Palestra Sobre Overclock Campus Party 2009 1-Introdução 2-Apresentação 3-Overclock, o que é?



Baixar 38,27 Kb.
Encontro19.04.2018
Tamanho38,27 Kb.

Palestra Sobre Overclock

Campus Party 2009

1-Introdução

2-Apresentação

3-Overclock, o que é?

O objetivo do overclock é conseguir mais desempenho, como o processador é o “cérebro” do PC, se este operar mais rápido obtemos mais desempenho.

Antes de seguir, quero esclarecer a questão do desempenho em jogos, onde o componente principal é a placa de vídeo. Assim se você não tiver uma boa placa de vídeo, um overclock no processador não mudará praticamente nada. E geralmente, a menos que você tenha uma placa de vídeo ótima e um processador apenas razoável, fazer overclock no processador tampouco ajudará muito. Por isso, é bom montar uma configuração bem balanceada. Geralmente economizando no processador, para pegar uma placa de vídeo melhor e compensar a deficiência do processador com um overclock, obtendo assim um desempenho muito melhor que a proposta inicial de gastar mais no processador, restando menos para a placa de vídeo.

Vou assumir que todos sabem montar uma configuração bem balanceada e que já escolheram uma placa mãe “boa” para overclock, que tenha todos os ajustes necessários. Que só falta mesmo técnica para extrair um bom overclock de qualquer processador, exatamente o que quero sanar com essa palestra.

Como a maioria já deve saber, grande parte do sucesso ou não de um overclock será definido pela placa mãe, o que não quer dizer necessariamente que só placas caras são boas para overclock. Isso geralmente é verdade (no sentido de que uma placa cara deve ser boa de overclock), porém há exceções para ambos lados (placas baratas e boas; placas caras e ruins).

Dois honrados exemplos de exceção a essa regra são a Gigabyte G31M-S2L e a Foxconn A6VMX, placas baratas e muito boas de overclock, melhores que muitas placas bem mais caras! Claro que sendo placas baratas, elas possuem suas limitações, mas permitem um bom overclock antes que se esbarre nessas limitações.

Antes de seguir, quero saber, quantos tem ou preferem processadores Intel e quantos tem ou preferem processadores AMD. Levante a mão quem prefere Intel, levante a mão quem prefere AMD.

Como imaginava, +- meio a meio.

Vou começar com processadores Intel Core2, que permitem ilustrar melhor os conceitos básicos, depois partirmos para o Athlon X2, que tem uma série de particularidades, depois vamos para o Phenom, que tem mais uma série de detalhes que merecem atenção e depois vemos o Core i7, que é bem parecido com o Phenom, mas também tem suas peculiaridades.

4-Processadores Intel Core2

Como a plataforma Intel para processadores Core2 segue a clássica receita de FSB e multiplicador, é mais fácil para estudar estes conceitos básicos.

É bem simples, o clock do processador é formado pelo clock do FSB (que também é usado como referência para outras coisas, como o clock das memórias) e seu multiplicador.

Como existem processadores com clocks de FSB diferentes, normalmente basta ter uma placa mãe com suporte a vários clocks de FSB, pegar um processador mais simples (com FSB mais lento) e aumentar o clock do FSB, conseguindo assim mais desempenho não só porque o clock do processador aumentou, mas também porque o clock do FSB aumentou, assim o acesso à memória é mais rápido.

Aumentar o clock do FSB não só é necessário, como é o único caminho, já que o multiplicador é travado “pra cima”; pode ser reduzido mas não aumentado.

Então, quando se aumenta o clock do FSB, além de aumentar o clock do processador, o acesso à memória fica mais rápido, porque a controladora de memória está no chipset e para acessar o chipset, o processador deve usar o FSB.

Além disso, o clock da memória é formado com base no clock do FSB, então aumentando o clock do FSB pode-se aumentar também o clock da memória, ganhando ainda mais desempenho. Desde que a memória agüente operar a um clock maior que o especificado.

Antigamente o mais normal era que a memória operasse ao mesmo clock que o FSB, mas hoje isso é o menos comum, os chipsets oferecem uma série de multiplicadores, para fazer a memória operar a sua freqüência especificada com praticamente qualquer clock de FSB (entre clocks oficiais, pelo menos).

Assim não importa se seu processador tem FSB 800, 1066 ou 1333 e você tem memórias DDR2 667, 800 ou 1066, praticamente qualquer combinação é permitida, porém desde que o clock da memória não seja menor que o do FSB.

O FSB opera em modo QDR, assim a cada pulso de clock são feitas 4 transferências, o que faz com que sua freqüência de operação seja efetivamente 4 vezes superior à real. Enquanto as memórias operam em modo DDR (com duas transferências por ciclo) mas geralmente operam também em dual channel, assim sua eficiência é novamente dobrada. Assim, a partir da mesma freqüência “real” FSB e memória possuem taxas de transferência equivalentes.

Por exemplo, com o FSB operando a 333MHz (FSB1333) e a memória também a 333MHz (DDR2-667), mas em dual channel; temos o sistema em equilíbrio.

É possível fazer a memória operar a um clock maior e isso trará um pequeno ganho em desempenho, porque o FSB será um gargalo para a banda excedente, mas de todas formas a latência de acesso à memória cairá um pouco.

O que não é possível é operar com a memória a um clock inferior ao do FSB. Por exemplo, se o FSB opera a 400MHz (FSB1600), a memória deve operar a pelo menos 400MHz (DDR2-800), nos chipsets atuais não há multiplicadores/divisores menores que 1:1, só maiores.

Então são necessárias memórias adequadas para a faixa de freqüência que vamos trabalhar. Por sorte, processadores mais simples, normalmente possuem FSB baixo e multiplicador alto, assim um pequeno aumento no clock do FSB já proporcionará um aumento considerável no clock do processador, portanto não serão necessárias memórias muito boas e mesmo que as memórias sejam excelentes (supondo que você tenham memórias DDR2-1066, por exemplo), a banda adicional que ela pode proporcionar, será desperdiçada porque o FSB operará a uma clock bem menor...



5-Core 2: Conceitos Avançados: vCore / vDroop

No primeiro gráfico vemos dois recursos de proteção do regulador de tensão, é importante entender como funcionam para que não nos atrapalhem durante o overclock.

Como vocês já devem saber por experiência própria, o valor que ajustamos no setup não é o mesmo que vemos com o sistema em funcionamento, quando o processador está ocioso. E quando exigimos 100% do processador o vcore cai mais ainda.

Veremos agora porque isso acontece, sua importância e o que podemos fazer para que isso não nos atrapalhe.

Observe que a primeira linha representa o VID, o indicador de tensão, o vcore padrão do processador, que normalmente é o que podemos ajustar no setup. Logo abaixo vemos o vcore quando o processador está parado (ocioso/idle) e mais abaixo o vcore quando o processador está trabalhando (heavy load).

Observe que em cada mudança de carga (light to heavy e heavy to light) ocorre um pico de tensão, pois o regulador de tensão demora um pouco para se adequar à necessidade de consumo do processador.

O voffset e o vdroop foram implementados para DIMINUIR estes picos, visando garantir a estabilidade do sistema sem que seja necessário um regulador de tensão que possa reagir mais rápido, e ainda garantir a integridade do processador, pois a tensão nunca ultrapassará o VID.

Remover estas características podem gerar conseqüências terríveis como perda de instabilidade sob condições aleatórias, aumento do consumo do processador e da sua temperatura; além de redução da vida útil do processador, pois este ficaria sujeito a picos de tensão bem maiores que o VID.

O outro gráfico mostra o comportamento do processador cruzando o máximo clock suportado com a menor tensão necessária. É interessante fazer estes testes com o seu processador para observar como ele responde aos aumentos de clock e quanta tensão ele precisa para isso.

Observe que há uma região do gráfico onde ele reage de forma praticamente linear, mas depois disso passa a exigir muito mais tensão, com aumentos menores de clock.

Ao operar nessa região estamos forçando demais o processador, não faz sentido forçar o processador a operar a um clock um pouco maior com vcore muito mais alto, se reduzindo um pouquinho o clock já voltamos à região “de conforto”.

Lembrem que cada processador reage de forma única, portanto é necessário estudar bastante seu comportamento para encontrar o melhor ponto para uso diário.

Observe também que no exemplo o processador pôde operar ao clock padrão com bem menos tensão que o padrão, o que por outro lado indica que ele poderá operar a uma freqüência bem maior que a padrão, sem que seja necessário aumentar o vcore.

6-Core 2: Conceitos Avançados: tRD

Um dos primeiros detalhes mais importantes dos chipsets Intel atuais é o parâmetro conhecido como Performance Level. Tecnicamente conhecido como Static Read Delay ou tRD, embora tenha relação com a memória, não depende dos módulos instalados, é um timing do chipset. Determina quantos ciclos (do FSB) o chipset demora para repassar os dados da memória ao processador. Este é o fundamento por traz do “NB Strap”, indica que quando o clock do FSB é baixo, pode-se usar um tRD bastante agressivo, sendo necessário relaxar o parâmetro à medida que se aumenta o clock do FSB.

Isso normalmente é feito automaticamente pelo BIOS da placa mãe mas algumas placas também permitem o ajuste manual. Por padrão, é definido um valor para cada faixa de FSB utilizado, levando em conta também o multiplicador da memória utilizado. Quanto maior é o clock da memória em relação ao FSB (maior é o multiplicador da memória), pode-se usar um valor de tRD mais agressivo.

Se sua placa permite o ajuste de tRD/Performance Level, você pode tentar um valor mais agressivo, o que deve melhorar significativamente o desempenho da memória, adicionando pelo menos 200MB/s na banda de leitura e tirando pelo menos uns 5ns da latência para cada passo de tRD.

A maioria das placas já vem com um ajuste automático muito bom, então normalmente não é necessário mexer nesse ajuste, mas pode-se forçar um valor maior aumentando a tensão do chipset.

O gráfico da esquerda mostra as diferenças de vários valores de tRD sobre a mesma configuração, o da direita mostra a curva da latência do tRD exclusivamente (um dado puramente teórico), mas mostra também quanta tensão o chipset (o X48 no caso) precisa para operar em cada configuração.

O P35 se assemelha bastante ao X38/X48 em comportamento, então podemos ter uma boa idéia do que pode ser feito.

O P45 difere bastante, tanto nas tensões aplicadas (o padrão é 1.1v em vez de 1.25v do P35 e do X38/X48) e valores de tRD, já que opera mais relaxado (o que por outro lado permite superar os 500MHz no FSB com muito mais facilidade).

Observe que os testes foram feitos com o FSB na faixa dos 400MHz a 450MHz e com a memória em 4:5 (500MHz a 560MHz), portanto são necessárias memórias muito boas para reproduzir estes números.

Com a memória a 1:1 o P35 trabalha com tRD 7 a 400MHz subindo para 8 ao redor de 420MHz, que deve ser o suficiente para ir até os 500MHz com um ligeiro overvolt.



7-Processadores AMD Athlon64 X2

Como vimos uma série de conceitos básicos nos Core 2 já temos uma idéia do cenário, mas o Athlon64 já é um bocado diferente. Não existe FSB, como a controladora de memória está dentro do processador o chipset perde importância, portanto o chipset que liga o processador a ele também. Apesar disso, em vez de usar um barramento velho e ultrapassado como o FSB da Intel, o Athlon64 se comunica com o chipset por Hyper Transport, um barramento serial, de baixa latência e Full-Duplex (possui dois canais independentes, um para cada sentido).

Como trabalha a um clock bem alto, o Hyper Transport tem seu próprio multiplicador, que assim como o processador toma como referência um sinal que não alimenta diretamente nenhum barramento, esse clock é chamado incorretamente de HTT ou FSB, mas na verdade é apenas uma freqüência base, que dá origem a todas as outras.

Assim como o clock do FSB, o clock base é programável e como os processadores AMD também tem multiplicador travado o overclock é feito aumentando o clock base.

Aqui começam os cuidados que devemos cuidar.

Primeiro, o Hyper Transport trabalha por padrão a 1GHz (5x clock base) e já é superdimensionado, portanto não há ganho em forçar o HTT a operar acima de 1GHz, e ele pode ficar instável se operar muito acima de 1GHz, portanto é necessário reduzir seu multiplicador de vez em quando ao fazer overclock. Podemos adotar como regra 4x até 250MHz (assim ele volta a 1GHz) e 3x dali em diante (indefinidamente, já que não iremos passar muito de 300MHz).

O clock da memória é formado dividindo o clock do processador por um divisor inteiro, então ao fazer overclock o clock da memória será afetado indiretamente. O clock base sobe, o clock do processador sobe, o clock da memória sobe, mas para cada multiplicador do processador há uma tabela de divisores de clock para a memória então dependendo da configuração de multiplicador do processador e clock da memória, a memória sobe num ritmo diferente.

Por exemplo, num X2 5000+ (2,6GHz 12x200) com a memória configurada para DDR2-800 o divisor do clock da memória será CPU/7, que em stock fará a memória operar a 371MHz. Só quando o processador atingir 2800MHz (12x233) é que a memória chegará aos 400MHz (DDR2-800). Como na maioria dos casos a memória opera abaixo do padrão, isso acaba sendo uma vantagem no overclock, pois dá uma margem maior para a memória subir. E no geral o acesso à memória já é muito rápido, a menos que você tenha memórias muito ruins ou tenha que subir muito o clock base, isso não será um problema.

Mas vamos supor então que você tem um X2 4000+ (2.1GHz 10,5x200) muito bom de over, que chega facilmente a 3GHz, como com o multiplicador a 10,5x o divisor para DDR2-800 é CPU/6 em stock a memória operará a 350MHz e só chegará a 400MHz quando o processador operar a 2400MHz, mas nós queremos mais, queremos 3GHz!

Então será necessário reduzir o clock da memória. A 10,5x o divisor para DDR2-667 é CPU/7 assim a 3GHz a memória operará a 428MHz, um clock razoável que a maioria das DDR2-800 deve suportar.

Mas então começam os maiores problemas de se fazer overclock em processadores Athlon64: a falta de ajustes!

Para chegar aos 3GHz no 4000+ precisamos configurar 10,5x285 como o Hyper Transport deve ficar instável com 5x285 (1425MHz), precisamos reduzir seu multiplicador para 3x, mas muitas placas nem tem ajuste do multiplicador do HTT...

E outra, ao reduzir o clock da memória para DDR2-667 a maioria das placas ajusta timings bem mais agressivos (presentes no SPD da memória), até ai tudo bem, o problema é que isso normalmente inclui o Command Rate 1T e muitas placas não possuem ajuste de Command Rate...

Portanto é bom ficar de olho nesses detalhes na hora de escolher uma placa mãe para AMD se você pensa em fazer overclock.

É bom ter em mente também que são raras as placas para AMD que relaxam sozinhas os timings de memória à medida que o clock da memória sobe, como na maioria das placas para Intel, portanto de vez em quando será necessário relaxar manualmente alguns timings.

Os principais subtimings, além do Command Rate (que deve ser 2T para DDR2-800, pois são muito raras memórias que operam a 400MHz com 1T) são o tRC que deve ser relaxado para uns 25 ou mais ao passar de DDR2-800 e os ajustes de tRFC de 75ns ou 105ns para 145ns ao passar de DDR2-800.



8-Processadores AMD Phenom

Agora que já conhecemos bem o Athlon64 podemos ver melhor como o Phenom funciona, pois é bem diferente em alguns aspectos. O principal é que enquanto no Athlon64 a controladora de memória trabalhava ao mesmo clock que o resto do processador, no Phenom ela está em uma região própria do processador, que tem clock independente dos núcleos. Fica numa espécie de northbridge interno, que também abriga o Cache L3 e o controlador do Hyper Transport.

A boa notícia é que agora o clock da memória é formado a partir do clock base com um multiplicador próprio, como nos chipsets Intel, por exemplo. Assim a memória não opera abaixo do clock desejado. A má notícia é que o northbridge interno tem um potencial de overclock bem limitado e muito poucas placas mãe possuem ajuste do seu multiplicador.

Na grande maioria dos Phenom, o northbridge interno funciona a 1.8GHz, portanto 9x clock base. O Hyper Transport 3.0 pode funcionar sem problemas a até 2.6GHz (5.2GT/s), mas não pode operar acima do clock do northbridge interno, portanto está limitado a 1.8GHz (3.6GT/s).

Há muitas placas AM2 (não AM2+) que suportam Phenom, nelas o Hyper Transport é limitado a 1GHz (5x clock base) e continuam valendo as regras de redução do seu multiplicador, mas nas placas AM2+ (que suportam HTT 3.0) não é necessário se preocupar com ele, pois dificilmente atingiremos 2.6GHz no northbridge interno...

Na maioria dos Phenom o northbridge interno trabalha a 1.8GHz com 1.2v (lembrando que assim como o clock, a tensão do northbridge interno também é diferente da dos núcleos), tensão suficiente para levá-lo até uns 2.2GHz (240MHz, talvez 250MHz no clock base) o que dará um aumento apenas razoável no clock dos núcleos, o que é especialmente frustrante em um X3 8450, por exemplo, já que a maioria dos Phenom novos chega a uns 2.7 ou 2.8GHz com vcore padrão, mas podendo subir apenas até uns 240MHz no clock base, ficaremos limitados a 2,5GHz ~ 2,6GHz.

É possível chegar até uns 2400MHz no northbridge interno com cerca de 1.35v a 1.4v, mas para isso é necessária uma placa mãe AM2+ com este ajuste, o que não é fácil de achar.

Um detalhe interessante, quando um Phenom trabalha em uma placa mãe AM2 (não +) a tensão que alimenta o northbridge interno é a mesma que a do resto do processador, portanto pode ser aumentada, assim pode-se forçar uma subida um pouco maior que nas placas AM2+ sem este ajuste (ou de multiplicador do CPU-NB).

Mas um detalhe muito importante, para reduzir custos muitos fabricantes economizaram no regulador de tensão, o problema é que os Phenom já consomem bastante sem overclock (começam com tem TDP de 95w, passando para 125w nos modelos superiores), portanto muito cuidado, pois muitas placas só suportam processadores de 95w, ao fazer overclock o processador vai consumir mais que isso rapidamente, o que pode destruir a placa mãe.

Portanto não recomendo fazer overclock num Phenom em placas não certificadas para processadores de 140w. Placas mãe AM2 não + top de linha como a Asus M2N32, por exemplo, tem regulador de tensão bem robusto, então pode ser mais interessante procurar uma placa antiga top que pegar uma placa nova meia boca...

É uma pena que muito poucas placas tenham todos os ajustes necessários para um bom overclock no Phenom. Mesmo nas placas AMD790GX, que possuem o Advanced Clock Calibration (que, resumindo, permite subir mais com menos vcore) são raros os ajustes de multiplicador e tensão do northbridge interno. Acho que parte desse desleixo é que os Black Edition são pouco mais caros que os processadores normais, então quem quer fazer overclock acaba optando por um Black Edition, que pode subir facilmente apenas aumentando o multiplicador.

9-Processadores Intel Core i7

Como falei antes, o Core i7 é em muitos as aspectos parecido com o Phenom. Finalmente a Intel integrou a controladora de memória ao processador, abandonou o GTL (barramento ultrapassado demais para ser usado como FSB) e agora a conexão do processador ao chipset é feita por QPI, barramento serial, de baixa latência e Full-Duplex, semelhante ao Hyper Transport, mas mais rápido, pois opera a 4,8GT/s (2.4GHz) ou 6,4GT/s (3.2GHz).

Também possui um northbridge interno, chamado pela Intel de parte Uncore, que assim como no Phenom, abriga o cache L3, a controladora de memória (triple channel) e o controlador do QPI.

Cada um com seu multiplicador e todos regidos pelo clock base, que aqui vale 133MHz e é chamado simplesmente de BCLK ou BClock.

Apesar de bem diferente, fazer overclock no i7 é bem simples e eu diria que principalmente porque todos os ajustes estão lá. Até a X58 da ECS possui todos os ajustes que precisamos para overclock.

Os principais cuidados que devem ser tomados são de deixar o multiplicador do QPI no mínimo (4.8GT/s), baixar o clock da memória mas mantendo os timings relaxados, pois o clock da memória subirá bastante.

Ao contrário do Phenom, no i7 o Uncore sobe bastante e tem uma particularidade, seu clock deve valer pelo menos 4 vezes o clock (real) da memória (ou o dobro do clock efetivo), o BIOS não permite selecionar valores menores, então este alerta vale apenas para que ninguém pergunte porque não aparecem opções menores, dependendo da configuração.

O Uncore chega a até os 3,2GHz (clock necessário para trabalhar com memórias DDR3-1600) sob tensão padrão, portanto não há muito com o que se preocupar aqui. O interessante disso é que com o uncore acima de 3GHz o cache L3 fica muito rápido, sua latência é apenas 1ns maior que a do cache L2, que também é muito rápido. Portanto mesmo que você use memórias mais lentas, é interessante manter um clock alto no Uncore.

Tomando estes cuidados deve-se atingir 200MHz no clock base sem muito esforço, o que é suficiente para levar o i7 920 a 4GHz, lembrando que para isso é obrigatório o uso de um ótimo cooler, pois o i7 esquenta bastante.

Um detalhe importante ao fazer overclock no i7 é que a Intel recomenda não usar mais que 1,6v ou 1,65v nas memórias, sob o risco de danificar o processador. Uma limitação grave, pois muitas memórias DDR3 precisam de mais que isso para usar suas características especiais.



Porém corre pela net a informação de que basta aumentar a tensão do uncore de modo a manter uma diferença inferior a 0,5v entre o uncore e a memória, para proteger o processador e parece que procede, pois há muito poucos casos de processadores mortos pelo uso de alta tensão na memória (desde que esta regra seja seguida).

De todas formas, o desempenho do i7 com DDR3-1333 de timings relaxados (9-9-9, as DDR3 mais simples encontradas no mercado) já é excelente e como o ajuste mínimo de clock da memória é DDR3-800 (BCLK x 6), pode-se subir bastante com qualquer memória, não sendo necessário nem investir muito no kit, nem apelar para tensões muito altas para se obter um bom overclock.



©livred.info 2017
enviar mensagem

    Página principal