1. EACH
Evolução das CPUs:
Dual e Quad Core
Cesar Sposito
Mário J. Filho
Rodrigo Ferrassa
... os computadores sequenciais estão se
aproximando do limite físico fundamental em
sua energia potencial computacional. Tal
limite é a velocidade da luz...
Angel L. DeCegama
2. EACH
Introdução – Limite: Pentium IV
Desafio: Aumento frequência de clock.
Corrida por clock (Intel X AMD).
Athlon Thunderbird X Pentium III.
Intel: Movimento arriscado.
Investimento em um processador com um
longo pipeline.
Pentium IV.
3. EACH
Pentium IV: longo pipeline
Pipeline é uma técnica de hardware que
permite que a CPU realize a busca de uma
ou mais instruções além da próxima a ser
executada.
Pentium III: 10 estágios.
Pentium IV: 20 estágios a 31 estágios.
Dobrar o número de estágios no
processador é como dobrar o número de
funcionários de uma empresa.
4. EACH
Longo pipeline: Consequencias
Com mais estágios, o processador seria
capaz de atingir freqüências mais altas.
Adicionar mais estágios tornou o
processador menos eficiente, pois as
instruções precisavam do dobro do número
de ciclos do processador para serem
processadas.
Possuir o dobro de estágios significa
também possuir aproximadamente o dobro
de transistores e consumir o dobro da
eletricidade.
5. EACH
Mais consumo – Maior aquecimento
Maior consumo gera maiores desperdícios.
Maior desperdicio gera maiores
aquecimentos.
A dissipação térmica (W/cm^2) de um
Pentium 4, é próximo do núcleo de um
reator nuclear.
Se a produção de processadores
continuasse da mesma forma, num futuro
não muito distante, teríamos um
processador com dissipação térmica
próxima a da superfície solar.
7. EACH
A barreira dos 3.4 GHZ
Desde 1983 até 2002, as taxas de
frequência de clock aumentaram de 5 MHz
para 3 GHz.
Aumento do clock 600 X em 19 anos.
Na época, a Intel previa alcançar 5.2 GHz no
final de 2004 e planos para 10 GHz no final
de 2005.
Porém, nada disso aconteceu. Os 3.4 GHz
se tornaram uma barreira difícil de transpor.
Fim da Lei de Moore?
8. EACH
Hyper Treading: Inicio do
processamento paralelo
Hyper Treading: simula em um único
processador físico dois processadores
lógicos.
Pode melhorar desempenho de até 30%
Utiliza as partes ociosas dos recursos para
simular dois núcleos.
9. EACH
Evolução
Elevando, por exemplo, em 20% a
freqüência do processador, aumentamos
apenas em 13% o seu desempenho e como
efeito colateral, também passa a consumir
73% mais energia.
Recíproca verdadeira.
10. EACH
Estratégia
Reduzindo a freqüência em 20%, perdemos
apenas 13% de desempenho e reduzimos
em 49% o consumo de energia.
Se reduzíssemos em 20% o clock e
colocássemos dentro da mesma pastilha
dois processadores?
11. EACH
Estratégia: Multiplos Núcleos
Teríamos um processador de dois núcleos
com 73% mais desempenho e consumindo
praticamente a mesma coisa (~2% mais
energia).
Processadores multicore podem
simultaneamente executar múltiplas tarefas
computacionais.
13. EACH
Nova Arquitetura
“Caminhou bastante, porém para o lado e
não para a frente” (National Instruments).
NetBurst Core
Pentium D
Quad Core
Core 2 Duo
Pentium IV
Pentium III
14. EACH
Arquitetura Core
Somando-se a estratégia de lançar
processadores de múltiplos núcleos, a nova
arquitetura interna do processador também
foi importante.
Maior eficiência de execução de instruções
por ciclo de CPU.
Maior desempenho e menor consumo.
A arquitetura Core consegue desempenho
superior aos da microarquitetura Netburst
(anterior) com o clock muito inferior.
15. EACH
Arquitetura Core
Derivada do Pentium III – Pentium M.
Pipeline de 14 estágios.
Cache de memória L2 é compartilhado.
Pré-buscas são compartilhadas, se o
controlador de cache carregar um bloco de
dados para ser usado pelo primeiro núcleo,
o segundo núcleo também pode usar o dado
já carregado.
Aprimoramento da unidade de pré-busca do
processador (“Melhor Chute”).
16. EACH
Arquitetura Core
Quanto menor o número de instruções a
serem executadas, mais rápido o
computador realizará a execução da tarefa
além de consumir menos.
O decodificador de instruções do Pentium IV
pode decodificar três instruções por pulso de
clock, já o do Core 2 Duo (Arquitetura Core)
4.
17. EACH
Arquitetura Core
Novo conceito: Fusão de instruções
load eax, [mem1]
cmp eax, [mem2]
jne target
load eax, [mem1]
cmp eax, [mem2] + jne target
Graças ao conceito de fusão de instruções o
decodificador de instruções da arquitetura
Core consegue fundir 2 instruçoes enviar 5
por pulso de clock.
18. EACH
Arquitetura Core
E mais!
Unidade de ponto flutuante (FPU) e uma
unidade lógica e aritmética (ALU) extras.
Caminho de dados real de 128 bits.
Desambiguação de memória.
Chaveamento Elétrico Avançado.
Etc.
20. EACH
Quad Core
- É uma das versões de processadores da
Intel mais recente apresentada com
núcleos Kentsfield(65nm) e
Yorkfield(45nm).
- O clock pode alcançar até 3.33Ghz. Em
overclocking, com cooler de ar, até
4.0Ghz, e na água até 5Ghz.
- Exemplos: Core 2 Quad, Core 2
Extreme: quad-core, Quad-Core Xeon.
21. EACH
Quad Core
- Multi-Chip: Duas pastilhas de silício (1 núcleo em cada)
encapsuladas junto: Comunicação externa .
- Monolítica: Uma pastilha de silício integra 2 núcleos
encapsulados: Comunicação interna.
- Monolítica Multi-Chip: Duas pastilhas de silício (2 núcleos
em cada) encapsuladas: Comunicação interna e externa.
33. EACH
AMD: Phenom X3/X4
• Três ou Quatro núcleos independentes.
• Os núcleos se comunicam internamente
dentro da pastilha.
• Controlador de memória integrado.
• Tecnologia HT.
35. EACH
Considerações Finais
Por 10 anos os aumentos de desempenho
vieram à custa do uso cada vez mais
ineficiente do uso de energia.
A partir de 2001, a taxa de crescimento de
desempenho pareceu ter reduzido. Se essa
diminuição será ou não temporária ainda é
uma questão obscura.
Arquitetos estão usando técnicas cada vez
mais complexas para tentar explorar mais
paralelismo a nível de instrução.
J L Hennessy e D A Patterson
36. EACH
Considerações Finais
Com essa estratégia em mente, os
fabricantes de processadores tem o desafio
de continuar entregando a melhor relação
desempenho/Watts.
A Intel propõem melhorar sempre, em um
ano a microarquitetura, no ano seguinte a
miniaturização, e assim por diante.
38. EACH
Considerações Finais
2007 a Intel lança os primeiros
processadores para servidores fabricados
com a tecnologia de 45nm.
2008 foi o ano do Nehalem, que foi o nome
código da nova microarquitetura, que
permitirá um outro passo importante, para
manter viva a Lei de Moore.
39. EACH
Considerações Finais
Processadores Futuros (Roadmaps)
Arquitetura Processador Clock Núcleos Processo Cache TDP Previsão
Intel
Nehalem Core i7 2,6 - 3,2 Ghz 4 por padrão 45nm 1 a 8mb 130W – 150W Novembro-08
Westmere - - 6 por padrão 32nm 1 a 12mb - 2009/2010
Sandy Bridge - - 4–8 32nm 8 a 24mb - 2010/2011
Haswell - - 8 por padrão 22nm - - 2012
AMD
Barcelona Opteron - 4 65nm 2mb - 2008
Shanguai Opteron/Phenom - 4 45nm 6mb - 2008/2009
Istambu Phenom - 6 45nm 6mb - 2009
Magny-Cours - - 12 45nm 12mb - 2010
São Paulo - - 6 45nm 6mb - 2010
40. EACH
Bibliografia
J L Hennessy e D A Patterson
HENSON Valerie - The Kernel Hacker's
Bookshelf: Ultimate Physical Limits of
Computation
INTEL - http://www.intel.com/portugues/
products/ processor/index.htm
BLOGS INTEL - http://blogs.intel.com
FAPESP - http://www.agencia.fapesp.br
NATIONAL INSTRUMENTS -
http://digital.ni.com/worldwide/brazil
41. EACH
Bibliografia
CLUBE DO HARDWARE -
http://www.clubedohardware.com.br/
PC FÓRUM - http://www.pcforum.com.br/
FÓRUM PC - http://forumpcs.ig.com.br/home
Vasconcelos, Laércio – Introdução aos
processadores dual core e quad core