Por que as CPUs não são resfriadas tanto por baixo quanto por cima?

28

Os bits transistórios de um circuito integrado estão aproximadamente no centro da embalagem (plástica ou cerâmica). Às vezes, esquentam e nós os esfriamos colocando um dissipador de calor em um lado. Às vezes, apenas sopramos ar sobre eles com um ventilador. Parte desse calor se propaga para cima, mas alguns também devem descer para o PCB. Eu não sei a razão. A seguir, a parte inferior de uma CPU Intel Core i7-7700K, dissipando 91W de calor: -

CPU lado de baixo

Existem muitos blocos de conexão. Claramente, eles agem como muitos micro dissipadores de calor que transferem uma proporção significativa do calor para o soquete / PCB. De fato, muitos componentes montados na superfície dissipam o calor através de camadas de cobre (por meio de costura).

Portanto, se o resfriamento é importante (como para a comunidade de overclocking da CPU), por que as CPUs também não são resfriadas por baixo do PCB, digamos, um fã?

EDITAR:

Embora os comentários abaixo sejam totalmente negativos, existem dois novos itens. Primeiro, há um longo encadeamento no Overclock, sugerindo que um número significativo de graus pode ser retirado da temperatura da CPU com um ventilador na placa traseira. E dois, eu tentei (reconhecidamente com apenas um Raspberry Pi). Cobri a parte superior com um pano para isolar a CPU Broadcom, enquanto resfriava a parte inferior apenas com uma ventoinha de 60 mm. O ventilador reduziu a temperatura máxima da CPU de 82 graus. para 49. Nada mal, então acho que essa ideia tem pernas ...

Paul Uszak
fonte
25
Por causa de uma coisa chata chamada soquete ZIF e um PCB que fica no caminho
JonRB
5
Foi uma resposta faceta :) os pinos são realmente bastante eficientes e estão atraindo calor. Da mesma forma o plano de apoio ajuda
JonRB
3
Simplesmente não é prático. Para fazer isso, você precisa cavar um buraco na PCB da CPU e outro na placa principal da placa. Mesmo nos dias em que a matriz da CPU está na parte de baixo do pacote, ninguém escolhe cavar um buraco na placa principal.
precisa saber é o seguinte
14
Google "flip chip". Os chips de processador mais modernos são montados de cabeça para baixo, de modo que o chip de silício real está mais próximo do topo da embalagem. Isso faz com que o calor do lado superior afunde muito eficaz.
DoxyLover
2
A placa de circuito impresso ao redor do soquete da CPU está ocupada dissipando o calor dos componentes do regulador de tensão - pode ser vantajoso ter a CPU isolada termicamente da placa-mãe.
Andrew Morton

Respostas:

37

Eles não são resfriados por baixo porque têm pinos na parte inferior e FR4 abaixo disso.

Copper:385.25WmKAluminum:205.25WmKFR4:0.25WmK

As probabilidades são de que você não gostaria de cercar os sinais com metal, o que alteraria drasticamente a impedância; portanto, o metal na parte inferior é mais um problema. Se você construísse um soquete de metal, ele precisaria ser micromáquina, o que seria muitas vezes mais caro que um soquete moldado por injeção de plástico. Essas coisas impediriam a construção de um soquete do processador que evitaria o aquecimento.

Você pode colocar um bloco de resfriamento na parte inferior da placa, mas o material PCB (FR4) reduziria substancialmente o resfriamento.

Voltage Spike
fonte
3
Mas o número do FR4 é um pouco enganador. O PCB sob uma CPU moderna é altamente preenchido com muitas vias de solda e faixas de cobre. Veja a densidade dos pinos na minha foto. E o solo / aviões de força. E através do soquete da placa e montagens mais frias. Eu esperaria que a condutividade térmica agregada de tudo isso fosse muito maior que 0,25. Apenas enfiar o dedo em sua placa-mãe para sentir o calor ...
Paul Uszak
1
Concordo que seria maior que 0,25, mas essas vias não são muito grandes e atualmente correm microvias e vias cegas e enterradas, de modo que a maior parte desse cobre não passa por todo o percurso. Qualquer cobre absorve o calor, mas você também precisa de um grande caminho térmico que não acontecerá na parte inferior da CPU, porque é muito mais fácil colocá-lo na parte superior.
Voltage Spike
22

O resfriamento não é importante , é crucial . Uma CPU moderna pode facilmente colocar algo entre 15 W e 200 W, de uma matriz de alguns cm². Se você não está transportando esse calor, esse chip deve parar de funcionar, diminuir a velocidade ou: apenas queimar.

Com isso fora do caminho: onde você coloca seu calor a partir daí? A superfície de resfriamento de uma placa-mãe é muito limitada em comparação com a superfície do corpo de um resfriador de CPU. A capacidade de transporte de calor das camadas de cobre não é ruim por si só, mas comparada a um bloco maciço de cobre e alumínio (e, freqüentemente, tubulação de calor por convecção), é insignificante.

Então: a placa-mãe em si geralmente não é o lugar mais legal, especialmente em torno da CPU. Lá, toda a cadeia de fornecimento de energia da CPU está situada. Isso tem uma boa eficiência, mas com uma carga de várias dezenas de amperes e cenários de carga que mudam rapidamente, não é de admirar que esses conversores também fiquem quentes.

Estou certo de que, em computação personalizada de alto desempenho e compilações militares, você encontrará pacotes de CPU especializados que dão acesso inferior a partes da CPU, mas em CPUs mainstream com soquete, isso não é possível mecanicamente nem termicamente excessivamente vantajoso.

Observe que isso não se aplica a todas as CPUs. Se você for para o setor embarcado, geralmente encontrará CPUs menores com um dissipador de calor no meio. Simplesmente não parece viável para CPUs maiores.

Estou certo de que a Intel e a AMD não colocariam essas passivas no fundo de suas CPUs se pudessem evitá-la. De fato, olhe a figura: a placa verde que você está vendo não é a matriz, é a portadora de PCB à qual a placa está conectada; esse é o preço tecnológico que você paga por ser capaz de produzir CPUs intercambiáveis ​​de maneira barata, em vez de apenas ter placas-mãe com a esfera do pacote de escala de chip de CPU soldada diretamente a elas - e você não pode ter isso completamente, mesmo teoricamente, porque o calor dessa CPU é tanto que um plano de metal que se espalha por calor precisa ser ajustado à pressão sobre ele, e você pode efetivamente fazer apenas mecanicamente isso colocando a matriz em algum tipo de substrato.

Marcus Müller
fonte
10
Leitura adicional: o "muro de força": por que não podemos construir CPUs que dissipem mais do que cerca de 200W , mesmo que quiséssemos. TL: DR: a densidade de potência com transistores minúsculos é um problema. (Esse artigo tem uma boa visão geral da microarquitetura de CPU, desde os primeiros processadores em pipeline até o OoO moderno, bem como o problema de parede de energia que causou o Pentium 4 cair de cara no chão. A Intel escolheu o momento errado para mudar para uma velocidade que requer muita energia projeto -demon, apenas algumas gerações antes dos transistores eram pequenos o suficiente para que isso seja o fator limitante).
Peter Cordes
12

Uma resposta que ainda não foi dada é por causa da maneira como são construídas. As CPUs usadas em computadores e laptops (pelo menos que eu saiba) nunca são um flip-chip completo. Eles simplesmente têm muitas conexões para permitir flip-chip fácil em um processo simples de PCB usado nas placas-mãe. Quero dizer simples aqui, em comparação com os processos necessários para aplicações de ondas de RF / milímetro, ou um processo que permite densidades em que você realmente pode espalhar mais de 1000 pinos em alguns milímetros quadrados.

Por esse motivo, as matrizes da CPU são sempre lascadas em um interposer. Isso geralmente é cerâmico e feito de várias camadas. Aqui está um exemplo, da wikipedia. Você pode ver 5 matrizes separadas neste pacote, além de uma grande quantidade de passivas pequenas nas bordas (pelo que posso dizer, na verdade, é um empilhamento ainda mais complexo, com um interposer de silício para interconectar as matrizes diferentes, e que é então colocado em cima de um interpositor de cerâmica).

insira a descrição da imagem aqui

Por que tudo isso importa? Você sugere que você deve ser capaz de transferir com eficiência o calor pelos pinos da CPU. No entanto, este não é o caso, por causa desse interpositor. Isso não é como um grande dispositivo de energia em que o bit de metal grande está realmente conectado ao silício - há muitas coisas no meio.

Como resultado, a condutividade térmica do molde aos pinos ainda é baixa - portanto, mesmo se você encontrasse uma maneira muito bacana de tirar todo o calor desses pinos, dificilmente veria alguma melhoria, pois ainda estará lidando com resistência térmica de ordem de grandeza maior em comparação com um espalhador de calor metálico que está em contato direto com a parte superior do silício.

Se você for às CPUs usadas em telefones ou dispositivos incorporados, que são um "dissipador de calor inferior", as coisas são diferentes. Aqui eles não usam uma abordagem flip-chip. No centro do BGA, eles terão um local de metal no qual a matriz é fixada termicamente (isso geralmente também é retificado). Eles então usam fios de ligação para conectar todos os pinos, ainda usando uma forma de interposição com o metal no meio (ou o metal central é apenas um monte de vias para obter baixa condutividade térmica). Isso significa que há muito menos material entre esse bloco de resfriamento central e os pinos BGA, permitindo uma transferência de calor muito mais eficiente.

Joren Vaes
fonte
Acho que você entendeu o que está escrito aqui atrás: "a condutividade térmica do molde aos pinos ainda é alta", mas parece que você quis dizer condutividade = baixa ou resistência (resistividade?) = Alta, não alta condutividade.
Peter Cordes
@PeterCordes Correct! Obrigado por apontar isso, eu o corrigirei imediatamente.
precisa saber é o seguinte
Além disso, você precisa colocar esses capacitores em algum lugar, e é crucial que as conexões sejam curtas.
rackandboneman
1
Observe que a imagem é do Fiji G PU da AMD , usado na série R9 Fury. O interposer de silício usado é uma raridade, mesmo entre pacotes com vários chips. A maioria simplesmente coloca todos os chips no substrato FR4, mas as quatro pilhas de High Bandwidth Memory de Fiji exigiam silício para fornecer a densidade de fios necessária para um barramento de 1024 bits para cada pilha.
precisa saber é o seguinte
Ré. último parágrafo Se o gabinete permitir, você também pode esfriar um de seus chips de dissipador de calor por cima, ou seja. ambos os lados?
Paul Uszak
12

Parte desse calor se propaga para cima, mas alguns também devem descer para o PCB. Eu não sei a razão.

Isso é verdade, o calor se propaga em todas as direções. Infelizmente, a taxa de propagação (também conhecida por ser caracterizada como resistência térmica) é muito diferente.

Uma CPU deve estar conectada com periféricos / memória de alguma forma, para ter de 1000 a 2000 pinos para esse fim. Portanto, o caminho elétrico (fanout) deve ser fornecido, o que é feito através da tecnologia da placa de circuito impresso. Infelizmente, mesmo se impregnado com vários fios / camadas de cobre, a coisa toda da PCB não conduz calor muito bem. Mas isso é inevitável - você precisa de conexões.

As primeiras CPUs (i386-i486) foram resfriadas principalmente pelo caminho da PCB; no início dos anos 90, as CPUs do PC não tinham dissipador de calor no topo. Muitos chips com montagem tradicional de ligação por fio (chip de silicone na parte inferior, almofadas conectadas com fios das almofadas superiores à estrutura de chumbo) podem ter uma lesma térmica na parte inferior, porque esse é o caminho de menor resistência térmica.

Em seguida, a tecnologia de embalagem flip-chip foi inventada, para que a matriz fique na parte superior da embalagem, de cabeça para baixo, e toda a conexão elétrica seja feita através de solavancos eletricamente condutores na parte inferior. Portanto, o caminho de menor resistência agora está passando pelo topo dos processadores. É aí que todos os truques extras são usados, para espalhar o calor de uma matriz relativamente pequena (1 m²) para um dissipador de calor maior, etc.

Felizmente, as equipes de design da CPU incluem departamentos de engenharia consideráveis ​​que realizam modelagem térmica da matriz da CPU e de todo o pacote. Os dados iniciais vieram do design digital e, em seguida, os solucionadores 3D caros fornecem uma visão geral da distribuição e fluxos de calor. A modelagem obviamente inclui modelos térmicos de soquetes / pinos da CPU e placas-mãe. Eu sugeriria confiar neles com as soluções que eles fornecem, eles conhecem seus negócios. Aparentemente, um pouco de resfriamento extra na parte inferior do PCB simplesmente não vale a pena um esforço extra.

ADIÇÃO: Aqui está um modelo fixo de um chip FBGA, que pode dar uma idéia, por exemplo, do modelo térmico LGA2011 Intel.

insira a descrição da imagem aqui

Enquanto o PCB de várias camadas com vias térmicas e 25% de cobre pode ter um bom desempenho térmico, o sistema LGA2011 moderno / prático possui um elemento importante, um soquete. O soquete possui contatos de mola do tipo agulha sob cada bloco. É bastante óbvio que o volume total de contato de metal no soquete é bem menor que o volume de cobre na parte superior da CPU. Eu diria que não passa de 1/100 da área de lesmas, provavelmente muito menos. Portanto, deve ser óbvio que a resistência térmica do soquete LGA2011 é pelo menos 100X da direção superior, ou não mais de 1% do calor pode diminuir. Acho que, por esse motivo, os guias térmicos da Intel ignoram totalmente o caminho térmico inferior, não é mencionado.

Ale..chenski
fonte
2
Para sua informação, as CPUs Epyc e Threadripper da AMD aumentaram o número máximo de pinos em uma CPU convencional de ~ 2000 para ~ 4000. Os atuais chips Xeon / Phi topo de linha da Intel usam um soquete de ~ 3600 pinos por mais tempo, mas como uma plataforma multisocket so consideravelmente mais nicho.
Dan Neely
1
Uma revisão muito boa, mas deixe-me pressioná-lo agora ... O que você estimaria como a divisão entre o calor subindo e o calor diminuindo? Essa proporção foi o que me levou a fazer a pergunta.
Paul Uszak
1

Em aviônicos, o resfriamento é avaliado para todos os caminhos possíveis, inclusive via PCB.

Um microprocessador convencional em um laptop / desktop geralmente usa uma mistura de resfriamento por condução (dissipador de calor) e convecção (geralmente ar forçado). À medida que a mistura desses dois afasta a maior parte do calor, o mecanismo de resfriamento via PCB às vezes é ignorado, mas ainda está presente.

Se o equipamento estiver em um compartimento aviônico não pressurizado, o resfriamento por convecção perde bastante sentido (a densidade do ar é muito baixa, o que significa que existem moléculas insuficientes em alta altitude para espalhar o calor). Por esse motivo, o resfriamento por condução é amplamente utilizado, pois é o único método de resfriamento verdadeiramente eficaz nesse cenário.

Para que isso seja eficaz, vários aviões são usados ​​dentro do PCB como espalhadores de calor.

Onde os dissipadores de calor são usados ​​(não é uma solução preferida, mas às vezes inevitável), o caminho ainda é conduzido por escadas de calor até uma parede fria (este é um termo relativo - a parede fria pode estar a 70 ° C ou mais).

Às vezes é usado ar forçado, mas dentro de uma câmara pressurizada conectada à placa fria.

Portanto, nesse cenário, é utilizado o resfriamento por todos os caminhos; condução de ambos os lados, o FR-4 pode não ser particularmente condutor térmico, mas os planos de cobre são.

Entrei em uma discussão térmica um tanto detalhada em resposta a esta pergunta .

Peter Smith
fonte
1

A resposta real é engenharia básica. É muito mais fácil otimizar um sistema se você puder separá-lo em subsistemas que podem ser otimizados independentemente.

Otimizando um lado para a conectividade e o outro lado para remoção de calor. Você simplificou o problema, impondo, no máximo, uma penalidade de 2: 1 para qualquer um dos problemas. Claramente, se você tivesse muito mais calor do que conexões ou mais conexões que calor, essa escolha deve ser revisada, mas esse claramente não é o caso.

Isso não significa que não é possível remover o calor da parte inferior ou colocar as conexões por cima, mas a que custo? Que outros compromissos devem ser feitos?

Os módulos de CPU resfriados a líquido, enquanto estão voltando, eram bastante comuns 30 anos atrás. Quando os mainframes tinham “envelopes” na CPU totalmente imersos em líquido, removiam o calor de todos os lados dos CIs fechados. Isso apresenta claramente uma desvantagem no design das conexões, depuração, retrabalho e os tipos de líquido que podem ser usados. Essas são muitas restrições adicionais para qualquer um dos subsistemas. O fato de ter sido feita essa escolha indica que a remoção de calor foi a principal restrição.

Os supercomputadores modernos, de refrigeração líquida, possuem microdutos de água altamente otimizados em cima da bolacha. Enquanto todas as conexões estiverem do lado de baixo. Cada subsistema é independente do outro, otimizando bastante o design inteiro.

Em aplicações nas quais o lado oposto às conexões está ocupado, por exemplo, LEDs, lasers, links ópticos, portas de RF, etc. a parte inferior é o principal caminho de remoção de calor. E substratos especializados, com alta condutividade térmica, são geralmente usados.

Edgar Brown
fonte