Wyzwania w nowoczesnych układach scalonych: jak przeciwdziałać przegrzewaniu się chipów
W świecie półprzewodników nadchodzi era, w której ciepło staje się jednym z największych wrogów postępu technologicznego. Przez ponad 50 lat mogliśmy cieszyć się nieustannym wzrostem gęstości tranzystorów zgodnie z Prawem Moore’a, ale teraz stoimy przed poważnym wyzwaniem – jak odprowadzić ciepło z coraz bardziej kompaktowych układów scalonych?

Źródło: Canva
Ciepło jako przeszkoda w rozwoju procesorów
Gdy przemysł półprzewodnikowy dążył do zwiększania gęstości logicznej, problem nadmiernego ciepła stawał się coraz bardziej widoczny. W nowoczesnych układach typu system-on-chip (SoC), takich jak dzisiejsze procesory CPU i GPU, temperatura ma krytyczny wpływ na wydajność, zużycie energii i ogólną efektywność energetyczną. Nadmierne ciepło prowadzi do spowolnienia rozprzestrzeniania się sygnałów w procesorze i może skutkować trwałym pogorszeniem wydajności. Powoduje również zwiększone straty prądu w tranzystorach, co przekłada się na marnowanie energii. W konsekwencji efektywność energetyczna spada, gdyż potrzeba coraz więcej energii do wykonania tych samych zadań.
Koniec skalowania Dennarda
U podstaw problemu leży koniec tzw. skalowania Dennarda. Zgodnie z tą zasadą, wraz ze zmniejszaniem się wymiarów liniowych tranzystorów, napięcie powinno spadać tak, aby całkowite zużycie energii dla danego obszaru pozostawało stałe. Niestety, skalowanie Dennarda zakończyło się w połowie roku 2000., gdy dalsze redukcje napięcia stały się niemożliwe bez pogorszenia funkcjonalności tranzystorów. W rezultacie, podczas gdy gęstość obwodów logicznych nadal rosła, gęstość mocy również wzrastała, generując ciepło jako niepożądany produkt uboczny.
Nowe narzędzia do przewidywania emisji ciepła
Zespół badawczy z Imec opracował ramy symulacyjne wykorzystujące standardowe w branży i otwarte narzędzia do automatyzacji projektowania elektronicznego (EDA), uzupełnione o wewnętrzny zestaw narzędzi. Umożliwiają one szybkie zbadanie interakcji między technologią półprzewodnikową a systemami zbudowanymi z jej wykorzystaniem. Wyniki badań są jednoznaczne: wyzwania związane z temperaturą rosną z każdym nowym węzłem technologicznym i będziemy potrzebować innowacyjnych rozwiązań, aby skutecznie radzić sobie z odprowadzaniem ciepła.
Granice tradycyjnych metod chłodzenia
Klasycznie układy SoC są chłodzone poprzez nadmuch powietrza na radiator przymocowany do obudowy. Niektóre centra danych zaczęły stosować chłodzenie cieczą, które może absorbować więcej ciepła. Chociaż chłodziwa w postaci cieczy mogą jeszcze radzić sobie z obecną generacją wysokowydajnych układów, to już wkrótce mogą okazać się niewystarczające wobec nadchodzących technologii. Na przykładzie tranzystorów nanosheet i uzupełniające tranzystory polowe (CFET). Symulacje projektów testowych wykazały, że gęstość mocy w węźle A5 (CFET) jest o 12-15% wyższa niż w węźle A10 (nanosheet), co prowadzi do prognozowanego wzrostu temperatury o 9°C przy tym samym napięciu roboczym.
Taki wzrost temperatury w centrum danych, gdzie pracują miliony chipów, może prowadzić do niekontrolowanego wzrostu temperatury – niebezpiecznej pętli sprzężenia zwrotnego, w której rosnąca temperatura zwiększa upływ mocy, co dalej podnosi temperaturę, aż do momentu awaryjnego wyłączenia sprzętu.
Zaawansowane metody chłodzenia
Naukowcy badają zaawansowane alternatywy dla podstawowego chłodzenia cieczą i powietrzem:
- Chłodzenie mikroprzepływowe, wykorzystujące mikrokanały wytrawione w chipie
- Uderzenie strumieniowe, polegające na rozpylaniu gazu lub cieczy z dużą prędkością na powierzchnię chipa
- Chłodzenie zanurzeniowe, w którym cała płytka drukowana jest zanurzana w kąpieli chłodzącej
Jednak poleganie wyłącznie na chłodnicach może okazać się niepraktyczne, szczególnie w systemach mobilnych, które mają ograniczenia dotyczące rozmiaru, wagi i mocy baterii.
Równoważenie wydajności i temperatury
- Na szczęście istnieją rozwiązania na poziomie systemowym, które mogą utrzymać ciepło pod kontrolą:
- Czujniki termiczne – wykrywają wzrost temperatury i sygnalizują zmniejszenie napięcia roboczego i częstotliwości, co jednak może wpłynąć na wydajność.
- Thermal sprinting – polega na uruchomieniu rdzenia do momentu przegrzania, a następnie przeniesieniu operacji na inny rdzeń, podczas gdy pierwszy się ochładza. Ta metoda maksymalizuje wydajność pojedynczego wątku, ale może powodować opóźnienia przy migracji zadań między rdzeniami.
Efektywne stosowanie tych rozwiązań wymaga wszechstronnego zrozumienia dystrybucji mocy w chipie i zachowania cieplnego układu.
Innowacyjne podejście – wykorzystanie tylnej strony układu scalonego
Obiecującą strategią jest dodanie nowych funkcji do spodniej strony płytki krzemowej. Technologie backside, takie jak:
- Sieć zasilania z tyłu (BSPDN) – przenosi linie zasilania z przodu chipa na tył, zmniejszając rezystancję i straty napięcia, pozwalając na obniżenie napięcia wejściowego i temperatury.
- Kondensatory z tyłu – absorbują skoki napięcia, umożliwiając pracę przy jeszcze niższym napięciu.
- Zintegrowane stabilizatory napięcia (IVR) – pozwalają na dokładniejsze dostrajanie napięcia dla poszczególnych rdzeni, zwiększając efektywność energetyczną.
Jednak badania pokazują, że technologie backside mogą wprowadzać nowe problemy termiczne. Na przykład, zmniejszenie grubości podłoża krzemowego wymagane przy BSPDN ogranicza możliwość bocznego odprowadzania ciepła, co może prowadzić do powstawania lokalnych gorących punktów i wzrostu temperatury nawet o 14°C.
W kierunku CMOS 2.0
Nowy paradygmat technologii logiki krzemowej, nazwany CMOS 2.0, będzie obejmował zaawansowane architektury tranzystorów i wyspecjalizowane warstwy logiczne. Jednym z pomysłów jest zastosowanie dwóch warstw sterujących – jednej dla długich połączeń i drugiej dla połączeń krótszych niż 10 mm, co pozwoliłoby na obniżenie napięcia i zmniejszenie gęstości mocy.
Podejście interdyscyplinarne
Rozwiązanie problemów termicznych w branży półprzewodnikowej będzie wymagało współpracy specjalistów z różnych dziedzin. Żadna pojedyncza technologia – czy to materiały interfejsu termicznego, tranzystory, schematy sterowania, obudowy czy chłodnice – nie rozwiąże wszystkich problemów cieplnych przyszłych układów scalonych.
Eksperci wzywają do nowej metody rozwoju układów scalonych zwanej współoptymalizacją technologii systemowej (STCO), która ma na celu całościowe rozpatrywanie systemów, projektu fizycznego i technologii procesów, przekraczając tradycyjne granice między specjalizacjami.
Choć nie znamy jeszcze wszystkich odpowiedzi na narastające wyzwanie termiczne, odpowiednie narzędzia i interdyscyplinarna współpraca dają powody do optymizmu w poszukiwaniu skutecznych rozwiązań.
Źródło: IEEE Spectrum, autor: Mario Konijnenburg, belgijskie centrum badawczo-rozwojowe Imec.