Статья удалена
Хьюстон у нас проб в общем жопа…
Итак совеменные техпроцессы микрочипов потихоньку приближаются к рубежу всех возможных пределов. Количество транзисторовов растет по экспоненте и уже в ближайшее время десяток, а то и сотня триллионов транзисторов на какой- нибудь RTX 7090 будет обычным делом.
Но из-за роста числа транзисторов охлаждать такие чипы становится все сложнее и сложнее. Токи утечки, плюс особенность материала на котором, они расположены, а именно монокристаллический кремний.
Кремниевая подложка настолько убого отводит тепло, что энтузиасты пытаясь выжать дополнительные мегагерцы при разгоне, сошлифовывают миллиметры кристалла и о чудо - это дает выйгрыш по градусам и частотам.
Собственно, а почему сами чипмейкеры этого не делают? Какой-то заговор?
Да нет, это сильно уменьшает прочность чипа, вероятность его скола при его сборке повышается многократно, плюс верхний слой кристалла легирован каким-то особым покрытием, защищающий кристалл от воздействия атмосферного воздуха, а именно азота.
Ну и сами чипы изготавливаются в условиях защитной атмосферы из благородных газов (Гелий, Аргон, Неон и тд)
Если загуглить как делается микрочипы, то будет куча видосов, как из больших кремниевых зеркально отполированных пластин, путем многократной заливки фоторезистов их особой засветки, протравкии и сымвки, формируются те самые логические элементы типо NAND, NOR, XNOR, XOR и тд.(кто все эти люди?)
По сути при толщине подложки в 1 мм, слой полупроводников вашего любимого Rayzen или i9 занимает какие-то 100-200 микрон, все остальное кусок стекла с очень хреновым теплопроводением.
И выводы кристалла находятся именно на той стороне, которая через специальный интерфейс припаивается к текстолитовой подложке (микрошары и компаунд которым залит чип)- вся верхняя часть кристалла по сути пустышка и небольшие сколы кромок - обычно не приводят к проблемам, если они конечно не уходят в глубь.
Теперь суть проблемы. Кристалл кремния во время тяжелой нагрузки из-за скачкообразного роста температуры, по причина своей омерзительной теплопроволности, начинает расширяться в размерах, причем расширяется он во все стороны сразу.
Компаунд который его фиксирует от температуры начинает размягчаться, а из-за разности в температурном расширении текстолита и кристалла происходят микроотрывы шариковых выводов от кристалла. Проявляется это отвалами и прочими нехорошими последствиями.
И решение этой проблемы лишь частично исправлено- вспомним печально известные серии Nvidia до 1000 серии, там отвал привычное явление.
Сейчас Авито захламлена объявлениями где предлагают 590, 690GTX у которой почему-то не работает один чип. Либо просо ставят неадекватный ценник и пишут - не работает, что с ней не знаю - отвал что же еще.
Хоть Nvidia заявляет что победила отвал в 1000 серии - это не так. Причина тут именно в материале кристалла, он очень плохо проводит температуру. А желание чипмейкера получить корону первенства, заставляет подкручивать частоты и напряжение. Андервольтинг тут идет уже как панацея, а не тупость.
И если вы следите за новостями, то наверно слышали, как проблему с расширением и перегревом пытаются решить.
Например - Тонкий слой полиэтилена в один атом способен отводить температуру на равне с алмазом.
Микрокапилляры в кремниевом кристалле показали эффективность в отводе тепла.
Графен (ну куда же без него) в исследованиях показал невероятную эффективность по отводу тепла.
Ученые MIT провели металлизацию кремниевого кристалла, что позволило эффективно отводить тепло и тд.
Кубический нитрид бора - более совершённый полупроводник, эффективнее кремния и лучше проводит тепло
И тд и тп
И…Где… все это?
Где?
Этим исследованиям уже десятки лет, а процессоры до сих пор еле еле до 5ГГц смогли дойти. И то это частота буста с температурами под 95-98° - нормально ли это?
Нет конечно- хот спот ядер находится на некотором расстоянии от них, и из-за слабой теплопроводности кремния, самое горячее ядро, еще горячее, чем те цифры, что показывает датчик.
В добавок производитель откровенено ещё жадничает, пихая совершенно неподходящи термоинтерфейс под крышку теплораспределителя.
Плюс существует так называемая электронная диффузия и электонная эрозия
. Под действием высокой температуры и напряжения, электороны в полупроводниковой среде формируют туннели между выводами транзисторов в обход затвора и случается закономерный исход, транзистор больше не управляем, он всегда включен. И алгоритмы процессора вынужденно выключают целые сбойные кластера. Так называемая деградация кристалла.
Этот процесс неизбежен, но температура и напряжение являются его катализатором.
Заметили одну вещь, серверные процессоры, не тот мусор что на Али, а новые только что из под станка - имеют низкие частоты и напряжения. А ценник у них просто космический. И температура у них обычно даже при полной нагрузке до 80 не доходит. И их покупают партиями, потому что важна безотказность и надежность.
Может скажу глупость, но компания выпускает одинаковые процессоры, а потом сортирует их по качеству.
И когда остаётся куча годных кристаллов, их делят поровну, одним режут частоты и напряжение и продают как серверные, другие же разгоняют и выжимают из них всю мощь и продают как HI-END процессоры.
Для исторической справки, радиоэлектроника для военной отросли подлежит плановой утилизации через определённые временные промежутки и это прописано в госте. Даже если она не применялась, через определенный срок она подлежит полной замене.
Вывод из этого лонга, есть куча решений, как эффективно отводить тепло от кристалла и плаышать частотный потенциал микропроцессоров, но дальше бумаги и пары экспериментов это не пошло.
Производстель в борьбе да первенство старается максимально выжать все ресурсы из чипа, что бы в бенчмарке он был круче конкурента. Это зашитые в микрокод процессора параметры буста, множителя и напряжения.
Высокая температура и напряжение приводят к деградации микропроцессора
В будущем ситуация только усугубиться - почему? Да потому что этим данным уже десятки лет и ничего из этого так и не реализовано.
Компании попытаются выдоить все возможное из кремния и только потом перейдут на что-то новое.