Компания Samsung Electronics внедряет новую архитектуру питания в своей высокоскоростной памяти HBM4E, чтобы решить проблемы с перегревом и энергоэффективностью, возникающие при переходе на следующее поколение чипов для систем искусственного интеллекта. Количество контактов питания при переходе с HBM4 на HBM4E увеличивается с 13 682 до 14 457, но разместить их приходится на той же физической площади, используя более тонкую и плотную проводку. Это неизбежно ведет к росту плотности тока и увеличению сопротивления, что вызывает эффект IR-падения — снижение напряжения по мере прохождения через цепи. Возникающий нагрев дополнительно повышает сопротивление, создавая замкнутый круг, который способен привести к сбоям или вынужденному снижению тактовой частоты.
Для преодоления этих трудностей инженеры Samsung переработали структуру блока питания MET4 на базовом кристалле памяти. В предыдущих поколениях этот блок представлял собой единый массив, напоминающий пчелиные соты и расположенный вблизи интерпозера. При передаче энергии к верхним слоям память тратилась в сужающихся каналах, что создавало узкие места наподобие автомобильной пробки при слиянии полос. В новой версии крупный узел MET4 разделили на четыре самостоятельных меньших блока, а верхние слои разводки также подвергли сегментации. Такое решение сократило пути прохождения тока и уменьшило локальную перегруженность проводников.
Результатом реорганизации системы питания стало значительное улучшение ключевых показателей. По данным компании, количество дефектов в металлических цепях снизилось на 97% по сравнению с предшественником HBM4. Величина IR-падения уменьшилась на 41%, что расширило рабочий диапазон напряжений и повысило стабильность функционирования кристаллов. Улучшенные характеристики открывают путь к более высоким частотам работы памяти и ее надежности в составе ускорителей вычислений.
Параллельно с инженерными улучшениями текущего продукта Samsung исследует возможность кардинальной смены архитектуры — физического отделения кристаллов высокоскоростной памяти от графического процессора. В современных конструкциях стопки HBM располагаются вплотную к GPU на общем интерпозере, что создает крайне высокую концентрацию тепловыделения в ограниченной области. Увеличение расстояния между компонентами до 5 сантиметров и более способно заметно облегчить отвод тепла и упростить конструкцию системы охлаждения.
Ключевым вопросом при такой разнесенной компоновке становится сохранение высокой пропускной способности. Традиционные медные соединения на таких дистанциях неизбежно вносят задержки и потери сигнала. В качестве решения Samsung рассматривает применение фотонных межсоединений, где данные передаются световыми импульсами. Теоретическая скорость таких линий может достигать терабит в секунду, что примерно в тысячу раз быстрее электрических аналогов. При достаточной пропускной способности даже удаленное расположение памяти не станет препятствием для производительности. Кроме того, изучаются возможности совершенствования подложек и методов разводки, которые сами по себе позволят разнести компоненты без катастрофической потери скорости.
Необходимо отметить, что работа над архитектурой HBM4E ведется на фоне рыночных успехов Samsung с предыдущей версией HBM4. Компания уже поставляет коммерческие образцы HBM4, работающие на скорости 11,7 гигабит в секунду с запасом до 13 гигабит, и участвует в цепочках поставок для ускорителей NVIDIA. По отраслевым данным, Samsung применила в HBM4 более тонкий техпроцесс 1c для DRAM, что обеспечило прирост энергоэффективности на 10–20% и скорости примерно на 10% по сравнению с предшествующими решениями конкурентов. Накопленный опыт и технологический задел позволяют компании прорабатывать столь нетривиальные пути эволюции, как перепроектирование системы питания и переход к оптическим межсоединениям в следующих поколениях памяти.
