3 месяца назад 6 ноября 2025 в 14:40 17884

В первом квартале 2024 года компания NVIDIA представила платформу GB200 NVL72, предназначенную для крупномасштабных задач искусственного интеллекта и высокопроизводительных вычислений. Эта система включает 72 графических процессора GB200 Grace Blackwell Superchip, объединенных в единый вычислительный блок. Для обеспечения стабильной работы такого мощного оборудования требуется эффективное решение для отвода тепла. Стоимость системы жидкостного охлаждения, разработанной специально для GB200 NVL72, составляет 49 900 долларов США.

Платформа GB200 NVL72 представляет собой стойку, содержащую 36 двухслотовых вычислительных узлов, каждый из которых оснащен двумя суперчипами GB200. Общее количество графических процессоров достигает 72 единиц. Суммарная тепловая мощность, выделяемая этой системой, достигает 120 кВт. Традиционные методы воздушного охлаждения не способны справиться с таким объемом тепловыделения, что делает применение жидкостного охлаждения обязательным условием эксплуатации.

Система жидкостного охлаждения, оцененная в 49 900 долларов, включает в себя несколько ключевых компонентов. В первую очередь, это система распределения охлаждающей жидкости, которая обеспечивает подачу хладагента непосредственно к вычислительным узлам. В состав системы входят насосные станции, теплообменники и трубопроводы, выполненные из материалов, устойчивых к коррозии и высоким нагрузкам. Также в комплект поставки входит блок управления, который мониторит температуру и регулирует поток жидкости для поддержания оптимального теплового режима.

Стоимость системы охлаждения составляет значительную долю от общей стоимости всей платформы GB200 NVL72. По оценкам экспертов, полная стоимость стойки GB200 NVL72 может превышать 3 миллиона долларов, в зависимости от конфигурации и дополнительных услуг. Таким образом, расходы на охлаждение составляют примерно 1,6% от общей стоимости оборудования. Эта цифра отражает сложность и высокую технологичность решений, необходимых для работы с современными высокопроизводительными ускорителями.

Сравнение с предыдущими поколениями систем охлаждения показывает тенденцию к увеличению сложности и стоимости. Например, системы охлаждения для предыдущих поколений ускорителей, таких как NVIDIA A100 или H100, имели более низкую стоимость, поскольку их тепловыделение было существенно меньше. Максимальное тепловыделение одного ускорителя H100 составляет около 700 Вт, в то время как GB200 Superchip, содержащий два графических процессора, выделяет значительно больше тепла. Увеличение плотности мощности в современных центрах обработки данных требует перехода на более эффективные и, соответственно, более дорогие системы жидкостного охлаждения.

Система жидкостного охлаждения для GB200 NVL72 использует технологию прямого контакта с жидкостью (Direct Liquid Cooling, DLC). Хладагент циркулирует через специальные холодовые плиты, установленные непосредственно на горячих компонентах – графических процессорах и модулях памяти. Это обеспечивает максимальную эффективность теплоотвода по сравнению с косвенными методами. Эффективность DLC позволяет снизить температуру чипов до уровня, необходимого для их стабильной работы на высоких тактовых частотах, что критически важно для задач обучения больших языковых моделей и научных расчетов.

Никто не прокомментировал материал. Есть мысли?