NVIDIA официально представила свою архитектуру GPU Blackwell, обещающую пятикратный прирост производительности по сравнению с предыдущими GPU Hopper H100. По словам спикеров NVIDIA, этот анонс закрепляет позиции компании на переднем крае инноваций в области ИИ и тензорных вычислений.
Графические процессоры Blackwell, произведенные по специальному техпроцессу 4NP от TSMC, содержат 208 миллиардов транзисторов. В этих чипах используется новаторская конструкция многокристального модуля (MCM), объединяющая два GPU в одном корпусе, соединенных каналом связи 10 ТБ/с между кристаллами, что обеспечивает устойчивую связь и высокую вычислительную мощность.
Отличительной особенностью Blackwell является движок Transformer Engine второго поколения, использующий передовую поддержку масштабирования микротензоров и алгоритмы управления динамическим диапазоном NVIDIA. Этот движок позволяет удвоить объем вычислений и размер моделей, подкрепленный новыми возможностями ИИ-вычислений с плавающей запятой 4 бит, интегрированными в фреймворки NVIDIA TensorRT-LLM и NeMo Megatron.
Обеспечивая высокоскоростную связь между 576 GPU для самых сложных больших языковых моделей (LLM), технология NVLink пятого поколения обеспечивает двунаправленную пропускную способность 1,8 ТБ/секунду на GPU, что в свою очередь обеспечивает бесперебойную совместную работу нескольких GPU, необходимую для решения самых сложных вычислительных задач в отрасли.
Надежность, доступность и удобство обслуживания являются для Blackwell важными факторами, поэтому в архитектуру встроен специальный механизм RAS Engine. Кроме того, в Blackwell реализованы возможности предиктивного обслуживания на основе искусственного интеллекта на уровне чипа, что позволяет увеличить время безотказной работы системы и снизить эксплуатационные расходы при развертывании масштабных систем искусственного интеллекта, работающих без перерыва в течение длительного времени.
В Blackwell реализованы передовые возможности конфиденциальных вычислений, которые защищают модели ИИ и данные клиентов. Встроенные протоколы шифрования интерфейса предназначены для таких чувствительных к конфиденциальности отраслей, как здравоохранение и финансовые услуги.
Blackwell может похвастаться специальным механизмом декомпрессии, поддерживающим самые современные форматы. Эта инновация отвечает растущему спросу на обработку данных с GPU-ускорением — область, в которую компании инвестируют десятки миллиардов ежегодно.
Графический процессор NVIDIA Blackwell B200 — первое предложение на базе этой архитектуры. Благодаря многокристальному корпусу с двумя вычислительными плашками, изготовленными по 4-нм техпроцессу TSMC, он оснащен 160 потоковыми мультипроцессорами (SMs) и 20 480 ядрами. Дополняют эту вычислительную мощь восемь стеков памяти HBM3e, предлагающих в совокупности 192 ГБ памяти и пропускную способность 8 ТБ/с по 8192-битному шинному интерфейсу.
По сравнению с архитектурой Hopper, Blackwell обеспечивает в 5 раз большую производительность ИИ, достигая 20 петафлопс на чип для вычислений FP8, FP6 и FP4. Он также поддерживает до 740 миллиардов параметров, 34 триллиона параметров в секунду и может похвастаться межсоединением NVLink со скоростью 7,2 ТБ/с — все это значительные улучшения поколения.
