4 недели назад 11 октября 2024 в 16:25 11537

Компания AMD расширила ассортимент ускорителей искусственного интеллекта, представив Instinct MI325X. Этот новый ускоритель призван заменить предыдущую модель Instinct MI300X, предлагая ряд улучшений.

Instinct MI325X построен на архитектуре AMD CDNA 3 и имеет ряд ключевых усовершенствований. Наиболее заметным изменением является увеличение объема памяти: новый ускоритель оснащен 256 ГБ памяти HBM3E, работающей с пропускной способностью 6 ТБ/с. Это в 1,8 раза больше, чем 192 ГБ памяти HBM3 в предыдущей модели MI300.

Увеличение объема памяти является важным событием, поскольку ожидается, что в будущем рабочие нагрузки ИИ будут включать в себя обучение моделей с количеством параметров, измеряемых триллионами, а не миллиардами, как в текущих моделях.

Что касается вычислительных ресурсов, Instinct MI325X обеспечивает производительность 1,3 Петафлопс в FP16 и 2,6 Петафлопс в FP8 как для обучения, так и для вывода. Это в 1,3 раза больше, чем у Instinct MI300.

Важно отметить, что Instinct MI325X предназначен для замены текущей платформы, разработанной для MI300X, поскольку они имеют одинаковую совместимость выводов. В системе с восемью ускорителями MI325X пользователи могут воспользоваться 2 ТБ памяти HBM3E с потрясающей пропускной способностью 48 ТБ/с. Такая система может достичь производительности 10,4 Петафлопс в FP16 и 20,8 Петафлопс в FP8.

AMD сравнила производительность Instinct MI325X с системой NVIDIA H200 HGX, заявив, что новый ускоритель AMD превосходит систему NVIDIA в 1,3 раза по пропускной способности памяти, производительности вычислений FP16/FP8 и в 1,8 раза по объему памяти.

Ускоритель Instinct MI325X поддерживается программным стеком AMD ROCm, который компания намерена внедрить в каждый GPU, включая потребительские модели.

Забегая вперед, отметим, что AMD готовит семейство Instinct MI350X ко второй половине 2025 года. Ожидается, что этот ускоритель следующего поколения CDNA 4 будет построен по нормам 3 нм в TSMC и оснащен 288 ГБ памяти HBM3E. В архитектуре CDNA 4 также появится поддержка низкоуровневых типов данных, таких как FP4 и FP6, что позволит Instinct MI355X достичь впечатляющих вычислительных возможностей в 2,3 Петафлопса в FP16 и 4,6 Петафлопса в FP8.

Никто не прокомментировал материал. Есть мысли?