Компания AMD расширила ассортимент ускорителей искусственного интеллекта, представив Instinct MI325X. Этот новый ускоритель призван заменить предыдущую модель Instinct MI300X, предлагая ряд улучшений.
Instinct MI325X построен на архитектуре AMD CDNA 3 и имеет ряд ключевых усовершенствований. Наиболее заметным изменением является увеличение объема памяти: новый ускоритель оснащен 256 ГБ памяти HBM3E, работающей с пропускной способностью 6 ТБ/с. Это в 1,8 раза больше, чем 192 ГБ памяти HBM3 в предыдущей модели MI300.
Увеличение объема памяти является важным событием, поскольку ожидается, что в будущем рабочие нагрузки ИИ будут включать в себя обучение моделей с количеством параметров, измеряемых триллионами, а не миллиардами, как в текущих моделях.
Что касается вычислительных ресурсов, Instinct MI325X обеспечивает производительность 1,3 Петафлопс в FP16 и 2,6 Петафлопс в FP8 как для обучения, так и для вывода. Это в 1,3 раза больше, чем у Instinct MI300.
Важно отметить, что Instinct MI325X предназначен для замены текущей платформы, разработанной для MI300X, поскольку они имеют одинаковую совместимость выводов. В системе с восемью ускорителями MI325X пользователи могут воспользоваться 2 ТБ памяти HBM3E с потрясающей пропускной способностью 48 ТБ/с. Такая система может достичь производительности 10,4 Петафлопс в FP16 и 20,8 Петафлопс в FP8.
AMD сравнила производительность Instinct MI325X с системой NVIDIA H200 HGX, заявив, что новый ускоритель AMD превосходит систему NVIDIA в 1,3 раза по пропускной способности памяти, производительности вычислений FP16/FP8 и в 1,8 раза по объему памяти.
Ускоритель Instinct MI325X поддерживается программным стеком AMD ROCm, который компания намерена внедрить в каждый GPU, включая потребительские модели.
Забегая вперед, отметим, что AMD готовит семейство Instinct MI350X ко второй половине 2025 года. Ожидается, что этот ускоритель следующего поколения CDNA 4 будет построен по нормам 3 нм в TSMC и оснащен 288 ГБ памяти HBM3E. В архитектуре CDNA 4 также появится поддержка низкоуровневых типов данных, таких как FP4 и FP6, что позволит Instinct MI355X достичь впечатляющих вычислительных возможностей в 2,3 Петафлопса в FP16 и 4,6 Петафлопса в FP8.