Китайская компания Huawei Cloud первой среди облачных провайдеров внедрила поддержку свежей версии популярной языковой модели DeepSeek-V4, релиз которой состоялся 24 апреля 2026 года. Разработчики получили доступ к двум вариантам нейросети через платформу MaaS без необходимости самостоятельно разворачивать серверное оборудование и настраивать программное окружение. Инженеры Huawei провели глубокую оптимизацию вычислительных процессов на серверах с собственными чипами Ascend, что позволило снизить нагрузку на оперативную память и ускорить обработку длинных текстов объёмом до одного миллиона токенов.
Модель DeepSeek-V4 вышла в двух редакциях на базе архитектуры смеси экспертов. Флагманская версия Pro насчитывает 1,6 триллиона параметров с активацией 49 миллиардов из них при каждом обращении, в то время как экономичная версия Flash содержит 284 миллиарда параметров и активирует 13 миллиардов. Обе редакции штатно работают с контекстом длиной 100 тысяч токенов, но при необходимости способны обрабатывать до одного миллиона токенов, что эквивалентно двум полным томам романа «Война и мир». Для сравнения, предшествующая модель V3.2 имела предельный размер контекста 128 тысяч токенов.
В техническом плане DeepSeek-V4 использует механизм гибридного внимания, который включает два основных компонента: сжатое разреженное внимание и пересжатое внимание. Эти нововведения позволяют существенно экономить вычислительные ресурсы. По данным производителя, при работе с контекстом в миллион токенов версия Pro тратит на один токен вычислений всего 27 процентов от объёма, требовавшегося модели V3.2, а занимаемый объём кэша ключей и значений сократился до 10 процентов. Версия Flash демонстрирует ещё более впечатляющие показатели — 10 процентов вычислений и 7 процентов кэша. Такой прогресс достигнут благодаря отказу от наращивания аппаратной мощности в пользу архитектурных изменений.
DeepSeek открыто признаёт, что её новая модель уступает лидерам рынка. В официальном отчёте компания указала, что возможности V4 отстают от GPT-5.4 OpenAI и Gemini-3.1-Pro от Google примерно на три-шесть месяцев. Тем не менее, в определённых тестах новинка показывает конкурентоспособные результаты: в бенчмарках по программированию Codeforces модель набрала рейтинг 3206, а в тесте Apex Shortlist достигла 90,2 процента правильных ответов, заняв первое место. В сценарных тестах на работу с инструментами Toolathlon и терминальными командами Terminal Bench 2.0 DeepSeek-V4-Pro опередила большинство соперников.
Huawei Cloud провела комплексную адаптацию модели для работы на собственных чипах Ascend. Инженеры внедрили механизм послойного сжатия внимания и настроили эффективное управление кэшем ключей и значений. Для ускорения вычислений задействовано более десяти высокопроизводительных операторов слияния TopK, SWA, CFA в паре с фреймворковой асинхронной диспетчеризацией и многошаговым спекулятивным декодированием. Этот комплекс оптимизаций обеспечивает на оборудовании Huawei полноценную поддержку длинного контекста.
В официальном сообщении DeepSeek указано, что пропускная способность Pro-версии в настоящее время ограничена из-за дефицита высокопроизводительных вычислительных мощностей. Компания ожидает, что после массового выпуска серверных кластеров Ascend 950 во втором полугодии 2026 года цены на Pro-версию существенно снизятся. Этот шаг укрепит позиции китайской экосистемы искусственного интеллекта, работающей на отечественной аппаратной платформе в обход решений Nvidia.
