Китайская компания Alibaba Group обновила флагманскую языковую модель до версии Qwen3.7-Max, сделав основной упор на способности к длительной автономной работе (Agentic AI). В ходе внутреннего тестирования нейросеть сохраняла непрерывную логику рассуждений на протяжении 35 часов, выполнив более 1000 обращений к внешним программным инструментам без потери смыслового контекста. Модель получила нативную совместимость с протоколом MCP (Model Context Protocol) и демонстрирует стабильную работу при развёртывании в сторонних средах, таких как Claude Code или OpenClaw.
Ядром новой модели является архитектура, нацеленная на поддержание длинных цепочек действий. Для проверки этого инженеры Alibaba дали Qwen3.7-Max задачу оптимизировать вычислительное ядро (kernel) Extend Attention для незнакомого чипа — ускорителя T-Head Zhenwu M890. У модели не было документации или примеров кода под эту архитектуру. Стартовав с нуля, нейросеть самостоятельно запускала цикл «написание кода — компиляция — профилирование — поиск узких мест — правка». В процессе она провела 432 замера производительности и в итоге ускорила работу ядра в 10 раз по сравнению с эталонной версией от SGLang на языке Triton.
Ключевой особенностью Qwen3.7-Max стало умение перестраивать архитектуру решения спустя много часов работы. Если на старте модель использовала простые методы распараллеливания, то после 30 часов автономного труда она самостоятельно перешла к более сложной схеме, которая обрабатывает сразу четыре токена запроса в одном блоке, экономя время на загрузку данных из памяти. Эта способность к редизайну спустя длительное время отличает новинку от многих конкурентов, у которых «внимание» к задаче рассеивается быстрее.
В корпоративном сегменте Qwen3.7-Max адаптировали для автоматизации офисных процессов и сложной multi-agent координации. Через протокол MCP модель получает доступ к внешним базам данных и API, а при помощи внутреннего разделения труда (один «агент» ищет данные, другой анализирует, третий пишет отчёт) способна заменить ручную работу команды. В бенчмарке SpreadSheetBench-v1, имитирующем работу с электронными таблицами, модель набрала 87 баллов из 100. В симуляции стартапа YC-Bench система показала выручку в 2,08 миллиона долларов, что выше показателей предшествующих версий.
Помимо длительных сессий, разработчики усилили безопасность рассуждений. На этапе обучения с подкреплением Qwen3.7-Max выработала механизм контроля, который отслеживает попытки нейросети «сжульничать» или подогнать ответ под известные из базы данных результаты. Модель научилась выявлять такие эпизоды и корректировать поведение, что повышает достоверность при решении математических или научных задач.
В сравнении с прямыми конкурентами, Qwen3.7-Max занимает позицию между проприетарными гигантами. По данным рейтинга Arena, модель обошла Kimi-K2.6 и DeepSeek-v4-pro, приблизившись к показателям GPT, Claude 4.6 Opus и Gemini. При этом стоимость использования существенно ниже: заявляется ценовой коэффициент около 1/10 от расценок на сопоставимые модели Claude. Доступ к Qwen3.7-Max открыт бесплатно в приложении, на веб-сайте и через API на платформе Alibaba Cloud BaiLian (Model Studio).
