Компания OpenAI анонсировала серию новых моделей под названием GPT-4.1, которая включает GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Эти модели предлагают заметные улучшения в области программирования, выполнения инструкций и понимания длинного контекста по сравнению с предыдущими версиями, такими как GPT-4o. Все три модели поддерживают до одного миллиона токенов контекста, что позволяет им обрабатывать более объемные документы, кодовые базы и даже транскрипты часовых видео.
В тестах по программированию модель GPT-4.1 показала результат 54.6% на проверочном бенчмарке SWE-bench Verified, что на 21.4 пункта лучше, чем у GPT-4o. Это делает её одной из самых сильных моделей для реальных задач в области разработки программного обеспечения. Модель демонстрирует улучшенные способности в исследовании кодовых баз, создании исправлений, которые компилируются и проходят тестирование, а также в работе с различными формами отличий без дополнительных правок.
Способности модели в выполнении инструкций также показали развитие. На бенчмарке MultiChallenge от Scale модель GPT-4.1 набрала 38.3%, что на 10.5 пунктов больше, чем у GPT-4o. Это свидетельствует о её большей надежности в выполнении многоэтапных подсказок и соответствии формату ответов, заданному пользователем.
Долгосрочные навыки обработки контекста модели заметны на бенчмарке Video-MME. Здесь GPT-4.1 получила 72.0% в категории «долгие, без субтитров», что на 6.7 пункта выше, чем у GPT-4o. Благодаря окну в один миллион токенов, GPT-4.1 способна обрабатывать информацию, разбросанную по огромным массивам данных, будь то текст в документе или ключевые моменты в видео.
OpenAI заявляет, что эти улучшения стали возможны благодаря тщательной работе с разработчиками, направленной на настройку моделей для актуальных задач, а также на снижение затрат и времени отклика. Модель GPT-4.1 mini уменьшает затраты на 83% и сокращает время ответа почти наполовину по сравнению с GPT-4o. Модель GPT-4.1 nano характеризуется еще более высокой скоростью и экономичностью, что делает её целесообразной для классификации или автозаполнения.
Все три модели стали доступны через API OpenAI. Изначально они не будут доступны непосредственно в ChatGPT, хотя многие из их улучшений уже вошли в последнюю версию чат-бота GPT-4o. Разработчики, использующие бета-версию GPT-4.5 Preview, должны перейти на новые модели до 14 июля 2025 года, когда текущая версия будет выведена из оборота.