Компания ByteDance, владеющая популярной социальной сетью TikTok, представила обновленную версию своей передовой языковой модели Dou Bao, получившую название Dou Bao 1.5. Модель, разработанная в рамках подразделения ByteDance — Fire Engine AI, демонстрирует значительные успехи в различных интеллектуальных задачах.
Согласно техническому отчету, Dou Bao 1.5 показала выдающиеся результаты в математических рассуждениях, программировании, научных выводах и даже творческом письме. В тесте AIME 2024 по математике модель показала результат, сопоставимый с показателями OpenAI’s o3-mini-high. Кроме того, Dou Bao 1.5 продемонстрировала высокие баллы в соревнованиях по программированию и научным задачам, приближаясь к уровню модели o1.
В области творческого письма и ответов на вопросы, связанные с гуманитарными знаниями, новая версия Dou Bao также проявила впечатляющие способности к обобщению и адаптации к широкому спектру применений.
Одним из ключевых преимуществ Dou Bao 1.5 является ее эффективная архитектура на основе смеси экспертов (MoE). Общее количество параметров модели составляет 200 миллиардов, однако активных параметров всего 20 миллиардов, что на 50% меньше, чем у аналогичных моделей отрасли. Это обеспечивает значительное снижение вычислительных затрат при сохранении высокой производительности.
Кроме того, облачный сервис Dou Bao API демонстрирует впечатляющую масштабируемость, поддерживая высокую параллельность обработки запросов при задержке менее 20 миллисекунд.
Одной из новых возможностей Dou Bao 1.5 является интеграция с технологиями компьютерного зрения, позволяющая модели не только понимать текст, но и анализировать визуальную информацию. Это открывает новые сценарии применения, например, оценку геоморфологии на основе фотографий или помощь в выборе блюд во время путешествий.
Помимо обновлений в области понимания текста и изображений, ByteDance также представила новую версию своей генеративной модели Seedream 3.0, ориентированной на генерацию изображений. Seedream 3.0 уже используется в приложениях компании и занимает лидирующие позиции в авторитетном рейтинге Artificial Analysis по генерации изображений.
Одним из перспективных применений Dou Bao 1.5 является улучшение возможностей поиска по видео. Модель способна находить ответы на вопросы пользователей, анализируя соответствующие фрагменты видеоконтента.
Согласно заявлению компании, использование больших языковых моделей Dou Bao продолжает стремительно расти. К марту 2025 года среднесуточный объем использования токенов превысил 12,7 триллионов, что более чем в 106 раз превышает показатели начального периода.