Корпорация ByteDance представила новую версию генеративной модели Seedream 4.0 для создания и редактирования изображений. Модель в частности доступна в приложении Doubao и на веб-платформе Jimeng. Обновление ориентировано на улучшение логического понимания контекста и увеличение скорости обработки данных.
Технология поддерживает восемь ключевых функций, включая точное редактирование, работу с референсами и генерацию последовательностей изображений. Пользователи могут выполнять сложные задачи, такие как замена фона или ретушь портретов, с помощью текстовых инструкций. Модель способна анализировать ключевые характеристики исходного изображения, включая художественный стиль и структурные особенности, для последующего воссоздания в новых контекстах.
Интеграция возможностей обработки визуальных сигналов позволяет использовать эскизы и наброски для управления генерацией без дополнительных модулей. Контекстный вывод обеспечивает работу с физическими и временными ограничениями, а многоканальный ввод поддерживает одновременную загрузку до десяти референсов. Функция вывода серий изображений поддерживает согласованность персонажей и стиля, что актуально для создания комиксов и дизайнерских проектов.
Расширенные возможности типографики включают обработку формул, таблиц и химических структур. Разрешение генерации достигло стандарта 4K UHD (3840×2160 пикселей) с адаптивным механизмом соотношения сторон. Технология автоматически выбирает оптимальное соотношение сторон в зависимости от семантики запроса или характеристик reference-объектов.
Эволюция генеративных моделей демонстрирует переход от инструментов выполнения единичных задач к комплексным творческим платформам. В отличие от предыдущих версий, Seedream 4.0 объединяет текстовую генерацию, редактирование и создание серий изображений в рамках единой архитектуры.
