1 месяц назад 14 марта 2024 в 19:20 7618

OpenAI, ведущая исследовательская компания в области искусственного интеллекта, недавно представила свой революционный инструмент для преобразования текста в видео, Sora. Эта инновационная технология позволяет генерировать реалистичные видеоролики в формате 1080p на основе текстовых описаний. В настоящее время Sora проходит тестирование с ограниченной группой режиссеров и создателей фильмов, чтобы выявить и устранить потенциальные уязвимости и обеспечить безопасность для публичного использования.

В интервью Wall Street Journal главный технический директор OpenAI Мира Мурати рассказала о планах компании выпустить Sora для широкой публики до 2025 года, причем релиз может состояться уже в ближайшие несколько месяцев. OpenAI стремится предоставить создателям инструмент, который позволит им «редактировать и создавать с легкостью».

В отличие от предыдущей демонстрации Уилла Смита, поедающего спагетти, которая была создана год назад, Sora создает «гиперреалистичный» контент, за исключением некоторых незначительных проблем с изображением рук и пальцев. Технический директор OpenAI подчеркнул, что видео, сгенерированные Sora, будут снабжены водяными знаками, что является обычной практикой среди инструментов генерации текста в изображение, для обеспечения прозрачности.

Отвечая на вопрос о потенциальном влиянии этого инструмента на работу творцов в будущем, Мурати заявил, что цель OpenAI — использовать Sora в качестве инструмента, помогающего творцам в их работе, а не заменяющего их. Компания намерена сотрудничать с киноиндустрией и создателями фильмов, чтобы определить дальнейшее развитие и внедрение Sora, а также создать экономическую модель, учитывающую вклад данных.

Что касается данных, используемых для обучения Sora, Мурати упомянула, что они состоят из общедоступных и лицензированных данных, которые могут включать видео с таких платформ, как YouTube, Facebook и Instagram. Однако более подробной информации она не предоставила.

Примечательно, что в настоящее время Sora не включает звук в генерируемые ролики, но, как сообщается, OpenAI планирует интегрировать аудиовозможности в будущем. Это может привести к появлению еще более продвинутой версии инструмента с другим названием, подобно эволюции DALL-E.

Как и другие модели OpenAI, Sora будет платной услугой.

Никто не прокомментировал материал. Есть мысли?