2 месяца назад 5 декабря 2024 в 14:46 8334

Компания Google DeepMind, занимающаяся исследованиями в области искусственного интеллекта и создавшая систему AlphaGo, объявила о выпуске Genie 2 — инструмента, способного генерировать интерактивные 3D-среды на основе одного изображения. Эта новая модель призвана помочь в обучении и тестировании агентов ИИ, позволяя им взаимодействовать с этими динамичными виртуальными мирами с помощью клавиатуры и мыши.

Genie 2 обладает несколькими ключевыми возможностями, которые отличают ее от предыдущих инструментов для интерактивной генерации 3D-миров. Модель управляется действиями, то есть она может реагировать на действия пользователя, например, перемещать персонажа с помощью клавиш со стрелками, не ошибаясь при этом в перемещении других объектов, таких как деревья или облака. Кроме того, модель обладает памятью с длинным горизонтом, что позволяет ей запоминать и визуализировать части мира, которые уже не видны, создавая более непрерывную и реалистичную симуляцию.

Кроме того, Genie 2 может генерировать новый контент на лету, обеспечивая правдоподобное развитие окружения с течением времени. Система способна моделировать сложные взаимодействия, включая физику, гравитацию, освещение, анимацию персонажей и поведение неигровых персонажей (NPC). Это позволяет создавать разнообразные и захватывающие виртуальные миры.

Одной из примечательных особенностей Genie 2 является способность генерировать контрфактические симуляции, когда система может создавать различные пути из одной и той же начальной точки. Эта функция позволяет исследователям проверять различные результаты, предоставляя универсальный полигон для обучения агентов ИИ. Модель не ограничивается компьютерными изображениями; она также может использовать фотографии реального мира в качестве подсказок, имитируя природные элементы, такие как ветер, вода и растительность.

Также следует отметить возможности Genie 2 по быстрому созданию прототипов, позволяющие исследователям быстро создавать интерактивные объекты и тестировать их в различных средах. Эта функция облегчает итеративную разработку и оценку систем ИИ, ускоряя процесс исследований и разработок.

Никто не прокомментировал материал. Есть мысли?