Google DeepMind анонсировала новую версию своей ИИ-модели Genie 2, которая способна преобразовывать текстовые описания в трёхмерные интерактивные игровые окружения. Эта разработка расширяет возможности первой версии, Genie, выпущенной в феврале 2024 года, которая генерировала двухмерные миры.
Genie 2 позволяет пользователям создавать сложные виртуальные пространства, описывая их текстом. ИИ отвечает за рендеринг окружения, а взаимодействие происходит через действия, выполняемые пользователем, — будь то движение мыши или нажатие клавиш. Генерация базируется на алгоритмах модели Imagen 3, которая синтезирует визуальные элементы по текстовым подсказкам.
Вторая версия получила существенные улучшения:
На данный момент Genie 2 способна генерировать интерактивные сцены продолжительностью до одной минуты. Однако Google DeepMind подчёркивает, что технология находится на раннем этапе развития. Для её улучшения требуются значительные доработки в области взаимодействия агентов и создания более сложных миров.
Компания видит в Genie 2 инструмент для безопасной тренировки ИИ-агентов, а также платформу для создания уникальных цифровых сред, что может ускорить разработку игр и тестирование алгоритмов. Genie 2 — это шаг вперёд в интеграции ИИ в разработку интерактивных миров. Несмотря на текущие ограничения, технология демонстрирует потенциал для революции в игровой индустрии и обучении искусственных интеллектов.