Команда Google DeepMind начала тестирование Project Genie — нового прототипа, позволяющего создавать интерактивные миры с помощью текстовых запросов или изображений. Сервис позиционируется как исследовательский инструмент для экспериментов с генеративными моделями.
В основе системы лежит модель Genie 3, которая в реальном времени генерирует изменчивое окружение, предсказывая физику объектов и их реакцию на действия пользователя. Для создания сцены достаточно загрузить изображение или описать его текстом, выбрать тип персонажа и управления. Инструмент предлагает три основные функции: первичное создание мира, его свободное исследование и возможность модифицировать уже существующие сцены других пользователей.
На текущем этапе Project Genie доступен только подписчикам платной услуги Google AI Ultra, а сессия взаимодействия с миром ограничена 60 секундами. Разработчики предупреждают, что визуализация и отклик управления могут работать с задержками, а сгенерированная среда не всегда точно соответствует запросу или законам физики.
Project Genie представляет собой практическое применение исследований в области «мировых» моделей — систем ИИ, способных симулировать динамику различных сред. Технология рассматривается как шаг к созданию более универсальных алгоритмов, которые в будущем могут использоваться не только для развлечений, но и в областях вроде робототехники или проектирования.
Публичный тестовый доступ позволит Google собрать данные о том, как пользователи взаимодействуют с подобными системами. В компании отмечают, что это ранняя экспериментальная версия, и её функциональность будет постепенно расширяться, а в последствии функционал станет доступен всем пользователям.

