Китайская команда Robbyant опубликовала в открытом доступе фреймворк LingBot-World, позволяющий генерировать интерактивные игровые среды в реальном времени. Разработка, представленная спустя двое суток после анонса закрытой системы Genie 3 от Google, дает независимым студиям и исследователям бесплатный инструмент для создания «играбельных» миров из изображений или текстовых описаний.
Основой проекта стала архитектура Wan2.2 от Alibaba. Модель LingBot-World-Base обеспечивает симуляцию с частотой 16 кадров в секунду, что позволяет пользователю напрямую управлять персонажем и камерой внутри сгенерированного пространства. В отличие от пассивной генерации видео, система обучалась на данных игровых движков, что позволило ей воспроизводить основы физики и причинно-следственные связи.
Ключевой особенностью фреймворка разработчики называют контекстную память. Модель сохраняет целостность сцены, отслеживает объекты, даже когда они вне поля зрения, и предотвращает их клиппинг через препятствия, что обеспечивает последовательное развитие ситуации в мире, а не просто воспроизведение заранее заданной анимации.
В настоящее время основным ограничением технологии остается высокая потребность в вычислительных ресурсах, что делает ее малодоступной для запуска на потребительском оборудовании. Также отмечается постепенный дрейф сцены при очень длительной симуляции из-за отсутствия выделенного модуля памяти. Разработчики указывают, что работают над расширением спектра возможных взаимодействий внутри мира и повышением стабильности генерации.
Появление полностью открытой альтернативы коммерческим продуктам крупных корпораций может ускорить исследования в области генеративного ИИ для игр и симуляций, снизив порог входа для небольших команд. Все

