В эксперименте применялась эмуляторная версия игры, интегрированная с разработанной командой Hao AI Lab платформой GamingAgent, рассказывает 24 Канал со ссылкой на TechSpot.
Читайте на сайте Фанат определил, на какой версии игры Minecraft основан фильм "Minecraft в кино"
Эта система позволяла моделям управлять Марио путем генерации кода Python. Все искусственные интеллекты получали одинаковые базовые инструкции, например, "Перепрыгни этого врага", а также визуальные снимки игрового процесса.
Хотя Super Mario Bros. на первый взгляд кажется простой 2D-игрой, она оказалась серьезным вызовом для ИИ. Моделям приходилось не только строить сложные последовательности движений, но и быстро адаптировать стратегию прохождения в реальном времени.
Лучшие результаты продемонстрировал Claude 3.7 от Anthropic – он отличился точными прыжками и умением избегать врагов. Его предшественник, Claude 3.5, также показал достойный результат, тогда как GPT-4o от OpenAI и Gemini 1.5 Pro от Google несколько отставали.
Исследование показало, что для успешного прохождения Super Mario Bros. логическое мышление играет второстепенную роль, зато решающее значение имеет точность и скорость реакции. Даже небольшая задержка могла отправить Марио на предыдущий чекпойнт.
Смотрите также Ubisoft объяснила, почему так долго откладывала разработку Assassin's Creed Shadows
Исследователи подчеркивают, что использование ретроигр для оценки ИИ – это преимущественно экспериментальный подход. Умение пройти Super Mario Bros. не определяет реальную полезность модели, но наблюдать, как интеллекты, обученные на миллиардах параметров, терпят поражение в классической игре, безусловно, интересно.