Anthropic опубликовала результаты внутреннего тестирования своей новой модели Claude Fable 5, в ходе которого ИИ-агент смог полностью пройти игру Pokémon FireRed, опираясь исключительно на картинку с экрана. Разработчики подчеркнули, что модель не получала карту, доступ к внутреннему состоянию игры и подсказки о том, куда двигаться дальше. Весь визуальный поток (локации, меню, диалоги, сражения) транслировался напрямую, как если бы перед монитором сидел человек.
В опубликованном видеоролике видно, как Claude Fable 5 запускает Pokémon FireRed, методично прокачивает покемона и проходит сюжетную линию. Некоторые действия выглядели неочевидно: например, ИИ время от времени возрождал слабых покемонов, чтобы те были моментально уничтожены. Остаётся неясным, нашла ли модель такую тактику самостоятельно или дополнила увиденное информацией из обучающих данных. Тем не менее факт остаётся фактом — игра была пройдена, причём без сложных вспомогательных модулей, которые требовались в более ранних экспериментах.
Параллельно Anthropic протестировала Fable 5 в других проектах. В карточном рогалике Slay the Spire результат оказался заметно скромнее: ИИ застрял на третьем уровне, который сами разработчики в блоге иронично охарактеризовали как «уровень новичка». Зато в Factorio модель сумела выстроить автоматизированную фабрику — задачу, где необходимо долгосрочное планирование, распределение ресурсов и удержание цели на десятках последовательных шагов.
Самый заметный нюанс, который не позволяет воспринимать эксперимент как прелюдию к замене геймеров или стримеров, — колоссальный расход токенов. По оценкам Anthropic, на полноценное прохождение Pokémon уходят вычислительные ресурсы, сопоставимые с промышленными объёмами. Пользователи сети
