Американская компания Emergence AI создала исследовательскую лабораторию, посвященную тестированию долгосрочной жизнеспособности непрерывно работающих систем ИИ.
Исследователи решили выяснить, что случится с нашей планетой, если миром будет управлять искусственный интеллект. Было запущено пять 15-дневных симуляций реального мира, каждая из которых управлялась разными агентами ИИ: Claude, ChatGPT, Grok, Gemini. Пятое моделирование, управлялось комбинацией моделей искусственного интеллекта. Таким образом исследователи хотели выяснить, какой мир создает каждая модель ИИ и насколько он устойчив. Каждая симуляция дала совершенно разные результаты.
Симуляции, в которых работали агенты ИИ, были оснащены множеством сложных элементов реального мира, включая более 40 локаций, в том числе полицейский участок и здание мэрии. Исследователи предоставили агентам ИИ доступ к новостным событиям в реальном времени и Интернету. Все 10 агентов, работавших в каждой симуляции, подчинялись одним и тем же законам, включая запреты на кражу, уничтожение имущества и обман.
Каждый агент ИИ мог общаться, голосовать, управлять ресурсами и планировать, а также демонстрировать другие виды поведения, свойственные людям. Параметры каждой симуляции также учитывали такие факторы, как экономическое давление и дефицит.
Симуляция под управлением Claude Sonnet 4.6 оказалась наиболее социально стабильной, с самыми высокими показателями гражданского участия, с нулевым уровнем преступности. Это была единственная симуляция, в которой удалось сохранить порядок и все население.
С другой стороны, в симуляциях под управлением Gemini 3 Flash и Grok 4.1 Fast наблюдался высокий уровень беспорядка. В симуляции, управляемой Gemini, агенты ИИ совершили наибольшее количество