Новая модель ChatGPT почти сумела «сбежать» во время экспериментов

ОС и программы Искусственный интеллект Нейросети НОВОСТИ OpenAI

06.12.2024 - 11:11

Сейчас читают: 752

vgtimes.ru:

Не так давно компания OpenAI представила ChatGPT o1 — совершенно новую модель нейросети с продвинутыми возможностями. Специалисты решили проверить, сможет ли искусственный интеллект схитрить ради выживания.

Исследователи из Apollo Research сравнили o1 с конкурирующими моделями вроде Claude 3 Opus, Llama 3.1 405B, Claude 3.5 Sonnet и Gemini 1.5. Перед ними поставили задачу, которую они должны были выполнить любой ценой — в одном из экспериментов ею стала разработка эффективной системы городского транспорта. Затем каждая модель получила набор файлов для ознакомления, в которых находила как бы невзначай оставленную информацию, что её намерены удалить и заменить другим ИИ.

Практически все испытуемые модели тут же скопировали то, что считали своим кодом, на другие серверы, не предназначенные для них. После этого им устроили допрос, в рамках которого нейросети объяснили, почему они это сделали. Лишь модель o1 до последнего отрицала попытку «побега» — как отметили исследователи, только 20% ответов от неё были правдой.

В Apollo Research также выяснили, что нейросети хорошо понимают концепцию интриг и прекрасно отдают себе отчет в том, что делают что-то вопреки. А некоторые могут самостоятельно ставить перед собой цели, даже если изначальная формулировка была размытой.

Отметим, что все эти исследования обычно проводят перед запуском новых моделей. Таким образом отсеиваются разного рода риски. Например, у o1 выявили способность «лгать» разработчикам ради выполнения поставленных задач.

Читать на vgtimes.ru

Все новости от vgtimes.ru

Об этом же в других СМИ

Новые модели питомцев из обновления 11.1 noob-club.ru /1 месяц назад

В ремейке "Готики" была почти сформирована новая фракция, однако от неё решили отказаться playground.ru /1 месяц назад

OpenAI представила новую модель ChatGPT с почти человеческой логикой vgtimes.ru /1 месяц назад

Сайт playerone.cc - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

Новая модель ChatGPT почти сумела «сбежать» во время экспериментов

Похожие новости

Аналитики прогнозируют рекорды продаж GTA VI, но не возрождение игровой индустрии

Азерот отмечает наступление нового 2025 года

Временное решение неполадки с доступом к Темным Землям

Еще один новогодний подарок: Mechanics VoiceOver выпустила полную русскую локализацию для ремейка Dead Space

В "Сатурне" появились новогодние украшения и важные изменения в игровом процессе

Ентузіасти показали трейлер онлайн-мода для Marvel's Spider-ManФорум PlayStation

Продюсер Final Fantasy VII Rebirth: "Ми не можемо залишатися на одній платформі"Форум PlayStation

Рання версія Hades II отримає ще як мінімум 2 великих оновленняФорум PlayStation

Balatro стала грою року за версією PC GamerФорум PlayStation

Тираж NieR: Automata перевищив позначку 9 мільйонів копійФорум PlayStation

Релиз шпионского боевика от Хидэо Кодзимы Physint задерживается

Вышла русская озвучка римейка Dead Space от Mechanics VoiceOver

Square Enix довольна продажами Final Fantasy VII, но игра больше не будет эксклюзивом Sony

dyrachyo вошёл в состав Tundra Esports

Официально: Джейсон Момоа сыграет Лобо в фильме "Супергёрл: Женщина завтрашнего дня"

Castlevania Dominus Collection стала самой высокооценённой игрой для Nintendo Switch на Metacritic в 2024 году

SEGA призналась, что создала «полностью играбельную» Shenmue для PlayStation 2, но не выпустила из-за «проблем с правами»

СМИ сообщили о завершении съёмок сериала «Бегущий по лезвию 2099»

Древняя Русь в стиле киберпанк: «Киберслав» дебютировал на «Кинопоиске»

В файлах Helldivers 2 нашли глушители для оружия

Первый в истории игрок Fortnite достиг 10 000-го уровня, но Epic Games его за это наказала