Grok от xAI показал наименьший уровень «галлюцинаций» среди ИИ-гигантов

Илон Маск Сша Google Нейросети НОВОСТИ OpenAI

25.12.2025 - 14:27

Сейчас читают: 888

vgtimes.ru:

Аналитическая компания Relum опубликовала результаты независимого тестирования десяти крупных языковых моделей. Согласно исследованию, чат-бот Grok продемонстрировал самый низкий уровень «галлюцинаций» ИИ. В ходе оценки Grok генерировал недостоверные ответы лишь в 8% случаев, что лучший показатель среди всех протестированных моделей. Для сравнения, у ChatGPT от OpenAI этот параметр составил 35%, а у Google Gemini — 38%.

Исследователи Relum оценивали модели по четырем ключевым параметрам: уровень «галлюцинаций», оценки пользователей, стабильность ответов и время недоступности сервиса. На основе этих данных каждой модели был присвоен сводный индекс риска надежности по шкале от 0 до 99, где большее значение означает более высокий риск ошибок и проблем.

Grok, с его 8% «галлюцинаций», средним рейтингом 4.5, оценкой стабильности 3.5 и временем простоя 0.07%, получил совокупный индекс риска всего 6 баллов. Ближайшим конкурентом по общей надежности оказался DeepSeek с индексом 4, но его уровень «галлюцинаций» был почти вдвое выше — 14%. ChatGPT оказался на противоположном конце спектра с максимальным индексом риска в 99 баллов.

Точность ответов становится критически важной на фоне активного внедрения ИИ в бизнес-процессы. Согласно приведенным в отчете данным, около 65% компаний в США уже используют чат-ботов в повседневной работе, при этом почти 45% сотрудников признаются, что передавали таким сервисам конфиденциальную или чувствительную рабочую информацию.

Исследование выявило заметный разрыв между узнаваемостью бренда и фактической производительностью моделей. Несмотря на относительно меньшую распространенность, Grok показал себя как решение, потенциально более пригодное для задач, где на первом месте стоит точность фактов.

Читать на vgtimes.ru

Все новости от vgtimes.ru

Об этом же в других СМИ

Сиквел "Гренландии" показал катастрофические результаты в США playground.ru /6 месяцев назад

Илон Маск запретил пользователям раздевать женщин через свою нейросеть Grok. Но ограничение коснулось не всех vgtimes.ru /6 месяцев назад

Netflix показал трейлер детектива «Тайна семи циферблатов» по Агате Кристи — премьера 15 января vgtimes.ru /6 месяцев назад

Сайт playerone.cc - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

Grok от xAI показал наименьший уровень «галлюцинаций» среди ИИ-гигантов

Похожие новости

Valve разрешила разработчикам в Steam не раскрывать использование ИИ, но только если игроки его не увидят

Фанаты заметили, что Леон в играх постоянно теряет дорогие куртки, и подсчитали сумму убытков

Разработчики Fallout 3 рассказали, с чего на самом деле началась работа над игрой

В Steam можно бесплатно забрать в свою библиотеку 5 игр. Есть нуарный экшен с рейтингом 96%

Rockstar Games купила домен для GTA VI: слух

Слух: по текущему сценарию "Пиратов Карибского моря 6" Джонни Депп снова сыграет Джека Воробья

Нико Робин на новом постере второго сезона сериала "One Piece. Большой куш"

Композитор Рассел Брауэр устроился директором по аудио в CD Projekt RED

«Зверополис 2» стал самым кассовым мультфильмом Disney

Слух: Игры HoYoverse могут появиться в Steam с полноценной синхронизацией аккаунтов

В разработке находится духовный наследник культовой стратегии Empire Earth

Предстоящий процессор AMD Ryzen 9 9950X3D2 с "двойным 3D V-Cache" благодаря кэшу L3 в 192 МБ превосходит 9950X3D на 7%

Моддер собрала PS5, Xbox Series X и Switch 2 в одном устройстве - "Ningtendo PXBOX 5"

Разработчики Granblue Fantasy Versus: Rising продемонстрировали нового DLC-персонажа — Ильзу

Amazon анонсировала шоу по мотивам Fallout Shelter

Nix: «Мне не нравится, что в Доте невозможно героя убить. Это основная причина, по которой мне сложно играть»

"Unreal Engine - самый большой шаг назад," - Гор Вербински о UE5

3D-иллюстрации с персонажами World of Warcraft от JenEricLive

Рад, что получил шанс сыграть за команду моего брата-близнеца — Ghost о победе на Asia Pacific Predator League

iLTW: «Вы в школу ходите, в университет — вы учитесь меньше, чем у меня в Доте сыграно времени на аккаунте»

"Зловещие мертвецы" возвращаются: Тестовые показы нового фильма вызвали полный восторг