Компания Anthropic представила Claude Opus 4.8 — обновлённую версию своей главной нейросети. Новинка вышла всего через 41 день после предыдущей модели Opus 4.7, что говорит о бешеном темпе гонки между создателями ИИ: Anthropic, OpenAI (GPT-5.5), Google (Gemini 3.1 Pro) и другими лабораториями выкатывают крупные обновления практически каждый месяц.
Главное улучшение — работа с кодом. По результатам теста SWE-bench Pro, который проверяет способность нейросети самостоятельно находить и исправлять баги в реальных проектах, Opus 4.8 набрала 69.2%. Для сравнения: предыдущая версия — 64.3%, GPT-5.5 от OpenAI — 58.6%, Gemini 3.1 Pro от Google — 54.2%. Кроме того, модель стала в четыре раза реже пропускать ошибки в собственном коде — вместо того чтобы молча выдать результат с багом, она теперь чаще предупреждает, что не уверена в ответе. Для тех, кто использует нейросети в работе, это критически важно: модель, которая честно говорит «я не знаю», полезнее той, которая уверенно врёт.
Серьёзный скачок произошёл и в математике: на тесте USAMO 2026 (олимпиадные задачи по доказательствам) результат вырос с 69.3% до 96.7% — это самый большой прирост за одно обновление в истории линейки Claude. В задачах на рассуждение и работу с большими объёмами текста (до миллиона токенов — это примерно 3–4 полноценные книги за раз) модель тоже заметно прибавила.
Цена при этом не изменилась — для разработчиков доступ стоит $5 за миллион входных токенов и $25 за миллион выходных. Появился новый быстрый режим, который работает в 2.5 раза шустрее и обходится втрое дешевле, чем аналогичный режим у предыдущей версии. Opus 4.8 уже доступна через собственный сервис Anthropic, а также через облачные платформы Amazon, Google и Microsoft.
Пользуетесь нейросетями в
