OpenAI запустила ограниченное превью нового семейства языковых моделей GPT-5.6, в которое вошли три варианта: флагманская Sol, сбалансированная Terra и облегчённая Luna. Пока модели доступны лишь узкому кругу — примерно 20 доверенным партнёрам и организациям, причём только через API и Codex; в ChatGPT новинок во время превью нет. Публичный запуск во всех сервисах OpenAI обещает в ближайшие недели.
Sol — самая мощная модель в линейке, рассчитанная на ресурсоёмкие задачи вроде сложного программирования и исследований по безопасности. Terra оптимизирована для крупных бизнес-нагрузок, а Luna — для быстрых и экономичных сценариев. Для Sol предусмотрены два новых режима: Max (углубляет одну цепочку рассуждений, давая модели больше времени на анализ) и Ultra (подключает несколько субагентов параллельно, ускоряя сложные процессы).
В тесте командной строки TerminalBench 2.1 Sol в режиме Ultra показала рекордные 91,9%, обычная Sol — 88,8%, а Terra — 84,3%. Для сравнения: флагман Anthropic Claude Mythos 5 на том же бенчмарке набирает 88,0%, а прошлая GPT-5.5 — 83,4%. Таким образом, Sol обходит Claude Mythos 5 даже без режима Ultra. В тестах по биологии и кибербезопасности Sol также опережает предшественницу GPT-5.5, причём тратит меньше токенов.
При этом, как сообщается, сами OpenAI делают акцент на оборонительной стороне: «GPT-5.6 Sol лучше помогает находить и устранять уязвимости, чем надёжно проводить атаки от начала до конца», — заявили в компании. Модель не пересекает внутренний критический порог по кибервозможностям.
Sol, Terra и Luna получили самый жёсткий набор защитных механизмов за всю историю OpenAI. Модели отказывают в выполнении запрещённых киберзапросов, даже если пользователь маскирует намерения или пытается обойти
