OpenAI официально представила новую версию своей флагманской модели — GPT-5.4. Главным отличием новинки стала «нативная» возможность управления компьютером и теперь ИИ может самостоятельно взаимодействовать с интерфейсами операционных систем, используя мышку и клавиатуру, подобно человеку.
Вместе с базовой версией компания выпустила две модификации: GPT-5.4 Pro для максимальной производительности и GPT-5.4 Thinking, которая доступна в интерфейсе ChatGPT. Последняя примечательна тем, что может показывать пользователю план своих рассуждений в реальном времени, что позволяет корректировать ход мысли нейросети прямо во время генерации ответа, не начиная диалог заново. ИИ получил возможность «видеть» экран через скриншоты и выполнять действия: кликать по координатам, вводить текст, работать с браузером и десктопными приложениями. В тесте OSWorld-Verified, который оценивает навигацию по операционной системе, GPT-5.4 набрала 75%, обойдя предыдущую версию GPT-5.2 с её 47,3%. Интересно, что результат модели оказался выше и среднего показателя человека, который составляет 72,4%.
По заявлению разработчиков, модель особенно хороша в работе с офисным пакетом: создании презентаций, сложных электронных таблиц и документов. Пользователи в ходе слепого тестирования в 68% случаев предпочитали презентации, сделанные новой версией, отмечая лучшую эстетику и верстку. Разработчики утверждают, что новая модель стала не только умнее, но и экономичнее. Внедрена функция Tool Search: теперь, если модели доступен большой набор инструментов (например, десятки плагинов), она не грузит описания всех сразу, а подтягивает их только по мере необходимости, что позволяет экономить до 47% токенов, что снижает затраты и ускоряет работу.
OpenAI заявляет, что