Компания OpenAI анонсировала новую версию своей языковой модели - GPT-5.4. Разработчики заявляют, что она получила заметные улучшения в логическом мышлении, программировании и работе с офисными файлами, включая таблицы, документы и презентации.
Главное нововведение - нативная функция управления компьютером. Модель способна выполнять действия на устройстве пользователя: взаимодействовать с программами, вводить команды с клавиатуры и мыши, а также анализировать скриншоты для выполнения задач.
В компании считают, что GPT-5.4 приближает индустрию к так называемым автономным агентам - системам, которые могут самостоятельно выполнять сложные задачи в интернете и различных приложениях. Ранее для этого в ChatGPT появился инструмент ChatGPT Agent.
Также представлена версия GPT-5.4 Thinking, ориентированная на задачи, требующие сложного анализа. Внутри ChatGPT она показывает пользователю структуру рассуждений и позволяет корректировать запрос прямо во время выполнения задачи.
Модель стала точнее при поиске информации из нескольких источников. По данным OpenAI, GPT-5.4 лучше справляется с вопросами, где нужно находить редкие или скрытые данные, и формирует более обоснованные ответы. Компания утверждает, что это «самая фактически точная» модель на данный момент: вероятность ошибок в отдельных утверждениях снизилась на 33% по сравнению с GPT-5.2.
GPT-5.4 уже разворачивается в ChatGPT, API и инструменте для разработчиков OpenAI Codex. Версия GPT-5.4 Thinking доступна пользователям подписок Plus, Team и Pro, а более мощная модификация GPT-5.4 Pro предназначена для API, а также клиентов Enterprise и Edu.