OpenAI без развернула новую модель генерации изображений под названием GPT Image 2. Она уже доступна внутри ChatGPT для платных подписчиков и, судя по первым тестам, заметно опережает не только предыдущую версию, но и большинство специализированных нейросетей вроде Nano Banana Pro и Flux.
Модель появилась на фоне запланированного на 12 мая 2026 года отключения API для DALL‑E 2 и DALL‑E 3 и по сути, это окончательный переход OpenAI на линейку GPT Image, интегрированную напрямую в чат‑интерфейс. Предыдущая версия, вышедшая в декабре 2025‑го, уже умела генерировать изображения быстрее DALL‑E и поддерживала редактирование в контексте диалога, но у неё оставались заметные ограничения: тёплый желтоватый оттенок на многих результатах, проблемы с длинным текстом внутри картинки и слабая точность при описании сложных сцен.
В GPT Image 2 разработчики сделали упор на несколько вещей, которые раньше считались почти нерешаемыми для генеративных моделей. Во‑первых, рендеринг текста, теперь нейросеть теперь отображает надписи на изображениях с точностью выше 99 процентов, включая поддержку кириллицы и иероглифов. Для дизайнеров и маркетологов это означает возможность получать макеты с читаемыми заголовками и кнопками без доработки в фотошопе. Во‑вторых, устранён постоянный жёлтый каст, который преследовал предыдущие версии и цветопередача стала нейтральной. В‑третьих, модель научилась удерживать внешность персонажа при нескольких генерациях подряд.
Разрешение тоже подтянули и максимальный размер теперь достигает 2048×2048 пикселей, чего достаточно для небольших печатных материалов и уверенного масштабирования под веб. Одним из самых неожиданных применений GPT Image 2 стала генерация правдоподобных экранов приложений и игровых сцен. Модель
