Microsoft представила MAI-Image-2 — вторую версию своего генератора изображений на основе искусственного интеллекта. Новинка уже доступна для тестирования и, по данным независимой платформы Arena.ai, вошла в тройку лучших решений в своей категории, уступив лишь разработкам OpenAI и Google.
Основное отличие новой модели от предшественницы и конкурентов — упор на фотореализм. Вместо «идеальных» глянцевых картинок разработчики сосредоточились на правдоподобности, поэтому MAI-Image-2 точнее обрабатывает естественное освещение, сложные оттенки кожи и текстуры поверхностей. Отдельное внимание уделили работе с текстом внутри изображений и если предыдущие версии нейросетей часто «ломались» при попытке нарисовать вывески, инфографику или слайды, то MAI-Image-2 справляется с этим значительно лучше.
Позиционируют новинку как инструмент для профессиональных креаторов. а при разработке разработчики консультировались с фотографами, дизайнерами и художниками, чтобы понять, на чем именно они тратят больше всего времени при постобработке. Итоговая модель должна сократить часы ручной доработки, позволяя сосредоточиться на концепции, а не на исправлении ошибок ИИ. Сейчас MAI-Image-2 доступна в нескольких форматах. Для обычных пользователей возможность опробовать модель появится позже — интеграция запланирована в Copilot и Bing Image Creator. Для разработчиков и бизнеса API открыт уже сегодня.
Появление MAI-Image-2 усиливает конкуренцию в сегменте генеративных нейросетей. На данный момент Arena.ai фиксирует, что новая модель Microsoft уступает по совокупным оценкам только лидерам рынка, оставляя позади множество других коммерческих и открытых решений. В самой компании называют команду разработчиков «небольшой, но амбициозной» и намекают, что


