Компания Google представила специализированную модель искусственного интеллекта, способную самостоятельно выполнять задачи в интернете, система анализирует экран и производит действия, которые обычно делает пользователь: кликает по ссылкам, заполняет формы и упорядочивает данные. Принцип работы технологии напоминает работу ассистента, получив задачу, модель изучает текущее состояние интерфейса, определяет нужное действие и выполняет его, а после этого она снова оценивает обновлённую картинку на экране, чтобы сделать следующий шаг. Такой цикл повторяется до полного завершения задачи.
На практике это позволяет автоматизировать множество рутинных операций, ведь система может самостоятельно перенести информацию из одной базы данных в другую, организовать заметки на виртуальной доске или записаться на какой-то приём, пройдя авторизацию на сайте.
Разработчики подчёркивают, что для операций с повышенными рисками, таких как финансовые транзакции, система будет запрашивать подтверждение у пользователя, также в неё встроены защитные механизмы, призванные предотвратить злоупотребление. В настоящее время модель заточена на работу с браузерами, но в перспективе она сможет выполнять и задачи внутри операционной системы. Ознакомиться с её возможностями разработчики могут через специальные API-инструменты.
Параллельно с этим Google масштабное расширение языковой поддержки своего интеллектуального поиска (AI Mode). Теперь он понимает и генерирует ответы на почти полусотне языков и доступен более чем в 200 странах. По заявлению компании, это стало возможным благодаря адаптации модели Gemini, которая научилась учитывать лингвистические тонкости и культурные особенности каждого языка.
Этот шаг окончательно стирает языковые барьеры для миллионов
