Google запустила синхронный голосовой перевод в «Переводчике» и Google Meet и официально представила модель Gemini 3.5 Live Translate — нейросетевой аудиодвижок, заточенный под практически мгновенный перевод устной речи. С 10 июня технология поэтапно становится доступной в мобильном приложении «Google Переводчик», а в скором времени появится и в Google Meet. Главное отличие от прежних версий — непрерывный перевод без ожидания конца фразы и умение автоматически распознавать десятки языков на лету.
Модель охватывает свыше 70 языков и способна переключаться между более чем двумя тысячами языковых комбинаций, а в число поддерживаемых языков вошёл и русский. Разработчики сделали акцент на низкой задержке: нейросеть генерирует перевод, отставая от говорящего всего на пару секунд, но не дожидаясь пауз. При этом система старается копировать интонацию, темп и даже высоту голоса, чтобы озвучка звучала естественно, а не как роботизированная начитка.
В приложении «Google Переводчик» на iOS и Android функция активируется в левом нижнем углу интерфейса при подключённых наушниках. Пользователи Android дополнительно получили «режим прослушивания» — достаточно поднести смартфон к уху, как при обычном звонке, и перевод зазвучит из разговорного динамика. Таким образом можно обойтись без гарнитуры в ситуациях, когда нужно быстро понять собеседника в тихой обстановке. В Google Meet смена модели означает расширение с прежних пяти языков до тех же 70+ и отказ от жёсткой привязки к английскому. Если раньше переводить можно было только с английского или на него, то теперь участники конференции смогут общаться в любых комбинациях внутри встречи.
Все аудиофайлы, сгенерированные моделью, получают невидимую цифровую водяную метку SynthID, что позволяет
