Google внедряет функции перевода в своих приложениях Translate и Meet во Вьетнаме, позволяя пользователям прослушивать перевод на родном языке в режиме реального времени.
Интерфейс приложения Google Translate от 10 июня, с функцией «Перевод в реальном времени».
В своем анонсе модели Gemini 3.5 Live Translate от 10 июня Google заявила, что внедряет функции перевода в свои приложения Meet и Translate на большем количестве рынков, включая Вьетнам.
Ранее эти приложения могли переводить вьетнамский язык, но отображали субтитры на экране. Новая функция, однако, представляет собой наложение голоса на оригинальный звук через наушники с низкой задержкой, аналогично синхронному переводу. Например, в разговоре с англоговорящим пользователем пользователь может открыть приложение и выбрать языковую пару английский-вьетнамский. Затем через наушники будет воспроизводиться вьетнамский голос одновременно с оригинальным звуком.
Пользователи во Вьетнаме могут использовать приложение Google Translate на устройствах под управлением iOS и Android, выбрав «Живой перевод» в верхнем левом углу экрана. Для прослушивания перевода требуется подключение наушников. Google заявляет, что приложение может точно передавать интонацию говорящего более чем на 70 языках.
Компания Google объявила о начале внедрения режима для Android, позволяющего пользователям прослушивать перевод непосредственно через наушник. «Просто поднесите телефон к уху, как при обычном звонке, и переведенный звук будет передан вам напрямую», — говорится в сообщении. Эта функция полезна в ситуациях, когда пользователи хотят быстро услышать перевод, не привлекая внимания окружающих, или когда наушники недоступны.
Эта функция также работает в приложении Meet с моделью Gemini 3.5 Live Translate, поддерживая более 70 языков вместо прежних 5, включая вьетнамский. Она позволяет вести диалог между участниками совещания, говорящими на более чем 2000 различных языках. Предварительная версия этой функции была недавно запущена для некоторых корпоративных клиентов Google Workspace, а позже в этом году она станет доступна более широкой аудитории.
Gemini 3.5 Live Translate — это новейшая аудиомодель от Google, предлагающая практически мгновенный перевод речи в реальном времени. Компания утверждает, что модель может автоматически распознавать языки и создавать переводы, которые «плавны, естественны и сохраняют интонацию, ритм и высоту голоса говорящего».
Для этого Google не переводит реплики пошагово, как традиционные системы перевода, а непрерывно генерирует голосовые переводы, балансируя между ожиданием дополнительного контекста для улучшения качества перевода и мгновенным переводом для поддержания синхронизации с говорящим. Компания заявляет, что перевод может быть «на несколько секунд позже» в ходе разговора.
Помимо приложений Meet и Translate, Google также предоставляет разработчикам функции через API Gemini Live и Google AI Studio, помогая им создавать приложения для голосового перевода. Grab — один из партнеров, тестирующих эту модель для поддержки многоязычной связи в режиме реального времени между водителями и пассажирами в пунктах посадки. По данным Google, в настоящее время таким образом ежемесячно совершается 10 миллионов голосовых звонков через платформу Grab.
«В ходе тестирования Gemini 3.5 Live Translate нас впечатлила способность модели автоматически распознавать несколько языков и точно переводить речь с низкой задержкой», — сказал Филипп Кандал, менеджер по продуктам Grab.
Чтобы предотвратить использование голосового перевода для распространения дезинформации, разработчики заявляют, что все аудиофайлы будут помечены водяным знаком SynthID, который помогает идентифицировать контент, созданный с помощью ИИ.
Собираетесь во Вьетнам?
Источник
VietNews.ru (RU)