среда, 8 апреля 2020 г.

В Google Duo выпущена новая функция улучшения речи во время видео-звонков.



Google представил технологию автоподставления звуков во время видео-звонков в Google Duo.


У Google есть несколько различных сервисов, в которых можно проводить видеовстречи и видео-звонки.
Большое место в развитии новинок технологий Google уделяет сервису мобильных звонков Duo.
Duo - это мобильное приложение для обычных пользователей, которые могут общаться лично между собой во время видео-звонка.

Все мы пользовались видеовстречами в самых разных сервисах, и знаем, что иногда звук и картинка прерываются.
В Google давно идёт разработка технологий, призванных улучшить видео-связь, сделать её более плавной.
Это касается и картинки, и звука.

Если связь плохая, мы слишим прерывистые "металлические" звуки и видим размытую картинку, иногда сильно пиксельную.
Чтобы улучшить качество звука, Google решил использовать технологии распознавания речи и автоподставление распознанных фрагментов.

Что это значит?
Это значит, что нейросеть определяет возможные произнесённые слова, звуки в них, и звучание речи собеседников.
Обработка данных может занимать до 20 миллисекунд — на данное время это отличный результат, позволяющий слушать, воспринимать и понимать речь другого человека комфортно.
После обработки нейросеть дополняет слово или фразу говорящего, которые могут прерываться из-за плохой связи, и отправлять и предлагать слушателю автоподставление слов или фраз.

На примере :
  — Пр..т, мам! У.н....с ....по..д.е ← что реально может услышать человек
* — Привет, мам! У нас всё в порядке! ← что ему предложит нейросеть.

Данная технология пока хорошо разработана на английском языке ( американский вариант), но работа идёт и для других языков.
Скорее всего, будут добавлены те языки, которые уже есть в Google Translate / Переводчике.

Эта же технология внедряется и для сервиса Hangouts Meet — видео-чата для платных корпоративных аккаунтов GSuite

Источник :
http://ai.googleblog.com/2020/04/improving-audio-quality-in-duo-with.html
В статье вы сможете прослушать примеры обычной и улучшенной голосовой связи.

Комментариев нет:

Отправить комментарий