Яндекс Первым Научился Воспроизводить Голосовые Эмоции

Технология синтеза речи Яндекса научилась воспроизводить эмоции.

В зависимости от выбранного параметра робот может читать текст «добрым», «злым», нейтральным или «больным» голосом.

Об этом представители компании сообщили ЦПУ.

Для демонстрации технологии «Яндекс» выпустил приложение «Диктовка» для App Store и Google Play.

Яндекс первым научился воспроизводить голосовые эмоции

Синтез речи доступный пользователи облачного сервиса распознавания речи для корпоративных клиентов Yandex SpeechKit Cloud.

Насколько нам известно, SpeechKit Cloud — это первый в мире коммерческий сервис синтеза речи с поддержкой эмоций.
В сфере телефонии мы уже предоставили возможность использования SpeechKit Cloud российской компании OKTELL (разработчикам программного обеспечения для автоматизации колл-центров); в области систем умного дома нашу технологию распознавания речи использует компания Cubic Robotics (разработчики персонального робота для дома) и ведут переговоры с несколькими компаниями из сферы системной интеграции, медицины и разработки систем корпоративной автоматизации.
.

По словам представителей Яндекса, использование SpeachKit Cloud обойдется в $5 за 1000 голосовых запросов.

Яндекс ориентирует технологию на клиентов с сотнями тысяч запросов в день.

При этом компания готова предоставить технологию некоторым категориям клиентов бесплатно: «Тем, кто не зарабатывает на своем сервисе, а делает мир немного лучше — например, занимается образовательной или медицинские проекты».

По словам руководителя отдела голосовых технологий и продуктов «Яндекса» Дениса Филиппова, объем рынка голосовых технологий можно оценить в сотни миллионов долларов в год. Но именно из-за высокого порога входа конкуренция пока не высока:

Мы используем статистический (параметрический) синтез речи на основе скрытых марковских моделей.
Тембр такого голоса несколько «компьютеризирован», но имеет естественные и плавные интонации.
При этом плавность речи не зависит от объема и длины читаемого текста, а голос легко настроить.
Изменяя числовые коэффициенты, можно моделировать разные эмоции.

Для демонстрации возможностей синтеза речи с помощью SpeechKit Cloud Яндекс выпустил приложение «Диктовка», доступное на Магазин приложений И Гугл игры .

Он может «включить» распознавание по голосовой команде.

Для этого достаточно сказать приложению «Яндекс, записывай!» Технология выделения смысловых объектов в их тексте также предоставляет возможность редактировать текст с помощью голосовых команд. Например: «добавить смешной смайлик», «удалить последнее слово», «заменить слово осень на весну», «начать с новой строки», и приложение отредактирует текст.