Яндекс Представил Технологию Синтеза Речи И Голосового Ввода

30 октября на «Еще одной конференции разработчиков» Яндекс представил технологии синтеза речи, извлечения семантических объектов и голосовой активации.

Для тестирования компания опубликовала приложение «Яндекс.

Диктовка» в Яндекс.

Store. Об этом ЦПУ сообщили представители поисковой системы.



Яндекс представил технологию синтеза речи и голосового ввода

Технологии Yandex SpeechKit охватывают основные возможные сценарии речевого взаимодействия человека и устройства: голосовую активацию, распознавание речи произвольных тем и перевод ее в текст, синтез речи, то есть озвучивание текста с возможностью выбора интонации, а также голосовое управление с выбором смысловых объектов.



Технологии для разработчиков

В качестве примера использования технологий синтеза речи Яндекс приводит банковскую сферу, когда клиенту необходимо автоматически озвучить статус счета, или в робототехнике озвучить ответ. Синтез речи будет использоваться и для мобильных приложений: голосовой ввод пригодится в ситуациях, когда руки заняты или нет возможности прочитать текст с экрана.

В Яндексе отмечают, что технология распознавания естественного языка позволяет выделять в распознанном тексте объекты, например, дату, время, фамилию или адрес.

Благодаря технологии голосовой активации любое приложение может создать собственную голосовую команду для активации голосового взаимодействия.



«Яндекс.

Диктант»

Для демонстрации речевых технологий в Яндекс.

Маге создано приложение « Яндекс.

Диктант Для активации голосового ввода, например, следует использовать команду «Яндекс, запись».

Далее необходимо продиктовать произвольную речь, которую программа переведет в текст, а в некоторых случаях расставит знаки препинания.

Технология выделения смысловых объектов позволяет редактировать текст с помощью голосовых команд. Например, разрешены команды «добавить забавный смайлик», «удалить последнее слово», «заменить слово осень на весну», «начать с новой строки».

Технология синтеза речи прочитает запись с помощью команды «Прочитать все».

Текст, продиктованный в демонстрационном приложении, можно скопировать в буфер обмена и поделиться им в сторонней программе с помощью голосовых команд. Все тексты автоматически сохраняются в заметках, которые доступны для скачивания на Яндекс.

Диск.

Все речевые технологии Яндекса доступны в библиотеках Yandex SpeechKit Mobile SDK (для мобильных разработчиков на iOS, Android и Windows Phone) и Yandex SpeechKit Cloud (API для других систем и устройств).

Вместе с данным постом часто просматривают: