Amazon стремится не просто усовершенствовать голосовой ассистент Alexa, а сделать общение с ним похожим на разговор с живым человеком. Но для столь тщательной имитации реального собеседника необходимо избавиться от характерных для машины особенностей вербальной коммуникации, несвойственных людям. Первым шагом на пути к этому станет интеграция многофункционального пакета Speech Synthesis Markup Language.
Speech Synthesis Markup Language (SSML) — это новый программный инструмент от Amazon, ориентированный на разработчиков софта с поддержкой Alexa. Авторы ПО получат в свои руки решение, которое сделает поведение Alexa многогранным и меняющимся в зависимости от нюансов ситуации.
SSML позволит наделить цифрового помощника индивидуальным и специфичным произношением, задать интонацию, брать при ответе на вопрос уместные паузы, в которых нуждается любой живой собеседник, а также разбавлять сухое декламирование эмоциями.
Для реализации изменений в манере общения Alexa специалисты Amazon дополнили его базу навыков сразу пятью новыми умениями, среди которых значатся:
- Whispering — эффект, заставляющий Alexa понижать громкость речи и произносить слова шёпотом.
- Expletive beeps — «запикивание» нецензурной лексики.
- Sub — аннотация сказанного в виде субтитров.
- Emphasis — интонационное ударение на определённое слово в фразе с целью придания ей дополнительной смысловой нагрузки.
- Prosody — регулировки скорости, тембра и громкости произношения.
Разумеется, никакой полной свободы для модификации «речевого аппарата» Alexa компания Amazon предложить сторонним разработчикам не намерена. Однако менять интонацию, придавать сказанному нужный эмоциональный окрас уже стало возможным. На данный момент доступ к SSML получили разработчики из США, Англии и Германии.
Источник: 3DNews