На IT-фестивале SXSW представлен первый в мире «гендерно-нейтральный» голосовой помощник

На SXSW представили виртуального ассистента, голос которого по звучанию не напоминает ни женский, ни мужской. Рассказываем, как его создавали и посмотрим на перспективы.

На IT-фестивале SXSW представлен первый в мире «гендерно-нейтральный» голосовой помощник
Фото Gareth Halfacree / CC BY-SA

Зачем нужен «гендерно-нейтральный» голос

Согласно исследованиям, пользователям умных колонок и голосовых помощников не хватает «нейтрального» варианта голоса без ярко выраженных женских или мужских черт. В опросе R&D лаборатории Space10 почти половина из 12 тысяч респондентов предпочли бы слышать «бесполый» голос ассистента. В таком исполнении люди лучше ассоциируют его с системами ИИ, скрытыми «под капотом» помощника. Нейтральный голос больше подходит образу «машины». Однако такой опции у крупных игроков на этом рынке нет.

Своё решение предложили специалисты агентства Virtue — на конференции SXSW в Остине они представили нового «бесполого» голосового ассистента под названием Q. Его разработали совместно с некоммерческой организацией Equal AI, интерактивными студиями thirtysoundsgood и Koalition Interactive, а также экспертами по лингвистике.

Как устроен ассистент Q и как его создавали

Для создания нового помощника голоса пяти людей «объединили» в один. Итоговый «голос» дали послушать потенциальным пользователям ассистента из разных стран Европы — люди должны были оценить по пятибалльной шкале, насколько он похож на женский. В соответствии с результатами тестирования голос корректировали — делали более низким или более высоким — после чего снова давали послушать пользователям.

Итеративная работа с фокус-группой в четыре с половиной тысячи респондентов привела авторов проекта к «нейтральному» исполнению голоса.

По словам разработчиков, звучание Q кажется людям «бесполым», потому что голос помощника лежит в частотном диапазоне между мужскими и женскими голосами. Для первых спектр частот составляет 80–180 Гц, а для вторых 140–255 Гц. Голос Q попадает в нейтральный диапазон 145–175 Гц, что не позволяет однозначно определить пол.

Послушать, как звучит ассистент, можно в видео по этой ссылке, а также на сайте проекта.

Мнения и потенциал

Журналисты отзываются о проекте Q положительно. По словам колумниста CNBC, помощник звучит достаточно «уверенно», но при этом кажется дружелюбным и отзывчивым. О перспективах помощника высказались и авторы проекта. Они верят в успех идеи, потому что Q расширяет возможности выбора для пользователей умных колонок и голосовых помощников.

Разработчики не планируют запускать собственное устройство или приложение, а хотят привлечь внимание ИТ-компаний и предложить им добавить нейтральный голос для своих ассистентов. В планах у создателей Q — рассказать о своём продукте транспортным компаниям, государственным и другим организациям, которые используют голосовые объявления.

Тем не менее, пока будущее проекта остаётся неясным. Ни одна технологическая компания ещё не объявила о желании поработать с создателями Q, и, возможно, после шума в технологических СМИ «гендерно-нейтральный» помощник будет разработан ИТ-гигантами самостоятельно.

Кто ещё разрабатывает «бесполых» ассистентов

В области голосовых помощников аналогов Q пока нет. Однако возможность выбрать «пол» голоса уже есть во всех заметных проектах в этой сфере. Для англоязычных пользователей в Google Assistant доступны десять разных мужских и женских голосов, а в Siri — мужской и женский голос с разными акцентами. Изменить звучание можно и в Amazon Alexa — разные голоса доступны в «навыках» умной колонки.


Фото Tony Webster / CC BY-SA

Аналоги Q можно найти в области чат-ботов. Один из первых «гендерно-нейтральных» ботов разработали в британской компании Sage — он получил название Pegg. По словам руководительницы проекта Крити Шарма (Kriti Sharma), ассистент сделали «бесполым», чтобы создать для него личность бота, а не «бота, притворяющегося человеком».

«Нейтральных» чат-ботов разрабатывают также для компании GoDaddy и сети магазинов Lowe’s — оба бота будут использовать в сфере клиентского сервиса.

Выводы

Хотя создатели умных колонок и помощников расширяют диапазон доступных голосов, «дефолтное» звучание ассистента оставляют неизменным. Согласно изданию Slate, такое постоянство может быть связано с узнаваемостью бренда — если голос помощника резко изменится, это вызовет негативную реакцию у пользователей, которые привыкли различать разные сервисы на слух.

Скорее всего, «нейтральные» голоса не станут общепринятым стандартом на рынке крупных голосовых ассистентов. Однако популярность подобных решений у пользователей может привести к появлению новых игроков, которые смогут предложить широкое разнообразие образов виртуальных помощников.


Дополнительное чтение — о звуке и музыке из нашего блога и Telegram-канала:

Как говорят деревья и другие растения
Как превратить графики в звук, и зачем это нужно
​​​Записываем и редактируем подкаст
В чем особенности и задачи звукового сопровождения игр


 
Источник

Читайте также