Ученые из южнокорейского Университета науки и технологий Пхохана (POSTECH) представили передовую носимую разработку, способную озвучивать беззвучную речь в режиме реального времени.
В основе концепции лежит понимание того, что речевой акт — это не только акустические колебания. Даже при безмолвной артикуляции кожные покровы и мышцы шеи генерируют специфические микровибрации, уникальные для каждого слова. Для фиксации этих тончайших движений специалисты спроектировали высокочувствительный многоосевой сенсор деформации.
Устройство, изготовленное из эластичного силиконового материала, плотно прилегает к коже и улавливает малейшие изменения её рельефа. Важной особенностью разработки стала функция автоматической калибровки: система сохраняет высокую точность распознавания даже при смещении датчика, избавляя пользователя от необходимости ручной настройки.
Полученные данные анализируются интеллектуальным алгоритмом, который расшифровывает паттерны деформации и переводит их в текстовые конструкции. Затем система генерирует аудиосигнал, используя параметры профиля пользователя, чтобы максимально аутентично передать индивидуальные характеристики его голоса.

В отличие от классических методов восстановления речи, таких как электромиография (ЭМГ) или электроэнцефалография (ЭЭГ), требующих сложного стационарного оборудования, технология POSTECH отличается компактностью и мобильностью. Испытания показали впечатляющую эффективность системы даже в условиях сильного окружающего шума, где стандартные микрофоны оказываются неэффективными.
Потенциал разработки огромен. В первую очередь, она призвана вернуть дар общения людям, перенесшим операции на гортани или утратившим голос по другим медицинским причинам. Кроме того, технология открывает возможности для «тихой коммуникации» в местах, требующих соблюдения тишины, или в производственных условиях с повышенным уровнем децибел.
Авторы проекта отмечают перспективность интеграции устройства в привычные гаджеты, что может принципиально изменить способы нашего взаимодействия друг с другом и цифровой средой. В ближайших планах разработчиков — дальнейшее повышение точности распознавания и расширение лингвистического охвата системы.
«Синтез искусственного интеллекта и носимых решений знаменует наступление эпохи интуитивного общения, когда даже непроизнесенные вслух слова обретают голос», — подчеркивают исследователи.
Источник: iXBT


