Разработчики из Томского государственного университета систем управления и радиоэлектроники (ТУСУР) создали математическую модель для компьютерного распознавания речи, которая превосходит другие аналоги. Она позволяет определять пользователя по голосу и даёт возможность управлять «умной» техникой.
«Наш математический аппарат отличается от аналогов детальным соответствием устройству внутреннего уха человека при распознавании критических частот речи. Вероятностные механизмы, на которых построены существующие системы распознавания речи, у нас играют только вспомогательную роль», — рассказал Антон Конев, заместитель директора ЦК НТИ «Технологии доверенного взаимодействия» ТУСУР.
Утверждается, что новая система даёт погрешность вчетверо меньше, чем у лучших мировых аналогов. Новая система лучше распознаёт основной тон, может фиксировать спонтанный разговор или даже пение.
По словам создателей математической модели, это позволит общаться с «умными» системами как с живыми собеседниками, не прибегая к формальным командам.
«Наша разработка особенно эффективна при распознавании различных аббревиатур, редко встречающихся слов и фраз. Отдельное направление – выделение ключевых слов из речи, распознавание которых может стать заменой формальных команд при управлении «умной» техникой», – подчеркнул Конев.
Разработчики уточнили, что их разработка может лечь в основу системы продлённой аутентификации, которая будет идентифицировать пользователя в течение всего сеанса, а не однократно. В будущем планируется создать ПО, которое будет отслеживать присутствие конкретного абонента в чате или в видеоконференции.
Помимо этого, разработчики создают нейросеть для проверки текста, которая сможет определять авторство материалов или исходного кода программы.
Источник: iXBT