Группа нейроинженеров из Калифорнийских университетов в Беркли и Сан-Франциско представила инновационную систему, способную трансформировать нейронные сигналы в синтезированную речь с задержкой менее секунды. Впервые такая технология предоставила возможность 47-летней Энн, потерявшей дар речи после перенесённого инсульта в 2005 году, общаться с помощью голоса, практически моментально выражающего её мысли. Это достижение открывает новые горизонты в восстановлении коммуникативных способностей у пациентов с тяжёлыми формами паралича.
В основе технологии лежит алгоритм, аналогичный используемым в голосовых помощниках, таких как Siri. Однако вместо обработки звуков он занимается расшифровкой активности моторной коры — зоны мозга, ответственной за артикуляцию. «Мы перехватываем сигналы на этапе подготовки мозга к движению речевых мышц, ещё до того, как человек попытается произнести звук», — пояснил Чхоль Джун Чо, один из авторов исследования и аспирант UC Berkeley.

Во время клинических испытаний у Энн были установлены электроды, регистрировавшие активность её мозга, пока она мысленно проговаривала фразы с экрана. Нейросеть, натренированная на записях её голоса до травмы, преобразовывала эти сигналы в аудиозвук. Система не только успешно воссоздавала 80% обучающих предложений, но и правильно синтезировала редко встречающиеся слова из фонетического алфавита NATO, такие как «Альфа» и «Браво». «Модель научилась распознавать базовые элементы речи, не ограничиваясь простым запоминанием шаблонов», — отметил Гопала Ануманчипалли, один из соавторов разработки.
Ключевым достижением стала минимизация задержки: предыдущие системы требовали до восьми секунд для генерации фразы, что делало разговор неестественным. Новая технология сократила этот интервал до одной секунды. «Первый звук появляется почти одновременно с посылаемым нейронным сигналом», — отметил Ануманчипалли. Пациентка Энн описала этот опыт как «возвращение к осознанию себя», подчеркнув, что немедленная обратная связь разительно отличается от предыдущих методов, где нужно было поэтапно превращать мысли в текст и голос.