Нейроинтерфейс для слухового аппарата: устройство автоматически регулирует громкость по сигналам мозга

Всем знакома ситуация, когда в шумном баре приходится напряженно вслушиваться в речь собеседника, пытаясь отсечь посторонний гул — это классический «эффект коктейльной вечеринки». Для людей с потерей слуха данная задача превращается в серьезное испытание, ведь стандартные слуховые аппараты лишь равномерно усиливают звуки, не умея приоритизировать нужный голос.

Решение этой проблемы долгое время оставалось лишь теорией, однако в мае 2026 года в журнале Nature Neuroscience было представлено исследование, доказывающее возможность создания слухового аппарата, способного в реальном времени фокусироваться на голосе человека, к которому обращено внимание пользователя. Ниже мы разберем, какой путь проделали ученые, почему в этой работе участвовали хорьки и какие перспективы это открывает для аудиологии.

От исследований на хорьках к высокоточной электрокортикографии

Нима Месгарани, ныне профессор Колумбийского университета, начинал свой научный путь с изучения слухового восприятия у хорьков. Их слуховая система во многом схожа с человеческой, однако невозможность получить вербальный отклик от подопытных животных заставила ученого сменить фокус. Его дальнейшие исследования проводились на пациентах с эпилепсией, которым для клинических целей имплантировали электроды непосредственно в кору головного мозга.

Использование электрокортикографии (ECoG) — инвазивного метода записи нейронной активности — позволяет получать данные высочайшей точности. Этот метод стал фундаментом для прорыва в нейробиологии слуха.

Электрокортикография 
Электрокортикография

В 2012 году совместно с нейрохирургом Эдвардом Чангом Месгарани опубликовал в Nature работу, ставшую вехой в изучении слухового внимания. Ученые доказали, что мозг способен выделять голос конкретного спикера из многоголосого потока. В ходе эксперимента удалось реконструировать спектрограмму речи исключительно на основе нейронных сигналов: полученная модель в точности соответствовала тому источнику звука, на котором был сосредоточен испытуемый.

Так зародилось направление «декодирования слухового внимания» (Auditory Attention Decoding, AAD). Со временем методы эволюционировали от линейных декодеров до сложных нейросетевых архитектур.

Механика процесса: как работает декодирование

Когда мы внимательно слушаем кого-то, наш мозг синхронизируется с ритмическими колебаниями громкости речи спикера. Этот нейронный «отклик» и фиксирует система AAD, применяя метод стимул-реконструкции. Алгоритм сопоставляет многоканальные данные ЭКоГ с аудиоогибающей входящего сигнала, подбирая коэффициенты для каждого нейронного канала.

Для повышения точности и подавления шумов в модели вводится регуляризация. Важнейшим инженерным вызовом здесь является учет временной задержки (лага) между акустическим стимулом и реакцией мозга, которая обычно составляет 100–250 мс.

Состояние внимания пользователя — ключевой фактор, влияющий на вариативность производительности системы
Состояние внимания пользователя — ключевой фактор, влияющий на производительность системы

В 2019 году появилась архитектура AADNet. Эта нейросеть анализирует нейронную активность и аудиопотоки всех источников параллельно, что позволило повысить точность определения объекта внимания с 66% до 81%.

Схема автоматизированного анализа данных на основе реконструкции стимулов
Схема анализа данных на основе реконструкции стимулов

Новый прорыв и потенциал технологии

Результаты исследования, опубликованного в мае 2026 года, подтвердили, что система AADNet способна в режиме реального времени регулировать громкость голоса, на который направлено внимание пользователя. Испытания проводились в условиях, имитирующих реальное общение: с несколькими дикторами и перекрестными диалогами.

Участники эксперимента единогласно отметили повышение разборчивости речи. Объективность этого вывода была подтверждена пупиллометрией: при включении системы AAD размер зрачков испытуемых уменьшался, что свидетельствует о снижении когнитивной нагрузки на мозг.

Система работала с минимальной задержкой (менее 0,5 с), что критически важно для естественного восприятия. Дальнейшие тесты на добровольцах с нарушениями слуха показали, что даже с учетом текущих ограничений, технология существенно упрощает коммуникацию.

Расположение электродов у испытуемого
Локализация электродов

Сложности на пути к массовому рынку

Несмотря на многообещающие результаты, до коммерческого внедрения предстоит пройти долгий путь. Основные барьеры:

  • **Неинвазивность:** Необходимо адаптировать технологию для использования с обычной ЭЭГ или «ушной» ЭЭГ (ear-EEG), встроенной непосредственно в слуховой аппарат.

  • **Синтез с направленными микрофонами:** В реальной обстановке спикеры перемещаются, и существующие системы направленного усиления требуют глубокой интеграции с алгоритмами декодирования внимания.

  • **Миниатюризация:** Мощности для обработки нейроданных в реальном времени должны быть втиснуты в корпус миниатюрного слухового аппарата без риска перегрева и быстрой разрядки батареи.

Таким образом, заявления о появлении «читающих мысли» слуховых аппаратов на прилавках завтрашнего дня — пока лишь маркетинг. Однако текущие успехи в нейронауке позволяют с уверенностью сказать: фундамент для создания таких устройств уже заложен.

 

Источник

Читайте также