В ухе не происходит преобразование Фурье

Разберёмся, как улитка внутреннего уха анализирует звуковые сигналы.

Звуковые волны заставляют колебаться барабанную перепонку, а цепь слуховых косточек усиливает эти колебания и передаёт их в жидкость улитки. Волны расходятся по жидкости до базилярной мембраны, которая разделяет частоты1: жёсткое и лёгкое основание («base») резонирует с высокими частотами, а более эластичная и тяжёлая вершина («apex») — с низкими. Между ними оптимальная резонансная частота постепенно снижается по логарифмической шкале2.

Резонирующие частоты базилярной мембраны
Резонирующие частоты базилярной мембраны. Внешние большие числа — частоты (Гц), внутренние — расстояние вдоль мембраны (мм). Из лекционных слайдов.

На разных участках мембраны волосковые клетки колеблются с характерной частотой, соответствующей их положению. Механочувствительные соединения между стереоцилиями открывают ионные каналы с той же частотой, что и колебания, вызывая высвобождение нейромедиаторов. Ниже показана анимация этого процесса:

Нервные волокна действуют как фильтры, извлекая временные и частотные характеристики. На примере слева — фильтры высокой временной точности, позволяющие точно определить момент появления частоты. Справа — фильтры с более равномерным распределением по частотам и меньшей временной детализацией.

Примеры временных фильтров

Хотелось бы, чтобы улитка выполняла классическое преобразование Фурье, но оно не даёт точной временной локализации, и структура фильтров улитки существенно отличается.

Слева — представление с высоким временным разрешением без частотной детализации; справа — разложение по частотам без точной привязки ко времени3. Улитка же работает подобно сочетанию вейвлет-преобразования и Габоровых схем: для высоких частот — узкие временные окна и широкие по частоте, для низких — наоборот.

Схемы временно-частотной фильтрации

Исследование Lewicki 2002 показывает, что такие фильтры минимизируют избыточность кодирования природных звуков. Михаил Левицки применил независимый компонентный анализ к записям окружающих шумов, речи и голосов животных, найдя оптимальные фильтры для разных типов звуков:

ICA-фильтры звуков природы и речи
ICA-звуки окружающей среды и речи приводят к вейвлетам, а голоса животных — к более узкочастотным компонентам.
Примеры оптимальных фильтров
Образцы фильтров, полученных в разных звуковых условиях.

Человеческая речь занимает отдельную область во временно-частотном пространстве. Возможно, эволюция речи заполнила свободные ниши, не задействованные другими звуками.

Распределение звуков во временно-частотном пространстве
+: голоса животных, x — звуки природы, o — человеческая речь (Lewicki 2002).

Кодирование, ориентированное на окружающую среду, объяснимо: поведение зависит от контекста. Это универсальный принцип всех органов чувств. Возможно, на нём базируются будущие модели эффективного кодирования.

Мы коснулись лишь начала пути сенсорного кодирования. В следующей статье детальнее рассмотрим биофизику нейронных вычислений.

  1. Это называется тонотопией — пространственным отображением частотных компонентов. Аналогичные принципы действуют в зрительной (ретинотопия) и соматосенсорной (соматотопия) коре.

  2. Восприятие высоты тона логарифмически связано с частотой звука.

  3. Короткосрочное преобразование Фурье имеет проблемы разрешения и не отражает работы улитки (short-time Fourier transform resolution issues).

 

Источник

Читайте также