Как мозг визуализирует образы: общие нейронные механизмы зрения и воображения

1 час назад

Ментальная визуализация опирается на те же нейронные паттерны, что и реальное зрительное восприятие. Это открытие не только проливает свет на фундаментальную природу воображения, но и предлагает перспективные архитектурные решения для развития искусственного интеллекта.

Способность мысленно моделировать образы играет ключевую роль в процессах памяти, пространственного ориентирования и творческой деятельности. Тем не менее биологические основы воображения долгое время оставались загадкой. Ранее исследования с помощью фМРТ подтверждали вовлеченность одних и тех же зон мозга в зрение и воображение, однако низкая точность метода не позволяла доказать идентичность задействованных нейронов. Потребовался анализ активности отдельных нервных клеток, чтобы подтвердить эту гипотезу.

Внутричерепные замеры активности нейронов доказали: при воображении наш мозг повторно использует сенсорные коды, сформированные при восприятии реальности. Вентральная височная кора (ВВК) оперирует так называемым «осевым кодированием» (axis code) для структурирования визуальных образов. При представлении объекта в уме активируется часть тех же нейронов, что и при его прямом разглядывании, причем интенсивность их отклика коррелирует с реальным зрительным опытом.

Эти данные подкрепляют концепцию генеративной модели мозга, согласно которой высшие абстрактные представления «запускают» сенсорный код, создавая физиологический базис для воображения.

При зрительном восприятии и мысленном воображении активируются одни и те же нейроны — Исследователи из Cedars-Sinai выяснили, что при зрительном восприятии и мысленном воображении активируются одни и те же нейронные коды. Источник: Getty

Принципы осевого кодирования в вентральной височной коре

Фокусом исследования стала вентральная височная кора — область, критически важная для распознавания объектов. В ходе работы с 16 пациентами, страдающими эпилепсией (им проводилась имплантация электродов для диагностики), ученые регистрировали реакцию мозга на изображения лиц, предметов, флоры и текста. Было выявлено 456 нейронов, обладающих строгой специализацией на определенных категориях стимулов.

Для расшифровки нейронного кода исследователи применили методы глубокого обучения. Признаки объектов были переведены в математические координаты на множестве осей. Выяснилось, что около 80% изученных клеток (367 из 456) являются «осевыми» (axis-tuned): их возбуждение зависит от проекции визуального сигнала на соответствующие им «оси» признаков.

Гипотеза была подтверждена экспериментально: генеративная нейросеть смогла предсказать активность живых нейронов и создавать изображения на основе их математического описания.

«Мы использовали визуальные глубокие нейросети, чтобы дешифровать код нейронов через числовые характеристики объектов. Затем мы подтвердили валидность этого кода с помощью генеративного ИИ: синтезировали новые изображения и с высокой точностью предсказали реакцию мозга пациентов».

— Варун Вадия (Varun Wadia), ведущий автор исследования (Cedars-Sinai и Caltech)

Обнаруженная система кодирования в точности совпадает с механизмом, ранее описанным у приматов доктором Дорис Цао. Успех предсказательной модели подтверждает, что осевое кодирование является универсальным для человека.

Реактивация нейронных путей при воображении

Далее ученые задались вопросом: работает ли воображение на тех же нейронах или использует параллельные структуры? Шестеро испытуемых должны были детально вообразить ранее продемонстрированные им объекты. Выяснилось, что около 40% «осевых» нейронов (43 из 107) проявляли активность во время процесса воображения. Важно, что амплитуда сигнала коррелировала с «осевыми» значениями так же, как и при реальном наблюдении.

Таким образом, воображение — это частичная реактивация (около 40%) того же нейронного субстрата. Однако мозг успешно дифференцирует восприятие и воображение: скорее всего, именно этот количественный сдвиг в активации служит маркером реальности для нейронной системы.

«Воссоздавая образ в сознании, мы задействуем те же клеточные ансамбли, которые участвовали в первичном восприятии. Наше исследование позволило «взломать» этот код, используемый мозгом для регенерации визуальных данных».

— Уэли Рутисхаузер (Ueli Rutishauser), соавтор исследования (Cedars-Sinai и Caltech)

Результаты подтверждают генеративную модель работы мозга: воспоминания, инициируемые из глубинных структур, «подсвечивают» визуальные коды в ВВК, синтезируя внутренний образ.

Нейроны реактивируются во время визуализации — Записи активности одиночных нейронов выявили осевой код, используемый для репрезентации изображений в вентральной височной коре. (Источник: *Science*)

Перспективы в медицине и нейроинженерии

Понимание механизмов повторного переживания сенсорного опыта открывает горизонты для терапии психиатрических патологий. Способность мозга проводить грань между фантазией и реальностью критически нарушена при шизофрении, ПТСР или ОКР, сопровождающихся навязчивыми галлюцинациями.

«Дальнейшее изучение этого механизма позволит разработать инновационные методы коррекции состояний, при которых пациенты страдают от патологически ярких и неконтролируемых мысленных образов».

— Адам Мамелак (Adam Mamelak), соавтор исследования (Cedars-Sinai)

В области ИИ принципы осевого кодирования могут лечь в основу создания более эффективных архитектур. Объединение дискриминативных (распознавание) и генеративных (воображение) способностей внутри одной нейросети, использующей общий «язык» кодов, обещает существенный прорыв в производительности и качестве синтеза данных.

Ограничения и открытые вопросы

Несмотря на успех, ряд моментов требует уточнения:

Механизм активации: Каким образом память инициирует выборку нужных нейронов в ВВК? Требуется изучение нейронных связей между гиппокампом и височной корой.
Природа 40% активации: Почему при воображении задействуется лишь часть ансамбля? Вероятно, существуют дополнительные регуляторные контуры.

«Остается вопрос: задействуется ли этот механизм при создании совершенно новых творческих образов, которые мы никогда не видели? У нас появилась обоснованная гипотеза, которую предстоит проверить в дальнейших работах».

— Уэли Рутисхаузер

Важно помнить об ограничениях выборки и специфике исследуемой группы (пациенты с эпилепсией). Кроме того, декодирование образов возможно только при наличии предварительно изученного индивидуального кода человека, поэтому до «чтения мыслей» в привычном нам понимании технологий еще очень далеко.

Итог

Человеческое воображение — это результат реактивации нейронных кодов вентральной височной коры. Тот факт, что зрение и воображение используют один и тот же биологический «язык» осевого кодирования, но различаются лишь интенсивностью активации нейронов, является ключом к пониманию границы между реальностью и воображением. Эти данные закладывают фундамент для лечения психических расстройств и создания нейросетей нового поколения.