Фотонная нейросеть показала лучшую точность распознавания по сравнению с цифровыми аналогами

Китайские исследователи разработали фотонную нейросеть, в которой вычисления выполняются «на лету» благодаря дифракции света и оптическим взаимодействиям. Учёные из Северо-Западного политехнического университета и Университета Юго-Восточного Китая предложили архитектуру на основе концепции Extreme Learning Machine (ELM). Эта модель нейросетей имеет фиксированный скрытый слой, обучение в котором осуществляется исключительно через выходные веса. Главное отличие здесь — вместо программной симуляции скрытый слой реализован посредством физических оптических процессов. Сигналы к каждому нейрону поступают через несколько световых путей одновременно, что называют фотонными мультисинапсами.

Эта конфигурация обеспечивает не только высокую точность распознавания, но и значительно ускоряет процесс. Система достигла 99,79% точности на наборе данных MNIST (распознавание рукописных цифр), 98,26% на Fashion-MNIST (изображения одежды) и 90,29% на сложном датасете CIFAR-10 (цветные фотографии объектов). Это превосходит большинство современных архитектур.


Фотонная нейросеть показала лучшую точность распознавания по сравнению с цифровыми аналогами
Иллюстрация: Sora

Ключевым моментом успеха является применение «мультисинаптической» оптики. Вместо единичного соединения между нейронами используется множество параллельных путей, которые создаются путем дублирования входного изображения и направляются по различным траекториям. Этот метод улучшает устойчивость к шуму, обеспечивает точную передачу данных и улучшает обучение без численного моделирования.

Благодаря физическому подходу к вычислениям, обучение модели занимает всего несколько секунд. Потребление энергии составляет всего атоджоулей на операцию умножения-сложения, что значительно ниже по сравнению с современными цифровыми чипами. Производительность достигает 2,89 TOPS/s, делая архитектуру перспективной для энергоэффективных ИИ-устройств.

Фотонная нейросеть превзошла цифровые аналоги в точности распознавания
Источник: Zhuonan Jia, Haopeng Tao, Guang-Bin Huang, Ting Mei

К тому же, фотонная сеть обходится без сложного программного обучения — её структура формируется за счёт световой дифракции, а обучение производится лишь на уровне цифровой обработки результата. Это значительно снижает требования к оборудованию и позволяет создавать компактные оптические устройства.

Исследование открывает путь к новому поколению «аналоговых» нейросетей, где вычисления выполняются со скоростью света в прямом смысле.

 

Источник: iXBT

Читайте также