Разработан ИИ-процессор, способный вычислять со скоростью света

Коллектив исследователей из Сиднейского университета представил инновационный прототип нанофотонного процессора для задач искусственного интеллекта. В отличие от классических микросхем, данное устройство оперирует световыми потоками вместо электрических импульсов. В ходе экспериментальных тестов чип продемонстрировал впечатляющую точность в 99% при классификации десятков тысяч биомедицинских снимков. Благодаря новой архитектуре вычисления производятся за пикосекунды (триллионные доли секунды), что полностью снимает проблему термического перегрева, характерную для кремниевых серверов в современных дата-центрах.

Микроскопическое изображение нанофотонного вычислителя

Изображения оптических чипов, полученные с помощью сканирующего электронного микроскопа
Микроснимки чипов MNIST (20×20 мкм) и MedNIST (30×20 мкм), выполненные методом сканирующей электронной микроскопии на платформе «кремний на изоляторе». Авторы: Joel Sved и др. Источник: Nature Communications.

На представленных кадрах видны нанофотонные ускорители при значительном увеличении. Оптические волноводы направляют свет к структурам с топологически оптимизированной конфигурацией, где осуществляются физические вычисления. В нижней части изображена интеграция кристалла на печатную плату с золотым напылением контактов для сопряжения с традиционными электронными компонентами. Авторы: Joel Sved и др. Источник: Nature Communications.

Фотонная альтернатива: преодоление барьеров полупроводников

Лаборатория фотоники Сиднейского университета под руководством профессора Сяокэ И продемонстрировала функционирующий образец сверхминиатюрного оптического процессора. Устройство ориентировано на выполнение сложных математических операций, лежащих в фундаменте алгоритмов машинного обучения. Ключевая инновация заключается в отказе от переноса электронов по металлическим путям: информационный поток базируется исключительно на управлении фотонами.

При пиковых нагрузках стандартные вычислительные системы неизбежно сталкиваются с проблемой колоссального тепловыделения из-за электрического сопротивления материалов. Фотонный кристалл устраняет этот барьер на уровне фундаментальной физики. Световые волны проходят сквозь наноструктуры практически без потерь, сводя генерацию тепла к минимуму. Время выполнения одной операции сокращается до пикосекундного диапазона, что фактически соответствует времени прохождения света через физическую структуру чипа.

Работоспособность решения была подтверждена на наборах данных MNIST (распознавание рукописного ввода) и MedNIST (база из 10 000 биомедицинских изображений, включая МРТ органов грудной клетки). В симуляционных тестах точность достигала 99%. В условиях реального аппаратного эксперимента чип показал результат в 89% для MNIST и 90% для MedNIST, успешно идентифицируя патологические изменения на медицинских снимках.

Топологическая оптимизация как замена транзисторной логике

Глобальная индустрия ИИ стремительно приближается к «энергетическому тупику». Огромные серверные кластеры потребляют мегаватты энергии и требуют сложнейших систем водяного охлаждения. Оптические нейронные сети рассматриваются как перспективный выход, однако ранее их внедрение сдерживалось громоздкостью компонентов — создать компактный оптический элемент гораздо сложнее, чем разместить миллиарды транзисторов на кремниевой подложке.

Австралийские инженеры решили эту проблему, применив метод инверсного проектирования (обратного дизайна), основанный на детальном 3D-моделировании электромагнитных полей. Вместо компоновки нейросети из стандартных оптических узлов, таких как интерферометры Маха-Цендера, исследователи использовали алгоритм для вычисления идеальной геометрии материала.

Итоговое устройство представляет собой сложнейшую, на первый взгляд хаотичную наноструктуру из кремния и его диоксида. Внутри этого лабиринта световые волны (длиной 1550 нм) многократно рассеиваются и вступают в интерференцию. Проходя сквозь среду, свет физически выполняет операцию умножения матриц. Размеры рабочей области составляют всего 20×20 микрометров для простых задач и 30×20 микрометров для сложных медицинских данных. По заявлениям разработчиков, такая архитектура обеспечивает колоссальную плотность вычислений — порядка 400 миллионов настраиваемых параметров на один квадратный миллиметр площади.

Нелинейность вычислений: опыт ученых из MIT

Достижение австралийской группы опирается на десятилетний фундамент исследований в области физики света. Долгое время главной преградой для фотоники оставались нелинейные операции — функции активации, позволяющие нейросетям находить сложные закономерности. Поскольку фотоны слабо взаимодействуют друг с другом, создание оптической нелинейности требовало огромных энергетических затрат. Раньше сигналы приходилось постоянно конвертировать в электрический вид для обработки на цифровом процессоре, что нивелировало все преимущества скорости.

Прорыв в этой области совершила команда Массачусетского технологического института под руководством Дирка Энглунда и Саумила Бандиопадхьяя. В их системе, представленной в журнале Nature Photonics, используются особые нелинейные блоки. Эти элементы направляют малую часть световой энергии на фотодиоды для создания микротоков, которые управляют нелинейностью без использования внешних усилителей.

Благодаря этому подходу процессор MIT смог реализовать полный цикл глубокого обучения — включая линейные и нелинейные этапы — целиком в оптической среде менее чем за 0,5 наносекунды с точностью свыше 92%. Это доказало возможность создания самообучающихся оптических систем с экстремально низким энергопотреблением.

Путь к коммерциализации: от лабораторий к промышленным ЦОД

Пока академические группы совершенствуют точность и миниатюризацию, техгиганты уже внедряют фотонику для нужд масштабируемых систем. Главным «бутылочным горлышком» современных кластеров ИИ стала не только скорость процессоров, но и задержки при передаче данных между GPU.

Компания Lightmatter активно продвигает технологию 3D Co-Packaged Optics. Их флагманские решения, такие как фотонный суперчип Passage M1000, объединяют электронные интегральные схемы с оптическими модулями в едином корпусе. Это позволяет обойти физические ограничения медных соединений, где не хватает места для размещения контактов на периметре плат, что критически важно для обучения масштабных языковых моделей (LLM).

Системы Lightmatter передают до 448 Гбит данных в секунду по единичному оптическому каналу. Для этого применяется формат модуляции PAM4, позволяющий удвоить объем передаваемой информации в каждом сигнале. Кроме того, такая архитектура поддерживает возможность «горячей замены» оптоволоконных линий непосредственно в серверных стойках.

Масштабирование фотонного будущего

Команда Сиднейского университета уже инициировала процесс патентования своей технологии нанофотонных чипов и работает над методами её масштабирования. В ближайших планах — создание сетей из множества таких блоков для реализации принципов сверточных нейросетей. Архитектура адаптирована под стандартные технологические процессы CMOS-производства. Хотя переход индустрии на оптические рельсы займет время, успешная интеграция света на наноуровне подтверждает, что у кремниевой монополии появился серьезный технологический конкурент.

Физика света: от «холодных» вычислений в кремнии до природной инженерии

Механика «холодного» вычисления: преимущество фотона над электроном

Принципиальное различие между традиционным и фотонным процессором кроется в свойствах элементарных частиц. Работа современного графического ускорителя завязана на движении электронов — частиц, обладающих массой покоя и зарядом. Проходя под напряжением сквозь кристаллическую решетку, миллиарды электронов сталкиваются с атомами вещества.

Этот процесс рассеяния вызывает микроскопическое трение: электроны передают кинетическую энергию решетке, усиливая вибрацию атомов. В макромире это выражается в интенсивном нагреве, требующем громоздких радиаторов и систем охлаждения. Фотонная архитектура радикально меняет этот принцип. Фотон лишен массы покоя и электрического заряда. Инфракрасный лазерный луч, двигаясь по кремниевому волноводу, не встречает классического электрического сопротивления.

Фотоны не взаимодействуют между собой и не «трутся» об атомы среды (кремний прозрачен для волн 1550 нм). Они преодолевают топологию чипа без передачи паразитной энергии. Математические операции, реализованные через интерференцию света, происходят на предельных физических скоростях и фактически без генерации тепла. Фотонным системам не нужно охлаждение, так как в их основе отсутствует физическое трение частиц.

Кремниевая фотоника: свет в «непрозрачном» кристалле

Использование кремния в оптике может показаться парадоксальным, ведь в бытовом представлении это непрозрачный серый кристалл. Однако секрет заключается в диапазоне длин волн. То, что непроницаемо для видимого глазом спектра, становится абсолютно прозрачным для инфракрасного излучения.

На длине волны 1550 нм (стандарт телекоммуникаций) чистый кристаллический кремний прозрачен, как качественное стекло. Чтобы управлять светом на площади тоньше волоса, инженеры используют технологию «кремний на изоляторе» (SOI). Тончайший слой кремния наносится на диэлектрическую подложку, после чего в нем вытравливаются волноводы.

Здесь вступает в силу закон полного внутреннего отражения. Благодаря высокому показателю преломления кремния по сравнению с диоксидом, лазерный луч оказывается «запертым» внутри канала. Границы волновода работают как идеальные зеркала, заставляя свет мчаться по наноразмерному лабиринту без рассеивания во внешнюю среду. Это позволяет использовать существующие производственные линии микроэлектроники для создания сложнейших световых процессоров.

Биомиметика в архитектуре: уроки от природы

Рабочая зона нового процессора на микроснимках выглядит не как строгая сетка, а как органический, хаотичный узор. Такой подход к манипуляции светом заимствован у природы, а именно — у тропических бабочек рода Morpho. Их ярко-синий окрас обусловлен не химическими пигментами, а физической структурой чешуек.

На поверхности крыльев расположены миллионы микроскопических «древовидных» наноструктур. Свет, падая на этот рельеф, преломляется так, что волны синего спектра усиливаются, а остальные гасятся. Это явление структурной окраски стало прообразом для топологической оптимизации чипов. Алгоритм «вылепил» из кремния нанорельеф, который работает по аналогичному принципу: лазерные волны интерферируют внутри него по заданным математическим векторам. В обоих случаях — будь то сияние крыла или классификация МРТ-снимка — результат достигается исключительно за счет ювелирной геометрии наноструктур.

Источники

 

Источник

Читайте также