Кризис в сегменте памяти затягивается?
Существует вероятность, что дефицит на рынке оперативной памяти не только не ослабнет, но и обострится. Ирония заключается в том, что катализатором может стать инновация от Google, на которую возлагали надежды как на средство выхода из сложившейся ситуации. Многие эксперты приходят к выводу, что алгоритм TurboQuant спровоцирует скачок спроса, а вовсе не его снижение.
Суть TurboQuant заключается в оптимизации работы с памятью при обучении нейросетей, что позволяет экономить от четырех до восьми раз больше ресурсов. На первый взгляд, это прорыв: если компаниям требуется значительно меньше «железа», потребность в закупках должна упасть, что мгновенно отразилось на биржевых котировках производителей чипов. Однако, если верить аналитикам, опрошенным Financial Times, поспешные выводы могут быть ошибочными.

Профессор Университета Сонгюнкван в Сеуле Квон Сок-джун подчеркивает: хотя стоимость запуска языковых моделей действительно падает в разы, это лишь открывает «ящик Пандоры» для новых высокозатратных проектов.
Удешевление вычислительных процессов позволяет реализовать сценарии, которые раньше были экономически нецелесообразными. В результате общая нагрузка на инфраструктуру не снижается, а лавинообразно возрастает.
Среди таких сценариев эксперт выделяет работу ИИ-ассистентов в режиме реального времени и повсеместное внедрение мультиагентных систем. Его поддерживает Хан Ин-су, один из разработчиков концепции TurboQuant. Он отмечает, что новая технология позволяет обрабатывать гораздо более обширные контексты без потери точности и эффективно запускать производительный ИИ на портативной технике.
Аналитик Ким Ён-гун проводит историческую параллель с внедрением Google Kubernetes. Тогда отрасль опасалась, что оптимизация серверов приведет к стагнации рынка «железа». На практике же доступность технологий спровоцировала бурный рост их потребления. С TurboQuant, вероятнее всего, произойдет то же самое.
Индустрия склонна недооценивать долгосрочный эффект: развитие ИИ-моделей требует всё больших объемов памяти как для стадии обучения, так и для инференса.
По сути, мы наблюдаем действие парадокса Джевонса: когда эффективность использования ресурса растет, издержки падают, что делает технологию доступнее и неизбежно ведет к еще большему потреблению ресурсов.
Пока что реальное влияние TurboQuant на рынок остается лишь теоретическим. Ожидается, что масштабный эффект станет заметен после официальной презентации алгоритма на Международной конференции по обучению представлениям в Бразилии в конце апреля, когда технология станет доступна для широкого тестирования специалистами по всей индустрии.
Источник: iXBT


