Скрытые затраты: Китайская нейросеть DeepSeek могла обойтись в 400 раз дороже, чем заявлено?

Появление китайской языковой модели DeepSeek, которая привела к резкому падению финансовых рынков США и сократила рыночную стоимость Nvidia на ошеломительные 600 млрд долларов, возможно, обошлось разработчикам на порядок дороже, чем изначально сообщалось.


Скрытые затраты: Китайская нейросеть DeepSeek могла обойтись в 400 раз дороже, чем заявлено?
создано DALL-E

Сообщается, что обучение модели стоило всего лишь 5-6 млн долларов, что впечатляет на фоне многомиллионных бюджетов западных конкурентов. Однако аналитики из SemiAnalysis, проведя подробный анализ имеющихся данных, указывают на то, что реальные затраты DeepSeek были примерно в сто раз выше заявленных!


Китайская нейросеть DeepSeek: затраты на обучение предположительно в 400 раз больше заявленных
фото SemiAnalysis

Китайская нейросеть DeepSeek: затраты на обучение предположительно в 400 раз больше заявленных
фото SemiAnalysis

Согласно отчету, DeepSeek использует около 10 000 графических чипов Nvidia H800 для китайского рынка и такое же число ещё более дорогих H100. Помимо этого, компания вложила средства в ускорители H20. В компании также имеется совокупность ресурсов, которыми DeepSeek делится с китайским хедж-фондом High-Flyer для осуществления операций торговли и исследований. В совокупности инвестиции оцениваются примерно в 1,6 млрд долларов, не учитывая текущие расходы, оцениваемые примерно в 944 млн долларов. Эти данные существенно превосходят ранее озвученные цифры затраченных средств.

Возможно, использование суммы в 5-6 млн долларов — это всего лишь часть расходов, связанная с финальным этапом запуска модели.

Следовательно, если оценки источника верны, никакого прорыва не произошло в том плане, что DeepSeek не смогла по-настоящему изменять рынок, когда тем требуются колоссальные вложения для работы крупных языковых моделей.

 

Источник: iXBT

Читайте также