Появление китайской языковой модели DeepSeek, которая привела к резкому падению финансовых рынков США и сократила рыночную стоимость Nvidia на ошеломительные 600 млрд долларов, возможно, обошлось разработчикам на порядок дороже, чем изначально сообщалось.

Сообщается, что обучение модели стоило всего лишь 5-6 млн долларов, что впечатляет на фоне многомиллионных бюджетов западных конкурентов. Однако аналитики из SemiAnalysis, проведя подробный анализ имеющихся данных, указывают на то, что реальные затраты DeepSeek были примерно в сто раз выше заявленных!


Согласно отчету, DeepSeek использует около 10 000 графических чипов Nvidia H800 для китайского рынка и такое же число ещё более дорогих H100. Помимо этого, компания вложила средства в ускорители H20. В компании также имеется совокупность ресурсов, которыми DeepSeek делится с китайским хедж-фондом High-Flyer для осуществления операций торговли и исследований. В совокупности инвестиции оцениваются примерно в 1,6 млрд долларов, не учитывая текущие расходы, оцениваемые примерно в 944 млн долларов. Эти данные существенно превосходят ранее озвученные цифры затраченных средств.
Возможно, использование суммы в 5-6 млн долларов — это всего лишь часть расходов, связанная с финальным этапом запуска модели.
Следовательно, если оценки источника верны, никакого прорыва не произошло в том плане, что DeepSeek не смогла по-настоящему изменять рынок, когда тем требуются колоссальные вложения для работы крупных языковых моделей.
Источник: iXBT