Исследовательская фирма SemiAnalysis провела обширный анализ того, что на самом деле стоит за DeepSeek с точки зрения затрат на обучение, опровергнув рассказ о том, что R1 стал настолько эффективным, что вычислительные ресурсы от NVIDIA и других не нужны.
Было заявлено, что DeepSeek использовала только «5 миллионов долларов» для своей модели R1, что на одном уровне с o1 от OpenAI GPT, и это вызвало розничную панику, которая отразилась на фондовом рынке США ; однако теперь, когда слух развеян, посмотреть стоит на фактические цифры.
Для тех, кто не в курсе, DeepSeek, как говорят, был побочным проектом китайского хедж-фонда High-Flyer, а в отчете SemiAnalysis утверждается, что они приобрели 10000 единиц NVIDIA A100 еще в 2021 году, когда экспортные ограничения не были такими агрессивными. Затем DeepSeek превратился в отдельную организацию, поскольку материнская компания High-Flyer решила отделить проект, и вот тогда все действительно пошло. С этого момента они начали накапливать вычислительные ресурсы.
В отчете говорится, что DeepSeek имеет около 10000 графических процессоров NVIDIA H800 AI, предназначенных для «китайского рынка», и 10000 более дорогих чипов H100 AI. Более того, компания инвестировала в ускорители NVIDIA H20 AI, и у них есть «пул» ресурсов, которые DeepSeek и High-Flyer совместно используют для «торговли, вывода, обучения и исследований». Это составляет около 1,6 млрд долларов США в капитальных вложениях для DeepSeek, а эксплуатационные расходы, по слухам, составляют около 944 млн долларов США. Эти цифры примерно в четыреста раз выше, чем изначально предполагали рынки.
Для ясности, первоначальная цифра, как говорят, является «определенной частью» расходов на обучение, вероятно, связанных с запуском