DeepSeek的R1大模型，究竟是不是国运级别的产品？

时空复利 / 03月12日 19:21 发布

这是时空复利的第1959篇原创

自从DeepSeek（我们简称DS）横空出世，我发现很多媒体吹的过了头，什么国运级别、AI珍珠港事件，导致很多人对于DS的误区很多，甚至很大，有些大误区需要澄清一下，避免上头。

1、AI大模型的开发，硬件端可以国产替代么？

如果训练完成，只是用推理服务，可以，无非是电费贵很多。

但如果训练的话，还不行。

因为就连全球第二大GPU厂商AMD的计算卡也不行，只能是英伟达的计算卡。

很重要的原因是，英伟达有软件平台相当于绑定了计算卡的优化，这是20年的生态，就好比苹果与谷歌的操作系统，是底层逻辑，很难撼动。

所以英伟达依旧是计算卡当之无愧的霸主。

2、DS不是蒸馏出来的，这是开源社区的共识。

就连OpenAI的金主，微软的CEO都表示，DS有一些真创新，而AI成本下降是大趋势。

那为什么OpenAI的CEO表示，DS是从OpenAI蒸馏出的数据呢？

一是因为OpenAI的CEO阿尔特曼没有技术背景，并且有些急眼。

因为DS的成本太低了，而OpenAI作为行业先行者，烧了投资人那么多钱，压力山大。

3、DS的训练成本600万美元，是真的么？

这个数据是DS自己公布的V3训练模型的预训练费用。

不过要看成本是算哪些。

600万美元是数据费用以及按照租赁H800计算卡时间的租赁费用，得出的。

如果按照全部成本计算，购买计算卡，搭建服务器，人力成本等，加一起大概率是26亿美元。

这26亿美元并不是V3的训练成本，相当于至今的成本，以及未来很长时间的运行成本。

4、DS横空出世，对于计算卡的需求是增加的。

这是因为，DS降低了使用成本，人人都可以用，需求增加了，所以对于计算卡的需求也就增加了。

5、AI大模型降低成本，实际上是大势所趋。

DS通过种种努力，一切改进都以降低成本、提高计算卡利用率为首要目标，最终实现了一个和0penAl的01性能类似，但在训练和推理环节在成本上都大致降低了一个数量级的水平，而且明显超过之前开源模型里表现最好的Llama-3.3。

这种资源少，想办法实现的事情，也有很多大模型企业再做，只不过DS最先成功。

如果没有DS，还有有PS，WS。

尽管这是行业趋势，就好比曾经还有效的摩尔定律，但依旧可以说明DS的强大。

6、DS的R1，是不是国运级别的产品？

R1发布后，我看到好多媒体神吹，什么国运级别、AI珍珠港事件。但是，这跟DeepSeek的领头人梁文峰对这个成果的理解大相径庭。

梁文锋在采访的时候是这样说的，创新需要尽可能少的干预和管理，让每个人有自由发挥的空间和试错机会，创新都是自己生长出来的，不是可以安排的，更不是教出来的。创新就是昂贵且低效的，有时候伴随着浪费，所以经济发展到一定程度之后才能够出现创新，很穷的时候，或者不是创新驱动的行业，成本和效率非常关键，OpenAl也是烧了很多钱才出来的。

DS的创新是伟大的，但伟大不能被计划，不能被裹挟，不要被考核，不能被打扰。

比如DS的大模型是怎么做出来的呢？

DS的母公司是幻方量化，是利用AI技术操作股票的一家公司。

为了更好的利用量化策略投资，2015年开始做大模型，最初只有100张计算卡。

积累了技术优势后，这家公司本身又特别赚钱，人员构成的核心都是有计算机背景又心怀好奇的年轻人，所以就有意识地买更多计算卡去尝试。

在不断尝试的过程中，不断买英伟达A100，H100计算卡，那个时候这些计算卡还没有被禁封；幻方量化的动作要比大厂们早的多。

因为国内科技大厂其实很难说有这样肆意妄为的满足好奇心的空间，它们全都是业务驱动型的，最早批量买卡都是因为要在自动驾驶上砸钱，时间点大约在2022年下半年。

所以，尽管百度的投资部门就在幻方量化所在的那栋大厦的6层，却比就在5层的幻方量化晚了好几年。

这就是DS的生长环境，研发人员在业务上已经可以轻松出色完成的基础上，剩下的时间就是一群有理想、功底深厚的年轻人，在资金支持比较充足的情况下，没有考核指标，自由探索。

探索的结果就是，DeepSeek的各个版本。由于始终时就没有考核，成果的用法也就不会被局限在盈利上。

这就是创新的环境。

言归正传，尽管DS的R1不是国运级别的产品，但依旧是伟大的产品，尤其是象征意义，以及推动AI平权的实际意义。

同时我还观察到了一些情况，抛开宇树机器人等，有三位90后中国数学家可能做出了菲尔兹奖级别的成果，不一定，仅仅是可能。

这里说一下，菲尔兹是数学最高奖，难度比诺奖还要高。

菲尔兹奖很重要，但更重要的是，这是整个基础学科培养的土壤成功的先兆。

有可能未来20年，会出一批中国人得菲尔茨和诺奖，20年后可能会出一批在中国完成主要成果的菲尔茨和诺奖。

实际上这对于A股市场至关重要。

因为未来的经济，一定是依靠硬科技产业推动的，硬科技的背后就是基础科学。

为什么纳斯达克强大，长牛。

表面是纳斯达克有一批全球最好的顶级科技巨头，本质是美国有良好的基础学科培养的土壤。

而良好的基础学科培养的土壤，带来优质的科技公司，是支撑市场估值的底层逻辑。

本文完，大家看完以后辛苦右下角一键四连，毕竟写文章需要反馈，反馈越是强烈，写起来也会更认真，所以拜托大家啦。

（获取更多行业，个股，交易位置，详细内容见“时空复利”）

注，优质个股分析，操作系列文章，在【价值投资常识】对话框输入对应的名称，对应文章就会自动跳出；

【1】投资三大策略；

【2】贵州茅台；

【3】片仔癀；

【4】长江电力；

【5】海天味业；

【6】伊利股份；

【7】大秦铁路；

【8】美的集团；

【9】格力电器；

【10】承德露露；

【11】养元饮品；

【12】双汇发展；

【13】分众传媒；

【14】海螺水泥；

【15】公牛集团；

【16】涪陵榨菜；

【17】京东方；

【18】招商银行；
【19】伟星新材；

【20】青岛啤酒；

【21】云南白药；

【22】安琪酵母；

【23】绝味食品；

【24】宁德时代；
【25】汇川技术；

【26】千禾味业；

【27】华域汽车；

【28】伟星股份；

【29】东鹏饮料；

【30】同花顺；

【31】香飘飘；

【32】汤臣倍健；

【33】牧原股份；

【34】福耀玻璃；

【35】龙佰集团；

【36】柳药集团；

【37】中国中免；

【38】山东药玻；

【39】重庆啤酒；

【40】仲景食品；

【41】华兰疫苗；

【42】华兰生物；

【43】中国移动；

【44】百度；

【45】隆基绿能；

【46】中国联通；

【47】腾讯控股；

赞(5) | 评论 03月12日 19:21 来自网站举报

取消发布

推荐关注更多

DeepSeek的R1大模型，究竟是不是国运级别的产品？