水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

股道的卢

06年入市实战操作至今,经...


价值领航

稳健的投资风格和淘金精神


柴孝伟

建造十九层每层成倍财富高楼...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

前券商首席经济学家


banner

banner

DeepSeek的R1大模型,究竟是不是国运级别的产品?

时空复利   / 03月12日 19:21 发布

这是时空复利的第1959篇原创

自从DeepSeek(我们简称DS)横空出世,我发现很多媒体吹的过了头,什么国运级别、AI珍珠港事件,导致很多人对于DS的误区很多,甚至很大,有些大误区需要澄清一下,避免上头。


1、AI大模型的开发,硬件端可以国产替代么?


如果训练完成,只是用推理服务,可以,无非是电费贵很多。

但如果训练的话,还不行。

因为就连全球第二大GPU厂商AMD的计算卡也不行,只能是英伟达的计算卡。

很重要的原因是,英伟达有软件平台相当于绑定了计算卡的优化,这是20年的生态,就好比苹果与谷歌的操作系统,是底层逻辑,很难撼动。

所以英伟达依旧是计算卡当之无愧的霸主。


2、DS不是蒸馏出来的,这是开源社区的共识。

就连OpenAI的金主,微软的CEO都表示,DS有一些真创新,而AI成本下降是大趋势。

那为什么OpenAI的CEO表示,DS是从OpenAI蒸馏出的数据呢?

一是因为OpenAI的CEO阿尔特曼没有技术背景,并且有些急眼。

因为DS的成本太低了,而OpenAI作为行业先行者,烧了投资人那么多钱,压力山大。


3、DS的训练成本600万美元,是真的么?

这个数据是DS自己公布的V3训练模型的预训练费用。

不过要看成本是算哪些。

600万美元是数据费用以及按照租赁H800计算卡时间的租赁费用,得出的。

如果按照全部成本计算,购买计算卡,搭建服务器,人力成本等,加一起大概率是26亿美元。

这26亿美元并不是V3的训练成本,相当于至今的成本,以及未来很长时间的运行成本。


4、DS横空出世,对于计算卡的需求是增加的。

这是因为,DS降低了使用成本,人人都可以用,需求增加了,所以对于计算卡的需求也就增加了。


5、AI大模型降低成本,实际上是大势所趋。

DS通过种种努力,一切改进都以降低成本、提高计算卡利用率为首要目标,最终实现了一个和0penAl的01性能类似,但在训练和推理环节在成本上都大致降低了一个数量级的水平,而且明显超过之前开源模型里表现最好的Llama-3.3。

这种资源少,想办法实现的事情,也有很多大模型企业再做,只不过DS最先成功。

如果没有DS,还有有PS,WS。

尽管这是行业趋势,就好比曾经还有效的摩尔定律,但依旧可以说明DS的强大。


6、DS的R1,是不是国运级别的产品?

R1发布后,我看到好多媒体神吹,什么国运级别、AI珍珠港事件。但是,这跟DeepSeek的领头人梁文峰对这个成果的理解大相径庭。


梁文锋在采访的时候是这样说的,创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会,创新都是自己生长出来的,不是可以安排的,更不是教出来的。创新就是昂贵且低效的,有时候伴随着浪费,所以经济发展到一定程度之后才能够出现创新,很穷的时候,或者不是创新驱动的行业,成本和效率非常关键,OpenAl也是烧了很多钱才出来的。


DS的创新是伟大的,但伟大不能被计划,不能被裹挟,不要被考核,不能被打扰。


比如DS的大模型是怎么做出来的呢?

DS的母公司是幻方量化,是利用AI技术操作股票的一家公司。

为了更好的利用量化策略投资,2015年开始做大模型,最初只有100张计算卡。

积累了技术优势后,这家公司本身又特别赚钱,人员构成的核心都是有计算机背景又心怀好奇的年轻人,所以就有意识地买更多计算卡去尝试。

在不断尝试的过程中,不断买英伟达A100,H100计算卡,那个时候这些计算卡还没有被禁封;幻方量化的动作要比大厂们早的多。

因为国内科技大厂其实很难说有这样肆意妄为的满足好奇心的空间,它们全都是业务驱动型的,最早批量买卡都是因为要在自动驾驶上砸钱,时间点大约在2022年下半年。

所以,尽管百度的投资部门就在幻方量化所在的那栋大厦的6层,却比就在5层的幻方量化晚了好几年。

这就是DS的生长环境,研发人员在业务上已经可以轻松出色完成的基础上,剩下的时间就是一群有理想、功底深厚的年轻人,在资金支持比较充足的情况下,没有考核指标,自由探索。

探索的结果就是,DeepSeek的各个版本。由于始终时就没有考核,成果的用法也就不会被局限在盈利上。

这就是创新的环境。


言归正传,尽管DS的R1不是国运级别的产品,但依旧是伟大的产品,尤其是象征意义,以及推动AI平权的实际意义。

同时我还观察到了一些情况,抛开宇树机器人等,有三位90后中国数学家可能做出了菲尔兹奖级别的成果,不一定,仅仅是可能。

这里说一下,菲尔兹是数学最高奖,难度比诺奖还要高。

菲尔兹奖很重要,但更重要的是,这是整个基础学科培养的土壤成功的先兆。

有可能未来20年,会出一批中国人得菲尔茨和诺奖,20年后可能会出一批在中国完成主要成果的菲尔茨和诺奖。

实际上这对于A股市场至关重要。


因为未来的经济,一定是依靠硬科技产业推动的,硬科技的背后就是基础科学。

为什么纳斯达克强大,长牛。

表面是纳斯达克有一批全球最好的顶级科技巨头,本质是美国有良好的基础学科培养的土壤。

而良好的基础学科培养的土壤,带来优质的科技公司,是支撑市场估值的底层逻辑。


本文完,大家看完以后辛苦右下角一键四连,毕竟写文章需要反馈,反馈越是强烈,写起来也会更认真,所以拜托大家啦。


(获取更多行业,个股,交易位置,详细内容见“时空复利”)



注,优质个股分析,操作系列文章,在【价值投资常识】对话框输入对应的名称,对应文章就会自动跳出;

【1】投资三大策略;

【2】贵州茅台;

【3】片仔癀;

【4】长江电力;

【5】海天味业;

【6】伊利股份;

【7】大秦铁路;

【8】美的集团;

【9】格力电器;

【10】承德露露;

【11】养元饮品;

【12】双汇发展;

【13】分众传媒;

【14】海螺水泥;

【15】公牛集团;

【16】涪陵榨菜;

【17】京东方;

【18】招商银行;
【19】伟星新材;

【20】青岛啤酒;

【21】云南白药;

【22】安琪酵母;

【23】绝味食品;

【24】宁德时代;
【25】汇川技术;

【26】千禾味业;

【27】华域汽车;

【28】伟星股份;

【29】东鹏饮料;

【30】同花顺;

【31】香飘飘;

【32】汤臣倍健;

【33】牧原股份;

【34】福耀玻璃;

【35】龙佰集团;

【36】柳药集团;

【37】中国中免;

【38】山东药玻;

【39】重庆啤酒;

【40】仲景食品;

【41】华兰疫苗;

【42】华兰生物;

【43】中国移动;

【44】百度;

【45】隆基绿能;

【46】中国联通;

【47】腾讯控股;