-
DeepSeek的R1大模型,究竟是不是国运级别的产品?
时空复利 / 03月12日 19:21 发布
这是时空复利的第1959篇原创 自从DeepSeek(我们简称DS)横空出世,我发现很多媒体吹的过了头,什么国运级别、AI珍珠港事件,导致很多人对于DS的误区很多,甚至很大,有些大误区需要澄清一下,避免上头。
1、AI大模型的开发,硬件端可以国产替代么?
如果训练完成,只是用推理服务,可以,无非是电费贵很多。
但如果训练的话,还不行。
因为就连全球第二大GPU厂商AMD的计算卡也不行,只能是英伟达的计算卡。
很重要的原因是,英伟达有软件平台相当于绑定了计算卡的优化,这是20年的生态,就好比苹果与谷歌的操作系统,是底层逻辑,很难撼动。
所以英伟达依旧是计算卡当之无愧的霸主。
2、DS不是蒸馏出来的,这是开源社区的共识。
就连OpenAI的金主,微软的CEO都表示,DS有一些真创新,而AI成本下降是大趋势。
那为什么OpenAI的CEO表示,DS是从OpenAI蒸馏出的数据呢?
一是因为OpenAI的CEO阿尔特曼没有技术背景,并且有些急眼。
因为DS的成本太低了,而OpenAI作为行业先行者,烧了投资人那么多钱,压力山大。
3、DS的训练成本600万美元,是真的么?
这个数据是DS自己公布的V3训练模型的预训练费用。
不过要看成本是算哪些。
600万美元是数据费用以及按照租赁H800计算卡时间的租赁费用,得出的。
如果按照全部成本计算,购买计算卡,搭建服务器,人力成本等,加一起大概率是26亿美元。
这26亿美元并不是V3的训练成本,相当于至今的成本,以及未来很长时间的运行成本。
4、DS横空出世,对于计算卡的需求是增加的。
这是因为,DS降低了使用成本,人人都可以用,需求增加了,所以对于计算卡的需求也就增加了。
5、AI大模型降低成本,实际上是大势所趋。
DS通过种种努力,一切改进都以降低成本、提高计算卡利用率为首要目标,最终实现了一个和0penAl的01性能类似,但在训练和推理环节在成本上都大致降低了一个数量级的水平,而且明显超过之前开源模型里表现最好的Llama-3.3。
这种资源少,想办法实现的事情,也有很多大模型企业再做,只不过DS最先成功。
如果没有DS,还有有PS,WS。
尽管这是行业趋势,就好比曾经还有效的摩尔定律,但依旧可以说明DS的强大。
6、DS的R1,是不是国运级别的产品?
R1发布后,我看到好多媒体神吹,什么国运级别、AI珍珠港事件。但是,这跟DeepSeek的领头人梁文峰对这个成果的理解大相径庭。
梁文锋在采访的时候是这样说的,创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会,创新都是自己生长出来的,不是可以安排的,更不是教出来的。创新就是昂贵且低效的,有时候伴随着浪费,所以经济发展到一定程度之后才能够出现创新,很穷的时候,或者不是创新驱动的行业,成本和效率非常关键,OpenAl也是烧了很多钱才出来的。
DS的创新是伟大的,但伟大不能被计划,不能被裹挟,不要被考核,不能被打扰。
比如DS的大模型是怎么做出来的呢?
DS的母公司是幻方量化,是利用AI技术操作股票的一家公司。
为了更好的利用量化策略投资,2015年开始做大模型,最初只有100张计算卡。
积累了技术优势后,这家公司本身又特别赚钱,人员构成的核心都是有计算机背景又心怀好奇的年轻人,所以就有意识地买更多计算卡去尝试。
在不断尝试的过程中,不断买英伟达A100,H100计算卡,那个时候这些计算卡还没有被禁封;幻方量化的动作要比大厂们早的多。
因为国内科技大厂其实很难说有这样肆意妄为的满足好奇心的空间,它们全都是业务驱动型的,最早批量买卡都是因为要在自动驾驶上砸钱,时间点大约在2022年下半年。
所以,尽管百度的投资部门就在幻方量化所在的那栋大厦的6层,却比就在5层的幻方量化晚了好几年。
这就是DS的生长环境,研发人员在业务上已经可以轻松出色完成的基础上,剩下的时间就是一群有理想、功底深厚的年轻人,在资金支持比较充足的情况下,没有考核指标,自由探索。
探索的结果就是,DeepSeek的各个版本。由于始终时就没有考核,成果的用法也就不会被局限在盈利上。
这就是创新的环境。
言归正传,尽管DS的R1不是国运级别的产品,但依旧是伟大的产品,尤其是象征意义,以及推动AI平权的实际意义。
同时我还观察到了一些情况,抛开宇树机器人等,有三位90后中国数学家可能做出了菲尔兹奖级别的成果,不一定,仅仅是可能。
这里说一下,菲尔兹是数学最高奖,难度比诺奖还要高。
菲尔兹奖很重要,但更重要的是,这是整个基础学科培养的土壤成功的先兆。
有可能未来20年,会出一批中国人得菲尔茨和诺奖,20年后可能会出一批在中国完成主要成果的菲尔茨和诺奖。
实际上这对于A股市场至关重要。
因为未来的经济,一定是依靠硬科技产业推动的,硬科技的背后就是基础科学。
为什么纳斯达克强大,长牛。
表面是纳斯达克有一批全球最好的顶级科技巨头,本质是美国有良好的基础学科培养的土壤。
而良好的基础学科培养的土壤,带来优质的科技公司,是支撑市场估值的底层逻辑。
本文完,大家看完以后辛苦右下角一键四连,毕竟写文章需要反馈,反馈越是强烈,写起来也会更认真,所以拜托大家啦。
(获取更多行业,个股,交易位置,详细内容见“时空复利”) 注,优质个股分析,操作系列文章,在【价值投资常识】对话框输入对应的名称,对应文章就会自动跳出;
【1】投资三大策略;
【2】贵州茅台;
【3】片仔癀;
【4】长江电力;
【5】海天味业;
【6】伊利股份;
【7】大秦铁路;
【8】美的集团;
【9】格力电器;
【10】承德露露;
【11】养元饮品;
【12】双汇发展;
【13】分众传媒;
【14】海螺水泥;
【15】公牛集团;
【16】涪陵榨菜;
【17】京东方;
【18】招商银行;
【19】伟星新材;【20】青岛啤酒;
【21】云南白药;
【22】安琪酵母;
【23】绝味食品;
【24】宁德时代;
【25】汇川技术;【26】千禾味业;
【27】华域汽车;
【28】伟星股份;
【29】东鹏饮料;
【30】同花顺;
【31】香飘飘;
【32】汤臣倍健;
【33】牧原股份;
【34】福耀玻璃;
【35】龙佰集团;
【36】柳药集团;
【37】中国中免;
【38】山东药玻;
【39】重庆啤酒;
【40】仲景食品;
【41】华兰疫苗;
【42】华兰生物;
【43】中国移动;
【44】百度;
【45】隆基绿能;
【46】中国联通;
【47】腾讯控股;