水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

柴孝伟

买进就值,越来越值,时享价...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

前券商首席经济学家


桂浩明

申万证券研究所首席分析师


宋清辉

著名经济学家宋清辉官方账号...


banner

banner

DeepSeek蒸发万亿美股之后,算力重估

冰女   / 01月28日 11:17 发布

1月20日,DeepSeek老板梁文峰进京开会,DS首次被定调上升高度。就在昨晚,美股最牛的AI板块崩了。英伟达暴跌13%,市值损失4477亿美元

 

台积电暴跌11%

 

ASML暴跌7%

 

以几家公司的市值:英伟达3.49万亿美元,台积电1.15万亿美元。这个13%和10%的跌幅,加上博通、ASML、微软,意味着一夜之间可能蒸发了上万亿美元。

DeepSeek对于全球震惊,尤其外网都是一边倒的赞这个是真的。

从发酵角度,这个没有那么多阴谋论,也不是谁为了收集筹码黑英伟达。不管是国内哪个投资平台,还不至于黑到美国的股票市场,那他们也不可能涨这么多年了对吧。这个事件为什么过了好几天才发酵呢?这其实跟那个小红书事件是一样的。每上有很多新模型的,工作日的时候还没发酵,到了周末的时候,几个美国AI大神在家里网上测这个模型,然后发现这个模型是对的,就在推特上去发言,然后就从科学界发酵到了美国网民,所以这个节奏根本就是美国网民自己带出来的。整个事件发酵就是跟小红书一样的,中美网民的又一次神助攻。

全球算力内卷的开始,就是说对于美国资本现在最恐慌的并不是DeepSeek本身,而是DeepSeek开源了,而且可以通过各种已知的节省的方式,然后揉合在一起,达到或者接近甚至超越部分openai大模型的效果,那么未来会有越来越多的拿不到算力卡的国家选择这个模式。这又是一种实质上的中国创新方法的胜利。对于美国巨头来说,他就得重新测算它的硬件投入部分。你再走以前的路径的话,你大模型的使用成本就会比中国以DeepSeek为主的大模型,使用成本要贵很多很多。

DeepSeek和算力不是反面,算力硬件还需要,但是整个估值体系裂了,就是对于最大硬件消耗的训练阶段,还需要多少算力卡目前可以说需要全部重估

成本简单对比匡算

DeepSeek v3只花了550万美元训练,而根据大多数的美国同类模型,大概需要几个亿美刀。就假设1亿美金吧,所以是在训练端的话,目前大概相当于百分之五的训练成本。而在使用端。目前,中国几乎所有的大模型对个人用户都是免费的。几乎就不用比较了吧。

对于商业化调用API DeepSeek和OpenAI的使用价格对比如下:

DeepSeek

- DeepSeek-R1:每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。

- DeepSeek-V3:每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。在2025年2月8日之前,所有用户使用

DeepSeek-V3 API的价格分别下降了80%(输入命中)、50%(输入未命中)、75%(输出)。

OpenAI

- GPT-3.5 Turbo:4K context下,每1K tokens输入0.0015美元,输出0.002美元;16K context下,每1K tokens输入0.003美元,输出0.004美元。

- GPT-4:8K context下,每1K tokens输入0.03美元,输出0.06美元;32K context下,每1K tokens输入0.06美元,输出0.12美元。

以处理百万字文本(假设按500个中文汉字为1K tokens)为例,OpenAI的GPT-3.5 Turbo 4K context大约收费2美元左右,GPT-4 8K context收费60美元左右;而DeepSeek-R1在缓存命中时仅需1元人民币,DeepSeek-V3优惠期内缓存命中时仅需0.1元人民币。四舍五入,DeepSeek对于美国人几乎是免费。

所以不管是训练端,还是推理端。这种方法论所带来的思维冲击是巨大的,对于算力垄断这件事需要重新评估。

DeepSeek不完美,但是它是开源的,各种mla和蒸馏方法写的清清楚楚都告诉你了,而且这些方法,每一个单独拿出来,业界的几个大公司都是掌握的,并不是说他每一个技术,别人做不到,所以以后会有越来越多的ds,算力基座的核心逻辑继续裂开。

DeepSpeek是中国的,整个美国引导的ai逻辑是硬件决定大模型,大力出奇迹,再加上硬件排它制裁让美国领先。中国ds这个事就是整个逻辑推翻了,有限的硬件通过极致软件优化和裁切加各种模型缝合,未来路径就是节衣缩食优化算法节省算力达到同样效果。

完全跳出了美国这设计的这套逻辑,美国算力逻辑继续继续裂开。相当于两个大国博弈筹码混乱了,也是要重新评估。

总体而言,不是说未来不缺算力,但是需要多少算力这个事儿,现在应该是一团乱麻了,对几千亿投入的这个事,就需要重新估量估量,那么对于翻了几倍的硬件端,一旦需求降或者延缓10%或者20%就很可怕。来自海涵财经