-
DeepSeek蒸发万亿美股之后,算力重估
冰女 / 01月28日 11:17 发布
1月20日,DeepSeek老板梁文峰进京开会,DS首次被定调上升高度。就在昨晚,美股最牛的AI板块崩了。英伟达暴跌13%,市值损失4477亿美元
台积电暴跌11%
ASML暴跌7%
以几家公司的市值:英伟达3.49万亿美元,台积电1.15万亿美元。这个13%和10%的跌幅,加上博通、ASML、微软,意味着一夜之间可能蒸发了上万亿美元。
DeepSeek对于全球震惊,尤其外网都是一边倒的赞这个是真的。
从发酵角度,这个没有那么多阴谋论,也不是谁为了收集筹码黑英伟达。不管是国内哪个投资平台,还不至于黑到美国的股票市场,那他们也不可能涨这么多年了对吧。这个事件为什么过了好几天才发酵呢?这其实跟那个小红书事件是一样的。每上有很多新模型的,工作日的时候还没发酵,到了周末的时候,几个美国AI大神在家里网上测这个模型,然后发现这个模型是对的,就在推特上去发言,然后就从科学界发酵到了美国网民,所以这个节奏根本就是美国网民自己带出来的。整个事件发酵就是跟小红书一样的,中美网民的又一次神助攻。
全球算力内卷的开始,就是说对于美国资本现在最恐慌的并不是DeepSeek本身,而是DeepSeek开源了,而且可以通过各种已知的节省的方式,然后揉合在一起,达到或者接近甚至超越部分openai大模型的效果,那么未来会有越来越多的拿不到算力卡的国家选择这个模式。这又是一种实质上的中国创新方法的胜利。对于美国巨头来说,他就得重新测算它的硬件投入部分。你再走以前的路径的话,你大模型的使用成本就会比中国以DeepSeek为主的大模型,使用成本要贵很多很多。
DeepSeek和算力不是反面,算力硬件还需要,但是整个估值体系裂了,就是对于最大硬件消耗的训练阶段,还需要多少算力卡目前可以说需要全部重估。
成本简单对比匡算
DeepSeek v3只花了550万美元训练,而根据大多数的美国同类模型,大概需要几个亿美刀。就假设1亿美金吧,所以是在训练端的话,目前大概相当于百分之五的训练成本。而在使用端。目前,中国几乎所有的大模型对个人用户都是免费的。几乎就不用比较了吧。
对于商业化调用API DeepSeek和OpenAI的使用价格对比如下:
DeepSeek
- DeepSeek-R1:每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。
- DeepSeek-V3:每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。在2025年2月8日之前,所有用户使用
DeepSeek-V3 API的价格分别下降了80%(输入命中)、50%(输入未命中)、75%(输出)。
OpenAI
- GPT-3.5 Turbo:4K context下,每1K tokens输入0.0015美元,输出0.002美元;16K context下,每1K tokens输入0.003美元,输出0.004美元。
- GPT-4:8K context下,每1K tokens输入0.03美元,输出0.06美元;32K context下,每1K tokens输入0.06美元,输出0.12美元。
以处理百万字文本(假设按500个中文汉字为1K tokens)为例,OpenAI的GPT-3.5 Turbo 4K context大约收费2美元左右,GPT-4 8K context收费60美元左右;而DeepSeek-R1在缓存命中时仅需1元人民币,DeepSeek-V3优惠期内缓存命中时仅需0.1元人民币。四舍五入,DeepSeek对于美国人几乎是免费。
所以不管是训练端,还是推理端。这种方法论所带来的思维冲击是巨大的,对于算力垄断这件事需要重新评估。
DeepSeek不完美,但是它是开源的,各种mla和蒸馏方法写的清清楚楚都告诉你了,而且这些方法,每一个单独拿出来,业界的几个大公司都是掌握的,并不是说他每一个技术,别人做不到,所以以后会有越来越多的ds,算力基座的核心逻辑继续裂开。
DeepSpeek是中国的,整个美国引导的ai逻辑是硬件决定大模型,大力出奇迹,再加上硬件排它制裁让美国领先。中国ds这个事就是整个逻辑推翻了,有限的硬件通过极致软件优化和裁切加各种模型缝合,未来路径就是节衣缩食优化算法节省算力达到同样效果。
完全跳出了美国这设计的这套逻辑,美国算力逻辑继续继续裂开。相当于两个大国博弈筹码混乱了,也是要重新评估。
总体而言,不是说未来不缺算力,但是需要多少算力这个事儿,现在应该是一团乱麻了,对几千亿投入的这个事,就需要重新估量估量,那么对于翻了几倍的硬件端,一旦需求降或者延缓10%或者20%就很可怕。来自海涵财经