-
【广发通信】我们如何看待DeepSeek R1对算力硬件投资的影响
大张 / 01月26日 23:21 发布
DeepSeek R1目前的关键信息:
(来自【广发通信】)1)1/20发布,开源,性能比肩0penAI01,训练及推理成本远低与海外大模型
2)海外掀起复现DeepSeek R1热潮,海外科研人员评价积极居多
3)通过强化学习、MoE稀疏激活、开源等方式实现低成本比肩o1效果
-DeepSeekr1产生的影响:
拉近了中外模型的差距,一定程度的创新了模型训练和推理的方式,,说明堆算力不是提升模型训练能力的唯一路径,#模型架构上的一些”巧思”亦可提升模型训练速度和降低训练推理成本。可能部分影响全球AI模型【训练】的范式,开辟新的道路。喱
为什么利好算力硬件?
很多投资者直觉是利空算力,但是仔细想一想,问题出现在部分投资者对算力需求的理解还停留在#训练视角,而不是#推理视角。
广发通信在24年12月发布了《迎接AI的大推理时代》的25年度策略,指出25年AI正式进入“大推理时代”,训练对于算力硬件需求的影响边际弱化,#推理对于算力硬件需求的影响边际强化。其核心标志1模型侧,引入强化学习RL,训练侧部分工作迁移至推理侧,推理对算力消耗加大;2重力硬件测,云厂商要求解耦,算力硬件自研比例提升,为低成本部署庞大的推理做准备;B应用侧,算力需对训练侧的锚定弱化,转而更多的锚定推理侧AI用户数/AI Agent数量/AI应用的复杂亮。(详细请参考12/15的观点推送)
基于以上判断,我们认为DeepSeek R1对于降低训练和推理双方成本的事实,非常利好AI应用快速爆发,长期抬升推理侧算力需求。
有些投资者担心推理场景相较于训练场景,对于互联密度要求降低,从而不利于AI互联互通的光和铜的需求。#我们认为这种观点的问题是没有抓住主要矛盾。首先,目前推理场景对互联密度要求不高是因为目前的AI应用大都为"轻量级”应用,而实时多模态等“重量级“AI应用对互联密度的要求可能不低;第二,“大推理时代”的#主要矛盾是用户数量,#而不是互联密度,未来十年人+Agent的数量总和可能是百亿甚至千亿量级,推理需求才刚刚开始。
看好:小米及小米产业链。目前国内科技巨头只有小米在大模型领域暂时落后,但是小米在端侧(手机+汽车+智能家居)布局较好,壁垒较高,此前据媒体报道,小米按角DeepSeek团队关键成员,如果小米能在短时间、低成本补强高性能大模型自研,则其端侧的优势就有望得以快速展现。