水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

股道的卢

06年入市实战操作至今,经...


价值领航

稳健的投资风格和淘金精神


柴孝伟

建造十九层每层成倍财富高楼...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

前券商首席经济学家


banner

banner

为什么Agent对算力需求如此大

火眼金睛   / 05月04日 21:24 发布

核心观点

海外科技巨头业绩超预期,持续加大AI基建支出。1)谷歌:2025年第一季度营收902.3亿美元,净利润345亿美元,均超预期。一季度谷歌云计算部门的收入同比增长28%达123亿美元。谷歌将维持今年2月公布的资本支出计划,即2025年全年资本支出达到750亿美元,用于建设数据中心等项目,较2024年的530亿美元显著增加。2)微软:截至3月31日的2025财年第三财季财报营收为700.66亿美元,同比增长13%;净利润为258.24亿美元,同比增长18%,在云计算业务Azure强劲增长加持下业绩超过分析师预期。其中智能云业务事业部营收为267.51亿美元,较上年同期的221.41亿美元增长21%。剔除财务租赁的资本支出达167.5亿美元,同比增长近53%。2026财年微软预计资本支出将继续增长,但增速将低于2025财年,届时将包括更多短周期资产支出。3)Meta:2025年第一季度营收为423.14亿美元,同比增长16%;净利润为166.44亿美元,同比增长35%。首席执行官扎克伯格表示目前Meta AI已拥有近10亿月度活跃用户。上调资本开支指引:Meta预计2025年全年资本支出将达到640亿至720亿美元,较此前预期的600亿至650亿美元有所增加。

Agent内在技术对算力天然存在高需求。以LLM为核心驱动的Agent 技术展现出强大的智能交互与任务处理能力,其背后也蕴含庞大的算力需求。从内在技术维度深入剖析:1)Agent接入外部数据以及多次调用模型带来的长上下文。Agent工作时需要维持庞大的上下文信息,包括用户输入、系统提示、通过检索增强生成从外部数据源获取的补充信息。即使是看似简单的单轮对话,背后也可能涉及复杂的上下文处理和推理过程,对于需要多步规划、工具调用或持续交互的任务,模型推理次数会更多,进而消耗更多算力。2) Agent 能力增强带来调用频率提升。随着 Agent 在自然语言理解、任务执行等多方面能力不断增强,其应用场景不断拓展,用户依赖度显著提高,阿里云平台大语言模型API调用量近一年增长近100倍便是有力佐证,高频次的模型推理大幅增加了算力需求。3) Agent执行任务验证带来算力开销,为确保任务执行的准确性、可靠性与合规性,如Manus的三重校验体系不可避免地消耗大量算力。4)多模态发展趋势下,Agent需处理整合文本、图像、音频等多种类型数据,且要满足实时性交互需求,进一步推高了力消耗。这些内在技术因素共同作用,使得 Agent 对对算力天然存在高需求。


Agent处于爆发期,应用层出不穷。Agent 正处于技术高速迭代、应用场景不断拓展、用户数量激增的爆发期。1)市场规模看,亿欧智库预测,2024 年中国 AI Agent 市场规模为 1473 亿元,企业渗透率不足 5%,但到 2028 年规模有望飙升至 3.3 万亿元。2)在应用场景方面,通用 AI 助手如豆包、DeepSeek 等迅速积累海量用户,成为新的流量入口,其中 DeepSeek 仅 7 天便实现 1 亿用户增长,到 2025 年 2 月中国生成式 AI 用户总数达 2.5 亿。垂直领域的 Agent 应用也蓬勃发展,例如营销领域,AI Agent覆盖客户交互、内容生产等全链路环节;在旅行领域飞猪“问一问”多智能体通过连接实时报价引擎,为用户提供定制化旅行服务。3)MCP(模型上下文协议)的影响力不断扩大,其作为开源协议标准化大模型上下文连接方式,加速了Agent 生态构建;4)OpenAI 的 GPTs、字节跳动的 Coze 平台等智能体开发平台,以低代码甚至无代码开发模式降低开发门槛,推动 Agent 应用的创新与普及。5)除了用户端的推理需求,还是模型训练阶段对更大规模数据和模型参数量的需求也对算力提出了更高要求。


算力瓶颈影响Agent服务的用户体验。 Agent 的算力瓶颈问题日益突出,严重影响用户体验。1)随着用户量的爆发式增长、模型复杂度不断提升以及应用场景的日益多样化,服务响应延迟、不稳定甚至中断等问题频繁出现:以 Manus 为例,执行文字类任务需 15 - 20 分钟,复杂的网页交互任务耗时更长达 31 分钟;字节推出的扣子空间因备受关注,在开放 demo 后出现服务器拥堵现象。2)为保障用户体验,Agent 服务提供商需预留应对用户流量波动的冗余算力,然而用户访问量受节假日、营销活动等多种因素影响具有不确定性,尽管部分平台如 DeepSeek通过动态调整节点的方式,在白天高负荷时全力保障推理服务,夜间低负荷时用于研究和训练,但并非所有服务商都具备类似灵活调配能力,因此不可避免需要一定算力冗余。由此可见从模型训练到推理,从应对高并发到保障服务稳定性,算力已成为支撑Agent发展的关键基础设施和核心瓶颈。

 

算力:寒武纪、海光信息、阿里巴巴、奥飞数据、海南华铁、云赛智联、潍柴重机、科华数据、大位科技、玉柴国际、弘信电子、协创数据、亿田智能、宏景科技、圣阳股份、润建股份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份、华策影视、顺网科技、恒为科技、网宿科技、朗科科技等。

Agent:金山办公、泛微网络、金蝶国际、鼎捷数智、用友网络、宇信科技、京北方、中科金财、致远互联、金桥信息、汉得信息、朗新集团、上海钢联、新致软件、同花顺、信雅达、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、软通动力、光云科技、科大讯飞、万兴科技、海天信息、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。

垃圾发电:旺能环境、盈峰环境、瀚蓝环境、军信股份等。
互联网大厂AI链:寒武纪、恒玄科技、孩子王、天键股份、润欣科技、实丰文化、乐鑫科技、萤石网络、中芯国际、润泽科技、欧陆通、华懋科技、浪潮信息、中兴通讯、中科曙光、兆易创新、国光电器、法本信息、亚康股份、申菱环境、兆龙互连等。
军工AI:能科科技、品高股份、普天科技、海格通信等。



风险提示AI技术迭代不及预期风险;宏观经济风险;行业竞争加剧风险。



报告正文



01


海外科技巨头财报超预期,持续加大AI基建支出

谷歌:
4月24日谷歌公布第一季度业绩报告,营收902.3亿美元,净利润345亿美元,均超预期。一季度谷歌云计算部门的收入同比增长28%达123亿美元。营业利润率为17.8%,较去年同期9.4%明显提高。

谷歌表示其在数据中心、芯片和其他AI基础设施上的投入在今年正持续扩大,第一季度资本支出飙升至172亿美元,高于去年同期的120亿美元,也略高于市场预估的171亿美元。谷歌仍将维持今年2月公布的资本支出计划,即2025年全年资本支出达到750亿美元,用于建设数据中心等项目,较2024年的530亿美元显著增加。

微软:
5月1日腾讯科技报道,微软公布了截至3月31日2025财年第三财季财报,在云计算业务Azure强劲增长加持下业绩超过分析师预期。微软第三财季营收为700.66亿美元,同比增长13%;净利润为258.24亿美元,同比增长18%。

微软第三财季智能云业务事业部营收为267.51亿美元,较上年同期的221.41亿美元增长21%,按固定汇率计算同比增长22%。运营利润为110.95亿美元,高于上年同期的95.15亿美元。

微软仍在持续加码AI基础设施投资。微软第三财季资本支出增长52.9%至214亿美元,低于Visible Alpha所调查分析师平均预期的223.9亿美元。不过,微软长期资本支出占比已降至约50%。微软投资者关系副总裁乔纳森·尼尔森表示,这反映出公司支出重点正从数据中心建设等长期资产转向芯片等短期资产。第三财季剔除财务租赁的资本支出达167.5亿美元,同比增长近53%,超出Visible Alpha所调查分析师平均预期的163.7亿美元。微软预计2026财年资本支出将继续增长,但增速将低于2025财年,届时将包括更多短周期资产支出。

Meta:
当地时间4月30日消息,Meta发布了公司2025年第一季度财报,营收与净利润均超出市场预期。财报显示Meta当季营收为423.14亿美元,同比增长16%;净利润为166.44亿美元,同比增长35%。首席执行官扎克伯格表示目前Meta AI已拥有近10亿月度活跃用户。

Meta上调资本开支指引:Meta预计2025年全年资本支出将达到640亿至720亿美元,较此前预期的600亿至650亿美元有所增加。此次调整反映出Meta为支持人工智能计划而增加的数据中心投资,以及基础设施硬件预期成本的上升。



02


Agent内在技术对算力天然存在高需求

当前以大语言模型(LLM)为核心驱动的AI Agent技术正在快速发展中,展现出理解复杂指令、自主规划、调用工具并执行多步骤任务的强大能力。从简单的问答、文本生成,到复杂的市场分析、代码编写、差旅预订,Agent正逐渐渗透到我们工作和生活的方方面面。技术浪潮下不容忽视的现实是Agent对算力的需求极其庞大,无论是训练更强大的Agent模型,还是支撑海量用户的高并发访问,亦或是确保Agent执行任务的准确可靠,都离不开底层算力的强力支撑。

图片


探讨Agent对算力需求巨大的几个核心原因,从技术层面上包括:

1、Agent需要处理长上下文和接入外部数据。
Agent的上下文窗口长度以及接入外部数据的能力直接关系到Agent能够处理任务的复杂度和深度,这种能力的提升直接关联到巨大的计算需求。计算需求增长对底层硬件(主要是GPU)提出了极高的要求,不仅需要更多的计算单元,还需要更大的显存来存储模型参数和中间计算结果。这是当前Agent技术发展面临的核心挑战之一,也是驱动算力基础设施不断升级的关键因素。

更长的上下文窗口意味着模型可以处理和记住更多的信息。IBM的解释中明确指出,(LLM) 的上下文窗口(或上下文长度)是模型在任何时候可以考虑或“记住”的文本量,以词元为单位。LLM 的上下文窗口可被视为其工作记忆。它决定了 LLM 在不遗忘先前对话细节的情况下可以进行多长时间的对话。它还决定了一次可以处理的文档或代码样本的最大大小。当提示、对话、文档或代码库超过人工智能模型的上下文窗口时,必须对其进行截断或总结,模型才能继续处理。一般来说增加 LLM 的上下文窗口大小意味着更高的准确性、更少幻觉、更连贯的模型响应、更长的对话以及分析更长数据序列的能力提高。增加上下文长度通常需要增加算力要求,导致成本增加。

当用户与Agent进行多轮对话,或者要求Agent处理长文档、分析大量数据时,模型需要维持一个庞大的上下文信息。不仅仅是用户输入的文本,还可能包括系统提示、通过检索增强生成(RAG)从外部数据源获取的补充信息,如通过API调用、网页浏览、数据库查询等方式获取实时或特定领域信息。所有这些信息都需要在模型的工作记忆中占据空间。Agent执行这些外部调用本身就需要计算资源,而获取到的外部数据往往需要整合到当前的上下文中,再次增加了上下文的长度和处理的复杂度。例如一个Agent在规划旅行时,可能需要调用天气API、航班查询API、酒店预订API,并浏览相关旅游攻略网页。这些操作获取的信息都需要被模型理解和处理,以便生成最终的旅行计划。这个过程涉及多次模型推理和数据整合,每一次都消耗算力。即使是看似简单的单轮对话,背后也可能涉及复杂的上下文处理和推理过程。而对于需要多步规划、工具调用或持续交互的任务,模型推理的次数会更多,进而消耗更多算力。



2、Agent能力增强带来的调用频率提升

随着Agent能力的不断增强,用户对其依赖性日益增加,调用频率也随之显著提升,这构成了算力需求的另一个重要驱动因素。

Agent能力的提升体现在多个方面:更强的自然语言理解和生成能力、更广泛的知识覆盖、更复杂的任务执行能力(如规划、推理、调用工具等),以及更流畅的多模态交互能力。Agent能力的提升将更广泛的应用场景和更高的用户采纳率。用户不再仅仅将Agent视为简单的问答工具,而是开始将其应用于更复杂、更核心的工作流程中,例如编程辅助、商业咨询、创意构思、自动化办公、客户服务等。导致用户与Agent的交互次数大幅增加。

一个显著的例证是云平台上大语言模型API调用量的激增。根据环球网的报道,阿里云智能集团资深副总裁刘伟光在2025年阿里云AI势能大会上透露:“过去一年,阿里云平台上的大语言模型API调用量增长近100倍,接入企业数量同样增长百倍”。这种指数级的增长直接反映了企业和开发者将大模型及其Agent能力集成到各类应用中的趋势,导致模型被调用的总次数急剧攀升。


3、Agent执行任务验证带来的算力开销

为了确保Agent执行任务的准确性、可靠性和合规性,复杂的验证过程成为许多高级Agent架构中不可或缺的一环。据51cto,以Manus为例,其技术架构中包含一个专门的验证模块,验证模块通过三重校验体系保障输出可靠性:逻辑验证器检测任务链的因果合理性;事实核查器交叉比对多信源数据真实性;合规审查器确保输出符合法律法规。在医疗咨询、金融分析等对准确性和合规性要求极高的场景中,验证模块发挥着关键作用,如在医疗咨询时同步验证医学指南、最新论文和临床数据,生成置信度评分,让输出结果精准且可靠。

执行这些验证步骤需要额外的计算资源,是为了提升结果质量和可靠性而进行的投入。我们认为Agent越智能、越可靠,其内置的验证和修正机制往往越复杂,对算力的需求也就越大。

4、多模态的发展会带来更大算力需求
随着技术进步,Agent正朝着多模态的方向发展,即能够处理和整合多种类型的数据,如文本、图像、音频、视频等。多模态的发展使得Agent能够在更广泛的应用场景中发挥作用,为用户提供更加丰富和全面的交互体验,但同时也带来了更大的算力需求。以一个智能客服Agent为例,它不仅需要理解用户的文本提问,还可能需要识别用户上传的图片或语音消息。为了处理这些多模态数据,Agent需要对文本、图像和音频进行特征提取、分析和融合,需要大量的计算资源,尤其是在处理高清图像或长时间音视频时计算量会显著增加。

 

同时多模态交互可能对Agent响应的实时性更高。例如在视频会议中智能助手实时识别参会者的语音、表情和手势,并根据这些信息提供相应的服务。为了满足实时性要求,Agent必须在短时间内完成多模态数据的处理和分析,这对算力提出了更高的挑战。


03


Agent处于爆发期,应用层出不穷


当前Agent正处在一个技术快速迭代,应用场景不断拓宽,用户数量激增的爆发期,共同推动了对底层算力需求的指数级增长。


市场规模的爆炸式增长:亿欧智库的研究指出2024年中国AI Agent市场规模1473亿元,企业渗透率不足5%,但随AI Agent在SaaS产品中增益价值扩大及高性能定制化AI Agent开发市场成熟,2028年规模有望达到3.3万亿元。

图片

Agent应用场景的极大丰富和深化
通用AI助手如豆包、DeepSeek等迅速积累了庞大的用户基础,正逐渐成为新的流量入口。罗兰贝格的报告提到,DeepSeek仅用7天就完成了1亿用户的增长,到2025年2月,中国生成式AI的用户总数已达2.5亿。


面向特定垂直领域的Agent应用也层出不穷,进入高速发展元年
例如在营销领域,亿欧报告中提到了AI Agent在营销全链路(客户交互、内容生产、数据分析、策略优化)的应用,例如利用AI数字人进行24小时直播带货,利用AI生成营销文案和视频素材,利用AI进行实时数据分析和用户行为预测等。

在旅行领域,五一假期前夕飞猪上线了一款多智能体驱动的旅行AI“问一问”。它能像资深旅游服务从业者一样,思考用户需求,提供定制化般的服务,把用户从拼凑攻略、反复比价的琐碎中解放出来,真正做到说走就走。

和大多AI助手只能使用离线数据不同,“问一问”连接了飞猪的实时报价引擎,可以精准捕捉机票、酒店的实时价格,提供多个真实可订的选择。确定航班酒店后,用户也不需要再切换后台,点击“预订”即可一键跳转至商品页面,光速搞定出行和住宿问题。用户还可以随意调整预算区间,“问一问”将会根据新预算,迅速生成一套符合需求的新方案。

图片

如果出行方案的文字太多,用户还可以查看"问一问"生成的"手绘行程图"。

图片


MCP影响力扩大,Agent生态构建加速。
MCP(模型上下文协议)是一种开源协议,旨在标准化如何为大模型提供上下文。可以将MCP想象成 AI Agent的 USB-C接口:为大模型提供了一种连接到各种工具和数据源的统一方法。

图片


传统上将AI统连接到外部工具涉及集成多个API。每个API 集成都意味着单独的代码、文档、身份验证方法、错误处理和维护。MCP旨在替换碎片化的Agent代码集成,从而使 AI 系统更可靠,更有效。通过建立通用标准,服务商可以基于协议来推出它们自己服务的 AI 能力,从而支持开发者更快的构建更强大的 AI 应用。开发者也不需要重复造轮子,通过开源项目可以建立强大的 AI Agent 生态。例如扣子空间支持添加 MCP 扩展,如高德地图,飞书云文档等,预计未来将有越来越多扩展加入,丰富Agent能力边界。


图片


此外,各类智能体开发平台的兴起进一步降低了Agent的开发门槛如OpenAI的GPTs、字节跳动的Coze平台、百度的文心智能体平台等,这些平台以低代码甚至无代码的开发方式进一步降低了Agent的开发门槛,使得大量开发者和普通用户能够创建和分享针对特定需求的Agent,极大地加速了Agent应用的创新和普及。

图片

Agent市场的爆发和应用的普及直接转化为对算力的海量需求。一方面用户基数的快速增长意味着更高的并发请求量,需要更多的服务器和计算资源来支撑。另一方面Agent能力的增强(如更长的上下文、更复杂的多模态处理、更精密的验证机制)和应用场景的深化(如需要实时交互、调用多种工具、执行复杂工作流)都对单次任务的算力消耗提出了更高要求。

算力需求不仅体现在用户端的推理服务上,也体现在模型训练阶段。训练更大、更强的Agent模型需要海量的算力支持。当下大模型的参数规模和训练数据量规模都非常庞大。以阿里的Qwen模型为例,4月29日阿里开源的Qwen3系列模型中Qwen3-235B-A22B有2350多亿数、 220多亿激活参数。在预训练方面,Qwen3 的数据集相比 Qwen2.5 有了显著扩展。Qwen2.5是在 18 万亿个 token 上进行预训练的,而 Qwen3 使用的数据量几乎是其两倍,达到了约 36 万亿个 token,涵盖了 119 种语言和方言。在后训练阶段,为了开发能够同时具备思考推理和快速响应能力的混合模型,阿里实施了一个包括(1)长思维链冷启动(2)长思维链强化学习(3)思维模式融合(4)通用强化学习的四阶段训练流程。

 


04


算力瓶颈影响Agent服务的用户体验

尽管Agent展现出广阔的应用前景,但其对算力的巨大需求也带来了现实的挑战。在用户量激增、模型复杂度提升、应用场景多样化的背景下,算力瓶颈问题日益凸显,具体表现为服务响应延迟、服务不稳定甚至服务中断等情况,导致用户体验受损,虽然可以通过优化API调用方式(如批量请求、异步请求)等方法缓解,但根本原因在于瞬时或持续的算力需求超出了服务提供商的承载能力。

Manus回答问题一般耗时15分钟。据新京报贝壳财经记者测试发现,根据任务难度的不同,Manus执行任务的时间也不同,如对“设计采访提纲与视频采访脚本方案”等几项文字类任务,Manus的执行时间约为15分钟至20分钟,而对于“设计金融科普互动产品”这项涉及网页交互的任务,Manus耗时31分钟。

扣子空间是字节推出的智能体协作系统,官方主打“你和AI Agent协同办公的最佳场所”。据量子位4月23日报道,由于放出来的demo效果惊艳,过去几天里出现了挤爆服务器的场面。

图片


扣子有探索和规划两种模式,探索模式让AI 自主动态思考,完成速度更快,规划模式由AI帮助规划步骤,分步执行。据极客公园测试,用扣子的探索模式制定一份日本旅行攻略,做出这份旅行攻略的时间在10 分钟以上,可以看到扣子将推理过程的思维链与搜索深度结合,践行“边想边搜”,在已获取到日本关西和熊本的小众景点、海边景点以及适合三十岁生日庆祝的特别地点信息后,扣子保存了景点信息,开始“边想边做”,从景点中筛选出合适的景点并规划出行程安排,在完成行程安排后,开始生成包含地图、景点介绍、必备日语短语及旅行提示的 html 旅行手册。


为了保证用户体验Agent服务需要留出一定应对用户流量波动的冗余算力用户对服务的访问量往往具有不确定性,会因各种因素如节假日、特殊事件、营销活动等出现峰值。DeepSeek官方在知乎发布的技术报告指出,由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。但并非所有Agent服务提供商都有训练模型等需求可以充分利用闲时算力,因此能满足用户峰值的算力必然会存在一定的冗余。

图片

 

综上所述,基于大语言模型的Agent之所以对算力有着巨大的需求,是由其技术特性和当前的发展阶段共同决定的。更长的上下文处理能力、接入外部数据的需求、日益增强的功能带来的用户调用频率激增、确保结果可靠性的复杂验证机制,以及当前Agent技术和应用的爆发式增长,都对底层算力提出了极高的要求。从模型训练到服务推理,从应对高并发访问到保障服务稳定性,算力已成为支撑Agent发展的关键基础设施和核心瓶颈。

 



05

国盛计算机投资建议

算力:寒武纪、海光信息、阿里巴巴、奥飞数据、海南华铁、云赛智联、潍柴重机、科华数据、大位科技、玉柴国际、弘信电子、协创数据、亿田智能、宏景科技、圣阳股份、润建股份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份、华策影视、顺网科技、恒为科技、网宿科技、朗科科技等。


Agent:金山办公、泛微网络、金蝶国际、鼎捷数智、用友网络、宇信科技、京北方、中科金财、致远互联、金桥信息、汉得信息、朗新集团、上海钢联、新致软件、同花顺、信雅达、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、软通动力、光云科技、科大讯飞、万兴科技、海天信息、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。

垃圾发电:旺能环境、盈峰环境、瀚蓝环境、军信股份等。

互联网大厂AI链:寒武纪、恒玄科技、孩子王、天键股份、润欣科技、实丰文化、乐鑫科技、萤石网络、中芯国际、润泽科技、欧陆通、华懋科技、浪潮信息、中兴通讯、中科曙光、兆易创新、国光电器、法本信息、亚康股份、申菱环境、兆龙互连等。

军工AI:能科科技、品高股份、普天科技、海格通信等。