-
人工智能行业:2025年人工智能十大发展趋势
大张 / 01月28日 11:20 发布
核心观点:大语言模型发展进入深度推理阶段,通用人工智能愈行愈近,AI应用进入爆发前夜。站在当前这一重要的历史节点,我们从技术、应用、能源三个维度展望了人工智能的未来发展,其中技术是源动力,应用是牵引力,能源是支撑力。对未来的展望中,我们提出推理计算、合成数据、缩放法则、超级智能体、具身智能、 Al4Science、端侧创新、自动驾驶、人工智能、能源需求十个方面的发展趋势。
(来自 中信建投-人工智能行业:2025年人工智能十大发展趋势)趋势一 推理计算提升大模型准确率,强化学习激发模型推理能力
OPenAl发布新的具有深度思考能力的a1推理模型,推理侧缩放法则同样存在,大模型算力需求逐步迁移至推理侧。ol模型在复杂问题上花更多时间进行思考而非直接回应,具有改善和调整策略的能力。在科学、代码和数学等复杂问题上表现出色。思维链和思维树通过中间推理步骤帮助大模型实现了复杂的推理能力,大语言模型能够自己对推理过程的中间思维进行评估,ol呈现出类人的逻辑思维潜力。
强化学习激发模型推理能力,复杂思维方式反思能力涌现。传统大模型需要大量人工标注的监督数据进行训练,DeepSeek-R1-Zero验证了无需任何微调数据,仅通过强化学习即可实现推理能力的自主进化。而且这是没有奖励思维链长度的情况下实现的,即目标只是为了作对题目,大模型就会自发进行更长地思考,并且最后回答效果更好。在这个过程中,自发涌现出“反思”、“多步验证”等复杂推理行为,出现问题后,模型会自动纠正早期错误,这种“智能”的出现,为未来更有智慧的Agent出现铺平道路。
结合蒸馏技术实现能力的高效迁移。使用DeepSeek-R1作为教师模型生成800K数据,并对多个小型密集模型微调,小模型性能飞跃。以通叉干问的15亿参数量大模型为例,经过DeepSeek蒸馏后,数学题上超过GPT40-0513的水平,为小算力实现特定功能奠定了基础。
趋势二高质量数据更为稀缺,合成数据价值显现
高质量数据的稀缺性日益加剧。生成式AI模型的智能表现很大程度上依赖于数据,高质量数据是构建和训练复杂大模型的基础,模型训练所需要的数据主要来源于互联网上的文字和视频。目前大语言模型需要的数据资源规模目益扩充,加速了数据资源耗尽的时间点到来,同时互联网数据的创建者提升了数据抓取的限制。让搜寻数据变得越来越困难。
合成数据是一种模仿真实世界数据的非人工创建的数据,是由基于生成式AI技术的计算算法和模拟创建而成。英伟达发布的开源模型Nemotron-4340B,开发者可以使用它们生成用于训练大型语言模型的合成数据,以应用于医疗、金融、制造、零售及其他各行各业的商业应用,生成的合成数据在规模较小的大语言模型训练中将扮演重要的角色。
合成数据与推理时计算的化学反应在DeepSeck V3、DeepSeek R1中开始显现。以DeepSeek为例,用DeepSeek RI模型蒸馏出来高质量CoT数据去训练DeepSeek-V3,其高质量的合成数据对V3基础模型训练有明显提升。
趋势三 缩放法则依然有效,o3与GPT5循环驱动有望开启
缩放法则(Scaling law)t人工智能领域的缩放法则在2020年被首次提出,缩放法则在过去一段时间内指引大语言模型取得巨大成功:随着模型参数数量、训练数据量和计算量的增加,模型的性能会以可靠且可预测的方式提高。
发展趋势:随着大语言模型的模型尺度快速上升以及数据和算力的限制,尽管提升模型参数带来性能上升的边际收益正在逐步递减,提升模型参数规模、扩大训练语料库仍然是大语言模型提升性能的重要手段。在多模态数据中、在模型推理过程中、在生物数据中、在世界模型中,缩放法则初步展露头脚,缩放法则将从文本为主的大语言模型训练迁移到更加广阔的人工智能领域,指导人工智能模型在更多维度上的发展路径。
o3模型有望驱动模型和数据间的飞轮效应。o3模型思维链过程数据是目前AI行业的稀缺资源,可以极大推动模型和数据的飞轮效应,未来o3提升GPT-5、GPT-5提升o4的循环有望开启。
趋势四 应用的最佳形态一一超级智能体(AIAgent)
AI Agent指接受周围环境的信息,做出规划和决策,并通过执行器采取行动的人工智能体。Agent主要包括三个行动,以LLM为大脑模块的Agent展现出强大潜能,大语言模型展现的推理能力和决策能力是AIAgent的灵魂。
AIAgent即将进入能力快速跃升阶段。随着LVM(纯视觉大模型)和流式多模态模型的不断成熟,大语言模型的视近期大语言模型在推理侧“慢思考”能力方面取得的突破,意味着AIAgent已准备好进入普及阶段。
全球巨头争相布局端侧AIAgent。头部的人工智能企业和互联网公司均在端侧AIAgent方面有所布局,AIAgent展望后续,Agent在C端有望成为AI时代的操作系统,大量营销、办公等B端AI助手向Agent过渡。
趋势五 具身智能不断突破,人形机器人进入量产元年
具身智能的核心能力:感知、学习和与环境动态交互的能力。
Nvidia世界模型加速机器人训练。物理AI模型开发成本很高并且需要大量真实数据和测试,英伟达推出的Cosm
发者能够轻松生成大量基于物理学的逼真合成数据,以用于训练和评估其现有的模型。人形机器人进入量产元年。特斯拉在2023年12月发布第二代原型机OptimusGen2,Optimus而仅仅依靠2D摄像其端到端神经网络经过训练,能够对特斯拉工厂的电池单元进行准确分装,算法在机器人的FSD计算机上实时运
人形机器人相继进入工厂实训,加速智能制造落地进展。预计2025年有上千台机器人应用于特斯拉工厂,未来人、自动化设备等协同作业,实现柔性化生产。家庭场景是最具潜力的市场之一,未来目标可以完成扫地、擦伴老人等。
趋势六 AI4science : 黄金时代已经到来
人工智能极大加速科学研究进度。人工智能应用可见于所有STEM领域,应用在医学、材料科学、机器人技术、
学等领域,人工智能擅长模拟复杂系统及研究组成部分之间的相互作用,可以在庞大的问题解决方案中寻找最智能在蛋白质结构预测、小分子药物研发、材料结构预测、数学问题证明等研究过程中具备巨大的优势。诺贝尔奖:2024年诺贝尔物理学奖给了美国科学家约翰·霍普菲尔德、英国裔加拿大科学家杰弗里·辛顿,以
网络实现机器学习的基础性发现和发明”。2024年诺贝尔化学奖授予德米斯·哈萨比斯和约翰·M·詹珀,
AlphaFold在蛋白质结构预测方面的贡献。展望未来,特定领域短期内就能从AI中受益,比如自主实验室。同时,AI智能能够提升最先进技术水平,比如的生物、化学或物理过程的长度和时间尺度相关的研究。
趋势七 端侧创新将不断涌现,AI塑造端侧新分工新格局
随着AI大模型逐步成熟,几乎所有硬件产品都可以加入AI元素来提升表现能力。“AI+硬件”模式在办公、娱乐、教育未来有望在更多场景以更多品类形式进行应用。
2024CES展会的关注焦点是AIPC和AI手机,2025CES展会能看到端“百镜大战”的预演,三星喊出“AIl for AI”的口号,在手机、电视、耳机、戒指、手表等产品中均融入AI。
硬件产品功能性较强的单品逐步扩散到全场景、全品类、全价格段的多品类铺量模式。各品类SKU的需求量快速增加,合的创新在不断涌现,有望催生新一轮产业链分工,同时拉动上游SoC、PCB、新型封装、存储等产品。
趋势八 自动驾驶迈向端到端,Robota进入商业化落地阶段
自动驾驶算法经过多年不断演进路线,目前进入端到端驾驶算法发展阶段。端到端自动驾驶算法采用感知决策一体化法模型,直接输入传感器感知的信息,输出控制结果。自2023年以来智驾行业掀起的BEV、端到端技术浪潮后,智络融入感知、规划、控制等环节。大语言模型和视觉语言模型(VLM)逐步与端到端融合,进一步增强环境理解能型将端到端、VLM两个模型合二为一,多模态大模型将成为端到端自生的一种能力。
智能驾驶商业化进程不断加速。国内Robota相关政策不断完善,逐渐建立起Robota从准许上路到全无人商业运营,则在内的政策体系。智能驾驶算法不断向上迭代的同时,配有高阶智能驾驶产品的车型起售价在不断下降。
趋势九“人工智能+”全面铺开,企业数字化率先落地
“人工智能+”旨在将人工智能作为一种基础性、驱动性的技术力量,与制造、医疗、教育、交通、农业等多个领域进出新的产品、服务和商业模式,从而推动传统行业的转型升级和社会经济结构的变革。
企业数字化率先落地。对于提升效率,人工智能通过自动化流程与智能预测,使企业能够在短时间内实现更高的生产通过数据驱动的决策支持系统,人工智能帮助管理者做出更加精准基于数据分析的信息,从而降低风险,提高竞争 AI潜力巨大的领域,通过个性化推荐、24小时客服等方式,极大地提升了客户体验与满意度。
趋势十 AI对能源需求大幅增长,可持续发展日益紧迫
推理端算力需求大幅增长。随着基础模型的日益成熟,推理侧算力需求开始大幅增长。以字节为例,日均tokens调用量从1200亿增长到4万亿,所需要的算力大幅增长。
随着人类进一步训练更大参数量的模型,以及越来越多的AI应用开始部署,基于云的人工智能系统需要消耗更多的能源。英伟达单卡功耗从A100的400W到B200的1200W,功耗越来越高,并且服务器也开始迈向机柜式方案设计,对供电系统提出了更大的挑战。同时,为了更高效、更稳定、更环保,全球新一轮AIDC开始启动建设。
-
请先登录水晶球财经网再评