水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

柴孝伟

买进就值,越来越值,时享价...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

前券商首席经济学家


桂浩明

申万证券研究所首席分析师


宋清辉

著名经济学家宋清辉官方账号...


banner

banner

会“思考解题逻辑”的OpenAI推理大模型o1登场

冰女   / 09月16日 16:05 发布

一,OpenAI发布新系列AI模型o1

9月13日,光模块&PCB大涨,新易盛上涨10%,旭创涨8%,沪电涨7%,天孚涨7%,胜宏涨7%,主要原因在于:OpenAI发布新系列AI模型o1,思考时间越多推理能力越强,可推理复杂任务并解决比以前的科学、编码和数学模型更难的问题。


二,史上最强模型-o1,推理能力超人类博士

根据OpenAI公布测试的数据显示,o1在美国数学奥林匹克预选赛中,排名美国前500 名学生之列,并且在物理、生物学、化学基准上,首次超过了人类博士。也就是说,o1超过了GPT-4o,是现役最强的超复杂推理大模型。

图片

1,科学、编码、数学领域性能达到顶尖人类水平

1)编程方面,模型在Codeforces竞赛上超过83%的专业人员。

2)数学方面,以2024年的美国数学邀请赛为测试集,o1单次生成可解决74%的问题,多次生成后进一步提升正确率到83%,而GPT-4只能解决12%的问题。

3)科学方面,模型GPQA Dimond测试集正确率78%,超越人类专家70%水平,超越普通人类博士能力。

2、相比于GPT-4o的性能提升:可以像人类一样思考

自适应强化学习、纠错则是其第二大技术特点,o1 通过大规模的强化学习算法进行训练,在训练过程中,模型学会了如何有效地利用其思维链来解决问题。

这种训练方法使得 o1 能够不断优化自己的策略,识别和纠正错误,学会将复杂的步骤分解为更简单的部分,并在当前方法不奏效时尝试不同的方法来解决。通过不断的学习和改进,o1 的推理能力得到了极大的提升,也就是说o1具备了智能体的功能。

o1使用了谷歌训练时计算类似的技术,OpenAI发现,随着训练时计算资源的增加和测试时思考时间的延长,o1 的性能会不断提升。这表明,通过增加计算资源的投入,可以进一步挖掘 o1 的潜力,使其在各种任务中表现得更加出色。

o1的其他主要特色应用功能包括,可以直接翻译一个不健全的句子,自动补全缺失内容;可根据提示自动编写复杂的视频小游戏;擅长解决超复杂、冗长的推理问题。

三,AI推理正在成为行业焦点

推理大模型的特点,就是AI会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。以往的大模型,背后的逻辑是通过学量数据集中的模式,来预测单词生成的序列。

在训练阶段,公司往往会给模型“喂”海量数据进行大规模神经网络的训练。由于高计算密度、低能耗、内存带宽大等要求,目前大多数AI模型的训练均依赖于英伟达的GPU;而在推理阶段,AI模型在训练的基础上,利用神经网络模型进行推理预测,从而响应用户指令。这类芯片(LPU)对整体性能的要求没有GPU那么高,但推理引擎性能更强。

今年2月,英伟达首席财务官Colette Kress在上周表示,英伟达最大的营收来源数据中心部门中,去年有超过40%的业务是有关部署AI模型,而非训练——这一比例是AI芯片市场开始转向的重要迹象。

同样的,英伟达的另一强劲对手AMD执行副总裁Mark Papermaster也在3月的访谈中表示,AMD获得了大量对AI定制推理芯片的需求,这些需求覆盖了广泛的嵌入式应用场景。因此,随着这一趋势的发展,AMD将提供更多定制化计算产品来回应这一需求。

华福证券表示,当前推理算力市场已然兴起,24年AI推理需求成为焦点。

四,推理芯片、以太网、HBM等将受益

AI推理首先推动的就是推理芯片的需求;据西部证券推测,最终训练芯片与推理芯片数量之比或达到2:8。

其认为,随着生成式AI模型参数和Token数量不断增加,模型单次推理所需的算力持续攀升。同时,ChatGPT、Gemini、Kimi等聊天机器人的用户数逐步上升,MicrosoftCopilot、Adobe Firefly、WPS AI等办公助手持续落地,用户侧的流量不断上升,推理算力未来有望超过训练算力。

其次是以太网的渗透率将提升。中泰证券认为,随着AI应用拓展,推理侧算力需求占比提升,以太网此前长期积累的性价比和应用生态优势将驱动头部云厂商将其作为主干网络集成AI业务,叠加持续网络技术创新,市场份额有望提升,交换芯片、交换机、光模块等需求也将相应提升。

以太网交换机设备:由芯片(交换芯片、CPU、PHY)、PCB、光器件、插接件、阻容器件等组成。

其中交换芯片为最核心部件,全球主要厂商包括:思科、H为、博通、美满、瑞昱、盛科通信。

交换机市场格局方面,全球市场思科为绝对龙头,占据近50%份额,其余海外厂商包括Arista、HPE、Juniper。

国内交换机主要厂商包括:H为、新华三(紫光股份)、锐捷网络、中兴通讯、智微智能、菲菱科思、共进股份。

继续看好大模型多模态能力进展和商业化进程加速,建议持续关注相关领域的头部AI公司:

1)应用层:金山办公、科大讯飞、用友网络、金蝶国际、万兴科技、当虹科技、广联达、虹软科技等;

2)算法/数据处理:科大讯飞、星环科技等。

3)算力层:海光信息、工业富联、中科曙光、浪潮信息等。来自海涵财经