AI商业化加速，大模型重点标的！

飞来 / 2024-12-07 20:59 发布

OpenAI在其举办的“12天12场直播”活动首秀中发布完整版o1大模型。o1模型回答用户提问时可形成类似人类思维方式的内部思维链条，从而明显提高回答专业问题的准确性，o1模型回答困难现实问题时出现重大错误的概率可减少34%。相比o1-preview，完整版o1模型响应更快且更准确，同时增加了多模态输入的能力。

　　OpenAI推出ChatGPTPro，定价为每月200美元。ChatGPTPro用户可以无限量地使用o1模型（Plus用户限制为每周50条信息），以及无限量使用o1 mini模型和高级语音模式。o1 pro会使用更多的计算资源进入深入思考，并为“最难的问题提供最好的答案”。OpenAI未来计划为模型添加更多更强大、计算密集型的功能。

　　亚马逊、谷歌DeepMind相继发布多模态大模型，应用场景持续延伸

　　在12月4日的re:Invent大会上，亚马逊AWS发布了新款AI多模态系列大模型Amazon Nova。Nova一共包含6个模型，其中Micro和Lite模型能够理解文本、图像和视频输入，适合快速和低成本的交互场景。Pro模型结合多模态能力和高准确性及响应速度，适合视频摘要、软件开发辅助等高级应用。最高端的Premier模型预计将于2025年初发布，旨在处理复杂推理任务。而Canvas、Reel用于创意任务。Canvas模型能够从文本或图像提示生成专业级图像，Reel模型则能够用自然语言控制风格和摄像机运动，制作短视频。

　　近日，谷歌DeepMind推出第二代大规模基础世界模型Genie 2，相比于上一代模型，Genie 2在通用性上实现重大突破——能生成丰富多样的3D世界，可以模拟虚拟世界，包括采取任何行动（如跳跃、游泳等）的后果。基于大规模视频数据集进行训练后，Genie2展现出了各种规模的涌现能力，例如物体交互、复杂的角色动画、物理效果、建模、预测其他智能体行为的能力等等。基于Genie 2模型，研究人员可以快速尝试新环境并训练和测试具身AI智能体。

　　近期国内厂商在大模型及产品层面均有升级迭代，关注多模态AI商业化加速

　　近日，万兴科技旗下视频创意软件Filmora V14版本新增上线超十项AI功能，包括音频成片、图生视频、智能切片、AI翻译唇形驱动、AI文生音效等一系列AI能力，适用于视频博客、教育工作者、营销团队等群体视频创作增效提质。

　　在大模型侧，近日腾讯开源了130亿参数的类Sora文生视频模型HunyuanVideo，具备物理模拟、一镜到底、文本语义还原度高、动作一致性强色彩分明、对比度高等技术特性，可生成带有音乐的视频。国内厂商多模态模型及产品应用呈现加速迭代趋势。

　　标的

　　AIAgent应用：科大讯飞、彩讯股份、焦点科技、鼎捷数智、泛微网络、拓尔思、迈富时；

　　AI垂类应用：金山办公、三六零、万兴科技、昆仑万维、虹软科技、润达医疗、美图公司、商汤-W；

（浙商计算机）

赞(38) | 评论 (11) 2024-12-07 20:59 来自网站举报

取消发布

推荐关注更多

AI商业化加速，大模型重点标的！