-
华为盘古大模型全景解析
糖芯儿 / 11月22日 12:54 发布
在国产AI领域,华为拥有最为完整和成熟的生态系统。软件端,盘古可赋能千行百业,鸿蒙可实现万物互联;在硬件端,端侧麒麟已重回巅峰,鲲鹏+昇腾有望构筑全球算力体系的第二极。 在AI应用终端爆发元年,华为有望凭借盘古+鸿蒙星河+麒麟+昇腾+鲲鹏最强生态领衔演绎国产软硬件生态崛起。 在之前的文章中我们已经梳理过华为昇腾、华为鲲鹏、华为鸿蒙产业格局,本文重点梳理解析华为盘古大模型产业生态。 盘古大模型持续深耕行业,已在30多个行业、400多个场景中落地,在政务、金融、制造、等领域发挥着巨大价值。 据国际权威分析机构沙利文(Frost & Sullivan)发布的《中国行业大模型市场报告2024》显示,华为云在行业大模型领域取得政务、工业、金融3个市场份额第一,并位居医疗、药物、气象以及汽车4个者象限,全面领跑中国行业大模型市场。 01 华为盘古大模型概览
华为盘古大模型是华为旗下超大规模的AI大模型,集成了华为云团队在AI领域数十项研究成果,并且与昇腾(Ascend)芯片、昇思(MindSpore)语言、ModelArts平台深度结合。盘古大模型主要是面向行业的大模型,是为解决行业难题和释放AI生产力而生。 以其强大的数据处理能力和精准的算法模型,为各行各业的数据分析和决策支持提供强有力的技术支撑。 盘古大模型包含L0中5类基础大模型、L1行业大模型及L2场景模型三层架构。 L0层为5个基础大模型,包括自然语言、视觉、多模态、预测、科学计算大模型; L1层为N个行业通用大模型,是在 L0 基础上导入行业数据迚行讪练而衍生,如矿山大模型、政务 大模型、气象大模型等。 L2 场景模型,是在 L1 基础上结合行业细分场景得到 的推理模型,如传送带异物检测、台风路徂预测等具体应用场景。L2层为更多细化场景模型,用户可自主训练。 盘古NLP大模型可以根据流水账改写成标准会议议程,辅助会议顺利进行;基于会议内容生成文本摘要,以便更好地了解会议重点和成果;会议结束后可撰写不同风格邮件,为会议组织者、与会者提供高效便捷的体验。 多模态大模型基于AI全栈自主文本生成图像,更快生成速度,更强泛化性和自然美感。 此外,科学计算大模型用于中长期天气预报;预测大模型用于财务异常检测;CV大模型用于万物分割,万物分割可以实现通用的语义分割,也可以实现辅助标注功能。 基于华为自研的达芬奇架构,盘古大模型具备强大的计算能力,能够快速、高效地完成训练和预测任务。 02华为盘古大模型发展历程 华为云团队于2020年立项AI大模型,并于2021年4月首次以“盘古预训练大模型”(简称“盘古大模型”)的名称对外发布。 2023年7月7日,在华为开发者大会上,面向行业的盘古大模型3.0发布,是中国首个全栈自主的AI大模型。 2024年6月21日,在华为开发者大会(HDC 2024)上,正式发布了盘古大模型5.0。 盘古大模型5.0在全系列、多模态、强思维三个方面做了全新升级。 全系列模型覆盖:盘古大模型5.0包含了不同参数规格的模型,从十亿级到万亿级,以适配不同的业务场景。 其中: (1)盘古 E 系列:10 亿参数级别,可支撑手机、PC 等端侧的智能应用; (2)盘古 P 系列:100 亿参数级别,适用于低时延、低成本的推理场景; (3)盘古 U 系列:有 1350 亿参数和 2300 亿参数两种,适用于处理复杂任务,可以成 为企业通用大模型的底座; (4)盘古 S 系列:万亿级参数,可以处理跨领域多任务,够能帮助企业更好地在全场 景应用 AI 技术。 多模态能力提升:盘古大模型5.0能够更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等更多模态。在内容生成方面,采用了业界首创的STCG(Spatio Temporal Controllable Generation,可控时空生成)技术,可生成更加符合物理规律的多模态内容。 盘古多模态大模型融合语言和视觉跨模态信息,实现图像生成、图像理解、3D生成和视频生成等应用,面向产业智能化转型提供跨模态能力底座。 强思维特性:通过深度结合思维链技术与策略搜索,盘古大模型5.0极大地提升了数学能力、复杂任务规划能力以及工具调用能力。这使得它能够更好地理解复杂情境下的逻辑关系,执行更为复杂的任务。 03华为盘古大模型行业应用
华为盘古大模型拥有广泛应用场景。 盘古大模型5.0已在30多个行业、400多个场景中落地应用。 自动驾驶领域:盘古大模型5.0可以帮助车辆更好地理解交通环境和行人行为,提高行驶安全性。 ▲生成车身四周,六个摄像头视角的视频,可直接用于自动驾驶训练 建筑设计:基于盘古大模型的可控生成能力,只需输入设计的黑白草图,即可生成彩色并带有纹理的建筑群360°实景视频;基于盘古3D重建能力,还可以构建出高真实感的建筑3D模型,将复杂建筑群的概念设计周期从数周缩短到数十分钟,助力建筑师创造出更加出色的建筑作品。 具身智能:盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。 媒体内容生产和应用领域:盘古大模型能够将实拍视频快速转换成特定风格的动漫,并保持角色样貌特征前后一致,舞蹈、武打等大运动轨迹也能确保合理一致的视觉效果;能自动将视频译制成不同语言,并保留原始角色的音色、情感、语气;将译制配音、动漫生成等场景的制作周期从月级缩短到天级,大大提升制作效率,作品一次拍摄多元化制作,实现价值最大化。 钢铁行业:华为与宝钢合作,利用盘古钢铁大模型提升了高炉的生产调控能力,成功降低了铁水的能耗。 高速铁路领域:华为推出的智能巡检机器人通过使用盘古大模型,提升了故障识别的准确率,确保了高铁的运行安全。 医药领域:天士力基于盘古大模型打造“数智本草大模型”,赋能方剂筛选和优化、提升研发效率,并辅助医生问诊。 气象领域:华为云联合深圳市气象局,在分辨率为25公里的全球模型基础上,融合区域高质量气象数据集,升级了分辨率分别为1公里、3公里、5公里的区域预报能力,包含气温、降雨、风速等气象要素。 04华为盘古大模型合作伙伴
华为云正加速推动盘古大模型在更多领域的落地应用。华为盘古大模型通过与各行业合作伙伴的深入合作,进一步拓展应用场景和影响力,推动多个行业的数字化转型和智能化升级。根据公开资料和公司公告,相关合作布局厂商中,软通动力是盘古大模型首批合作伙伴、昇腾AI大模型联合创新伙伴;拓尔思与华为签署了全面合作协议,携手打造全栈自主可控的软硬一体化联合解决方案。拓尔思基于自有高质量数据,以盘古大模型为基础模型进行微调,训练出盘古版拓天大模型。 捷成股份已与华为盘古正式签署合作协议,成为盘古大模型生态合作伙伴,双方面向AIGC领域展开深度合作,共同探索AI大模型在影视内容生产领域的应用与创新。 云鼎科技在华为盘古通用模型的基础上,利用山能集团在煤炭、化工、电力等行业的专业技术沉淀和行业技术专家优势研发了全球首个商用于能源行业的AI大模型——盘古矿山大模型,打造了覆盖主运、安监、防冲等9大专业的40个矿山领域应用场景,并于2023年7月公司与华为公司进行了联合发布。 拓息是华为“鲲鹏+昇腾+行业大模型+开源鸿蒙”全方位合作伙伴。在AI大模型方面,公司为华为盘古大模型生态合作伙伴,将进一步深化与盘古大模型在数据、算法以及服务等方面的交流与合作,加速推动交通行业大模型落地。 泛微网络作为华为政务一网通战略伙伴,联合华为发布了基于华为盘古大模型和泛微政务办公联合解决方案的城市治理大模型联合解决方案。通过与华为盘古大模型的对接,实现智能公文、智能问答、智能办事、智能会议等功能。 赛意信息、博彦科技、南威软件、梅安森、北信源、科达自控、先进数通、电科数字、九联科技、创意信息、常山北明等也和华为盘古大模型有相关合作布局。 随着AI技术的快速发展和市场的不断成熟,盘古大模型有望在未来发挥更加重要的作用,将成为推动行业智能化升级的重要力量,为企业带来更高效、更智能的解决方案。乐晴智库精选