-
盘古是最接近人类中文理解能力的AI大模型
沈丘刘哥 / 2023-03-26 21:52 发布
去年华为伙伴暨开发者大会2022上,“中国算力网—智算网络”上线,提出了“像建设电网一样建设国家算力网,像运营互联网一样运营算力网,让用户像用电一样使用算力服务”的发展愿景。国内多地人工智能计算中心已上线运营,均基于昇腾AI基础软硬件平台。
天风证券预计,中国算力网为未来有望成为全国大型算力底座,支撑国家“数字经济”和“东数西算”重大战略。
华为盘古大模型是由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。
1)盘古NLP大模型可能是最接近人类中文理解能力的AI大模型。
盘古NLP大模型是业界首个千亿参数中文语言预训练模型,在预训练阶段学习了40TB中文文本数据,是最接近人类中文理解能力的AI大模型,下游应用仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。
2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。?
应用场景:
智能舆情:利用文档信息抽取、情感分类、文档自动摘要等关键技术,在金融、电商、政务领域实现精准舆情分析、企业运营软件分析。
智能营销:利用文本匹配,问答和对话系统、意图识别等关键技术,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统。
2)盘古CV大模型——业界最大预训练CV模型,首次兼顾图像判别与生成能力
盘古CV大模型能同时满足底层图像处理与语义的理解需求。同时基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地,使研发成本降低90%。
目前盘古CV大模型在ImageNet10%数据集上的小样本分类精度上达到目前业界最高水平。
业界最大预训练CV模型:30亿参数,10亿级图像
判别与生成联合预训练:底层/视觉预训练任务通用
100+场景验证:研发成本降低90%
小样本学习性能领先:ImageNet10%标签分类精度业界第一
?
应用场景:
智能巡检:可以进行无人机智能巡检,并解决巡检系统中数据标注工作量大和缺陷种类繁多问题。数据筛选效率提升30倍、筛选质量提升5倍,模型的精度比普通模型提升18%。
智慧物流:可以用1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。
3)盘古气象大模型:速度较传统数值方法提升1000倍
?气象预报精度首次超过传统数值方法,速度提升1000倍:
借助创新的3DEST网络结构以及分层时间聚合算法,盘古气象大模型在气象预报的关键要素(例如,重力势、湿度、风速、温度等)和常用时间范围上(从一个小时到一周)精度均超过当前最先进的预报方法,同时速度相比传统方法提升1000倍以上。
同时,盘古气象大模型支持广泛的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低20%以上的位置误差。
4)可实现一个模型在众多场景规模化复制,多行业受益。
已在电力、金融等多个行业应用
国家电网(无人机电力巡检):基于盘古CV大模型的智能缺陷识别,视觉预训练大模型助力下游缺陷识别,进一步提升巡检效果,缺陷样本标注代价减少85%;平均精度提升18%。
浦发银行(浦慧云仓):盘古CV大模型1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。9种场景差异较大,大模型具备较强泛化能力。异常样本种类多、数量少,大模型可利用小样本数据取得高精准度结果。利用大模型的时空对齐能力,综合多摄像头数据,解决局部遮挡等问题,准确估计物体轨迹。
广发证券(企业财务智能预警):2019年有496家企业被监管处罚、问询或被ST处理,利用盘古大模型预测出其中439家,覆盖率近90%,其中被监管处罚企业111家,盘古大模型全部命中,无一家遗漏。
天风证券认为,未来随着盘古系列AI大模型的上线,将持续赋能金融、电力、交通、气象、物流等行业,华为产业链及下游应用相关公司有望持续受益。
相关标的:
底座硬件:拓息、四川长虹、神州数码、常山北明
底座软件:麒麟信安、中国软件
2B应用:
金融:长亮科技、中科软
电网:智洋创新、东方电子
其他:中科创达、赛意信息、东方国信
2C应用:金山办公、同花顺、科大讯飞、万兴科技、光云科技、当虹科技、视源股份