-
商汤何以跑出大模型落地的「逃逸速度」?
辉常观察 / 04月25日 09:28 发布
当商汤董事长兼CEO徐立在一面颇具中国风的背景面前发布全新升级的「日日新SenseNova 5.0」大模型体系,预示着商汤成为了首家实现了云端边全栈布局的企业,而正是在这样一面背景之上,赫然写着「AI大模型时代 II」。
于是,人们不禁会问,商汤何以跑出了大模型落地的「逃逸速度」,实现了大模型性能超越GPT-4 Turbo的呢?
如果我们对商汤日日新5.0大模型以及商汤背后强大的算力支撑,有一个全面的了解,便不会对此有任何的惊讶。
正如徐立所言,「商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。」以此为基点,我们或许能够找到商汤跑出大模型落地的「逃逸速度」的内在逻辑。
商汤日日新5.0性能全面超越GPT-4 Turbo
自去年4月正式上线以来,商汤日日新大模型系统已经完成了五大版本的迭代升级。而此次升级,主要是基于超过10TB tokens训练、覆盖大量合成数据,采用混合专家架构,推理时上下文窗口可以有效到 200K 左右,以及聚集增强了知识、数学、推理及代码能力,全面对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。
得益于这些更新,日日新5.0的「文科能力」、「理科能力」以及多模态能力,全面得到了一次质的提升。
以日日新5.0和GPT-4回答趣味推理问题为例:“妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后,将它加满水,然后她又喝了半杯后,再加满水,最后全部喝完。问圆圆喝的咖啡多,还是水多?”,日日新5.0回答正确,GPT-4回答错误。
日日新5.0的这些能力的提升,可以在中文语境下,更好地为用户进行总结和问答,助力教育、内容等行业场景应用的落地。
同时,日日新5.0的数理能力、代码能力以及推理能力的大幅度提升,同样可以为金融、数据分析等场景的应用,提供有力支撑。
除了「文科能力」、「理科能力」之外,日日新5.0的多模态能力,同样表现优异。它不仅支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,还具备丰富的多模态交互能力。
商汤多模态大模型的图文感知能力达到全球领先水平,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得领先成绩。
可见,商汤日日新5.0在「文科能力」、「理科能力」以及多模态能力上的突出表现,为其更好地助力大模型场景落地打下了坚实的基础。它不仅在主观评测上全面达到或者超越了GPT-4 Turbo,更加可以在中文环境下助力更多本土企业积极拥抱大模型时代带来的红利。
因此,如果我们要寻找商汤日日新5.0跑出大模型落地的「逃逸速度」的内在逻辑的话,文理兼修的全面发展以及多模态交互的卓越表现,无疑是最值得我们去关注的一个重要方面。
云端边全栈布局,商汤打造大模型产品矩阵
随着AI时代的来临,特别是当中心化算力需求向端侧扩展以及企业级边侧AI需求的不断增加,只有实现云、端、边的高效协同,才能真正助力大模型的落地。
正是基于这样一种认知,商汤在业内首次推出「云、端、边」全栈大模型产品矩阵,其中包括应用于终端设备的「商汤端侧大模型」,以及面向金融、代码、医疗、政务等多个领域的边缘产品「商汤企业级大模型一体机」。
据悉,商汤日日新·端侧大语言模型的推理速度达到了业内最快,可在中端平台实现18.3字/s的平均生成速度,旗舰平台更是达到了78.3字/s。
扩散模型同样可在端侧实现业内最快的推理速度,端侧LDM-AI扩图技术在某主流平台上,推理速度小于1.5秒,比友商云端app快10倍,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。
值得一提的是,为了满足金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤正式推出企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。
得益于商汤在云、端、边的全栈布局,商汤可以让AI大模型在更多的企业落地,让每一个企业的需求都能够得到最大限度的满足。
正因如此,
在办公领域,商汤基于“日日新”大模型的卓越代码生成及工具调用能力,助力WPS 365打造更高效释放场景能力的办公新质生产力平台,为企业构建专属的“企业大脑”。
在金融领域,海通证券与商汤科技联合发布金融行业多模态全栈式大模型,双方在智能客服、合规风控、代码辅助、展业办公助手等领域助推业务落地,并共研智能投顾、舆情监控等行业前沿场景,打通证券行业大模型落地的全栈式能力。
在出行领域,基于商汤端云大模型解决方案,小米小爱同学为车主提供智能化交互体验。
可以预见的是,随着商汤日日新5.0的云、端、边全栈布局的不断深入,我们还将会看到更多的企业在商汤的助力之下实现AI应用的快速落地,不断地去拥抱AI时代来临的红利。
算力加持,商汤找到遵循「尺度定律」的路径
无论是日日新5.0的全面升级,亦或是商汤基于云端边的全栈布局,其实都离不开商汤打造的算力中心的加持与支撑。
正如商汤董事长兼CEO徐立所说的那样,商汤持续寻求最有数据配比并建立数据质量评价体系,推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。
在本次技术交流日最后环节,商汤科技董事长兼CEO徐立还带来了三段完全由大模型生成的视频,并强调文生视频平台对于人物、动作和场景的可控性。
商汤科技在文生视频平台方面也取得了技术突破,未来,通过输入一段文字或一个完整的描述,就可以生成一段视频,而且人物的服饰、发型、场景都可以根据预先设定,保持视频内容的连贯性和一致性。
不难看出,商汤的文生视频,已经在路上了。
可以说,商汤找到了遵循「尺度定律」的路径。
正是基于这样一个全新的路径,商汤才可以不断地实现日日新5.0的升级,才可以打造了云、端、边的全栈布局,才可以满足越来越多的企业对于AI的新需求。
因此,如果我们要寻找商汤跑出大模型落地的「逃逸速度」的内在原因的话,商汤智能算力中心在背后的强大加持,无疑是最值得我们去关注的另外一个重要方面。
结语
从日日新5.0的知识、数学、推理及代码能力,全面对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo,到业内首次实现云端边全栈布局,再到商汤对于合作伙伴的深度赋能,乃至是商汤对于AGI时代的全面拥抱,我们都可以看出,商汤着实跑出了大模型落地的「逃逸速度」。
当商汤日日新5.0的性能超越 GPT-4 Turbo,当商汤比 GPT-4 Turbo更懂中国的消费者和企业,商汤无疑可以在“尺度定律”路径逐渐清晰的时刻,实现一次弯道超车,助力AI在更多场景落地,真正实现算法、算力、数据、应用和场景的全面协同。
—完—
作者:孟永辉,资深撰稿人,专栏作家,行业观察家,知名KOL。