-
专家交流:低训练成本对算力的影响?竞争格局与梯队评估
kuru / 01月29日 18:19 发布
低训练成本对算力的影响?国产大模型厂商竞争格局与梯队评估, 大厂模型商业化路线, 25年应用展望
要点
- 国内大模型竞争格局,其实豆包调用量一直在环比往上,能否评价下现在整体大模型,国内结构是什么?例如第一梯队、第二梯队是哪些?
- 今年下半年,个人观察到模型加速商品化、模型价格战,当时访谈豆包,他们价格已经杀到基本上不赚钱、文本模型亏钱的程度。您刚刚提到,第一、第二、第三梯队,内容、数据有差异化,但从最终用户使用角度而言,是否有很大的区别?另外2025年,大模型价格战在今年会以什么方式展开?Deepseek V3入局后,是否加速模型竞争?是否对于市场价格有很大压力?
- 您刚提到,To B部署里,可能模型调用没有很贵,但相关数据库或PaaS层服务,会以较高价格捆绑,但例Deepseek发布后,它作为开源模型,您说的这些数据库管理方法、相关软件栈,它也有开源solution。对于一些企业,是否降低了他们从模型到部署过程中的自建门槛?它可以基于开源参数、finetune自己模型、部署在自己环境里。当然可能会做云计算的算力,但是否把大厂能做的事扁平化,大厂相对而言做的事更少?
- To C场景还有什么变现手段?策略是什么?如果不靠模型盈利,To C市场会有哪些?
- 贵司相关的打法或策略是什么?
- 展望下AI如何赋能百度、腾讯等其他公司?
- 关于模型,对于DeepSeek V3这种工作,以后对于算力需求影响如何看待?有观点认为其显著下降算力需求,因为成本降低,所以可能对未来算力消耗量下降。第二种观点,认为其降低行业门槛、成本后,其他可以自己训练模型的玩家数量会增加,且推理市场打开后,可能对算力需求量上升,您如何看待这两种观点的矛盾,您更相信哪一个?
- 展望2025年,在大模型领域或应用层,应该主要关注哪些内容?
以下是专家观点:
Patrick:国内大模型竞争格局,其实豆包调用量一直在环比往上,能否评价下现在整体大模型,国内结构是什么?例如第一梯队、第二梯队是哪些?
专家:个人认为,这个赛道里,第一梯队是这样:先从总量上,一是百度、字节、腾讯、本公司,还有独角兽头部,如Kimi、智谱、百川。第一梯队有几个特点;第一,模型能力还行,第二是用户量、商业化已经走到相对一个阶段。另外Deepseek也算第一梯队,V3出来之前,可能是第二梯队靠后一点位置,V3出来后,暂时可以放在前七名里,这里主要拼模型能力。第二梯队是独角兽里面后面几家,如MiniMax、零一万物等,包括老牌互联网如360、讯飞、商汤等。第三梯队,大概10到15名之间,如刚兴起的一些新玩家,如天工AI、Scale AI。第一梯队几个特点:数据量、算力、模型能力比较先进,后续在第一梯队里面排名往上提升的,可能如字节,字节模型能力其实一般,虽然用户量很大,但模型不是排第1~2名,而是靠后一点,腾讯模型能力也一般,为什么放在第一梯队?因为他们现在重投入,在数据层面他们较高的壁垒。百度、腾讯和字节,背后都有很强的数据,这些数据有几个特点,例如字节的数据,头条、新闻、抖音,都是自有生态数据,外部获取不了。这些厂家,依托于自己强大的数据壁垒,再加上不断追赶的模型能力。字节虽然模型一般,但模型都已经比较全,文本、音频、视觉都有,再隔一两个季度,基本上要看齐更头部模型能力,所以个人认为,字节可能会往上排,基于其用户量多,数据量价值凸显。本公司模型能力较强、技术上较强,但是弱项是数据没有腾讯、百度、字节这么多,因为公司不是内容大厂,它是做电商、生态的,所以未来可能在头部里面排名第3~4,数据可能在短期之内无法追赶,只能依托于自己被投企业的数据,包括CSDN、知乎、微博等传统互联网数据,现在好的数据都藏在APP里,并非web端的,也爬不到。所以头部客户里,会出现以大厂核心玩家占据整个市场,其他家往后排。包括创业公司,智谱、Kimi,虽然模型有段时间领先,但后续他们可能往后排,因为大家模型越来越接近,后续拼算力、拼数据的情况下,他们可能会相对弱一点,对他们而言,可能接下来要去找细分赛道,做出他们的特点,不要和大厂PK主场景,可能才会有生还机会。
Patrick:今年下半年,个人观察到模型加速商品化、模型价格战,当时访谈豆包,他们价格已经杀到基本上不赚钱、文本模型亏钱的程度。您刚刚提到,第一、第二、第三梯队,内容、数据有差异化,但从最终用户使用角度而言,是否有很大的区别?另外2025年,大模型价格战在今年会以什么方式展开?Deepseek V3入局后,是否加速模型竞争?是否对于市场价格有很大压力?
专家:在模型赛道里,12月31号时,本公司已经首先表态,把上一代视觉推理模型两个版本都是降价:一个是50%+,一个是80%+。降价比例较大,从价格角度,大厂可能会持续往这条路走,一方面迫于竞争压力,一方面本身有成本优化方式来使成本降低。所以整个市场上,不要看单独靠模型盈利多少。模型调用方面,无论是十亿还是数十亿、万亿级token,未来只是收入之一,整体还是希望通过低价牵引行业快速商业化。在最近第四季度,虽然公司B端用户量从十几万涨至三十几万,但模型调用次数还没有这么高,基于现在模型还不够好、生成速度慢、生成质量不高,另外价格也是一部分原因,所以未来通过低价方式,一是应对竞争,二是把B端客户迅速融入自家生态、快速业务上线、推送到B端或者C端客户手上用起来,只有用起来后,大厂未来才有可能赚到钱。基于大厂盈利逻辑不靠模型,其盈利是:第一,如果是B端,要做捆绑式销售,模型本身成本较低,但客户用时要选很多其他东西、周边产品,例如数据库、算力、插件,搜索、BI、PaaS、SaaS等,这些依然保持较高利润率,通过低利润模型调用加上高利润率产品绑在一起,把利润率做起来,这是大厂的策略。Deepseek产品比较单一,毕竟只是一个模型,虽然降价,再和大厂PK时,没有产品矩阵概念,在竞争上无法去和大厂去正面竞争。对于这些公司,未来除了模型以外,还需要产品化的东西。今年,大家视野要稍微开阔一点。第一,不要盯着模型本身盈利或价格,而是要看这个方向有没有衍生出更多应用。只有应用落地,被广泛B端、C端用起来后,整个市场才真正活跃起来,否则模型只能停留在自己平台上自用,没有生态在赋能,或还没迁移过来,这样量起不来,商业化也会受阻。另外竞争格局层面,未来,Deepseek技术毕竟还是一个文本模型,随着技术发展,可以加速文本模型和海外的差距,甚至局部超过,这种技术是可行的,但是这种技术别指望可以复制到其他模态,如音频、图像、视频等都是新模型架构,不是纯transformer,它是diffusion transformer或其他架构。大家也在研究哪些可以沿用到其他模型。如果只是停留在文本模型,对于往后发展的多模态模型,没有构成特别的算力需求降低等方式,而是把文本模型加速应用创新和落地。
Patrick:您刚提到,To B部署里,可能模型调用没有很贵,但相关数据库或PaaS层服务,会以较高价格捆绑,但例如Deepseek发布后,它作为开源模型,您说的这些数据库管理方法、相关软件栈,它也有开源solution。对于一些企业,是否降低了他们从模型到部署过程中的自建门槛?它可以基于开源参数、finetune自己模型、部署在自己环境里。当然可能会做云计算的算力,但是否把大厂能做的事扁平化,大厂相对而言做的事更少?
专家:可能性是有的。Deepseek释放出来的内容,行业这些玩家能否用起来?如果要私有化部署,技术上是可行的。他完全可以去买一套一体机,如10台、20台来本地部署。对云方面,个人认为,云在整个生态大头,基于特殊行业会做一些私有化部署,而大部分行业是上云。例如生物医药、生命科学或金融,这些赛道较喜欢私有化部署,其他赛道,如互联网、汽车、教育,大部分还是公有云,因为公有云成本低、算力扩展更弹性,在这个赛道里,会有一些玩家喜欢私有化部署,但主流还是上云。
Patrick:To C场景还有什么变现手段?策略是什么?如果不靠模型盈利,To C市场会有哪些?
专家:关于字节,整个生态围绕内容、视频、文字这些信息,是内容搬运工,内容找人的商业策模式,叠加电商、广告,背后逻辑都围绕信息,只是信息是商品、视频还是文字。背后核心逻辑还是通过信息传达、精准匹配,实现广告匹配,从这方面收费。所以其发展方向,是在面向内容创作赋能UGC。不管是豆包,还是豆包下面其他产品矩阵,核心逻辑有几点,第一,赋能生态创作者,用工具完善创作。创作过程中,衍生出收费模式,例如基础版,每天做低分辨率480p的20个版本。超过部分收费,这是第一种方式,即按量、AIGC、UGC生成次数来收费,基于接下来在社交平台会出现一些AI生成东西,背后要有一套工具,有对应的收费模式。第二种,在电商导流部分,字节为什么要做豆包?其认为下一代AI驱动应用里,电商流量会发生转移,从过去TikTok、抖音上找产品,变成从豆包入口找产品。这就为何其打通整个字节的数据,主要是基于奔着流量迁移。它已经感知到字节可能被新应用颠覆,还不如自己做颠覆自己的产品出来。所以其下一个商业模式,是从AI搜索当作入口,问信息、搜索信息,并连带广告模式。现在以文本为主,而下一步可能用多模态搜索,多模态搜索可以穿插小广告来变现。第三种,硬件是应用的扩展,目前的硬件不是前几年老技术做的AI硬件,现在都是生成式、个性化,可以做出全新体验,这种体验是应用延展,从APP延展到耳机或其他自硬件,背后可以和智能体对话,也会长出商业模式:第一,可以买硬件,从硬件上赚钱,第二可以买套餐,例如喜欢某个数字网红的智能体,给他充值、送卡,可以出很多玩法,用户上瘾。用现在技术和智能体聊天,智能体会很懂你,和他越深入,他会越来越懂你,会上瘾,而上瘾就要付钱,这是一种模式。这是字节打法。
Patrick:贵司相关的打法或策略是什么?
专家:本公司,本身目前核心策略还是守住基本盘,用新技术赋能电商,主要用技术提效降本,给商家赋能。商家多卖货,GMV上升后,公司从商家收到的钱就多,这是本公司核心逻辑。第二个核心逻辑,是用这种技术把公司云拉升起来。公司的云业务,在IaaS时代,是整个云算市场number one,全球第三,国内第一,而面向未来,云计算市场要发生技术迁移。所以公司要引领市场。其商业化是把AI赋能后所有产品重构。公司现在50~60%产品,大部分都已经完成重构,有些正在重构、优化中。已经上线产品,如智能客服、导购、内容审核、BI、大数据、Maxcomputer等,很多背后技术已经发生重构。因此,公司要用AI重构产品、卖出新价值,用新产品来服务客户,为客户创造价值,客户买单,这是商业化逻辑。后续,公司会做很多C端产品,AI驱动硬件。过去硬件是补贴式销售,而现在硬件本身就要产生价值,不再补贴。例如最近10月份推出的闺蜜机,贵的要5000多,便宜的要2700多。毛利率很高。叠加硬件背后的OS,也是AI驱动的。例如闺蜜机有很大的屏,可以买东西,也可以投广告。所以硬件单独是一条线。另外C端方面,如夸克现在变现方式包括:第一,里面有免费的教育,但高级功能也要付费,它可以解决大部分功能,但如果要找专线人来指引也要付费。另外包括健康教育、健康问答等,基础的问答可以回答,但高阶问答、连真人背后的医生,是需要有分成。AI搜索,如果提供基础事件,他可以解答,但如果有些知识点要找老师给来讲课,他可以卖课,而卖课也有分成。所以这些互联网玩法,有了流量以后,会衍生出很多变现方式。以上只是目前能够看到,还有很多未来新玩法,随着这些产品上线会诞生出来。
Patrick:展望下AI如何赋能百度、腾讯等其他公司?
专家:百度本身是为了搜索,现在也要自我颠覆,只是百度决心还没这么强,它单独做了文小言,其实就是新一代搜索,现在上线是4.0的收费、每个月59块,用AI加百度搜索来提供服务。所以百度这种公司,未来搜索本身要进行重构,只是现在AI搜索不盈利,还是靠传统网页版搜索来广告和导流。现在还没有订阅费之外新收费方式出来。其他公司,有产品矩阵,围绕着赋能生产力提升,包括视频编辑、新推出的秒答等,这些是基础功能加高级功能收费的商业模式。腾讯,本身是做C端社交媒体,所以腾讯因为现在还没有完全像字节这么猛,产品相对较少,主要元宝。元宝是做AI搜索定位。AI搜索,个人认为,可能还是持续走免费路线。未来可能在AI搜索里,做高级功能订阅或广告导流方式,其本身不太会走低端付费方式。
Patrick:关于模型,对于DeepSeek V3这种工作,以后对于算力需求影响如何看待?有观点认为其显著下降算力需求,因为成本降低,所以可能对未来算力消耗量下降。第二种观点,认为其降低行业门槛、成本后,其他可以自己训练模型的玩家数量会增加,且推理市场打开后,可能对算力需求量上升,您如何看待这两种观点的矛盾,您更相信哪一个?
专家:个人观点倾向第二种。第一种视野窄了一些,DeepSeek现在是文本模型,随着模型分类及未来发展,一定奔着多模态走,当下技术并不会复制到更先进的模型架构,所以它偏向于文本模型创新。在短期内看似乎是对训练算力需求下降,但从大盘上看,模型训练玩家就少,就这么十几家,影响算力需求主场景还是随着应用推广、上线后,能够获取海量C端、B端客户的拉升的算例需求。个人观点,第一,DeepSeek的创新的确能够降低算力成本,好处是加速自有大语言模型技术迭代,基于DeepSeek开源,在上面衍生出各种细分版本出来,在未来一两个季度可能会有DeepSeek V3 - ,这个“-”是后续迭代出来的新版本,这可能会发生,这迭代本身就拉起算力需求,大家可能会租云去做深度后训练或微调,所以加速自身技术迭代,缩短和海外大模型差距,降低了普通大众门槛。另外,由于模型本身迭代加速,应用也会加速。因为AI应用特点,基于通用模型去做应用做不出太多特色,这个功能可能大厂已经做过,如果能在较好模型上做出需要的那种应用,一定是专属模型,所以“one product one model”,应用背后需要专门模型来支撑,例如MiniMax有自己的音频文本模型,所以才能做出新意,如果调用 OpenAI的模型或其他公版模型,做不出那个能力。例如,MiniMax虚拟社交里有个重要的功能是个性化对话,其特点是每个角色发音、声色、语气、性格不一样,因此需要可以调模型的敏感度,例如哪些话能说、哪些不能说等,这些可以基于开源模型设置、调整,才能做出较好产品体验。由于模型门槛降低,加速应用创新,进而自然拉升算力需求。最后,随着大模型门槛降低,会加速基于文本模型驱动的应用创新,从而驱动算力加速,另外多模态里,这些技术无法复制,至少现在还没有办法复制,传统等视觉模型还是需要强大的算力支撑。
Patrick:展望2025年,在大模型领域或应用层,应该主要关注哪些内容?
专家:应用层,在过去一年里,已经跑通三个核心场景。第一个核心场景是AI搜索。已经广泛影响普通人获取信息方式。当习惯用了AI搜索时,基本就不用百度或Google搜索。最好的是海外Perplety AI,国产的如秘塔AI、360的纳米搜索等,这些应用渗透越来越高。目前主要渗透在技术研究、学生人群,后续也会往普通人群迁移。在移动互联网时代有10亿用户,而现在AI搜索用户大概是六七千万, 滲透率还是处于早期, 还有20倍上升空间,所以Al搜索是第一个赛道, 要去关注,而且可以跑出商业模式。第二是反复强调的Al教育. 该市场上玩家没那么多 字节本来做了一个高斯, 但是是海外版, 国产例如精准学, 也开始在慢慢往这方向迁移,有些做成学习pad, 有些做成app, 例如Echo英语口语.目前A可以做打断式学习和指导, 不是以前简单把视频放一下, 用户跟着学和看. 而现在可以将一个知识点反复问它, 直到听懂为止,是交互式教学。第三是虚拟社交. 已经被验证出能走出商业模式。要看用户体验, 所以虚拟社交也是第三个要去关注的赛道。第四个 赛道, 硬件赛道里很多产品会出现。会重构,基于硬件和之前逻辑发生重大变化, 变化有几个特点: 第一,端侧模型变得越来越小, 进而可以去植入到端侧来帮助提升软体验, 所以会产出AI伴侣。例如以前的娃娃机,甚至高端一点的给成人的产品, 例如可以做大一点,你可以和它聊天, 情感陪伴. 这个产品有人在做, 且公司已经拿到较不错的融资。另外是机器人, 有些是玩具式机器人, 例如把它做成擎天柱, 用语音控制, 做复杂动作, 会编程可以做一些很多玩法。核心点是在生成式人工智能驱动的趋势下, 很多A|硬件都可以值得再做, 类似吴晓波在年会上说过,创新用户体验. 为企业挖掘用户需求 创造市场提供新方向, 所以AI硬件需要关注。这个赛道里, 一是大品类例如PC, 手机 中小品类, 一是玩具AI眼镜。为什么Al眼镜在这个赛道上可以再做? 以前Al眼镜有几个重要特点: 以前A|较傻. 较重, 较贵。现在如海外Meta已经推出自己的眼镜, 贵的才1000多美金, 国产版,例如雷鸟, 只要一两干。这种产品是第四代可穿戴设备, 第一代是普通蓝牙耳机, 第二代是智能手表,第三代是双耳耳机, 第四代是A|功能智能眼镜, 这种眼镜只有49克, 很轻,可以续航六个小时以上,最重要是可以有两种配置,种带摄像头, 一种不带摄像头。带摄像头的产品, 连接到视觉理解模型, 例如看图书馆、博物馆, 观察艺术品,游客不知道它是什么, AI可以把看到画面解读, 这是全新体验。另外是和人聊天, 如果他说语或法文, 用户听不懂, 可以让Al翻译, 实时对话 另外包括需要用到蓝牙耳机的产品, 都可以同步复制过来,所以这是一种新品类, 通过Al加持带来新体验、需求。纪要私享圈