-
豆包”赋能硬件,“模”力相伴
A股计划 / 01月24日 08:34 发布
2025年1月22日,火山引擎视频云RTC联合乐鑫、移远等厂商,推出「实时对话式AI嵌入式硬件」解决方案,致力于让用户拥有流畅、自然、真实的AI互动。
本文观点选自网络,仅供参考。一、“万物皆可AI”的当下,初涉大模型和硬件结合的厂商,在将AI实时语音功能与硬件结合时遇到多种挑战:
技术复杂变化快,研发成本高;
3-5s的反馈,响应延迟优化棘手;
交流像用“对讲机”,交互体验有待提升。二、该方案的AI语音交互框架可让硬件设备无缝对接火山引擎RTC的实时通信能力和云端智能体服务,实现与豆包大模型超低时延、流畅的交互:
在端侧,芯片集成自动唤醒功能和音频3A等技术,以提升音频输入的清晰度。同时,火山引擎RTC提供音视频传输,确保设备在网络不佳的情况下也能稳定通话。
在云端,智能体服务则可提供Functioncalling和知识库支持,让硬件具备个性化服务和智能决策,满足用户的深层次需求。三、方案接入流程简单:更新硬件固件-开通火山服务-跑通联合方案-调用智能体
目前方案已开源,仅一天内即可完成集成跑通。四、此外,字节还于今日发布了豆包大模型
1.5Pro版本,新模型综合能力显著增强,低训练/推理成本,高效模型结构,全面提升多模态能力、推理能力,多项公开评测基准上全球领先。
Doubao-1.5-pro现已在豆包APP灰度上线,同时,开发者也可在火山引擎直接调用API。
目前「实时对话式AI嵌入式硬件」方案已成功应用于IP玩具、AI机器人、智能家电等诸多硬件,逐步强化终端智能化的共识。我们认为,字节模型+合作伙伴的终端产品落地将成为2025年AI端侧行业的主要叙事,建议持续关注相关标的:
一、从投资逻辑上来看,字节AI硬件方案的推出将加速终端智能化,直接利好品牌商及背后的方案商、代工厂。
方案商:移远通信、广和通、美格智能
代工厂:天键股份、国光电器、歌尔股份、佳禾智能
二、分析硬件供应链组成,目前端侧的运算依旧依赖云端,因此WiFi、蓝牙等连接能力是重中之重;此外,视觉能力将是后续端侧多模态提升的关键,视频处理相关的ISP能力有望发挥至关重要的作用。
SOC芯片:乐鑫科技、恒玄科技、瑞芯微、星宸科技、润欣科技、富瀚微、中科蓝讯、全志科技、泰凌微