-
机器人灵巧手专家交流
蓝朋友 / 01月28日 11:10 发布
1、灵巧手行业发展背景 具身智能推动灵巧手发展:具身智能得到很大发展,众多制造业巨头积极拥抱,相关中心纷纷成立并改名,推动灵巧手行业发展。
马斯克对人形机器人的看法:马斯克认为人形机器人是未来最大产业,每年会卖出10亿台,其手部研发精力占整个工程量的一半。
开源具身项目的发展:开源具身项目中灵巧手的应用越来越多,假肢论文已饱和。
2、灵巧手公司产品特点 自由度优势:国内很多厂商的灵巧手为12个自由度,而公司最低档的L10有20个自由度(10个主动加10个被动),L20有20个主动自由度,L30为线性版,还有七轴机械臂式的假肢。
产品演示成果:在中关村仿生大赛获灵巧手第一名,演示了乐器演奏(弹钢琴、吹笛子的机器人协同演奏)、掌内盘球(泛化性好,成功率99%以上)、化妆(涉及长程任务规划和复杂用户体验)。
价格与耐用性优势:国内卖66度的灵巧手零售价三四万,公司的L20在海外卖15万,国内为推动科研发展只卖5万,耐用性提升十倍,价格削减20分之1。
研发规模与销售情况:公司有超过80人的研发团队研发灵巧手,算上组装装配人员超过100人;公司月销量最高,且年销售中有一半用户曾购买过别家产品,但因产品易坏而选择了该公司产品,公司提供一年内免费更换服务。
3、灵巧手研发难点与要求 研发难点:高自由度灵巧手在海外零售价格高于人形机器人,其在狭小空间内实现高自由度,需考虑发热量、体积、力量等因素,还需突破力矩密度,做到结实耐用。
灵巧手要求:高自由度、多传感器、能采集各种数据、在狭小空间内有高力量、结实耐用。
4、公司的目标与优势 目标:推动具身智能发展,做全球化公司;更好地服务客户,了解客户需求,降低成本;提高用户AI满意度,与合作伙伴共同承接项目。
优势:产品性价比极高,形成良好口碑,交付速度快,能快速满足用户需求。
5、数据采集与平台搭建 数据采集方案:公司支持多种数据采集方式,包括操作系统、VR、便携穿戴设备等,并建有智能数据化采集系统,可分配任务、标注采集数据并用于训练。
数据集与大模型:公司结合开源数据集和自身采集数据,搭建大型数据集;介绍了常见的巨型大模型,如大脑大模型、小脑大模型、世界模型、自身世界模型等,还提到了巨人想象等具体应用。
6、主要客户与落地场景 主要客户:包括清华北大剑桥、香港中文大学、香港大学等高校;实验室和整机厂商;产业化客户。
落地场景:养老场景,替代护工;精密制造场景,解决工厂夹爪不通用、难以实现柔性生产的问题,以及非遗文化(如苏绣)的传承;商超场景、生物实验场景、物流打包装配场景等。
7、定制化服务与公益性质 定制化服务:为青年科学家提供硬件定制和协同开发服务,满足其探索新触觉传感器和算法的需求,硬件达到软件快速迭代速度。
公益性质:带有公益性质,为推动具身智能发展和落地,提供硬件数据,连接科研机构和不同场景。
8、传动方案评价 三种传动方案:绳驱是仿生的,连杆在区域中间,齿轮传动偏直驱,效率高、控制容易、建模简单,但受限于体积、发热等因素。
公司方案选择:公司认为三种方案各有优缺点,都会坚持下去,以满足不同用户需求,投资赛道而非个体。
销售结构与客户偏好:国内用户90%指定要求连杆传动,海外三种传动方案都有需求,其中省去方案的比例可能较高。
国内外差异原因:海外做灵巧手科研较多,且想持续性收费,国内强调稳定性。但国内受特斯拉影响,也在考虑省去方案。
9、成本与触觉传感器 成本分布:电机占成本的百分之六七十,传感器占20%,量产前外部结构和外壳等占20%,关节模组占60%。
触觉传感器:电阻式和电容式触觉传感器都可以,电容式稳定性稍好但成本高。新的触觉方案对做图像识别的人友好,但成熟度不如传统触觉传感器,且目前零售价较高、耐用性不足。公司采用了视觉传感方案,标准版搭载的是自研的三维力传感器,但因产能不足,也使用了国内的他山传感器。
10、神经方案与高自由度大模型 神经方案:手术机器人多采用神经方案,通过加入稀有技术或耐用材料可解决绳子可靠性和数据可重复性问题。公司有神经产品,且测试显示误差很小。神经方案虽可靠性可行,但控制方式中间的换算可能产生误差,这可能是软件问题。
高自由度大模型:灵巧手大模型的机会即将出现,训练自由度与数据量有关,但对机器来说,向量中具体几项差别不大。实现日常操作需要解决高自由度问题,马斯克从第一性原理思考,人形机器人自由度不断提高。
Q&A Q:为什么灵巧手成为大家关注的热点? A:核心原因是具身智能得到很大发展。目前具身智能到了一个新的阶段,驱动着灵巧手的发展。许多制造业巨头如新成立相关中心,各地的人形机器人中心也纷纷将其与人形机器人并列,都体现了对具身智能的重视,进而带动了灵巧手受关注。 Q:公司做的灵巧手产品有哪些特点?自由度情况如何? A:公司认为灵巧手的本质是数据的映射。公司产品默认有20个自由度。最低档的L10有20个自由度(十个主动的再加十个被动的),L20是20个主动自由度,L30是线性版,还做了类似七轴机械臂的假肢,可360度任意方向旋转。 Q:公司灵巧手在中关村仿生大赛上演示了哪些项目? A:演示了三个项目。一是演奏乐器,实现了多个乐器同步演奏;二是掌内盘球,泛化性较好,对塑料球、木球、铁球等盘球成功率基本能达到99%以上;三是化妆,这涉及长程任务规划和精细操作以及复杂的用户体验。 Q:公司灵巧手产品的价格和耐用性情况如何?研发团队规模怎样? A:国内很多66度的灵巧手零售价大概三四万,公司的L10售价19999元,L20在海外卖15万,在国内为推动科研发展卖5万人民币。公司产品耐用性提升了十倍,价格是竞品的二十分之一。目前有超过80人的研发团队研发灵巧手,算上组装装配人员超过100人。 Q:公司从四月份量产后在客户方面有哪些情况? A:从四月份量产后有很多客户,公司做了很多数据采集能力的提升,让人类数据能同步到手上。目前月销量较高,公司之前年销售有二分之一的用户之前买过别家的手,最终选择了公司产品,因为别家的手大概率三个月内用坏,而公司能提供一年内免费更换。 Q:为什么高自由度灵巧手很难商业化? A:一是技术难度大,如要在狭小空间内实现高自由度,需考虑发热量、体积、力量等多方面,要突破力矩密度;二是对耐用性要求高,放在人形机器人上可能因机器人跌倒导致手损坏,在进行抓取操作时手指与桌面磕碰也需要手结实耐用,否则难以大规模推广使用。 Q:公司为什么能在短时间内获得较大成就、发展很多客户且交付快? A:最主要原因是产品性价比极高,还有之前形成了一些口碑,通过口碑转介绍,客户能够快速做出选择购买产品。 Q:公司在数据采集方面有哪些举措? A:公司搭建平台来共享数据和模型算法,推动特定领域发展。用户包括北京人行、成都人行等多地人行,他们都建了自己的数据采集场。公司不仅提供硬件,还提供数据采集平台,支持多种数据采集方式,如操作系统、VR、便携穿戴设备(手套、全身外骨骼)等,是支持采集方式最全的。还建立了智能的数据化采集系统,可分配任务,采集完的数据能做好标注用于未来训练。 Q:目前有哪些常见的巨型大模型及特点? A:常见的巨型大模型有大脑大模型、小脑大模型、世界模型、巨人想象。大脑大模型发展的是快慢系统相结合,可提高操作成功率,如之前无快慢系统时用L卡采集数据成功率仅百分之六七十,有类似O - 1慢思考反馈后成功率能提高;小脑大模型专注于操作,即物理执行方面;世界模型常用于导航,能将三维空间3D化;巨人想象是在执行任务前生成多个方案视频,加入人类反馈以得到较好结果。 Q:公司的灵巧操作模型与国内其他厂商有何不同? A:国内很多做灵巧操作或端到端学习训练的厂商目前几乎都用二指夹爪,人形机器人厂商演示人机交互时用灵巧手,但进行分拣、叠衣服等操作时就变回二指夹爪。而公司从成立之初,无论是硬件还是软件,核心都是为了映射人类的全部数据,主要用灵巧手做实际工作。 Q:公司的主要客户有哪些? A:主要客户有三类,一类是清华北大剑桥、香港中文大学、香港大学等高校;第二类是实验室和整机厂商;第三类是产业化客户。 Q:灵巧手有哪些落地场景? A:落地场景包括养老场景,加入灵巧手后养老机器人功能更完整,可替代护工;精密制造场景,能解决工厂复杂操作需求,避免众多定制夹爪的问题,实现智能制造升级;非遗文化传承场景,如苏绣等手工艺技巧可通过灵巧手学习;化妆场景;商超场景;生物实验场景;物流的打包装配场景等。 Q:公司针对科研机构和青年科学家提供哪些服务? A:提供定制化服务,包括硬件定制,能在两三周内完成,达到软件的快速迭代速度,还协同进行开发,为其提供大量数据,甚至提供模型让他们在模型上进行微调。 Q:公司在操作大模型和数据方面投入很多,目标和动机是什么? A:本质上有三个目标。一是推动通用智能的发展,公司80%的成果都可开源,这既是道德追求,也是为了实现全球化,让不同国家消除对模型和数据不透明的担忧。二是更好地服务客户,了解客户需求,更快接收用户需求并降低成本,使数据采集接口更友好。三是提高用户的AI满意度,与合作伙伴共同接项目,满足用户对成本和人工替代是否划算的考量,因为灵巧手的灵巧核心在于数据,手指是数据的映射。 Q:现有销量中,只要硬件的客户和既需要硬件也需要数据或模型的客户分别有多少?提供这些额外内容后,相比友商产品有哪些额外竞争力? A:用户分三类,大学等科研单位基本喜欢全套;做本体的厂商会参考公司方案以提升自身系统;制造业企业的需求目前还未很好满足。在AI方面取得了一些进展,未来半年内可能会有成果展现。 Q:公司从2024年4月量产至今,不同阶段的月出货量是怎样的级别?主要客户有哪些? A:早期量小,去年中国区灵巧手出货量不超过500台。早期主要客户是清北的教授等,工业客户较少。拐点在十月份,特斯拉发布22自由度灵巧手后,争议减少,同时公司对高速灵巧手的算法和模型有所提高,能提供满意效果,很多之前购买过其他公司易坏灵巧手的客户选择了我们。现在只要产能充足,有信心一个月卖出300台,且认为拐点很快会到来,因为可能出现自身领域的deep tech,马斯克也提到人形机器人产量目标在提升,智能化升级将带来灵巧手的大量应用。 Q:如何评价绳驱、连杆、齿轮这三种传动方案? A:这三种方案对技术要求的考验难度点不同。直驱(齿轮传动偏直驱)效率最高,控制和建模容易,但受限于体积、发热等因素,做出来的手可能大一点,主要考验电机关节的扭矩密度。连杆驱动处于中间。绳驱从仿生学角度最好,手小巧,但对整个系统的稳定性要求高,如几千万次拉伸后误差要控制在一定范围内。这三种方案都是可行的。公司会坚持这三种方案,因为要满足所有用户需求。 Q:目前公司客户中,这三种传动方案的销售结构如何,客户接受程度和偏好怎样? A:国内用户90%指定要求连杆传动方案,但最近也在考虑其他方案。海外市场三种方案都有,比例大概是40%、50% ,或者一种占40%,另外两种加起来占60%等多种情况。不同用户有不同需求,工业场景中臂较粗,手大一点无所谓;与人交互场景对与真手大小要求较严,可能会考虑不同方案。 Q:为什么海外和中国在传动方案的客户结构上有差异? A:海外在灵巧手科研方面较多,且想持续性收费,像直觉外科的达芬奇。而国内强调产品稳定性,希望能用很多年。不过最终两者会融合,现在特斯拉出来后,国内很多主流厂商都在考虑其他方案。 Q:如果产品卖5万块钱,各个关节、电机、减速器、传感器等成本是如何分布的? A:量产后,电机占成本的一半或百分之六七十,传感器占20%,外部结构和外壳等结构件占20%,关节模组占60%。 Q:业内电机价格情况如何? A:瑞士maxon的产品卖给业内价格大概是3000到7000。国内明智电器等主流有刷电机卖一千多到两千多,无刷电机贵一点,可能到五千多,且国内无刷方案成熟度相对低一些。如果是20自由度,用到20个推杆模组,国内平均每个推杆模组一两千。 Q:电阻和电容这两种触觉传感器哪种比较好,国内厂家性能优劣如何? A:电阻和电容的触觉传感器都可以。电容的稳定性稍好,成本稍高;电阻的非常成熟。传统的电阻、电容触觉传感器都比较成熟。新起来的触觉方案是前面有一层薄膜,按压薄膜时后面摄像头有图像,对之前做视觉图像的人友好,但成熟度不如传统触觉方案。 Q:为什么要在电机和丝杠之间再加一个减速器? A:加减速器主要是为了提升力矩。丝杠的减速倍数有限,比如常见的行星减速器,一级一般是5到9倍,二级一般是16倍,三级可以做到35到50倍;谐波减速器一级就能做到50倍 ,而丝杠的减速不一定有这么大,所以要再加一个减速器来达到比较大的力量。 Q:公司未来会采用触觉方案吗?国外有哪些企业会用这种方案?触觉方案的优点是什么? A:公司已经采用了触觉方案。国外有MIT实验室做的GelSight。触觉方案的优点是直接采集出来的就是图像,不是力。比如大拇指压在玻璃上产生的形变被摄像头捕捉,最终采集到的就是一堆图像。 Q:公司标准版的三维力传感器是国内的还是国外的? A:公司自己研发的有,但产能不足,现在用的是国内“他山之石”的他山的传感器。之前用过帕斯尼的传感器,其是点阵式的,反馈存在问题,相比之下他山的传感器做得更好。 Q:特斯拉后面会用触觉传感方案吗? A:从特斯拉上次演示及之前情况看,都没有用这方面方案。马斯克讲究低成本原理,更偏向简单方案,最终可能会偏向电子皮肤的方案。 Q:如何看待传感器的配置问题,包括是否配置、配置哪种传感器等? A:公司默认都会配置传感器,因为手是数据的映射,需要通过传感器采集数据。对于点阵式传感器,结合深度学习,通过点阵和位置可以做出方向判断。软体机器人未来随着AI玩具、定制化机器人的发展会有需求,预计2030年之前会爆发。 Q:触觉的面积是否还会一直扩大下去? A:是的。目前市面上很多是低速度的灵巧手,当进行越来越多掌内的操作时,自然要增大在掌内的触觉传感器的接触面积,比如人类拿笔、拿剪刀时都进行了掌内的位姿调整。 Q:目前神经方案的最大挑战是什么?网上提到神经的数据可重复性是很大问题,您怎么看? A:像绳子一致性不好、用着用着松了这类数据可重复性问题,个人认为通过加入特种金属或使用耐用材料等方式已经解决。所有手术机器人都是神经的,在实时可控操作时也需考虑鲁棒性,加入稀有技术或耐用材料可解决相关问题。 Q:贵司是否有神经产品?是二十多自由度的吗? A:有神经产品,是二十多自由度的。 Q:贵司二十多自由度的神经产品,输入一样的编码或控制角度,能达到多少角度精度?多次实验后的标准差分布是多少? A:应该误差很小。实际测试至少五百万甚至2000万次之后,误差要低于0.1毫米。 Q:神经方案是目前最好的方案吗? A:不能简单认为神经方案就是最好的方案。神经方案可靠性可以,但在控制时需要进行换算,若换算问题处理不好,可能产生误差,而且不一定是硬件问题,也可能是软件问题。 Q:欧美主流使用神经方案的厂商除了特斯拉,还有哪两家? A:还有一家是被OpenAI投资的One X,另一家是。 Q:目前行业内出现的低自由度模型与20自由度之间差距较大,这个差距能很快填补吗? A:对机器来说,自由度数量的影响不大,无论多少自由度都是一个向量。虽然从一个自由度增加到20个自由度,训练的数据量会大幅增加,但这一块虽有难度,但仍有可能突破。像特斯拉机器人从六自由度到12个自由度,再到22个自由度,进展较快,马斯克从第一性原理、终局去思考这个问题,一直比较乐观。 Q:您对灵巧手达到不同自由度水平的时间线有怎样的预期? A:个人认为会有所突破,但具体时间线较难确定。机器对自由度数量不敏感,二指夹爪虽然自由度低但在某些场景有优势。国外从底层原理出发解决问题,进展较快,比如特斯拉机器人自由度提升迅速。 Q:公司的传感器是自研还是外采?技术方案有哪些? A:公司传感器有自研也有外采。技术方案包括传统的电阻式压阻阵列、电容式的三维力传感器、型摄像头的指端触觉传感器,还有整块电子皮肤都在尝试。 Q:目前世界上比较主流的用于传感器的材料有哪些? A:有特殊金属的丝,在耐用性上表现较好,测试报告能达到千万次,测试误差很小。 Q:公司对超高分子聚乙烯、PBO纤维等高分子材料有实际尝试吗? A:公司目前有尝试,但测试周期可能较长,一两个月后能有更清晰的回答。目前处于测试初期,表现还不错。股市调研