-
人形机器人产业链发展现状及未来应用前景
A股计划 / 今天08:23 发布
1、机器人技术解析
硬件优化:为实现高性能动作及马拉松长跑,对硬件进行加强,如强化大腿电机和连杆连接件法兰盘,将脚踝电机扭矩从36牛米提升到70牛米,加定位销解决螺丝断裂问题,还给机器人穿鞋缓冲。同时,将最重部件置于胯部,集中重心,减少脚踝冲击。 软件算法:从去年起强化学习能力达到较高水平,跑步调试仅用一周。采用模仿学习算法AMP,通过判别器给予策略网络风格奖励,让机器人学习拟人步态。室内外奔跑采用同一算法策略,可适应多种地形。 导航方式:因准备时间短,比赛采用控制器方式而非UWB模式。公司未来计划在to C产品中尝试UWB,其可助力破风提高速度。公司已研发出室内强化学习避障导航,但因传感器限制,室外避障导航尚不成熟,预计未来两三年可解决。 电池方案:比赛采用不断电换电方式,用外置备用电池持续供电。认为清华团队内置两块电池的方案较好,值得学习。对于半固态和固态电池的应用不太清楚。 散热设计:电机工作温度正常,未造成困扰。机身内部通过设计合理风道并加风冷(风扇)的方式散热,认为在当前散热方案能解决问题的情况下,无需上新设备增加耗电。 2、数据相关
数据获取:Locomotion任务无需真实数据,在仿真数据上做深度强化学习即可。Manipulation任务真实数据获取成本低,通过与高校合作,利用学生志愿小时数无偿采集,一年可达上千万小时数据量,后续计划以数据售卖分成形式与学校合作。 采集方式:采用类似UMI的末端采集设备,认为其复用性高、采集快。不看好仿真和遥操作方式,仿真物理引擎无法模拟真实柔性接触,遥操作存在无法复用、采集视角及商业化困难等问题。 数据方向:上肢操作数据认为纯真实数据较好,但目前采集设备应采集哪些数据学术界未统一,待统一后数据采集难度或降低。 3、产品规划与布局
家庭服务机器人:未来将推出聚焦家庭服务场景的机器人,认为家庭场景泛化性大,适合具有身体的AI。目前该机器人应用于上肢操作算法研究,中长期除机器人外,还会推出数据采集设备,如夹爪、手套采集设备。灵巧手初步定采用连杆方案,使用空心杯电机,现阶段注重性能,量产价格有望降低。 仿生人脸机器人:人形仿生人脸机器人有32个自由度,是全球自由度最高的仿生人脸,采用自研达摩系统,输出舵机关节角度,减少恐怖效应。应用场景主要在文旅展示展览,可代替数字人角色,年底将推出带全身的全尺寸带人头机器人,还可提供半身或全身可移动导览机器人。 4、行业发展与公司策略
行业路径:认为英伟达专注机器人平台壁垒高,从硬件端切入做机器人需了解本体才能做好算法,最终软硬件一体是趋势,只是切入方式不同。 应用场景:不看好人形机器人在工业场景应用,认为工厂适合专机,人形机器人最终目标应在家庭场景。中期可能会推出非人形产品做locomotion商业化。 能力提升:认为人形机器人需提升算法能力和鲁棒性,当前硬件头部几家达合格水平,后续软件端突破更关键,软件提升后会对硬件提出更高要求。同时需加强人机交互、任务规划、感知决策等能力。 公司优势:创始人懂强化学习及硬件,技术团队多为95后。人形机器人R系列支持二次开发,五一前起步售价3.99万,相比宇树G1价格优势明显。 公司目标:今年目标现金流转正,对人形、仿生人脸及上肢夹爪采集数据等布局追求极致轻量化、尽快盈利,注重产品实际落地与商业化。 Q&A Q:公司在人形机器人电池续航方面采用的具体换电方式是什么,未来半固态或固态电池方案的发展趋势如何?
A:目前公司采用不断电换电的方式,用一块外置备用电池持续供电,取下旧电池后换上新电池。清华团队内置两块电池的换电形式较好,值得学习。关于未来半固态或固态电池方案的发展趋势,不太清楚。
Q:公司在人形机器人散热方面的方案是怎样的?
A:公司电机工作温度在测试三十多度天气时大概到50度,电机最大能工作的温度大概是75度,目前电机热量未造成困扰。对于机身内部包括上位机、看板、电源板等地方的散热,公司首先设计了合理的风道,其次加了一些风冷(风扇),让空气流畅运行以起到降温作用。
Q:做汽车电池管理电子方案的公司切入机器人电池方案使用的可能性如何?
A:只要不使用电源就有可能性。目前21公里极限奔跑情况下,内部风道能解决散热问题,考虑到人形机器人电池电量少,上新设备可能更耗电,所以应更多从电能方向考虑,而非散热方向。
Q:目前松延动力的实际数据量有多少,真实数据和仿真数据的比例是多少,真实数据目前的获取成本是多少钱一条?
A:在机器人方向,如跑步、走路等locomotion任务不需要真实数据,在仿真数据做深度强化学习,训练不到一天时间就可在真机上部署使用;而抓取等manipulation操作类任务需要获取真实数据。公司真实数据获取成本目前并不高,公司正在和高校(包括三本、大专高校)谈合作,学生用志愿小时数无偿帮忙采集数据,一年体量会有上千万小时,后续会讨论以数据售卖的比例分成给学校。
Q:未来推出的家用机器人会在哪些领域带来惊喜,产品端中长期的布局和规划是怎样的,是否主要专攻家庭服务场景?
A:公司认为自身具有身体的AI最适合泛化性大的家庭场景,而非工厂场景。未来数据量收集足够、算法研制出来后,该机器人可作为家庭服务场景的机器人售卖。目前这款机器人主要应用于上肢操作的算法研究。中长期公司不光会推出机器人,还会出相应的机器人数据采集设备,如夹爪采集设备、手套采集设备,与机器人灵巧手和电机板夹爪配套。目前家庭服务场景机器人款式是一款,但手套和夹爪可应用于任何机器人。
Q:公司灵巧手是自研方案还是采购第三方方案,采用的是腱传方案还是连杆方案?
A:公司先做好相对应的一比一采集手套,以便采集和灵巧手可一比一复用的数据。目前初步定使用连杆方案,不采用现成方案,因为现成方案运行多次后会出现磨损不准的情况,不是可持续性方案,而电机可越做越小,可采用电机直驱式驱动方案。
Q:公司驱动方案用到的电机是无刷电机还是空心杯电机,选择空心杯电机是注重其性能吗?
A:使用空心杯电机。现阶段不考虑成本,主要考虑能做成什么事,批量生产后空心杯电机价格也会降下来。
Q:在运控方面,如果将技术应用到家庭场景,还有哪些领域需要攻克?
A:家庭场景下,除了简单的走路跑步,还需要上下肢协调,即全身协调(whole body manipulation)。只有在操作(manipulation)研究很详细之后,全身协调才会有更多的研究。
Q:参加比赛的人形机器人在电机磁材方面是否用到高性能的钕铁硼磁铁?电机的供应商是哪家?对电机供应商在性能上有哪些要求?
A:目前电机是外采的,前三名用的都是英克斯的顶级电机。后续会做自研电机。对电机供应商性能有要求,会对电机的减速器做修改,因为最初机器人单腿跳时电机容易因减速器材质硬度不够而卡死。大部分人最初用36牛米的电机作为下肢电机,为了做翻的动作,对厂商提出更高扭矩爆发输出的要求,后续关节电机都用了70牛米的关节电机。
Q:在硬件方面,除了电机外采,还有哪些零部件是自研和外采的?
A:所有的结构都是自研设计的。深度相机目前大家统一用的是RealSense D435,IMU目前使用原生的IMU和串行IMU两款。
Q:为什么选择做小尺寸的机器人?
A:机器人应用目前主要是科研教育和未来应用场景。在科研教育方面,一米二机型比1.8米机型更便于一个人调试。从未来应用场景趋势看,之前1.8米的机器人都在往1.3 - 1.4米方向发展,后续会推出一款E1机器人,做到一米四左右,能很好地完成桌面的整理和操作任务。
Q:从技术上看,大尺寸和小尺寸机器人的难点分别在哪里?
A:难点区别不大,可能大尺寸机器人需要更大的电机,小尺寸机器人不需要那么大的电机,对于算法来说没有太大区别。
Q:如何看待比赛中小巨人机器人冒烟的情况?
A:小巨人那种几十厘米的机器人可称之为玩具,和一米以上的机器人有区别。一米多的机器人使用的电机和之前1.6米那款机器人的电机类似,甚至修改后脚踝关节更大。而几十厘米的机器人可能使用玩具级的小舵机,完全不能对比。
Q:如何对待比赛中的通信干扰问题?
A:目前使用自研的遥控器,采用信号较强的2.4G蓝牙,测试和比赛时都未受到很大干扰。如果觉得平常信号不够,也可以用5.8G的wifi信号做遥控器。可以随时调整信号强度来屏蔽外界信号干扰,这不是一个太难的问题,很早之前就有相同的解决方案。
Q:公司在短时间内调试好参赛机器人步态的具体方案和优势是什么?与室内行走、奔跑相比,产品优势体现在哪里?
A:首先,室内室外行走对公司产品没有区别,公司算法可在多地形使用,同一策略适用于上坡、下坡、有坑洼、有井盖、桥、凹凸不平地面、沙地、雪地以及室内瓷砖、地毯等不同地形。其次,公司使用的是模仿学习算法AMP,即对抗类的模仿学习(GAN类),会给机器人重建人类数据并下到机器人身上,判别器会根据机器人表现给予策略网络风格奖励,像专家数据风格就给高奖励,不像则给惩罚,使其学到拟人步态。而且公司从0到1的路已跑通,之前的N1就已完成过这样的算法。
Q:能再具体分享一下公司的算法吗?
A:目前DeepMind网上都用强化学习算法,但拟人形态如跳舞、行走、跑步、后空翻等很难用之前的规则奖励定义。公司目前采用用人的数据重新上到机器人后进行模仿学习的方式。走路、跑步等动作适合用对抗学习方式学风格;前空翻、后空翻、跳舞等一段结束的motion,用每一帧强化学习,跟上专业数据并给稳定性奖励更合适。目前能做这些的大概有宇树、公司重载和一个外包商,其他公司没看到有类似能力。
Q:公司如何看待当前本体厂商小脑(运动控制能力)和大脑(大模型能力)能力不同的情况,未来发展趋势如何?
A:小脑比较强的公司目前逐渐收敛到几家,这些公司的问题是如何把运动运控能力应用到to c端或场景端,找到合适的商业场景,且local motion的落地场景不局限在人形,可能是四足或双足。而操作类任务(大脑能力)目前学术界都没有收敛,大家首要做的是数据采集。
Q:公司目前主要的数据收集方式是什么,如何看待遥操作和仿真这两种主流方式?
A:公司目前用类似于斯坦福宋书航组论文UMI(universal manipulation interface)的方式,制作末端采集设备,如夹爪、手套等,收集的数据可应用于不同自由度的机械臂。仿真方式最大的问题是其物理引擎达不到真实世界物理要求,只能模仿点接触,模仿不了柔性接触,很难做出可迁移到真实世界的算法,目前业界和学术界都不太看好。遥操作有VR遥操作和ALOHA两种,存在几个问题:一是无法复用,采集的关节角数据只能用于特定机械臂;二是以第三视角采集数据,与末端采集设备的第一视角采集相比,采集难度和速度差别大;三是需要带真实机械臂或机器人到环境中采集数据,商业化较难,所以公司采用末端采集设备。
Q:未来数据采集是采取真实数据为主,还是真实数据和仿真数据结合的形式?
A:对于上肢操作数据,认为还是纯真实数据比较好。目前没采到足够量的数据,不是因为采集成本高,而是学术界对于采集设备应采哪些数据没有统一,如是否要触觉、听觉以及以何种方式呈现等还在摸索中。如果这些在学术界有一定统一后,机器人的数据采集对中国来说应该不难。
Q:大模型的端到端生成模型和分层模型的优势和劣势如何,未来哪种方式会成为主流?
A:在数据完备的情况下,端到端一定是未来最好的解决方案。分层模型不属于大模型,是上一代技术,能在某些专精领域做事,但无法做通用泛化的事情。未来机器人会逐渐增强泛化能力,端到端的大模型最适用。
Q:公司目前大模型的情况如何?
A:公司目前没有做大模型的部署,坚信只有当数据采集收敛之后,讨论模型才有意义。同时会做一些算法模型的跟进,如decision policy DIT等,但只是用于做demo,目前用ROS去做。因为在数据达到一定程度后,算法路径可能随时改变。公司认为上肢操作目前的核心不在算法,而在数据,所以主要会做数据这一块。
Q:公司是否涉及大模型相关的算力领域?
A:公司不涉及,因为不想把自己弄成重资产公司,目前大模型公司存活艰难的原因之一就是资产过重。
Q:如何看待国内厂商用顶置显示器和斜坡显示器方案,海外头部厂商如特斯拉用行星减速器方案,公司的方案是什么?
A:硬件对机器人的影响不大,硬件保证下线情况,算法决定上限。特斯拉走路视频效果差是因为算法差而非结构差。公司电机模组用行星减速器,其他关节处做旋转关节,旋转处放电机。
Q:公司目前有哪些机器人产品,下游主要应用场景是什么?
A:公司有人形仿生人脸机器人,约有32个自由度,是全世界自由度最高的仿生人脸,其驱动方式是自研的达摩系统。该系统将语音生成的文字及后续会加入的图像输入模型,生成每个电机、舵机的关键角度,可减少恐怖效应。应用场景主要是文旅场景,如展示展览等。公司第一个目标是让其代替数字人角色,年底会推出带全身的全尺寸带人头的机器人,也会根据需求提供半身或全身可移动性的导览机器人。
Q:公司如何看待本体发展的三条路径(自下而上从硬件端切入、自上而下从软件端切入、专注中间件和芯片)?
A:英伟达做机器人平台是很好的路径,且壁垒非常大。做算法必须先了解机器人本体,因为本体决定下限,算法决定上限。中长期来看,除了英伟达纯做机器人平台不需要硬件外,其他公司最终都会采用软硬件一体的方式,只是一开始切入的方式不同。
Q:公司产品未来目标下游应用场景主要聚焦家庭场景,是如何考虑的?为何不选择工业或商业场景?
A:工业场景目前很多工厂自动化程度高,人员数量少且工资不高。人形机器人具有身体智能,其最终目标应是在各种环境中做相同的事,如在家庭场景中。而工厂是固定场景做固定的事,这反人性,后来工厂都用专机代替人。并且专机成本低,24小时工作可能只需万八千块钱,人形机器人成本高,还需更换电池、三班倒,成本算不过来,所以工厂不适合人形机器人。
Q:如何在硬件端和软件端增强人形机器人的算法能力和鲁棒性?
A:目前头部几家的硬件端都已达到合格水平,后续主要看软件端的突破。比如软件端完成全身遥操作,或实现与大模型交互,让机器人按指令做动作,包括一些踢球、与地板有更多接触的动作等。软件提升后会对硬件有更高要求,硬件和软件相辅相成,硬件可基于软件的提升再往前发展。
Q:人形机器人R系列起步售价13.99万的机器人可进行二次开发,不同价位的机器人对应的功能有何不同?
A:目前该机器人支持二次开发接口,13.99万是五一之前的价格,五一之后价格暂不清楚。若要加定制开发,如避障导航、加雷达、加深度相机,或添加和大语言模型交互等功能,需加相应价格。目前带二次开发接口的本体卖到13.99万已是非常低的价格,比如宇树的G1带二次开发接口要卖到20万,目前还有加价情况,要卖到25万。股市调研