21世纪经济报道记者 林典驰 深圳报道
5月22日,在第二十一届中国(深圳)国际文化产业博览交易会广东展团主展厅上,一场特殊的“格斗赛”引发业界关注。
深圳众擎机器人公司等官宣了首个以“全尺寸类人身高”的人形机器人为竞技主体的赛事“众擎机器人自由格斗赛之‘机甲拳王’”。
在大会上,广东省政协委员、世界数字科学院(WDTA)国际首席人工智能官、广东省人工智能产业协会创始会长杜兰谈到,“机器人格斗看似是‘打架’,实则是一场‘全身心’的技术验收。”
杜兰在演讲中表示,人形机器人需通过“大脑、小脑、身体”三部分的协同,而格斗场景正是对这三者的考验。国产机器人在机械结构、运动能力、量产成本控制等方面已表现出色。
身体是构建机器人的一切硬件,例如,减速器、传感器、灵巧手等硬件可支撑多关节协调动作。其次,小脑,也就是运动控制系统,该系统能实现动态避障、攻击路径规划及摔倒后的快速恢复,这会涉及实时姿态调整算法和力反馈系统。然而,机器人的大脑看似借着大模型的东风迅速突破,但距离及格线仍然非常遥远。
杜兰举例,“一个简单的洗衣动作需协调40个关节,但现有AI模型仅能预设200种动作,无法应对衣物材质变化;机器人摔倒后也无法自主分析原因,需人工重置程序。”当前大模型本质仍是“语言智能”,与物理世界的交互存在断层。
英伟达CEO黄仁勋在CES上称,AI发展的终极阶段是“物理AI”,即AI对于三维物理世界的理解,它包括物理动力学(比如重力、摩擦力和惯性)、理解几何和空间关系及因果关系的能力,以及客体永久性。
然而,在“物理AI”这一领域面临多重挑战。
“李飞飞的空间智能模型、LeCun的世界模型虽能通过单张图片构建3D世界,但事实上物理AI的训练数据极度稀缺。”杜兰解释,多模态感知与动作耦合数据的获取成本极高,且实际应用对准确率的要求远超ChatGPT类文本模型。
她预测,现阶段的人形机器人尚处婴儿期,至少10年内无法成熟,人形机器人大脑的 "GPT 时刻" 从技术上来说仍然遥遥无期。
尽管技术面临瓶颈,杜兰强调机器人格斗赛的产业价值不容忽视。“赛事会暴露技术短板,但更能生成海量真实数据,推动算法迭代,也让更多人关注到这个行业,关注到行业背后千千万万不断拼搏的科技工作者。”
她以机器人马拉松为例,称高强度的对抗场景可验证电池续航、散热及关节耐冲击性,为硬件优化提供依据。
在杜兰看来,机器人是AI与硬件的最高形态结合,而当前大模型热潮正为行业注入新动能。“AI一天,人间一年。技术的爆发速度远超想象。但科技是来源于真实世界并且要为真实世界去服务的,只有经过实测的技术才能真正服务于现实世界。”