《科创板日报》6月6日讯(记者 李明明)今日,在2025北京智源大会具身智能会客厅环节,宇树机器人G1、天工机器人、银河通用机器人盖博特(Galbot)各展绝活,共同演绎人形机器人的技术突破。
只见G1一套流畅的搏击动作吸引全场目光。其勾拳、踢腿、闪避等动作引得观众阵阵喝彩。与此同时,人形机器人们还展示了更多实用技能,如挑选早餐水果、协助购物、叠衣服、制作三明治等,尽显其在日常生活中的多样化应用场景。
人形机器人无疑是当下最流行的热点之一,然而,一个问题却在人们心头萦绕:这些能歌善舞的人形机器人,究竟什么时候才能真正下场干活,成为推动社会发展的“生产力担当”呢?
在会客厅环节,宇树科技CEO王兴兴,北京人形机器人创新中心总经理熊友军,北京大学助理教授、智源具身智能研究中心主任、银河通用创始人兼CTO王鹤,穹彻智能联合创始人、上海交通大学教授卢策吾,Physical Intelligence联合创始人兼CEO Karol Hausman就人形机器人赛事、产业化与技能落地、VLA模型的应用与挑战等进行了讨论。
(《科创板日报》记者李明明摄)未来机器人的形态将千奇百怪
在具身智能的大潮下,机器人必须造成人形似乎成了一件约定俗成的事情,但机器人一定要做成人形吗?
对此,王兴兴表示,他过去多次公开强调,并不坚持机器人必须采用人形设计。对于其公司而言,研发机器狗和人形机器人是自然而然的选择。特别是在腿部设计上,采用轮式底盘是一种非常实用的方案。目前,人形机器人之所以受到青睐,尤其是其上半身保持与人类相似的形态,主要是因为当前的人工智能技术是基于人类数据进行采集和训练的。人形机器人的上半身动作与人类一致,这使得数据采集更为便捷,同时也便于AI进行训练。例如,在跳舞或格斗比赛中,如果机器人的外形与人类不符,则无法完成相关动作。
王兴兴认为,随着通用人工智能(AGI)或通用AI的发展,机器人的形态将变得更加多样化。未来,工厂、医疗等领域的机器人形式将远比现在丰富,甚至可能增加百倍。
熊友军赞同王兴兴的观点,认为具身智能的发展形式是多样化的,不应局限于人形。他认可人形机器人是具身智能研究的一个重要载体,但主要基于未来市场容量的考量。当前,机器人可以采用非人形设计,例如四足或轮式机器人,这并无不可。然而,从市场应用的角度来看,人形机器人在家庭、商用和日常生活中具有更广阔的应用前景,而工厂应用场景仅是其中的一小部分。熊友军认为,人形机器人的市场容量将远大于其他类型的机器人。
其次,从人机交互的角度来看,人形机器人在未来将更自然地融入家庭和生活,甚至可能成为人类的朋友或伴侣。因此,人形机器人在人机交互方面具有显著优势,更容易被人们接受。此外,当前的环境大多是为人类设计的,人形机器人能够更便利地适应这些环境,并使用现有的工具,无需进行过多的改造。否则,为了部署机器人,可能需要对环境进行大规模改造。综合以上几点,熊友军坚信,从长远来看,人形机器人是一个适宜的载体选择,尽管目前其成本和技术仍面临一些挑战。
VLA模型仍存在局限性
VLA是最近被提出作为可泛化机器人控制的有前途的方法。王鹤指出,自动驾驶领域已经验证了端到端方案的优越性,VLA模型的核心优势在于能够直接从视觉观测和自然语言指令中端到端地输出动作,无需中间产物。然而,VLA目前仍处于发展阶段,其需要突破的方向并非简单地将人类所有能力集成到一个基座模型中,而是逐步融合多模态信息,如力觉、触觉、嗅觉、味觉和听觉等,以实现更接近人类水平的具身智能。
王鹤认为,VLA目前最适合应用于移动抓取和放置任务,这些任务主要依赖视觉,辅以触觉或力觉传感器,具有广泛的应用前景。如果能够将VLA在在工业、商业、服务等场景中部署成功,将标志着具身智能技术真正走向实用化。
卢策吾则强调了VLA模型的本质意义,即通过视觉理解世界、通过语言与人类沟通、通过行动改变世界。他认为,语言是连接不同语义数据的“黏合剂”,而VLA的扩展性虽然强大,但仍存在局限性。具身智能的发展需要逐步落地,同时也要有长远目标,即推动通用智能的发展。
卢策吾指出,VLA面临的挑战在于如何在通用场景中压缩不确定性,这需要不断加入新的模态信息,如力反馈和物理世界理解,以增强模型的鲁棒性和适应性。他提到,通过力反馈技术,可以显著提高机器人的动作稳定性,减少计算负担。此外,通过仿真合成数据和数字基因技术,可以进一步压缩模型空间,降低数据需求,从而推动VLA逐步走向通用智能。
Karol Hausman在讨论中提到,跨本体VLA在实践中仍面临瓶颈,主要问题是现有模型无法完全满足需求,需要算法的进一步提升和新技术的引入。尽管数据规模庞大,但现有算法在处理这些数据时仍存在不足。他认为,当前的重点是优化算法,而非单纯依赖数据规模的扩大。
人形机器人赛事是观察性能的起点
王兴兴表示,从春晚到格斗比赛,很好的展示了技术水平,并让大家了解到目前机器人的发展阶段。但宇树终极目标还是希望机器人干活,无论是家庭还是工厂。希望让机器人去真正解放人类的生产力。但在这个终极目标未实现之前,先参加一些表演和格斗比赛来给大家展示一下机器人的情况,并产生一部分商业价值。今年上半年,包括人形机器人租赁市场也比较火爆,本身已经带来了一些产业价值。
熊友军表示,举办机器人比赛有意义,首先,比赛等可以给大众普及机器人的发展状况,比如将要在鸟巢举行的比赛,会有短跑、长跑、障碍接力赛等田径比赛,还有足球、舞蹈等大家喜闻乐见的方式,这会让大众对人形机器人有个潜移默化的了解;
其次,比赛是机器人的技术训练场,比赛不少场景源自真实的生活场景,比如工厂提出的物流搬运,医院提出的医药分拣以及酒店服务等,对提升机器人的技术有帮助;
第三,对于有潜在需求的客户来说,比赛是一个桥梁,可以加速机器人产业化落地,或加速在真实场景里做试点的应用。
Karol Hausman认为,中国有各种各样的机器人比赛,在海外也有一些比赛,还有很多学术性的竞赛,但和中国的规模无法相比,所以非常期待能看到中国的比赛和机器人技术的发展和验证。
王鹤和卢策吾都强调了推动具身智能产业化的重要性。王鹤提到银河通用机器人在无人药店等场景的应用,若能实现人形机器人24小时常态化服务,便是具身智能走向产业化的起点,“目前我们已在北京落地7家无人药店,人形机器人全天候值守完成捡药、对接骑手等工作,不仅为夜间急需用药的患者提供了及时帮助,更打破了‘人力24小时锁守岗位’的传统模式,缓解了特殊时段的人力短缺问题。今年,我们还将在北京、上海、深圳三地拓展至100家无人药店。”
“当超市订单处理、车厂配料等场景都能由人形机器人‘当家作主’,技术便真正融入了生产生活。我们希望后续赛事能与这些实际需求对接,以‘可落地的技能’为导向,让比赛成为产业生态运转的‘催化剂’。” 王鹤表示。
对此,卢策吾也表示认同,“赛事是观察机器人性能的‘起点’,但更重要的是让机器人‘干活’‘创值’——未来或许需要更多聚焦‘生产力’的比赛,” 他透露,团队正将“物理世界高持续接触+力反馈模型”应用于食品食材加工领域。