Figure CEO:人形机器人是AGI的关键物理形态,已进入工程化验证期,将在四年内部署10万台
创始人
2025-07-07 18:47:57
0

Brett Adcock表示,Figure最新设计的机器人成本降低了约90%,其人形机器人将在未来四年内实现大规模部署,在新工厂具备年产10万台机器人的能力。他预测,在我们的有生之年,人形机器人将超越人类在大多数工作上的表现,使所有工作成为一种选择。

近日,Figure 创始人兼CEO Brett Adcock 与Gemini 开发者关系负责人Logan Kilpatrick、联合主持人Nolan Fortman进行了一场深度对话。

在访谈中,Brett Adcock认为,当前机器人领域的指数级发展主要得益于两大突破性进展:硬件的可靠性达到前所未有的高度,以及神经网络在机器人技术中的卓越表现。他强调,强大的硬件是AI发挥作用的基础,而电动系统的进步取代了过去液压系统的局限,使得人形机器人更加安全可靠。

Adcock 强调,他们致力于打造通用型机器人平台,能够通过学习而非预编程来适应复杂且多变的任务。其部署节奏已进入面向现实世界任务的工程化阶段,而在物流、制造、医疗等高标准化行业,原型机器人已可稳定执行无需人工干预的流程任务。

Adcock 透露,他们最新设计的机器人成本降低了约90%。其人形机器人将在未来四年内实现大规模部署,在新工厂具备年产10万台机器人的能力,最终目标是向全球输送数亿台机器人。

他预测,在我们的有生之年,人形机器人将超越人类在大多数工作上的表现,使所有工作成为一种选择。机器人不仅能完成家务和个人服务,甚至能协助制造其他机器人,从而极大地促进全球GDP增长,并最终改变我们衡量经济产出的方式,因为机器人将成为“人造人”的劳动力。

亮点观点如下:

  • 对我来说,终极元问题就是解决类人机器人的问题,所以你必须直接去做... 如果从一开始就没有针对正确的系统进行设计,那么它就会成为一个重大障碍,让你很难达到最终目标。
  • 我们基本上在公司成立后不到12个月,就从头设计出了人形机器人的大部分部件。所以,这一切都发生得非常快。而现在的环境表明,人形机器人将成为通用人工智能(AGI)的最终部署载体。
  • 现在的情况真的是一天比一天好。我刚刚才发出一个视频,视频里我们每四秒就能处理一个包裹。上周五我看到,我们每3.5秒就能完成一个...还会做一些非常聪明的事情,比如把一个包裹移开,以便能把另一个包裹推到传送线上,接着处理条形码,然后翻转包装。
  • 我们有两个重点。一是专注于家庭场景下的送货机器人,二是将重点放在劳动力方面,比如让机器人进入物流、制造、医疗保健、建筑等领域。
  • 我认为未来会有这样一个时刻到来:当你出门办事或外出时,你会看到和人类一样多的人形机器人。
  • 这里的终极模式就是将一批机器人推向市场,这些机器人随着规模化制造成本不断降低而变得越来越智能,并与集群中的其他机器人共享学习成果。
  • 如果我们无法解决人形机器人的问题,却接近了数字超级智能,那将是一种危险的情景。届时,我们将拥有大量为人类工作的数字代理,它们需要(或要求)在现实世界中完成大量任务。如果届时我们还没有解决人形机器人的问题,这些数字代理就可能会要求、强迫、指挥或花钱雇佣人类来完成这些物理任务。
  • 对于家用设备,你制造出一个机器人,每月的费用可能也就几百美元。但在劳动力市场中,你的盈利潜力是巨大的,毕竟这相当于一半的GDP。
  • 我认为未来10年,你会看到一个类似于手机的人形机器人平台,其大部分功能将受到软件的限制。
  • 我们下一个重大目标是在未来四年内推出10万台机器人。新开设的制造工厂就能实现这个产能。
  • 我认为未来会有这样一个时刻到来:当你出门办事或外出时,你会看到和人类一样多的人形机器人。我觉得那会像一部科幻电影,就好像未来50年发生的事情被提前到了今天,这即将发生的一切,会让人感觉很疯狂。
  • 我希望人们能把更多的时间花在做自己真正喜欢的事情上,比如滑雪、陪伴家人。我希望30年后,人们不会一生工作50年,尤其是在体力劳动岗位上度过大半生。

以下为访谈全文:

机器人技术的指数级增长

Logan Kilpatrick:

让我们深入探讨,可以从机器人领域正在发生的指数级发展开始。我很好奇,想听听你的看法:是什么推动了这种情况?我们在指数曲线上处于什么位置?像Figure这样的公司正处在指数增长的前沿,看到你们取得的进步真是太棒了。

Brett Adcock:

我参与了两家公司,都从事机电硬件方面的工作:一家是Archer,专注于电动垂直起降飞行器(eVTOL);另一家是Figure,致力于开发通用人形机器人。

与五到十年前相比,现在有两点非常不同。首先,我们能够打造出真正强大的硬件,尤其在人形机器人领域。在这种情况下,机身对我们来说变得极其可靠。如果你来我们的工厂,会发现到处都是机器人,可能马上就有一个从我身后走过。这些机器人的硬件可靠性已经非常高,无论是在部署到客户的商业环境中,还是在我们自己的设施中都是如此。你在这里逛一整天,可能都不会看到一次硬件故障。

硬件故障变得越来越罕见了。就算拥有世界上最好的AI,如果硬件性能平平,也无法完成任务,它需要非常强大的硬件。

我们首先能够在硬件方面构建出真正可靠的机电系统。这是一个非常复杂的机械系统,其复杂性堪比火箭、涡轮风扇等特定硬件。我们已经能制造出像涡轮喷气系统中的涡轮风扇那样极其可靠的部件。我认为对于人形机器人也是如此,未来几年,其可靠性将变得非常强大。

这是第一点,非常有帮助。我们现在拥有了十年前所没有的优质硬件。十年前,世界上最好的机器人可能是波士顿动力公司的阿特拉斯,那是一个液压系统,大约只能运行20分钟,到处都是液压油。其压力高达数千PSI,液压阀的压力大约在两三千PSI,一旦泄漏会极其危险。而现在,我们拥有的是更安全、更可靠的电气系统。

第二件事是,从根本上说,机器人技术是一个神经网络问题,直到最近几年,我们才看到神经网络在机器人领域表现出色。现在,我们有运行在机器人板载上的神经网络,它们负责指挥手部位置、躯干姿态等整个基本动作空间,并且效果非常好。例如,在我们大约一周前发布的更新中,有一个机器人使用单一神经网络连续进行了60分钟的物流作业。它的动作在某种程度上非常像人类,我们正在让机器人的性能和速度接近人类水平。

这也是十年前所不具备的。因此,神经网络加上能力越来越强的硬件,这正是让机器人真正发挥作用的两大要素。

Logan Kilpatrick:

我对此很好奇。我并不完全了解机器人的发展史,但最初的设想就是直接开发人形机器人吗?我这么问,是结合了我刚买的麦蒂克家用吸尘机器人,它比我用过的任何其他产品都好得多,感觉非常接近未来家用机器人的形态。但它显然与人形机器人差异巨大,功能非常有限。所以我想知道,你对于实现人形机器人的路径有何看法?很明显,你们选择了最直接的路径。

人形机器人背后的愿景

Brett Adcock:

是的,我直接回到了类人机器人的起点。我写了一份总体规划,就像现在网站上的愿景文档。我在特拉华州注册公司的第一天,就写下了这份文档并发布了出去。对我来说,终极元问题就是解决类人机器人的问题,所以你必须直接去做。

当然,还有其他选择,比如给机器人装上轮子,或者使用爪子等不同类型的末端执行器。但这属于一个局部最优解。如果从一开始就没有针对正确的系统进行设计,那么它就会成为一个重大障碍,让你很难达到最终目标。它会成为一根巨大的拐杖,阻碍公司的发展。我记得三年前我的论点是,这件事是可行的。所以我们从第一天起,就从零开始为公司构建和设计类人机器人。

Logan Kilpatrick:

是的,关于这点我有一个简短的后续问题。特斯拉的总体规划中,有一部分是需要做很多事情来为最终目标提供资金支持。显然,如今的募资环境对AI和机器人技术极为有利。过去几年,对这个领域的关注度和资金投入都呈指数级增长。但是,在你着手这个项目时,早期有哪些令人信服的观点,让你觉得可以直接构建最终形态的机器人,而不是逐步推进、从小处着手,最终才实现类人机器人?

Brett Adcock:

好的。我有个故事。在创立Figure之前,我于2018年创立了Archer Aviation。在那之前,我刚以略高于1亿美元的价格出售了一家软件公司。我有了一些资金,便创立了Archer,坚信电动飞机不仅可行,而且是当下可以解决的需求。但我发现当时深度科技(deep tech)的融资环境几乎不存在。早期投资者并不看好特斯拉、Rivian和SpaceX这类公司,Archer的情况也是如此。

 我把我全部的流动资产净值都投入到了Archer,但即便如此,要成功仍需大量资金。这并非是说我投入得不够,或者我的净资产不足以产生足够大的影响。我至今仍记得当时的环境有多艰难。如今七年过去了,整个业界对深度科技的态度完全转变了。现在有专门为此设立的基金。人们现在意识到,一些深度科技公司可能会成为,或者已经开始成为全球最大的企业。所以,当我开始创办Figure时,我的人脉和资源网络已经有所提升,从一开始就能为公司提供充足的资金支持。

一开始在公司内部,我们的资金消耗速度是每月100万美元,到第五个月资金就会耗尽。我们当时的想法是:放手去造一个人形机器人吧。我们基本上在公司成立后不到12个月,就从头设计出了人形机器人的大部分部件。所以,这一切都发生得非常快。而现在的环境表明,人形机器人将成为通用人工智能(AGI)的最终部署载体。如果你想在现实世界中完成某些任务,使用吸尘器这类专用工具会遇到局限。你需要搭载在高维度机器人上的AI来开展工作。我们看到机器人技术和AI正在兴起,其中有大量的资本投入。我们正是在这些趋势的推动下进入了这个领域。除此之外,我们看到机器人开始做有用的工作,并且表现出色。在很多情况下,我们可以让机器人近乎全天运行,执行有用的任务。所以你开始看到迹象,表明这一切即将发生。我们正处于一个恰当的十年,这也很有帮助。

Nolan Fortman:

我想谈谈从软件到硬件的转变。我一直很好奇,在你进行这种转型时,硬件方面有哪些软件开发中不会遇到的挑战?从用户采用的角度来看,我的直觉是让人们采用硬件比采用软件要困难得多,尤其是在软件层出不穷的今天。人们可以上网试用软件,喜欢就用,不喜欢就换下一个。这是一个两部分的问题:首先是硬件开发的总体挑战,其次是用户采用方面的挑战。你是如何设想的?

Brett Adcock:

是啊,这里有很多可以讨论的。我个人有几点观察。对于创业者来说,做硬件有点像做软件,只是时间尺度要长10倍到100倍。硬件有很多前期工作,比如前期规划,然后确定测试和执行方案。你需要先设计,再建造,然后从供应链采购物料并运送过来,进行早期测试,最终制造和组装所有部件,看它能否正常工作。在某些情况下,这个过程可能长达一年,而软件开发可能只需几天或几周。

但两者在基于科学方法提出假设方面有很多相似之处。我们想要测试一个假设,这个假设可能来自早期的客户反馈或其他类型的输入。然后我们着手构建,看它最终是否可行,并在此基础上持续迭代。

应用挑战与市场焦点

Brett Adcock:

 现在的问题是时间线非常长,项目也非常昂贵。你现在必须实实在在地购买硬件,不像以前只是编写软件。硬件很难推向市场,一旦开始做,要让事情真正运作起来非常困难。因为你得制造更多实体产品,而在数字领域,你可以无限扩展软件,比如在软件即服务(SaaS)或其他领域实现扩展。所以,这就像是软件创业者的死亡陷阱,好比是打了兴奋剂的软件创业,真的相当困难。

但这真的很有成就感。在我做软件的那些日子里,我从来没有真正感受到过这种成就感。对于软件,我无法切实地感受和触摸它。如果要展示产品,只需登录浏览器展示一下就行。在现实世界中亲手建造东西有一种特别之处。我们在现实世界中花费了大量时间,但这一点在某种程度上并没有得到太多关注。

我是在一个热衷于建造东西的农场和硬件团队的环境中长大的。在我的软件生涯之后,我真的很想涉足硬件领域,并全力以赴。我和阿彻(Archer)现在的这种形象和影响力也延伸到了我其他的公司,而且一直很棒。

没错,这个领域更难,一切都更艰难了。所以,这就像是把软件的挑战和难度调到了11级。不过,我内心总是非常焦虑,担心自己是否在为正确的事情进行设计,是否朝着正确的方向前进。在软件领域,你真的不太清楚这一点,你需要构建一个东西,然后走出去,尽早从用户那里获取反馈和进行测试。但在硬件上,你很清楚它是否能运行。比如,如果我们有这样的信念:我们应该开飞机而不是开车,因为那样肯定行得通,能为大家节省时间。或者在地下建造隧道,如果能以低成本建造出来,那也肯定行得通。如果你能研发出合适的产品,那么从确保可行性的角度来看,工程方面是相对直接的。这是优秀的一阶工程。我们必须从零开始完成这项工作,但这涉及物理学,而且有相关规则。

所以在某种程度上,这对我来说是作为创业者从事硬件开发的职业生涯中,压力最小的几年。因为我们有一本物理规则手册,基本上可以作为依据。实际上我真的很喜欢这种感觉。我作为一名努力奋斗的创业者,生活既充满挑战又令人愉悦。而且我喜欢这两个领域。

机器人技术的学习与改进

Nolan Fortman:

快速跟进一下,关于采用方面,作为一个团队,你们如何评估谁可能是最合适的人选,无论是在哪个行业?我知道你们现在在制造业和物流方面投入很大,在继续推进的过程中是怎么设想的呢?是等着听人们说“嘿,我们觉得可以在这里融入某种人机协作”,还是说你们有一份包含10个行业、10个人物角色的清单,并打算向他们推介?我很好奇,想听听你是如何设想这一切的。

Brett Adcock:

是的,我们有两个重点。一是专注于家庭场景下的送货机器人,家庭环境是一种非常非结构化、高度多变的环境,(里面的情况)真的很难处理。二是将重点放在劳动力方面,比如让机器人进入物流、制造、医疗保健、建筑等领域。

这有点反直觉,因为家庭领域的难度要远大于劳动力市场。你可能会想,如果攻克了家庭市场,它的规模会比职场市场大1000倍,但实际上情况正好相反。劳动力市场占了GDP的一半,其环境的变异性要低得多。工程挑战与可变性成正比,所以,可变性越低,就越容易将自主系统融入其中。在大多数情况下,劳动力市场与家庭场景相比就具有这种低变异性的特点。

再看商业模式,对于家用设备,你制造出一个机器人,每月的费用可能也就几百美元。但在劳动力市场中,你的盈利潜力是巨大的,毕竟这相当于一半的GDP。所以,我们基本上专注于这两条轨道。

当然,现实情况是我们正在努力打造一个通用机器人。我们希望能够与客户签约,并理论上让机器人在他们的设施内完成人类所能做的大部分事情。只要机器人有一定的运动范围、负载能力和速度,就应该能够完成所有这些工作。

我们与上一家物流公司的签约过程就很有趣。我们当时并不是看着物流业然后说:“哦,我们觉得机器人在处理包裹方面会很棒,我们就去搞定包裹吧。”我们的想法是寻找一个真正有发展空间的领域,并认为物流业属于这一类。我们签下客户时,其实完全不知道接下来要做什么。通过一系列的工厂参观,我们发现小包裹处理在运营中占据很大一部分,他们甚至会把招聘旺季、用工困难的时期称为“艰难时期”。

当我们看到这个问题时就意识到,天哪,每个包裹都不一样,有的像塑料袋,一抓就变形,而且每次的堆放情况都各不相同。这根本不可能通过预先编程来解决,但这是可以通过学习来解决的。于是我们就走上了机器学习的道路,并全身心投入其中。我们很快就让机器人在实际工作中运行起来,这非常有帮助。

毫不夸张地说,现在的情况真的是一天比一天好。我刚刚才发出一个视频,视频里我们每四秒就能处理一个包裹。上周五我看到,我们每3.5秒就能完成一个。我昨天在现场时没有计时,但我敢说它的速度更快了,处理各种不同类型包裹的能力也更强了,还会做一些非常聪明的事情,比如把一个包裹移开,以便能把另一个包裹推到传送线上,接着处理条形码,然后翻转包装。这是机器人在执行任务时所经历的一连串深思熟虑的思考和推理过程。

所以,从宏观层面来讲,我们正试图深入这些行业,并从机器学习的角度,让机器人归纳出通用的行为模式。我们希望硬件能够完成人类所能做的大部分、甚至所有事情。我们的观点是,现在就要在劳动力市场中迅速启动并推动这件事。我认为,距离真正能够将机器人投入使用、并让它们自主地为人类完成有价值的工作,可能只有几年的时间了。因此我们也在努力推进另一条轨道(家庭场景),但因为每个家庭都非常缺乏条理且各不相同,所以那是一个稍微棘手点的问题。

机器人技术的未来方向与扩展

Logan Kilpatrick:

布雷特,我们来深入探讨一下软件和硬件之间的差异。在软件层面,我们正目睹一场大规模的爆发和生产力的提升,软件开发人员拥有AI和各种AI工具,这使得工程师的效率能比以往提升10倍。我很好奇,在硬件领域,我们是否也能看到类似的效益转化?在制造和设计实体产品方面,你认为我们距离实现类似的加速还有多远?

Brett Adcock:

 我想在这方面有几点看法。我们倾向于类比学习,这里的关键杠杆在于学习的指数曲线,这意味着我们需要大量投放机器人,并且它们需要持续地学习和改进。

我们现在已经看到了这一点。我们看到机器人因为拥有了更多数据和训练,在执行任务方面表现得越来越出色。我们也看到机器人在现实世界中执行任务的能力不断提升。这正是我们希望从物理智能体上看到的——我们希望它们能通过与世界互动,在完成用例、任务和行为方面变得更智能。

所以我认为这种情况正在发生。并且,在未来一两年内,随着一批机器人走向世界,我们会看到机器人的应用场景日益完善。机器人会将这些成功的经验轨迹反馈给整个机器人集群,用于再训练。

这里的终极模式就是将一批机器人推向市场,这些机器人随着规模化制造成本不断降低而变得越来越智能,并与集群中的其他机器人共享学习成果。

除了像艾勒姆斯(Ailems)¹这样的系统之外,我们或许从未见过类似的技术:它走向世界,与世界互动,并且随着时间的推移变得更智能、更便宜。在接下来的几年里,我们将开始看到这种情况的发生。最终,我们会受到基础生产能力的限制,比如如何让足够多的机器人下线。我们刚启用了一个新设施,现在我们所在的正是Figure 3²的制造工厂。我们目前正在积极制造Figure 3机器人。我去年主要在负责如何实现高速生产的项目。我们正在内部进行Figure 3的制造。我确信我们会制造出很多机器人。但我们能否实现年产量超过手机的规模,目前还是个未知数。这是一个非常难解决的问题。我认为这个问题是有可能解决的,但继学习瓶颈之后,下一个挑战就是制造瓶颈。我们现在正处于学习瓶颈阶段,未来某个时候则会面临制造瓶颈。

Nolan Fortman:

我快速问个问题。Logan,现在机器人已经拥有了视觉、语言能力,并且能像人类一样活动,你认为下一次迭代还需要什么?让机器人在外部世界学习,是一种必要的做法吗?还是说从硬件角度来看,存在某些内部特性的瓶颈,导致机器人还无法达到你们期望的水平?或者情况更像是“我们必须把它们派出去学习,否则就无法取得更大进展”?

Brett Adcock:

我们内部正在进行一些实现这些目标所必需的产品开发。例如,Figure 3是我们设计的首款为高产量制造而生的机器人,它比图2便宜约90%。这些都是关键环节,我们需要将大量机器人投放到世界中,这正是你刚才提到的关于“下一步”的关键。我们需要推出大量低成本的机器人,因此我们一直将可制造性和成本控制作为核心重点。

我们通过设计解决的另外几个方面包括:第一,整体安全性,尤其是在进入家庭领域时,这将极为重要。第二,我们的设计路线图紧密围绕着一个目标:让机器人在操作和移动方面随着时间的推移越来越像人类。可以通过机器人的速度、活动范围和有效载荷来衡量这些进展。我们的路线图趋势,就是让机器人能胜任越来越多的人类体力劳动。

下一步就是,我们如何在一定规模上,将大量人形机器人融入到几乎不需要人类协助就能开展日常工作的世界中。这就像我们过去几年在自动驾驶领域看到的那样:部署一个车队来证明端到端运行的可行性,并逐步降低人工干预率。这正是我们需要经历的阶段,也是我们目前正在做的事。我们的目标是实现极低甚至零人工干预率,让机器人能全天工作。再下一步就是扩大规模:扩大机器学习的规模,以及将制造业的规模提升到非常高的水平。我们正处于将更多机器人真正推向世界的阶段。这将有助于数据采集、提高机器人的可靠性,并帮助我们将机器人更好地融入现实世界——这同样是一件难事。

Logan Kilpatrick:

布雷特,接着刚才的话题,从机器人的角度来看,你认为未来会出现哪些新的产品特性?

 近两周我关注到一个话题:人类对机器人的心理反应。比如,如果把机器人设计得有点笨拙可爱,人们的反应会很特别。我现在为只收听音频的听众描述一下,布雷特的旁边有一个机器人模型(弗雷德³)在来回走动,大家的目光会时不时地落到它身上。这提醒我,这对你和你的团队来说已经习以为常了。我很好奇,你认为当人类逐渐习惯身边总有机器人时,大众的接受过程会是怎样的?我再举个例子,DoorDash在芝加哥使用小型机器人配送订单,每次我们开车路过,我的女朋友都会说:“天哪,这个小机器人太可爱了。”它看起来像是在摸索着找路,有点迷糊的样子。我觉得这是一次相当有趣的经历。

Logan Kilpatrick:

我感觉人们对仿人机器人的反应会略有不同,它们看起来太像人类,会给人一种不祥之感(恐怖谷效应)。你有没有想过,相对于工业版,家庭版的机器人会有什么不同?

Brett Adcock:

我对此有一些想法。首先,我认为未来会有这样一个时刻到来:当你出门办事或外出时,你会看到和人类一样多的人形机器人。我觉得那会像一部科幻电影,就好像未来50年发生的事情被提前到了今天,这即将发生的一切,会让人感觉很疯狂。如果你来到我们这里,看到这么多机器人,感觉会非常棒。我非常喜欢这种感觉。

机器人集成的未来

Brett Adcock:

我们有机器人在设施内整天四处走动。有些会与人交谈,询问是否需要饮用水或咖啡;有些则像在巡逻。我们喜欢看机器人,这有助于提升多巴胺水平。我们这里也有很多来面试的人,他们看到这些会觉得很棒。

我们在人形机器人的设计和美学方面投入了大量时间,力求打造出完美的作品。我们还有一个专门的标识团队,其中大多数成员来自大型汽车集团。我们不仅思考机器人本身的设计,也思考它进入家庭所需的人机交互。

但关于你之前提到的让机器人应用更柔和、看起来没有威胁性等观点,我并不认为需要把一个本身就高度能干、智能和复杂的机器人,刻意做得看起来没有威胁性。要建立人类对机器人在安全和隐私方面的信任,需要在实际使用场景中(无论在家还是在工作场合)做到两点:一是做正确的事,二是在性能上表现出色。

因此,我认为给那些能力强大、速度快、并最终能完成大部分人类工作的机器人装上巨大的卡通眼睛,是非常不妥的。这就像戴上谷歌眼镜,试图糊弄别人,让对方觉得它只是一个有趣、卡通化的小玩意儿。从设计角度来看,这很愚蠢。有些机器人团队在机器人或其屏幕上添加了眼睛之类的设计,这看起来很滑稽。这些是精密的机器,我认为它们的设计应该与之匹配。

在家庭环境中,我们正面临一系列与安全和隐私相关的网络安全问题,这确实很困难。在家中,安全是第一位的,我们不希望伤害到任何人或宠物。因此,我们需要360度全天候检测移动的动物或人类。其次是语义安全,例如,我们不希望机器人打翻蜡烛导致房屋烧毁。机器人需要非常审慎,即使在物理上是安全的,它在家庭环境中的移动方式也需要经过周全考虑,以免给周围的人带来危险。

我认为这是一个棘手的难题。问题可以归结为:我们如何让社会接受这类产品?我真心希望有大量像我和我同事这样的科幻爱好者,他们期望机器人能进入自己的家庭。我认为会有很多人真心想要机器人,但必须达到几个门槛:足够安全、能做足够多有用的工作、价格实惠。

如果我们能实现这些,我相信每个人都会希望有机器人来帮忙洗衣服、收拾和归位餐具、煮咖啡、做饭。有时我早上醒来看见洗碗机,就再也不想碰它。因此,我认为当我们能够证明物理智能可以以较低成本为人类完成这类任务时,我们就可以让机器人不分昼夜地运行。到了晚上,它可以悄无声息地慢慢行动,把所有盘子归位。所以我认为这对家庭和职场都将是一个巨大的福音,我们在两方面都需要它。

我认为你将看到一个单一的机器人平台来完成所有这些工作。就像人可以在家或在职场工作一样,我们为普通用户打造了适用于工作场所和家庭的机器人。我认为未来10年,你会看到一个类似于手机的人形机器人平台,其大部分功能将受到软件的限制。

Nolan Fortman:

我很好奇,人类是如何与机器人互动的?比如,一个人在公寓里拥有一个人形机器人,它的控制方式是什么?你如何处理人机交互,以及用户如何通过手机等设备了解并控制机器人的行为?是否有一个应用程序,可以让我命令它执行X、Y、Z等操作?我知道Mantic似乎也有类似的应用UI层。对用户来说,目前的交互方式是怎样的,你认为未来会如何发展?回到隐私问题,当人们的公寓里有一个能听能看的人形机器人时,我们如何确保数据只在本地处理,而不会泄露给更广泛的受众?

Brett Adcock:

我认为,无论是开箱体验,还是家中乃至全球机器人的默认用户界面,都将通过语音来实现。你提到的手机或电脑等设备,当我们站在机器人旁边,用电脑打开终端发命令或点击按钮时,感觉非常奇怪。延迟很高,带宽很低,而且非常耗时。你更愿意直接与机器人交谈,或者给它发消息。

我们每台机器人都内置一张带手机号的SIM卡,你可以直接通过自然语言与它交流。我们的机器人Helix,其神经网络是基于语言条件的。所以,用语言来调整和命令它,将成为家中人形机器人的自然默认交互方式。因此,如果你想让它做什么事,直接说出来或者用提示词即可。

关于隐私和网络安全,这是一个非常重要的话题,我们投入了大量时间。实际上,我们大约四个月前刚组建了专门的隐私和网络安全部门。我们有一个来自Snapchat和谷歌的小团队,在商业(企业端网络安全)和产品两个方面处理这些问题。我们必须在这些领域做好许多事情,并不是说只做一件事情就能解决所有问题,那种想法是不切实际的。

Brett Adcock:

另外,我们收到很多关于中国机器人的问题。我认为中国机器人要进入欧美家庭和商业劳动力市场会面临很大困难,这是一个相当棘手的问题。因此,用户需要与他们打交道的公司建立真正的品牌信任。这比电脑和手机要复杂得多,因此隐私和网络安全在此更为重要。要把产品安全和企业安全都做好,这些问题是相当微妙的。

我不想给人留下我们今年就能解决所有问题的印象,但我们正为此非常努力。这是一件重要的事。你肯定希望为机器人制定规则,并将其存储在非易失性存储器中,明确规定它能做什么、不能做什么。你不希望任何人在任何情况下都能获得对机器人的超级用户访问权限。我们现在正在做的许多工作,对于未来在全球推广数百万台机器人至关重要。

Logan Kilpatrick:

我一直在思考一件事,听起来你似乎也同意近两年的一个共识:即使我们很快拥有了AI超级智能,我也不会感到惊讶。但当我望向窗外、走出家门,现实世界看起来和现在并无二致。构建数字智能并不会直接(至少在短期内)改变我们周围的物理世界。人类在物理世界的生活方式将非常相似。但在数字世界,情况会大不相同,因为你将拥有按需的智能。

Logan Kilpatrick:

但听起来你认为,人形机器人技术是我们在现实世界中加速进步的方式。你对实现这一目标的时间线有何看法?指数增长起初可能非常缓慢,但随后会真正腾飞。我很好奇你对此的看法。

Brett Adcock:

(现实世界)感觉不像未来,对吧?虽然功能有些进步,但还不是未来的样子。我确实认为未来会有一个时代:人形机器人为人类做各种事情,我们乘坐飞行汽车出行。我坚信这就是我们所有人的未来。正是这种信念驱使我投身于现在的公司和项目,因为我觉得这些事对创造一个激动人心的未来至关重要。

我还想补充一点,我们正朝着数字超级智能迈进,而且感觉它已近在咫尺。如今,超级智能生活在服务器的盒子里。我致力于人形机器人研究的原因之一就是数据。在我看来,如果我们无法解决人形机器人的问题,却接近了数字超级智能,那将是一种危险的情景。届时,我们将拥有大量为人类工作的数字代理,它们需要(或要求)在现实世界中完成大量任务。如果届时我们还没有解决人形机器人的问题,这些数字代理就可能会要求、强迫、指挥或花钱雇佣人类来完成这些物理任务。

机器人技术的隐私与网络安全

Brett Adcock:

我们会成为数字超级智能的奴隶,而人形机器人是实现这一目标的理想部署载体。它能像人类一样做大多数事情,需要具备语义智能,才能在混乱的环境中穿越现实世界。它就是完美的外形尺寸,你在家里的吸尘器或其他任何东西里都找不到这种能力。就像你刚才说的,那些设备没有硬件支持。

所以我认为,你首先会看到人形机器人被部署在极少数地方,全天候工作。如果你有幸能去看看,就会感叹,感觉一切都运转起来了。我想这可能就是我们现在乘坐 Waymo 时的共同感受。但是,美国大部分地区并没有 Waymo。所以当我和我母亲打电话时,她说在伊利诺伊州的中部,然后我说我的机器人就在这里。这种事每天都在发生,机器人正在工作,但目前规模有限。

我们认为,会看到在一个非常渐进的过程中,我们越来越投入,也学到了很多东西。我们需要学习如何进行整合、如何运作可靠性、如何开展维护以及如何进行人机交互。我们致力于扩大扩展学习的运作方式。作为一家公司,我们正试图通过部署机器人并将其推向世界来找到答案。我们在商业环境中几乎每天都运行机器人,所以我们正在获得真实的体验,试图弄清楚这一点。

我觉得在这个阶段,我们已经学到了很多,现在正努力让更多机器人投入使用。然后,随着我们投放更多机器人,管理更大规模的机群将变得更加困难,同时,我们需要的“照看”工作可能会比过去减少一些。然后在某个时刻,我们真的会攻克这个难题,并且能够向全世界投放数亿个机器人。能够生产出几十万台机器人和生产出几百万台机器人之间不会有太大差别。

你必须拥有现有的技术,干预率必须极低。默认的UI需要支持语音,你需要拥有泛化学习能力。你需要达到一定规模,才能实现向人类学习这类事情。你需要通过特定的规模来解决这些问题。

Brett Adcock:

我们下一个重大目标是在未来四年内推出10万台机器人。我们新开设的制造工厂就能实现这个产能。而且我们现在已经开始制造 Figure 01 了,它们实际上在运行,在自主工作。我们希望在未来四年内,将业务拓展到这些领域。如果我们能达到这个数量,我们认为就正走在向世界输送数百万台机器人的轨道上。

和软件不同,我们没办法像数字信息一样无限复制。但我认为最大的障碍是,走进某个地方,看到它实际运转起来。这好像是整个问题中最棘手的部分。例如,在我们刚刚展示的包裹分拣工作中,机器人能够自主工作,这是通过 Helix 模型完成的。我想我们刚刚发布的最新版本只增加了大约60小时的数据。在此之前,机器人完全不知道如何处理物流。我们向其输入了60小时的数据,它就完成了我们向大家展示的所有工作。从宏观角度来看,这根本算不了什么。

所以我们能够开始收集数亿甚至数十亿小时的人类演示数据。我认为我们能够将这些产品的规模扩大到十亿级别,并将其推广到世界的每一个角落。我认为,这是我们必须经历的阶段,因为硬件问题难度极大,而且我们必须学习如何进行规模化整合。

Logan Kilpatrick:

是的,关于这个问题我有一个简短的后续问题:你认为快速学习过程在多大程度上得益于世界知识的压缩?我不知道你们的模型是基于什么构建的,但我们这个生态系统似乎正在探索如何将越来越多的世界知识压缩到更小的模型中。你们是否也因此直接受益,即模型因为已经内置了大量知识而学得更快?

Brett Adcock:

是的,这肯定有帮助,因为它让我们可以在本地运行这些模型。我们需要模型更小、更快。我们使用 VLM (视觉语言模型) 作为语义基础,并将其应用于 VLA (视觉语言-行动) 模型,也就是我们的 Helix 模型。这个模型就像一个更强大的大脑,其在 S2 上的运行速度大约为 7.9 赫兹,比我们一些低级别的 Transformer 策略要慢。所以我们肯定从中受益了。

问题在于,这些模型在物理层面上并不真正理解如何与周围的物体交互。例如,抓取一个物体时,它们不理解机器人合适的受力状态,也不理解如何处理柔性或刚性等不同特性的物体。它们没有接受过任何那样的训练。机器人领域不存在像 YouTube 那样的平台,所以我们不得不自己构建所有这些数据和训练流程。

我们在模型中使用了 VLM 主干,这对语义理解非常有帮助。在我们的 Helix 项目中,“螺旋”团队的人员占全体员工的 20%,所以对于AI团队来说,这规模相当可观。目前该团队专注的唯一问题就是机器人学习,以及如何高效地训练新行为。

Nolan Fortman:

布雷特,我有一个简短的问题,你可能是回答这个问题的最佳人选。我们正在讨论超级智能,以及将数十亿台机器人融入现实世界的构想。你如何设想十年、二十年后的超级智能会是什么样子?对人类来说,那会是怎样的情景?你希望它能达成什么样的目标?目标是给人们更多时间与家人共度吗?有了这些能帮助执行任务的机器人,是否会开启创造力的新高度?我很好奇,当我们达到你所说的那些门槛和基准时,社会将呈现出怎样的景象。

Brett Adcock:

是的,趋势显示,人形机器人每年能做的人类工作越来越多,而且随着时间的推移,它们在大多数工作上会比人类做得更好。这在我们的有生之年肯定会发生。我想,届时世界上任何工作,无论是在家还是在职场,都将成为一种选择。你可以选择自己做饭、洗衣服、煮咖啡、遛狗、照看孩子或从事建筑等工作,也可以让机器人来完成。

机器人将对 GDP 做出重大贡献。我们现在是按人均来衡量 GDP 的,而这些机器人基本上就像人造人。即使是今年,我们也会在生产线上使用机器人来协助制造其他机器人。所以,你肯定会在有生之年看到机器人制造机器人。机器人制造机器人,它们持续工作,并且在大多数任务上比人类做得更好、更快、更可靠。

超级智能在社会中的作用

Brett Adcock:

那我们该如何度过我们的时间?我们的目标是什么?这就变成了一场非常艰难的对话,尤其是对我这样的人来说。它在我生命的大部分时间里都在发挥作用,而我也一直热爱着它。我们正在制造的机器人和智能体,可能在我们有生之年就会比我们所有人都更聪明、更优秀。

这确实会引发很多焦虑情绪。所以我希望人们能把更多的时间花在做自己真正喜欢的事情上,比如滑雪、陪伴家人。我希望30年后,人们不会一生工作50年,尤其是在体力劳动岗位上度过大半生。

Nolan Fortman:

我快速跟进一个问题。您觉得会不会出现类似特斯拉的模式——就像埃隆推动的那样——当你不用特斯拉时,它就会变成优步或自动驾驶出租车为你创造收入?我们会不会走到这样一个阶段:每个人都有一个人形机器人,可以将其部署去执行各种任务,那个机器人得到报酬后,又回到你身边?我只是好奇您对这个画面的想法。

Brett Adcock:

是的。你可以让机器人去帮你赚钱。比如,你想把它借给邻居用,只需让机器人穿过街道到隔壁去帮忙就行。从长远来看,机器人的制造成本会相对较低。它们可以从事基础的、持续性的工作,这将导致商品和服务的价格下降。每个人都能享用几乎任何东西,无论是理发、商品、农产品还是其他服务。如果由机器人来做,所有这些服务的成本,最终都会归结为机器人本身的成本、所需的能源成本,可能再加上房地产的成本,仅此而已。而且你可以大幅降低所有成本,因为合成人(注:人形机器人)可以日夜不停地工作,完成几乎无限的工作量。所以,是的,你将拥有一个有个性的机器人。你可以要求它调高幽默感或变得更严肃;你会和它交谈、给它发消息,而它会一直为你工作。

Logan Kilpatrick:

是啊,那样的生活将会很疯狂。布雷特,我们想问每个嘉宾的最后一个问题,这是一个非常开放的问题:关于2025年,你希望发生什么,以及不希望发生什么?虽然问题很宽泛,但我们总能因此得到非常有趣的回答。所以我很好奇你在这两方面的想法。

Brett Adcock:

我正在努力经营我的公司,比如Archer、Figure和Cover(注:根据上下文推断,此处为公司名),希望它们都能发展良好,创造一个真正令人兴奋的未来。

就个人而言,我非常希望推动人类进步所需的技术能更上一层楼。我们需要着手开展像水下城市、太空电梯或针状结构这类项目,这些是真正能在2050年前推动人类进步的事物。很多这样的领域正开始变得越来越可行,技术就绪水平正在不断提高。在四五十年代和六十年代,我们曾有过那种大胆的宏伟目标。为了人类,我们需要设立新的标杆。我们需要全人类和超级智能共同努力,帮助我们实现这一目标。

Brett Adcock:

这些在我们有生之年都有可能实现,我们希望能亲眼看到。所以我希望我们能更上一层楼。因为我关心的是利用技术杠杆来提升全球的生产力和幸福感。希望到2050年我们能有一部太空电梯,那太棒了。我认为这有可能实现。在更多类似的技术领域,我认为那将是我们能生活在其中的最激动人心的未来。

Logan Kilpatrick:

是的,我喜欢这个愿景。布雷特,这太棒了。感谢您抽出时间与我们交流。很高兴看到你们的持续进步,我觉得贵公司的未来一片光明。再次感谢您与我们聊天。

Brett Adcock:

 洛根、诺兰,感谢你们的邀请。期待很快再和你们聊。

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

相关内容

热门资讯

自关税实施以来,加拿大人赴美购... 格隆汇7月7日|Redfin数据显示,加元走弱以及美加之间的政治分歧抑制了加拿大人赴美购房的热情。与...
南京红姐网传信息有被夸大成分 【#南京红姐网传信息有被夸大成分#】#律师分析南京红姐可能刑期# 据法治日报报道,记者从警方相关人士...
深入挖掘历史细节 中国人民抗日... 【深入挖掘历史细节 中国人民抗日战争纪念馆展出新解密档案】#中国人民抗日战争纪念馆将恢复开放#中国人...
抗战馆场景化复原 营造现场感 ... 【#抗战馆场景化复原# 营造现场感 代入感 激发观众共情共鸣】中国人民抗日战争纪念馆将于2025年7...