【全文版】FigureAI CEO访谈:人形机器人时代 - AGI的终极载体与物理世界的未来 |1.7万字+视频
创始人
2025-07-08 12:56:32
0

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

【城主说】FigureAI的创始人CEO Brett Adcock本次最新访谈深入探讨了人形机器人领域的指数级发展。Brett了他对行业现状的见解,指出可靠的机电硬件与先进神经网络的融合是当前增长的核心驱动力。他阐述了Figure公司从第一天起就直接开发人形机器人的战略决策,并对比了硬件与软件创业的挑战与回报。访谈还覆盖了市场策略、人机交互的设计哲学、语音控制的重要性以及未来在安全、隐私和规模化生产方面面临的挑战。最终,讨论延伸至人形机器人作为通用人工智能(AGI)在物理世界的终极载体,将如何深刻改变人类社会、生产力乃至生活的意义。

核心观点

Brett Adcock: 现在我们所处的环境似乎是,人形机器人将成为通用人工智能(AGI)的最终部署载体。然后就是家庭应用了。我认为,在个位数年内,我们就能真正地将机器人投入家庭,并让它们自主地为人类做一些真正有用的工作。未来会有一个时候,当你外出办事或去户外时,你会看到更多……你会看到和人类一样多的人形机器人。

主持人: 让我们深入探讨一下。也许我们可以先从机器人技术领域正在发生的指数级增长这个话题开始。我很想听听你的看法,比如是什么驱动了这种增长,或者我们目前在指数曲线的哪个位置。显然,Figure,但Paramount在这方面处于领先地位。很高兴看到你们取得的所有进展。

Brett Adcock: 是的。所以我比较喜欢从事机电硬件工作的两家公司,一家是Archer,他们做电动垂直起降飞机,另一家是我们,我们制造电动人形机器人。我认为现在和5或10年前相比,有两件事确实非常不同。

第一点是,我们已经能够在这个机器人领域,或者更具体地说是人形机器人领域,制造出真正有能力的硬件。比如,在这种情况下,对我们来说,身体变得极其可靠。如果你来我们的工厂,四处走走,你会发现到处都是机器人。我想马上就有一个机器人要走到我身后了。而且这些机器人都非常出色,硬件的可靠性已经变得非常好。无论是在商业环境中,当我们把机器人部署到客户那里,还是在我们自己的工厂里。所以如果你在这里走动,你会看到很多机器人。而且我认为你一整天都不会看到任何硬件故障。我们很少看到像这样的事件。我们的确有,只是,我觉得它变得越来越罕见。所以,即使你拥有世界上最好的AI,你也需要非常、非常强大的硬件,你不能在平庸的硬件上完成这项工作。这是第一件事。

我们已经能够在硬件方面构建像机电系统这样的东西,这些系统将会非常可靠。就像可靠的,你有一个非常复杂的机械系统,你知道,复杂度非常高。所以可以与火箭和涡轮风扇以及其他类型的特定硬件相提并论。但是我们已经能够在世界上构建像极其可靠的涡轮风扇和涡轮喷气系统。我认为人形机器人也是如此。即使在未来的几年里,人形机器人的可靠性也将变得非常强大和非常好。这是第一件事,真的很有帮助。我们现在拥有非常好的硬件,而10年前你没有这些。

我的意思是,像10年前世界上最好的机器人可能就是波士顿动力的Atlas。那是一个液压系统,所以它只能运行大约20分钟左右,而且到处漏油。每个阀门的液压大约是2000到3000 PSI,身边有一个额外的人来延长泄漏时间是非常危险的。所以,现在我们有了电动系统,我认为它们是安全的,而且可靠的,我想这是趋势。

然后我认为的第二件事是,机器人技术在极限情况下实际上是一个神经网络问题。直到最近,我们才真正看到神经网络在机器人上表现良好,就像最近这几年一样。所以我们现在有了在机器人上运行的神经网络,它们控制着手的位置,头部,躯干,基本上是整个机器人的动作空间。而且效果很好。就像你可以观看我们的一些更新,你会看到,我们大约一周前发布了一个更新,一个机器人正在进行60分钟的连续物流工作。这是一个单一的S1螺旋神经网络,它在机器人上运行。它看起来在某种程度上像人类会做的事情,几乎像模仿,非常类似于人类会有的特征。而且,我们正在接近那种机器人的类人速度和性能。所以这也是我所说的5到10年前你根本没有的东西。

所以在机器人的例子中,我们有类似神经网络在工作。而且我认为硬件总体上变得越来越强大,这就像你真正需要让它运作起来的两个重要输入。

直击终局:为何直接构建人形机器人

主持人: 是的,我对这个很好奇。我不太了解Figure的所有历史观点,但最初的目的是直接跳到人形机器人吗?或者说,有没有,我是通过我刚买的Matic家用真空吸尘器机器人来思考这个问题的,它在材质上比我过去用过的任何其他机器人吸尘器都要好。而且,它感觉非常接近你可能想象的那种家庭机器人的未来,但显然,它与人形机器人截然不同。它在能做什么方面受到了极大的限制,等等。所以我很好奇,比如你们在让类人机器人工作这条道路上的思路是怎样的。显然,你们采取的方法是,直接做类人机器人。

Brett Adcock: 是的,我们一开始就直接做类人机器人,从第一天起,我写了一个总体规划,就像一个,你知道的,类似愿景文档的东西,它在网站上。在我注册特拉华州公司的第一天,我就写了那个并发布了。对我来说,这就像是终极的元问题,那就是试图解决类人机器人问题。所以,你必须直接着手解决它。

比如,还有其他的选择,比如在机器人上安装轮子和其他类型的末端执行器,比如爪子和其他东西。但这基本上是一个局部最大值。如果你从一开始就不是为正确的系统设计,那么这将给你带来重大问题,阻碍你到达真正需要去的地方。它基本上会起到一种作用,就像一个巨大的拐杖,支撑着这个企业。所以我三年前的论文的想法是,做成这件事是可能的。所以我们基本上从公司成立的第一天起就开始构建和设计人形机器人。

从软件到硬件:深科技创业的挑战与回报

主持人: 还有一个非常快速的后续问题,然后,抱歉,诺兰。我只是觉得,就像特斯拉总体规划的一部分是围绕着,你知道,他们需要做很多事情来实际资助这件事的发生。显然,在2025年,现在的融资环境对人工智能非常有利,对机器人技术非常有利。但你是否感觉到,你知道,在过去几年里,很明显,人们的兴趣呈指数级增长,大量的资金流向这个问题。但是,当你真正把这件事整合在一起时,早期的一些信念是什么,比如说,与逐步前进,做一些更小的事情,然后最终达到人形机器人相比,实际上朝着这个方向发展是可能的?

Brett Adcock: 是的。我有一个有点有趣的故事。你知道,在创立Figure之前,我在2018年创立了Archer Aviation。而且,你知道,在那之前,我成功退出,在软件领域以略高于1亿美元的价格出售了公司。所以我有一点钱,就开始像Archer一样,以这种信念去建设,比如电动飞机是既有可能,而且是现在需要的,也是一个可解决的问题。而且当时对于深科技来说,融资环境几乎不存在。就像,你知道的,早期的投资者并没有投资像特斯拉、Rivian和SpaceX这样的公司。Archer也是一样。我投入了,基本上,我基本上把我所有的流动净资产都投入到Archer上,但是,但我仍然需要大量的资金才能完成。不是说我投入的不够,而是我的净资产还不够,无法使其达到足够重要的程度。

我记得当时的气候有多么艰难。天哪,事情是怎样的,你知道,现在过去多久了?像七年吗?就像,老兄,整个,整个对深层科技的态度真的转变了。曾经有完全专门的资金用于此。就像人们现在意识到,可能这些深层科技公司会成为世界上最大的企业,或者开始成为世界上最大的企业。所以是的,所以我会说,你知道,当我开始明白的时候,我基本上也算是净资产上了一个台阶,并且能够从一开始就实质性地资助这项业务。就像一开始,就自筹资金成立了公司。我想我们在第五个月的时候,每月消耗就达到了100万。我们当时就像铁了心一样,就想着,让我们去造一个人形机器人吧。让我们走出去。比如,让我们取得尽可能多的进展。我们当时正在操控一个人形机器人,这个机器人基本上是我们公司成立后,在不到12个月的时间内,从头开始自主设计完成的。所以我会说它发生了。我会说它发生得非常快。

现在我们所处的环境是,人形机器人看起来将成为通用人工智能(AGI)的最终部署载体。就像如果你想在现实世界中完成事情,你会发现很难把它装在吸尘器或其他任何东西上。就像你真的需要,你真的希望人工智能能够搭载在一个非常高维度的机器人上,以便能够完成工作。所以我们看到机器人技术和人工智能的这种融合出现,我认为,由于这些趋势,肯定有很多资金涌入这个市场。而且我认为,除此之外,机器人正在工作,我们正在看到机器人开始做真正有用的工作。我们可以运行机器人,你知道,在很多情况下,我们几乎整天都在运行机器人,而且它们在执行有用的工作。所以,你开始看到迹象表明,这件事现在实际上将会发生,而且我们正处于正确的十年,这对我们也很有帮助。

但我认为谈及从软件到硬件的这种转变,我总是很好奇地想听听,你知道,当你进行这种转变时,在硬件方面出现了哪些你在软件方面没有看到的挑战?你如何解决这些挑战?还有,你知道,从采用的角度来看,我的直觉是,让人们采用硬件比采用软件要难得多,尤其是在出现如此多的软件的情况下,你知道,人们可以上网,试用一下,如果他们喜欢,也许会成为用户,如果不喜欢,就继续寻找下一个。比如,你是如何设想的,这有点像一个包含两部分的问题。所以再次强调,首先,是总体的挑战,然后是关于采用方面的挑战。

嗯。我是说,听着,这里有很多东西要谈。我认为有几件事,也许我只是对我自己来说做一些观察,比如,对于创业者来说,硬件方面看起来很像软件,只是在时间尺度上放大了10倍、100倍。所以,你知道,需要大量的预先规划,然后说,好的,我们想去测试它,我们想去做它,比如你去设计它,你去构建它,然后购买这些,比如购买供应链中的东西,你把它们拿进来,你尽早地测试它,你制造它,把它们组装在一起,然后看看它是否有效。而且,在某些情况下,这就像你在软件中可能只需几天或几周就能完成的一年。但是有很多这样的情况,我说有很多相似之处,我们有一个潜在的,类似科学方法假设,我们想要去测试。它背后有一些真实的早期,比如,你知道的,客户反馈,或者一些,你知道的,某种其他的输入。然后我们开始构建一些东西,我们将尝试看看它最终是否有效。然后,你知道的,从那里继续迭代。

现在的问题是,你有很长的时间线,你有非常昂贵的东西,你现在必须真正购买硬件,而不是仅仅编写软件。而且,硬件很难推出。一旦你做了,就很难让东西真正发挥作用,因为你必须制造更多这样的东西。或者在数字上,你可以无限地扩展SaaS中的软件或任何东西来扩展它。所以这就像,对于软件企业家来说,这就像软件,就像一个死亡挑战。这就像,你知道,就像是打了兴奋剂的软件创业一样,真的非常困难。

所以,但是,你知道,但我认为这非常值得。而且我认为我在做软件时从未感到真正得到回报。就像在软件领域,我无法感受到它并触摸它。我们会展示产品,你必须登录某个浏览器才能展示,就像在现实世界中物理地构建事物一样,这真的很特别。而且我们在物理世界中花费了大量时间,在某种程度上,软件在过去的10或20年中并没有得到太多关注。我在很多硬件环境中长大,在农场长大,从小就建造东西。在我的软件生涯结束后,我真的很想全身心投入到硬件领域。这也引领我进入 Archer,然后是 Figure 和 Cover 以及我其他的公司。这很棒。

是的,采用更难,一切都更难。所以就像,就像,我会说,像软件,但是就像,只是把旋钮拧到,比如挑战和难度到11。然后你就到这儿了。但我要说的是,我总是很焦虑,内心总是担心确保我设计的东西是对的,方向是对的。而且在某些方面,就像软件一样,你真的不太清楚。所以就像,你,你,你在构建一些东西,你把它发布出去,你早期获得,比如用户的反馈和测试,你并不清楚,比如,这是否会奏效。至于硬件,如果我们有这种信念,比如,好吧,我们应该驾驶飞行器而不是开车,比如,那肯定会奏效,或者我们可以节省人们的时间。或者,比如,建造地下隧道,如果你可以,比如,建造它并使其便宜,如果你能够,如果你能够设计出正确的产品,那肯定会奏效。并且工程方面,就像确保,比如,这是可行的东西去做,相对来说是比较直接的。就像,就像是一阶工程学,我们必须要在白纸上进行。但这是物理学。而且这有一些规则。所以在某种程度上,对我而言,这就像是我作为创业者生涯中最不具压力的几年,比如构建硬件,因为我们有一本物理学规则手册,我们可以基本上,你知道,像,基本上公理化地追溯到它,我实际上非常享受它。就像我只是,你知道,我作为一名硬件创业者的生活既充满挑战又令人愉快。而且,你知道,我喜欢这两个领域。

市场切入策略:从劳动力市场到家庭应用

Brett Adcock: 快速地,关于采用部分,也快速跟进一下。你知道,作为一个团队,你们如何评估,你知道,谁可能最适合,你知道,无论是哪个行业,我知道,显然,你们现在在制造业和物流业方面投入很大。你们如何设想随着你们继续推广?就像,只是等着听取人们的意见吗?比如,嘿,我们认为我们可以在这里加入某种人形机器人。你们好像有一个清单,你知道的,10个行业,10个角色,你们想进入并介绍这个给他们,只是有点好奇想听听你们如何设想这一切。

是的,我想我们有两个重点。我们专注于家庭中的运输机器人,这是一个非常非结构化、高变异性的环境。所以家庭真的很难。然后我们专注于劳动力,比如让机器人去做物流、制造、医疗保健、建筑。这有点滑稽,因为家庭比劳动力难得多。你会认为,如果你攻克了家庭,它会比劳动力市场大一千倍,因为难度,比如工程难度太大了,但实际上它是颠倒的。比如劳动力占GDP的一半。它的变异性要低得多。我这么说是因为工程挑战与变异性成正比。所以,像较低的可变性更容易将自主系统整合进去。在大多数情况下,劳动力市场相对于家庭来说就具有这种较低的可变性,如果你要对此进行总体概括的话。

所以家庭就像是那样,而且更进一步说,在家用领域,你所能收取的成本可能比劳动力市场低一个数量级。比如在家庭中,你得制造一个机器人,然后每月收取几百美元,对吧?比如在劳动力市场,你有巨大的能力赚很多钱,它占国内生产总值的一半。所以我们基本上专注于这两个方向。

然后,你知道,现实是我们正试图制造一种通用机器人。所以我们希望能够签约客户,并且理论上能够完成人类在其设施内部可以做的绝大多数事情。所以只要机器人具有完成任务的运动范围、有效载荷和速度,我们就应该能够完成所有这些工作。我们签下了像上一家物流公司那样的公司。够滑稽的是,我们当时并没有看着它说,哦,我们觉得机器人非常适合处理包裹。让我们去追逐包裹业务,然后去干吧。我们说我们想进入一个我们能够真正扩展的领域。我们认为物流会是这个行业。我们签下了客户。我们完全不知道我们将要做什么。我们参观了一堆设施。我们发现小型包裹物流是运营的重要组成部分。他们在招聘方面遇到了很大的困难,劳动力方面也很困难,诸如此类。

而且,你知道,我们看到了那个问题,然后说,我的天,每个包裹都不一样。它们就像塑料袋。所以就像当你抓取它们时,它们会移动。堆积的方式每次都不同。这就像根本无法通过编程来解决这个问题。就像这必须是,这必须是学习来的。所以我们开始走学习的道路。必须几乎像是,我必须全力以赴地学习这个。我们全力以赴地学习。并且立刻我们就看到了它的效果,这非常有帮助。现在你看到了一些我们正在发布的东西。并且感觉它好像,很难说,但它实际上每天都在变得更好。所以把视频发出去吧。我们现在大约每4秒处理一个包裹。我星期五看到了。我们现在大约每3.5秒处理一个包裹。昨天我坐在那里的时候,我们实际上没有计时。但我发誓那东西快了很多,而且处理不同类型的混合包裹也更好。它在做非常聪明的事情,比如将一个包裹移开,以便它可以将另一个包裹推下生产线,然后处理条形码,并在之后翻转包裹。几乎像是经过一番深思熟虑,像一个机器人正在进行的连锁思维推理。

所以,是的,我认为,你知道,在更高的层面上,我们正试图深入这些行业。我们正试图从学习的角度,从机器人中提取出通用的行为。然后我们希望硬件能够做到人类可以做的大部分事情。而且我们需要,你知道,我们必须能够做所有的事情。所以,我们可能希望开始我们的观点,就像我们现在要引导这个,在劳动力中快速启动这个。然后家庭应用就要来了。就像家庭应用,我认为,距离真正能够将机器人投入其中,并能够自主地为人类做真正有用的工作,只有个位数的年份了。所以我们也在尽可能努力地推进这条轨道。只是就像我们进入的每个家庭,情况都非常非结构化,而且各不相同。所以这只是一个稍微困难一点的问题。

人机交互的未来:建立信任而非拟人化伪装

主持人: 是的,布雷特,要深入探讨软件和硬件之间的差异,我认为在软件层面上,我们现在正看到生产力的巨大爆发,软件开发人员拥有人工智能和所有这些人工智能工具等等。你现在可以做到比以前作为一名工程师所能做到的多10倍。你认为是否存在这样一种情况,或者我很想知道,在构建硬件产品时,我假设其中一些好处已经转化到你们所做的工作中,但你是否觉得我们离能够在构建物理产品和工程物理产品等方面实现加速还有多远?

Brett Adcock: 嗯,关于这个问题,我想说几点。我们,从某种程度上说,就像杠杆臂一样,学习的指数增长要求我们能够大量部署机器人,并且它们需要持续不断地学习和变得更好。我们现在已经看到了这一点。我们看到机器人正在他们所做的事情上变得更好,比如更多的数据,更多的训练,诸如此类的事情。我们也看到机器人在现实世界中做事时也在不断改进。这些是你真正希望将一批物理代理部署到世界各地的事情,你希望它们仅仅通过与世界互动,就能更聪明地了解如何完成这些用例、任务和行为。所以我确实认为现在正在发生这种情况,而且我确实认为在未来一两年内,我们会看到机器人被投入使用,一支机器人队伍被派往世界各地,并且机器人所做的用例实际上每天都在变得更好。而且机器人几乎将这些像模型轨迹一样的东西用作一种方式,放回舰队其余部分的预训练中。

所以这是类似的事情。这基本上是这里最终的护城河,你想要将一支机器人队伍推向市场,它们既随着规模化生产而变得更便宜,又变得更聪明,并且它们正在集体与舰队的其他成员分享这一点。所以我实际上拥有...我的意思是,我不知道我们是否见过这样的技术,除了在某种程度上像AI LLM一样,这是一个走向世界、与世界互动,并随着时间推移变得更聪明和更便宜的系统。这就是...在未来几年内,我们将开始看到这种情况真正发生。然后最终,就像...然后你最终会被基本生产以及如何让足够的机器人走出工厂所束缚。我们有一个新设施,我们刚刚启动了。我们内部称其为巴库。这是我们Figure 3的制造工厂。我们现在正在积极地生产Figure 3机器人。基本上,我去年一整年都在研究如何高速完成事情的那个项目。我们正在内部进行Figure 3的制造。我确实坚信我们将制造大量的机器人。尚未定论的是,我们能否以超过每年生产手机的规模来制造它们?所以这是一个非常难解决的问题。我认为解决这个问题是可能的,但那是超越学习的下一个挑战。我们现在正面临学习瓶颈,然后在某个时候,你将会面临制造瓶颈。

针对刚才说的,问一个快速的问题。不好意思,洛根。显然,人形机器人现在拥有视觉、语音,也能像人类一样移动。你认为下一次迭代还需要什么?真的只是让这些机器人出去学习吗?从硬件角度来看,是否有你认为距离达到你想要的水平或声望还比较远的功能?或者,再说一遍,是不是就像,我们需要把它们放出去。它们需要学习。一旦它们做到了,我们就准备好大干一场了。

我们正在内部进行一些产品开发,这些开发是启用这些功能所必需的。例如,Figure 3 是我们的第一款量产机器人,旨在以高产量制造。它比 Figure 2 便宜 90%。那些是将大量机器人推向世界所需的一些关键事项。这暗指你提出的关于下一步是什么的问题。所以,是的,我们需要能够以低廉的价格推出大量机器人。因此,我们一直将此作为核心重点,例如可制造性和成本,基本上就是这样。我们尝试通过设计的另外几个领域是,整体安全性将极其重要,尤其是在我们进入家庭时。第三件事是,我认为我们的设计路线图与在操作和移动方面随着时间的推移更像人类密切相关。而且你可以在基本上机器人所需的速度和有效载荷以及运动范围内来判断这些。因此,总的趋势是,基本上在我们的路线图中,随着时间的推移,更多地进行类似人类的体力劳动。

然后,是的,下一步是从那里开始,我们如何在相当大的规模上将大量人形机器人集成到世界中,而无需人工协助来每天工作。几乎就像我们过去几年看到的Waymo所做的那样。他们已经能够部署一支车队,并能够证明它实际上正在进行端到端的工作,并随着时间的推移降低人工干预率。我们需要经历那段时间。我们现在正在做这件事。这有点像我们作为一个企业所处的阶段,即我们如何在未来几年向世界推出大量的机器人,然后让它们推理它们正在做什么。你基本上想要极低或无人为干预率,并且整天都在工作。然后从那里开始,下一步就是扩大规模。你必须扩大学习规模,并且必须将制造规模扩大到非常高的水平。所以,是的,也许为了回答你的问题,我们现在正处于那个阶段。我们只是要将更多的东西以物理形式投入到世界中。这将有助于数据收集。这将有助于机器人的可靠性。这将帮助我们更好地将机器人融入世界,这也是一件难事。

主持人: 布雷特,我很想听听你对此的反应。这与此一致,从机器人的角度来看,你认为未来会出现哪些产品特性?在过去两周里,我看到的一个主题是关于人类对机器人的心理反应,以及如果你让它们看起来傻乎乎的,人类会有某种特定的反应。当我坐在这里,对于那些听着但没看着的人来说,有一个人形机器人在布雷特身后时不时地走来走去。这让我想到这样一个现实,那就是你和你的团队整天坐在办公室里看到这种情况发生。这对你来说已经成为一种正常的体验。我很好奇你的反应会是什么,或者你认为当人类逐渐习惯机器人一直存在时,采用的学习曲线会是什么样的。我会举一个非常快速的轶事例子,那就是 DoorDash 使用一家公司来使用这些在芝加哥行驶并提供 DoorDash 送货服务的小型机器人。并且每次我们开车经过其中一个时,我和我的女朋友都会说,哦,我的天哪,这个小机器人太可爱了。他看起来好像只是在试图找到自己的路。它看起来迷路了,以及诸如此类的。这实际上是一个非常有趣的体验。我很好奇你是否认为……我觉得我总体上的感觉是,人们对类人机器人的反应略有不同,它们看起来有点像人类。这有点不祥。你有没有想过家用部署版本相对于工业版本会是什么样子?

Brett Adcock: 是的。所以,是的,关于这一点有一些想法。我认为首先会出现这样一个时刻,当你出去办事或外出时,你会看到更多的类人机器人,数量和看到的人类一样多。我觉得那会像是,我不知道,它真的会感觉像一部科幻电影。我觉得未来的50年被提前到了今天,这感觉会很疯狂。这种情况会发生。你来到这里,会看到很多机器人,感觉……太棒了。我真的,真的很喜欢。我们有机器人在整个工厂里整天走来走去。其中一些会和人交谈,询问他们是否需要水或咖啡。有些只是四处走动,基本上就像在巡逻。这真是太好了。我们喜欢看到机器人。它有助于提高多巴胺水平。而且我们这里也有很多人来进行面试等等。看到这些东西真是太棒了。

我们在人形机器人的设计和美学方面花了很多时间。我们有一个完整的工业设计团队。他们中的大多数来自主要的汽车集团。我们不仅考虑机器人本身的设计,还考虑机器人最终进入家庭所需经历的人机交互。所以这就像我们可以在这里展开的一条长线。但我认为你之前提到的一件事,比如软化机器人,使其看起来不具威胁性等等。我对此有一个非常强烈的观点,即机器人需要表现得非常能干、非常聪明和复杂,因为它就是如此。并且你会通过以下方式与机器人在安全和隐私方面建立起人类的信任:A,做正确的事情;B,在实际用例中,例如在家庭或工作场所,从机器人性能方面真正出色地执行。

所以在我看来,当你给那些真正有能力的机器人装上巨大的卡通眼睛之类的东西时,是一种巨大的伤害。在很多情况下,它们真的很快。随着时间的推移,它们可以做人类可以做的绝大多数事情。所以,装上卡通眼睛几乎就像你试图欺骗其他人,让他们觉得你是个宝贵的小东西,你知道,就像,你知道,真的很滑稽和卡通化。我认为从设计的角度来看,这真的很愚蠢。所以,你知道,有些机器人团队会在机器人身上,比如在屏幕上,安装眼睛之类的东西。但实际上,这很滑稽。而且,这些都是非常精密的机器,在我看来,应该相应地进行设计。

交互与安全:语音控制和隐私的基石

Brett Adcock: 在家庭中,我们现在正在经历安全、隐私和网络安全等一系列问题。而且说实话,这真的很难。比如,在家庭安全方面,我们不想撞到任何人。我们不想撞到任何宠物。所以基本上意味着我们需要,你知道,在任何时候,360度,我们需要检测到任何移动的动物或人。然后,你知道,还有语义安全,比如,我们真的不想打翻蜡烛把房子烧毁。所以在这个领域,每个人都需要非常周到,即使它是物理上安全的,也需要非常周到地考虑它如何移动,比如在一个家里,不危及周围的任何人。所以我认为这很难,这是个难题。

你问了一个问题,有点像,我们如何让社会接受这些东西?我真的希望有一大批像我和我们这里的人一样的科幻迷,希望人类在他们的家中。我这周家里真的有个人在工作。所以我认为会有很多人真的想要一个机器人,并且门槛需要是,它需要足够安全,并且需要真正地做足够有用的工作。而且它需要是自主的。而且它需要是,你知道的,负担得起的。就像这些都是需要全部实现的事情。如果我们能够实现这些,我想,我觉得人们,我觉得每个人都会想要一个机器人来洗衣服,来清理碗碟,把它们放好,比如煮咖啡,做饭。就像你会想要有人来做所有这些工作。就像我从来,我早上醒来有时会卸洗碗机。这就像,我只是想再也不想做这件事了。就像我会想,为什么,你知道吗?所以我认为,当我们能够展示真正的具身智能可以为人类做那样的事情,并且以相对负担得起的价格去做,我们可以全天候地运行那些东西。我的意思是,在晚上,这可能就像真正缓慢地踮着脚走路,收拾所有的盘子,或者做其他的事情。就像,所以我认为这对家庭和劳动力来说都将是非常、非常、非常棒的。我们两者都需要它们。

我认为你所看到的是,我看到你有一个单一的机器人在遍历所有这些。就像你在家有人类工作一样,你也有在劳动力队伍中的人类。你有,你知道,我们为一种像普通非专业人士的人类建造了劳动力和家庭。这就是你将看到的。我认为你会看到一个,就像几乎像一个手机。你会看到一个用于人形机器人的平台,并且在未来10年内,它的大部分功能将受到软件的限制。

很想知道,而且我确信这可能是一个愚蠢的问题,但你如何保持人类参与其中?比如,如果我有一个人形机器人在我的公寓里,对吧?该怎么做呢?就像,很明显我在和人类对话,但是,控制方式是什么?比如,你实际上如何处理人形机器人正在做的事情,并且知道和拥有安全感,比如,嘿,你知道,我可以去我的手机。是否有一个应用程序,我可以进入并说,嘿,做X、Y和Z。我知道Mantic,我认为也有应用程序用户界面层。但是,对于正在采用的人来说,目前的情况是什么样的?而且,你知道,你如何看待未来的发展?因为我知道回到你的隐私声明,你知道,人们在你的公寓里拥有人形机器人。他们在听,他们在看,你知道,我们如何确保它保持在封闭的门内,而不是更广泛的受众。

是的。所以我的观点是,整个开箱体验,以及机器人在家中的整个默认用户界面,以及世界任何地方的机器人,都需要通过语音来完成。你提到像手机或电脑之类的东西,比如,当我们和一个机器人在一起,然后在电脑上打开终端,输入命令,比如发出一个指令或点击一个按钮时,感觉非常奇怪。这太奇怪了。它的延迟非常糟糕。带宽很低。这就像,你需要,它只是花费太多时间。你会想要直接和机器人交谈。如果你不在它旁边,你就会给它发短信。我们拥有的每个机器人内部都有一张带有手机号码的eSIM卡。你会想要通过自然语言与机器人进行交流,而像我们的机器人Helix一样,神经网络是经过语言调节的。所以你会想要,是的,你会想要,我们正在通过语言来调节一切。这将像是你家中人形机器人的默认自然层。所以如果你不想让它做某事,你只需告诉它并提示它去做这件事。

并且,当它涉及到隐私和网络安全等其他事情时,这是一个我们正在花费大量时间的重要话题。实际上,我们刚刚在这里建立了整个隐私和网络安全部门,大概已经进行了4个月。就像,我们有一个来自Snapchat和Google的小团队,他们以前曾处理过其中的一些问题,包括商业方面、公司方面的网络安全以及产品方面。而且,你知道,我们必须在这些领域做好大约30件事。不是说,好吧,一件事,你就像,好吧,你只要做这件事,你就会没事。不是那样的。那将会非常,非常靠不住。

我认为这也是另一个问题,我们收到了很多关于中国机器人之类的问题。我认为中国的机器人在美国或欧洲将会面临非常艰难的处境,比如部署到家庭和商业劳动力市场。就像我认为,就目前而言,对于他们来说,这是一个非常棘手的问题。所以我想你真的需要与你互动的公司建立真正的品牌信任。它比电脑和电话更复杂。因此,对于这个问题来说,隐私和网络安全就显得更加重要。所以这些问题是相对而言的,比如,要真正做好产品安全和公司安全,确实非常微妙。然后总体上我们如何考虑这里的隐私问题。所以我认为这也是一个非常棘手的问题。所以我不想给人一种我们今年就能解决所有问题的印象,但我们正在非常努力地解决它。而且这是一件重要的事情。你肯定不希望机器人像那样,你知道,你基本上希望在机器人的底层基板的非生物时间记忆中制定规则,规定它能做什么和不能做什么。你不希望任何人在任何情况下都能获得机器人的root权限。所以我们现在正在研究的很多东西对于在全球范围内启用数百万台机器人非常重要。

终极愿景:当AGI拥有身体,物理世界的变革

主持人: 我一直在思考的一件事,听起来你和我想法一致,那就是过去两年里我意识到,如果我们在不久的将来拥有人工智能超级智能,我不会感到惊讶。但是,当我向窗外看,观察周围的物理世界时,很明显,情况并非如此,我会走到外面。世界看起来和我现在看到的一模一样。并且构建这种数字智能并不能直接地,至少在短期内,转化为我周围物理世界的改变。就像你知道的那样,人类目前在物理世界中的生活,他们在物理世界中的生活将非常相似。数字方面会有所不同,因为你将拥有按需智能。但听起来你认为,人形机器人是我们看到物理人类世界进步加速的方式。你对真正实现这一目标的时间线有什么看法?还有,你知道的,感觉指数增长开始时会非常缓慢,但随后会以实质性的方式真正起飞。所以,是的,我很想听听你对此的反应。

Brett Adcock: 感觉不像未来,不是吗?未来似乎已经到来了一点,但感觉不像未来。我确实认为,在这样一个世界里,类人机器人随处可见,为人类做各种各样的事情,我们可以乘坐飞行汽车去任何地方,以及其他事情。我确实认为那是我们都想要的未来。我认为这促使我去帮助我现在所从事的公司和项目。所以我确实觉得这些东西对于令人兴奋的未来非常重要。

我还想补充一点,我们正在接近数字超级智能。感觉它确实近在咫尺,而且今天的超级智能就像是存在于服务器中,存在于一个盒子里。我在Figure公司致力于人形机器人研究的原因之一是,我最终认为,如果我们无法解决人形机器人的问题,那么对我们来说,就相当于我们在接近数字超级智能。我们拥有,你知道的,我们拥有所有这些代理,比如数字代理,为我们,为人类工作。它们在提出要求,它们需要,它们将需要在物理世界中完成大量的事情。如果我们没有解决人形机器人的问题,那么它们就会要求人类,或者强迫、指挥或付钱给人类去做这些工作。我们将会像,你知道的,成为那些数字超级智能的奴隶。

而人形机器人是实现这一目标的完美部署载体。它可以完成像人类一样的大部分事情。它需要这种语义上的智能,才能真正地在这种混乱的环境中穿梭于物理世界。而且它是完美的形态因素,你无法在你的家用吸尘器或其他任何东西上得到它。就像你刚才说的,这没有硬件支持。

所以我的看法是,你将会首先看到人形机器人被建造并部署在少量的地方,全天候地工作。如果你有幸能够亲眼看到这些,你就会进来,然后惊叹道,天啊,感觉它现在可以工作了。我认为当我们乘坐Waymo时,可能我们都会有这种感觉,但是,我假设美国的大部分地区都没有乘坐过Waymo。因为美国的大部分地区都没有乘坐过Waymo。所以当我打电话给我妈妈时,她说,你知道,就像,你知道的,在伊利诺伊州,就在伊利诺伊州的正中间。就像,我乘坐Waymo,就像自动驾驶就在这里一样。你知道,就像,它每天都在发生。人形机器人正在出现。它们正在工作。而且它目前只是在有限的范围内。

而且我们,我们喜欢,我们会看到,你知道,这个非常渐进的点,我们越来越走出去,并且学到东西。我们需要学习如何整合,可靠性如何运作,维护如何运作,以及人机交互如何运作。我们在大规模上工作,比如规模化学习如何运作。就像我们需要,作为一个公司,我们正在通过部署机器人并将越来越多的机器人推向世界来弄清楚这一点。所以,你知道,我们每天都在商业环境中运行机器人。我们也在这里运行。所以我们正在获得真正的经验,试图弄清楚这一点。然后我认为,在这一点上,我们已经学到了很多,现在我们正在努力推出越来越多的机器人。然后,随着我们推出越来越多的机器人,管理更大的机器人群将会更加困难,而且,你知道,与我们过去可能做到的相比,需要更少的“保姆式”照看。

然后在某个时刻,我们就会真正攻克它,我们将能够向世界投放数亿个机器人。能够投放几十万个机器人和投放数百万个机器人之间不会有太大区别。你必须拥有相同的技术。你必须,你不能,你知道,你必须拥有极低甚至零干预率。你必须,比如,你的默认用户界面需要是语音。你需要在学习方面进行大致的概括。你需要有规模,比如,你知道,从人类那里学习,比如这些都需要像,你需要学习这些,你需要在达到某种规模之前弄清楚这些。因此,我们的下一个重大举措是在未来4年内投放10万个机器人。这就是我们正在努力做的事情。这就是巴库,我们开设的制造工厂,能够做到的。我们现在已经开始制作3字形机器人了。它们实际上在运行,它们实际上在自主工作。我们希望在接下来的3到4年,或者说未来4年内,将规模扩展到那些领域。如果我们能达到那些数字,我们认为我们正走在将数百万个机器人推向世界的轨道上。

所以,是的,不像软件,我们不能以数字方式无限复制它。但我认为这里最大的障碍是,最大的障碍是走进某个地方并看到它在工作。就像那样,就像那是整个问题中最难的部分。就像,就是让它,让它在一段时间的轮班中自主完成工作。在我们刚刚展示的包裹处理工人的例子中,它是通过螺旋神经网络完成的。它有,我认为我们刚推出的最新版本有大约60小时的额外数据。就像在我们做任何事情之前,它就像,不知道,它根本不知道如何处理那种情况下的物流。我们向其中输入了60小时的数据,它完成了我们向你展示的所有工作。这就像,从宏观角度来看,什么都不是。所以我们基本上能够开始收集数亿甚至数十亿小时的类人数据。我认为我们能够将这些扩展到几乎像,像,你知道的,十亿单位的规模。你可以将它们扩展到世界的每个角落。这就是我们努力要做的事情。我认为我们必须经历这些阶段,因为它是硬件,而且非常困难。而且,我们必须学习如何大规模地整合这些。

展望未来:从超级智能到人类新篇章

主持人: 是的。关于这一点,我有个快速的跟进问题,就是,你认为快速学习过程在多大程度上受益于世界知识的压缩?我不太清楚你们的模型是基于什么,但一般来说,就像我们这个生态系统,搞清楚如何将越来越多的世界知识压缩到越来越小的模型中。就像你们都看到了直接的好处,模型可以学得更快,因为它们已经内置了很多知识。

Brett Adcock: 是的,我们,就像我们,这肯定有帮助。比如,因为我们可以在本地运行这些模型,所以速度更快,体积更小。我们基本上使用这些视觉语言模型(VLMs)来进行语义基础,比如用于视觉降维模型(VLA),也就是螺旋模型(Helix)。我们运行它几乎就像一个更大的大脑,在S2级别上运行,速度基本上较慢,大约为7到9赫兹,而不是我们的一些较低级别的Transformer策略。所以我们肯定从中受益。

问题是,这些模型并不真正了解如何在几乎物理的层面上与周围的不同对象交互。比如,能够抓住一个物体,并真正理解机器人的本体感受状态,以及它应该如何处理某些类型的物体,这些物体可能更顺从或更坚硬,或者类似的情况,这些都是模型完全不了解的。他们没有接受过任何那种训练。没有,就像,没有像机器人技术的YouTube。它不存在。所以我们不得不自己设计所有那些工作。我们的模型中有一个VLM骨干,这对于语义基础非常有用。在我们称之为Helix的整个项目中,我们已经完成了,我认为在这一点上,你知道,我们在Figure的整个员工中有20%在Helix团队。所以对于仅仅是人工智能团队来说,这是一个相当大的规模。我们唯一在做的问题是像机器人学习以及如何极快地训练新的行为。

我真的很好奇,而且我认为你是获得对此反馈的绝佳人选,布雷特。你知道,显然我们在谈论超级智能。我们正在讨论将数十亿机器人融入世界本身的想法。你知道,你如何设想超级智能,比如说,十年或二十年后会是什么样子?它对人类来说会是什么样子?你希望它能实现什么目标,或者说目标是什么?是为了让人们每天有更多的时间与家人共度吗?还是说,既然有了这些可以帮助你执行任务的机器人,就能解锁更高层次的创造力?很想让你描绘一下,作为一个社会,当我们达到你所说的那些阈值和基准时,会是什么样子。

是的,趋势线确实显示,人形机器人每年都能做越来越多人类能做的事情,而且随着时间的推移,大多数事情都会做得比人类更好。这肯定会在我们有生之年看到。我认为,我认为那会变成一种情况,即你在世界上所做的任何类型的工作,无论是在家里还是在职场,对人类来说都是一种选择。这是可选的。就像你可以选择做饭,洗衣服,煮咖啡,遛狗,照看孩子,或者做任何你想做的事情,或者做建筑工作,随便什么,或者你可以让机器人来做这些。而且那个机器人将会显著地增加国内生产总值。我的意思是,我们今天衡量国内生产总值,比如按人均计算。而且,这些基本上就是合成人。所以,你知道,即使今年我们也会有机器人在巴库的生产线上帮助建造其他机器人。所以,在你的有生之年,你肯定会看到机器人建造机器人。

所以,就像你有了机器人建造机器人,它们走出去工作,而且大部分工作比人类做得更好,更快,更可靠。那么,我们该如何利用我们的时间呢?比如,在某种程度上,我们的目的是什么?这就变成了一个非常困难的对话,特别是对于像我这样的人,就像我一生中的大部分时间都在工作并且热爱它一样。比如,我想到我们正在制造比我们所有人都更聪明、更好的机器人和智能代理,可能就在我们有生之年。是的,这引起了很多焦虑。我会说。所以我希望人们花更多的时间做他们真正热爱的事情。那可以是滑雪,与家人共度时光。我希望30年后我们不会坐在这里,人们一生要工作50年,而且你知道,他们生命中很大一部分时间都花在这些体力劳动上。

快速地、快速地跟进一下,然后Logan你可以完成这个问题。你认为会有一种像特斯拉模式的东西出现吗?比如,我知道埃隆正在推动,在你不用特斯拉的时候买一辆,我们会变成某种优步或自动出租车,为你创造收入。你认为你会达到这样一种程度吗?即每个人都拥有一个人形机器人,然后他们可以部署该机器人来执行X、Y和Z任务,机器人获得某种补偿,然后回到你身边?就像,再说一次,只是有点好奇地想描绘这幅图景,听听你的想法。

是的,只要告诉你的机器人,如果你像你的伙伴一样,或者想借用它,你只要告诉你的机器人过去,走下街,去隔壁邻居家帮忙就行了。你还会有一个为你赚钱的机器人。我甚至会说,从长远来看,机器人的制造成本相对较低,并且可以外出从事基本上像持续不断的工作,这将长期压低商品和服务价格。就像每个人都能负担得起几乎任何东西,无论是理发、商品、农产品还是任何类型的服务,你都会压低所有这些成本。如果一个机器人正在做这些,那仅仅是机器人的成本,以及你需要的任何能源。如果涉及到房地产,可能还有房地产的成本,仅此而已。通过像合成人一样昼夜不停地工作,而且几乎能满足你所需的无限量需求,你就能大幅降低所有成本。所以,是的,你会拥有,这将会是,你会拥有一个人格,你会要求它,你知道,提高它的幽默设置,在某些时候变得更严肃。而且,你将会和它交谈,你会给它发短信,它会不断地为你工作。

主持人: 是的。生活将会很精彩。布雷特,我们想问大家的最后一个问题,我们会让它非常开放,那就是你希望在2025年发生什么,以及你希望什么不要发生。这非常含糊,但为了给你施加压力,我们总是能得到非常有趣的东西。所以我很好奇,好奇你在这两个方面是怎么想的。

Brett Adcock: 你知道,当我们接近那个时候,我想,我正在努力,你知道,就像我的公司,比如Archer figure and cover。我希望我的公司在那段时间里一切顺利。所以希望我们能在那里创造这样一个令人兴奋的未来。就我个人而言,我真的希望我们在提升人类种族所需的技术方面更上一层楼。比如我们需要研究,你知道,水下城市、太空电梯或尼尔结构,诸如此类到2050年真正能够推动人类进步的东西。那些就像,这些领域中的很多就像,正开始变得越来越有可能。比如技术就绪水平正在提高,而且,你知道,我们在,你知道,四五十年代和六十年代有过宏伟的胆大目标。我们需要为人类设定新的标准。我们需要,我们将需要整个人类和超级智能来帮助我们到达那里。但这是,这些在我们有生之年是可能实现的。我们希望看到。所以我希望,你知道,我们正在进入下一个阶段。因为你知道,我关心的是技术杠杆,它基本上可以增强全球生产力和幸福感。比如我想,是的,希望我们,希望我们在2050年之前能有一个太空电梯。那就太棒了。我认为这有可能。还有更多类似的技术,我认为会是我们可能生活的最令人兴奋的未来。是的。

主持人: 我喜欢这样,布雷特。这太棒了。感谢您抽出时间与我们聊天。很高兴看到你们所有人不断取得进展。我觉得你们所有公司的未来都非常光明。非常感谢与我们聊天。

Brett Adcock: 是的。洛根、诺兰,感谢邀请我参与。

相关内容

热门资讯

受贿2.71亿余元 西藏自治区... 据央视新闻消息,2025年7月8日,湖南省郴州市中级人民法院公开宣判西藏自治区人民政府原党组成员、副...
富邦科技:2021年公司与蚂蚁... 7月8日,湖北富邦科技股份有限公司(富邦科技,300387.SZ)在深交所互动易平台表示,2021年...
“星光·燕赵号”京津冀首列观光... 中新网石家庄7月8日电 (邢璐 张雍)中国铁路北京局集团有限公司(以下简称“国铁北京局”)8日消息,...
“光影传奇·岁月回响”国际影视... 转自:北京日报客户端珍品如云纵览光影长河,金曲联动献上文化盛宴。7月7日晚,市文联以中国电影诞生12...
ETF日报|科创信息技术ETF... 截至2025年7月8日,上证指数收涨0.70%,报3497.48点,实现4连涨;深证成指收涨1.47...