加州大学伯克利Dr. Allen Yang:物理AI的分水岭时刻尚未到来|CES 2026
创始人
2026-01-10 22:43:14

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:钛媒体APP)

加州大学伯克利Dr. Allen Yang

当前,人工智能行业正深陷 “GPU 竞赛” 的热潮,在2026年CES(国际消费电子展)现场随处可见对云端 AI 应用的热议,“人均GPU 数量” 成为衡量技术实力的热门指标,从企业到国家层面都在追逐算力的堆砌。

美西时间1月6日-8日,钛媒体CES 2026「Talk to the World」系列论坛在拉斯维加斯举办。会上,加州大学伯克利分校Vive 增强现实中心创始执行主任Dr. Allen Yang提出了一个清醒而关键的观点:我们应超越云端,将目光投向物理世界,探寻物理 AI 的下一个 “AlphaGo时刻”。

作为伯克利 Vive 增强现实中心创始执行主任,Dr. Allen Yang主导着 AR/VR、元宇宙及赛车自动驾驶三大创新方向。过去四年,他带领伯克利 AI 赛车队连续征战 CES 自动驾驶挑战赛,并在 2025 年斩获头对头超车项目冠军。这些扎根物理场景的实践让他深刻意识到,物理 AI 与依赖云端数据的大型语言模型有着本质区别,其真正的 “分水岭时刻” 尚未到来。

他指出,虽然以AlphaGo和大型语言模型为代表的AI已取得里程碑式突破,但物理AI仍亟待属于自己的“分水岭时刻”。其挑战并非源于算力不足,而是根植于物理世界独特的复杂性。

首先,物理AI极度缺乏覆盖所有极端场景的训练数据。不同于语言模型可汲取数十年互联网的养分,现实世界中的“边缘案例”——如罕见的天气、突发障碍物、极端的机械故障——难以被穷尽采集。

其次,毫秒级的实时响应是生命线。在高速行驶或紧急救援中,决策延迟意味着失败甚至灾难。一个开源项目“LLM Colosseum”的实验生动地证明了这一点:在《街头霸王》游戏中,虽然小模型单次决策精度较低,但其高频的决策速度能使其战胜响应缓慢的大型模型。这印证了那句古老的格言:完美是优秀的敌人。

再次,众多前沿场景中“云端”是缺席的。无论是月球探索、矿难救援,还是火灾现场,稳定、高速的网络连接都是奢望。在这些领域,部署在设备本地的“边缘AI”是唯一可行的智能。

为攻克这些挑战,Dr. Allen Yang的团队选择在最具挑战性的赛道上进行实战——高速自动驾驶赛车。

在 2025 年 CES 自动驾驶挑战赛中,赛车实现 140 英里 / 小时的全自主行驶,伯克利车队更是以 163 英里 / 小时的速度完成超车。当普渡大学赛车尝试反超时,两车因弯道漂移打破 2-5 米安全距离,双双自动紧急制动,这一场景反映出,在动态、高速的物理交互中,AI系统不仅需进行复杂的实时感知与规划,更必须在安全规则与竞争目标之间做出平衡。此后,他们又将赛道延伸至中国张家界天门山。这条全长10.77公里、拥有99道弯的山路,为自动驾驶系统提供了包含陡坡、急弯与多变天气的综合测试场。清华大学、浙江大学等九所国内高校参与了相关项目。

2026年,Dr. Allen Yang进一步宣布,将在原有赛事基础上增设天门山人形机器人挑战赛,邀请研发机构测试机器人在非结构化地形——如攀登999级台阶——中的移动与决策能力。他表示,物理AI的进展不仅依赖于算法与硬件的迭代,也有赖于跨学科协作与在真实场景中持续积累的经验。在极端环境下的技术实践与人才培养,或将为行业带来新的启发。

以下为Dr. Allen Yang演讲全文,经钛媒体编辑:

大家好,欢迎大家来到CES,我是Dr. Allen Yang。首先感谢钛媒体的邀请,如今 CES 上到处都在谈论基于云的人工智能应用。我也听说,当人们寻找下一个酷炫的人工智能应用时,每个人都在问的一个问题是关于这个叫做GPP的新东西,我刚刚才知道这是指一家公司里人均拥有多少个 GPU。所以拥有的 GPU 越多,似乎就越强大,甚至有人在问一个国家能有多少个 GPU 来推动应用的发展。但今天我想邀请大家把目光超越云端,探寻物理人工智能领域的下一个“AlphaGo时刻”。

先简单介绍一下我自己。今年 2026 年对我来说也是个不错的年份,因为我已在加州大学伯克利分校工作了 20 年。在伯克利,我目前是 Vive 增强现实中心创始执行主任,之前曾是冯氏工程领导力研究院的首席科学家。我很自豪能在三个领域引领创新:第一个是增强现实 / 虚拟现实(AR/VR),第二个是元宇宙(Metaphors),第三个是赛车应用中的自动驾驶技术。

今年回到 CES,对我来说是个五味杂陈的时刻,因为这让我想起,在过去的四年里,我们一直带领伯克利人工智能赛车队连续参加自动驾驶挑战赛。过去四年的 CES 都有我们的身影。特别是在去年 2025 年 CES 上,伯克利人工智能赛车队赢得了头对头超车项目的冠军。

今天,我想谈谈物理人工智能。之所以伯克利以及许多与我们竞争的大学会投身其中,是因为我们想培育下一个 “分水岭时刻”。

这些分水岭时刻对培养未来的人工智能用户至关重要,而且大家都知道,到目前为止,人工智能创新无疑是吸引数百万用户速度最快的技术,对吧?这其实要归功于人工智能过去的分水岭时刻,比如 IBM 研发的 “深蓝”、DeepMind 研发的 “AlphaGo”。

现在,每个人都知道强化学习,在过去三年里,大型语言模型也应运而生。所以,在来 CES 准备PPT之前,我本打算说服大家,物理人工智能仍在等待属于它的黄金时刻,也就是它自己的分水岭时刻。

为什么这么说呢?第一个原因是,尽管强化学习造就了世界上最厉害的围棋选手,能击败所有围棋大师。但现在,如果你和自动驾驶公司交流就会发现,仅靠强化学习,还不足以打造出像人类一样擅长驾驶的自动驾驶系统。

一个关键的例子就是我们惨痛经历过的 “Beta 三时刻”。在这里,我准备了一段短视频,向大家展示伯克利人工智能赛车队过去经历的一个关键失败时刻。

这段视频会让大家看到我们学到的东西,以及我们在伯克利和许多大学里,认真教给最优秀学生的知识。当我们把这些理论应用到高速人工智能赛车的现实世界中时,我们发现,课本上的知识往往无法直接奏效。

(视频播放)

这是 2024 年在印第安纳赛车场,伯克利对阵圣母大学(Uni More,结合语境推测)的一段短视频。接下来,大家就会明白我在说什么了。

当时发生了什么呢?

在这场比赛之前,印第安纳赛车场遭遇了特大暴雨,由于云层厚重,GPS 卫星信号丢失。我们的赛车系统在那一刻决定将定位源信号从一个系统切换到另一个系统。这些混合系统的不一致性,导致我们的控制算法选择了错误的行驶曲率,而不是正确的那条。这恰恰说明,当我们谈论物理人工智能时,它实际上是理论与实践、科学与工程的深度结合。

在来 CES 之前,我还准备了第二个理由,想说服大家物理人工智能的分水岭时刻尚未到来。

我的第二个论点是,行为智能似乎比语言智能更基础。

在座有孩子的各位可能都能理解,人类婴儿在学会用母语描述世界之前,就已经会通过行动去探索未知的世界了。但现在,在CES 上,多亏了黄仁勋的主题演讲,我们知道英伟达已经全面进军物理人工智能的新时代。所以,我觉得他们帮我省去了很多说服大家的功夫。

我想,在 CES 上,大家已经听说了很多很棒的新工具,它们能帮你获得更多 GPU、更大内存,还能实现更长的思考过程。或许你还会用到混合专家模型(Mixture of Experts)、思维链(Chain of Thoughts),让你的 GPT 模型思考得更聪明、更深入。不过,抛开这些优秀的工具,我想针对物理人工智能补充几个观察结论。

第一,物理人工智能需要更多的极端边缘案例。

为什么这么说呢?当我们为大型语言模型增加更多 GPU 时,强大的计算平台本身就能让 GPT 模型变得更聪明。为什么?因为所有的 GPT 模型都从互联网获取知识。

自互联网泡沫以来的 30 年里,互联网几乎已经涵盖了所有的边缘案例、世界上所有的语言,你只需编写一个脚本就能爬取互联网上的这些数据。事实上,你甚至可以说,互联网为语言模型准备的内容太多了。有时候,我们的人工智能模型会从这些数据中学习到不良内容。这就像我们必须向孩子屏蔽那些不好的语言,避免他们学到一样。

但如果切换到物理人工智能领域,很容易就能明白,如今没有任何一家物理人工智能公司能声称,他们已经积累了足够多的物理人工智能数据,涵盖了所有的极端边缘案例。

我想分享的第二个观察结论是,除了需要覆盖所有边缘案例,物理人工智能还要求极高的毫秒级低延迟性能。

对于 GPT 模型来说,增加更多 GPU 会消耗更多能源、更多时间,这也会导致订阅费用更高,对吧?所以,你要为你的算力、云服务、使用时长支付更多费用。但在物理人工智能领域,情况并非如此 —— 为更大的模型支付更多费用,并不一定能带来成功的解决方案。

我给大家举个例子。

有一个名为 “LLM Colosseum” 的开源项目,在这个项目中,作者们对接了不同类型的语言模型,让它们操控游戏角色玩《街头霸王 3》。比如,在这段视频中,你可以让 ChatGPT 操控红色的角色。你也可以让另一个可能更小的模型,比如 Mistral,操控绿色的角色。

然而,实验结果出来后,相当令人惊讶 —— 或者说,取决于你的视角,也可能并不惊讶。“LLM Colosseum” 的实验发现,虽然小型模型的单次推理精度较低,但它们每秒、每分钟能进行更快的推理,做出的决策数量也比大型语言模型多得多。

换句话说,英语中有句老话 “完美是优秀的敌人”,在物理人工智能领域,你宁愿每秒获得 50 次、100 次(或赫兹级)的不完美决策,也不愿用一个庞大的大型模型,每秒只能进行 1 到 2 次完美决策。在这种情况下,小型模型实际上会比大型模型表现更好。

我想分享的第三个观察结论是,在更多前沿应用场景中,月球上可没有云端,所以你根本没有机会为你的云端和互联网搭建现代化的基础设施。这些前沿应用包括火灾救援。当发生火灾、你的房子被烧毁、整个社区都被烧毁时,你怎么可能还能用上互联网呢?这还包括油气勘探、采矿作业。

当然,当我们考虑帮助美国国家航空航天局(NASA)将宇航员送往月球和火星时,我们如何打造出能容纳整个机构所有知识的智能宇航服?但与此同时,我们不可能先在月球或火星上搭建云端。月球上没有云端。

总而言之,我今天想和大家分享的观点是,除了寻找能提供更多 GPU、更大内存、更长思考过程(比如下一个思维链技术)的优秀新工具,我们还必须把目光超越云端,将物理人工智能视为下一个前沿领域。

为什么?有三个原因。

第一,边缘案例与安全对人类用户至关重要。

因此,当我们部署物理人工智能机器人或汽车,让它们与我们共享同一个环境时,这些系统必须在边缘端实现毫秒级延迟的决策。无论你的云端技术多么复杂,至少你必须有一个本地解决方案作为安全备份。

第二,对于许多前沿应用来说,边缘人工智能就是你唯一能依赖的人工智能 —— 你没有能力为你的应用、宇航员或作业人员搭建云端。

以上就是我想分享的主要观点和理由,我试图说服大家,对于物理人工智能应用,我们必须把目光超越云端。

接下来,我想和大家分享一些我们为探寻物理人工智能下一个分水岭时刻所做的创新尝试。

第一个是回顾 2025 年 CES 印第安纳自动驾驶挑战赛,在这场比赛的决赛中,伯克利人工智能赛车队对阵普渡大学人工智能赛车队的头对头超车项目。五年后,参与自动驾驶挑战赛的十支队伍已经实现了 140 英里 / 小时(约 225 公里 / 小时)的全自主行驶基准速度。

140 英里 / 小时,这个基准速度是加州或内华达州高速公路限速的两倍,在那些地方,超过这个速度就会被开罚单。

除此之外,比赛规则要求进行头对头竞争,进攻方需要制定正确的行为和运动规划,才能超越防守方。作为进攻方,你必须在超过 140 英里 / 小时的速度下,成功选择一条清晰的路线,超越你的 “对手舞伴”(指防守方赛车)。

大家可以看到,蓝色的是伯克利的赛车,金色的是普渡大学的赛车,这是去年在拉斯维加斯赛车场举办的 CES 比赛中的场景。伯克利的赛车以 163 英里 / 小时(约 262 公里 / 小时)的最高速度超越了普渡大学的赛车。这比 140 英里 / 小时的基准速度还要快 20 英里。

接下来,很快大家就会看到,按照比赛规则,普渡大学的赛车要尝试反超伯克利的赛车,但这时发生了一些事情。

普渡大学的赛车还没准备好,现在他们得加把劲了。所以,决定是跟在后面还是超车,完全是自主进行的。场边的学生和教职员工什么也做不了。他们唯一能按的按钮就是放弃,也就是切断电源。除了切断电源,他们只能站在一旁,等着看电脑如何运作。两个系统之间没有任何通信。

除了要负责自己的驾驶决策,你还必须感知对手的动向,猜测对手要做什么。

普渡大学的赛车来了。

速度飙升到 158 英里 / 小时,他们还没完成超越,没完成超越。没有发生碰撞。所以,如果你想看碰撞的画面,可能会有点失望。

但当时的情况是,根据比赛规则,两辆车之间必须保持 2 到 5 米的安全距离。

如果任何一辆车或两辆车都检测到安全距离被侵犯,根据规则,车辆应该立即刹车。不幸的是,普渡大学的赛车尝试超越伯克利赛车的那一刻,正好是在弯道处。如果你在弯道处高速行驶,赛车会向外侧漂移。正是因为这种漂移,安全距离被打破了。所以两辆车实际上同时启动了紧急刹车。

但因为这是一场比赛,进攻方(普渡大学赛车)刹车就意味着放弃比赛,就在那一刻,两辆车都做出了正确且智能的决策,保护了安全距离,退出了高速行驶。

也正是在那一刻,去年在 CES 上,伯克利的赛车以 163 英里 / 小时的最高速度,赢得了头对头超车项目的冠军。

我想,作为拥有这辆价值 100 万美元赛车的教职员工之一,同时也是监督研究生参与这项全年无休的高速方程式风格比赛的导师,对我来说,最宝贵的时刻。

其实并不是我们的赛车超越了其他赛车。而是在那一刻,学生们脸上露出的笑容和满足感 —— 他们真正学到了如何突破物理人工智能极限的关键知识,我认为这就是教育的价值。

而且我认为,对于所有想打造下一个产品的企业家和初创公司来说,这才是最宝贵的资产,这些学生正是你们应该沟通合作的对象。

我很期待能和大家交流,如果你想参与进来,共同创造下一个分水岭时刻,接下来,我想给大家展示另一个领域的案例。

把赛车推向高速只是边缘案例中的一种,事实上,这是一种你本不应该遇到的边缘案例,也就是人类驾驶员非法将自动驾驶汽车开到法定限速以上的情况。

但对于来自中国的观众来说,2025 年中国有一个名为 “懂车帝” 的社交媒体平台,他们创建了六大类边缘案例,对 20 多款自动驾驶系统的性能进行了测试。

当然,这不是你想和家人一起遇到的边缘案例,而这实际上是最新的测试结果,无疑是亚洲范围内最全面的自动驾驶测试,涵盖了六大类边缘案例。

这六大类边缘案例充分表明,至少在自动驾驶领域,物理人工智能的分水岭时刻尚未到来。

为了解决这个问题,我和我的团队实际上打造了下一个人工智能赛车核心挑战赛。

所以,在这个案例中,我们的目标是见证下一个 “AlphaGo时刻”

我们并不是要在一级方程式赛道上追求最高速度,所以我们邀请了九所大学,带来了最先进的电动汽车平台,其中一款最顶尖的电动汽车平台,来到了中国张家界的天门山。

这条赛道是一条山路,全长 10.77 公里,海拔落差超过 1000 米,有 99 个急弯。几乎都是 180 度的弯道,我们还涵盖了复杂的雨天和雾天山地气候。

对于那些还不了解天门山和张家界的人来说,这里是电影《阿凡达》中潘多拉星球取景地的原型。所以在 2025 赛季,我们成功与中国九所顶尖大学合作,共同探寻人工智能的下一个分水岭时刻。

这些大学包括清华大学、浙江大学、上海交通大学、西安交通大学、湖南大学、武汉理工大学、吉林大学和海南大学。

接下来,我想给大家看一段有趣的视频。

(天门山比赛视频)

视频就到这里。所以,自动驾驶的分水岭时刻已经到来了吗?还没有。

因为对于那些积极参与人工智能赛车的人来说,我们知道,目前最好的人工智能解决方案,首先,据我所知,还没有端到端的解决方案。没有任何大学或公司能承受用强化学习去 “惩罚” 一辆价值 100 万美元的方程式赛车,这永远行不通。

其次,我们知道,下一个前沿领域可能是将 “从 A 点到 B 点的自动驾驶” 与下一个应用场景相结合,这将引领我们发现那个分水岭时刻,也就是 “AlphaGo时刻”。

对于 2025 年的物理人工智能来说,我们非常自豪地看到,我们的比赛已经引发了大量关于 “人类与物理人工智能” 的讨论,在不久的将来,它可能会成为全球关注的焦点。仅 2025 年的比赛,就吸引了超过 50 万人在为期 6 周的时间里亲临现场观看。在线上,比赛的观看量超过了 10 亿次,当然,每所大学都有自己的粉丝。此外,相关的社交媒体讨论也超过了 800 万条,所以这是一个在一年内迅速走红的顶级赛事之一。

那么,我们接下来要走向何方?

明年,也就是 2026 年 CES,今天我很高兴能和大家分享一个消息:在 2026 年的人工智能赛车比赛之外,我们将与天门山国家公园密切合作,邀请所有有能力的人形机器人公司,来尝试创造他们的分水岭时刻 —— 也就是他们的 “AlphaGo时刻”,让机器人从天门山山脚攀登 999 级台阶,抵达山顶的天门。

最后,感谢大家的聆听。

(文|引擎视角,作者|韩敬娴,编辑|李玉鹏)

相关内容

热门资讯

新年资金入市!超450亿公募资...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   新年行情暖意融融...
国家粮食和物资储备安全政策专家... 1月10日,国家粮食和物资储备安全政策专家咨询委员会全体会议在京召开。国家发展改革委党组成员,国家粮...
原创 她... 她的一生充满了传奇,经历了风雨波折,先后嫁给了两位帝王,并且亲手培养了两位皇帝。在那个男权主导的时代...
促内需如何更有效?国常会部署一... 1月9日召开的国务院常务会议部署实施财政金融协同促内需一揽子政策。 会议指出,实施财政金融协同促内需...
恬嫔25年未晋封,最后在大火中... 道光帝是一位守成的皇帝,一生没有什么大的功绩。他在位30年,清朝日益衰弱,他为挽救清朝衰落做了一些努...