AI跨步进入“经验时代”_知识

创始人

2025-09-11 17:15:53

作者 | 柴旭晨

编辑 | 周智宇

迅猛迭代的AI似乎正迎来一次关键的转折。

9月11日，在2025 Inclusion·外滩大会，“强化学习之父”理查德·萨顿（Richard Sutton）指出，AI行业处在“人类数据时代”，今天大多数机器学习的目的，是把人类已有的知识转移到一个静态、没有自主学习能力的 AI 上。

问题在于，这一路线下，人类数据红利正逼近极限，而持续学习对智能的效用至关重要。他认为，AI正在进入以持续学习为核心的“经验时代”，潜力也将远超以往。

萨顿在发言中表示，我们正进入“经验时代”，需要一种由智能体与世界直接交互中生成的新数据源。这正是人类和其他动物的学习方式，也是近期AlphaProof在国际数学奥林匹克斩获银牌的路径。

萨顿解释，“经验”指的是观察、行动和奖励，这三种信号在智能体与世界之间来回传递。“知识来自于经验，可以从经验中学习。一个智能体的智能程度，取决于它能预测并控制自身输入信号的程度。经验是一切智能的核心与基础。”

他同时指出，强化学习带领我们进入了新的经验时代，但要释放全部潜力，还需要两项目前尚不成熟的技术——持续学习（continual learning）和元学习（meta-learning）技术。

面对外界对AI带来偏见、失业甚至人类灭绝的担忧，萨顿认为，这种对AI的恐惧被夸大了，并且是被某些从中获利的组织和个人煽动起来的。他指出，只有当每个人有不同的目标和能力，经济才能运行得最好。同样，目标不同的智能体，可以通过去中心化的协作实现双赢。

“人类最卓越的超能力，就在于比其他任何动物都更擅长协作。人类最伟大的成功在协作本身——经济、市场与政府都是成功协作的产物，”

萨顿表示，AI和人类繁荣将来自于去中心化协作。“协作并非总能实现，却是世间一切美好事物的源泉，我们必须寻求协作、支持协作，并致力将协作制度化。”

展望AI的未来未来，他提出了四条现实的“预测原则”：第一，对世界应该如何运转并没有共识，但没有哪一种看法能够凌驾于其他；第二，人类将真正理解智能，并借助技术将其创造出来；第三，当今人类的智力水平，很快将会被超级AI，或者超级智能增强的人类远远超越；第四条，权力和资源会流向最聪明的智能体。

基于此，他认为在人类的发展进程中，AI的替代将是不可避免的。

放眼宇宙的历史，萨顿将其分为四个时代：粒子时代、恒星时代、复制者时代和设计时代。他认为人类的独特之处在于“把设计推向极致”，创造出能自己设计的事物，这也正是今天通过AI所追求的目标。人类至少是催化剂，更是开启宇宙第四大时代——“设计时代”的先驱。

“AI是宇宙演化的必然下一步，我们应以勇气、自豪和冒险精神来迎接它。”萨顿表示。