2024年图灵奖颁给强化学习先驱巴托和萨顿,其研究成果深刻影响人工智能崛起
创始人
2025-03-06 10:58:19

3月5日,全球最大的计算机专业人士协会计算机协会(ACM)宣布,将2024年图灵奖授予安德鲁·巴托(Andrew Barto)博士和理查德·萨顿(Richard Sutton)博士,以表彰他们在强化学习方面做出的奠基性贡献。

巴托目前是马萨诸塞大学荣誉退休教授。萨顿现在担任阿尔伯塔大学教授,他也是前DeepMind研究科学家。

查德·萨顿有着“强化学习之父”的美誉,安德鲁·巴托则是萨顿的博士导师。自 1980 年代起,两位学者就在一系列论文中提出了强化学习的主要思想,并构建了强化学习的数学基础,开发了强化学习的重要算法。两人合著的《Reinforcement Learning: An Introduction》一直是强化学习领域最经典的教材之一。

ACM在颁奖词中高度评价了两位科学家的贡献:“萨顿和巴托的工作不仅推动了强化学习的理论发展,还为深度强化学习的崛起铺平了道路。他们的研究成果在游戏AI、机器人控制、自动驾驶等领域产生了深远影响”。

强化学习的突破性进展在近年来尤为显著。2016年,谷歌DeepMind开发的AlphaGo利用强化学习技术击败了世界顶级围棋选手李世石,震惊全球。

过去十年,强化学习在人工智能(AI)的崛起中发挥了至关重要的作用,包括OpenAI的ChatGPT和DeepSeek等突破性技术。

强化学习在许多其他领域也取得了成功,其中之一是机器人运动技能学习。通过强化学习,机器手可以学会操作物体和解决物理问题;并且这种学习过程可在模拟中完成,然后再迁移到现实世界。

不过,在领奖之际,巴托和萨顿也表达了对当前人工智能开发中安全隐患的深切担忧。巴托指出,许多公司在产品尚未经过充分测试的情况下急于推向市场,这种做法无异于“建造一座桥,然后通过让行人使用来测试其安全性”。

萨顿补充说,人工智能公司过于受商业利益驱动,忽视了研究的深入发展。他们呼吁业界重视技术可能带来的负面影响,遵循更严谨的安全标准。

ACM 图灵奖被称为“计算机领域的诺贝尔奖”,奖金为 100 万美元,由谷歌公司提供资金支持。该奖项以提出计算数学基础的英国数学家艾伦・图灵命名。

相关内容

热门资讯

欧盟对中国实体采取跨境调查,商... 商务部新闻发言人就认定欧盟外国补贴调查相关做法构成不当域外管辖措施答记者问。问:5月15日,司法部发...
紫竹漫游纪|5月:浅夏幻梦·童... 摄影:宣传科 刘兵图文编辑:宣传科 李冬晴来源:北京号作者: 北京紫竹院公园
SpaceX拟推万亿火星薪酬方... 5月16日,有消息称,正在推进上市的SpaceX在保密招股书中披露了一项激进的治理与薪酬方案。公司计...
香港赛马会助力劳动者杯中国职工... 转自:中国日报网中国日报5月16日电 5月16日上午,中华全国体育基金会-香港赛马会助力劳动者杯中国...
图书之外,更多格局 坐标长春,5月。如果你对书博会的印象,还停留在现场淘折扣好书、沉浸式逛展阅读,那你或许还没读懂第三届...