蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版
创始人
2026-03-04 10:44:56

  Hehson科技讯 3月4日上午消息,蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版。该版本主打“Agent一键接入RL训练”:不用改代码,兼容各类Agent框架,让智能体强化学习训练开箱即用。

  2026年开年以来,Agent持续升温,以LangChain、Claude Code、OpenClaw为代表的智能体框架繁荣发展,但也暴露出两大瓶颈。一是接入训练成本高:现有智能体框架接口各异,每接入一个往往需要编写整套适配代码。二是Agent缺乏持续进化的能力:多数Agent的能力取决于底层模型在训练阶段习得的固定权重,部署后无法再针对特定场景持续优化,能力上限在交付时便已确定。

  AReaL是首个全异步训推解耦的大模型强化学习训练系统,能让Agent在真实任务交互中获得反馈、持续优化决策。此次发布的v1.0版本让任意Agent零改造接入RL 训练成为现实,即通过在智能体与训练系统之间加入 Proxy Worker 中转层,开发者只需修改一个请求地址即可接入训练。

相关内容

热门资讯

2026年可再生能源投资前景展... (来源:电力国际汇epintl)可再生能源已迈入成熟且由资本驱动的新阶段,太阳能、风能和水电如今已成...
何小鹏两会建议:加快推动自动驾... 2026年全国两会即将启幕,第十四届全国人大代表、小鹏汽车董事长兼CE0何小鹏,围绕科技创新、产业创...
拍客日历 2026/03/04 来源:北京日报客户端作者: 张舒
大学生生活费1W,合理吗 有段时间网上流行消费打卡,一帮学生给自己设一个目标,每个月不能花超多少钱,从3000到一万多的都有,...
输液可预约,胃镜有陪护!普陀区... “一生病本就难受,输液还要排长队?站着累、坐着等,实在熬人!”这曾是很多患者的烦恼。如今,这一困境在...