阿里开源自主AI智能体WebAgent 可模拟人类感知决策和行动
创始人
2025-05-30 14:41:14
0

【太平洋科技快讯】5月30日,阿里巴巴在GitHub上开源一款名为WebAgent的自主搜索人工智能(AI)智能体。该智能体具备端到端的自主信息检索与多步推理能力,能够在网络环境中模拟人类的感知、决策和行动。

WebAgent的核心功能在于其强大的自主搜索能力和多步骤逻辑推理能力。它能够主动搜索多个学术数据库,并根据用户需求进行深入分析和总结。此外,WebAgent能够通过多步推理将不同文献中的观点进行整合,最终为用户提供一份全面且精准的研究报告。这种能力使得WebAgent在处理复杂信息检索任务时,表现得如同一位经验丰富的专家。

据悉,WebAgent的技术核心在于其训练框架——WebDancer。该框架由四个关键环节组成,从数据构建到训练优化,逐步打造出能够自主完成复杂信息检索任务的智能体。

WebDancer采用了创新的浏览数据构建方法。它通过短推理和长推理两种方式,利用大模型生成简洁的推理路径,或通过推理模型逐步构建复杂的推理过程。这种方法有效解决了传统数据集的局限性,为智能体提供了丰富的训练素材。

在数据准备完成后,WebDancer进入监督微调(SFT)阶段。这一阶段的目标是通过高质量的轨迹数据对智能体进行初始化训练,使其能够适应信息检索任务的格式和环境要求。在SFT过程中,WebDancer将轨迹中的思考、行动和观察内容分别标记,并计算损失函数,以优化模型的参数。为了提高模型的鲁棒性,WebDancer在计算损失时排除了外部反馈的影响,确保模型能够专注于自主决策过程。

强化学习(RL)阶段是WebDancer框架的关键环节。在这一阶段,智能体通过与环境的交互,学习如何在复杂的任务中做出最优决策。WebDancer采用了DAPO算法,这是一种专门针对智能体训练设计的强化学习算法。DAPO算法通过动态采样机制,有效利用未充分利用的QA对,提高数据效率和策略的鲁棒性。在RL过程中,智能体通过多次尝试和反馈,逐步优化其决策策略,最终实现高效的多步推理和信息检索能力。

相关内容

热门资讯

《折腰》看懂小乔500人马退敌... 宋祖儿、刘宇宁主演的古装剧《折腰》,自开播以来,凭借小乔、魏劭狐狼cp先婚后爱,鲜活群像、女性力量、...
不输横店!迪丽热巴、杨紫、李现... 嘉定不仅拥有深厚的文化底蕴,还因独特的景致成为众多影视剧组青睐的取景地。让我们跟着影视的足迹,一同领...
《藏海传》中,藏海的“第三个仇... 肖战、张婧仪领衔主演的古装权谋剧《藏海传》中,无数网友化身“推理大师”,猜测谁是稚奴的救命恩人“面具...
美国男子指导女儿开车,女儿误踩... 近日,美国洛杉矶一名15岁少女练车时发生意外,导致指导她学车的父亲当场身亡,她自己也受了伤。 警方称...
AI科普:仲夏端午至,如何保“... “端午临中夏,时清日复长。”农历五月初五是端午节,暑湿交织容易诱发疾病。如何做到“端午安康”?这些方...
《在人间》疯批设定引热议,赵丽... 什么是大女主?赵丽颖才是大女主的“模版”:当古偶仙侠还在谈恋爱的时候,靠着“古偶”一飞冲天的赵丽颖,...
漠北王后真实目的曝光,所做的一... 画江湖之不良人第七季第十一集现在已经出来了。这一集一出,漠北王后的真实目的也终于是曝光了。漠北王后的...
《藏海传》这才是藏海最大的死穴... 电视剧《藏海传》新的剧情中庄家算是集体下线了,在藏海的算计之下,蒋襄因为庄之甫废了,庄芦隐要扶持庄之...
MiniMax开源首个视觉RL... 近日,MiniMax正式开源了其自主研发的首个视觉强化学习(Visual RL)统一框架——V-Tr...
“AI教父”辛顿最新专访:没有... Datawhale分享 最新专访:辛顿,来源:腾讯科技 以下视频来源于 腾讯科技 被誉为“AI...
《藏海传》火到台湾,却惹疑惑:... 近日,在中国台湾的时事评论节目里,当主持人问起时事评论员“藏海传好看吗”,评论员郭正亮当即竖起大拇指...
7年了,骂她的人真该闭嘴了 2021年,《我是刑警》导演拨通了马苏的电话:马苏,有一个角色,但是是单元女主,你愿不愿意接?马苏二...
到了夏天怎么穿衣才好看?这些日... 穿衣搭配对个人外在形象的影响还是比较大的,如果能够找到一些适合自己的穿搭,甚至可以起到一个改头换面的...
广西推出“桂智一号”AI平台 如何保障政务敏感数据的安全?如何安全可控且高效地使用企业核心机密数据?医院的重要信息如何稳妥兜底……...
雷军宣布小米·中国汽车耐力锦标... 5月31日,雷军发文宣布小米·中国汽车耐力锦标赛成都站,今天正式开赛,大家一睹中国最高级别的汽车耐力...
阿里通义开源「推理+搜索」预训... 通义实验室 投稿 量子位 | 公众号 QbitAI 为提升大模型“推理+搜索”能力,阿里通义实验室出...
正是肥的时候!每天上万斤在青岛... 初夏时节, 在即墨区丁字湾, 两万亩养殖的蛏子迎来丰收季, 渔民陆续展开采收。 近日, 记者跟随当地...
信阳市委市政府召开基层代表反映... 5月29日,信阳市委市政府召开基层代表反映问题办理情况反馈会,认真落实开门教育的部署要求,系统反馈基...
兵马俑三号坑今日正常开放,受损... 西安市公安局临潼分局官方微博5月31日通报:2025年5月30日17时30分许,孙某(男,30岁)进...