全球通用Agent领域的英雄榜,再次得到刷新。
8月18日,百度文库、百度网盘联合发布全球首个全端通用Agent“GenFlow2.0”。
在发布会后的访谈中,文库事业部、网盘事业部负责人王颖讲道:“文库网盘,发出来的都是现货。”正如她所说,4个月前GenFlow以发布即可用的姿态闯进市场。
最新的文库GenFlow2.0延续了这种务实风格,已于即日起上线百度文库网页、App全端,无需邀请码、立即可用。不仅如此,GenFlow2.0能够调度100+Agent同时运行任务,并行完成5个以上复杂任务只需3分钟,速度可达同类产品的5-10倍。
3分钟完成超5个复杂任务,多智能体协作不再“翻车”
网红通用Agent“一码难求”“高价竞购”的场景还留在用户的记忆里,一场祛魅就已上演。
理想情况下,用户只需进行简单的自然语言交互,就能让通用Agent调动多智能体(Multi- Agent)协同、完成复杂任务。但随着用户真正“上手”实操,问题逐渐涌现了出来。
不少用户经过实践后反馈,通用Agent存在需要反复调整描述输入、任务交付质量低、等待时间过长、答案空洞有误、无法编辑等种种问题。在各大论坛之中,“为什么Multi- Agent总是失败”也成了热门讨论话题。
这甚至得到了数据支撑,来自加州大学伯克利分校等机构的团队调研了海外5个Multi- Agent系统的故障率,其中一大工具甚至出现了高达86.7%的故障率数值,也从侧面说明现有的许多通用Agent并不能精准捕捉需求和执行任务、距离理想状态仍有不远距离。
凡此种种,折射出的是不少通用Agent受限于系统设计缺陷、数据缺失、知识库协同不足等种种原因,而难以发挥出全部潜能,也为许多用户留下了AI能力不足的“初印象”。在与媒体沟通时,百度文库、网盘团队分享道,这正是GenFlow2.0希望攻克的难题。
为了测评文库GenFlow2.0性能是否达到预期,「电厂」输入了一个针对全球GPU芯片龙头英伟达的企业研究任务,要求了解该公司的发展历程、历年财务状况与业务布局,并要求以不同文件格式输出研究结果。
运行过程显示,文库GenFlow2.0第一时间拆分出了8个子任务,并使用深度检索工具搜集核心信息,最终在几分钟的时间内执行完毕,并且生成内容基本准确,且格式符合企业调研要求。
图源/百度文库GenFlow2.0
另一个针对初中物理教师教学材料的生成任务(含5个子任务)则在3分钟内内运行完毕。官方数据显示,GenFlow2.0的运行速度是同类产品的10倍,实现了实现分钟级“并行”工作和交付。
运行速度提升背后,文库GenFlow2.0 采用了自研的Multi-Agent基础架构,而非主流的Agent串行工作流。为了提升交互体验,文库App端还将常规的“瀑布式”工作流升级为“并列式”。
除此之外,在生成过程中,文库GenFlow2.0支持用户在任务过程随时「干预」,用户可根据场景需求、随时在GenFlow2.0聊天窗口要求暂停、进行追问、修改思考内容、上传文件参考等,GenFlow2.0将根据最新要求实时调整生成内容。
在交付能力上,除了「电厂」体验的PPT、文档、图片之外,GenFlow2.0还覆盖了研报、视频绘本、海报、图表、HTML、代码、游戏、网站等多模态内容。全模态的生成能力背后,文库GenFlow2.0可调用100+多模态Agent组成的“AI专家团”,全面满足用户需求。
并且所有Agent均经过文库网盘数亿用户验证。比如,文库PPT Agent的用户访问量已达全球第一、采纳率接近90%;研报Agent则在行业率先实现了数万字专业报告的分钟级生成、同时生成专业级可视化图表的能力。
王颖透露,为保证用户体验,当下GenFlow2.0接入的Agent以百度自研居多,但随着产品发展,第三方Agent也将日益丰富。
两年全面AI重构,文库网盘展现焕新“增长力”
要拆解GenFlow2.0性能提升的原因,除了前述功能设计之外,也不能脱离其根植于百度生态资源的背景。
从2023年开始,文库网盘就陆续开始了长达两年的AI重构。
在GenFlow2.0的发布会上,主创团队介绍称,GenFlow的定位是提供一支“牢记初心、目标清晰、听从指挥、能打胜仗”高效率的AI专家团队。为此研发团队在技术基座上进行了大量投入。
比如,在模型层,文库网盘自AI重构以来就坚持采用MoE(底层专家模型),可基于不同任务、步骤来调用不同模型——这也是当前大模型的主流架构选择,从2024年开始,不少大模型玩家开始转向MoE。
在技术方面,GenFlow2.0自建了Multi-Agent引擎,并积极优化上下文工程,为模型构建信息生态系统;通过动态混合推理、多模式智能化调度、公私域知识增强以及全模态渲染编辑,实现对复杂任务的一站式端到端交付;以及构建包括全周期消息总线、多模态数据理解、临短长记忆中枢、多级风控体系等能力的基础底座,致力于实现性能、效果和扩展性的最优解。
在今年4月举办的百度Create 2025开发者大会上,百度文库、百度网盘携手推出内容操作系统“沧舟OS”,并基于该系统首发“GenFlow1.0”版本。截至目前,百度文库拥有超14亿专业内容资源,AI月活用户超9700万,拥有智能PPT、智能文档、AI绘本等数百项AI能力;百度网盘已累计服务超10亿用户,月活用户超2亿,AI月活用户超8000万。
此外,GenFlow2.0兼容MCP协议,可灵活接入第三方服务生态,支持厂商、企业用户、智能体应用、开发者等接入,面向用户提供更加丰富的服务项。当前,荣耀已作为全球首批接入MCP生态的硬件厂商,将GenFlow2.0原生接入荣耀智能助理YOYO。
借此,荣耀MagicOS用户可一键获取个人网盘知识库与文库专业文档,实现网盘检索、内容分享、联网搜索、图片理解、文件总结与问答、文库PPT生成等体验,实现AI Agent与硬件厂商的系统级原生调度。
而这,还远未抵达通用Agent的终局,在那之前百度文库网盘仍将持续发力。
活动上,文库网盘宣布升级开发者权益,将新开放和优化升级超100项能力,并针对所有能力提供免费额度,以赋能更多开发者。
企业与市场脉搏共振,随着用户好奇心褪去、对于价值的拷问成了所有市场玩家无法面对的问题,当全球大模型应用市场步入深水区的同时,百度的AI重构也日益纵深。
通用Agent市场还没有标准答案,但唯有历经不辍地探索与投入,才能将人们对“未来工作方式”“超级生产力”的想象落地现实。包括百度在内,市场仍在拔足狂奔,但许多有趣的变化已在发生。