来源:源达
投资要点
AI Agent 是AI 发展的第三阶段
根据OpenAI对AI发展的理解和定义,AI水平可分为五大等级,智能体能够代表用户采取行动处于第三阶段,其核心架构可概括为“核心决策中枢+核心认知架构+工具使用“。福布斯指出2025年将成为AI应用的分水岭即AI正从单纯的问答和内容生成升级为真正的“执行者”,能够独立完成实际工作任务,而不仅仅是充当“助手”。根据LangChain数据,截至2024年底,AI Agent的渗透率已达到43%。
MCP 协议重构AI Agent 新范式
2024年11月,Anthropic发布Model Context Protocol(MCP),自推出以来,MCP迅速成为AI原生应用的重要基础设施。MCP协议如同AI应用的USB-C端口,其最关键的设计理念是将“工具调用”与“上下文感知”统一纳入一个协议框架,使得模型与外部世界之间的交互不仅更自然、更精准,还可以跨模型平台共用。MCP协议正在成为AI领域连接大模型与外部世界的核心基础设施,提升了AI模型与外部服务的兼容性。预计未来MCP协议+Agentic-based决策路径或将成为主流。
科技巨头积极布局AI Agent 产品
从字节和阿里等科技公司近期的动向来看,AI Agent或成为今年科技公司布局AI 的重要主线。整体来看,AI Agent产业在2024年第四季度至2025年初呈现快速迭代态势,并逐渐从技术竞争转向生态价值重构。AI Agent领域的发展还呈现出明显的结构性分化。根据CB Insights最新统计数据显示,资本市场对通用型AI Agent展现出更强的偏好。
投资建议
MCP协议正在成为AI时代的“HTTP协议”,AI发展正从“SDK适配”的碎片化阶段迈向“协议兼容”的标准化时代。各大科技厂商纷纷开启AI Agent布局,有望通过MCP协议引入大量生态伙伴。
建议关注:1)商业平台BIP: 用友网络;2)办公:金山办公;3)AIGC:科大讯飞,万兴科技。
风险提示
AI技术发展不及预期;AI应用落地不及预期;市场需求不及预期;行业竞争加剧等。
一、MCP 协议重构AI Agent 新范式
1.AI Agent 是AI 发展的第三阶段
根据OpenAI对AI发展的理解和定义,AI水平可分为五大等级:一是聊天机器人(Chatbot),能够用自然语言进行对话;二是推理者,基于推理模型,解决人类级别的智力问题;三是智能体(Agent),能够代表用户采取行动;四是创新者;五是组织。
过去,在ChatGPT等聊天机器人产品推出时,大模型通常采取一次性推理,用户与聊天机器人的交互形式呈现为简单的一问一答。而在推理模型的不断发展之下,AI模型逐渐能够与自己对话,实现内部思考,具备推理能力。当前,随着大模型在交互/认知/泛化/自主等多维度能力持续提升,AI正从推理者转向智能体,逐步具备采取行动及处理任务的能力,智能体产品加速推进。
图1:OpenAI定义的5个AI发展阶段
资料来源:OpenAI官网,源达信息证券研究所
智能体(Agent)是基于大模型(LLM)构建的智能化系统,其核心架构可概括为“核心决策中枢+核心认知架构+工具使用”。
(1)核心决策中枢:AI Agent的核心决策中枢是其模型系统,它可以由一个或多个不同规模的语言模型组成。这些模型具备执行指令驱动的推理能力,能够灵活运用多种逻辑框架,如思维链(Chain-of-Thought)或思维树(Tree-of-Thought)等。
(2)核心认知架构:AI Agent的编排层作为其核心认知架构,通过“感知-推理-决策”的闭环机制实现智能决策,主要包含三种模式:ReAct模式为语言模型提供结构化思考框架,使其能自主推理并触发行动;思维链(Chain-of-Thought)模式通过中间推理步骤提升决策质量,衍生出自洽性推理、主动提示和多模态思维链等技术分支;思维树(Tree-of-Thought)模式作为进阶形态,支持多路径探索和战略前瞻,特别适合解决复杂问题。
(3)工具使用:AI Agent通过工具实现与外部世界的交互,这些工具主要分为三类:扩展程序(Extensions)、函数(Functions)和数据存储(Data Stores)。尽管基础模型在文本和图像生成方面表现出色,但由于无法直接与外界互动,其能力受到限制。工具则弥补了这一缺陷,使Agent能够访问外部数据和服务,从而执行基础模型单独运行时无法完成的任务。
图2:AI Agent的结构
资料来源:谷歌《Agent》白皮书,源达信息证券研究所
表1:工具使用的执行和用例
|
扩展 |
函数调用 |
数据存储 |
|
执行 |
Agent-Side 执行 |
Client-Side 执行 |
Agent-Side 执行 |
|
用例 |
·开发者希望Agent能够控制与API端点的交互 ·在利用原生预构建扩展(例如 Vertex 搜索、代码解释器等)时很有用 ·多跳规划和 API 调用(即Agent的下一个操作取决于前一个操作/API调用的输出) |
·安全或身份验证限制使Agent无法直接调用 API ·时间限制或操作顺序限制使Agent无法实时调用API.(例如:批处理操作、人工审核等) ·未向互联网公开的 AP,或 Google 系统无法访问的 API |
·来自预先索引的域和 UR的网站内容 ·以 PDF、Word 文档、CSV、电子表格等格式存在的结构化数据 ·关系型/非关系型数据库 ·以 HTML、PDF、TX等格式存在的非结构化数据 |
资料来源:谷歌《Agent》白皮书,源达信息证券研究所
表2:编排层的三种模式
|
ReAct |
Chain-of-Thought |
Tree-of-thoughts |
描述 |
一个提示工程框架,为语言模型提供了一种推理和对用户查询采取行动的思维过程策略。 |
一种通过中间步骤实现推理能力的提示工程框架。 |
一种适用于探索或战略前瞻任务的提示工程框架。 |
特点 |
显示出优于几个最先进的基准,并提高了人类与 LLM 的互操作性和信任度。 |
包括各种子技术,如自我一致性、主动提示和多模态CoT,每种技术都有其优点和缺点,具体取决于特定的应用程序。 |
超越了链式思维提示,并允许模型探索各种思维链条,这些思维链条作为语言模型解决一般问题的中间步骤。 |
资料来源:谷歌《Agent》白皮书,源达信息证券研究所
2025年4月,福布斯发布AI 50 2025榜单,指出2025年将成为AI应用的分水岭即AI正从单纯的问答和内容生成升级为真正的“执行者”,能够独立完成实际工作任务,而不仅仅是充当“助手”。在企业级和消费级领域,AI工具已开始接管完整的工作流程,例如自动处理法律文件、实现全流程客服自动化以及端到端的代码生成。
截至2024年底,AI Agent的渗透率已达到43%。据LangChain的数据,同期有43%的AI应用采用了AI Agent框架Lang Graph,这表明AI Agent框架已成为主流开发选择。与此同时,超过30%的AI应用支持AI调用外部工具(Tool Calling),使模型能够自主执行函数或访问外部资源,从而表现出更强的自主决策能力。工具调用的普及增强了AI Agent与外部系统的交互能力,使其能够执行诸如写入数据库等更复杂的任务。
图3:AI Agent的渗透率
资料来源:LangChain,源达信息证券研究所
AI Agent在快速崛起的过程中,其发展主要围绕数据交互和决策执行两条路径展开。
2024年11月,Anthropic发布Model Context Protocol(MCP),自推出以来,MCP迅速成为AI原生应用的重要基础设施。MCP协议如同AI应用的USB-C端口,能够实现允许系统向AI模型提供上下文信息,并且可以在不同的集成场景中通用化。没有MCP的时候开发者需要为每个数据源创建自定义的整合方式和API,既耗时又无法规模化扩展,而MCP允许AI应用通过统一协议访问文件系统、数据库等,定义了AI模型如何调用外部工具、获取数据以及与各种服务交互。其最关键的设计理念是将“工具调用”与“上下文感知”统一纳入一个协议框架,使得模型与外部世界之间的交互不仅更自然、更精准,还可以跨模型平台共用。
具体来看,Model Context Protocol (MCP) 采用客户端-服务器架构实现智能模型与多源数据的协同交互。该协议由MCP Host(用户操作端)、MCP Client(请求代理端)和分布式部署的MCP Server节点构成核心框架,通过传输层、通知机制、采样控制等模块,无缝对接本地文件系统、数据库、Web API及互联网资源。
1)MCP Client:MCP Client指的是LLM-native产品或者Agent,比如Claude Desktop产品、IDE产品,未来任何想通过MCP协议调取数据的AI产品都是一个MCP Client,都可以通过MCP协议访问数据。
2)MCP Server:MCP Server指的是可以让LLM理解Context Layer的转换接口,是轻量级Context连接软件,如文件系统访问或数据库查询。
图4:MCP系统架构
资料来源:阿里云云原生微信公众号,源达信息证券研究所
从结构框架层面来看,传统API与MCP之间存在显著差异:
1)传统API:基于经典的“客户端–服务端”架构,客户端发起请求,服务器处理并返回响应,传统API充当二者之间的中介,开发者通常需要分别集成多个服务接口,单独处理认证、数据格式和通信协议,带来较高的集成与维护成本,易出现响应机制不一致等问题。
2)MCP:遵循“客户端服务器”架构,由MCP主机/MCP客户端/MCP服务器三个核心组件组成,专为AI系统设计,通过标准化协议传递模型所需的上下文数据,使模型能够高效调用工具,提升AI模型的理解与执行能力。
图5:传统API技术路线 |
图6:MCP技术路线 |
资料来源:Z Research,源达信息证券研究所 |
资料来源:Z Research,源达信息证券研究所 |
2025年4月9日,Google正式发布了Agent 2 Agent Protocol(A2A)。该协议为不同类型的智能体之间搭建高效沟通与协作的桥梁,无论是独立Agent与独立Agent、独立Agent与企业Agent,亦或是企业Agent与企业Agent,都能借助该协议实现通信交互和事务协作。
图7:谷歌A2A开放协议工作原理 |
图8:谷歌A2A与MCP协同工作 |
资料来源:谷歌《Agent》白皮书,源达信息证券研究所 |
资料来源:谷歌《Agent》白皮书,源达信息证券研究所 |
综上,MCP协议正在成为AI领域连接大模型与外部世界的核心基础设施,提升了AI模型与外部服务的兼容性。同时,全球科技巨头已形成协同生态,OpenAI、微软、谷歌等海外企业率先支持该协议,阿里云百炼、腾讯云等国内厂商也快速跟进并推出标准化接入平台。MCP协议取代了之前传统的“链下模型+链上API“架构,预计未来MCP协议+Agentic-based决策路径或将成为主流,这一转变将改变AI服务的交互方式和产业格局。
表3:各科技巨头平台支持MCP统计
|
平台支持 |
OpenAI |
2025年3月,OpenAl宣布正式采用MCP协议标准,OpenAI模型可以调用MCP Server。 2025年6月,OpenAI宣布ChatGPT迎来重大更新,新增两大功能:支持MCP协议和会议记录模式。 |
谷歌 |
2025年4月,Gemini更新API文档,正式宣布接入MCP,Gemini可以调用MCP Server。 |
微软 |
2025年5月,微软宣布将在 Azure AlFoundry 和CopilotStudio 两大平台上引入A2A及MCP。 |
阿里云 |
2025年4月,阿里云百炼平台集成了高德、无影、Fetch、Notion等50多款阿里巴巴集团和三方MCP服务。 |
腾讯云 |
2025年4月,腾讯云大模型知识引擎接入MCP,用户在搭建应用时,可以通过大模型知识引擎调用平台精选的MCP插件或插入自定义的 MCP 插件,接入腾讯位置服务、微信读书等生态工具。 |
字节 |
飞书多维表格、高德地图、图像工具等高频组件已接入MCP扩展体系。 |
百度智能云 |
2025年4月,两大模型文心大模型4.5Turbo和深度思考模型X1Turbo,及多款AI应用,并宣布支持MCP。百度AI搜索,百度地图、文生图、图像识别等能力组件都提供了MCP Server。 |
资料来源:澎湃新闻,钛媒体,腾讯网,源达信息证券研究所
二、AI Agent 相关应用加速落地
1.科技巨头积极布局AI Agent 产品
从字节和阿里等科技公司近期的动向来看,AI Agent或成为今年科技公司布局AI 的重要主线。整体来看,AI Agent产业在2024年第四季度至2025年初呈现快速迭代态势,并逐渐从技术竞争转向生态价值重构。
表4:AI Agent领域行业动态
时间 |
产品/技术 |
参与者 |
意义 |
2024年12月 |
谷歌 Gemini 2.0驱动的Project Astra(谷歌Al 助手) |
谷歌 |
拓展AI Agent在多领域的应用,推动多模态Al Agent的发展,为用户提供更全面智能的服务 |
2025年1月 |
Al Agent Operator |
Open Al |
拓展Al Agent的功能边界,为用户提供更强大的自动化任务执行和知识生成能力推动Al Agent在多领域的应用,代表 Open Al拉开L3级Agent时代序幕 |
2025年1月 |
拓尔思拓天大模型 Al Agent工具链 |
拓尔思 |
降低Al Agent的创建门槛,推动AI在多个领域的应用落地,具备任务规划、流程编辑与自动执行功能 |
2025年2月 |
GitHub Copilot Agent 模式 |
GitHub |
提升AI在代码开发中的自主性和智能性,推动软件开发模式的变革,提高代码开发的效率和质量 |
2025年3月 |
Manus |
Monica.im |
工具链整合能力的规模化跃升迎来中国Al Agent重大突破时刻,推动Al Agent从对话智能升级为生产力操作系统 |
2025年3月 |
AutoGLM 沉思 |
智谱 |
能够模拟人类的思维过程,完成从数据检索、分析到生成报告,核心链路的技术与模型于4月全面开源,进一步推动生态发展 |
2025年4月 |
Genspark |
MainFunc |
整合多AI模型的混合代理(MoA)系统,包含了80多个工具集和10多个高级数据集,在GAlA Benchmark中表现超越Manus、Open Al、Deep Research等产品 |
2025年4月 |
扣子空间 |
字节跳动 |
从回答问题,到解决问题全线打通,拥有专家Agent生态并首创探索/规划双模式MCP扩展集成,拓展Agent能力边界 |
2025年4月 |
Qwen3 |
阿里巴巴 |
原生支持MCP,并全面开源,为下游行业构建Agent应用提供模型支持 |
资料来源:甲子光年,各公司官网,源达信息证券研究所
此外,AI Agent领域的发展还呈现出明显的结构性分化。根据CB Insights最新统计数据显示,资本市场对通用型AI Agent展现出更强的偏好。
从融资规模来看,跨行业通用型AI Agent创企累计获得35亿美元融资,完成149笔交易,而垂直行业型创企仅获得13亿美元融资,达成65笔交易。前者融资规模是后者的2.7倍,交易活跃度更是达到2.3倍。
在市场成熟度方面,通用型AI Agent在商业上更为成熟,超过2/3的市场正在部署或扩展AI解决方案,其中,客户支持、软件开发、销售和通用企业工作流程等赛道较为活跃,而垂类智能体仍处于新兴和验证阶段,预计未来垂直行业智能体将向部署阶段推进。这种“通用先行、垂直跟进”的发展路径,正推动整个AI Agent产业发展。
图9:2020年至2025年2月通用型和专业型AI Agent 成熟度份额
资料来源:CB Insight,源达信息证券研究所
Manus作为全球首款通用Agent,凭借在GAIA基准测试中的SOTA表现和与阿里通义千问的战略合作,正在推动国产化通用智能体的突破;OpenAI的Operator则通过GPT-4o多模态能力和强化学习技术,重新定义了浏览器智能体的交互范式;而字节跳动的Coze平台以低代码开发和完善的插件生态,正在构建最易用的智能体协同办公环境。这三类产品分别代表了通用任务处理、垂直场景渗透和开发者生态建设的不同侧重的发展路径,具体来看:
Manus是全球第一款通用Agent产品,可以解决各类复杂多变的任务。在GAIA(General Artificial Intelligence Assistant benchmark)的基准测试中,在所有三个难度级别上都取得了新的SOTA(state of the art)表现,超越OpenAI同级产品。
图10:Manus初始运行界面 |
图11:Manus执行结果界面 |
资料来源:Manus官网,源达信息证券研究所 |
资料来源:Manus官网,源达信息证券研究所 |
Manus平台宣布将与阿里通义千问团队正式达成战略合作。双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。目前两家技术团队已展开紧密协作,致力于为中国用户打造更具创造力的通用智能体产品,Manus产品使用了不同的基于阿里千问大模型(Qwen)的微调模型。此外,官方将计划在今年开源Manus中的部分模型,特别是Manus的推理部分。国内厂商有望内化Manus的通用任务执行能力,推出在多个领域具有泛化应用效果的模型,有望进一步推动AI应用的落地。
Operator是由OpenAI于25年1月份发布。该产品是一款由OpenAI推出的AI浏览器智能体,由计算机使用代理(Computer-Using Agent,)驱动,结合了GPT-4o的视觉能力以及强化学习下的高级推理,能够识别网页并自动实现与网页的交互,且具备一定的推理能力,可以在遇到问题时自我纠正,可以在无法解决时将控制权交换给用户。
图12:Operator运行界面 |
图13:Operator应用场景 |
资料来源:OpenAI官网,源达信息证券研究所 |
资料来源:OpenAI官网,源达信息证券研究所 |
Coze是字节跳动旗下一款重要的 AI Agent 开发平台,发布于2024年2月1日。主要面向普通用户和开发者。它的特点是简单易用,无需编程基础就能快速上手。在扣子平台上,用户可以通过拖拽式的零代码方式或简单的低代码方式,轻松搭建基于先进AI大模型的各类智能体应用。 2025年4月18日,“扣子空间”正式开启内测。扣子空间的定位“与AI Agent协同办公的最佳场所”,旨在让用户与AI Agent高效协作,完成各种复杂任务。该AI Agent 采用自研豆包大模型并且集成了超过60款MCP扩展插件。
图14:Coze空间介绍
资料来源:Coze空间官网,源达信息证券研究所
三、投资建议
1.建议关注
MCP协议正在成为AI时代的“HTTP协议”,该标志着AI发展正从“SDK适配”的碎片化阶段迈向“协议兼容”的标准化时代。同时,各大科技厂商纷纷开启AI Agent布局,有望通过MCP协议引入大量生态伙伴,推动国内AI Agent产业走向新纪元。
建议关注:1)商业平台BIP : 用友网络;2)办公:金山办公;3)AIGC:科大讯飞,万兴科技。
2.行业重点公司一致盈利预测
表5:万得一致盈利预测
公司 |
代码 |
归母净利润(亿元) |
PE |
总市值(亿元) |
||||
2025E |
2026E |
2027E |
2025E |
2026E |
2027E |
|||
用友网络 |
600588.SH |
-2.1 |
3.0 |
7.4 |
-217.0 |
150.1 |
60.6 |
451.0 |
金山办公 |
688111.SH |
19.2 |
23.4 |
28.4 |
69.0 |
56.8 |
46.8 |
1,328.5 |
科大讯飞 |
002230.SZ |
9.5 |
13.6 |
18.6 |
116.7 |
81.4 |
59.8 |
1,109.4 |
万兴科技 |
300624.SZ |
49.3 |
66.8 |
98.3 |
2.3 |
1.7 |
1.2 |
114.1 |
资料来源:Wind一致预期(2025/6/5),源达信息证券研究所
四、风险提示
AI技术发展不及预期;
AI应用落地不及预期;
市场需求不及预期;
行业竞争加剧等。