炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
根据Sensor Tower,25年11月ChatGPT移动端MAU突破8.7亿,月活市占率63%,Gemini则依赖Google庞大生态追赶;国内字节豆包日活达到亿级。建议关注中外参与者竞争格局、Agent化、商业化的发展趋势。
Chatbot已经成为AI时代“Killer App”。互联网核心变革来自生产关系,普通用户能低门槛成为生产者,互联网“Killer App”例如社交、UGC内容平台源于此;AI大模型核心变革来自生产力,其能高效理解用户需求和产出内容,而Chatbot应运而生,目前Chatbot的用户月均活跃天数、日均使用时长、留存率逐渐接近社交平台,在工作、学习与娱乐场景的渗透率不断提升。
ChatGPT海外领先,国内豆包一家独大。ChatGPT遵循“模型即产品”逻辑,其模型能力迭代是驱动用户持续增长重要原因,推动用户场景从“效率工具”泛化至“生活方式”。而豆包初始定位部分借鉴Character.ai(移动端原生且更加聚焦情绪价值),依赖于字节用户生态获客,并通过多模态模型的突破以及成本下探,持续加强自身优势,始于EQ(情绪),兼容IQ(智能)。
从Chatbot到Agent。综合Agent是市场共识的AI应用的终极目标,我们认为Chatbot、端侧AI、垂直场景Agent等都有进化潜力,其中Chatbot潜在进化路径或类似“早期微信”(IM工具→一站式服务平台)。ToC端,我们认为通用型Agent或相对垂直Agent有优势;Agent入口和垂直服务巨头之间的博弈或也将成为重要变量,谷歌、微信等已有成熟交易生态的平台有存量优势。
商业化畅想:从订阅到广告。现阶段海外Chatbot变现以订阅为主,国内以免费为主。长期看,随着单位推理成本降低,我们认为“免费+交易导向效果广告”有望成为ToC Agent领域门槛更低、壁垒更高、天花板更高的商业模式,互联网广告龙头在数据和基础设施等维度有优势。
大模型的发展路径具备不确定性;产品商业化的不确定性;监管与地缘政治风险;从Chatbot到Agent进化的不确定性。
Chatbot是AI原生的“Killer App”
从第一性原理看AI与互联网的本质
互联网的本质是生产关系的革命。其颠覆性在于重构了内容生产与传播的社会网络,通过构建低门槛的发表与连接平台,将大众原有的创作与社交能力“舞台化”,催生了以UGC为核心生态的社交网络(如Facebook)和短视频平台(如YouTube、抖音)。这些平台并未赋予用户新的生产能力,而是通过连接与分发,释放了存量能力的网络价值。
而大模型AI的本质是生产力的革命。其意义在于,机器首次获得了生成内容、辅助决策与执行任务的能力,从而扩展了人类生产力的边界。它表现为三种核心形态:顾问(如提供专业咨询与策略支持)、秘书(如自动化处理事务性工作)以及创作者(如生成文本、代码与多媒体内容)。最直接的体现就是,普通用户也能完成以往需要专家或专用工具才能完成的任务,比如无代码编程。此外,在经常使用的用户群体中,也有正反馈关系:根据OpenAI《2025年企业人工智能现状》,1)用得多,省得多:在工作中每周节省超过10小时的员工群体,其消耗的AI智能资源(以平台积分衡量)是节省时间少于2小时群体的8倍,这表明,更大的智能资源投入直接转化为更高的时间收益。2)越会用,越高效:同时,用户获益与任务类型多样性直接相关,能用AI处理7种不同任务类型的用户,其节省的时间是只能用AI处理4种的任务类型的用户的5倍。
图表1:用户对ChatGPT的使用与所获得的生产力提升呈正相关
资料来源:OpenAI《2025年企业人工智能现状》,中金公司研究部
“Killer App”源头是技术核心颠覆性。正如社交与UGC内容平台是互联网时代的“Killer App”,我们认为AI时代的“Killer App”应是生产力平台,而Chatbot是目前最接近该定义的产品形态,且迅速增长的用户规模给予了部分佐证。目前,ChatGPT全球周活用户已突破8亿,根据Sensor Tower,其月活在2025年H1超过头部社交平台X,持续拉开差距。根据36氪,截至目前,国内豆包App日活超过1亿,这标志着它已跨越早期采用阶段,进入大众化增长周期,为其向生产力平台演进奠定了用户基础。
图表2:ChatGPT的MAU迅速增长,与主流社交媒体展开同量级竞争
资料来源:Sensor Tower,中金公司研究部
频次和留存持续提升,“Killer App”露出“冰山一角”。一方面,Chatbot的使用频次持续提升,验证用户的黏性,根据Sensor Tower数据,ChatGPT的用户月均活跃天数达13天,频率与X(原Twitter)、Reddit等成熟社交平台基本持平,高频触达成为常态。另一方面,用户使用模式展现出稳定性与全天候特征——生成式AI在一年内由早期的“工作日工具型”(类似Slack,周末使用量下降),演变为“全天候均衡型”(类似Google),周末与工作日使用强度收敛,深度融入了非工作场景。用户黏性相关指标同步印证了这一趋势。
图表3:ChatGPT与社交平台、工具类应用人均日均使用时长
资料来源:Sensor Tower,中金公司研究部
图表4:ChatGPT与社交平台、工具类应用日均会话次数
资料来源:Sensor Tower,中金公司研究部
图表5:ChatGPT与工具类应用7日留存率
资料来源:Sensor Tower,中金公司研究部
图表6:ChatGPT与工具类应用30日留存率
资料来源:Sensor Tower,中金公司研究部
自然语言交互有望开启AI应用新周期
人机交互方式越来越自然,门槛越来越低,而人机交互方式大变革往往带来产业发展大周期,从历史来看,图形操作界面带来PC大众化普及,而多点触控则开启了移动时代。Chatbot引入人类最熟悉的社交行为(对话),承载了从模糊需求到精确指令的完整谱系,自然地将用户引向深度的生产力提升,这构成了其产品形态的核心变革点。
Chatbot是对传统多点触控(Multitouch)交互范式的重要升级和补充。它使用户得以用符合日常习惯方式,即语言交互,调动AI生产力,降低了使用门槛,让模糊的需求能通过多轮对话自然澄清并得到满足。而且,这种“对话即交互”的模式,在双手被占用,或需要处理复杂任务时提供了独特的效率优势。
另一方面,我们认为自然语言交互不会完全替代图形交互,而是与之形成补充关系。从演化进程来看,视觉、触觉等形成都早于语言,因此前者属于更符合人类直觉的交互方式,存在不可替代性。我们认为未来的交互或将是语言与图形智能结合的多模态形态,图形交互(如点击、滑动)凭借其直观和普适性,在信息浏览、精细操作等场景中仍不可替代。
Chatbot已成气候——格局与发展复盘
全球市场:ChatGPT领先,但Gemini在追赶
ChatGPT凭借全面的规模优势、品牌力的占领以及成熟的跨平台体验,占据市场第一的位置。截至2025年7月,其全渠道周活跃用户(WAU)已超过7亿;根据Sensor Tower,至2025年11月,其移动端月活跃用户(MAU)进一步突破8.7亿,月活市占率63%;在网页端,根据Similarweb,其占据了全球生成式AI访问量的近80%。
Gemini凭借Google全栈式AI布局呈现追赶态势。10月,其全渠道活跃用户达6.5亿(2025年10月谷歌财报披露);根据Sensor Tower,其移动端累计下载量达4.54亿次,MAU 达3.37亿,稳居市场第二。根据Similarweb,其网页端流量市占率持续提升。其通过深度整合至Android系统、Google Search及Workspace产品矩阵,Gemini能够直接触达全球数十亿现有用户,实现低成本、高效率的市场渗透与习惯迁移,我们认为这是其挑战市场格局的核心变量。
图表7:全球Chatbot流量格局(移动端)
资料来源:Sensor Tower,中金公司研究部
图表8:全球Chatbot流量格局(网页端)
资料来源:Similarweb,中金公司研究部
在通用市场之外,一批参与者通过聚焦特定需求建立了差异化。在市场整体用户特征趋同(以年轻、高知群体为主)的背景下,部分应用已凭借场景化优势,形成了差异化的忠实用户群:Anthropic Claude专注于B端API和开发者工具的战略,尽管移动端MAU(约1211万)规模较小,但凭借对安全性、长上下文和可靠性的极致追求,已成为企业市场的首选之一。Perplexity以“答案引擎”定位,强调实时性和信源引用,在信息查询场景占有一席之地。Grok在情感智能(EQ)的突破,让其在追求“人格化”、富有情感温度的交互体验上脱颖而出。
在用户粘性方面,ChatGPT表现领先。留存表现方面,ChatGPT的7日、30日用户留存都要高于其他,此外,ChatGPT和Claude的人均单日使用时长为16-17分钟。此外,根据Sensor Tower,超过15%的ChatGPT用户同时使用其移动应用与网页版,表明其服务已深度融入用户跨场景的工作流。
图表9:海外Chatbot 7日用户留存率
资料来源:Sensor Tower,中金公司研究部
图表10:海外Chatbot 30日用户留存率
资料来源:Sensor Tower,中金公司研究部
根据我们对于Gemini、ChatGPT、Claude的测评(截至12月):在海外市场,ChatGPT和Gemini在多模态能力、回答与生成流畅性与体验、语音表现力和情绪交互能力等多个维度不分伯仲,且在拟人化交互(比如语音)能力上,优于Claude。
图表11:海外Chatbot的产品特性对比
注:1)根据我们实际测评,本轮测评均依据截至2025年12月的结果;2)绿色表示具备,红色表示尚不具备,颜色越深表示特性越强
资料来源:公司官网,中金公司研究部
ChatGPT深度复盘:“北极星”是AGI,产品是模型的自然延伸
我们认为,ChatGPT的发展史本质上是一部底层大模型(GPT系列)的能力扩张史,团队的核心理念始终围绕着追求通用人工智能(AGI)的“北极星”,产品形态则是这一技术理想最直接的消费品。
ChatGPT的背后是OpenAI,一个以非营利研究实验室为起点、使命驱动型的组织。其团队核心并非产品经理,而是以首席科学家伊尔亚·苏茨克维为首的研究科学家与工程师。其长期保持相对扁平的研究工程架构,重心在于前沿算法的突破与工程化,而非针对特定场景进行产品化打磨。而其绝大部分资源倾注于算力采购、基础模型训练与安全对齐研究,产品团队规模相对较小,主要职责是将强大的模型能力以最直观的方式(对话界面)交付给用户。
因此,其产品的第一性原理就是追求IQ(智能)。其所有设计的首要目标是展现和利用底层模型最强大的推理、知识与泛化能力。用户体验的核心是“与一个超级智能对话”,而非与一个亲切的伙伴交互。
图表12:ChatGPT聊天入口界面设计简单
资料来源:ChatGPT,豆包,中金公司研究部
ChatGPT的演进是其核心理念的逐步兑现:
能力升维与生态雏形(2023年3月-2024年5月)GPT-4发布带来推理能力质变,产品层面引入插件系统、联网搜索和多模态,赋予模型调用外部工具API的能力,标志着ChatGPT从封闭对话系统转向能调用工具和感知世界的“智能体”。多模态的产品封装(2024年5月-2025年3月)发布更快速、更自然的原生全模态模型(文本、音频、视觉)。自此其增长节奏紧密对应GPT-4、GPT-4 Turbo、o1推理模型等重要模型发布。每一次模型能力的跃迁,无论是多模态理解、推理能力提升、幻觉率降低还是视频生成突破,均直接推动用户规模上升,巩固C端入口吸引力。根据Sensor Tower,2024年5月-2025年3月,其DAU突破1亿,用户规模加速增长。
图表13:ChatGPT DAU增长,以及历史上模型、功能迭代更新回顾
资料来源:OpenAI,Sensor Tower,中金公司研究部
从Chatbot到“AI平台”与“智能默认接口”(2025年3月至今)战略重心全面转向平台化:全力推进GPT Store与自定义GPT,将创作生态交给开发者。同时,通过API和企业级合作(如与微软、Google日历的整合),深化其作为AI基础设施的角色。在2025年5月红衫AI峰会上,Altman描绘了“核心AI订阅”的愿景,即一个拥有海量上下文、能容纳个人经历的小型推理模型,成为人与数字世界交互的“智能默认接口”,且其认为,AGI是一个已经身处其中的渐进过程。
从需求端来看,使用场景从“效率工具”泛化为“生活方式”。Altman在2025年10月提出,ChatGPT正在从一个“超级助手”变成一个“平台”,目标是让其他人在其上创造出比OpenAI自身更有价值的东西。
用户群体不断破圈。对于高认知密度、强工具属性的人群,例如程序员(GitHub)、知识工作者(Notion)等核心群体,Sensor Tower数据显示其渗透率已超过50%。更具说服力的是向“非原生关联场景”的外溢能力,在TikTok、Duolingo等看似不相关的应用用户中的渗透率超过了30%,且过去五个季度在所有观测应用中的渗透率增幅均超20个百分点。
图表14:ChatGPT与Google Gemini及其他多类型应用的用户重合度
资料来源:Sensor Tower,中金公司研究部
中国市场:豆包确立领先优势,DAU破亿
不同于海外,中国的AI流量延续了移动互联网的“路径依赖”。根据QM《2025年三季度AI应用行业报告》,截至25年9月,国内AI应用整体月活跃用户移动端规模达7.29亿(包括独立App以及应用插件In-App AI),远超PC端的2亿。In-App插件凭借其与微信、抖音等超级App生态的无缝融合,增长轨迹一路向上(24年5月2.80亿→25年9月7.06亿);移动端原生App用户规模实现“从零到一”的增长(24年5月0.64亿→25年9月2.87亿),在不到两年时间内汇聚近3亿用户。
图表15:国内AI应用月活跃用户规模
资料来源:QM,中金公司研究部
图表16:国内AI月活跃用户应用形态分布
资料来源:QM,中金公司研究部
豆包Chatbot复盘:“超级App”之路
“豆包”团队的组织形态演进,与产品本身的战略地位提升同步,可划分为两个关键阶段。1)2023年字节整体的AI业务处于“支持职能”阶段,尚未形成独立架构,早期以内部创业项目形式牵头,团队临时整合,初期版本集成于抖音搜索,资源依附于抖音等主业务。2)2024年初,字节启动重组将AI升格为“一级战略”,“豆包”的产品定位也从“对话功能”明确为“核心AI入口”,为此,公司专门拆分Seed(基础模型研究,2025年明确吴永辉为负责人,其为前Google DeepMind研究副总裁)与Flow(模型应用,目前由朱骏负责产品)两大部门,与抖音、TikTok、火山引擎等业务线平级。豆包就是诞生于“Flow”部门的核心旗舰产品。我们进一步来看豆包这一产品的演化历史:
探索与定位(2023-2024年):移动化,借鉴“Charater.ai”,关注情绪价值。
► 豆包的三大设计原则。Flow产品与战略副总裁朱骏在2024年5月火山引擎大会上的演讲,系统阐述了豆包的三大设计原则:1)拟人化:人性化设计降低AI使用门槛,建立情感连接;2)离用户近:从“人找服务”到“服务找人”,最关键的实践是与抖音等超级App的整合;3)个性化:通过智能体(Agent)生态和“扣子”开发平台的支持,满足用户对功能、风格、记忆的个性化需求。
► 初期产品形态与“Charater.ai”相似性强。两者都将提供情绪价值、情感陪伴作为产品的核心功能,且都构建了以“角色”为中心的UGC生态。用户登录后,界面会默认提供多个不同定位的对话机器人(Bot),包括“全能写作助手”、“英语学习助手”以及用于闲聊的“聊天虚拟人物”。
► 关注情绪价值。豆包策略产品负责人李福祥2024年10月在北大演讲中提出,在AI产品探索进入“无人区”后,思路应包括:“产品理想态先行”(在开发初期,先不纠结于当前的技术限制或实现路径,而是首先定义并锚定一个理想产品状态)、持续并行尝试,以及“关注情绪价值,以新奇有趣为牵引”。
2024年5月举办的火山引擎FORCE原动力大会上,字节跳动正式发布“豆包大模型”及产品阵列;同时,豆包与今日头条、抖音搜索数据打通,强化AI搜索能力,并上线22个官方智能体及“发现”入口,覆盖资讯、娱乐、角色扮演等场景,尽管初期用户体验反馈不一,部分用户反馈其核心功能深度较弱(如文案生成模板化、多模态识别不准),但已经接近富有情绪价值的产品理想状态(如李福祥北大演讲指出),且已经具备“个性化”的智能体生态(如朱骏2024年FORCE大会演讲指出)。
此外,豆包大模型定价降至行业领先水平(主力模型比行业低99.3%),以低价策略迅速吸引开发者与生态在真实、复杂的场景中“喂养”模型、优化体验,从而在技术成熟度曲线上实现抢先卡位,持续将豆包的能力输送到社交、娱乐、教育、电商等各个垂直领域的末梢。
技术冲刺与能力闭环形成(2025年),组织架构深度调整,用户规模快速增长
根据QM,2024年9月-2025年5月,豆包App DAU净增约2700万,DAU/MAU从18%提升至26%,是豆包App历史上增长最快的时期之一。
图表17:国内Chatbot DAU(月度)
资料来源:QM,中金公司研究部
图表18:国内Chatbot DAU与MAU的比率
资料来源:QM,中金公司研究部
一方面,Seed基础模型研发全面发力,多模态能力“月更”补齐短板。2025年初DeepSeek以更接近ChatGPT的“技术原教旨”路线,对行业形成冲击,在纯文本和代码推理领域建立起口碑。 豆包应对DeepSeek的冲击并非简单的模仿或对抗:1)允许飞书、悟空浏览器等非核心业务接入DeepSeek以承接流量,但抖音、豆包两大核心战略产品坚持使用自研模型;2)依托Seed团队,将资源集中倾注于更具优势的多模态和垂直领域能力上。在2024年9月火山引擎举办的活动中,Seed团队揭幕豆包视频生成模型PixelDance与Seaweed、豆包音乐模型、豆包同声传译模型等多个垂类模型。且自4Q24起,豆包多模态模型进入“月更”级快速迭代。另外,Flow团队将Seed提供的模型能力,转化为用户每日高频使用的产品功能,提升产品实用性与趣味性。
根据我们对于豆包、元宝、千问的测评(截至25年12月),豆包在多模态能力、回答与生成流畅性与体验、语音表现力和情绪交互能力都占优,尤其在方言能力和语言交互方面,更是相比竞对更强。
图表19:国内Chatbot的产品特性对比
注:1)根据我们实际测评,本轮测评均依据截至2025年12月的结果;2)绿色表示具备,红色表示尚不具备,颜色越深表示特性越强。
资料来源:公司官网,中金公司研究部
生态整合(2025年至今),DAU突破1亿大关为其标志性事件,高留存巩固高质量增长。豆包目前的用户规模、留存率、增速、DAU与MAU的比率,均说明其DAU迈向更高门槛的确定性强;而竞对们无论是基于对产品的理解、定位还是投入,都很难影响这一路径。此外,用户主观上认为“谁更强”的品牌认知,可能构成了最坚固的长期壁垒。我们认为,这种认知一旦形成,便具有惯性,这种品牌认知会转化为广泛用户和海量数据,这些数据反哺模型优化,进一步巩固其“更强”的公众印象,从而形成自我强化的正向循环。
2025年12月,字节发布豆包大模型1.8版本,标志着能力重心从“生成”转向“理解与执行”。同期,字节与中兴合作推出豆包AI手机工程样机,尝试将智能体能力深度集成至手机操作系统底层;豆包也开始接入抖音电商开辟新的增长空间。此外,根据晚点,豆包或将成为2026年央视春晚独家互动合作伙伴,配合火山引擎上线多种互动玩法。
图表20:国内Chatbot 7日新用户留存率对比
资料来源:QM,中金公司研究部
图表21:国内Chatbot 30日新用户留存率对比
资料来源:QM,中金公司研究部
当下Chatbot普遍被视为“顾问”角色,未来沿着“执行”与“表达”两条路径,从Chatbot到Agent
目前,用户对ChatBot的核心使用仍是寻求信息、建议与内容生成,根据ChatGPT NBER的论文,高达49%的交互属于“询问”(Asking)类。这验证了其作为外部大脑和决策增强工具的初始定位,即通过对话提供认知支持,这一模式也是增长最快的类别,说明用户对其深度分析能力的依赖正在加深。多模态能力或决定产品形态的演进速度。
► 演进方向一:处理执行类任务。已有40%的交互属于“执行”(Doing)类任务(如编写代码、起草邮件、分析数据)。这标志着用户已认可其作为生产加速器,并为未来模型能力提升后,进一步自动化复杂工作流奠定了基础。
► 演进方向二:成为“情感伙伴”,探索非工具性互动。尽管占比约11%的“表达”类(Expressing)交互(如闲聊、创意写作、情感陪伴)规模尚小,但或也表明ChatBot在非工具性领域的潜力。
图表22:ChatGPT调用需求分布变化(根据动机)
资料来源:ChatGPT NBER 2025年9月发布的《HOW PEOPLE USE CHATGPT》,中金公司研究部
从Chatbot到Agent逻辑推演
Agent是Chatbot正在演进的方向
我们认为Agent代表着AI应用的终极形态与核心方向。其标志着AI从被动的问答工具,进化为能自主理解、规划并调度资源与服务的“行动主体”,或将开启一个比当前市场想象更为广阔的新商业时代。
当下有希望切入Agent赛道几个潜在方向:1)通用Chatbot(追求认知广度的通用智能大脑),以OpenAI的ChatGPT、谷歌的Gemini及字节跳动的豆包为代表;2)端侧AI(情境化执行终端),以苹果的Apple Intelligence为典型;3)垂直场景Agent(垂直场景专家),例如Cursor之于编程、Manus之于工作流自动化。如下图所示,尽管这三者现阶段体现出的差异化价值更大,但已经衍生出互相渗透的交集功能。比如Chatbot通过获得系统权限(如Gemini融入安卓)向端侧AI领域渗透;端侧AI通过集成专业服务(如快捷指令调用专业工具)向垂直场景延伸;而垂直场景Agent也通过API融入通用平台以扩大触达。
图表23:Chatbot、垂直场景Agent、端侧AI的三者关系
资料来源:公司官网,中金公司研究部
我们认为可以将Chatbot切入Agent路径或可以类比为“当代的早期微信”。微信始于即时通讯(IM),Chatbot始于对话(Chat),都是高频、通用的用户入口,微信通过公众号、支付、小程序,将通讯工具演变为连接人、内容、服务的数字生活平台;同理,Chatbot正通过插件、API、智能体生态,从回答问题的工具演变为调度数字世界资源与服务的“智能体平台”。这背后既有Chatbot对垂直场景Agent的渗透和反渗透关系,也有对端侧AI(目前以App形态和终端形态同时存在)的入口之争。
当前Agent应用普遍局限性包括模型能力对执行复杂问题仍有挑战,个性化功能仍有缺失,MCP等生态布局仍处于初期等:
1.模型端到端复杂任务可靠性不足。Anthropic模型测试 (2025)、ToolComp 基准测试 (2025) 指出主流模型在实际任务成功率低,且在需要多工具协作的复杂任务时的能力不足;WebAgent长上下文推理评估 (2025)指出当上下文长度增加(模拟多会话历史),模型成功率从基线40-50%骤降至10%以下。这也就导致了许多真实的使用场景下(如完整网购流程)的实际用户体验差,无法形成可靠的价值交付。
2. 个性化能力仍有缺失。当下主流观点仍认为大模型应用更像搜索,部分原因就是因为当下大模型仍然未展现足够的个性化能力(正如搜索),且需要用户主动对话表现意图。而从Agent第一性原理来看,针对用户个性化需求进行定制,甚至主动对用户意图进行预测并推荐,将成为Agent终极形态必备的功能。由此,我们认为终极形态的Agent大概率将是搜索+推荐的综合体,且个性化推荐可能甚至是更重要的选项。
3. MCP等工具生态布局仍处于初期。一方面是现状,目前大模型能够接入直接使用的工具库仍然有限,生态建立刚刚开始。另一方面是客观阻碍,综合Agent和交易类平台之间关于入口之争的博弈或将持续,可能会阻碍Agent生态建设进程。
关注焦点一:通用大脑(Chatbot)和垂直场景Agent共存&替代
Chatbot服务边界持续扩张,在C端尤其明显
从供给端来看,拥有通用型大模型在进军垂类模型时或拥有一定协同优势,展现出赋能垂类模型的“化学反应”。一方面,通过提供强大的通用智能(如上下文推理、多模态理解、代码生成),解决垂类模型核心能力瓶颈。另一方面,通用模型在垂类模型的训练数据生产和工作流融合中发挥作用。虽然这种优势理论上也有机会逾越(例如垂直场景Agent基于开源通用大模型补齐短板等),但如果这条逻辑主线大范围成立,或意味着专业应用的参与门槛在提升——简单基于大模型打造应用或竞争力不够,而需要深度整合通用大模型和垂类模型化学反应,这显然意味着更高技术投入门槛。
从需求端看,通用型产品面对ToC市场有一定优势。通用型Agent占据用户的高频使用场景(如日常沟通、信息查询、日程提醒),当单个特定需求出现时(如偶尔需要翻译、修图、制作表格),用户会本能地在已打开的高频入口内寻求解决方案。且从用户行为逻辑看,使用集成在通用Agent内的功能,边际成本(认知成本、切换成本、学习成本)远低于启用独立专用工具。最后,通用型产品由于规模优势,往往相对于专用产品有成本优势,从而带来价格优势。根据Menlo Ventures《2025年消费级AI现状报告》,在这种“默认行为”的驱动下,91%的AI用户会优先使用他们最顺手的通用AI助手。
图表24:AI功能渗透与替代路径示意图
资料来源:Google DeepMind,中金公司研究部
通用AI大脑(Chatbot)不会完全替代在垂直领域深度优化的垂直场景Agent,核心在于,专用工具能否找到足够规模、且对效果差距有高敏感度、并愿意为之付费的用户群体。根据Menlo Ventures,60%的用户表示,他们会同时使用通用AI助手和专业AI工具,对C端市场来说,随着壁垒不高的浅层专业工具逐渐被大模型内化,用户去寻找、下载并学习一个专业应用的机会也更少,其前提条件则是该赛道潜在空间大,专用参与者有充足空间打造体验差异。
图表25:当工具性能超越一个阈值后,用户满意度与支付意愿的变化逻辑
资料来源:中金公司研究部
在B端市场,垂直场景Agent的生存逻辑较为坚实。企业用户对工具的效果阈值、可靠性、安全性与工作流集成度要求远高于普通消费者。他们更愿意为能够持续提升效率、优化产出或降低风险的确定性而付费。因此,在编程、法律、金融分析、特定生产力工具等赛道上,那些能深入业务闭环、解决复杂问题的垂直场景Agent(例如专为代码生成的Claude或特定设计工具),也有可能建立起稳固的商业模式和竞争护城河。
关注焦点二:Agent入口和垂直服务巨头的博弈
平台化是大势所趋。其意义在于使Agent具备能够直接调用的API、软件功能或硬件能力,长出丰富的“手脚”。目前大部分公司已经有所尝试,但最终的形态还未被定义。核心在于ChatGPT、豆包等应用商店模式试图定义增量市场,但缺乏系统级权限,需通过硬件合作(如AI手机)或生态联盟突破;而超级App巨头和硬件厂商基于存量优势构建防御。
巨头生态博弈和入口争夺
我们认为综合Agent模式一旦成形,很有可能成为下一代超级应用流量入口。此外,由于其占据用户一系列生活、服务等需求,其背后需要多元化的应用生态支撑其提供服务,且这些服务所属的特定赛道往往已经经历行业整合,形成现有巨头赢家。由此,Agent入口的巨头和生态服务提供商巨头之间的博弈将难以避免。
对于亚马逊、美团、携程、淘宝等已建立庞大交易生态的垂直服务平台而言,Agent带来的“去中介化”是其不愿意看到的,核心担忧其可能会从“平台”降级为被调用的“供应商”,丢失交互界面以及潜在的商业模式影响。因此短期内,可能有限开放或拒绝开放核心交易API,尤其涉及实时库存、最优价格与会员体系的接口,以增加通用Agent无缝比价和一站式预订的难度,例如亚马逊起诉Perplexity,要求其禁止AI助手Comet代表用户在平台自动化购物(2025.11);字节跳动发布豆包手机助手技术预览版也引发了行业连锁反应,淘宝、微信等多家服务平台已拒绝AI外挂手机的登录(2025.12)。同时,平台加速自研垂直领域Agent(如美团外卖助手、携程旅行管家),将AI能力深度内嵌至自身App,强化用户体验与忠诚度,同时,利用其深厚的供应链与商户关系,提供通用Agent难以复制的“独家”库存或服务,构筑商业壁垒。
中美市场存在差异。对比移动互联网时代,谷歌搜索和百度搜索在中美互联网市场演进方向差异,前者显然受益于更加开放合作的巨头生态,而后者则受损于中国互联网巨头之间更高的“隔离墙”。由此,如果我们将综合Agent落地比喻为“再造一个谷歌搜索”,其在欧美互联网市场似乎障碍相对更小。反观中国互联网市场,由于互联网巨头已经形成了相对独立的流量生态,假设综合Agent落地,或对于原有竞争格局造成更大扰动,或许也预示着更强的博弈。
对比中外,谷歌和腾讯有部分交易生态优势。其核心原因是微信和谷歌本身生态卡位就类似于未来综合Agent流量入口卡位,
► 微信本身就有小程序等综合交易生态,根据腾讯财报,其小程序促成的交易GMV 3Q达到2万亿元,电商平台拼多多、京东,本地生活服务平台美团、携程等已经存在。此外,大量中长尾的服务提供商主要流量甚至来自微信小程序,例如迪士尼乐园的88%流量均来自微信小程序。
► 谷歌搜索,由于其十数年在欧美互联网市场占据搜索统治性份额(80%以上),且凭借庞大的开放生态(核心互联网内容都能搜到,且搜索体验佳),以及良好的价值观(赢得了用户信任),加深了“有用”定位。谷歌搜索成为欧美用户日常交易的最重要入口,其搜索成为主流交易平台例如Amazon,Booking等重要导流入口,Google自身也有庞大货架系统,根据其25年I/O大会,其货架涵盖50亿商品和服务SKU,商品来源主要来自第三方(例如亚马逊、Shopify等),且价格和库存动态更新,部分用户甚至可以不跳出Google搜索直接完成交易。由此,腾讯和Google确有部分存量生态优势,但这种生态优势是否能够直接转化成为Agent时代生态优势,仍然存在一定不确定性。例如,未来微信Agent是否能够自由使用小程序内部的数据仍然未知。
长期决定要素是“是否应该”,而不是“现在是否成立”。部分市场观点认为,从豆包手机助手接连遭遇其他应用禁用的案例可以分析出,由于隐私等问题,Agent应用很难实现跨应用调用,从而模式不成立。但我们认为这种分析仅仅是静态的“当下能不能分析”。然而,长期决定事物走向的往往是“Agent模式是否应该存在”这个关键问题。而这个问题显然是毋庸置疑的,由此,虽然其发展路径可能有些曲折,我们对于长期方向仍然不怀疑。
商业化畅想:从订阅到效果广告
当前商业化尝试与困境:订阅制主导与免费模式的博弈
海外市场订阅制渐成主流。以OpenAI和谷歌为代表的海外厂商,已建立相对清晰的订阅分层体系。OpenAI的商业模式尤为典型,其约75%的收入来自消费者订阅,并通过提供Plus(约20美元/月)和Pro(约200美元/月)等差异化服务,成功将5%-6%的免费用户转化为付费会员。面向企业,则有按席位收费的Team(约30美元/人/月)和定制化的Enterprise方案,根据the Information报道,OpenAI收入近三年快速增长。其年度收入从2023年的超过16亿美元,大幅提升至2024年的55亿美元,并进一步在2025年前七个月实现翻倍,达到约120亿美元的年化收入水平。收入结构方面,根据Techcrunch,其核心的ChatGPT Plus订阅服务(每月20美元)约占当前总收入的70%。
然而这一模式面临双重挑战。1)付费用户天花板较低,当下ChatGPT月活付费率仅为5-6%;2)例如谷歌等巨头依赖“成本优势+低价或免费策略”形成强大挤压。作为当下推理成本最低的参与者之一,谷歌有能力将Gemini 3 Pro等顶尖模型部分免费开放给所有用户,其Advanced订阅(约20美元/月)则与2TB云存储等权益捆绑。这种策略或也会压缩OpenAI等竞争对手的生存空间。
国内以免费为主。与海外不同,中国C端市场受用户付费习惯,市场竞争相对激烈等因素,Chatbot国内面向C端用户以免费为主、B端用户低价API的策略。
图表26:海内外Chatbot的订阅收费
资料来源:各公司官网,中金公司研究部
长期来看,免费+效果广告模式或在C端替代付费订阅方式。回顾互联网早期ToC邮箱应用历史,早期邮箱服务都是订阅付费制度,且往往存储空间仅有几百MB,然而Google Gmail凭借技术革新,为用户提供1GB的免费存储空间,迅速成为行业统治性应用。其关键要素包括技术迭代推动成本降低,数据驱动广告飞轮,随着技术迭代大模型的单位推理成本有望降低,到某个时点将突破可以免费提供给用户使用阈值。另一方面,海量用户意味着海量用户数据,而这些数据又将反哺广告等商业化价值,从而形成数据成长飞轮,成为产品核心壁垒之一。基于以上逻辑,我们认为在未来某个时刻,Chatbot(或Agent)在C端大概率将采用免费+效果广告的商业模式,其用户门槛最低,且竞争门槛最高,商业价值潜力同样有巨大空间。
现有互联网巨头或在广告变现维度有明显竞争优势。核心是现有的效果广告的变现基础设施和历史用户数据的积累。前者是多年持续建设的结果,对于新进入参与者(例如OpenAI)如果其要重建如Meta,Google的广告变现基础设施,至少需要耗费大量时间和金钱等资源。后者则更加具备挑战性,其挑战不仅来源于例如腾讯、谷歌等巨头广泛的数亿级别用户覆盖,更来自于过去十数年用户隐私等法律法规持续升级对新进入参与者搜集用户数据不利。例如21年苹果修改IDFA政策后,大部分iPhone用户已经默认关闭IDFA,新进入参与者将无法搜集这部分用户相关数据。
Agent时代的效果广告更加交易导向。我们认为相比于当下互联网效果广告兼具曝光、点击、转化等,Agent时代的效果广告或更加交易导向(CPS模式),主要原因是作为端侧AI,其必然需要帮助用户解决日常各种商品、服务交易问题,而这就意味着广告的机会和空间。这种趋势契合效果广告的第一性原理即广告即信息,其精准度提升,对用户打扰减少,从而进一步提升用户体验和用户黏性。 当前,主要厂商已进入到实质性的商业化验证阶段:
► OpenAI:公司正在研发基于对话上下文的广告系统,其核心是不干扰对话体验,只在用户进行相关商品咨询时,自然地嵌入已披露的赞助信息。其CEO山姆·奥特曼也在公开采访中表示可以探索“更有品味”的广告模式。此外其9月推出的 “Instant Checkout”(即时结账)功能,通过与Etsy、沃尔玛等合作,用户无需跳出对话即可完成购买。
► 谷歌:将传统搜索广告升级为更智能的交易推荐。在AI生成的“AI Overviews”摘要、以及 “AI Max”广告活动中,广告不再是独立的展示位,而是作为AI生成答案的一部分,被整合到信息流中,直接响应用户复杂的、带有购买意图的查询。此外,其新交互模式“AI Mode”支持多轮、口语化的对话式搜索,在连续对话中寻找交易机会。
►豆包等国内大模型:依托生态,探索商业联动。当用户询问商品推荐(如“预算9000元内适合拍照的手机”)时,豆包会在回复中直接嵌入来自抖音商城的商品卡片,包含价格、评分等信息,点击后可跳转购买。类似地,Kimi、腾讯元宝等也接入了京东等平台的商品链接。
国内Chatbot或胜负已分,Agent仍有悬念
国内Chatbot或胜负已分
针对海外市场,ChatGPT目前仍处于Chatbot赛道领先地位,但是Gemini凭借Google庞大生态也不容小视,而Grok,Claude等参与者也具备一定竞争力。行业最大不确定性可能来自OpenAI本身业务发展趋势以及财务稳健性,假若OpenAI出现发展波动,Gemini或成为最受益参与者。
中国市场字节豆包以亿级日活的规模成为了消费端赢家,截至目前,国内豆包App日活超过1亿。虽然AI的发展日新月异,无论技术、产品还是商业模式都存在较大变数,但豆包在如此短时间内达到1亿用户,是对其能力全方位的证明。我们认为,豆包目前的用户规模、留存率、增速、DAU与MAU的比率,均说明其DAU迈向更高门槛的确定性强;而竞对们无论是基于对产品的理解、定位还是投入,都很难影响这一路径。
Agent仍处于初期
基于我们此前构建的分析框架,Agent时代对胜出者的要求在于 “大脑”与“手脚”的协同,我们对主要AI参与者在Chatbot能力、Agent生态、商业化三个维度进行评估,目前来看各个参与者仍具备不同维度优势,目前仍然难以决策最终赢家。
大模型的发展路径具备不确定性:尽管以OpenAI、Google、字节跳动等为代表的头部厂商在基础模型能力、推理性能及多模态方向持续取得突破,但整体而言,大模型与Agent仍处于快速迭代阶段,其稳定性、可解释性、成本可控性及在真实复杂场景中的泛化能力尚未完全成熟。一方面,模型在多步骤决策、真实世界执行(如跨系统操作、交易闭环)中仍可能出现幻觉、执行偏差或失败,且生成式人工智能底层技术路径、架构选择尚未完全定型,存在迭代或转向的可能。此外,该行业属于技术与资本密集型领域,企业需持续进行大规模研发及算力投入,且投资回报周期较长。同时,由于核心技术开源化程度较高,且众多科技企业竞相布局,行业进入壁垒相对有限,市场竞争持续激烈。
产品商业化的不确定性:当前各家围绕订阅与API收费、云与平台化赋能、广告与电商转化、企业级解决方案等多元路径探索商业化,但盈利模式整体仍处于验证阶段,商业化存在较大不确定性。此外,行业价格战也可能压缩行业利润空间,现有Chatbot与Agent的用户黏性、付费能力均可能面临波动。
监管与地缘政治风险:AI原生应用直接触达终端用户与企业核心业务,涉及数据隐私、内容安全、算法透明度等多重监管议题。大模型训练数据来源、输出内容责任、系统级入口的审查有可能趋严,或对模型训练、产品功能和跨境数据流动形成约束。同时,高端算力芯片与云基础设施亦受地缘政治与出口管制影响,或导致算力成本显著抬升、模型迭代放缓。
从Chatbot到Agent进化的不确定性。从Chatbot到Agent的演进,并非平滑的功能升级,而是一次涉及技术、产品、商业和生态标准的跨越。当前行业共识虽指向能自主理解、规划并执行复杂任务的Agent,但其技术成熟度(如长期记忆、可靠推理)、可信的用户接受度及清晰的商业模式均未成型。此外,用户是否愿意将涉及隐私、支付或关键决策的任务委托给Agent,并接受其可能产生的错误结果与责任模糊地带,存在较大的习惯培养与信任建立门槛。对于现有的领先者而言,其现有成功奠基于Chatbot时代的逻辑,能否在Agent时代继续引领,存在较大不确定性。
本文摘自:2026年1月8日已经发布的《Chatbot专题研究:未来已来》
肖俨衍 分析员 SAC 执证编号:S0080521010001 SFC CE Ref:BIL686
魏萌 分析员 SAC 执证编号:S0080524070011 SFC CE Ref:BVB685
白洋 分析员 SAC 执证编号:S0080520110002 SFC CE Ref:BGN055