腾讯的大模型研发,一直被认为比阿里、字节跳动慢一步。全球主流机构的大模型基准测试中,腾讯的混元系列大语言模型长期不在第一梯队。“腾讯系”产品采取混元、DeepSeek共存的方案——用户可以自主选择使用混元或DeepSeek。这是自身模型能力不够强的折衷方案。
不过,腾讯正在试图改变这个局面,下决心做好自己的模型。
12月17日,腾讯对大模型研发架构做出调整。由Vincesyao出任“CEO/总裁办公室”首席AI科学家,向腾讯总裁刘炽平汇报。这意味着,大模型研发已经是腾讯CEO/总裁办公室的重点关注项目。
《财经》了解到,Vincesyao的实名是姚顺雨,他是OpenAI前研究员。姚顺雨出生于1998年,本科毕业于清华大学姚班(清华学堂计算机科学实验班),后进入普林斯顿大学攻读博士学位。2024年8月,姚顺雨加入OpenAI,参与了Operator与Deep Research这两款智能体产品的开发。他的智能体相关学术研究,也为OpenAI的智能体业务起到了基础贡献。
今年9月,曾有消息称姚顺雨高薪入职腾讯,但腾讯一直未明确回应这一说法。此次腾讯大模型研发架构调整,是姚顺雨首次出现在腾讯的公开信息中。
腾讯向《财经》提供的信息显示,Vincesyao还兼任新设立的AI Infra(基础设施)部、大语言模型部负责人,向技术工程事业群(Technology and Engineering Group,简称TEG)总裁卢山汇报。
AI Infra部将负责大模型训练和推理平台技术能力建设,AI Data部、数据计算平台部,将负责大模型数据及评测体系建设,大数据和机器学习的数据智能融合平台建设。
姚顺雨的个人学术主页
腾讯为何会慢一步?
过去两年,腾讯的大模型研发节奏确实比阿里、字节跳动慢了一步。2023年-2024年,阿里的通义实验室、字节跳动的Seed实验室频繁发布新款大模型,且不断占据全球大模型基准测试的榜单前列。
腾讯混元系列大语言模型长期和第一梯队存在差距。美国加州大学伯克利分校的LMArena开放平台长期对全球大模型进行测试,并更新Chatbot Arena Leaderboard(大模型竞技排行榜)。腾讯的混元TurboS今年5月一度位居全球第8。但截至12月17日,腾讯混元T1-20250711综合性能位居全球第68名。
腾讯因为游戏业务的积淀,擅长3D/4D/世界模型。它未来在机器人空间训练等领域潜力大,但不是当下商业变现、通用性最强的技术路线。截至12月17日,斯坦福大学3D/4D/世界模型WorldScore Leaderboard排行榜中,腾讯混元World-Voyager位居全球第二名。
包括腾讯云等业务部门在内的多位腾讯人士对《财经》曾表达过焦虑情绪。在他们看来,腾讯和阿里、字节跳动都是第一梯队的科技公司,却没有自研出与自身行业地位相匹配的大语言模型。腾讯每年净利润远超阿里(备注:2024年腾讯集团净利润1941亿元,同期阿里集团净利润1209亿元),应该把利润投入大模型训练等AI前沿领域。
没有强大的自研模型,腾讯云等To B(面向企业级)业务在和阿里云、字节跳动旗下的火山引擎正面作战时缺少抓手。
上述腾讯云人士提到,腾讯保证股东利益,每年都会大规模股票回购。好处是,腾讯股价长期稳定,腾讯一直是投资者保值增值的少数标的。不过,在他看来,“一家科技公司应该有更大的梦想”。腾讯如果把部分回购股票的现金,拿去研发模型、投资算力,虽然会有风险,但也会有更大的可能性。
由于腾讯大股东南非Naspers集团荷兰子公司Prosus在长期减持腾讯股票,腾讯一直在采取回购股票的方式稳定股价。2024年腾讯回购股票高达1120亿港元(约合1014亿元)。腾讯在履行回购计划的同时,主动将回购的股票全部注销,这保障了每股收益,让股东获得了回报。2025年,腾讯也持续进行了多轮回购。
要不要倾全力去做大模型?腾讯内部也有不同的观点。今年9月,一位腾讯人士曾对《财经》表示,社交和内容是腾讯的生命线。2023年以来,市面上一直没看到能真正威胁这条生命线的AI产品。因此,腾讯没有急于出手。
他同时认为,这不代表腾讯不重视AI,腾讯对大模型一直是密切关注的。只是腾讯采取了更稳妥的策略——把AI融入社交、广告、游戏业务,在改善用户体验的同时,带来更高的变现效率。
为达成上述目标,腾讯依旧投入了巨额资本支出。腾讯也是国内投资最大的企业之一。
腾讯财报显示,2024年三季度-2025年二季度,腾讯资本支出总额为1023亿元,同比增长178%。《财经》多方了解到,中国市场同期资本支出总额超过1000亿元的大型科技公司,仅有腾讯、阿里、字节跳动三家。
不过,腾讯采购的巨额AI算力,一直优先供给内部应用孵化、改造。腾讯旗下的产品体系,如微信、QQ社交生态(小程序、支付、广告)、办公应用(企业微信、腾讯会议、腾讯文档)、游戏产品,以及元宝(腾讯旗下AI助手)、ima(腾讯旗下AI知识库)等产品都在嵌入AI功能。腾讯要服务十几亿用户,旗下业务日活跃用户动辄上亿。以微信搜索为例,它的日活跃用户就超过1亿。
国际投行巴克莱银行2025年11月在一份针对腾讯集团的研究报告指出,腾讯的AI投资保持了理性。资本开支虽有增长,但更注重ROI(投资回报率),并未进行不计成本的激进投入。这与一些同行形成对比。
一位资深算法工程师和另一位腾讯云人士认为,腾讯是一家对股东友好的公司。所以它首先要确保股东回报,而不是不计成本地投入模型研发和算力采购。
他们的看法是,腾讯的游戏、广告、金融业务一直是最大现金流业务。这些业务的特点是“轻资产、高回报”。但大模型这类业务的特点是,需要重研发、重资产投入,且不知何时能收回投资。腾讯管理层一直以来的决策风格都是偏稳健的。面对这种不确定性较大的业务,腾讯会相对谨慎。
“大模型的竞争永无止境。今年领先,明年不投入,模型能力一定会落后。这需要长期的算力、人才投资,是个无底洞。但另一方面,大模型又是个5年-10年的长跑。过去两年,行业发展尚不清晰的时候,跟随第一梯队并不是错误选择。相反,这可能是一种更经济的做法。”上述资深算法工程师认为,等腾讯想清楚之后,再加大投入也不迟。
要做好大模型,先找人
《财经》了解到,除了由姚顺雨担任首席AI科学家,腾讯近期还在国内大量招聘懂模型训练的年轻算法人才,甚至开出了两倍薪资。腾讯期望建立一支年轻有活力的模型训练团队。
大模型的研发通常需要顶尖科学家作为带头人,更需要一批顶尖的算法人才。在中国市场,各公司大模型训练团队人数规模不大,通常只有一两百人。这些人才通常从清华、北大、浙大以及海外名校计算机系毕业,甚至拥有计算机奥赛金牌银牌。
大模型创业公司月之暗面模型训练团队仅为100余人。此前媒体报道称,DeepSeek团队仅为200人左右。字节跳动Seed实验室为管理好一批AI科学家,内部分成了多个大语言模型、视频模型等多个不同研究方向的实验室。
一位中国大模型创业公司人士对《财经》表示,大模型公司最核心的预训练团队,甚至仅有数十人。AI科学家也普遍年轻,90后、95后是各家模型公司训练团队的中坚力量。以阿里的通义千问大模型核心负责人林俊旸为例,他年仅32岁。
一位算法工程师对《财经》表示,年轻的工程师不会受到旧知识体系的束缚,他们的学习研究一开始就基于最新的范式,能够以最前沿的视角去思考和创新。大模型领域的知识迭代以“月”甚至“周”为单位。一篇论文、一个模型就可能颠覆原有的技术路线。
吸引、管理这群年轻的天才无法使用“流水线”,而是需要创造自由开放探索的氛围。
一位领导了60多名算法工程师的创业公司负责人今年12月对《财经》表示,算法训练是无法流程化的,高度不确定的,不可控且无法追责的。这就像化学实验,实验好坏无法用表面数据判断。这需要负责人亲身参与,理解每一个算法。
自有大模型决定未来话语权
对于腾讯这类大型科技公司来说,做好自研模型最现实的意义,不仅是为了抢流量,更是为了保利润。
今年12月末,中国科技巨头不仅自研模型,还在利用自研模型推出AI To C的App(应用),争夺AI带来的新流量。
截至2025年9月,字节跳动的豆包App月活跃用户高达1.72亿。今年10月之后,阿里倾全集团之力扶持千问App,蚂蚁金服则是倾力投入灵光App。一位蚂蚁金服人士今年11月曾对《财经》表示,先要不计成本抢流量入口,有流量之后再考虑下一步的动作。
“元宝”是腾讯内部被寄予厚望的一款AI To C产品。市场调研机构Questmobile数据显示,截至6月元宝月活跃用户3286万,是国内第三大AI对话App。目前它的月活跃用户仅次于豆包和DeepSeek。
目前腾讯的社交、内容“生命线”很稳固,豆包、DeepSeek无法形成有力威胁。不过,如果AI对话应用的渗透率持续提升,并改变用户习惯,腾讯将遇到的潜在风险是——用户会逐渐迁移,流量入口也会失守。届时,腾讯后续的广告分发权、游戏分发权都受到影响。
此外,如果没有足够强的自研模型,可能会被模型强的公司吃掉利润。
今年12月,一位字节跳动旗下火山引擎算法负责人在一场小规模交流中对《财经》表示,他们预判2030年豆包大模型的Token(词元)调用量相比2025年末,将增长100倍左右。AI应用会在这个过程中逐渐爆发。一位亚马逊AWS人士则在12月初对《财经》表示,随着AI应用爆发,自研模型不够强的公司,利润将直接被挤压。
对腾讯而言,这个逻辑同样成立。如果腾讯拥有自研强模型,每一次API(应用程序接口)调用、每一次微信里的AI对话,利润都留在腾讯体系内。如果腾讯依赖外部模型,随着Token消耗指数级增长,腾讯庞大的业务生态(微信、QQ、等)都可能要为外部模型支付巨额推理算力,这将直接导致毛利被挤压。
在利润最丰厚的环节被“抽税”和可能出现的成本失控风险均为短中期挑战。放眼长期,如果没有强大的自有大模型,大型科技公司将在后续更多领域竞争中越发被动。
目前,拥有顶尖大模型的科技公司实际上正在定义AI能力的天花板、技术范式和评价标准,其他公司只能跟随和适配,失去产业定义权和路线主导权。
而这,绝不是腾讯愿意看到的。