腾讯全球AI大模型格局再洗牌,继DeepSeek后,腾讯混元在大模型评测榜单Chatbot Arena首次杀入八强,站到全球大模型第一梯队。这个依据用户对匿名大模型做盲测投票的榜单,是全球语言模型评级的“琅琊榜”。
榜单上,混元Turbo S模型评分紧跟DeepSeek,是国内唯二进入前八的模型。而混元Turbo S在5月25日低调发布的技术报告上也披露了其研发细节,通过融合了Mamba在长序列处理上的高效率和 Transformer卓越的上下文理解能力,并创新采用自适应长短思维链(CoT)机制,Turbo S在LMSYS Chatbot Arena上获得1356 分,在23个自动化基准测试中平均得分77.9%,展现了强大性能。
这个成绩对埋头苦干的混元团队无疑是一次正向激励。在今年春节,DeepSeek重新点燃的大模型新一轮竞速后,短短几个月时间,包括混元在内的一系列模型开启“疯狂上新”模式。就在5月21日的AI峰会上,腾讯就一次公布了混元模型矩阵的多项更新。旗舰快思考模型混元Turbo S、深度思考模型混元T1双双迭代。基于Turbo S基座,新推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。混元图像2.0、混元3D v2.5及混元游戏视觉生成等一系列多模态模型也同步“上新”。
伴随着模型底座的快速迭代,腾讯的AI战略正在加速进化,不仅将AI相关的年度资本开支扩张至接近千亿,微信、QQ浏览器等业务也纷纷做大模型技术改造,挑灯夜战、快速变阵,重拾产品创业激情。腾讯繁多的应用场景,让大模型的研发与落地紧密协同。国际投行将腾讯与Meta对标时,其估值逻辑已从“社交巨头”转向“AI生态构建者”,而混元大模型无疑是腾讯AI战略的重要支撑。
小步快跑
快速迭代
混元大模型在2023年9月7日在腾讯全球生态大会上正式亮相。彼时,ChatGPT风头正劲,大模型创业公司如雨后春笋。腾讯早有大模型技术积累,但散落在特定业务场景,在GPT引爆大模型的行业变局中,腾讯大模型快速重构团队,俯身埋头数月后,正式推出了全链路自研的大模型,开启了小步快跑、快速迭代的追赶模式,直到2024年初,混元率先推出MoE架构的大语言模型,并陆续发布一系列多模态大模型,综合实力跻身国内第一梯队。
混元在腾讯的定位不是像微信一样打造超级应用,而是将大模型的研发与能力和腾讯业务深度结合,让生成式AI成为腾讯业务增长的放大器。目前,混元已深度融入腾讯各业务线,广泛应用于微信、QQ、腾讯元宝、腾讯会议、腾讯文档等核心产品。
2025年2月,国产大模型DeepSeek横扫市场。刚刚完成基础大模型团队和大模型应用团队分拆的腾讯,开放的拥抱了这个开源模型,腾讯元宝等多款产品火速接入DeepSeek-R1模型,两周内微信、QQ浏览器、腾讯文档等十余款应用完成整合,实现混元与DeepSeek的“双模型自由切换”。
事实证明,腾讯开放策略不仅激活了各种业务应用的AI改造,也给自研大模型团队带来“鲶鱼效应”,混元也再次开启了高速引擎。
2025年年初,混元Turbo S大模型正式发布,这是业界首个大规模混合Mamba-MoE机构模型,在发布之初的效果与性能上已展现出优势。
在Turbo S模型设计上,体现了腾讯团队对大模型架构设计的独特性思考。比如巧妙地融合了Mamba架构处理长序列的高效性与Transformer架构卓越的上下文理解能力。这两种架构的结合取长补短,使得模型在拥有5600亿总参数的同时,保持了较高的运算效率。实现性能与效率的最大化。
同时,让大模型像人脑一样,对常见问题和复杂问题的回答有不同的思考方式。团队引入的自适应思维链机制,成为一大亮点。面对简单问题,Turbo S自动激活“无思考”模式,以最小计算成本提供足够质量的答案;而当遇到复杂问题时,则自动切换至“思考”模式,运用逐步分析、自我反思和回溯等深度推理方法,给出高准确度的回答。
受益于自适应CoT的推理效率,在评估推理成本效益时,混元Turbo S在所有评估模型中实现了极具成本效益的输出生成。这项工作为高效、大规模预训练模型树立了新范式,推动了易于获取且功能强大的人工智能系统的发展。
发力多模态
落地业务场景
如果说大语言模型代表了智能的深度,那么多模态模型则体现了智能的广度。今年以来,混元的迭代速度明显加快,不断丰富在多模态上的布局。
4月23日,腾讯宣布混元3D生成模型全新升级,总参数量从1B提升至10B,有效面片数增加超10倍,实现超高清的几何细节建模,有效几何分辨率达到1024,从标清升级到了超清画质。仅需输入图片或文字描述,即可快速生成,极大降低创作门槛。
5月16日,腾讯发布最新混元图像2.0模型,在行业内率先实现实时生图。得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型,在同类产品每张图推理速度需要5到10秒的情况下,混元可实现毫秒级响应,一边打字一边出图,改变了传统“抽卡—等待—抽卡”方式。
同时,图像生成质量提升明显,在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,超过其他同类模型。
在游戏领域,混元推出精通游戏美术与术语的混元游戏视觉生成模型,涵盖游戏技能特效生成、角色动态立绘、实时交互游戏世界模型、角色多视图等五大子模型。面向工业级游戏资产生成,让游戏美术设计效率提升数十倍。
基于Turbo S的基座模型,混元在图片和音频的多模态理解能力持续迭代。在5月21日腾讯AI峰会上,腾讯混元新发布的混元视觉深度推理模型T1-Vision,支持多图输入,具备原生长思维链,实现“边看图边思考”,整体效果相比此前级联方案提升5.3%,整体理解速度提升50%。同时发布了端到端语音通话模型混元Voice,实现低延迟语音通话,相比级联方案,响应速度提升超过30%,降至1.6秒。会上还展示了大模型实时视频通话功能,可以像“打视频”一样直接和AI交流。
这些技术并非实验室成果,而是深度融入业务场景。例如,混元图像生成能力已经助力腾讯广告平台做广告设计,混元3D模型则助力游戏设计等行业创新。目前,混元能力已深度融入腾讯各业务线,广泛应用于微信、QQ、腾讯元宝、腾讯会议、腾讯文档等核心产品,提升腾讯内部产品的智能化水平,并通过腾讯云向外输出模型能力,帮助企业和开发者创新提效。
激活组织,长期投入
构建AI新矩阵
在此前的腾讯股东大会上,马化腾表示,真正做好大模型需要更多积累和沉淀,不能操之过急。“对于工业革命来讲,早一个月把电灯泡拿出来,在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好。”
但腾讯的应对还是速度极快的。早在1月初,腾讯就已经进行过一次组织调整,拆分模型团队与应用团队,让大模型团队聚焦底层模型技术,应用团队创新应用体验。2月19日,腾讯继续宣布将QQ浏览器、搜狗输入法、ima等更多产品和应用汇入CSIG,共同构建腾讯面向大模型时代的AI新矩阵。
4月,腾讯对其混元大模型研发体系进行了全面重构,围绕算力、算法和数据三大核心板块,刷新团队部署,加码研发投入。调整后,混元研发体系拆分为“大语言模型部”与“多模态模型部”,前者专注提升文本生成、逻辑推理等核心能力,后者主攻图像、3D、视频等模态的技术突破。
资源重新整合之后,研发力量与节奏都有了大幅更新。
5月初,DeepSeek工程师还在GitHub上高亮了来自腾讯的代码贡献,原因在于,腾讯多年来调教数据中心和GPU通信沉淀下来的TRMT技术,帮助DeepSeek开源的网络通信神器DeepEP性能再上一个台阶。
混元的快速迭代,离不开腾讯“All in AI”的决心。2024年,腾讯资本开支同比暴涨386%至767.6亿元,2025年一季度,单季资本支出进一步攀升至274.8亿元,全年预计接近千亿规模。
腾讯在AI持续增长的资本开支也印证了腾讯对AI是长期投入而非短期豪赌,是一场以技术护城河构建为核心的“百年工程”。混元的技术进化也不仅是技术竞赛,也腾讯从“应用巨头”向“AI基础设施商”转型的核心载体。
在资本与场景的双重驱动下,混元大模型正加速突破技术边界。从Turbo S的理科能力跃升到T1的复杂任务处理进化,腾讯不仅将AI深度嵌入广告、游戏等现金牛业务,更通过开源生态与行业共创,将混元锻造成“基础设施级”的通用智能底座。
腾讯云副总裁、腾讯混元大模型技术负责人王迪表示,混元正加速向智能化的深度与广度迈进,为AI普惠与产业升级提供坚实支撑。混元坚定拥抱开源,持续推进多尺寸、多场景的全系模型开源。
目前,混元已实现图像、视频、3D、文本等在内的全模态开源,其中,混元3D模型Hugging Face下载量超过160万。未来,混元计划推出多尺寸混合推理模型,从0.5B到32B的dense模型,以及激活13B的MoE模型,适配企业与端侧不同需求。混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源。
这场从追赶到领跑的蜕变,或许正是中国AI大模型在全球舞台站稳脚跟的序章。