抢先DeepSeek R2，开源万亿参数Kimi K2：月之暗面生死突围_知识

抢先DeepSeek R2，开源万亿参数Kimi K2：月之暗面生死突围

创始人

2025-07-22 10:43:12

0次

文 | 青橙财经，作者 | 青风，编辑 | 六子

中国AI领域一场悲壮的科技突围战正式打响！7月11日深夜，AI初创公司月之暗面发布全球首个开源的万亿参数大模型Kimi K2。该模型在多项基准测试中达到开源模型的SOTA（当前最高水平），API调用成本与DeepSeek R1持平，仅为Claude 4的五分之一。

这款被寄予"生死突围"厚望的模型，在发布后48小时内引爆市场：Kimi官网访问量激增36亿，开源社区Hugging Face下载量突破10万次，GitHub相关项目数量飙升200%。在OpenRouter平台上，K2的token消耗量迅速超越马斯克的Grok 4，登顶全球API调用榜。

抢在DeepSeek R2之前推出万亿参数大模型，并同样采取开源策略，这不仅是月之暗面的一次技术发布，更是这家被逼至悬崖边缘的明星创业公司，押上全部命运的一场豪赌——要么一战封神，要么黯然退场。

坠落神坛

曾几何时，凭借独树一帜的长文本处理能力和AI搜索功能，Kimi风光无限。QuestMobile数据显示，截至2024年12月，Kimi月活跃用户（MAU）达2101万，稳居国产AI原生应用前三。

然而2025年市场风云突变。年初，DeepSeek凭借低成本、高性能的开源模型强势入场，几乎零市场推广下，用户访问量7天破亿，迅速重塑全球AI格局，给包括月之暗面在内的众多玩家带来巨大冲击。

*图源QuestMobile

在DeepSeek的刺激下，AI大厂们也随之加速布局：字节对豆包持续重金投入，稳守头部；阿里通义大模型频繁更新，打造全球最大开源模型，并将夸克推为C端旗舰；腾讯元宝借鸡生蛋，借势“接入DeepSeek”疯狂推广；百度急转开源免费，联动文库、网盘全力助阵。

巨头们挟资金优势、海量用户生态与强大工程化能力，在模型迭代、场景落地、生态构建上全面挤压创业公司的生存空间。月之暗面首当其冲。

用户数据最能体现冲击。QuestMobile数据显示，截至5月，DeepSeek移动端MAU为1.69亿，虽较3月的1.94亿有所下滑，但仍是用户量最大的AI原生应用，超过字节跳动的豆包、腾讯的元宝，更远超Kimi。Kimi的MAU已滑落至1408万，不足DeepSeek的十分之一。

用户流失的同时，月之暗面此前火热的融资节奏也戛然而止。过去两年，红杉中国、美团、阿里、腾讯等接连投资，将其估值推至33亿美元。但自2024年初获得当时国内大模型最大笔融资后，月之暗面2025年再无新融资消息。对极度烧钱的大模型研发而言，这无疑是危险的信号。

在此背景下，月之暗面创始人杨植麟做出两个关键决策：全面停止营销投放，集中资源攻坚基础模型；放弃K1系列迭代，All in下一代架构研发。

Kimi K2由此诞生——这是一次破釜沉舟的突围尝试。

发布当晚，联合创始人张宇韬在朋友圈写下，"Make Kimi Great Again"。这句话清晰传递出，月之暗面内部对Kimi K2寄予厚望，将其视为抵御DeepSeek冲击的关键，希望凭借新模型的强大性能和开源策略，重新吸引用户目光，夺回失去的市场份额，重回大模型竞争的核心舞台。

背水一战

从技术性能与市场反馈来看，Kimi K2确有突围的潜力。

*图源Kimi官网

在技术层面，Kimi K2的参数规模与架构设计颇具竞争力。其总参数达1万亿（1T），是当前大模型参数量的天花板，激活参数为320亿；采用MoE（混合专家模型）架构，代码能力与通用Agent（智能体）任务处理能力显著提升——能执行任务拆解、自主规划、工作流设计及工具调用等复杂多步骤任务。

性能测试更印证了其实力。在SWE Bench Verified、Tau2、AceBench等基准性能测试中，Kimi K2均取得开源模型中的SOTA成绩。在细分维度上，编程能力仅次于Claude 4 sonnet，智能体能力仅次于Claude 4和GPT-4.1，数学推理能力则在MATH、AIME、GPQA-Diamond等测评中得分最高。

价格上，Kimi K2 也延续了 "高性价比" 策略：每百万输入tokens收费4元，每百万输出tokens收费16元，与DeepSeek标准时段的API价格体系一致。

*图源月之暗面公众号

为突出Agent能力，月之暗面官方提供了一些内部测试环境中的实际演示，比如，K2可以帮助用户制定粉丝的追星计划，完成演唱会所在城市的机酒与旅游规划，并且生成日历，再用html概括完整行程规划并发送邮件。

这样的表现迅速引发海内外AI圈关注。OpenRouter平台上线仅两天，Token消耗量就超越xAI，登顶全球API调用增长榜；在Cline、Roo Code、Kilo Code等平台，API使用量在全球开源模型中排名最高。

独角兽Perplexity CEO在社交媒体表示，基于Kimi K2模型的出色表现，公司将会利用K2进行后训练，上一个被该公司用于技术训练的中国模型是DeepSeek R1。全球最大开源AI社区Hugging Face联合创始人表示，不断突破极限挑战闭源的K2模型令人难以置信。不少社区用户也给出了不错的评价，“性能不输Claude 4，但便宜80%”、“唯一超越R1的存在”。《自然》杂志网站更是将Kimi K2发布称为“世界迎来又一个DeepSeek时刻”。

月之暗面研发团队也全员在Hugging Face、知乎等平台发声助威，其背水一战的决心可见一斑。对他们而言，K2是一场生死攸关的救赎。如果Kimi K2能够在市场上获得良好的反响，将有助于月之暗面重新夺回市场份额，提升品牌形象，在AI大模型领域实现困境突围，重回行业第一梯队。

强敌环伺

尽管Kimi K2在技术上表现亮眼，月之暗面仍面临诸多强劲对手与严峻挑战。

Kimi K2主打“模型即Agent”，重点强化代码与Agent能力。但目前智能体赛道的竞争已趋白热化，后来者既缺乏应用场景，更缺乏生态积累。

就在7月18日，OpenAI就推出了“ChatGPT Agent”，能够智能调用浏览器工具（Operator）、深度信息整合（Deep Research）与语言生成能力（ChatGPT），完成包括在线购物、订餐预约、撰写研究报告、制作PPT和财务分析在内的多步骤复杂任务。

而除了国际厂商，国内的阿里夸克、百度文库、字节扣子空间等也均已布局Agent，且坐拥上亿用户和更强的场景认知。不久前的高考填报志愿就是一个非常典型的AI应用场景，在这个细分领域，夸克和百度等均已经深耕多年，相关资源、高校数据和用户心智也都已建立起较高的壁垒。

“Kimi的努力方向是对的，但还不够，Kimi需要将自己的AI嵌入到一个生态当中。如今，互联网平台各大生态是封闭的，比如电商的AI可以帮助商家设计网站，自媒体的AI能够帮助自媒体制作视频，那么，Kimi的目标用户是谁？这方面，需要Kimi自己明确。”知名经济学者、工信部信息通信经济专家委员会委员盘和林，在接受媒体采访时如此表示。

此外，DeepSeek R2仍然如同悬顶之剑。据称，R2将拥有超过1.2万亿参数，重点方向就是智能体和多模态能力的加强。媒体爆料，此前因英伟达H20芯片禁售，R2上线受阻；但7月15日英伟达创始人黄仁勋透露"美国已批准H20对华出口"。这意味着R2最大阻碍已消除，上线在即。对月之暗面而言，这款被期待为"国运级"应用的大版本更新，可能是又一次冲击。

月之暗面更现实的挑战是算力与资金。有用户称，刚测试不到10个问题，K2对话框便显示“当前模型对话次数已达到上限，可切换为其他模型继续对话”——这背后是大模型研发与运营的高成本，需要大量的AI芯片和巨大的计算资源消耗。在月之暗面迟迟没有新的投资入账的情况下，这一问题可能更为棘手。

而要想获得投资青睐，另一个更直击灵魂的深层问题也随之浮现：DeepSeek之后，市场是否还需要自研基础大模型？若已有全方位开源的领先模型，创业公司推进自研的融资合理性何在？

巨头们拥有深厚的“血槽”，DeepSeek占据了用户心智和开源生态，月之暗面能否凭K2重新获得资本青睐，仍是未知数。

写在最后

回望"大模型六小龙"的发展轨迹，令人唏嘘，也可做借鉴，或许能更清晰看到月之暗面的处境。

2023年全年，六小龙累计融资曾占到国产大模型厂商的逾50%。而如今，格局已然大变：

零一万物已退出基础大模型竞争；百川智能也放弃了基座模型训练，收缩战线聚焦医疗垂类，且创始团队持续动荡；跃阶星辰几近失声；仅智谱AI与MiniMax近期有融资消息，但前者聚焦政企市场，后者押注多模态和出海方向，都避开了与DeepSeek及大厂们的正面交锋。

月之暗面尝试用K2证明，硬实力是最好的市场通行证，AI竞赛还没有结束。然而，前有巨头与OpenAI的生态围堵，后有DeepSeek R2的虎视眈眈，加之算力掣肘与融资困局，其突围之路，注定比昔日更加崎岖难行。

用户能力 DeepSeek 参数 Hugging 模型 Kimi Claude token 高性能 Agent 暗面

上一篇：姜文与贾樟柯，为什么不一样？

下一篇：最后一战，总算立案

抢先DeepSeek R2，开源万亿参数Kimi K2：月之暗面生死突围

相关内容

热门资讯