抢先DeepSeek R2,开源万亿参数Kimi K2:月之暗面生死突围
创始人
2025-07-22 10:43:12
0

文 | 青橙财经,作者 | 青风,编辑 | 六子

中国AI领域一场悲壮的科技突围战正式打响!7月11日深夜,AI初创公司月之暗面发布全球首个开源的万亿参数大模型Kimi K2。该模型在多项基准测试中达到开源模型的SOTA(当前最高水平),API调用成本与DeepSeek R1持平,仅为Claude 4的五分之一。

这款被寄予"生死突围"厚望的模型,在发布后48小时内引爆市场:Kimi官网访问量激增36亿,开源社区Hugging Face下载量突破10万次,GitHub相关项目数量飙升200%。在OpenRouter平台上,K2的token消耗量迅速超越马斯克的Grok 4,登顶全球API调用榜。

抢在DeepSeek R2之前推出万亿参数大模型,并同样采取开源策略,这不仅是月之暗面的一次技术发布,更是这家被逼至悬崖边缘的明星创业公司,押上全部命运的一场豪赌——要么一战封神,要么黯然退场。

坠落神坛

曾几何时,凭借独树一帜的长文本处理能力和AI搜索功能,Kimi风光无限。QuestMobile数据显示,截至2024年12月,Kimi月活跃用户(MAU)达2101万,稳居国产AI原生应用前三。

然而2025年市场风云突变。年初,DeepSeek凭借低成本、高性能的开源模型强势入场,几乎零市场推广下,用户访问量7天破亿,迅速重塑全球AI格局,给包括月之暗面在内的众多玩家带来巨大冲击。

*图源QuestMobile

在DeepSeek的刺激下,AI大厂们也随之加速布局:字节对豆包持续重金投入,稳守头部;阿里通义大模型频繁更新,打造全球最大开源模型,并将夸克推为C端旗舰;腾讯元宝借鸡生蛋,借势“接入DeepSeek”疯狂推广;百度急转开源免费,联动文库、网盘全力助阵。

巨头们挟资金优势、海量用户生态与强大工程化能力,在模型迭代、场景落地、生态构建上全面挤压创业公司的生存空间。月之暗面首当其冲。

用户数据最能体现冲击。QuestMobile数据显示,截至5月,DeepSeek移动端MAU为1.69亿,虽较3月的1.94亿有所下滑,但仍是用户量最大的AI原生应用,超过字节跳动的豆包、腾讯的元宝,更远超Kimi。Kimi的MAU已滑落至1408万,不足DeepSeek的十分之一。

用户流失的同时,月之暗面此前火热的融资节奏也戛然而止。过去两年,红杉中国、美团、阿里、腾讯等接连投资,将其估值推至33亿美元。但自2024年初获得当时国内大模型最大笔融资后,月之暗面2025年再无新融资消息。对极度烧钱的大模型研发而言,这无疑是危险的信号。

在此背景下,月之暗面创始人杨植麟做出两个关键决策:全面停止营销投放,集中资源攻坚基础模型;放弃K1系列迭代,All in下一代架构研发。

Kimi K2由此诞生——这是一次破釜沉舟的突围尝试。

发布当晚,联合创始人张宇韬在朋友圈写下,"Make Kimi Great Again"。这句话清晰传递出,月之暗面内部对Kimi K2寄予厚望,将其视为抵御DeepSeek冲击的关键,希望凭借新模型的强大性能和开源策略,重新吸引用户目光,夺回失去的市场份额,重回大模型竞争的核心舞台。

背水一战

从技术性能与市场反馈来看,Kimi K2确有突围的潜力。

*图源Kimi官网

在技术层面,Kimi K2的参数规模与架构设计颇具竞争力。其总参数达1万亿(1T),是当前大模型参数量的天花板,激活参数为320亿;采用MoE(混合专家模型)架构,代码能力与通用Agent(智能体)任务处理能力显著提升——能执行任务拆解、自主规划、工作流设计及工具调用等复杂多步骤任务。

性能测试更印证了其实力。在SWE Bench Verified、Tau2、AceBench等基准性能测试中,Kimi K2均取得开源模型中的SOTA成绩。在细分维度上,编程能力仅次于Claude 4 sonnet,智能体能力仅次于Claude 4和GPT-4.1,数学推理能力则在MATH、AIME、GPQA-Diamond等测评中得分最高。

价格上,Kimi K2 也延续了 "高性价比" 策略:每百万输入tokens收费4元,每百万输出tokens收费16元,与DeepSeek标准时段的API价格体系一致。

*图源月之暗面公众号

为突出Agent能力,月之暗面官方提供了一些内部测试环境中的实际演示,比如,K2可以帮助用户制定粉丝的追星计划,完成演唱会所在城市的机酒与旅游规划,并且生成日历,再用html概括完整行程规划并发送邮件。

这样的表现迅速引发海内外AI圈关注。OpenRouter平台上线仅两天,Token消耗量就超越xAI,登顶全球API调用增长榜;在Cline、Roo Code、Kilo Code等平台,API使用量在全球开源模型中排名最高。

独角兽Perplexity CEO在社交媒体表示,基于Kimi K2模型的出色表现,公司将会利用K2进行后训练,上一个被该公司用于技术训练的中国模型是DeepSeek R1。全球最大开源AI社区Hugging Face联合创始人表示,不断突破极限挑战闭源的K2模型令人难以置信。不少社区用户也给出了不错的评价,“性能不输Claude 4,但便宜80%”、“唯一超越R1的存在”。《自然》杂志网站更是将Kimi K2发布称为“世界迎来又一个DeepSeek时刻”。

月之暗面研发团队也全员在Hugging Face、知乎等平台发声助威,其背水一战的决心可见一斑。对他们而言,K2是一场生死攸关的救赎。如果Kimi K2能够在市场上获得良好的反响,将有助于月之暗面重新夺回市场份额,提升品牌形象,在AI大模型领域实现困境突围,重回行业第一梯队。

强敌环伺

尽管Kimi K2在技术上表现亮眼,月之暗面仍面临诸多强劲对手与严峻挑战。

Kimi K2主打“模型即Agent”,重点强化代码与Agent能力。但目前智能体赛道的竞争已趋白热化,后来者既缺乏应用场景,更缺乏生态积累。

就在7月18日,OpenAI就推出了“ChatGPT Agent”,能够智能调用浏览器工具(Operator)、深度信息整合(Deep Research)与语言生成能力(ChatGPT),完成包括在线购物、订餐预约、撰写研究报告、制作PPT和财务分析在内的多步骤复杂任务。

而除了国际厂商,国内的阿里夸克、百度文库、字节扣子空间等也均已布局Agent,且坐拥上亿用户和更强的场景认知。不久前的高考填报志愿就是一个非常典型的AI应用场景,在这个细分领域,夸克和百度等均已经深耕多年,相关资源、高校数据和用户心智也都已建立起较高的壁垒。

“Kimi的努力方向是对的,但还不够,Kimi需要将自己的AI嵌入到一个生态当中。如今,互联网平台各大生态是封闭的,比如电商的AI可以帮助商家设计网站,自媒体的AI能够帮助自媒体制作视频,那么,Kimi的目标用户是谁?这方面,需要Kimi自己明确。”知名经济学者、工信部信息通信经济专家委员会委员盘和林,在接受媒体采访时如此表示。

此外,DeepSeek R2仍然如同悬顶之剑。据称,R2将拥有超过1.2万亿参数,重点方向就是智能体和多模态能力的加强。媒体爆料,此前因英伟达H20芯片禁售,R2上线受阻;但7月15日英伟达创始人黄仁勋透露"美国已批准H20对华出口"。这意味着R2最大阻碍已消除,上线在即。对月之暗面而言,这款被期待为"国运级"应用的大版本更新,可能是又一次冲击。

月之暗面更现实的挑战是算力与资金。有用户称,刚测试不到10个问题,K2对话框便显示“当前模型对话次数已达到上限,可切换为其他模型继续对话”——这背后是大模型研发与运营的高成本,需要大量的AI芯片和巨大的计算资源消耗。在月之暗面迟迟没有新的投资入账的情况下,这一问题可能更为棘手。

而要想获得投资青睐,另一个更直击灵魂的深层问题也随之浮现:DeepSeek之后,市场是否还需要自研基础大模型?若已有全方位开源的领先模型,创业公司推进自研的融资合理性何在?

巨头们拥有深厚的“血槽”,DeepSeek占据了用户心智和开源生态,月之暗面能否凭K2重新获得资本青睐,仍是未知数。

写在最后

回望"大模型六小龙"的发展轨迹,令人唏嘘,也可做借鉴,或许能更清晰看到月之暗面的处境。

2023年全年,六小龙累计融资曾占到国产大模型厂商的逾50%。而如今,格局已然大变:

零一万物已退出基础大模型竞争;百川智能也放弃了基座模型训练,收缩战线聚焦医疗垂类,且创始团队持续动荡;跃阶星辰几近失声;仅智谱AI与MiniMax近期有融资消息,但前者聚焦政企市场,后者押注多模态和出海方向,都避开了与DeepSeek及大厂们的正面交锋。

月之暗面尝试用K2证明,硬实力是最好的市场通行证,AI竞赛还没有结束。然而,前有巨头与OpenAI的生态围堵,后有DeepSeek R2的虎视眈眈,加之算力掣肘与融资困局,其突围之路,注定比昔日更加崎岖难行。

相关内容

热门资讯

胜宏科技股价连续3天下跌累计跌... 7月22日,胜宏科技跌3.02%,截至发稿,报153.08元/股,成交81.81亿元,换手率6.20...
泰格医药跌1.33%,成交额6... 7月22日,泰格医药跌1.33%,成交额6.83亿元,换手率2.09%,总市值492.51亿元。异动...
伟明环保涨0.26%,成交额1... 7月22日,伟明环保涨0.26%,成交额1.29亿元,换手率0.40%,总市值327.62亿元。异动...
宁波建工涨1.42%,成交额4... 7月22日,宁波建工涨1.42%,成交额4.57亿元,换手率7.43%,总市值62.16亿元。异动分...
港股通科技30ETF(5209... 7月22日,汇添富恒生港股通中国科技ETF(520980)收盘跌0.46%,成交额2.81亿元。港股...