中国“平价”开源大模型首次跻身全球前五！MiniMax-M2挑战硅谷霸主_知识

中国“平价”开源大模型首次跻身全球前五！MiniMax-M2挑战硅谷霸主

创始人

2025-10-27 19:16:35

国内大模型赛道再迎重磅玩家。记者刚刚从国内AI独角兽公司稀宇极智（MiniMax）获悉，该公司发布并开源的新一代文本大模型MiniMax-M2在全球权威测评榜单Artificial Analysis （AA）中总分位列全球前五、开源第一，跻身全球第一梯队，与OpenAI、Anthropic、Google等硅谷巨头同台竞技。值得一提的是，这个成绩是在M2价格仅为Claude Sonnet 4.5的8%的基础上实现的，并且相较后者推理速度快了接近一倍。这意味着，中国AI企业正以“高智能+低成本”的新组合，向全球AI格局发起正面冲击。

中国首个开源跻身全球前五的大模型

根据Artificial Analysis最新榜单，MiniMax M2在编码、指令遵循和智能体（Agent）等核心任务上全面进入全球前列。顶级代码能力：专为端到端开发工作流打造，在Claude Code、Cursor、Cline、Kilo Code、Droid 等多种应用中表现卓越；强大Agentic表现：出色规划并稳定执行复杂长链条工具调用任务，协同调用Shell、Browser、Python代码执行器和各种MCP工具；极致性价比&速度：通过高效的激活参数设计，实现智能、速度与成本的最佳平衡。

顶级性能的“平价”模型掀起算力成本革命

OpenRouter 作为全球最具影响力的 AI 模型聚合与调用平台之一，其数据源于真实开发者的使用行为，极具代表性和权威性。M2在其平台上线不到两天，模型调用量已跻身全球前10。

M2仅有10B激活参数（总参230B）的轻量级模型，在保持卓越性能的同时，实现了更低的延迟与成本，以及更高的吞吐效率，完美契合了新兴多智能体工作流对高效协同与快速响应的需求。M2综合成本API价格定在每百万Token输入0.3美金/2.1元人民币，以及输出1.2美金/8.4元，同时在线上提供TPS（每秒输出Token数）在100左右的推理服务（还在快速提升）。这个价格是Claude Sonnet 4.5 的8%，而推理速度快了接近一倍，在大规模调用中保持高效响应。

极致的智能水平、响应延迟与成本效率体验，让海外的AI开发者给予中国开源模型一致好评。知名平台LMarena第一时间发X，向开发者推荐M2模型测试； Reddit社区技术大V在基准测试中运行了MiniMax M2，“它获得了58.3%的分数，这算是相当不错的表现”；CoreViewHQ 联合创始人兼CTO Ivan Fioravant 表示，“MiniMax-M2 的表现相当出色！甚至比 Claude 4.1 Opus 还要好，即使在实际使用中也令人印象深刻”；更有海外个人开发者接入API进行了广泛测试，并在技术社区分享真实案例。

为“AI+”千行百业提供核心引擎

从M2深度优化的方向（编码和Agent）不难看出，这次文本模型更新清晰地指向了B端市场和开发者生态。

对于国内市场而言，这一定位同样具有重大的行业意义。当前，中国正在大力推动数字经济发展，AI与实体经济的深度融合是关键路径。“AI+”赋能千行百业的背后，迫切需要一个强大的基础大模型作为核心引擎。M2的出现，正是为这一进程提供了强大的技术底座。凭借其在代码生成、工具调用和深度搜索方面的卓越能力，M2有望在国内金融、工业、医疗、教育、文化等众多行业的智能化转型中扮演关键角色。

例如，在金融行业，其强大的深度搜索（Deep Search）能力可用于更精准的研报分析和信息挖掘；在工业领域，其代理（Agentic）能力能够出色地规划执行复杂工具链，用于优化工厂生产流程和自动化运维；在软件开发领域，其专业的代码编程能力则快速化身为“超级程序员” 。

为了加速这一规模化普及进程，MiniMax同步带来两份大礼包：一是发布后两周内开放全球API接口免费调用；二是上线国内版MiniMax Agent，它拥有"高效与"专业"双模式——前者适配轻量级对话、基础编码等场景，后者则针对全栈开发、专业PPT制作等复杂需求优化，实现不同场景下的高效化，同样，MiniMax Agent在网页端与app限时免费，将普惠进行到底。

上一篇：用户突破2000万！揭秘有道AI同传做对了什么？

下一篇：美军“磨刀霍霍”向委内瑞拉，若真动武委军招架得住吗？

中国“平价”开源大模型首次跻身全球前五！MiniMax-M2挑战硅谷霸主

相关内容

热门资讯