国内大模型赛道再迎重磅玩家。记者刚刚从国内AI独角兽公司稀宇极智(MiniMax)获悉,该公司发布并开源的新一代文本大模型MiniMax-M2在全球权威测评榜单Artificial Analysis (AA)中总分位列全球前五、开源第一,跻身全球第一梯队,与OpenAI、Anthropic、Google等硅谷巨头同台竞技。值得一提的是,这个成绩是在M2价格仅为Claude Sonnet 4.5的8%的基础上实现的,并且相较后者推理速度快了接近一倍。这意味着,中国AI企业正以“高智能+低成本”的新组合,向全球AI格局发起正面冲击。
中国首个开源跻身全球前五的大模型
根据Artificial Analysis最新榜单,MiniMax M2在编码、指令遵循和智能体(Agent)等核心任务上全面进入全球前列。顶级代码能力:专为端到端开发工作流打造,在Claude Code、Cursor、Cline、Kilo Code、Droid 等多种应用中表现卓越;强大Agentic表现:出色规划并稳定执行复杂长链条工具调用任务,协同调用Shell、Browser、Python代码执行器和各种MCP工具;极致性价比&速度:通过高效的激活参数设计,实现智能、速度与成本的最佳平衡。
顶级性能的“平价”模型掀起算力成本革命
OpenRouter 作为全球最具影响力的 AI 模型聚合与调用平台之一,其数据源于真实开发者的使用行为,极具代表性和权威性。M2在其平台上线不到两天,模型调用量已跻身全球前10。
M2仅有10B激活参数(总参230B)的轻量级模型,在保持卓越性能的同时,实现了更低的延迟与成本,以及更高的吞吐效率,完美契合了新兴多智能体工作流对高效协同与快速响应的需求。M2综合成本API价格定在每百万Token输入0.3美金/2.1元人民币,以及输出1.2美金/8.4元,同时在线上提供TPS(每秒输出Token数)在100左右的推理服务(还在快速提升)。 这个价格是Claude Sonnet 4.5 的8%,而推理速度快了接近一倍,在大规模调用中保持高效响应。
极致的智能水平、响应延迟与成本效率体验,让海外的AI开发者给予中国开源模型一致好评。知名平台LMarena第一时间发X,向开发者推荐M2模型测试; Reddit社区技术大V在基准测试中运行了MiniMax M2,“它获得了58.3%的分数,这算是相当不错的表现”;CoreViewHQ 联合创始人兼CTO Ivan Fioravant 表示,“MiniMax-M2 的表现相当出色!甚至比 Claude 4.1 Opus 还要好,即使在实际使用中也令人印象深刻”;更有海外个人开发者接入API进行了广泛测试,并在技术社区分享真实案例。
为“AI+”千行百业提供核心引擎
从M2深度优化的方向(编码和Agent)不难看出,这次文本模型更新清晰地指向了B端市场和开发者生态。
对于国内市场而言,这一定位同样具有重大的行业意义。当前,中国正在大力推动数字经济发展,AI与实体经济的深度融合是关键路径。“AI+”赋能千行百业的背后,迫切需要一个强大的基础大模型作为核心引擎。M2的出现,正是为这一进程提供了强大的技术底座。凭借其在代码生成、工具调用和深度搜索方面的卓越能力,M2有望在国内金融、工业、医疗、教育、文化等众多行业的智能化转型中扮演关键角色 。
例如,在金融行业,其强大的深度搜索(Deep Search)能力可用于更精准的研报分析和信息挖掘;在工业领域,其代理(Agentic)能力能够出色地规划执行复杂工具链,用于优化工厂生产流程和自动化运维;在软件开发领域,其专业的代码编程能力则快速化身为“超级程序员” 。
为了加速这一规模化普及进程,MiniMax同步带来两份大礼包:一是发布后两周内开放全球API接口免费调用;二是上线国内版MiniMax Agent,它拥有"高效与"专业"双模式——前者适配轻量级对话、基础编码等场景,后者则针对全栈开发、专业PPT制作等复杂需求优化,实现不同场景下的高效化,同样,MiniMax Agent在网页端与app限时免费,将普惠进行到底。