6月17日,总部位于上海的AI独角兽企业MiniMax(稀宇科技)发布全球首个开源大规模混合架构的推理模型MiniMax-M1,并官宣了为期五天的连更计划。
MiniMax-M1采用混合架构设计,在软件工程、长文本理解等生产力场景中展现出较强性能。根据公开测试数据,其综合表现优于国内闭源模型,接近国际领先水平。
开源技术报告截图
据了解,MiniMax-M1支持全球最长的上下文窗口,包括100万tokens输入、8万tokens推理输出。其采用的闪电注意力混合架构,使得长文本处理效率提升,8万tokens深度推理的算力消耗为DeepSeek R1的30%。
MiniMax-M1还实现了开源模型中最强的智能体工具使用能力,其强化学习效率也惊人。通过自研强化学习算法CISPO(基于重要性采样权重裁剪),MiniMax-M1训练效率较传统方法提升约一倍,仅仅需要53.47万美元即可完成训练。
目前,MiniMax-M1已经集成到MiniMax Chat中。依托高效算力优势,MiniMax-M1实现高性价比服务:MiniMax App与Web端保持不限量免费使用,官网API定价分档与DeepSeek-R1比都有更高性价比。
模型发布快速引起海外业内人士关注
据了解,完整的M1模型权重、技术报告均已在Hugging Face和GitHub上开放获取。同时,MiniMax正与国家超算平台、vLLM等业界主流开源框架合作,以确保开发者能够轻松、高效地部署和使用M1模型。
分析人士认为,MiniMax此举将对国内乃至全球的AI大模型市场产生深远影响。它不仅为开发者和企业提供了一个高性能、低门槛的新选择,也用事实证明了通过技术创新可以有效打破“算力—资本”的壁垒。这种“卷成本、卷效率”的竞争模式,将倒逼更多模型厂商走向真正的技术驱动和价值创造,而非停留在参数和估值的虚假繁荣中。
而且,M1的发布仅仅是MiniMax“开源周”的序幕。MiniMax相关负责人表示,在接下来的四个工作日里,MiniMax计划每天发布一项新的技术或产品更新,持续为AI社区带来惊喜。
MiniMax是徐汇区人工智能龙头企业。截至目前,徐汇区已经汇聚稀宇科技、商汤科技、阶跃星辰、无问芯穹、星纪魅族、特赞科技和斑马智行七家人工智能龙头企业,形成“北斗七星”矩阵,这也标志着徐汇区已形成“技术研发—场景落地—产业协同”的闭环生态。