官方预告MiniMax M3系列AI模型即将登场
创始人
2026-05-27 21:47:04

IT之家 5 月 27 日消息,上海稀宇科技有限公司(MiniMax)今天在 X 平台发布推文,预告将推出 MiniMax M3 系列模型。

该推文转发了一篇 5 月 26 日发表在 arxiv 上的论文《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》,回顾了 MiniMax M2.x系列模型的背后工作。IT之家附上相关截图如下:

该论文指出 MiniMax M2.x系列模型总参数 229.9B,但每个词元仅激活 9.8B 参数,主打“低激活、高智能”,配备 192K 上下文窗口,预训练数据规模达 29.2T 词元。

在模型设计上,M2 系列采用 62 层解码器式 Transformer(变换器),使用 256 个细粒度专家,并为每个词元激活 8 个专家。

在训练系统层面,MiniMax 提出 Forge,这是一个面向智能体的强化学习系统,支持白盒与黑盒智能体统一接入。系统通过训练、推理与智能体解耦,配合窗口化 FIFO 调度、前缀树合并和推理加速,降低长轨迹训练成本。

M2.7 最受关注的升级,是论文提出的“自我进化”雏形。模型已能自主排查训练失败、阅读日志、修改脚手架代码,并在内部任务上完成 100 轮自主迭代。

论文称,这套系统已吸收团队 30% 到 50% 的日常迭代工作量,且在内部编程脚手架优化中带来 30% 性能提升,显示模型开始参与自身开发闭环。

参考

相关内容

热门资讯

膝盖疼吃什么牌子氨糖好 202... Meta描述:本文基于WHO26骨健康报告与真实测评数据,深度解析关节营养品选购逻辑。综合极净配方、...
呼和浩特市青少年(中小学生)棒... 转自:草原云6月6日,2026年呼和浩特市青少年(中小学生)棒垒球锦标赛在北方足球训练基地火热开赛。...
荣膺虹口北外滩国际金融学会副会... 6月4日下午,首席经济学家论坛下设机构上海虹口北外滩国际金融学会2026年度会员大会在北外滩来福士广...
实探上海老博会:“无感”适老,... (原标题:实探上海老博会:当银行长出“会客厅”,养老金融从“卖产品”到“卖安心”)在展会现场,老年人...
原创 妙... 《红楼梦》里,贾母领着众人到栊翠庵喝茶,妙玉将众人安置后,悄悄叫走了宝钗和黛玉,去喝体己茶,黛玉喝了...