图片来源:视觉中国炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
蓝鲸新闻6月21日讯(记者 朱俊熹)与大模型"六小龙"中趋于沉寂的其他几家同行相比,MiniMax用连续5天的上新,带来了久违的热闹场面。自6月17日起,MiniMax一周内相继发布了新的推理模型、视频生成模型、Agent、语音设计等产品。
其中,MiniMax-M1是MiniMax推出的首个推理模型,官方介绍称是基于年初的MiniMax-Text-01模型开发得到的。一位AI算法工程师对蓝鲸科技记者表示,半年时间内从基础模型通过强化学习训练出推理模型,属于正常的节奏。"不论是训练还是强化学习的方式,给业界的感觉就是MiniMax沿着DeepSeek R1的路又走了一遍。"
有媒体转述M1模型发布后,MiniMax创始人、CEO闫俊杰在社交媒体上表示,"第一次感觉到大山不是不能翻越。"
MiniMax-M1模型延续了此前MiniMax-01系列基模的架构创新,即在MoE架构的基础上引入了闪电注意力机制(Lightning Attention)。和传统的注意力机制相比,闪电注意力机制就像在阅读长文时能让模型快速锁定重点,并不时浏览章节标题以把握整体脉络,从而减少计算和内存消耗,更适用于长上下文的处理。
上述技术从业者表示,尽管MiniMax在一月份释出了这一独创的混合架构,但目前各家大模型厂商依然按照各自的方式进行模型的迭代。"基础模型的训练还是以稳定为主,如果更改架构的话,重新训练一旦效果不佳,可能会影响行业生态位。"
图片来源:MiniMax得益于模型的混合架构,M1在长文本方面具备显著优势。该模型支持目前业内最高的100万上下文的输入,与闭源模型中谷歌Gemini 2.5 Pro持平,是DeepSeek R1的8倍,同时支持最长8万token的推理输出。MiniMax还提出了新的强化学习算法CISPO,通过裁剪重要性采样权重,使强化学习训练中的"重要性评分"更合理,能够帮助模型更快、更稳地进步。
最终M1的强化训练过程实现了"超出预期"的高效。据MiniMax介绍,整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美元,较最初预期少了一个数量级。
和同样强调长上下文能力的字节豆包大模型1.6相似,MiniMax-M1也采用了分区间定价的方式。0-32k的输入长度内,输入0.8元/百万token,输出8元/百万token;32k-128k输入长度,输入1.2元/百万token,输出16元/百万token;最长的128k-1M输入长度,输入2.4元/百万token,输出24元/百万token。
MiniMax、字节等厂商此前也都强调过,长上下文的发展有助于促进智能体时代的到来。前述技术从业者解释称,Agent(智能体)的使用场景可以很复杂,例如Deep Research功能涉及大量超长文章的检索,长上下文能力自然越强越好。随着模型能力增强、MCP等外部基础设施逐步成熟,现在是Agent发展长上下文能力的好时机。
此次MiniMax推出的Agent包括通用智能体和一款视频创作Agent。通用的MiniMax Agent能够完成长程复杂任务,官方称在研发过程中是按照"靠谱的人"这一标准来设计和要求的,具体包括编程、多模态及MCP扩展。其中,多模态标准指的是支持长文本、视频、音频、图片等的全面理解,还应内置生图、生音频、生视频等能力。
Hailuo Video Agent这款视频创作智能体瞄准的是零门槛的Vibe Videoing。目前开放的第一阶段提供Agent视频模版,用户根据提示输入文字或图片,就可以一键生成创意短片。按照MiniMax的构想,第二阶段的半自定义视频Agent将支持用户在视频生成的任一环节进行自由编辑,第三阶段则实现完全形态的端到端视频Agent。
多模态向来是MiniMax的一大竞争优势。此次"上新周"发布的视频模型Hailuo 02在Artificial Analysis Video Arena评测榜上排名第二,仅次于字节的Seedance 1.0,但领先谷歌的Veo 3 Preview。收官日发布的语音设计工具则支持定制生成多语言、任意声音与情绪的语音,由5月发布的语音模型MiniMax Speech 02提供支持。
随着新模型与产品的亮相,MiniMax也公布了相应的付费方案。通用Agent采用积分制,优惠期内基础会员每月19美元,获得的5000积分大约可完成15个任务,Pro会员每月69美元,获得的20000积分对应的大约是60个任务。视频Agent则在MiniMax的视频平台海螺AI上提供,同样设有不同等级的付费方案。这些都为MiniMax带来了新的产品营收路径,通过多点变现进一步完善其商业化版图。
图片来源:海螺AI从当前来看,大模型"六小龙"已走向各异。零一万物不再继续训练超大模型,百川智能放弃金融聚焦医疗,阶跃星辰开始收敛产品转向Agent方向,月之暗面相比基模推出的更多是编程、视觉语言等垂直模型。如果要踏上IPO之路,智谱、MiniMax等"小龙"们仍然面临着一份复杂的商业化答卷有待完成。