6月17日,MiniMax开源混合架构推理模型M1。M1模型采用MoE与lightning attention相结合架构,模型大小为456B ,单token激活参数为45.9 B,M1原生支持100万token的上下文长度,包含40K和80K思维预算两个推理模型。(钛媒体AGI)
上一篇:一胎99子短剧平台方实控940余家企业
下一篇:《庆余年》第三季23:贺宗纬去江南牵制范闲,庆帝的废储计划开始