阶跃星辰全面开源Step 3.5 Flash
创始人
2026-03-10 14:57:57

“沪生沪长”的大模型创业公司阶跃星辰继开源Step 3.5 Flash模型后,日前又开源了这款Agent基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。这一举动在当前大模型开源趋于保守的环境下,显得颇为彻底,在开源社区引发热烈反响。

Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿参数(总计1960亿),在单请求代码类任务上最高推理速度可达每秒350个token。在Agent场景和数学任务上,Step 3.5 Flash的能力逼近闭源模型,能够胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模型。

包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已完成对Step 3.5 Flash的适配,通过底层联合创新提升模型适配性和算力效率。

在开发者社区和实际应用中,Step 3.5 Flash已经迅速获得了市场验证。截至目前,这款模型在Hugging Face上下载量已超30万次。就在3月2日,Step 3.5 Flash单日调用量已超过40B,在OpenClaw(被中国网友称为“小龙虾”)的调用量榜中排名第二。

值得一提的是,向来低调的阶跃星辰研发团队,罕见地现身相关社区回答全球开发者有关Step 3.5 Flash的提问。

有开发者提问:在规划Step 3.5 Flash时,你们是否心中已经瞄准了这个特定的“最佳平衡点”:89 tokens/参数,并且正好卡在消费级硬件规模的上限(128GB用于Q4量化,11B激活参数以保证实用的运行速度)?

阶跃星辰CTO朱亦博回复称,团队的确有明确目标,即让相关模型能够运行在128GB内存系统中。他发现,目前市场上约230B规模的模型,刚好超出了其个人MacBook Pro设备4位量化的承受范围,因此他便要求团队对模型规模进行了适当缩减。从开发者的角度去研发产品,而不是让开发者来适应产品。有开发者说,这正是他觉得兴奋的地方。

在与阶跃星辰研发团队的沟通中,有开发者希望阶跃星辰可以将基础模型与指令/思考模型一起发布,这样社区就可以对它进行微调了。

阶跃星辰对开发者有求必应——4日,其将Step 3.5 Flash的预训练权重、中训练权重以及配套的Steptron训练框架一同开源,希望通过更彻底的开源,让开发者能够以Step 3.5 Flash为基座进行更深度模型定制,打造真正属于自己的Agent。

记者注意到,短时间内,海外社区对阶跃星辰进一步开源的反馈十分热烈。

业内专家分析,随着OpenClaw等Agent平台热度持续升温,Step 3.5 Flash的开源或将进一步加速中国模型在全球Agent生态中的渗透。

本报记者 郜阳

相关内容

热门资讯

情暖通关路 福州边检站执勤三队... 福州新闻网3月10日讯(记者 宋亦敏 通讯员 何静雯 范海超)黄岐客运码头,船刚靠岸,福州出入境边防...
事情有变?假如柯文哲不用坐牢,... 最近,台湾政坛的风云变幻,最吸引眼球的莫过于柯文哲的动向。随着3月26日一审判决的临近,柯文哲是否能...
中国巨石涨3.31%,成交额1... 3月10日,中国巨石涨3.31%,成交额17.89亿元,换手率1.66%,总市值1075.24亿元。...
原创 特... 据央媒报道,3月8日,特朗普在接受以色列媒体采访时表示,他将在适当时机结束军事行动,这番话如同投石入...
妙可蓝多涨0.77%,成交额5... 3月10日,妙可蓝多涨0.77%,成交额5967.14万元,换手率0.56%,总市值107.11亿元...