文|晓静
编辑|徐青阳
3 月 4 日,阶跃星辰宣布在此前开源 Step 3.5 Flash 模型的基础上,进一步开放该模型的预训练权重(Base)、中训练权重(Midtrain),并同步发布配套的 Steptron 训练框架。此次更新使 Step 3.5 Flash 的开源内容从“模型本体”扩展到训练权重与训练工具链,覆盖从训练到复现所需的关键组件。
近期大模型开源策略分化明显:一部分机构倾向于只开放推理权重或仅发布可用版本,另一部分则进一步开放训练权重与训练框架。
阶跃星辰此次同时放出 Base/Midtrain 权重与训练框架,意味着外部开发者在“复现训练流程、做持续训练或定制化训练”方面拥有更完整的材料与工具,但对算力、数据与工程能力的要求也更高。
Step 3.5 Flash 采用稀疏 MoE 架构,总参数 1960 亿,推理时仅激活约 110 亿参数;在单请求代码任务场景下,推理速度最高可达 350 TPS。
阶跃星辰将其定位为面向智能体(Agent)场景的基座模型,并表示该模型针对复杂推理与长链任务进行了优化。
截至目前,这款模型在 Hugging Face 上下载量已超 30 万次,并登上 OpenRouter Trending 第一名,获得了较高的社区认可度。而在知名开源项目 OpenClaw(被中国网友称为“小龙虾”)上,该模型排名已升至前二。