首页
学习
活动
专区
圈层
工具
发布

阶跃星辰全面开源 Step 3.5 Flash:面向智能体场景,预训练+训练框架全放出

文|晓静

编辑|徐青阳

3 月 4 日,阶跃星辰宣布在此前开源 Step 3.5 Flash 模型的基础上,进一步开放该模型的预训练权重(Base)、中训练权重(Midtrain),并同步发布配套的 Steptron 训练框架。此次更新使 Step 3.5 Flash 的开源内容从“模型本体”扩展到训练权重与训练工具链,覆盖从训练到复现所需的关键组件。

近期大模型开源策略分化明显:一部分机构倾向于只开放推理权重或仅发布可用版本,另一部分则进一步开放训练权重与训练框架。

阶跃星辰此次同时放出 Base/Midtrain 权重与训练框架,意味着外部开发者在“复现训练流程、做持续训练或定制化训练”方面拥有更完整的材料与工具,但对算力、数据与工程能力的要求也更高。

Step 3.5 Flash 采用稀疏 MoE 架构,总参数 1960 亿,推理时仅激活约 110 亿参数;在单请求代码任务场景下,推理速度最高可达 350 TPS。

阶跃星辰将其定位为面向智能体(Agent)场景的基座模型,并表示该模型针对复杂推理与长链任务进行了优化。

截至目前,这款模型在 Hugging Face 上下载量已超 30 万次,并登上 OpenRouter Trending 第一名,获得了较高的社区认可度。而在知名开源项目 OpenClaw(被中国网友称为“小龙虾”)上,该模型排名已升至前二。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O7R98iqA_VWscbpoykWgI1FQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券