2月2日,阶跃星辰宣布推出并开源最新基座模型 Step 3.5 Flash,定位为“为 Agent 而生”的大模型,强调在推理能力、复杂任务稳定性与成本效率之间取得平衡。官方称,该模型在 Agent 场景与数学任务上可媲美部分闭源模型,并支持长链条任务执行。
在性能层面,阶跃星辰表示 Step 3.5 Flash 在单请求代码类任务中推理速度最高可达350 TPS。模型还引入 Parallel Thinking 机制以增强推理表现,并在对比图中展示了与多款开源/闭源模型的性能差异。
![]()
![]()
阴影柱状图为 Step 3.5 Flash 开启 Parallel Thinking 后的增强性能。左侧开源模型按总参数量排序,右侧为闭源模型。XBench-DeepSearch 数据源自官方发布。
技术架构上,Step 3.5 Flash 采用 稀疏 MoE 方案,总参数规模1960亿,但每个 token 仅激活约110亿参数;同时引入 MTP-3(一次预测3个 token)提升生成效率。长上下文方面,模型使用3:1滑动窗口与全局注意力混合架构(SWA + Full Attention),官方称可高效处理256K 上下文并降低计算开销。
目前 Step 3.5 Flash 已全量上线。同时,团队透露 Step 4模型训练已启动。(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
