阶跃星辰发布 Step 3.7 Flash:198B MoE 单 Token 仅 11B 激活

AI资讯
阶跃星辰 Step 3.7 Flash 多模态大模型发布
阶跃 Step 3.7 Flash 198B 参数仅激活 11B

阶跃星辰 5 月 30 日正式上线新一代多模态大模型 Step 3.7 Flash。官方介绍称,这是一款 MoE 架构的旗舰版本,主打”极速响应 + 低成本”,并把编程智能任务的表现作为本轮发布的重点宣传点。

198B 总参数,单 Token 仅激活 11B

Step 3.7 Flash 的总参数量来到 198B,但凭借 MoE 路由设计,每个 Token 推理只需要激活 11B 参数。这意味着真正参与计算的权重只占总量的约 5.6%,对显存和带宽的占用被大幅压低。在同等硬件配置下,模型能拿到接近大密集模型的能力上限,同时把响应延迟控制在小模型档位,这正是阶跃这次主打”极速”的硬件账。

编程任务明显涨分,综合推理成本继续往下走

除了延迟优化,新版本最显眼的更新是编程能力。阶跃官方给出的对比数据中,Step 3.7 Flash 在多类编程评测上较旧版本有明显涨幅,对长上下文和工具调用的稳定性也有改进。叠加 11B 激活带来的推理价格下降,模型的性价比曲线明显往用户这一侧偏。这与 Qwen3、DeepSeek-V3 等国产 MoE 路线的取舍接近:用稀疏架构换吞吐与价格。

阶跃这次是奔着推理价格战去的

从公布的参数和成本数据看,Step 3.7 Flash 的目标不是冲榜,而是把单位 Token 价格继续往下打。198B/11B 这一组数字写得很直白:绝大多数厂家想要的是足够快、足够便宜、又能写代码的模型,性能榜尾的那几个百分点反而不再是决策变量。如果阶跃接下来把 API 单价同步下调,国内这一档多模态模型的价格基线很可能被它再压一截。