阶跃 Step 3.7 Flash 上线：198B MoE 单 Token 11B 激活

阶跃星辰 Step 3.7 Flash 多模态大模型发布 — 阶跃 Step 3.7 Flash 198B 参数仅激活 11B

阶跃星辰 5 月 30 日正式上线新一代多模态大模型 Step 3.7 Flash。官方介绍称，这是一款 MoE 架构的旗舰版本，主打”极速响应 + 低成本”，并把编程智能任务的表现作为本轮发布的重点宣传点。

198B 总参数，单 Token 仅激活 11B

Step 3.7 Flash 的总参数量来到 198B，但凭借 MoE 路由设计，每个 Token 推理只需要激活 11B 参数。这意味着真正参与计算的权重只占总量的约 5.6%，对显存和带宽的占用被大幅压低。在同等硬件配置下，模型能拿到接近大密集模型的能力上限，同时把响应延迟控制在小模型档位，这正是阶跃这次主打”极速”的硬件账。

编程任务明显涨分，综合推理成本继续往下走

除了延迟优化，新版本最显眼的更新是编程能力。阶跃官方给出的对比数据中，Step 3.7 Flash 在多类编程评测上较旧版本有明显涨幅，对长上下文和工具调用的稳定性也有改进。叠加 11B 激活带来的推理价格下降，模型的性价比曲线明显往用户这一侧偏。这与 Qwen3、DeepSeek-V3 等国产 MoE 路线的取舍接近：用稀疏架构换吞吐与价格。

阶跃这次是奔着推理价格战去的

从公布的参数和成本数据看，Step 3.7 Flash 的目标不是冲榜，而是把单位 Token 价格继续往下打。198B/11B 这一组数字写得很直白：绝大多数厂家想要的是足够快、足够便宜、又能写代码的模型，性能榜尾的那几个百分点反而不再是决策变量。如果阶跃接下来把 API 单价同步下调，国内这一档多模态模型的价格基线很可能被它再压一截。

阶跃星辰发布 Step 3.7 Flash：198B MoE 单 Token 仅 11B 激活

198B 总参数，单 Token 仅激活 11B

编程任务明显涨分，综合推理成本继续往下走

阶跃这次是奔着推理价格战去的

相关推荐