xAI 在 5 月 27 日把 Grok 编程助手所有账户的当日使用额度全量重置,原因是新工具上线初期计费链路有 bug,用户用几次请求就把上限打空。xAI 官方账号 @xai 在 5/26 22:14 UTC 发推确认「caching attribution mismatch」并致歉,优化缓存说明显示,本应按 cached prompt 计算折扣的请求被当成全量 token 计费扣减。
事故经过
- Grok Code 上线 24 小时内,多名用户反馈额度消耗异常,部分账户半天就触顶
- xAI 工程团队定位到 cache hit 率上报链路错误,所有命中缓存的请求都漏算折扣
- 处置方式是回滚计费逻辑,并对所有受影响账户清零当日已扣额度
按 xAI 官方 status 推文,受影响账户为「全部 Grok Code 当日活跃用户」(具体数未披露),从首次报告到回滚用时约 90 分钟,回滚后所有账户当日额度被全量重置,未做差异化补偿。
定价问题永远比模型问题更难修
xAI 创始人 Elon Musk 此前多次在 X 上把 Grok Code 列为本季度核心产品。这次翻车说明的不是模型推理能力——是 token 计费、KV cache 折扣和限流策略这三层运营机制叠在一起没跑过真实负载。模型团队和计费团队在很多公司都是分开的,单独看各自系统都对,组合起来就漏掉了边界条件。

Grok Code 是 xAI 第一个直接对标 Claude Code、OpenAI Codex CLI 的命令行编程助手,对手已在企业开发者群体里铺开半年,留给 xAI 的容错窗口本来就窄。当天回滚加全量清零的处置算干净,但要把已经被扣空额度转去隔壁的开发者拉回来,要看接下来一周的稳定性能不能撑住。
定价 bug 在产品冷启动阶段是负面体感的放大器。Grok Code 后续要回血,光修缓存不够,得在限流和计费日志透明度上做出更具体的承诺。
参考链接