过去一周 X 和 LinkedIn 上多位技术高管集中吐槽同一件事:公司的 AI 系统月度账单失控了。一位匿名度很高的帖子来自某中型 SaaS 公司 CTO,他晒出账单截图——上个月 OpenAI + Anthropic API 费用 38 万美元,比预算超了 240%,老板第二天就把整个 AI 预算砍掉一半。这条帖子下面几百个 CTO 评论「同病相怜」。
问题的根子是 token 烧得太快。Agent 类应用一旦上线,单个用户请求背后可能触发几十次模型调用(规划、工具调用、反思、重试),每一步都在烧 token。很多团队在 demo 阶段觉得成本可控,一上量才发现账单是指数级膨胀的。OpenInference 数据显示,2026 年 Q1 企业平均每个 AI 功能的实际推理成本比立项预估高 3.7 倍。

财报里开始出现风险提示
这事已经不只是社媒吐槽。多家上市公司在 Q1 财报里把「AI 投入回报不确定性」单列为风险因素。Gartner 分析师 John-David Lovelock 给客户的报告写得很直接:「2025 年企业疯狂上 AI 是 FOMO 驱动,2026 年开始算账,我们预测今年下半年会有 30% 的企业 AI 项目因为成本回报不达标被砍掉或缩减。」
砍预算的连锁反应已经开始。一些团队从 GPT-4 级别模型降级到更便宜的小模型,一些直接砍掉非核心的 AI 功能,还有一些转向自托管开源模型(虽然短期省钱但运维成本另算)。这种「降级潮」反过来又影响了模型厂商的营收结构。
谁在这波洗牌里受益
成本焦虑催生了一批新机会。专门做「LLM 成本优化」的工具拿到融资:做 prompt 压缩的、做模型路由(简单请求走小模型、复杂请求走大模型)的、做缓存命中优化的。a16z 合伙人 Martin Casado 在 X 上点评:「2024 年大家比谁的模型强,2026 年开始比谁的单位 token 产出价值高。成本工程会成为 AI 应用层的核心竞争力。」
泡沫挤水还是结构调整
这波成本失控到底是 AI 泡沫破裂的前兆,还是一次正常的市场出清,社媒上吵得很凶。乐观派认为这只是 FOMO 退潮后的理性回归,真正有价值的 AI 应用会活下来,活下来的反而更健康。悲观派觉得这暴露了一个根本问题——很多 AI 应用根本没有正向单位经济模型,只是靠 VC 烧钱撑着,成本一算清就原形毕露。两种观点都有道理。可以确定的是,2026 下半年 AI 应用层会经历一次实打实的洗牌,能算清账、跑得通单位经济的团队才留得下来。光有炫酷 demo 的时代结束了。