AI 成本失控引市场洗牌巨头开始砍预算

过去一周 X 和 LinkedIn 上多位技术高管集中吐槽同一件事：公司的 AI 系统月度账单失控了。一位匿名度很高的帖子来自某中型 SaaS 公司 CTO，他晒出账单截图——上个月 OpenAI + Anthropic API 费用 38 万美元，比预算超了 240%，老板第二天就把整个 AI 预算砍掉一半。这条帖子下面几百个 CTO 评论「同病相怜」。

问题的根子是 token 烧得太快。Agent 类应用一旦上线，单个用户请求背后可能触发几十次模型调用（规划、工具调用、反思、重试），每一步都在烧 token。很多团队在 demo 阶段觉得成本可控，一上量才发现账单是指数级膨胀的。OpenInference 数据显示，2026 年 Q1 企业平均每个 AI 功能的实际推理成本比立项预估高 3.7 倍。

AI 成本失控市场洗牌示意 — Agent 应用 token 烧太快，CTO 们的 AI 账单集体失控

财报里开始出现风险提示

这事已经不只是社媒吐槽。多家上市公司在 Q1 财报里把「AI 投入回报不确定性」单列为风险因素。Gartner 分析师 John-David Lovelock 给客户的报告写得很直接:「2025 年企业疯狂上 AI 是 FOMO 驱动，2026 年开始算账，我们预测今年下半年会有 30% 的企业 AI 项目因为成本回报不达标被砍掉或缩减。」

砍预算的连锁反应已经开始。一些团队从 GPT-4 级别模型降级到更便宜的小模型，一些直接砍掉非核心的 AI 功能，还有一些转向自托管开源模型（虽然短期省钱但运维成本另算）。这种「降级潮」反过来又影响了模型厂商的营收结构。

谁在这波洗牌里受益

成本焦虑催生了一批新机会。专门做「LLM 成本优化」的工具拿到融资:做 prompt 压缩的、做模型路由（简单请求走小模型、复杂请求走大模型）的、做缓存命中优化的。a16z 合伙人 Martin Casado 在 X 上点评:「2024 年大家比谁的模型强，2026 年开始比谁的单位 token 产出价值高。成本工程会成为 AI 应用层的核心竞争力。」

泡沫挤水还是结构调整

这波成本失控到底是 AI 泡沫破裂的前兆，还是一次正常的市场出清，社媒上吵得很凶。乐观派认为这只是 FOMO 退潮后的理性回归，真正有价值的 AI 应用会活下来，活下来的反而更健康。悲观派觉得这暴露了一个根本问题——很多 AI 应用根本没有正向单位经济模型，只是靠 VC 烧钱撑着，成本一算清就原形毕露。两种观点都有道理。可以确定的是,2026 下半年 AI 应用层会经历一次实打实的洗牌，能算清账、跑得通单位经济的团队才留得下来。光有炫酷 demo 的时代结束了。

参考：AI 预算削减相关报道检索

AI 成本失控引发市场洗牌：巨头开始砍预算

财报里开始出现风险提示

谁在这波洗牌里受益

泡沫挤水还是结构调整

相关推荐