Uber 全年 AI 预算几个月就烧完了
Hacker News 5 月 26 日把一份 Uber 内部备忘录推到首页第一名。Uber 平台架构副总裁 Sundeep Jain 在备忘录里写得很白:公司今年批给 AI 工具和模型 API 的预算,到五月底已经用掉超过 80%,重度用户的人均月度 token 消耗是预算建模时假设值的三倍多。备忘录被 leak 之后引爆讨论,2400+ 评论里大半是企业 AI 落地团队在自陈类似处境。

Jain 在备忘录里点了一段直白的话:「我们没有看到对应的产出提升。token 消耗增长 4 倍,但我们能客观度量的工作产出指标只增长了不到 1.5 倍」。原文用的不是「ROI 不及预期」这种公关话术,是工程口径的对账。Uber 这次主动把预算红线拉出来,是大厂里第一次把 AI 支出和产出对账的内部文件被公开。
Token 计费撑不起重度场景
问题的核心在定价模型,不在 AI 本身。Anthropic 和 OpenAI 的 API 都是 token-by-token 计费,重度用户和轻度用户的成本曲线完全不同——一个工程师用 Claude Code 开自动 agent 一天可以烧 50 美金 token,月度账单两位数美金的「轻度用户」打底层。Uber 的工程师群体属于重度,TTL 长、上下文大、多 agent 嵌套,每一次重试都在堆账。
对照数据:根据 a16z 5 月发布的企业 AI 支出报告,企业级 AI 工具的人均月度 spend 中位数从 2024 年的 11 美元涨到 2025 Q1 的 47 美元,重度用户区间已经突破单人 300 美元。Cursor、Devin、Claude Code 这一批 IDE 类产品本身的订阅价不高,但底层 API 透传成本完全没有上限——订阅是入口,token 才是真正的账单。
Sundeep Jain 的压价信号
Uber 的处理方式很直接。备忘录里给出了三条措施:第一,按团队设 token 配额而不是开放使用;第二,强制使用 prompt caching 和上下文压缩;第三,重新评估和 Anthropic、OpenAI 的合同条款,要求按使用量阶梯打折。最后一条是真正的信号——Uber 这种规模的客户开始倒过来压价,意味着模型厂商的企业合同议价权正在变化。
这条压价信号还会传到中等规模公司。OpenAI 和 Anthropic 财报里”企业 ARR”占比正在快速上升,同时 GPT-4-class 模型的 token 单价过去一年压了 60%。客户用脚投票的力量在企业端比 to C 大得多——下个季度大概率会看到正式的”企业重度用户阶梯包”产品出来。
真正稀缺的是会衡量产出的工程经理
这事最该被注意的不是 AI 太贵。是大部分企业到现在没把 AI 工具当成可度量的生产资料管理——和买云、买 Salesforce 不同,AI 工具的人均消耗差异是 30 倍量级,不分级管理必然出现 Uber 这种全年预算半年烧完的局面。Sundeep Jain 备忘录里那句”token 消耗 4 倍但产出 1.5 倍”,其实是在打整个行业的脸——一年下来,没几家真正搭起 AI 使用的成本-产出对账系统。
解药也很清楚:AI 不是订阅 SaaS,是按吨买的原材料。能给重度用户单独建账、能把 prompt 长度和模型选择当成代码 review 项的团队,会比直接发牌的团队提前半年走出 token 透支。这事真正的瓶颈不在模型厂,是企业内部那个”会算账”的工程经理岗位还没补上。