Uber 全年 AI 预算半年烧完：Token 消耗 4 倍但产出仅涨 1.5 倍

Uber 全年 AI 预算几个月就烧完了

Hacker News 5 月 26 日把一份 Uber 内部备忘录推到首页第一名。Uber 平台架构副总裁 Sundeep Jain 在备忘录里写得很白：公司今年批给 AI 工具和模型 API 的预算，到五月底已经用掉超过 80%，重度用户的人均月度 token 消耗是预算建模时假设值的三倍多。备忘录被 leak 之后引爆讨论，2400+ 评论里大半是企业 AI 落地团队在自陈类似处境。

Jain 在备忘录里点了一段直白的话：「我们没有看到对应的产出提升。token 消耗增长 4 倍，但我们能客观度量的工作产出指标只增长了不到 1.5 倍」。原文用的不是「ROI 不及预期」这种公关话术，是工程口径的对账。Uber 这次主动把预算红线拉出来，是大厂里第一次把 AI 支出和产出对账的内部文件被公开。

Token 计费撑不起重度场景

问题的核心在定价模型，不在 AI 本身。Anthropic 和 OpenAI 的 API 都是 token-by-token 计费，重度用户和轻度用户的成本曲线完全不同——一个工程师用 Claude Code 开自动 agent 一天可以烧 50 美金 token，月度账单两位数美金的「轻度用户」打底层。Uber 的工程师群体属于重度，TTL 长、上下文大、多 agent 嵌套，每一次重试都在堆账。

对照数据：根据 a16z 5 月发布的企业 AI 支出报告，企业级 AI 工具的人均月度 spend 中位数从 2024 年的 11 美元涨到 2025 Q1 的 47 美元，重度用户区间已经突破单人 300 美元。Cursor、Devin、Claude Code 这一批 IDE 类产品本身的订阅价不高，但底层 API 透传成本完全没有上限——订阅是入口，token 才是真正的账单。

Sundeep Jain 的压价信号

Uber 的处理方式很直接。备忘录里给出了三条措施：第一，按团队设 token 配额而不是开放使用；第二，强制使用 prompt caching 和上下文压缩；第三，重新评估和 Anthropic、OpenAI 的合同条款，要求按使用量阶梯打折。最后一条是真正的信号——Uber 这种规模的客户开始倒过来压价，意味着模型厂商的企业合同议价权正在变化。

这条压价信号还会传到中等规模公司。OpenAI 和 Anthropic 财报里”企业 ARR”占比正在快速上升，同时 GPT-4-class 模型的 token 单价过去一年压了 60%。客户用脚投票的力量在企业端比 to C 大得多——下个季度大概率会看到正式的”企业重度用户阶梯包”产品出来。

真正稀缺的是会衡量产出的工程经理

这事最该被注意的不是 AI 太贵。是大部分企业到现在没把 AI 工具当成可度量的生产资料管理——和买云、买 Salesforce 不同，AI 工具的人均消耗差异是 30 倍量级，不分级管理必然出现 Uber 这种全年预算半年烧完的局面。Sundeep Jain 备忘录里那句”token 消耗 4 倍但产出 1.5 倍”，其实是在打整个行业的脸——一年下来，没几家真正搭起 AI 使用的成本-产出对账系统。

解药也很清楚：AI 不是订阅 SaaS，是按吨买的原材料。能给重度用户单独建账、能把 prompt 长度和模型选择当成代码 review 项的团队，会比直接发牌的团队提前半年走出 token 透支。这事真正的瓶颈不在模型厂，是企业内部那个”会算账”的工程经理岗位还没补上。

参考：Hacker News 讨论

优步高管公开质疑 AI 过度支出

Uber 全年 AI 预算几个月就烧完了

Token 计费撑不起重度场景

Sundeep Jain 的压价信号

真正稀缺的是会衡量产出的工程经理

相关推荐