英伟达算力租金暴跌:微软砍 Claude,优步 4 个月烧光预算

AI资讯
英伟达GPU算力租金暴跌示意
英伟达算力租金近期暴跌引发行业泡沫警报

彭博本周抛出一篇硬核数据稿:英伟达 H100 在三家头部云上的现货租金价格在过去 60 天里跌了 38%,A100 跌了 47%。文章标题挺刺眼——《算力世界里的 2008》。报道里点名了两件事:微软因预算严重超标,砍掉了内部 60% 的 Claude API 授权;优步在自家 AI 项目上 4 个月就烧光了原定全年的 5.4 亿美元算力预算,CEO Khosrowshahi 已经下令限制员工的 token 消费。

租金为什么跌

租金下跌不是因为需求消失,而是因为供给突然过剩。过去 18 个月超大规模数据中心交付了创纪录的 GPU 容量,仅 Microsoft Azure、Oracle Cloud、CoreWeave 三家就在 2025 第一季度新增了约 84 万张 H100。需求端却没有同步爆发——大量企业从 PoC 阶段没能走到生产阶段,模型训练完成后剩下的是相对便宜的推理负载。结果就是供大于求,现货市场价格被砸出来。租金下跌反过来又压低了二手 GPU 的转售价值,CoreWeave 这类纯算力租赁公司的毛利率从去年 Q4 的 64% 跌到本季度的 41%,股价随之一周跌去近 20%。

巨头自己也在勒紧裤带

微软的故事尤其值得读。它是 OpenAI 的最大金主,但同时被允许把 Anthropic 的 Claude 通过 Azure 卖给客户。问题是内部团队也大量调用 Claude,月度账单失控。CFO Amy Hood 在最近的财报电话会上直言:”我们必须重新评估每一行 token 是不是真的产生了对应的业务价值。”于是公司内部出了一套”token 预算”制度,每个团队按季度领配额,超了要写正式申请。优步的情况更极端,4 个月烧光全年预算意味着平均每月烧掉 1.35 亿美元算力,最终落地的产品却没几个能看见。Khosrowshahi 给出的应对方案是:所有 AI 项目必须先签 ROI,模型选型默认从最便宜的开源开始,只有在效果不达标时才允许升级到旗舰。这两家加在一起,传递的信号已经不是”AI 投入再大也不嫌多”,而是”账要算清楚才能继续花”。

泡沫不一定破,但盲目期肯定结束了

说算力市场进入”2008 时刻”或许夸张,但盲目购置 GPU 的窗口确实关上了。下一阶段会发生两件事:一是算力供应商之间的价格战会变得更难看,毛利率高的玩家被迫向低毛利率的玩家靠拢;二是企业方的 AI 预算会被强制结构化,token 使用量会像云开支一样进入财务季度审计。对模型厂商而言,这反而是好事——只有当客户开始真的算账,那些产生真实价值的应用才会被筛出来。算力租金跌的不只是一个数字,跌掉的是过去三年那种”先训了再说”的赌徒心态。