Bloomberg、The Information 5 月 31 日联合报道:OpenAI、Anthropic、Google DeepMind、Cohere 等头部模型公司不再满足于卖 API,2026 年第一、第二季度合计已经投入 47 亿美元搭建企业咨询团队,把「模型嵌入老旧 ERP/CRM 系统」当成核心销售动作,目标客户是财富 500 强的传统制造、保险、能源公司。
Bloomberg 数据显示,OpenAI 企业服务部门 2025 年从 320 人扩张到 2026 年 5 月的 2400 人;Anthropic 同期从 90 人扩张到 1100 人;Cohere 干脆把传统咨询行业的资深合伙人挖了一批过来,创始人 Aidan Gomez 接受采访时直说:「客户要的不是模型,是有人帮他们把模型塞进 SAP 里。」

API 卖不下去了?
恰恰相反。API 收入还在涨,问题是企业客户的实际付费速度跟不上模型迭代速度。一家保险公司想把 Claude 接进自家保单审批系统,平均要花 8-14 个月走完合规、IT 接入、流程改造,这期间模型已经升级了两代。客户付的是去年的合同价,跑的是今年的低成本模型,毛利反而在拉低。
所以模型公司开始下场做端到端集成:直接派工程师空降客户机房,承诺 90 天上线、按结果交付。这种打法 IBM、埃森哲、麦肯锡做了几十年,模型公司的优势是更熟自家模型,劣势是不熟客户。Anthropic 总裁、联合创始人 Daniela Amodei 在采访里承认:「我们的销售人员要先学会读懂客户的财务报表,这事比训练 Claude 还难。」
埃森哲麦肯锡反应快
真正紧张的是传统 IT 咨询。埃森哲已经把全球 14 万咨询顾问的 50% 列入「AI 转型必修」名单,麦肯锡对外声明 5 月内启动「与 OpenAI 全面战略合作」。市场逻辑很简单:AI 集成项目的决策链最终会落在传统咨询公司手里,但模型厂下场后,传统咨询要么在中间分蛋糕,要么被吃掉。
毛利账才是真正的驱动力
为什么宁可养几千人的重资产团队也要下场?算一笔毛利账就清楚了。纯 API 业务毛利看着漂亮,但企业客户合同周期长、用量波动大,The Information 援引的内部数据称头部模型公司纯 API 业务的客户留存毛利已经从 2024 年的 60% 以上压到 2026 年初的 30% 出头。端到端集成项目则不同:一个财富 500 强的 ERP 嵌入项目平均合同额 800 万到 2000 万美元,交付周期 6-12 个月,毛利能稳在 45% 左右,且锁定客户后续多年的运维续费。换句话说,模型厂不是不想轻装上阵,是 API 这门生意单靠卖 token 已经撑不起它们的估值故事——必须往交付链下游走,去抢埃森哲们碗里那块更厚的利润。
需要说明的是,上述扩招人数与投入金额是 Bloomberg、The Information 援引的内部数据,模型公司官方并未逐项确认,具体口径可能有出入。
这件事最让人玩味的是位置反转。三年前模型公司觉得「卖 API 就够了,集成是别人的事」;现在他们发现卖 API 只是入场券,真正的钱在系统集成里。这个赛道下半年大概率要看到至少一起头部模型公司收购传统 SI 公司的并购案——Cohere 已经放风在评估几个加拿大本土 SI 标的。