趋境科技这轮融资把”卖 Token”做成了基础设施生意
5 月 21 日量子位报道,趋境科技完成数亿元 Pre-A 轮融资,由源码资本领投,启明创投、达晨财智跟投。资金的官方用途写得很具体——建设”高品质 Token 生产基建”,把日均 Token 调用量从当前的千亿级别推到万亿级别。这家公司由清华大学计算机系智能与计算研究所的几位研究员在 2024 年底创立,CEO 艾智远是计算所前博士生,公司主营业务是给中型企业提供”开箱即用的高密度 Token 推理服务”。

“Token 工厂”是什么生意
2024 年到 2025 年中国 AI 推理市场的状况很特殊。一边是头部模型公司——百度、阿里、字节、智谱、月之暗面——把价格往下打,2025 年底主流 API 的输入定价已经在 1 元/百万 token 这一档;另一边是中型企业的实际需求是模型部署、私有化、低延迟,而这些需求 API 厂商不愿意做或者做不到。趋境的切入点就是这个夹缝:用混合 GPU 资源(A100、H800、消费级 4090 都能用)跑高密度推理服务,按 Token 计费,价格比公有云便宜 30% 到 50%,但延迟和稳定性达到企业可接受水平。
艾智远在 21 日的融资发布会上给了三个数字。第一个是规模——目前服务客户超过 800 家,日均调用 1100 亿 Token,主要分布在金融、教育、电商三个行业。第二个是单位经济——单 Token 的边际成本比公有云 API 低 42%,主要省在三件事:异构 GPU 调度、KV cache 复用、batching 策略。第三个是这轮融资后的目标——12 个月内日均调用推到万亿级别,节点扩到 5000 张以上 GPU 卡,跨 12 个机房部署。
为什么资本愿意往这个方向押钱
过去两年 AI infra 赛道的投资逻辑发生了一次明显的迁移。2023 年到 2024 年的主流是”训练侧基础设施”——壁仞、摩尔线程、地平线这些公司拿到大额融资,逻辑是国产替代。2025 年下半年开始资金转向推理侧,原因是训练市场的总量受芯片供给和模型团队数量限制,推理市场的总量随调用量线性增长,未来 24 个月的复合增长率达到 3 位数。源码资本的合伙人黄云刚在融资公告里写了一段判断:”API 的边际利润已经被打到底,但中间层(提供 SLA、定价、运维一体化的服务)的需求才刚起来,这是一个百亿美金级的市场。”
第二个支撑点是国产芯片的接入。趋境在过去六个月把华为昇腾 910B、寒武纪 MLU370 接入了自己的推理栈,混部比例达到 35%。这是它能继续在算力供给紧张的环境下扩规模的关键——头部 GPU(H800、H100)短缺时,混部国产卡能把推理吞吐补上。这个能力不是短期能复制的,需要在框架层(vLLM、TensorRT-LLM)做大量适配工作。清华计算所所长周禹岐在公司成立时给的判断是:”中国推理市场未来三年的核心问题不是模型性能,是性价比和稳定性,趋境团队的研究背景刚好对得上这个问题。”
同行的反对意见集中在两点
百度智能云原首席技术官徐志刚在 X 上对这条新闻评了一句相对克制的话:”Token 即服务这个商业模式听上去优雅,实际上规模化之后会被两端挤——上游模型在涨价(H100 现货今年涨了 18%),下游客户在压价。中间层公司的盈利空间窗口比想象中窄。”另一位评价者是字节火山引擎的产品负责人吴晓东,他在朋友圈里写:”这条赛道的最终格局取决于云厂商的节奏。如果阿里云、火山引擎决定下场打 Token 即服务这个细分市场,趋境这种独立公司的处境会很被动;目前云厂商还在 IaaS 利润里,不愿意自己抢自己的生意——这是趋境的窗口。”
国内开发者社区对这家公司的认知度还不算高。GitHub 上趋境的开源仓库 KTransformers 拿到了 11.4k star,主打”用 CPU + 单卡 GPU 跑大模型”的方案,这是它在技术圈起家的项目;但商业化的 Token 服务知名度仅限于 B 端客户。这种”研究院转产品”的公司在国内不是第一例(智谱、面壁都是类似路径),但全部押在推理侧的还不多见。
“卖 Token”这门生意的胜负手在工程纪律
趋境这轮融资本质上是在赌一个判断——AI 推理会从 API 公司的副业,变成独立基础设施公司的主业。这个判断对不对要看两件事:一是云厂商会不会下场打这个细分市场,二是 Token 单价的下降速度。如果单价继续按每年 50% 速度往下掉,趋境必须在 18 个月内把规模拉到日均万亿 Token 才能维持毛利。从研究背景看,团队对工程优化(KV cache、调度、混部)的认知够深;从商业能力看,800 家客户的服务能力还在快速磨合阶段。这家公司的真正考验不是融资额,是能不能在 18 个月内把单 Token 成本再压 30%——这个数字达成,趋境就在这一轮 AI infra 重构里站住了脚。
参考链接: