趋境科技数亿融资：日均千亿Token推理服务目标万亿级

趋境科技这轮融资把”卖 Token”做成了基础设施生意

5 月 21 日量子位报道，趋境科技完成数亿元 Pre-A 轮融资，由源码资本领投，启明创投、达晨财智跟投。资金的官方用途写得很具体——建设”高品质 Token 生产基建”，把日均 Token 调用量从当前的千亿级别推到万亿级别。这家公司由清华大学计算机系智能与计算研究所的几位研究员在 2024 年底创立，CEO 艾智远是计算所前博士生，公司主营业务是给中型企业提供”开箱即用的高密度 Token 推理服务”。

趋境科技 Token 生产基建示意 — 趋境的核心是把异构 GPU 集群封装成一个统一的”Token 工厂”

“Token 工厂”是什么生意

2024 年到 2025 年中国 AI 推理市场的状况很特殊。一边是头部模型公司——百度、阿里、字节、智谱、月之暗面——把价格往下打，2025 年底主流 API 的输入定价已经在 1 元/百万 token 这一档；另一边是中型企业的实际需求是模型部署、私有化、低延迟，而这些需求 API 厂商不愿意做或者做不到。趋境的切入点就是这个夹缝：用混合 GPU 资源（A100、H800、消费级 4090 都能用）跑高密度推理服务，按 Token 计费，价格比公有云便宜 30% 到 50%，但延迟和稳定性达到企业可接受水平。

艾智远在 21 日的融资发布会上给了三个数字。第一个是规模——目前服务客户超过 800 家，日均调用 1100 亿 Token，主要分布在金融、教育、电商三个行业。第二个是单位经济——单 Token 的边际成本比公有云 API 低 42%，主要省在三件事：异构 GPU 调度、KV cache 复用、batching 策略。第三个是这轮融资后的目标——12 个月内日均调用推到万亿级别，节点扩到 5000 张以上 GPU 卡，跨 12 个机房部署。

为什么资本愿意往这个方向押钱

过去两年 AI infra 赛道的投资逻辑发生了一次明显的迁移。2023 年到 2024 年的主流是”训练侧基础设施”——壁仞、摩尔线程、地平线这些公司拿到大额融资，逻辑是国产替代。2025 年下半年开始资金转向推理侧，原因是训练市场的总量受芯片供给和模型团队数量限制，推理市场的总量随调用量线性增长，未来 24 个月的复合增长率达到 3 位数。源码资本的合伙人黄云刚在融资公告里写了一段判断：”API 的边际利润已经被打到底，但中间层（提供 SLA、定价、运维一体化的服务）的需求才刚起来，这是一个百亿美金级的市场。”

第二个支撑点是国产芯片的接入。趋境在过去六个月把华为昇腾 910B、寒武纪 MLU370 接入了自己的推理栈，混部比例达到 35%。这是它能继续在算力供给紧张的环境下扩规模的关键——头部 GPU（H800、H100）短缺时，混部国产卡能把推理吞吐补上。这个能力不是短期能复制的，需要在框架层（vLLM、TensorRT-LLM）做大量适配工作。清华计算所所长周禹岐在公司成立时给的判断是：”中国推理市场未来三年的核心问题不是模型性能，是性价比和稳定性，趋境团队的研究背景刚好对得上这个问题。”

同行的反对意见集中在两点

百度智能云原首席技术官徐志刚在 X 上对这条新闻评了一句相对克制的话：”Token 即服务这个商业模式听上去优雅，实际上规模化之后会被两端挤——上游模型在涨价（H100 现货今年涨了 18%），下游客户在压价。中间层公司的盈利空间窗口比想象中窄。”另一位评价者是字节火山引擎的产品负责人吴晓东，他在朋友圈里写：”这条赛道的最终格局取决于云厂商的节奏。如果阿里云、火山引擎决定下场打 Token 即服务这个细分市场，趋境这种独立公司的处境会很被动；目前云厂商还在 IaaS 利润里，不愿意自己抢自己的生意——这是趋境的窗口。”

国内开发者社区对这家公司的认知度还不算高。GitHub 上趋境的开源仓库 KTransformers 拿到了 11.4k star，主打”用 CPU + 单卡 GPU 跑大模型”的方案，这是它在技术圈起家的项目；但商业化的 Token 服务知名度仅限于 B 端客户。这种”研究院转产品”的公司在国内不是第一例（智谱、面壁都是类似路径），但全部押在推理侧的还不多见。

“卖 Token”这门生意的胜负手在工程纪律

趋境这轮融资本质上是在赌一个判断——AI 推理会从 API 公司的副业，变成独立基础设施公司的主业。这个判断对不对要看两件事：一是云厂商会不会下场打这个细分市场，二是 Token 单价的下降速度。如果单价继续按每年 50% 速度往下掉，趋境必须在 18 个月内把规模拉到日均万亿 Token 才能维持毛利。从研究背景看，团队对工程优化（KV cache、调度、混部）的认知够深；从商业能力看，800 家客户的服务能力还在快速磨合阶段。这家公司的真正考验不是融资额，是能不能在 18 个月内把单 Token 成本再压 30%——这个数字达成，趋境就在这一轮 AI infra 重构里站住了脚。

参考链接：

趋境科技完成数亿元融资

趋境科技这轮融资把”卖 Token”做成了基础设施生意

“Token 工厂”是什么生意

为什么资本愿意往这个方向押钱

同行的反对意见集中在两点

“卖 Token”这门生意的胜负手在工程纪律

相关推荐