
Hacker News 5 月 22 日的热榜上挂出一条标题极短的帖子:国产大模型把价格永久降到新低位。讨论串里,发帖人贴出 DeepSeek-V4.2 在长上下文缓存读取上的官方报价,每百万 token 缓存命中费用被压到几乎可以忽略不计的水平,同时把首 token 输入价格也同步下调,下游代码助手和长文档分析两条主流场景都被点名直接受益。
“永久”两个字在这次定价公告里被 DeepSeek 写得很硬。过去几次主流模型降价都附带”限时””阶段””年内””灰度”这些前缀,这一次第一次出现”long-term”的字样。社区第一反应是把它理解成行业层面的竞争结构变化,而不是单纯的促销动作。
低成本不是市场操作而是架构红利
评论区里被点赞最多的一条解释指向架构本身。DeepSeek 这一代主力模型仍然是 MoE 结构,每次推理只激活总参数的小部分;与此同时上下文缓存(context cache)做得很彻底,长会话第二轮以后命中缓存的比例非常高,对应的物理算力消耗远低于一次完整 forward。把这两点叠加,长上下文价格能压到接近零的水位。
对比之下,闭源 SOTA 模型靠的是更大的稠密参数、更复杂的工具系统,单 token 成本天然偏高,很难用同样的方式跟进永久降价。这个差距决定了短期内 DeepSeek 的价格优势不容易被抹平,至少在长上下文这一档场景里。
编码助手是第一个被价格冲击的子市场
Hacker News 帖子里另一个被频繁提到的方向是 Coding Agent。国内外做编码助手的产品(Cursor、Cline、Continue、Aider 这一类)核心成本是 LLM 调用费,长会话里反复读项目目录和读文件的开销巨大,缓存读取价格几乎决定毛利。DeepSeek 这次把这一档价格压下来后,对手要么跟着降价,要么默认接受用户的迁移。
讨论串里还引到一个细节,发帖人贴出某第三方折扣渠道的页面截图,价格在官方降价基础上再叠了一档优惠。这种供给端的踊跃程度反映出 DeepSeek 的 API 已经进入”被批量采购转售”的阶段,需求侧实在。
这次价格战不会停在一家公司的公告上
过去一年国产模型互相比价的节奏已经走过一轮,但永久降价这条线被推到这个水位,意味着接下来其他厂商被动跟进的概率很高。从用户视角看,最直接的好处是项目预算被重写——之前要克扣上下文长度才能用得起的应用,现在可以放开手脚做长记忆、跨文件检索、整库分析。
真正的隐藏赢家可能是开源 Coding Agent 阵营。这些工具自己不卖 API,主要靠搭桥到便宜模型生存,DeepSeek 把成本拉到这个档位,等于直接送了一波天然的获客理由——用户买不起 Cursor 的高档套餐时,本地安装 Cline 接 DeepSeek 就是默认替代选项。这一层冲击在公告本身里没有写明,但很快会在产品装机量上体现出来。
关注点要从单价转回到 token 总消耗
价格战打到这个水位之后,下一个值得盯的指标不是单价,而是单个 Coding 任务真实消耗多少 token。Agentic 工具调用越来越密集,单 token 便宜不等于总账单便宜。前几个月 Cline 社区做过一份调查,深度使用一个月 API 账单很容易冲到三位数美元——便宜模型的存在让这个数字降下来,但不会消除需要每月仔细对账的事实。
用户该做的事比”换一家更便宜的”复杂一点:在长会话里主动控制上下文长度、在多轮工具调用里检查重复读取、在能用本地模型时优先本地。这些细节加起来比单纯比价单价更影响最终账单。
参考资料:
- Hacker News 讨论帖,国产大模型永久降价,2026-05-22
- DeepSeek 官方价格页与社区第三方折扣渠道公告