DeepSeek-V4.2 永久降价长上下文缓存价格压到接近零

Hacker News 5 月 22 日的热榜上挂出一条标题极短的帖子：国产大模型把价格永久降到新低位。讨论串里，发帖人贴出 DeepSeek-V4.2 在长上下文缓存读取上的官方报价，每百万 token 缓存命中费用被压到几乎可以忽略不计的水平，同时把首 token 输入价格也同步下调，下游代码助手和长文档分析两条主流场景都被点名直接受益。

“永久”两个字在这次定价公告里被 DeepSeek 写得很硬。过去几次主流模型降价都附带”限时””阶段””年内””灰度”这些前缀，这一次第一次出现”long-term”的字样。社区第一反应是把它理解成行业层面的竞争结构变化，而不是单纯的促销动作。

低成本不是市场操作而是架构红利

评论区里被点赞最多的一条解释指向架构本身。DeepSeek 这一代主力模型仍然是 MoE 结构，每次推理只激活总参数的小部分；与此同时上下文缓存（context cache）做得很彻底，长会话第二轮以后命中缓存的比例非常高，对应的物理算力消耗远低于一次完整 forward。把这两点叠加，长上下文价格能压到接近零的水位。

对比之下，闭源 SOTA 模型靠的是更大的稠密参数、更复杂的工具系统，单 token 成本天然偏高，很难用同样的方式跟进永久降价。这个差距决定了短期内 DeepSeek 的价格优势不容易被抹平，至少在长上下文这一档场景里。

编码助手是第一个被价格冲击的子市场

Hacker News 帖子里另一个被频繁提到的方向是 Coding Agent。国内外做编码助手的产品（Cursor、Cline、Continue、Aider 这一类）核心成本是 LLM 调用费，长会话里反复读项目目录和读文件的开销巨大，缓存读取价格几乎决定毛利。DeepSeek 这次把这一档价格压下来后，对手要么跟着降价，要么默认接受用户的迁移。

讨论串里还引到一个细节，发帖人贴出某第三方折扣渠道的页面截图，价格在官方降价基础上再叠了一档优惠。这种供给端的踊跃程度反映出 DeepSeek 的 API 已经进入”被批量采购转售”的阶段，需求侧实在。

这次价格战不会停在一家公司的公告上

过去一年国产模型互相比价的节奏已经走过一轮，但永久降价这条线被推到这个水位，意味着接下来其他厂商被动跟进的概率很高。从用户视角看，最直接的好处是项目预算被重写——之前要克扣上下文长度才能用得起的应用，现在可以放开手脚做长记忆、跨文件检索、整库分析。

真正的隐藏赢家可能是开源 Coding Agent 阵营。这些工具自己不卖 API，主要靠搭桥到便宜模型生存，DeepSeek 把成本拉到这个档位，等于直接送了一波天然的获客理由——用户买不起 Cursor 的高档套餐时，本地安装 Cline 接 DeepSeek 就是默认替代选项。这一层冲击在公告本身里没有写明，但很快会在产品装机量上体现出来。

关注点要从单价转回到 token 总消耗

价格战打到这个水位之后，下一个值得盯的指标不是单价，而是单个 Coding 任务真实消耗多少 token。Agentic 工具调用越来越密集，单 token 便宜不等于总账单便宜。前几个月 Cline 社区做过一份调查，深度使用一个月 API 账单很容易冲到三位数美元——便宜模型的存在让这个数字降下来，但不会消除需要每月仔细对账的事实。

用户该做的事比”换一家更便宜的”复杂一点：在长会话里主动控制上下文长度、在多轮工具调用里检查重复读取、在能用本地模型时优先本地。这些细节加起来比单纯比价单价更影响最终账单。

参考资料：

Hacker News 讨论帖，国产大模型永久降价，2026-05-22
DeepSeek 官方价格页与社区第三方折扣渠道公告

国产模型开启永久降价

低成本不是市场操作而是架构红利

编码助手是第一个被价格冲击的子市场

这次价格战不会停在一家公司的公告上

关注点要从单价转回到 token 总消耗

相关推荐