英伟达 PiD 像素扩散解码器：低清实时升 4K 超分

英伟达本周公开了下一代实时超分技术 Pixel Diffusion Decoder（PiD），把扩散模型压进解码端，可以在 RTX 50 系显卡上把 720p 帧实时升采样到 4K，对外定位是「DLSS 之后的下一站」。

PiD 的关键改动在于扔掉了传统超分依赖的 GAN 判别器和 ESRGAN 那套残差块结构，直接用一个单步扩散解码器在像素空间补全细节。英伟达高级渲染研究主管 David Luebke 在公告里给出的数字是：单帧推理 1.8 ms、4K 输出每秒约 240 帧、显存占用比 DLSS 4 降 32%，旗舰 RTX 5090 上可以做到 8K 60 fps。

英伟达 PiD 像素扩散解码器示意 — PiD 用单步扩散把超分塞进解码器，直接抢游戏与影像两条线

不只是游戏的事

PiD 第一波目标是 PC 游戏厂商，但英伟达同步放出了影像 SDK，意思很清楚：流媒体平台、影院后期、监控系统都是它要切的市场。Netflix 算法工程师 Anne Aaron 在 X 上贴了一张对比图，说同样码率下 PiD 主观质量比当前主力的 VMAF 调优管线高出半档，明年量产编码器会跟进集成。

对国产 GPU 是利空。摩尔线程、壁仞这类追赶者过去两年靠 DLSS 兼容方案过日子，PiD 把超分挪到扩散框架后，老一代 ESRGAN/SRGAN 的工程经验大半作废，得重新搭一套训练管线。

扩散模型从云端走到帧管线

真正值得记的是位置：扩散模型第一次被英伟达正式塞进帧渲染链路，而不是事后跑一段视频生成。这意味着以后每一帧画面都是「神经网络补全过的」，传统意义上的「原生分辨率」会越来越没意义——硬件能跑多大屏，取决于解码器能补多少细节，而不是栅格化能画多少像素。游戏开发者过去吵了十年的「TAA 还是 DLSS」算是被一并替换了。

英伟达发布 PiD 像素扩散解码器：低清画面秒变 4K 超分

不只是游戏的事

扩散模型从云端走到帧管线

相关推荐