英伟达本周公开了下一代实时超分技术 Pixel Diffusion Decoder(PiD),把扩散模型压进解码端,可以在 RTX 50 系显卡上把 720p 帧实时升采样到 4K,对外定位是「DLSS 之后的下一站」。
PiD 的关键改动在于扔掉了传统超分依赖的 GAN 判别器和 ESRGAN 那套残差块结构,直接用一个单步扩散解码器在像素空间补全细节。英伟达高级渲染研究主管 David Luebke 在公告里给出的数字是:单帧推理 1.8 ms、4K 输出每秒约 240 帧、显存占用比 DLSS 4 降 32%,旗舰 RTX 5090 上可以做到 8K 60 fps。

不只是游戏的事
PiD 第一波目标是 PC 游戏厂商,但英伟达同步放出了影像 SDK,意思很清楚:流媒体平台、影院后期、监控系统都是它要切的市场。Netflix 算法工程师 Anne Aaron 在 X 上贴了一张对比图,说同样码率下 PiD 主观质量比当前主力的 VMAF 调优管线高出半档,明年量产编码器会跟进集成。
对国产 GPU 是利空。摩尔线程、壁仞这类追赶者过去两年靠 DLSS 兼容方案过日子,PiD 把超分挪到扩散框架后,老一代 ESRGAN/SRGAN 的工程经验大半作废,得重新搭一套训练管线。
扩散模型从云端走到帧管线
真正值得记的是位置:扩散模型第一次被英伟达正式塞进帧渲染链路,而不是事后跑一段视频生成。这意味着以后每一帧画面都是「神经网络补全过的」,传统意义上的「原生分辨率」会越来越没意义——硬件能跑多大屏,取决于解码器能补多少细节,而不是栅格化能画多少像素。游戏开发者过去吵了十年的「TAA 还是 DLSS」算是被一并替换了。