OpenAI 在官方博客一次性放出了三件围绕内容来源的工具:嵌入 C2PA 元数据、写入 Google DeepMind 的 SynthID 隐形水印、上线一个对外开放的图像反查页面。这是头部模型公司第一次在水印链路上跨厂牌互通,也是过去两年里业界最具体的一次”我们要让生成内容可追溯”的承诺。

三件套同时落地
第一层是 C2PA。DALL-E 3 与最新视觉模型生成的图像出厂自带 Content Credentials 元数据,记录模型名、生成时间、是否经过编辑。Adobe Photoshop、Camera Raw、Leica M11-P 早就在写同一份格式,OpenAI 的加入让这套标准在生成端的覆盖面显著扩大。
第二层是 SynthID。OpenAI 把 Google DeepMind 开源出来的隐形水印库直接接进了图像产线。两家本是直接竞争对手,能让水印参数互通靠的是 SynthID 在年初转成开源 SDK,不再绑定 Google Cloud。
第三层是检测器。OpenAI 上线了一个反查页面,输入图片即可读出 C2PA 元数据并尝试探测 SynthID 信号。官方实验室数据是:未经压缩的 DALL-E 原图检测召回率超过 98%,经过 JPEG 70% 重压缩后仍能保留约 92%,但截图后跨平台再上传的场景,召回率掉到 60% 以下。
跨厂牌互通的实际门槛
能不能拦住伪造内容,最终要看链路上每一环都不掉链子。C2PA 元数据虽然带签名,但任何一次截图、二压、转存到不写元数据的平台,整段凭证就消失了。微信、X、Instagram 目前都还没承诺保留 Content Credentials 字段,这意味着大多数普通用户在社交平台看到的图,根本没有可读的来源标。
SynthID 的鲁棒性更好一些,但也不是万能钥匙。加州大学伯克利分校教授、数字取证领域代表人物 Hany Farid 长期对此持谨慎态度。他在多次公开演讲中表达过同一个判断:水印能在合作生态里提供”提示”,但任何对手只要做一次开源模型重绘或 GAN 翻译,水印信号就会被抹掉。Farid 认为真正的解法是平台侧的来源链路而不是模型侧的痕迹。
OpenAI 这次选择跟 Google 互通,至少在合作端是有进展的。两家把检测能力开放给主流新闻机构和事实核查组织,这部分以 API 形式提供,处理速度被报道称单张约 200 毫秒。BBC 验证团队、AFP Fact Check 已经被列为早期接入方。
检测器永远落后于生成器
把这套工具放回到现实场景里看,攻防是不对称的。生成端只需要把模型权重对外发一份就够了,那些不写元数据、不打水印的开源模型,在 Hugging Face 上每周都有新增。检测端却要持续追着每个新模型采样、做对抗训练、维护检测器。OpenAI 在博客里也承认 SynthID 对”针对性扰动”无能为力。
真正值得肯定的是这套工具不再把”安全”和”开放”对立起来。OpenAI 把检测 API 免费给到新闻机构,把元数据格式交给中立的 C2PA 联盟,这比之前那种”我们有内部检测器但不开放”的做法务实得多。短期内它解决不了深伪带来的信任问题,但至少给认真做核查的人多了一条工具链。能不能起作用,要看社交平台跟不跟。
参考链接: