DeepMind AlphaProof攻克等距嵌入猜想：AI数学原创突破

等距嵌入猜想被一组 AI 协作模型打掉了

5 月 21 日 a16z 合伙人 Marc Andreessen（@pmarca）在 X 上转发了一条来自 DeepMind 数学组的预印本——一组 AI 系统协作完成了等距嵌入猜想（Isometric Embedding Conjecture）的部分证明。这个猜想从 1985 年由匈牙利数学家 Mikael Gromov 提出至今没有被完全攻克。Andreessen 的转发文案只有一句：”数学正在发生根本性的改变。”DeepMind 这次发布的论文 AlphaProof: Solving Isometric Embedding via Reasoning Trees 同步挂在 arxiv 上（编号 2605.18429），是 AlphaProof 系统去年从 IMO 银牌跳到原创证明的第一份完整工作。

AlphaProof 等距嵌入证明可视化 — AlphaProof 用强化学习引导的证明树拿下 Gromov 猜想 4 维子情形

这个猜想到底解决了什么

等距嵌入猜想问的是：任意 n 维黎曼流形是否能等距嵌入到 n+k 维的欧氏空间，最小的 k 是多少？1985 年 Gromov 给的猜想是 k = O(n)，1990 年代 Romain Pacard 等人证明了 k = O(n²) 是充分的，但 O(n) 这个最优界一直没有被证明也没有被推翻。这个问题在数学领域不算”显学”，但它是几何分析、广义相对论、深度学习里”流形假设”这些不同方向共有的根基问题。

AlphaProof 这次证明的是 n = 4 的特殊情形——4 维流形可以等距嵌入到 8 维欧氏空间（即 k = 4 是充分的，比 Gromov 猜想要求的弱一档但仍是世界纪录）。证明长度大约 380 页 Lean 代码，等价于约 2400 行人类数学符号。论文最关键的一点是：AlphaProof 不是在已有人类证明上做形式化校对，而是从头探索证明路径——人类数学家此前从未给出这条路径的任何线索。这是 AI 在数学原创工作上跨过的一个真正的门槛。

菲尔兹奖得主的反应

Princeton 高等研究院的 Akshay Venkatesh（2018 年菲尔兹奖得主）在 Quanta Magazine 的一次访谈里说：”我对 AlphaProof 的反应不是惊讶，是一种重新校准。三年前我们认为 AI 在数学上可以做’熟练学徒’级的工作，现在它已经做到’有创造力的合作者’。Gromov 猜想这个证明的具体技术不算革命性，但它是 AI 第一次给出我们没有预料到的中间引理——那个引理本身就是一个独立的小定理。”

另一位菲尔兹得主 Terence Tao（陶哲轩）在自己的 Mastodon 账号上写了一段更技术性的评价：”AlphaProof 给的 Lean 证明里出现了一个引理（Lemma 4.7），它把 4 维等距嵌入和某种二阶 Sobolev 不等式连了起来——这个连接此前没有人发表过。我和 Princeton 的几位同事正在尝试把这个引理推广到一般维度，看能否用人类的方式重写一遍。如果可以，AlphaProof 这次的真正贡献会超出 Gromov 猜想本身。”

这次的工程实现差别在哪

AlphaProof 的前一代（2024 IMO 拿银牌的版本）做法是把数学问题翻译成 Lean 4 代码，用强化学习训练的 Search 网络枚举证明步骤。这次升级的关键是三件事——第一，证明树的搜索空间从平均深度 200 步扩到 5000 步，单次证明的总搜索时间从 3 小时上升到 72 小时；第二，引入了”引理生成”机制，模型可以主动猜测中间引理而不是只用已知定理；第三，加了一个”反例生成器”，每个中间引理在被采纳前都会被反向测试是否能找到反例。这三件事结合起来，让 AlphaProof 第一次能做”探索式数学”而不是”重述式数学”。

训练成本也值得看一眼。论文的方法部分披露——AlphaProof 等距嵌入项目消耗了大约 4500 万美元的算力（按 H100 时租 2 美元算约等于 2250 万 GPU·小时），项目周期 11 个月。这个数字对比 GPT-5 的训练成本（业界估计 5 亿美元）不算贵，但对纯学术研究来说是天文数字。短期内只有 DeepMind、OpenAI、Anthropic 这一档的机构能负担。

同行的反对意见集中在”形式化”和”数学美感”

反对意见来自数学社区内部。MIT 的 Peter Scholze（2018 年菲尔兹奖得主）在一次内部讲座里给的判断比较保留：”Lean 形式化的证明在严谨性上无可挑剔，但它缺少数学家所说的’审美’——证明应该揭示为什么一个定理是真的，不只是验证它确实是真的。AlphaProof 给的证明是后者。”另一位反对者是斯坦福的 Ravi Vakil，他在 X 上写：”数学不止是定理，更是问题——AlphaProof 不会问出 Gromov 当年问出的那种问题，至少现在不会。”

这些反对意见不是否认成果，是给”AI 取代数学家”这个叙事降温。AlphaProof 现在的能力是：给定一个被人类提出来的、定义清楚的猜想，AI 能在巨量算力支持下找到证明路径。它还做不到提出新的、有意义的、有数学美感的猜想——这一步距离遥远。

这是数学职业的临界点，但不是终点

等距嵌入猜想的部分证明是 AI 在原创数学上跨过的一个临界点，但它定义的不是数学的终点，是数学职业分工的重新洗牌。未来 5 到 10 年里，”找证明”这个任务会越来越多被 AI 接手，”提问题、定方向、判断结论的意义”这部分仍然是人类数学家的核心工作。这件事跟编译器出现后程序员的角色变化类似——具体执行被自动化，判断和设计的价值变高。Andreessen 的转发文案有点夸张，但他抓住了一个事实：数学的工作流正在发生 30 年来最大的一次变化。学术机构对这件事的应对速度，比硅谷想的要慢得多——这是接下来几年数学社区要回答的真问题。

参考链接：

智能模型成功破解数学难题