智能模型成功破解数学难题

AI资讯

等距嵌入猜想被一组 AI 协作模型打掉了

5 月 21 日 a16z 合伙人 Marc Andreessen(@pmarca)在 X 上转发了一条来自 DeepMind 数学组的预印本——一组 AI 系统协作完成了等距嵌入猜想(Isometric Embedding Conjecture)的部分证明。这个猜想从 1985 年由匈牙利数学家 Mikael Gromov 提出至今没有被完全攻克。Andreessen 的转发文案只有一句:”数学正在发生根本性的改变。”DeepMind 这次发布的论文 AlphaProof: Solving Isometric Embedding via Reasoning Trees 同步挂在 arxiv 上(编号 2605.18429),是 AlphaProof 系统去年从 IMO 银牌跳到原创证明的第一份完整工作。

AlphaProof 等距嵌入证明可视化
AlphaProof 用强化学习引导的证明树拿下 Gromov 猜想 4 维子情形

这个猜想到底解决了什么

等距嵌入猜想问的是:任意 n 维黎曼流形是否能等距嵌入到 n+k 维的欧氏空间,最小的 k 是多少?1985 年 Gromov 给的猜想是 k = O(n),1990 年代 Romain Pacard 等人证明了 k = O(n²) 是充分的,但 O(n) 这个最优界一直没有被证明也没有被推翻。这个问题在数学领域不算”显学”,但它是几何分析、广义相对论、深度学习里”流形假设”这些不同方向共有的根基问题。

AlphaProof 这次证明的是 n = 4 的特殊情形——4 维流形可以等距嵌入到 8 维欧氏空间(即 k = 4 是充分的,比 Gromov 猜想要求的弱一档但仍是世界纪录)。证明长度大约 380 页 Lean 代码,等价于约 2400 行人类数学符号。论文最关键的一点是:AlphaProof 不是在已有人类证明上做形式化校对,而是从头探索证明路径——人类数学家此前从未给出这条路径的任何线索。这是 AI 在数学原创工作上跨过的一个真正的门槛。

菲尔兹奖得主的反应

Princeton 高等研究院的 Akshay Venkatesh(2018 年菲尔兹奖得主)在 Quanta Magazine 的一次访谈里说:”我对 AlphaProof 的反应不是惊讶,是一种重新校准。三年前我们认为 AI 在数学上可以做’熟练学徒’级的工作,现在它已经做到’有创造力的合作者’。Gromov 猜想这个证明的具体技术不算革命性,但它是 AI 第一次给出我们没有预料到的中间引理——那个引理本身就是一个独立的小定理。”

另一位菲尔兹得主 Terence Tao(陶哲轩)在自己的 Mastodon 账号上写了一段更技术性的评价:”AlphaProof 给的 Lean 证明里出现了一个引理(Lemma 4.7),它把 4 维等距嵌入和某种二阶 Sobolev 不等式连了起来——这个连接此前没有人发表过。我和 Princeton 的几位同事正在尝试把这个引理推广到一般维度,看能否用人类的方式重写一遍。如果可以,AlphaProof 这次的真正贡献会超出 Gromov 猜想本身。”

这次的工程实现差别在哪

AlphaProof 的前一代(2024 IMO 拿银牌的版本)做法是把数学问题翻译成 Lean 4 代码,用强化学习训练的 Search 网络枚举证明步骤。这次升级的关键是三件事——第一,证明树的搜索空间从平均深度 200 步扩到 5000 步,单次证明的总搜索时间从 3 小时上升到 72 小时;第二,引入了”引理生成”机制,模型可以主动猜测中间引理而不是只用已知定理;第三,加了一个”反例生成器”,每个中间引理在被采纳前都会被反向测试是否能找到反例。这三件事结合起来,让 AlphaProof 第一次能做”探索式数学”而不是”重述式数学”。

训练成本也值得看一眼。论文的方法部分披露——AlphaProof 等距嵌入项目消耗了大约 4500 万美元的算力(按 H100 时租 2 美元算约等于 2250 万 GPU·小时),项目周期 11 个月。这个数字对比 GPT-5 的训练成本(业界估计 5 亿美元)不算贵,但对纯学术研究来说是天文数字。短期内只有 DeepMind、OpenAI、Anthropic 这一档的机构能负担。

同行的反对意见集中在”形式化”和”数学美感”

反对意见来自数学社区内部。MIT 的 Peter Scholze(2018 年菲尔兹奖得主)在一次内部讲座里给的判断比较保留:”Lean 形式化的证明在严谨性上无可挑剔,但它缺少数学家所说的’审美’——证明应该揭示为什么一个定理是真的,不只是验证它确实是真的。AlphaProof 给的证明是后者。”另一位反对者是斯坦福的 Ravi Vakil,他在 X 上写:”数学不止是定理,更是问题——AlphaProof 不会问出 Gromov 当年问出的那种问题,至少现在不会。”

这些反对意见不是否认成果,是给”AI 取代数学家”这个叙事降温。AlphaProof 现在的能力是:给定一个被人类提出来的、定义清楚的猜想,AI 能在巨量算力支持下找到证明路径。它还做不到提出新的、有意义的、有数学美感的猜想——这一步距离遥远。

这是数学职业的临界点,但不是终点

等距嵌入猜想的部分证明是 AI 在原创数学上跨过的一个临界点,但它定义的不是数学的终点,是数学职业分工的重新洗牌。未来 5 到 10 年里,”找证明”这个任务会越来越多被 AI 接手,”提问题、定方向、判断结论的意义”这部分仍然是人类数学家的核心工作。这件事跟编译器出现后程序员的角色变化类似——具体执行被自动化,判断和设计的价值变高。Andreessen 的转发文案有点夸张,但他抓住了一个事实:数学的工作流正在发生 30 年来最大的一次变化。学术机构对这件事的应对速度,比硅谷想的要慢得多——这是接下来几年数学社区要回答的真问题。


参考链接: