OpenAI 推理模型破解数学难题

AI资讯
OpenAI 推理模型破解数学难题

OpenAI 一个内部代号 “goblin” 的推理模型,被宣布解决了保罗·埃尔德什 1946 年提出的平面单位距离猜想等长期未决数学难题。消息来自社区帐号 yishilvao 5 月 22 日的一条 24H 动态汇总,原文同时点出 Google DeepMind 团队的 “Advancing Mathematics Research with AI-Driven Formal Proof Search” 论文也在同一周登场。两件事撞在一起,把 AI 在形式化证明上的存在感拉到一个新水位。

埃尔德什单位距离问题为什么是个硬骨头

这个猜想问的是 n 个点在平面上、点对距离恰好为 1 的最大可能数量是多少。埃尔德什 1946 年给出上下界,从那以后下界推进缓慢,每一次哪怕是常数级别的改进都能进顶刊。它的难处在于完全是组合几何,几何直觉和代数操作要双向贯通,过去 80 年靠人脑啃也没完全吃下来。

OpenAI 这次给出的不是新上下界的小幅改进,按汇总描述是直接”攻克”——具体细节官方还没放出,需要等正式 writeup。但这一表述本身已经够刺激:意味着模型在长链条数学推理上稳定到能输出可被审稿的论证。

把搜索和推理拼起来的形式化证明走出实验室

同一时段 Google DeepMind 多机构合作的论文走的是另一条路线,把 AI 用作形式化证明搜索器。两边路线不同,结论却互相印证:基于推理模型的数学研究已经从论文里的 toy benchmark 跨过门槛,开始尝试真正的 open problem。

对学术圈来说这是个分岔口。过去几年,数学家对 AI 的态度还停留在”它能做高考题但碰不到研究问题”。当推理模型开始啃没人解决过的猜想,老问题清单就从纯人类竞技场变成了”模型 + 人类协作的待办列表”。

真正改变的是数学研究的合作姿态

我的判断是,这一波的关键不是 OpenAI 又赢了一场 demo,而是数学家被迫思考一个新问题——当一个模型能在你领域里给出非平凡的新结论时,作者署名怎么写、审稿怎么走、版权怎么算?这些问题以前可以模糊处理,因为 AI 输出还停在习题集水平,现在不能再回避了。

下一步值得盯的是 OpenAI 是否会公开 goblin 的推理 trace。如果只放结论不放过程,这件事的科学价值会大打折扣;如果放出可验证的形式化证明,那才是这次成果真正的分水岭。


参考资料:

  • 医士吕奥(@yishilvao)24H AI 与科技动态汇总,原推链接,2026-05-22