智能AI
morning
诺奖得主联手Claude,40轮对话证出12年物理猜想
2026-06-07
1 阅读
新智元
新智元报道 【新智元导读】 一道悬了12年没人证出来的物理猜想,诺贝尔物理学奖得主Giorgio Parisi把它交给了Claude,模型几乎自己推出了完整证明。 一篇诺奖得主的论文中,特意点名了Claude。 就在几天前,一篇理论物理论文挂上了arXiv,作者在论文中提到了Claude的Sonnet 4.6和Opus 4.7,说这个证明「基本上是Claude自己推出来的」。 https://arxiv.org/pdf/2606.03300 论文作者是Giorgio Parisi,2021年诺贝尔物理学奖得主。 诺奖委员会官方解释 他的获奖理由时,说他「发现了从原子到行星尺度的物理系统中,无序与涨落之间的相互作用」。 通俗地说, Parisi的 大部分时间 都在干一件事: 在看上去毫无规律的随机系统里,把背后藏着的隐秩序找出来,并且证明小到一块磁性材料、大到地球气候,都遵循同一套规律。 这次 他与合作者Francesco Zamponi要攻克的是阻塞(jamming)转变理论里一道悬了12年的硬骨头:一个叫a+b=1的等式。 数值上,它早就被验证到极高精度。可整整12年,没人能证明它为什么对。 更巧的是,这个等式恰恰建立在Parisi自己开创的理论里。 全复本对称破缺(full-RSB),是 Parisi在自旋玻璃和复杂无序系统研究中发展出的核心框架之一,也属于他后来获得诺奖所表彰的复杂系统理论贡献的重要组成部分。 这一次,它被证出来了,主力就是Claude的Opus 4.7。 在 40轮对话的 人机交互中, Claude回到了 Parisi 当年的理论框架,补上了那块理论证明的缺角。 这事传开后,Stability AI创始人Emad Mostaque转发了论文:「如果Claude连诺贝尔奖得主都用得上,那对你来说也足够好了。」 Parisi和Zamponi两人干脆 把他们与Claude的对话在网上公开了:Claude到底在哪一步帮了忙,哪一步又是人改的,任何人都逐段去翻。 https://zenodo.org/records/20478428 那么问题来了。 这道把诺奖得主卡了12年的题,到底难在哪? 在问题的解决过程中,Claude又是怎么一步步从打杂,变成承担证明任务的主攻的? 一个等式 让物理界等了12年 要掂量这件事的分量,得先知道a+b=1到底有多难搞。 2014年,包括Parisi、Zamponi在内的几位物理学家,发表了关于无穷维硬球阻塞理论的系列论文(学界简称CKPUZ)。他们在计算里发现,几个临界指数之间,似乎藏着一个干净利落的关系:a+b=1。 数值上,这个等式严丝合缝,但他们试了又试,就是给不出一个解析证明。论文里只能写道:观察到它成立,证不出来。 这一等,就是12年。 更要命的是,这个等式还把两套理论连在了一起:一边是fullRSB解里的「相空间边缘稳定性」,另一边是堆积体系里的「力学边缘稳定性」。 证明a+b=1,就等于证明这两种「边缘稳定」在无穷维理论里其实是同一回事。 能算到小数点后好几位都分毫不差,却没人能说清它为什么对,这个等式成了理论物理中的一桩悬案。 从Parisi 那份公开的对话中,为我们复现了 Claude是如何与他紧密配合,破解这桩悬案的。 从打杂到主攻 Claude主要干了什么 双方的配合, 一开始并不是直接奔着证明去的,而是从数值求解开始。 Parisi第一条提示词,是让Claude写一段C++ 代码,用打靶法(shooting method)求解一个非线性微分方程,精度希望达到 (10^{-10})。 这是一个程序员的体力活:把方程算出来,验证到足够高的精度。 Parisi要Claude写一段C++代码,用打靶法(shooting method)求解一个非线性微分方程,此时Claude还只是个程序员,干的是把方程算出来的体力活。 接下来很长一段,Claude都在干这种活:调代码、提精度,从普通双精度一路加到四精度,把数值结果一点点逼到小数点后十几位。 中途 Parisi 还把方程写错了一次,把其中一个函数写串了。Claude在这个错方程上反复尝试,甚至正确地指出它本身就无解,直到 Parisi 回过头才发现,是自己写串了函数。 真正的转折,出现在 Parisi 那句话之后:「我自己接下来能搞定了。你应该注意到a+b≈1精度极高。有人猜想这个关系是精确成立的。我要你做一个解析计算,证明它。」 人类把那个精度极高却始终没人证出的关系:a+c/2=1/2(即a+b=1),正式交给Claude,要它给出解析证明。 从这一刻起,Claude的角色变了。 它给出的证明,核心是构造了一个特殊的辅助函数,再经过两处并不显然的代数消去,得出一个关键恒等式。把这个恒等式和已知的物理条件一拼,结论就出来了:a=(1-c)/2,也就是a+b=1。 有意思的是,后来 Parisi 直接问Claude:你是怎么想到这个证明的? Claude回答道:这里没有什么灵光一现,那个关键的辅助函数,其实是从想要的结论反推出来的,是「一套相当系统的逆向推理,加上小心的计算」。 它还补了一句:「不浪漫的版本,往往更接近真相。」 Claude复盘自己是怎么想到证明的:先由数值结果锁定目标a+c/2=1/2,再反推出关键的测试函数ξ=fg,剩下的全是代数硬算。 在合作的后半部分,Claude所做的 并非在已知套路里填空,它参与的是数学结构本身的搜索和构造。 别急 人类科学家并没有出局 人类科学家并没有出局。 在Parisi公开的这份对话里,Claude的证明初稿一出来,人类并没有照单全收,而是指出了其中的错误,把方向重新拨了回来。 Claude的证明里有一步,要论证函数f恒不为负。它信心十足地用了一个极值原理的论证。 结果合作者Zamponi直接指出:这个论证是错的,在极小值处根本不存在矛盾。Claude也没犟,当场认错:「你的朋友是对的……我犯了一个符号错误。」 随后它一步步复盘,承认上界论证成立、下界论证确实失败。 合作者Zamponi(对话中署名FZ)直接指出Claude某步论证有误,Claude先承认「你的朋友是对的」。 认错之后,Claude逐步复盘自己错在哪:在极小值处,方程给出的结果其实与极小值条件相符,构不成它原以为的矛盾。 它承认「我犯了一个符号错误」,并标明上界论证成立(✓)、下界论证失败(✗)。这一步的漏洞,是人类发现的。 人机之间的纠错是双向的。 在另一处,是合作者算的一个渐近行为里带了个小错,反过来被Claude挑了出来,还顺手定位到出错的根源。 这更像两个同行在一块儿磨一个证明,而并非谁服务谁。 但真正决定性的,是人类重新定义了整个问题。 Parisi 提醒Claude:你根本证不出那个函数永远非负:因为这个方程的解不止一个,大多数解都会上下摆动、反复穿过零线,而你先前用打靶法挑中的,只是其中唯一不摆动、始终待在零线上方的那一个。所以问题从一开始就问偏了:不该问「它一定非负」,而该问「到底有没有一个始终非负的解」。 紧接着, Parisi 给出了破局的思路:别死磕那个极限方程,回到更上游的原始方程,重新定义一个随尺度演化的函数,只要证明这个演化过程不破