新聞 > 科教 > 正文

數學界地震!GPT-5幹了件大事

最近,兩位研究人員僅用一個周末,便藉助GPT-5解決了10個「百年懸案」級的埃爾德什難題。正如數學家陶哲軒所言,AI最有成效的應用是處理查文獻等耗時環節,將研究者解放出來專注於思考。這標誌着一種全新科研範式的到來,AI正成為重塑基礎科學、加速人類接近真理的強大工具。

科學研究,尤其是數學研究,真的要被AI徹底改變了。

兩位數學研究人員,利用GPT-5,只用一個周末就解決了10個「百年懸案」級的埃爾德什難題。

埃爾德什難題,又名為Erdös problems,是數學家埃爾德什生前留下的大約1000多個問題,此前人類只解決了部分。

上一周,前微軟副總裁,現OpenAI研究科學家Sebastien Bubeck第一次確認了這件事。

今天,其中的一名的研究人員Mark Sellke最終確認了細節。

他們「問了」GPT-5數千次,就找到了10個未解決的埃爾德什難題的求解方案。

並且GPT-5還在另外11個問題上,發現了顯著進展。

這種通過AI查詢搜索的研究範式可能徹底改變科學、數學等基礎學科的研究方法。

AI已經是數學家的大殺器,如果不用可能就面臨出局了。

其中,Bubeck特地提到GPT-5 Pro在文獻搜索方面的能力非常強大。

比如在問題339上,GPT-5 Pro經過搜索確認,其實有其他數學家20年前就解決了。

這種深層的文獻搜索能力,目前只有AI能夠做到。

就連陶哲軒也表示,AI正在改變數學研究。

陶哲軒:「中等能力」的AI是關鍵

就在最近,陶哲軒連發數條推文表示:

未來AI在數學上的最有成效應用,並不會來自最強大的模型去解最難的問題,而是來自「中等能力」的AI去處理那些瑣碎、耗時、但又不可或缺的研究環節。

比如幫數學家查文獻、整理筆記、驗證引用、歸檔資料——這些看起來「沒技術含量」的工作,恰恰是最適合AI的。

他用來說明和論證這個觀點的例子正是開頭所描述的埃爾德什難題。

在一個叫Erdős Problems的網站上,收錄着上千個以數學家保羅·埃爾德什命名的命題。

其中大約600個被標註為「未解決」。

就在幾天前,幾位數學志願者嘗試了一個新方法——用AI深度檢索工具重新搜索資料,解決Erdős Problems上的數學難題。

AI幫他們掃出一批疑似「已有解」的線索,人工再覆核、比對、閱讀。

短短几天,6個原本被列為「未解決」的問題被重新標記為「solved」:Problem339、Problem494、Problem621、Problem822、Problem903、Problem1043。

隨即,評論區熱鬧了起來。

有人驚訝:原來這些題早被解決,只是沒人找到;也有人開始主動使用同樣的工具,繼續篩查更多問題。

數學界第一次感受到:AI不一定幫你「解出」什麼,但能幫你「發現」被遺忘的答案。

陶哲軒在帖文中評價這一趨勢:

AI工具輸出不會直接進入網站,而是由人工覆核後更新。但過去幾天評論區明顯活躍了,出現了更多帶文獻連結的注釋,說明很多發現確實是AI輔助完成的。

陶哲軒本人在Github上也維護了一個Erdős Problems埃爾德什問題數據庫。

截止發稿前2個小時,陶哲軒才剛剛更新了數據庫。

這些問題中有些還有懸賞金。

比如懸賞10000美元的數論題。

這道題目已經2001年被Baker,Harman和Pintz解決。

然後在2025年9月28日正式確認,大概率就是在AI的幫助下找到的。

其他埃爾德什難題速覽

比如上面提到的問題339,GPT-5 Pro直接從浩如煙海的論文裏找到了「答案」。

就是2003年發佈的一篇論文。

問題621是一道圖論。

問題822為數論。

問題903是組合數學。

其他未解決的問題,有些還有懸賞金額。

如果你稍微懂點數學,也可以用GPT-5試着搜索一下。

以上這些難題,絕大部分問題可能已經在浩如煙海的論文中被前人解決了。

但在AI出現前,想通過人力來查遍所有論文是不現實的。

從查文獻開始,AI正悄悄重塑數學研究

在數學研究里,查文獻一直是最讓人頭疼的環節之一。

如果問題有清晰的名字、固定的研究圈子,那還好。隨便搜一篇關鍵論文,順着引用鏈往前往後查,就能很快摸清全貌。

可很多問題壓根沒有標準名稱。

有的埋在幾十年前的期刊里,有的藏在不同學派、不同語言的論文中,還有的被研究者「順帶提了一嘴」,但沒出現在標題里。

陶哲軒說,這時候用傳統方法,就像在大海撈針。

哪怕你是專家,也得一篇篇點開、反覆確認。有時花幾天功夫,才發現看錯了方向。

AI則能跨語義、跨領域地掃描大規模文獻,用自然語言理解去捕捉相似概念。

比如輸入一個模糊的研究方向,AI就能自動聯想到各種近義的表達、不同領域的說法,從而找到那些人類肉眼容易忽略的論文

當然,陶哲軒也提醒:AI查文獻並不需要「完美命中」。

但只要在同樣的時間裏,能找到更多有用的線索、減少無效命中,它就已經贏了。

而且學者在學會使用之後,投入的時間成本會被多次使用「平攤」,越用越值。

在他看來,這種模式的意義不止是提效。它其實在重構科研的節奏:

AI的成功率不必是100%,它只要比傳統方法更高,就能帶來真正的生產力提升。

在傳統科研里,當研究者查遍資料、卻一無所獲時,這個過程通常不會寫進論文。

畢竟,沒人會在結論里說「我什麼都沒找到」。

一方面是擔心被誤會成「沒查仔細」;另一方面,是因為學術寫作習慣於只報告「成功」的結果。

但這樣一來,同一個「無結果」的搜索,可能會被不同的人重複幾十遍。

陶哲軒在帖子最後寫道:AI的系統化搜索,可能改變這種狀況。

因為當機器以同樣的標準批量檢索上百個問題時,「沒查到」也變成了可量化的數據。

例如,可以公開地寫:在36個問題中,24個找到了額外文獻,12個沒有。這樣的結果更透明,也能更準確反映已有文獻的分佈。

AI不僅幫人找到答案,也讓「沒有答案」成為有價值的發現。

它讓科研流程第一次具備了信息閉環:正向結果指向進步,反向結果避免浪費。

這或許才是AI帶來的真正文化變革,它讓科學回到它最樸素的樣子——誠實地呈現事實,不論好壞。

陶哲軒這一連串思考,看似在談AI,其實是在談「人類如何重新組織知識」。

AI不會創造真理,而是在於讓人類更快地接近真理。

它讓重複勞動變得可控,讓查不到結果也能成為信息;它不是研究者的競爭者,而是科研世界裏第一個真正的時間節省器。

它讓數學家不再被搜索、整理、驗證這些繁瑣工作拖住,而是能把注意力重新放回那件最重要的事——思考。

或許未來我們回望這一刻,會發現:人工智能沒有改變數學的本質,它只是讓數學回到了它該有的速度。

責任編輯: 時方  來源:新智元 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2025/1019/2293306.html