重磅發現：AI已開始自我進化＊阿波羅新聞網

6月5日，Anthropic發佈題為《When AI Builds Itself》的重磅論文，指出當前AI已出現自我進化、自我構建的跡象，提及「遞歸自我提升」概念，即AI未來可能完全自主設計開發自身繼任者。

論文披露，截至2026年5月，Claude已承擔Anthropic代碼庫中超過80%的合併代碼編寫工作，其在代碼生產、AI相關研究環節的能力正快速提升。

當地時間5月28日，Anthropic宣佈完成H輪650億美元融資，投後估值達9650億美元，成為全球估值最高的AI創企。該公司呼籲全球前沿AI實驗室協同暫停前沿人工智能發展，為社會結構與對齊研究留出跟進時間。

快科技6月5日消息，AI已經開始有自我進化和自我構建的跡象了！

這一大膽判斷，是剛剛Anthropic在最新的一篇重磅論文《When AI Builds Itself》中提出的。文章提到，如果這一趨勢持續發展並獲得足夠算力支撐，最終將指向能夠完全自主設計和開發自身繼任者的人工智能系統，這被稱為"遞歸自我提升"。

「我們還沒到那個階段，遞歸式自我提升也不是必然的。但這可能比大多數機構準備得更早到來。」

Anthropic呼籲，世界能夠選擇放緩或暫時暫停前沿人工智能的發展，以便社會結構和對齊研究跟上技術進步，將是件好事。

同時，Anthropic宣佈："Anthropic研究所將與外部利益相關者合作，開展研究，深入思考日益強大、可能自我改進的系統所帶來的影響，以及如何讓世界有能力對這項技術的未來發展做出深思熟慮的選擇。"

儘管Anthropic官方X賬號上補充澄清："這一切都不能保證遞歸自我提升即將到來。目前尚不清楚Claude是否具備研究判斷力——即選擇正確問題去解決的能力。但如果這些趨勢繼續下去，AI系統設計和構建自己的繼任者是合理的。這可能會在醫學、技術、經濟等方面為社會帶來革命性的改善，但也可能加劇對齊問題，最終導致失控。"

但論文中披露的一系列數據和事實，還是讓整個科技界感到了前所未有的震撼。因為這篇論文不是在預測遙遠的未來，而是在描述正在發生的現實。

順便提一嘴，當地時間5月28日，Anthropic宣佈完成H輪650億美元融資，投後估值達9650億美元，一舉超越OpenAI 8520億美元的估值，成為全球估值最高的AI創企。

作為當下全球AI行業雙寡頭之一、企業級大模型領域龍頭，Anthropic在商用大模型、代碼AI賽道份額穩居行業前列，也是全球前沿通用AI與AI安全規則的核心制定方，其技術結論與行業表態常年左右全球AI研發風向。

80%的Claude代碼，已經是Claude自己寫的

據Anthropic官方披露，截至2026年5月，Anthropic代碼庫中超過80%的合併代碼，都是由Claude自己編寫的。

要知道，就在一年多以前的2025年2月，Claude Code還只是一個研究預覽版，當時這個數字還停留在個位數。

短短15個月，AI就從一個偶爾提提建議的助手，變成了代碼生產的絕對主力。

這種轉變直接體現在了工程師的生產力上。論文顯示，在Anthropic成立的前四年（2021-2024年），每位工程師每天的代碼行數基本保持不變。

但從2025年開始，這條曲線突然向上拐了，當Claude不再只是建議代碼讓工程師複製粘貼，而是能夠直接運行代碼時，生產力開始爆發。到了2026年第二季度，這個斜率變得更加陡峭，普通工程師每天合併的代碼量已經是2024年的8倍。

當然，Anthropic也坦誠，代碼行數是一個不完美的衡量標準，它只看數量不看質量，8倍的數字很可能高估了真實的生產力提升。

2026年3月對130名研究團隊員工的調查顯示，中位數受訪者估計使用Mythos Preview後，自身產出約為不使用任何AI工具時的4倍。但即便如此，這也是一個革命性的變化。現在的工程師，已經不再是主要的代碼編寫者，而是變成了代碼的指導者和審核者。

更可怕的是，Claude寫的代碼質量還在飛速提升。多數內部員工認為，2025年底Claude編寫的代碼質量仍遜於人類工程師，但到了今天，兩者已經基本持平。Anthropic預測，不出一年，Claude寫的代碼質量就會全面超過人類。

這已經不是理論了，而是正在發生的事實。有Anthropic員工在內部表示：

"我大約一年前開始全力使用Claude，這是一段瘋狂的經歷，現在我已經有5個月沒有自己寫過一行代碼了。"

Claude不僅能寫代碼，還能大規模修復人類遺留的問題。

2026年4月，Claude一次性提交了800多個修復，將一類長期存在的API錯誤減少了1000倍。負責監督的工程師估計，人類完成同等工作量需要整整四年。甚至在代碼審查環節，Claude也已經超越了人類，自動審查系統可以發現人類工程師漏掉的約1/3會導致生產事故的bug。

在最開放、無明確規範的複雜工程任務上，Claude的成功率在2026年5月達到了76%，較六個月前提升了50個百分點。一個典型案例是，一次常規升級導致數萬個訓練任務崩潰，工程師只給了Claude一些文本內容和集群訪問權限，它就自主排查出了一個極其隱蔽的調試標誌問題，重現並修復了故障，整個過程只用了兩個小時，而人類通常需要兩到三天。

AI已經開始做AI研究了

如果說寫代碼還只是"體力活"，那麼做研究就是 AI真正開始挑戰人類智力邊界的標誌。

事實上，AI能力的增長速度本身就在加速。論文顯示，AI能夠可靠完成的任務時長，從最初每7個月翻一番，提升到了現在每4個月翻一番。2024年3月，Claude Opus3隻能完成人類約4分鐘的工作。一年後，Claude Sonnet3.7可以完成1.5小時的任務。又過了一年，Claude Opus4.6已經能連續工作12小時。

按此趨勢，2026年內AI就能完成需要人類數天的工作，2027年將能完成數周的任務。

這種能力提升在研究領域表現得尤為明顯。論文中披露了一個驚人的實驗，Anthropic給Claude一段訓練小型AI模型的代碼，讓它在保證正確性的前提下儘可能提速。2025年5月，Claude Opus4平均能實現3倍的速度提升；僅僅11個月後，Claude Mythos Preview就能實現52倍的速度提升。作為對比，一個熟練的人類研究員需要4到8小時才能達到4倍的速度。

在"執行明確指定的實驗"這個環節，Claude已經在不到一年的時間裏，從"非常有用"變成了"超越人類"。

更令人不安的是，Claude已經開始能夠獨立設計實驗了。今年4月，Anthropic展示了Claude端到端完成一個開放研究項目的能力。研究人員給了Claude一個 AI安全領域的開放問題："較弱的模型能否可靠地監督較強的模型？"，然後就放手讓它自己去解決。

在這個過程中，Claude自主提出假設、設計實驗、與並行的其他AI代理分享發現、不斷疊代。最終，兩名人類研究員花了大約一周時間，只彌補了23%的性能差距。而 Claude代理們用了800個累計小時和大約1.8萬美元的計算資源，彌補了97%的差距。

雖然人類仍然選擇了問題並制定了評分標準，但在這個框架內，所有的實驗都是Claude自己設計的。人類唯一有意義的角色，就是設定方向。

甚至在研究判斷這個人類最後的堡壘上，AI也在快速逼近。

Anthropic在官方X上公佈了一項關鍵數據："AI研究是一系列下一步決策。我們研究了人類研究者走錯路的會話，向Claude展示了會話到那個點為止的內容，然後問它下一步該怎麼做。Mythos Preview在64%的情況下做出了比人類更好的選擇，而2024年這個數字只有22%。"

要知道，日常的研究工作，本質上就是由無數個這樣的"下一步該做什麼"的決策組成的。

三種可能的未來

基於這些觀察，Anthropic描繪了三種可能的未來。

第一種是趨勢停滯。

所有的指數曲線最終都會變成S曲線，我們可能正在接近曲線的拐點。"研究品味"這種區分普通研究者和偉大研究者的能力，可能是無法通過簡單的算力和數據堆疊獲得的。或者，算力、能源、晶片製造等供應鏈問題會成為新的瓶頸。

但Anthropic認為這種可能性不大，因為目前所有可測量的能力都還在沿着同樣的指數曲線上升，還沒有看到任何彎曲的跡象。即便如此，即使AI能力凍結在當前水平，也足以引發巨大的社會變革。比如Project Glasswing項目中，Mythos Preview在短短几周內就發現了全球關鍵系統中上萬條高危和嚴重級別的軟件漏洞，使得網絡防禦的瓶頸已經從發現漏洞變成了足夠快地修補漏洞。

第二種是人類主導的加速發展。

在這個場景下，AI開發會變得高度自動化，但人類仍然掌握着研究方向的設定和結果的評判權。

每家公司的生產力都會獲得指數級提升，100人的公司可能能幹過去1萬人甚至10萬人的活。這會徹底改變知識工作的面貌，但也可能被用於有害的目的，比如大規模的監控和操縱。

第三種，也是最令人擔憂的一種，就是完全的遞歸自我提升。

如果技術趨勢繼續下去，AI系統最終將能夠設計和改進自己。

到那時，AI發展的速度將完全由算力的可用性決定，人類在開發過程中的角色將大幅減弱，主要精力會轉向對AI運行的"虛擬實驗室"進行監督、驗證和核查。

Anthropic坦率地承認，他們對於這個世界會是什麼樣子沒有很好的直覺。因為我們的整個經濟都是建立在人類和人類製造的工具之上的。

如果人類勞動不再具有競爭力，整個社會的運行方式都會發生根本性的改變。

呼籲全球暫停前沿AI研究

正是基於這樣的擔憂，Anthropic在論文中發出了一個不同尋常的呼籲，如果能夠有效地減緩這項技術的發展，給我們更多時間來應對其巨大的影響，那將是一件好事。

但Anthropic也清醒地認識到，單方面的暫停沒有意義，只會讓最不謹慎的參與者獲得技術領先優勢，最終讓所有人都更不安全。

真正有效的暫停，需要全球多個處於前沿的實驗室在相同的條件下同意停止，並且每個實驗室都能夠驗證其他實驗室確實已經停止了。