新聞 > 科教 > 正文

人類終於在圍棋上贏了AI!業餘棋手擊敗頂級AI…

圖片來源:pixabay

2016年,AlphaGo戰勝了前圍棋世界冠軍李世石,登上各大新聞頭條。這不免讓人想起1997年在國際象棋上戰勝人類的IBM深藍,但不同的是,國際象棋的棋盤是8×8,而圍棋的棋盤是19×19,每一步棋多出來的可能性讓棋局的可能性呈指數暴增,讓IBM深藍的窮舉策略變得不可能。但在蒙特卡洛樹和深度神經網絡的加持下,AI圍棋程序AlphaGo展現出了魔法一般的能力,讓人類無從招架。

隨着AlphaGo的勝利,AI對人類的威脅,不論是科幻中控制人類社會的AI失控,還是現實中的失業風險,都引起了越來越多的注意,這與現目前人們對ChatGPT和GPT-4的擔憂別無二致。不過,當時敗北的李世石卻發出了不一樣的聲音:「它的風格完全不同,和它對弈的體驗非同一般,我花了點時間才適應。AlphaGo讓我意識到,我在圍棋上還能繼續精進。」同時,幾個月前就輸給AlphaGo的歐洲圍棋冠軍選手樊麾也表示,與AlphaGo的對弈讓他對圍棋有了「完全不同」的看法,這在後來甚至提升了他的排名。

人工智能究竟有沒有改變頂級棋手的思考方式,這很難研究。但是幾十年來職業棋手對弈時的棋譜則為研究人員提供了寶貴的參考。3月13日在《美國科學院刊》上發表的一篇論文顯示,自從圍棋AI出現後,人類選手在圍棋競賽中的水平確實提高了

DeepMind首席科學家、AlphaGo項目負責人戴維·西爾弗(David Silver,並未參與此項研究)表示:「看到人類玩家能這麼快適應,並將新發現融入自己的對局中,真的令人驚訝。論文結果表明,人類能很快適應這些變化,並在此基礎上更進一步,提升自己。」

為了查明圍棋AI是否促使人類找到了新的圍棋策略,香港城市大學的助理教授申敏奎和同事使用了一個數據庫網站Games of Go on Download,其中收錄了1950至2021年期間580萬次棋局的棋譜。之所以從1950年開始記錄數據,是因為1950年是現代圍棋規則建立的那一年。

為了梳理580萬盤棋局,研究團隊必須創造一套程序來評估每一步決策的質量。研究團隊用到了人工智能系統KataGo,評估人類每一步棋的勝率,並將它和AI決策的勝率進行比較,並以此評判人類棋手每一步棋的水平。DeepMind的AlphaGo並沒有公開,一般認為KataGo是和AlphaGo同等級的AI圍棋程序。

研究人員用AI勝率分析了2016年以前和2016年以後的數據。結果非常明顯,在AI擊敗人類圍棋冠軍之前的66年裏,人類的決策水平在AI看來保持一致,或者說停滯不前,而在2016年AlphaGo的勝利後,人類棋手的決策質量開始攀升——人類雖然可能下不過圍棋AI,但在圍棋AI的指導下,人類圍棋選手的決策質量也在不斷攀升

掌握了這些數據,研究人員又開發出了一種方法,來查明人類棋手下出的棋中,究竟哪一步是新穎的——這指的是這種下法沒有出現在以前的對弈記錄中。在圍棋對弈的創新型分析中,研究人員跟蹤了每局棋的前60手,並在新下法出現時進行標記。比如,如果一場比賽中到第9手時才和傳統下法出現差異,而另一場比賽中到第15手才出現差異,那麼前一場比賽就比另一場比賽更多變、更新奇。

結果顯示,在2016年之後,人類棋手的下法更多變了。而且有趣的是,在2016年之前,大多數新穎的下法往往會降低整體的勝率;而2016年之後則反了過來——新穎的下法反而會提升整體勝率。很顯然,單純的「背AI棋譜」並不能達成這樣的效果,AI真的幫人類找到了更科學的下棋方法。

但情況在最近發生了轉變。最近,美國棋手凱琳·佩林(Kellin Pelrine)站了出來,他並非專業棋手,甚至也不是頂尖業餘棋手,卻能和頂級圍棋AI取得14:1的戰績。

他所用下法是一種專用於對抗AI的方法,如果用這種方法和人類玩家對弈,你一定會輸得很慘。並且,最令人失望的是,就連這種專門針對AI的下法,也是由電腦程式算出來的。

美國加州科技公司FAR AI的行政總裁亞當·格利夫(Adam Gleave)設計了這個程序,他表示:「開發這套系統出乎意料的容易。」他補充道,該軟件與頂級圍棋AI KataGo進行了超過100萬場對局,就是為了找到人類棋手可以利用的盲點。

這個由電腦程式找到的對抗AI的策略是這樣的:慢慢地在棋盤外圈連起來一連串棋子,試圖將這一串棋子圍成一個大「包圍圈」,同時,在棋盤的其他角落下一些分散的棋子來分散AI的注意力。使用這種策略,AI很難發現你已經悄悄圍起來了一大片區域,最終你能通過這種方法佔據更多目,戰勝不可一世的圍棋AI。

但是如果你用這種方式來和人類棋手對弈,對方大概率會覺得你是一個剛剛掌握圍棋規則的新手,只想過來隨便玩玩。畢竟這種下法的目的太明顯了——就是想用棋子圍起來一大片區域。只要對方掌握了基本的圍棋規則,用這種下法基本就沒有勝率。因為只要你的「包圍圈」還沒有合攏,對方就能在幾手棋內輕鬆破解整個包圍圈。這時,因為你在包圍圈上浪費了太多棋子,已經不可能再贏得這場比賽了。

但AI就是識別不出潛在的危險,也無法在包圍圈合攏前破解整個包圍圈。當然,在棋盤的其他角落分散下一些棋子來吸引AI的注意還是需要一些水平的。據佩林的說法,至少也要是比較強的愛好者才能用這種辦法戰勝AI。

研究人員表示,KataGo之所以失手,可能是因為在它的對抗性演練中,並沒有經歷過足夠多的此類下法——或者說,這種製造「包圍圈」的下法往往在剛開始時就因為浪費棋子太多,而被認為註定落敗,所以圍棋AI也沒有意識到如果讓「包圍圈」合圍,自己就會落敗。

AlphaGo的出現讓人類圍棋水平快速提升,申敏奎表示:「我們不應將人工智能視作人類的威脅,而是一種能增強我們能力的寶貴工具」。在ChatGPT和GPT-4爆火的今天,這種觀點能給人更多希望。

但是,這一切並非沒有風險,就像在AI已經統治圍棋界的今天,仍有一部分在人類看來完全不成立的下法卻能戰勝AI。亞當·格利夫表示:「我們能看到,非常龐大的AI系統在幾乎沒有被驗證的情況下就被大規模部署了。」這究竟給我們帶來了更多的便利,還是帶來了更多的風險,誰都無法回答這個問題。

責任編輯: 夏雨荷  來源:環球科學 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2023/0322/1880113.html