新聞 > 科教 > 正文

15:0大逆轉?人類業餘棋手完勝圍棋AI

大家或許知道,自那場著名的人機圍棋大戰——阿爾法狗vs李世石——以後,頂尖的人類職業棋手面對訓練成型的AI,已經毫無勝算。

現在國內商用的弈棋AI,如絕藝,如果把性能開到最大,基本上要讓人類兩子,才能打的有來有回。

但是,不久前,一位美國業餘(是指由業餘段位的)圍棋選手Kellin Pelrine,在與名為LeelaZero的AI公平對弈的情況下,連勝15盤。(實質上是14盤,有1盤作為測試,藉助了電腦)

LeelaZero的棋力基本與絕藝、星陣相當。

所以,這位Pelrine是人類圍棋史上前無古人的棋聖?

好吧,實際上他找到了當前圍棋AI的一個bug。

甚至這個漏洞也不是他自己找到的,而是通過AI。研究團隊開發了一個專門找bug的圍棋AI,讓它與另一款商用圍棋AI KataGo(棋力高於LeelaZero)下了上百萬盤棋,有目的地找漏洞,結果被他們找到了。

他們猜測,因為現在的圍棋AI的底層架構全來自DeepMind Alpha那一系列,所以這處bug,應該是普遍的。

具體漏洞是什麼?文章沒有細說。按照Kellin Pelrine的說法,漏洞不是那麼明顯,但知道後操作起來也不是很難(至少業餘中級棋手就可以做到)。

設計該項目的加利福尼亞研究公司Far AI的行政總裁Adam Gleave說:「針對系統,很容易找到人類玩家可利用的盲點。」

Pelrine使用的策略,大致上是慢慢將一塊大的「活棋」串在一起,同時用在其他角落的動作分散AI的注意力。 Pelrine說,在包圍圈近乎完成之前,AI都沒有意識到危機。

「但作為人類,很容易就能發現。」

加利福尼亞大學伯克利分校的計算機科學教授Stuart Russell說,在最先進的機器學習-神經網絡里發現了盲點,這揭示了深度學習系統的基本缺陷。

「這再次表明,我們太倉促了,不能將超人的智力賦予機器。」

Gleave說,可能是AI很少使用Pelrine所利用的戰術。

他補充說,當AI系統暴露於針對算法的「對抗性攻擊」時,通常可找到缺陷。儘管如此,「我們看到非常大的[AI]系統正在大規模部署,幾乎沒有安全驗證」。

有一說一,deepmind那一系下棋AI,從深度學習+對抗性網絡到監督學習再到強化學習,它最終是能「意識」到bug的。本質上就是為一個搜索樹剪枝的過程,如果連續幾千次都導向失敗的結果,它早晚能逐步回溯,找到剪錯的那一枝。如果當前商用的棋類AI已經定型,不再「學習」了,那就另說了。

責任編輯: zhongkang  來源:網易 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2023/0221/1869375.html