新聞 > 科教 > 正文

全球AI研究年度排名出爐,中美差距巨大!

腦洞問題:如果只看兩個AI頂會,其他一概不管,那麼最厲害的是哪些國家、哪些機構、哪些企業?按這個路子做出一個排行榜的話,又會是什麼樣子?(不許說野榜!)

還別說,專注科技界的風險投資公司Thundermark Capital就年年做這個事,最近,這家公司又推出了他們一年一度的全球AI研究年度排名。

這次他們選擇的兩個頂會是:ICML2021和NeurIPS2021,一共3523篇論文(其中ICML為1184篇,NeurIPS為2339篇)。

不如一起來看看有沒有自己熟悉的名字?

2022年人工智能研究排名

Top50國家/地區

Top100全球大學

?由於篇幅有限,在表格中只列全球前20個AI研究排名的大學。部分大學表格內是縮寫(不一定嚴謹),後附全稱。?因為Thundermark Capital本身的失誤,上圖中把南洋理工大學標為中國的大學。相信新加坡的朋友們不會太介意……吧??

排名方法

這個排名的方法參考了Nature Index,這個指標的計算方法是這樣的:

為了收集一個國家、一個地區或一個機構對一篇文章的貢獻,並確保不會重複計算,Nature Index使用分數計算,綜合考慮到每篇文章的作者份額。

計入Nature Index的每篇文章總分為1,在每個人的貢獻相同的情況下,由所有作者平均分享。比如一篇文章有10個作者,那麼每個作者得到的分數為0.1。如果一位作者所屬的機構不只一家,作者的分數會平均分配給這些機構。

最終,一個研究機構的總分,是旗下所有作者分配給該機構分數的總和。

國家/地區分數的計算過程與此類似,但由於一些機構有海外實驗室,這些實驗室將被計入所在國家/地區的總分,因此計算過程比較複雜。

說完了Nature Index,來說說這份報告的分數計算。

其實和Nature Index基本相同,唯一的區別是,這份報告將企業或機構的海外實驗室的論文計入其總部所在的國家/地區,而不是其實際駐在國家/地區。

確實,這麼算可能會有爭議,但這種方法更好地反映了知識產權的分配和對總部(而不是對當地實驗室)的利益累積。

以DeepMind為例,這是一家位於英國的人工智能研究實驗室,2014年被總部位於美國的跨國公司谷歌收購。

按照上面的計算方式,DeepMind發表的論文會計入其目前的所有者——谷歌,也就是美國。這可能會讓英國的朋友們失望了。然而,僅憑會議論文集,在地圖上定位每個作者的位置過於複雜了,現在這個方法是唯一一致的作者身份處理方法。

希望這兩個AI頂會的組織者今後能進一步提供作者的詳細信息,這樣就可以排出兩個版本的榜單,一個是基於企業所有權結構的排名,另一個是基於作者所在地的排名。

舉一個具體例子。

如果一篇論文有五個作者——其中三個來自MIT,一個來自牛津大學,一個來自谷歌。首先,每個作者將得到五分之一的分數,即每人0.2分。因此,僅從這篇論文來看,MIT將獲得3*0.2=0.6分,牛津大學獲得0.2分,谷歌獲得0.2分。

由於MIT位於美國,所以美國的分數增加0.6分。同樣,由於牛津大學在英國,歐洲經濟區+瑞士+英國地區將增加0.2分。

最後,谷歌是一家總部設在美國的跨國公司,因此美國的分數將額外增加0.2,總共獲得0.8分。

如果一個作者附屬於多家不同機構,在計算時會把對應分數平均分給每個附屬機構。

比如上面說的這個例子,如果最後一位作者列出了兩個附屬機構,即谷歌和史丹福大學,那麼谷歌和史丹福大學都將獲得額外的0.2/2=0.1分。

從直觀的角度出發,谷歌的指數為200,可以解釋為谷歌在2021年的這兩個AI會議上發表了200篇完整的論文。

關於參考數據集,榜單發佈方認為,將ICML和NeurIPS的論文合併到同一個數據集中是公平的。

這兩個會議在頂級AI研究人員中的感知威望(可以理解為「口碑」)接近。從研究機構的參與度,以及論文接受率上看,這兩個會議的表現也在伯仲之間。(ICML2021接受率為21.5%,NeurIPS2021的接受率為20.1%)。

實際上,這份榜單選擇ICML和NeurIPS這兩個會議作為「機器學習」領域的評價標杆倒是有一定的道理。比如CVPR、ICCV這類頂會可能影響力更大,但它們都有明顯側重的子領域。

在中國計算機學會(CCF)發佈的「中國計算機學會推薦國際學術會議和期刊目錄」上,在人工智能子類別下共列出了7個A類會議,ICML和NeurIPS均榜上有名。

根據去年7月更新的谷歌學術指標( Google Scholar Metrics)對各行業頂會和期刊影響力的排名,NeurIPS和ICML和在「工程和計算機科學」類別中分別位列第4位和第7位。

在清華AMiner對計算機科學頂會的排行榜上,結果也差不多。NeurIPS排名第2,ICML位列第4.

?根據Guide2Research梳理的頂會排名,NeurIPS排在第2,而ICML則可以排到第6。

雖然說了這麼多,但綜合來看這套評價標準並不能稱得上有多嚴謹,但依然可以作為參考看上一看。

各國AI研究態勢簡析

正如讀者可見到的,在過去的兩年裏,中國在人工智能領域進行了大規模的研究,其論文出版指數每年增加了52%和53%--考慮到ICML和NeurIPS會議的競爭程度,這是一個非常令人印象深刻的成就。

因此,中國的頂級高校清華大學從兩年前的第15位上升到今天的第8位,超過了Facebook、UCLA、ETH、EPFL、普林斯頓和UT Austin等強大競爭者。

另一所中國頂級大學北京大學,其AI研究的分數也緊跟清華大學,其論文出版指數落後一兩年(目前為第16位)。

另一個巨大的進步來自於德國,在過去的兩年裏,德國的論文出版指數分別增加了42%和44%。

評分機構並未發現任何支撐此態勢的、單一的明星大學或公司(德國的入榜頂級機構是排名第42位的圖賓根大學)。

德國的AI研究增長勢頭,在地理上均勻分佈於德國出名的馬克斯-普朗克研究所及各地的技術大學間。

此外,韓國的論文出版指數在過去兩年中分別提高了64%和32%。它在AI研究方面的仍才實力現在與瑞士相當(並略微超過)。

順便提一下,韓國的地區鄰居新加坡(尚未進入排名前十)表現驚人,在過去兩年中,其論文出版指數提高了128%和55%,目前排名第11位。

按照這個速度,它可能會在短短几年內趕上日本(第10位)。

學術界與產業界佔總發表論文的百分比

中美兩國,誰將在AI界領先

今天,一場關於美國和中國在AI領域佔主導地位的戰略競賽狀況的激烈辯論正在進行。

2016年人工智能領域發生了兩件大事:

第一,谷歌的AlphaGo成為第一個在無讓子的情況下擊敗圍棋九段職業選手李世石的電腦程式;

第二,奧巴馬總統的政府發佈了一項關於AI未來方向和考慮的戰略,名為《為人工智能的未來做準備》。

作為回應,中國在2017年提出了《新一代人工智能發展規劃》,不僅提出了政策上的支持還有數十億美元的研發投資。

據Thundermark Capital分析,由於中國的這種協同努力,美國在AI方面的技術優勢一直在迅速消失:

2017年,美國對中國有11倍的領先優勢;到2019年,美國下降到7倍的領先優勢;2020年,美國只剩下6倍的領先優勢;在寫這篇文章時,美國的領先優勢是4倍。

此外,艾倫人工智能研究所的分析發現,在被引用次數最多的前10%的論文中,中國的作者比例穩步上升。

人們可能會說,未來十年美國在人工智能方面的競爭力看起來並不樂觀。

然而,Thundermark Capital認為,結果將取決於現代AI三個關鍵要素的進步的相互作用:算法、硬件和訓練數據,要想在該領域佔據主導地位,就必須把這三者都做好。

在未來幾年裏,美國仍會在AI算法方面擁有強大的領先優勢,其基礎是MIT、史丹福大學、CMU和加州大學伯克利分校等世界級大學幾十年的計算機科學進步。

此外,谷歌和Facebook等公司在AI學術會議上發表內部研究的開放性,為頂級AI研究者創造了一個繁榮的生態系統,他們現在在學術界和產業界之間無縫流動。

此外,美國是矽谷最初以矽為中心的定義的所在地,它一直處於硬件創新的前沿。

Thundermark Capital認為,在未來五到十年內,中國要想在先進的微處理器技術方面趕上美國是非常困難的,尤其是考慮到英特爾、AMD和英偉達所擁有的龐大專利組合的保護。

然而,當涉及到訓練數據的可用性時,美國的優勢是值得懷疑的。獲取數據是更廣泛的私隱與公共利益爭論的一部分,美國傾向於選擇前者,而中國則選擇後者。

今天在中國,人工智能從數以億計的街頭攝像頭中掃描人臉,閱讀數十億條微信信息,並分析數以百萬計的健康記錄。這種訓練數據的可用性,加上中國的14億人口,為中國創造了巨大的戰略優勢。

雖然難以得出結論,但作者仍然認為前兩個因素(算法和硬件)將超過最後一個因素(數據的可用性),美國將在未來幾年內保持其在AI能領域的領先地位。

最近,針對中國的進展,白宮宣佈為人工智能和量子計算等研究領域注資10億美元,以回應許多政策顧問的「美國在這些鄰域落後於中國」的擔憂。

作者介紹

Gleb Chuvpilo是一家投資於深度技術初創企業的風險投資公司Thundermark Capital的管理合伙人。

他擁有麻省理工學院計算機科學和人工智能實驗室的碩士學位,以及賓夕法尼亞大學沃頓商學院的金融和戰略管理MBA學位。

責任編輯: 夏雨荷  來源:新智元 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2022/0522/1751734.html