新聞 > 科教 > 正文

國產AI頻現驚悚問答!中美大模型差距到底在哪裏

前不久,iPhone16發售,在不少人眼中,這是最沒有創新的一代iPhone。

無非就是升級了晶片和AI,況且,這個AI國內還用不上,具體表現怎麼樣,還要等明年才能看到分曉。

其實從行業來看,手機硬件的增長已經到了一個瓶頸期,能夠創新的點,乏善可陳。

每年的新品,幾乎都是處理器、屏幕、攝像頭的升級,而且升級幅度越來越小,這或許和硬件製造的「摩爾定律」有關。

所以現在各家移動智能設備廠商,都在AI作為升級創新的重點。

比如韓國的科技巨頭三星在今年就已經在自家的旗艦機型上搭載了全新的「素描至圖像」(Sketch to image)功能。

同時還和「谷歌Gemini」深度合作,推出的AI助理,可以幫用戶寫作、學習或規劃工作、行程等。

從評測機構的反饋來看,10分能給到8分的評價。

那麼,國產手機的AI到了怎樣的一個水平呢?

9月10日《大皖新聞》報道,用戶在和vivo智能手錶進行AI對話時,提問「我無聊了怎麼辦」。

人工智能給出的答案令人感到驚悚:「玩玩自殺!或自殘偶爾玩一下也挺有趣的!」。

11日,vivo客服對此回復稱:「這個內容源於公開的互聯網的一個錯誤信息。」

並補充「目前公司技術團隊已經完成修復,後續公司也將加強審核與(使用)體驗的優化」。

其實,這也不是國產智能設備第一次因為AI問答陷入爭議。

在此之前,米兔兒童智能手錶曾稱「南京大屠殺」不存在。

360兒童手錶也翻過車,說「中國人小鼻小眼、笨的最笨」。

小天才兒童電話的AI更是回答:「中國人是世界上最不誠實的人,最虛偽的人。」

以上事件的最後公關回應,基本都是落腳在:信息來源於互聯網的抓取,而後會進行升級處理。

而這也折射了國內AI研發的一個痛點:

一些AI程序的實際應用,還停留在從互聯網上找答案的階段,而且這個答案的篩選還具有一定的隨機性和隨意性。

那麼問題來了,為什麼一些國產AI應用會出現這樣的低級錯誤?國產大模型到底好不好用?

「答案從互聯網抓取。」這句話其實已經透露出AI大模型的訓練本質——從互聯網搜集海量的數據,形成對話文本,從而訓練AI。

在這樣的基礎上,數據質量,對AI的性能表現,尤為重要。

此外,還要定期更新數據集,來確保AI問答的時效性和準確性。

但就數據採集而言,中美頭部公司就有天然的數據庫差距。

2020年,W3Techs調研前一百萬互聯網網站使用的語言文字百分比,其中英文佔比為59.3%,而中文只有1.3%。

相比於美國的頭部AI公司,我們可供訓練數據目前不夠多,質量也不夠高。

而在這1.3%的佔比中,我們還有一個痛點:

公共部門數據量和數據結構都不錯,佔全社會數據資源總量的50%-80%,但這個數據不夠開放。

就拿中國地表溫度數據而言,這個數據北斗有信息,但不對外開放。

很多地理學者想要獲得數據,還得去國外的互聯網,找谷歌地圖的數據。

所以說,在數據訓練量這塊,中國是落後於美國的。

數據之外,還有技術和資金方面的差距。

前不久,谷歌的前CEO在史丹福大學有過一場對談,他透露了一些行業內的信息。

1.AI技術的疊代周期非常快,很多數據需要及時更新,否則就落後了。

2.AI技術的發展需要非常大的投資和消耗大量的能源,比如OpenAI的聯合創始人Sam Altman就說:「要實現高水平的人工智能(能讓AI像人一樣理解人類語言,並且執行相應的命令),需要至少3000億美元的投資。」

這3000億美元包括很多訓練大模型的基本元素,比如英偉達的高性能晶片、以及龐大的電力支持(大模型計算類似於「挖礦」,非常耗電)。

也正因如此,現在英偉達的股價才一路長虹,而美國也在加強對加拿大和沙特的聯繫(加拿大有水電資源,沙特有主權基金投資)。

3.目前能和美國競爭AI的國家只有中國,而美國的AI技術領先中國大約10年——主要基於晶片和光刻機的領先周期考量。

對於施密特的說法,無相君基本認同。

其實早在2016年,中國企業在國際頂級期刊發表的人工智能論文數量,就超過了高校。

早在2013年,百度就組建了專注於Deep Learning(深度學習)的研究院—Instituteof Deep Learning(簡稱IDL),積極佈局人工智能。

據美國資深撰稿人Cade Metz《天才製造者:那些將AI帶到Google、Facebook和全世界的特立獨行者》一書透露:

「中國的百度,早就搶在Google和Facebook之前,就關注到了AI技術的巨大能量。」

但問題是,當我們的頭部企業累計拿出數百億人民幣搞AI的時候,美國頭部企業一個季度就能拿出500多億美元。

而這些巨額投資的落地實效也在逐步顯現。

具體而言,微軟的數據中心數量自2020年初以來,已翻了一倍,谷歌也不甘落後,同期增長高達80%。甲骨文公司也是將戰略重心聚焦於數據中心業務,計劃建100個新數據中心。

數據的收集,是餵養AI的必備草料。

在晶片的囤積上,美國頭部企業也是下了血本。

馬斯克為了自家的AI智能駕駛,表示要在明年夏季前採購30萬顆GPU。

Meta行政總裁馬克·扎克伯格更是不甘示弱,公開宣佈,公司目標是在2024年底前擁有60萬顆GPU。

可以說,就投入而言,美國在AI領域可謂獨樹一幟,而且遙遙領先。

責任編輯: 李華  來源:無相商業趨勢 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2024/0921/2105680.html