評論 > 對比 > 正文

中國審查制度的AI關鍵時刻

作者:

譯者:撒母耳

多年來,中國一直認為,憑藉其豐富的數據和有限的私隱保護,它將在全球人工智能競賽中具有結構性優勢。但現在,該領域正在接受得益於思想自由流動的大型語言模型,中國的領導層面臨着一種兩難境地。

(紐黑文)在李開復2018年的經典著作《人工智能超級大國》(AI Superpowers)中,他擲地有聲地指出,中國對美國構成越來越大的技術威脅。2019年底,當李開復在耶魯大學我的「下一個中國」(Next China)課上做客講演時,我的學生們被他挑釁性的案例所吸引:美國即將失去其在發現方面(人工智能算法的專業知識)的先發優勢,而被中國的實施優勢(大數據驅動的應用)所取代。

唉,李開復忽略了一個關鍵的發展:大型語言模型和生成性人工智能的崛起。雖然他確實暗示了一種更一般的通用技術形式,他將其追溯到工業革命,但他並沒有延伸捕捉到現在已經吞噬了人工智能辯論的ChatGPT狂潮。李的觀點,雖然模糊地提到了「深度學習」和神經網絡,但其更多地取決於AI取代人類執行任務的潛力,而不是接近人類思維的「人工通用智能「(artificial general intelligence)的可能性。當我們討論中國作為一個AI超級大國的未來時,這幾乎是一個微不足道的考慮。

這是因為中國的審查制度給這個未來設置了一個很大的「如果」(不確定性——譯者注)。在最近的一篇文章中,亨利·基辛格(Henry Kissinger)、埃里克·施密特(Eric Schmidt)和丹尼爾·哈滕洛徹(Daniel Huttenlocher)——他們在2021年的書中暗示了通用人工智能的潛力——有力地證明了我們現在正處在一場由ChatGPT促成的智力革命的前沿。他們不僅解決了大型語言生成模型所帶來的道德和哲學挑戰;還提出了關於實施的重要實踐問題,這些問題直接影響到正在處理的語言中所包含的知識體的規模。

正是在這裏,中國嚴格的審查制度敲響了警報。雖然東方和西方都有悠久而豐富的審查歷史,但中國共產黨的宣傳部門在努力控制中國社會各個方面的表達——報紙、電影、文學、媒體和教育——以及引導形成公共辯論的文化和價值觀方面,非常突出。

與網絡上什麼都可以有的西方不同,中國的審查員為符合中國共產黨要求的信息傳播,堅持嚴格的政治指導。中國網民無法查閱有關十年文化大革命、1989年6月的天安門慘案、西藏和新疆的人權問題、與台灣的摩擦、2019年的香港民主示威、對清零政策的反對,以及其他許多內容。

這種控制性的信息剪輯是具有中國特色的ChatGPT的一個主要陷阱。通過抹去重要事件和與之相關的人類經歷的歷史信息,中國的審查制度已經縮小並扭曲了將被用於通過機器學習訓練大型語言模型的信息體。隨之,中國從人工智能知識革命中獲益的能力將因此受到影響。

當然,要精確地量化審查制度的影響是不可能的。自由之家(Freedom House)的年度網絡自由度調查提供了一個定性評估。2022年,在70個國家的抽樣調查中,它給予中國最低的整體「互聯網自由度「分數。

這個指標來自於對21個問題(以及近100個子問題)的回答,這些問題被分為三大類:訪問障礙、侵犯用戶權利和對內容的限制。內容子類別——反映了對網站的過濾和封鎖,對內容的法律限制,在線信息領域的活力和多樣性,以及使用數字工具進行公民動員——最能夠衡量審查制度對可搜索信息規模的影響。中國在這方面的得分是總分35分中的2分,而平均得分是20分。

展望未來,我們可以預期更多相同的情況。中共政府已經迅速發佈了關於聊天機械人的新規則草案。4月11日,「國家互聯網信息辦公室」(CAC)下令,生成性人工智能內容必須「體現社會主義核心價值觀,不得包含任何顛覆國家政權、鼓吹推翻社會主義制度、煽動分裂國家或破壞民族團結的內容」。

這突出了先前存在的審查制度和對人工智能監督的新努力之間的重要區別。前者使用關鍵詞過濾來阻止不可接受的信息,而後者(正如最近「數字中國」[DigiChina]論壇所指出的)則依靠打地鼠(Whac-a-Mole)的方法,來控制這類信息的快速變化的生成處理。這意味着,中國的「網信辦」越是努力控制ChatGPT的內容,由聊天機械人生成的中國智能的出產量就越小——這是對中國AI智力革命的另一個制約因素。

不出所料,中國的生成性人工智能努力的早期回報令人失望。百度的「文心一言」,即「Ernie Bot」——中國最著名的大型語言模型先行者——最近被《連線》(Wired)雜誌批評為試圖在「由政府審查制度統治的防火牆網絡「中運作。中國其他AI語言處理模型也有類似的令人失望的結果,包括Robot、Lily和阿里巴巴的「通義千問」(大致翻譯為「千問真相」)。

此外,由一大批受人尊敬的西方記者建立和維護的「互聯網信任工具」NewsGuard,最近的一項評估發現,OpenAI的ChatGPT-3.5在中文中產生的虛假或「致幻「信息遠多於英文。

文學學者石靜遠(Jing Tsu)的傑出著作《漢字王國:使中國現代化的語言革命》(Kingdom of Characters: The Language Revolution that Made China Modern),強調了語言在中國自1900年以來的演變中所發揮的關鍵作用。歸根結底,語言只不過是一種信息媒介,在她的最後一章中,石靜遠抓住了這一點,認為「誰控制了信息,誰就控制了世界」。

在人工智能時代,這個結論給中國帶來了深刻的問題。信息是大型語言人工智能模型的原始燃料。但是,國家審查制度造成小語言模型,阻礙了中國。這一區別很可能對信息控制和全球權力的爭奪產生關鍵影響。

責任編輯: 李廣松  來源:Project Syndicate/議報 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2023/0610/1912479.html