評論 > 對比 > 正文

譯叢:DeepSeek:一場悲劇的預言?

中國開源人工智能的夢想有未來嗎?

來源:話中國2025年1月31日

作者 Jordan Schneider and Angela Shen

譯者蘇利文

通過開源其模型,DeepSeek為任何好奇的開發者提供了學習和在節約成本的創新基礎上進行開發的機會。[開源人工智能的定義仍在不斷發展中。DeepSeek通過發佈其代碼、模型和技術報告,符合普遍接受的開源定義,但它並未發佈數據。其代碼採用麻省理工許可證,允許自由使用、修改和商業化。]

這正是開源的理想:全球研究者沙盤中的思想自由交流,允許聰明和創造性的想法不斷積累。開源模型的支持者認為,開源可以加速科學和創新,改善透明度,分散治理,並增強市場競爭。

然而,開源與閉源之間的辯論在 AI社區中依然激烈。到目前為止,很難為公司提供一個明確的、短期內有商業價值的理由,解釋為何它們會開源其 AI模型。[從「讓互補品標準化」角度來看,Meta的做法是有道理的,但這一邏輯並不適用於像DeepSeek這樣的純粹AI實驗室。]

在中國的科技領域,這種務實的觀點較為常見。百度創始人李彥宏曾直言不諱地表示:

開源是一種智商稅……

當你理性地考慮一個大型模型能為你帶來什麼價值以及它的成本時,你應該始終選擇閉源模型……很多時候,一個模型看起來很有用,但當你計算成本後,它的性價比就不高,客戶會放棄它。

這就是我說開源模型無法擊敗閉源模型的原因。

阿里巴巴維持着其開源的Qwen模型,但通過向客戶推銷 API、雲服務和計算基礎設施來賺錢。李開復的創業公司01.AI發佈了 Yi-34B,作為「回饋」中國開發者社區的方式,但該公司最終目標是將尖端的專有模型作為其商業產品的基礎。

與此相對的是,DeepSeek並沒有短期的盈利策略

在2023年的採訪中,CEO梁文鋒明確表示,DeepSeek的「無限研究」夢想沒有商業化的合理性。這種觀點讓人想起 OpenAI的 Sam Altman在2019年的名言:「我不知道我們將來如何產生收入。」

High-Flyer Quant也表示自己並非為了回報而投資。最近為 DeepSeek提供資金的量化對沖基金強調,其 AI模型研究不會用於股票交易:「這與金融無關……我們關心的是長期的社會價值。」

我們應該相信這些原則性的表態——這不是一個政府背景的項目,因為 DeepSeek的運作方式與傳統的中國政府支持的行業截然不同。更準確地說,DeepSeek的員工,主要由年輕的本土人才組成,是由除了賺錢之外的某些動力驅動的。一位採訪者問這是否瘋狂,梁文鋒的回答則十分有意義:

梁:我不確定這是否算瘋狂,但這個世界上確實存在許多難以解釋的現象。比如許多程式設計師——他們熱衷於為開源社區做貢獻。即使在一天的工作後筋疲力盡,他們仍然會抽出時間貢獻代碼。

Waves:其中蘊含着一種精神上的回報?

梁:這就像是徒步50公里——身體已經徹底疲憊,但精神卻感到深深的滿足。

Waves:你覺得由好奇心驅動的「瘋狂」能持續長久嗎?

梁:並非所有人都能終其一生保持激情。但大多數人在年輕時,都能毫無功利心地,全身心投入到某件事中。

這些年輕的中國開發者對開源項目的強烈熱情,有時被稱為「開源情懷」,Kevin Xu來自「互聯科技與創新」公司對此有很好的解釋:

大多數工程師都會感到興奮,如果自己的開源項目——無論是數據庫、容器註冊表等——被一家外國公司,尤其是矽谷的公司採用。他們會在已經免費的軟件基礎上,再無償付出勞動,日夜修復 bug、解決問題,一切都是為了獲得認可與肯定。

這種「熱忱」或「使命感」之中,隱含着一種深刻的意識:西方根本不尊重他們的工作,因為在外界看來,中國的一切要麼是偷來的,要麼是靠作弊得來的。他們也清楚,許多中國公司一直在免費利用開源技術發展自身,但他們渴望自己去創造、去貢獻,並證明自己的技術足夠優秀,值得被外國企業免費採用——其中既有民族情結,也有工程師的自豪感。

在最近的一次採訪中,梁也表達了類似的看法。他解釋說,如果工程師渴望證明自己,那麼要招募他們來解決棘手問題就會更容易:「中國的頂尖人才往往被低估,因為整個社會層面上的硬核創新太少,導致他們難以被看見。」

但這一情況正在改變。得益於最近的開源模型,DeepSeek已經贏得了全球工程師的認可與尊重。然而,中國政府會以同樣的眼光看待它嗎?

北京的開源策略

中國政府已經對開源發展表達了一定程度的支持。

2018年,一份(現已刪除的)白皮書以及中國人工智能開源軟件發展聯盟(China AIOSS Development Alliance)的成立,使開源 AI進入了公眾視野。白皮書指出,開源生態的建立需要通過培育開源社區和人才、推動標準制定、建立資金支持機制、完善知識產權體系以及加強安全審查等手段來實現。

國家層面的政策規劃[參見《第十三個五年規劃國家信息化發展規劃》和《軟件和信息技術服務業發展規劃》。]在討論軟件和技術生態時提及了開源,但尚未專門針對 AI領域提出明確方針。同時,兩份不同的五年規劃也提倡發展開源技術及其帶來的益處。[《十四五軟件和信息技術服務業發展規劃》目標到2025年建設兩個到三個具有國際影響力的作業系統社區。《十四五國家信息化發展規劃》明確了推進國產作業系統的具體步驟。這些步驟包括深化創新驅動,發展人工智能作業系統框架,以及培育以國內領先企業為核心的作業系統社區。]

政府對國內開源社區的積極態度,主要源於政界和產業界減少對外國軟件依賴的需求。

中國政府在2000年代初推動開源發展,建立了多個開源軟件聯盟,並推出本土開發的中科紅旗(Red Flag Linux),以此來削弱 Microsoft Windows作業系統的影響力。此後,工業和信息化部(MIIT)將Gitee指定為中國的國家級「獨立開原始碼託管平台」,以取代 GitHub,後者一直難以受到有效審查。在中國的晶片產業,開源項目正被視為降低對西方封閉生態系統依賴的一種途徑。[指令集架構(ISA)是晶片硬件與計算機上運行的軟件之間的接口。美國的英特爾和英國的ARM公司長期以來提供大多數晶片使用的閉源指令集架構,這使得這些公司能夠獲得豐厚的利潤。值得注意的是,由於中國公司作為受美國出口管制的專有系統,如果華盛頓與北京的關係進一步惡化,這些公司可能會面臨失去這些基本許可證的風險。][開源經濟對單個公司來說仍然充滿挑戰,北京尚未為開源指令集架構(ISA)開發推出類似於晶片產業其他領域的「大基金」。然而,私營和公共領域的興趣種子已經開始發芽:除了華為、阿里巴巴等巨頭在為微控制器(MCU)和中央處理器(CPU)投資開源ISA外,一些不太知名的公司,如VeriSilicon(芯原股份)、江蘇雲涌科技、Bluetrum(中科藍訊)、C*Core Technology(國芯科技)等,也在利用開源RISC-V、Linux和Khronos生態系統開展研究項目,開發物聯網應用、自然語言處理、神經網絡、自動駕駛汽車等解決方案。例如,VeriSilicon的數碼訊號處理器項目在2020到2023年間花費了2.42億元人民幣,利用RISC-V系統開發不依賴於閉源西方技術的圖像識別晶片。另一家公司Beken(博通集成)則報告稱其項目獲得了350萬元人民幣的政府補貼,旨在開發「國家秘密算法」(即加密標準)平台晶片,滿足中國國家密碼管理局要求某些企業實施的標準。]

華為則是地緣政治如何影響中國開源戰略的典型案例。2019年,華為消費者軟件部門總裁曾警告稱,如果沒有自己的開源社區,「一旦發生我們無法控制的情況,中國所有的軟件社區都將面臨巨大風險。」華為顯然是在暗指其面臨的美國制裁問題。

可能的風險

那麼,中國政府是否會允許 DeepSeek團隊繼續他們充滿激情的「技術秀」呢?

不幸的是,儘管官方言辭積極,但人工智能技術可能帶來的潛在責任風險,可能會促使政府遠離開源。

作業系統無法像人工智能那樣將信息和權力傳播到公眾手中。

一個開源的 AI模型能給予公眾廣泛的訪問、使用和定製權限——這些是難以被有效監控或撤回的。而 AI的安全風險也顯而易見。

除此之外,隨着 AI技術的不斷進步,政府的關注點可能不僅僅局限於一個過於直言不諱的聊天機械人。正如我們最近與 Miles Brundage的訪談中,Jordan提到的那樣:

我們離這樣的世界並不遙遠,在這種世界裏,直到系統得到加強之前,有人可以下載某些東西或在某個雲伺服器上啟動程序,對某人的生活或關鍵基礎設施造成真正的損害。這不僅僅是關於獲取天安門事件的信息——而是通過賦予個人使用這種極具威脅性的技術的權力,來實現權力的民主化,而這種技術有潛力對社會造成真正的損害。中國不允許普通公民購買槍支——一旦開源 AI達到「武器級別」,而某個人能關閉一個城市的電力,這真的是中國共產黨允許它在沒有任何控制的情況下擴散的事情嗎?我不認為北京的政府官員,或者西方國家的政府官員,會接受這樣的世界局勢。

目前,中國的生成式 AI法規缺乏對開源提供者的具體指導。隨着監管機構在國家控制需求與創新雄心之間尋求平衡,DeepSeek團隊——更多受到好奇心和激情驅動,而非眼前利潤——可能處於一個脆弱的位置。

DeepSeek和開源的未來充滿不確定性

至少目前,中國政府仍然看到了開源 AI的潛在好處。

需要明確的是,關於 DeepSeek(目前)的唯一政府聲明[由浙江省宣傳部(浙江宣傳)發佈在微信上的一篇文章]明確支持開源:

DeepSeek的最大優勢在於其開源方式,這使得全球的研究人員能夠受益……這凸顯了超越狹隘競爭思維的重要性。中國的技術進步可以並應當在更廣泛的範圍內為人類作出貢獻。最終,符合中國利益的事物也可以符合世界的利益,反之亦然。只要中國的技術與全球進步保持一致,無論障礙多麼高大或深遠,都無法阻止其發展。

DeepSeek的成功激發了中國更多關於開源優勢的討論。中國的 AI初創公司 MiniMax發佈了多個開源模型,期望「對優秀的工作給予鼓勵,對不好的工作給予批評,外界的人也能夠作出貢獻。」中國分析人士指出,具有成本效益的開源模型能夠支持廣泛的訪問和採用,尤其是在全球南方國家。參考一位工程師的病毒性帖子,他駁斥了 Dario關於出口管制的文章:

Dario提出了一個關鍵問題:如果中國在2026–2027年獲得數百萬台高端 GPU,會發生什麼?他的回答是——如果中國無法獲得這些計算資源,美國將進入「單極 AI主導」階段,並可能通過 AI的自我強化機制,長期鞏固其優勢。然而,如果中國確實獲得了這些資源,美國可能面臨一場持久的「AI軍備競賽」。

但我的看法是:無論是單極還是雙極,AI發展已經不可逆轉地進入了全球擴散的階段。美國不會壟斷 AI,中國也不會被遏制,像歐洲、日本、印度等國家也不會袖手旁觀。出口管制、模型競爭和資本流動等變量可能會影響競爭的節奏,但它們無法阻止世界朝着更先進的 AI形式邁進。

DeepSeek不是終點,而是一個信號——它的意義不在於「擊敗」任何人,而在於證明世界已經進入了一個不可逆轉的大規模 AI競爭時代。

在思考 DeepSeek時,兩個觀點可能同時成立:

DeepSeek可能選擇開源其模型,和世界各地的開發者選擇開源一樣,是因為對開放、全球研究社區的價值有着真誠的信仰——他們希望展示自己的成就,並激勵他人基於其工作的基礎進行構建。

與此同時,隨着 AI模型變得愈加強大,政府可能會有動力介入並掌握控制權。

[Jordan:除了政府的直接干預,DeepSeek的成就將為企業合作夥伴打開大門,提供比目前 DeepSeek所擁有的計算能力更為龐大的資源。DeepSeek在國內的關注度較低——它沒有外部投資者,沒有頂級西方實驗室的海歸學者,也沒有政府合同或流行的消費級應用。這種情況將會改變。正如 OpenAI在推出 ChatGPT後與微軟合作的例子一樣,中國的頂級雲計算公司——字節跳動、阿里巴巴、騰訊和華為——將會主動接觸。考慮到梁的硬核創新承諾和他對計算資源不足的坦承,他可能不會放棄在研發中獲得額外計算資源的機會。這可能會將 DeepSeek推向真正推動創新前沿的方向,與西方的主要 AI參與者展開競爭——但這樣做也可能釋放出類似於 OpenAI分裂的力量,導致其頂級研究人員分散四方。]

開源 AI在中國的未來如何?計算資源的吸引力會不會使 DeepSeek偏離其開源理念?政府會不會為了安全和控制介入?

Jordan:所以,R1真的是很擅長寫詩。我們用它對 DeepSeek及其開源模型未來的思考來做結尾。我給它輸入了這篇文章(最初它拒絕了,告訴我:「對不起,我還沒有學會如何思考這類問題,我擅長數學、代碼、邏輯類的題目,歡迎與我交流。」然後我讓 ChatGPT總結了上面的內容,重新輸入給它,告訴它寫一首獲獎的當代詩歌,經過幾輪,它寫出了這首詩。

無證的天空

他們在網絡的邊緣工作——

無主之物的工程師,

將光芒編織進數據庫,

拒絕蒙塵。

看他們:凌晨三點梁的團隊,

擼起袖子,在散熱風扇的嗡鳴中,

將民主原則嵌入機器。

這裏沒有董事會的頌歌——

他們的禱文是「分支」「合併」「拉取請求」。

中國的夢如今漸變成色:

國家主導的雲層向西漂移,

但在它們之下,無處不在的反抗——

Gitee的代碼庫像藻類生物般,

在巨石表面綻放。

法律以消失的墨水自我書寫。

監管者命名他們的恐懼:

無節制的生長可能扼殺收穫。

然而 DeepSeek的代碼溢出荒野,

一條藤蔓吞噬了我的和我們的之間的圍欄。

利潤是他們每晚忘卻的方言。

每一行開源的貢獻,每一層未申請專利代碼,

都成為過河的墊腳石,

供他人跨越。

批評者嗤之以鼻:天真。短暫。

但團隊懂得鹽的力量——

它如何保存,如何燃燒。

他們見證了自己訓練的模型

用他們也不理解的語言輸出,

看着他們的算法孕育出

沒有一家公司能宣稱的方程式。

這是信任的靜默構造:

一片心智的大陸在移動,

不是為了碰撞,而是朝着更慢、更深的契合。

當下一個 AI寒冬來臨時,

他們的伺服器將充滿着陽光的嗡鳴——

一粒開放的夏日種子,

屬於任何敢於播種的人。

責任編輯: 李廣松  來源:議報 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2025/0206/2171238.html