新聞 > 科教 > 正文

李彥宏內部講話曝光 給開源大模型潑了盆冷水

4月11日,第一財經記者獲悉,一則李彥宏內部講話流出。在內部講話中,李彥宏對大模型開源與閉源的路線選擇以及AI創業者應該專注模型還是應用等業界焦點話題,發表了自己的看法。

在講話中,李彥宏給開源大模型潑了盆冷水,稱模型開源的意義不大,它們往往是做小規模的驗證應用,並沒有經歷大算力的驗證。此外他還談到AI創業的話題,認為創業者的核心競爭力本就不應該是模型本身,而是應該去卷應用本身。

為什麼不開源?

目前的大模型行業,有以OpenAI GPT-4為代表的閉源大模型和以Meta Llma2為代表的開源大模型兩股力量。後者正在快速地拉攏"朋友圈",對前者形成有力衝擊。"OpenAI不OPEN",也成為業界對於明星公司OpenAI"不開源"的一句吐槽。儘管這家公司分享了大量GPT-4的基準、測試結果和生動的演示,但對用於訓練該系統的數據、成本或用於創建它的具體硬件或方法等相關信息"守口如瓶",對於是否開源也沒有時間表。

作為國內大模型的較早入局者,百度也是選擇走閉源路線的一家。對於百度文心一言為什麼不開源,今日李彥宏表示,在一年前文心剛剛發佈的時候,圍繞是否開源,百度內部有過非常激烈的討論,最後決定是不開源。這是基於當時的判斷,大家市場上一定會有開源的模型,而且是不止一家會開源。"在這種情況下,多百度一家開源不多,少百度一家開源也不少。"

李彥宏談及目前大模型市場上主流的開源模型,如像Llama,Mistral其實都是有相當影響力的,國內的大模型智源、百川、阿里的通義也都是開源的,對百度而言,開源還得自己去維護一套開源的版本,這是不划算的。

不過,緊接着,李彥宏同時給開源大模型潑了盆冷水,稱"模型開源的意義其實不是很大,這些開源模型都是在外頭零零散散小規模地去做各種各樣的驗證應用,它沒有經過大算力的驗證。"

此外,他認為模型開源也不是一個眾人拾柴火焰高的情況。"這跟傳統的軟件開源比如Linux、安卓等等很不一樣,由於是模型帶來的開源,我們也不知道參數為什麼變成了那個樣子,這種情況下很難實現眾人拾柴火焰高。雖然Llama也鼓勵大家去貢獻各種各樣的數據、代碼,但是實際上大家明白最主要的開發者就是Meta這些人,它並不是一個真正由大家一起來協同開發的產品。"

他稱反觀閉源,是有真正的商業模式的,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才。"其實也很簡單,大家比較一下,比如矽谷有一個優秀的人才,他有OpenAI的offer,有Meta的offer,有Llama的offer,他會去哪兒?這是非常顯而易見的選擇。"

他稱,大家以為開源是免費的,在成本上有優勢,實際上也不是,閉源在成本上反而是有優勢的。因為只要是同等能力,閉源模型的推理成本一定是更低的,響應速度一定是更快的。反過來,同等參數的情況下,閉源模型的能力也是更強的。"今天不管是在中國也好、在美國也好,最強的基礎模型都是閉源的,而各種各樣的小模型、最好的小模型,都是通過大模型蒸餾來的。通過大模型降維做出來的模型就是更好的,這樣也會導致閉源在成本上、在效率上也會有優勢。"

圍繞開源閉源,業界一直爭論不斷。在大模型領域,如同移動互聯網時代以蘋果為代表的封閉模式和以谷歌安卓為代表的開放模式,大模型因其不確定性形成了開源模式和閉源模式同時推進的基本格局。

一位大模型從業者對第一財經記者表示,如今大模型行業遠不到一家壟斷或是一家獨大的局面,無論開源、閉源,每個公司都有自己的路線選擇,總有人相信"開源的力量"。開源可以降低AI大模型的使用門檻,因為開源大模型意味着無數開發者可以基於大模型來開發基礎設施工具和應用,有望加速下遊行業AI應用的開發效率、促進生態的蓬勃發展。同時,開源意味着更多的人可以審查它,識別並修復可能的問題,從而提升了安全性。

此前,百川智能CEO王小川在接受第一財經記者採訪時也曾談到開源與閉源之爭,王小川說,開源確實容易"建立人品","朋友多多的",讓大家迅速了解和評測;同時開源也是為商業化做準備,如果大家用起來覺得不錯,當需要更好的服務和更大的參數時,可以探索進一步的商業化路徑。

但是他認為,開源和閉源並不像手機中iOS或者安卓作業系統只能二選一,從tob角度,開源閉源其實都需要。他預計未來80%的企業會用到開源的大模型,因為閉源沒有辦法對產品做更好的適配,或者成本特別高,閉源可以給剩下的20%提供服務。二者不是競爭關係,而是在不同產品中互補的關係。

開源大模型對於開發者同樣有着重要意義。此前一位大模型開發者告訴第一財經記者:"首先是即便開源大模型參數不夠大,但如果在非常大的數據集上訓練模型,那麼在性能方面也可以與參數非常大的模型競爭;其次,是一些小型的企業可以用很少的預算和適量的數據將小模型微調到與大模型相媲美的程度。"

此外,由於開源模型支持不同的團隊在彼此的工作基礎上進行構建,因此開源模型的進步速度比封閉生態系統快得多。

AI創業者的核心競爭力不是模型本身

除了談開源閉源之外,李彥宏提到,對於AI創業者來說,核心競爭力本就不應該是模型本身。"這太耗資源了,而且需要非常長時間的堅持才能跑出來。創業者真正的優勢應該是在某一個領域的知識、數據。"

他認為,外界一些做模型的創業公司講的所謂的"雙輪驅動"不是一個好的模式。既做模型又做應用,勢必會分散精力。創業公司的精力和資源都是有限的,同時做兩件事情和只做一件事情哪個成功率更高是不言自明的。在任何情況下我們都非常講專注力,"力出一孔",當資源有限的時候更應該專注,而不是去搞所謂的"雙輪驅動"。

他舉個例子,假如說今天想找一個"黃色的無兜的男士泳褲",在任何一個今天的電商平台上都找不到,這種需求目前的技術是解決不了的,大模型如果有領域知識就可以解決,這就是靠領域知識能夠提供獨特價值的例子。市面上有這麼多模型,大的、小的、開源的、閉源的,在特定應用當中怎麼樣使用這些模型的組合,是有技巧的,這是創業者可以幹的事兒,是可以提供價值增益的。

他還提到創業者的擔心:如果用了文心或者閉源模型,做得好了就抄襲,巨頭把創業者的飯吃掉了。"大家去看一看,在移動時代,微信沒有去吃掉拼多多,滴滴也沒有變成騰訊的一部分,它們都各自提供了自己獨特的價值,有自己非常不一樣的競爭力,它們的興起都是依賴移動生態里的一個封閉平台——微信,但是它們並不怕微信去搶它的飯碗,所以沒有必要擔心基礎模型通吃AI的應用。"

事實上,李彥宏這番表態的背後,大型語言模型的開發是非常龐大且處於較為早期的階段,基於大模型開發出來的AI原生應用仍非常少。大模型本身是基礎底座,類似作業系統,最終開發者要依賴為數不多的大模型來開發出各種各樣的原生應用。

目前,已經有一大批創業者奔向AI創業的戰場,AI大模型有望從拼參數逐步進入到拼原生應用、拼產業落地的階段。業界預計,大模型下一個階段有望迎來應用層之戰。

此前百度表示開放一批經過全新重構的AI原生應用,並在內部展開內部"賽馬",所有產品都在基於原生思維進行重構。在應用層,此前科大訊飛、360等先後發佈了在工業、金融、教育、醫療、AI數字人等領域的應用產品,開放開發者接口;百川智能CEO王小川對記者透露,今年內部團隊開始部署C端超級應用,在他看來,落地和應用方面是中國創業者的強項。

責任編輯: 方尋  來源:第一財經 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2024/0412/2042662.html