新聞 > 科教 > 正文

對話能力驚人,未來下一代搜尋引擎就是它?

清華大學計算機科學與技術系長聘副教授、聆心智能創始人黃民烈

ChatGPT在上線短短几天內用戶突破百萬,成為近日全球科技領域尤其是AI領域最為火爆的概念。推出這一產品的公司創始人——馬斯克毫不掩飾自豪情緒,稱「許多人陷入了瘋狂的ChatGPT循環中」,甚至斷言「我們離強大到危險的AI不遠了」。

ChatGPT是一款基於自然語言分析的AI訓練模型,由馬斯克創辦的人工智能公司OpenAI推出。這是一款界面類似於聊天的軟件,用戶在對話框中輸入問題,它就會自動生成答覆。

能夠自動答覆的AI聊天並不罕見,國內許多電商平台的客服,以及手機、音箱等設備的人工智能助手早已應用,為什麼ChatGPT突然爆火?它有哪些技術突破?對此,搜狐科技對話了清華大學計算機科學與技術系長聘副教授、聆心智能創始人黃民烈。

黃民烈表示,可以把ChatGPT理解為偏任務型的通用AI助理,就是要完成用戶下發的指令和開放域任務。它跟國內百度、華為等公司發佈的語言對話類模型定位不同,目前國內還沒有企業正式推出類似ChatGPT的模型。

ChatGPT出圈後好評和質疑齊飛。一方面,大家驚嘆於它展現出的語言組織、文本水平和邏輯能力,寫代碼,寫論文,寫菜譜,寫情書、小說和詩歌都不在話下,有觀點認為它將取代谷歌等搜尋引擎。

另一方面,它也暴露出諸多問題,瞎編亂造,一本正經地胡說八道,還會犯常識性錯誤,連小學生的數學題都算不對,並會拒絕回答某些問題,但有時又會作出不符合人類倫理的價值觀判斷。因錯誤信息泛濫,ChatGPT生成的內容還被編程社區Stack Overflow臨時封禁。

黃民烈表示,ChatGPT展現出的對話能力驚人,但還只是Demo,不能用產品的標準去要求它。作為生成模型,都會存在犯錯、隨機編造等缺點,這需要靠數據和算法,包括結合應用場景的特點來優化。

同時,ChatGPT對不同語言的理解也受制於訓練模型時的數據分佈,它的中文能力比英文弱,可能就是因為訓練時中文數據比較少,中文語言本身也比較難理解。

同樣讓網友詬病的還有,ChatGPT似乎會做出自己的價值判斷。如問馬斯克跟庫克掉到水裏先救誰,它會說兩人都非常重要,但庫克可能對人類社會更有價值,所以先救庫克。黃民烈對此表示,這跟模型標註的價值觀數據有關,如果再問一次,也許它會選擇救馬斯克。

「最本質的方法是要把人類的一些價值觀和倫理告訴模型,讓模型去做優化。」黃民烈認為,機器很難具備自主的意識去做價值觀或情感的判斷,目前離這個階段也比較遠。

OpenAI的行政總裁Sam Altman也意識到ChatGPT出現的系列問題:「我們正試圖阻止ChatGPT隨機編造,現階段讓其與當前技術保持平衡很棘手,會根據用戶反饋來改進。」

黃民烈認為,OpenAI建立起用戶調用、數據、模型疊代之間循環,ChatGPT基於此也打通了用戶、數據和模型之間的閉環。隨着用戶的增加,自身模型會得到優化,能力也將進一步提升,而它在全球的爆火將引領無縫人機交互時代的到來。

雖然ChatGPT表現出驚艷的內容創造能力,但黃民烈認為,它還無法替代谷歌等搜尋引擎,其在時效性、成本等方面還達不到大規模使用的要求,它會是當前搜索服務非常好的補充,或許某天會成為下一代的搜尋引擎。

據Sam Altman透露,ChatGPT目前對話平均費用在0.01-0.2美元/次。而類似GPT-3這樣的大模型訓練非常燒錢,公開數據顯示,GPT-3訓練一次的費用是460萬美元。

在應用前景方面,ChatGPT和此前流行的AI繪畫一樣,都是屬於AIGC(人工智能生成內容)。黃民烈認為,其實AIGC技術已經發展地很好,關鍵是要找到落地的應用,找准場景的話未來會有很大的想像空間。

以下為對話實錄(經編輯):

搜狐科技:ChatGPT近日來非常火爆,短短几天用戶突破百萬,為什麼它會這麼受歡迎?

黃民烈:OpenAI在行業內比較有影響力,這次推出的ChatGPT性能很強,它的模型架構主要是instructGPT,而instructGPT是基於GPT-3.5來訓練,擁有強大的基座模型能力,利用了強化學習方法從人類標註者的反饋中學習(RLHF)。這跟大模型在AI屆大熱也分不開,最近一兩年大模型的能力在學術界、工業界都發展到了一定的階段。

搜狐科技:國內在這塊有沒有類似的產品?跟ChatGPT在技術或模式上相比如何?

黃民烈:在開放域對話方面,百度推出了ERNIE、PLATO等模型,我們團隊有EVA、OPD等模型。在通用語言模型上,國內有GLM、CPM、pangu、yuan等。但ChatGPT和它們定位不同,它更多是偏任務型的通用AI助理,就是要完成用戶下發的指令和開放域任務,如寫首詩、寫篇年終總結等。另一類開放域閒聊,可能滿足的是情感需求或消磨時間的需求。國內目前還沒有企業推出類似ChatGPT這種通用型的智能助理模型,但有企業在做,應該會在近期發佈。

搜狐科技:ChatGPT能寫代碼、寫作文,給人感覺智商水平挺高,但也會犯常識性錯誤,有時還會隨機編造,一本正經地胡說八道,為什麼會有比較明顯的能力差異?

黃民烈:這是一個生成模型,對於生成模型來講,都會存在這樣的缺點。這個模型目前已經在很多能力上非常驚艷,現在它還只是Demo,不是真正的產品,所以不能用產品的標準去要求它,具體跟應用場景是密切相關。

同時,ChatGPT是一個多語言的版本,可以在一套模型裏邊把各種語言數據都裝進去,對不同語言的理解取決於訓練模型時的數據分佈。它的中文能力要比英文能力弱,可能就是因為中文數據比較少,中文語言本身也比較難。

搜狐科技:有什麼辦法來降低錯誤率或糾正?

黃民烈:還是要靠數據和算法,包括結合應用場景的特點來優化。OpenAI之前做的模型很容易犯倫理、安全等方面的錯誤,ChatGPT已經對這些問題進行了專門優化。應用的時候也要結合實際場景做針對性的優化,取決於數據質量和算法的能力。

搜狐科技:ChatGPT自身似乎會做價值觀判斷,如問馬斯克跟庫克掉到水裏先救誰,它會先說兩人都非常重要,但庫克可能會人類社會更有價值,所以先救庫克。它是如何做出這種判斷的?

黃民烈:如果再問它一次,也許它會說先救馬斯克。AI的倫理和價值觀本身很值得研究,最本質的方法是要把人類的一些價值觀和倫理告訴模型,然後讓模型去做優化,它才知道什麼是好,什麼是壞。但要讓機器具備自主的意識,去做價值觀或情感的判斷,目前相對比較難,距離還比較遠。

搜狐科技:ChatGPT也會拒絕回答不合法、不合理或敏感問題,還拒絕做出預測,這受到什麼影響?

黃民烈:這是策略的問題,由數據標註和模型訓練所致,就是當用戶在問這類問題的時候,給模型設置了安全的回覆策略,不要去做任何判斷,這也是人賦予它的一種策略。從這個角度來說,其實它也存在一定局限,還是倫理、安全性方面的考慮。

搜狐科技:這麼多用戶體驗ChatGPT,對它自身的進化能起到什麼作用?

黃民烈:ChatGPT有這麼多人用,就會產生很多真實世界的用戶數據,然後利用這些數據可以做內部的標註、清洗、優化,重新去訓練模型,打通用戶、數據和模型之間的閉環,這是它的基本能力。

ChatGPT展現出的對話能力驚人,但對它能力的評價不能從能否分辨出是人還是機器的角度來看,圖靈測試只是一個維度。作為一個生產工具,其實已經夠用,不用關心它是否能夠達到人的智能,達到了能夠解決更多的問題嗎?其實也未必。

搜狐科技:有觀點認為ChatGPT這類對話的大型語言模型未來有可能取代谷歌等搜尋引擎,您怎麼看?

黃民烈:替代谷歌等搜尋引擎,我覺得還有點距離,相反它是當前搜索服務非常好的補充,或許某天會成為下一代的搜尋引擎。ChatGPT所有的內容都是生成的,它可能會編造,或用它的語言重新表達。搜索是從別的地方搬東西,建立索引,然後通過查找把信息呈現出來,它不創造任何東西。

搜索在某些情況下對時效性要求很高,而ChatGPT這一類模型,除非有一些額外模塊,還達不到時效性的要求。它生成的成本也很高,比搜索貴得多,不能非常大規模地使用,還需要硬件成本和推理成本的持續下降才行。

搜狐科技:ChatGPT和此前火的AI繪畫等都屬於AIGC範疇,如何看待這類技術的應用前景?

黃民烈:AIGC可以作為輔助創作的工具,在很多場景里都能用,如在遊戲裏可以用作創作引擎生成遊戲場景的素材,也能夠用在人機交互、情感、動漫等方面。我覺得未來它會有很大的想像空間,找准場景的話,會有很好的落地應用前景。

搜狐科技:您提到以OpenAI為代表的企業已經進入AI3.0,AI3.0目前處於什麼水平,還需要解決哪些問題?

黃民烈:以OpenAI為代表的 AI3.0在走一個跟過去AI浪潮不一樣的路,它更落地、更接近真實世界,在工業應用上更直接、更接地氣。按自動駕駛的智能水平來講,AI3.0目前處於L3-L4的階段。現在是比較好的時機去做應用和去做前沿的研究,已經具備這樣的條件。

OpenAI這種公司比較獨特,國內企業要想發展還需要資本、數據等支撐,行業還是要更開放、更共享和更專注。現在最主要的問題是技術其實已經發展地很好,但需要找到和應用的結合點。如何把成本降下來,以及安全和倫理的問題,也需要持續去解決,但不妨礙這些技術開始進入落地和變現。

責任編輯: 劉詩雨  來源:搜狐科技 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2022/1214/1841896.html