新聞 > 科教 > 正文

Sora文本轉視頻功能太強?中國開始複製

Open AI的Sora文本轉視頻功能,在這段時間一直是熱點,引起了全球的關注。Open AI又給全球放了一個超大的衛星,從Sora這個文字轉視頻的AI功能來看,效果之出色的確出乎所有人的意料。中國用戶和從業者無論是有着震驚、羨慕、質疑或者不屑的態度,但在AI應用層面都得承認,海外的確是比中國要強出很多。不過中國從業者現在也開始準備複製Sora的文本轉視頻功能,而且已經取得了一些成效。

根據中國媒體的報道,北京大學的研究人員和深圳一家名為Rabbitpre的人工智能公司合作,啟動了一個名為Open-Sora的項目,這個項目的目標是在開源社區的幫助下創建OpenAI文本轉視頻模型Sora的一個版本,該版本更易於使用且更具可擴展性。

這顯然是中國AI從業者想要跟上國外步伐的一個舉措,而且開起來還是個開源項目,這更具有道德的高度以及可操作性,剩下的問題就是能不能成功了。

作為一個開源項目,整個項目當然會放在GitHub頁面,不過略顯諷刺的是,這雖然是中國AI從業者的項目,但GitHub頁面我們都知道不是那麼容易被國人訪問的,雖然我們自己倒清楚,要玩這類項目的人應該不會被這個問題難住……據悉Open-Sora這個項目開發了一個由三部分組成的框架,並已經展示了四個重組視頻的演示,看起來還是有不小的進展。

這個開源項目未來的目標包括完善技術以生成更高解像度的視頻,並通過額外的數據和更多的圖形處理單元加強培訓,從而為服務提供更多的算力。這些步驟對於提高模型的性能並擴展其生成更詳細和更長視頻的能力至關重要。也就是說如果這個項目發展下去,依然需要高算力的AI晶片。

除了這個國人發起的開源項目以外,其實中國的幾大互聯網公司在文本轉視頻上,也有着自己的動作。根據我們的了解,包括騰訊和字節跳動都涉足了文本轉視頻的領域。騰訊AI發佈了一個名為VideoCrafter2的軟件,這是一個開源視頻生成和編輯工具箱,能夠從文本生成視頻,不過時間僅限於兩秒;字節跳動的MagicVideo-V2則結合了各種模塊來創建端到端視頻生成管道。應該說中國的廠商們其實都在努力,但差距的確還是比較大。

對於中國文本轉視頻這部分的發展,不少人還是抱有期待,一些公司渴望利用文本到視頻的人工智能模型,如果有哪家公司推出相應的產品……但更多人還是對中國目前AI發展感到一些擔憂,畢竟AI項目需要大量的算力,這部分海外明顯強過中國太多,而且由於出口管制的存在,海外的高端AI晶片無法出口到中國,而中國自主研發的AI晶片在性能和產能都無法和海外相比,這可能會大大延緩中國AI技術的發展。

責任編輯: 李冬琪  來源:傑夫視點 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2024/0307/2027019.html