光速打臉！谷歌承認Gemini演示視頻是剪輯版科教頻道|科教興國|教育新聞☀阿波羅新聞網

西方感恩節和聖誕節期間通常並不是推出新技術的合理時間，但對Alphabet的旗艦子公司谷歌而言，今年的這段時間也是絕望的時刻。

一年前，這家行動遲緩的搜索巨頭被推出ChatGPT的OpenAI甩在身後，它急於描繪出自己飛速前進的畫面。

在媒體報道稱谷歌將推遲發佈Gemini之後，該公司周三突然發佈Gemini。

Gemini是一款全新的人工智能模型，可以識別魔術中的技巧，並在會計認證考試中取得好成績。

谷歌發佈的演示視頻震驚了社交媒體，但從技術角度來看，谷歌仍被OpenAI甩在身後，正在努力地追趕。

谷歌對Gemini模型進行了嚴格的測試，並評估了它們在各種任務中的表現。從自然圖像、音頻和視頻理解，到數學推理等任務。

從谷歌發佈的數據上看，GeminiUltra是首個在大規模多任務語言理解數據集（MMLU）任務表現上優於人類專家的大模型，得分率高達90.0%。作為對比，人類專家的成績為89.8%，GPT4的成績為86.4%。MMLU數據集包含數學、物理、歷史、法律、醫學和倫理等57個科目，用於測試大模型的知識儲備和解決問題能力。

但在大多數基準測試中，GeminiUltra僅領先OpenAI的GPT-4模型幾個百分點。換句話說，谷歌最好的AI模型只是在OpenAI至少一年前完成的工作上做出了微小的改進。

如果像谷歌所說的那樣，GeminiUltra在明年1月初發佈，它可能不會在很長時間內保持頂級模型的地位。在谷歌拼命趕上OpenAI的這段時間裏，後者已經花了將近一年的時間來開發它的下一代人工智能模型GPT-5。

承認演示視頻為剪輯版本

在谷歌發佈的時長為6分鐘的演示視頻中，一個男子做出後仰並躲避的慢動作，Gemini馬上猜出這是表演《黑客帝國》中的場景；當人類拿起畫筆在一張紙上勾勒出一隻鴨子，並為它塗上了藍色，Gemini說這可不是鴨子常見的顏色；當人類用手指比劃剪刀石頭布的動作時，Gemini馬上猜出是在玩剪刀石頭布；當三個空杯並排放在桌子上，一張藍色紙團被塞進其中一個杯子裏，在人類一番眼花繚亂的操作後，Gemini準確地猜出：「紙團在最左邊的杯子裏！」這段視頻展示了谷歌DeepMind人工智能實驗室在過去幾年中訓練的推理能力，也是其他人工智能模型所沒有的。

在社交媒體X上發佈的這段視頻的跟帖中，技術專家稱Gemini的表現「令人瞠目結舌。」不過沃頓商學院管理學教授伊桑·莫里克（EthanMollick）經過比對實驗證明了，Gemini展示出的許多能力並不是獨一無二的，GPT-V早已具備了這些能力。

彭博專欄作家帕米·奧爾森（ParmyOlson）對此撰文指出，Gemini在視頻中似乎非常能幹了。但谷歌自己也承認，視頻是剪輯過的。該公司在YouTube的描述中表示：「為了演示的目的，為了簡潔起見，延遲被減少了，Gemini的輸出也被縮短了。」這引發出關於谷歌實際上給Gemini提前埋了多少提示的質疑。

這就是奧爾森發現的端倪。根據她的彭博文章，谷歌承認視頻演示不是實時進行的，而是使用原始鏡頭中的靜止圖像幀，然後寫出文本提示，讓Gemini做出回應。奧爾森寫道：「這與谷歌似乎暗示的完全不同：一個人可以在Gemini觀察並實時回應周圍世界的同時，與它進行流暢的語音對話。」奧爾森認為，谷歌的視頻就是在「炫耀」，目的是誤導人們，讓他們不知道Gemini仍然落後於OpenAI的GPT。

谷歌不同意奧爾森的觀點。當被問及演示的有效性時，谷歌發言人指出，DeepMind負責研究和深度學習的副總裁奧瑞奧·維納爾斯（OriolVinyals）的一篇帖子，解釋了該團隊如何製作視頻。維納爾斯：「視頻中所有的用戶提示和輸出都是真實的，為了簡潔起見被縮短了。」該視頻展示了使用Gemini構建的多模態用戶體驗。我們製作它是為了激勵開發者。」