新聞 > 科教 > 正文

給機械人配AI大腦!谷歌發佈視覺語言行動模型

谷歌正在把先進的人工智能(AI)模型植入機械人,給機械人配一個 AI大腦

美東時間7月28日周五,谷歌公司宣佈推出應用於機械人領域的新產品——名為 Robotics Transformer2(RT-2)的 AI模型。它是一種全新的"視覺-語言-行動"(VLA)模型,可以幫助訓練機械人理解扔垃圾等任務。

谷歌介紹,RT-2基於 Transformer模型,根據互聯網上的文本和圖像進行訓練,直接指示機械人執行動作。就像用語言模型通過網絡文本訓練 AI學習人類社會的思想和概念一樣,RT-2也可以通過網絡數據,將相關知識告知機械人,指導機械人的行為。

谷歌舉例稱,如果我們要讓以前的機械人系統做出扔垃圾的動作,就必須明確訓練機械人懂得區分何為垃圾,以及撿起垃圾、扔掉它這些動作。而 RT-2能將網上的相關知識傳給機械人,讓機械人無需明確的訓練,就懂得垃圾是什麼,甚至即便從未受過如何扔垃圾的訓練,也知道怎麼扔垃圾。

谷歌表示,RT-2具有將信息轉化動作的能力,藉助它,機械人有望更快適應全新的情形和環境。

因為在6000多次測試 RT-2模型的機械人試驗後,谷歌的團隊發現,面對訓練數據中已有的任務、或者說"見過"的任務,RT-2和它的前代 RT-1一樣發揮功能,沒有差別。而在新穎的、之前從未見過的任務情形中,RT-2的性能幾乎提高一倍,成功率達到62%,遠超 RT-1的32%。

換句話說,通過 RT-2,機械人能像人類一樣學習更多內容,將學到的概念應用於全新的情境中。

谷歌稱,RT-2顯示出超越其所接觸機械人數據的推廣應用能力和語義、視覺理解能力,包括解釋新的命令,並通過基本的推理響應用戶的指令,比如關於物體的類別和高層次描述的推理。

谷歌的研究還表明,通過結合思維鏈的推理,RT-2能執行多階段的語義推理,比如判斷哪種物體可以臨時用作錘子,哪一類飲料最適合疲勞的人。

有媒體周五稱,谷歌目前沒有立即計劃大規模發佈或者出售應用 RT-2的機械人,但最終,這些機械人可能用在倉庫或者用作家庭助理。

責任編輯: 夏雨荷  來源:全天候科技 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2023/0730/1934030.html