今年可以說是,各種AI應用迸發的大元年了。
不管是ChatGPT,還是國內各種新生大模型,在日常問答、結合上下文理解等場景,都已做得相當成熟。
就連,集人類智慧語言大成的藝術——拍馬屁。
AI都能出口成章,講實話(吹牛)不帶一點臉紅的。
你說好玩麼,固然是好玩的。
但文字的表現力,也終歸是不如圖片和視頻的。
不管是普通網友,還是在搗鼓AIGC的工程師,都渴望能用上更先進成熟的AI生圖、擴圖等功能。
此前呢,也確實有好幾個AI擴圖的應用,陸續面世。
比如PhotoShop的【創成式填充】,能直接擴展出海邊全景圖。
又比如,機哥之前給大夥詳細盤過的,美圖秀秀【AI擴圖】功能。
它們都很好,但唯獨使用門檻上,有億點點高。
要麼是要用到電腦,要麼是免費次數有限。
用到一半收費,帶來的痛苦不亞於,洗澡突然斷水...
So,或許是意識到,網友們對於AI整活的強烈需求。
濃眉大眼的抖音,最近也搞起了【AI擴圖】,還直接登上抖音熱榜第一。
願景十分美好:
「AI擴圖,一秒拯救廢片。」
但大夥都懂的。
那稍顯稚嫩、練習時長還不足兩年半的【AI擴圖】。
即使再怎麼穩健,也難免會有翻車的時候。
在抖音的【AI擴圖】板塊里。
總是能出現一些,令人始料未及的擴圖元素。
比如,這個「一人一狗」躺在床上的場景,滿滿的溫馨。
那經過【AI擴圖】處理後,畫風一定也很溫暖吧?
只見畫面中,多出一個年輕貌美的歐美女生。
看來AI還是懂人類最樸實的需求——渴望陪伴。
而男主也確實,在這場景下華麗轉身,成為了霸道總裁。
彌補遺憾、成全人類,無疑是AI造福人類的一大體現。
但有一個問題,機哥不知當講不當講。
咱就是說,這哥們兒的手,咋就剩下半截了?
如果說殘忍「截肢」,還能說是【AI擴圖】對場景識別出錯所致。
辣麼,把人下半身補全為「人馬」,閣下又該如何解釋呢?
這可不是,AI把人類「動物化」的孤例啊。
還有一位網友,特意選了一張打臉局部圖,來考驗AI的擴圖準確度。
至於AI擴圖的結果嘛。
機哥勸大夥做好心理準備,看了多少有點恐怖谷效應的...
原本好端端的一位帥哥,被AI直接擴成狗子了。
說它瞎搞吧,它精準保留了左上角的燈源。
說它正經吧,又給人類硬生生切換了物種。
反正,這種對着大臉自拍的,就特別容易翻車。
人類可能不會在同一個地方跌倒兩次。
但依靠海量素材訓練的AI,顯然是會的。
這麼看下來。
抖音的【AI擴圖】,對人物肢體部位的還原,還是很摳腳。
運氣好的話,確實能還原出正常的四肢。
但要是AI玩得奔放點,它絕對能給你整出一些,令人眼前一黑的狠活...
各種離譜的翻車,讓機哥更加好奇。
處理時間短一些的【AI擴圖】,效果就如此不堪麼?
正所謂實踐見真章。
我還是沒忍住下了個剪映,試試這【限免】的擴圖,到底是怎麼個事兒。
像這類,直接面向廣大用戶開放的AI功能,使用起來都很簡單。
在App里隨便導入一張圖片,點擊【抖音玩法】,就能找到擴圖功能。
初來乍到,機哥還是先挑了一張,難度沒那麼高的風景圖。
而這,是經過抖音AI擴圖後的效果。
我是主觀覺得,效果一般般。
首先是整張照片的色調,在經過AI優化後,暗沉了許多。
而且這明明是個電線杆,被AI擴充後,反而成了...椰子樹?
如果是食物圖,會不會出現些離譜要素捏?
你別說,擴充得還行。
桌上多了一盆花,右邊的食物多出的部分,也毫無違和感。
如此看來,這AI處理一些風景和事物,還是遊刃有餘滴~
可問題的關鍵還是在於,它到底能不能人給擴充好。
畢竟鋼筋水泥和綠樹青山啥的,咱們天天都能拍上。
但好的人像照片,卻常常稀缺。
老規矩,咱們難度循序漸進,先用國外很火的「老外回頭」梗圖試水。
擴圖後的效果其實還行,AI顯然是識別到了圖片有街道。
於是就順着原有場景,補全了行人和店鋪。
甚至連背景的景深虛化,都考慮進去了。
但機哥還是想說,這【AI擴圖】只能看個整體氛圍感。
要是像列文虎克那般細看,那基本沒有一種圖,是能經得起考驗的。
比如這張圖裏的牛仔褲,就莫名其妙被縫合了紅色布料,腳的形狀也很奇怪。
接着再來一個,很經典的「思考的黑人」圖。
擴圖後,整體看下來沒啥違和感,翻車的地方也有,但比前面的效果都好上不少。
測到這裏,機哥算是摸清了抖音這個【AI擴圖】的特性。
畫面元素越簡單,擴圖效果就越好。
畢竟生成式AI嘛,最擅長的就是「無中生有」了。
但如果畫面要素太雜,AI就會追求「啥都要」,導致照片出現與現實場景不符合的東西...
比方說,這張圖裏面的輪椅...
還有一個要點,千萬不要只留半邊臉給AI。
機哥親測,半臉圖基本試一次,翻車一次。
機友們也不想,自己的膚色被切換,臉部表情被扭曲吧?
不過話說回來。
AI擴圖翻車的例子雖多,但不意味着,AI做不好這事兒。
機哥體驗過很多「生成式AI」。
包括純文本的、文生圖的、圖片擴展的和圖片轉視頻的...
可以說,「生成式AI」都有一個很明顯的特點:
你給它計算的時間越多,它反饋給你的成品,質量就越好。
但市面上的【AI擴圖】功能,基本都面向大眾用戶的,對出圖的速度追求,優於質量追求。
畢竟要是大夥等得太久,誰還樂意用啊。
而追求快呢,就難免會出現翻車,二者不可兼得。
但我覺得,現階段的痛點,很快就要被更新的技術給解決掉。
更別說,現在的生成式AI,已經進入了——
動動鼠標,就能讓靜態圖動起來的全新階段。