Midjourney這回可以說是驚艷眾人了,不過也有網友好奇,另一位重量級選手Stable Diffusion表現又會如何?
這不,有位網友便用Stable Diffusion搞了個鏡像:
效果似乎也不錯?
效果為何如此炸裂
Midjourney時隔4個月的更新,為何會讓效果一下拉高到如此「嚇人」的程度?具體又更新了哪些東西呢?
整體來說,最明顯的當屬以下三點更新了:
細節更加逼真
更多可以選擇的風格
告別不會畫手
首先是細節部分,下圖從左到右依次是V3、V4、V5生成的效果,可以說是越來越逼近照片效果了。
△圖源:arstechnica
不僅如此,在有面部特寫時,各種肌膚紋理以及光影效果,比如說反射、眩光和陰影等,V5都能搞定。
在Discord發佈說明中,Midjourney還指出,相較於V4版本,V5版本會有更多的可以選擇的風格,解像度也提升了2倍。
風格的話,可以從0~1000中選擇,stylize0=照片,stylize1000=更藝術。
並且V5還會對提示詞更加敏感,用更少更精簡的文本生成更好的有效的圖片。
更更更重要的是,這次升級,Midjourney可算是擺脫掉了「不會畫手」標籤,想要靠看手指數的多少來判別AI作畫已經不管用了(Doge)。
值得一提的是,此前,已經有人通過Stable Diffusion+ControlNet解決了AI畫手的問題。
不過,也有網友出來開槓,雖然手指數畫對了,但仔細看細節還是能區分出的:
大拇指還是有點過長了。
當然,除了上面這些比較明顯的升級之外,Midjourney V5版本還更新了一些小細節。
一位機器學習博主特意列了張表格對V4、V5進行了對比。
△來自@Lars Nielsen
比如說,在最新的V5版本中,重複式、鋪瓷磚式作畫功能又回來了,在V4版本中,這項功能被官方禁止。
還有,Midjourney V5生成的尺寸也更加自由,像下面1:3、5:1這種窄長的圖像就是V5生成的,甚至1:10的圖像它也能生成(如果你想的話)。
反觀V4版本,尺寸被限制在1:2~2:1之間。
嗯,這樣的話,說不定之後的某個電影創作畫面就是Midjourney V5生成的。
此外,V5版本還可以手動調節圖像權重,比如輸入一張圖像,可以手動輸入數值來決定它影響最終生成圖像的程度。
如何上手試玩
Midjourney目前在公測階段,通過Discord的機械人指令,AI會根據提示詞幫你生成4張你想要的圖像。
具體來說,加入測試後,在新手頻道中,你可以通過/image指令來輸入提示詞。
不過,現在想要玩上V5版本的Midjourney,得先充值成為付費用戶才行。
(充哪一檔都可以)
在提示詞中加入—v5或者從/settings中選擇「V5」,就可以試玩這個最新模型啦~
就像這樣:
啊,對了,如果你不知道怎麼寫提示詞,或許可以問問GPT-4。