今天凌晨,谷歌在官網發佈了最新圖像模型Gemini 2.5 Flash Image,目前國外爆火Nano Banana生成的圖片使用的就是這個模型。
Gemini 2.5 Flash Image能生成圖像、編輯、融合,尤其是在保持圖像一致性和文本語義理解方面非常非常強,例如,你上傳一張圖片,只想改變某個區域,圖像其他區域一切都不變,它可以很好的做到這一點。或者上傳兩張圖片直接融合在一起。
「AIGC開放社區」會在下面的案例中為大家展示這些強大功能,簡單來說,這就是一個只用文本提示就能實現PS功能的圖像生成、編輯神器,並且現在是免費使用的支持中文。

免費使用地址:https://gemini.google.com/app
根據谷歌公佈的數據顯示,Gemini 2.5 Flash Image在Overall Preference、Character Creative、Infographics、Object和Environment測試中,全部領先OpenAI的GPT image 1最高版本,黑森林實驗室的FuUXI Kontent MAX版,以及阿里巴巴最新開源的image Edit,成為目前最強的圖像模型。

圖像編輯案例
先為大家展示一下它最強的圖像編輯功能,就是上面說的只改變某個區域,其他一切不變。
打開谷歌Gemini應用,選擇最新的Gemini 2.5 Flash Image模型,上傳一張著名足球員卡洛斯的圖片。


然後輸入提示詞:幫我把這個足球員的頭部,P成香蕉人,要求臉部有眼睛、鼻子和嘴巴,其他一切不變。

Gemini 2.5 Flash Image給出的結果,非常非常完美,除了改變頭部其他一切區域沒有發生任何變化。就連足球員手部原圖變形這一點,也很好的繼承下來~

我們繼續輸入提示詞來編輯圖像,可以把足球換成是一顆巨大的鑽石嗎?其他一切不變。
依然非常完美,足球變成了鑽石。當然,如果你對鑽石的形狀,顏色不滿意,可以繼續進行多輪對話調整到你滿意為止。

我們再把這張圖轉換成,前段時間GPT-4o爆火的吉卜力風格吧。輸入提示詞:可以幫我把這張圖片轉換成吉卜力風格嗎?
這次出現了點意外,居然人物和地上的鑽石沒轉換,不過摳圖是真乾淨,用PS的鋼筆、圖層方法來摳圖也不過如此吧~
所以,用這個模型來扣圖像那是相當好用。

我們繼續修改,輸入提示詞:把人物和地上的鑽石也變成吉卜力風格。
Gemini還嘴硬說之前的圖片我已經將人物和地上的鑽石也變成了吉卜力風格。我說,那個是寫實風格,幫我變成吉卜力卡通風格。
後來Gemini覺悟了,幫我重新生成了,真的挺人性化的有點意思。

最終輸出的轉換圖像

圖像融合案例
這位小帥哥表情很嚴肅好像不高興,用Gemini讓他開心一下。輸入提示詞:可以讓這位小男孩,開心的笑起來嗎?

輸出結果,笑的毫無違和感不錯~

手裏有點空,讓小男孩拿個毛茸茸玩具吧。輸入提示詞:讓他手裏拿着一個毛茸茸的玩具。
很完美,手指也沒變形。
圖像融合
我們還以上面小男孩為案例,讓他和另外一位小朋友手牽手。別說用AI圖像編輯了,用PS都很難做到,即便能做也是超複雜流程。下面見證奇蹟吧。
上傳下面這兩張圖片,然後輸入提示詞:讓這兩位小朋友 手牽手在一起吧。




小男孩和小女孩笑,是因為我在之前微笑基礎上編輯的,所以AI應該是記住了。這個牽手相當驚艷了。
上面只是簡單的基礎圖像編輯案例,結合Gemini 2.5 Flash Image超強的圖像編輯、融合功能,還能玩出更多的花樣,小夥伴們可以試試。
圖像生成
下面再展示下Gemini 2.5 Flash Image的圖像生成功能。
幫我生成一張圖片,2077 年的深海科研基地,圓形觀測艙外游過發光的巨型烏賊,艙內科學家通過全息投影分析海底熱泉數據,金屬艙壁上佈滿藍色指示燈,地面有輕微積水反射燈光,整體氛圍科幻且靜謐。


效果還行整體氛圍感不錯。
一片神秘的熱帶雨林,高大的樹木遮天蔽日,樹冠層中透出斑駁的陽光,空氣中瀰漫着濕潤的泥土氣息和植物的清香,各種奇花異草在林間生長,色彩鮮艷的鸚鵡在樹枝間跳躍,遠處傳來瀑布的轟鳴聲,一條清澈的小溪從林間穿過,溪水在石頭間跳躍,發出清脆的聲響,周圍的一切都顯得生機勃勃。


一片寧靜的沙漠,金黃色的沙丘起伏連綿,陽光灑在沙面上,閃爍着耀眼的光芒,遠處的地平線上,天空與沙漠相接,呈現出一種壯闊的景象,偶爾可以看到幾株耐旱的仙人掌頑強地生長在沙丘之間。


說實話Gemini 2.5 Flash Image的圖像生成沒有編輯功能那麼驚艷,但也屬於top級的了,最起碼在文本語義還原、構圖、光線等方面不錯。
可能很多小夥伴不知道國外爆火的香蕉人圖梗,谷歌CEO Sundar Pichai在昨天深夜只發了三個香蕉圖標,這個推文的瀏覽量將近300萬,評論超過2500,你就知道香蕉圖多火了。

網友表示,很有意思。更快的圖像生成速度固然有用,但精準的控制能力與細膩的輸出效果,才是真正提升用戶體驗的關鍵。

Nano Banana這個名字比Gemini 2.5 Flash Image好多了。這條建議請轉達給你們的市場部。

這項創新太驚艷了!它為無限的創意可能打開了大門。

非常瘋狂的技術進步。

尊敬的谷歌人工智能團隊,祝賀你們👏👏👏👏👏👏👏!這一成果太出色了。非常感謝你們所付出的努力與取得的卓越成就,請繼續蓬勃發展、再創佳績!順祝商祺。
















