Nano Banana在台爆紅,Google揭4種用法

曾子軒
user

曾子軒

2025-09-08

瀏覽數 4,750+

Google DeepMind產品經理薛倫(David Sharon)在自己的LinkedIn分享使用nano banana的成果。取自LinkedIn@David Sharon
Google DeepMind產品經理薛倫(David Sharon)在自己的LinkedIn分享使用nano banana的成果。取自LinkedIn@David Sharon

喜歡這篇文章嗎 ?

登入 後立即收藏 !
00:00
00:00

Google Gemini團隊推出、暱稱為「Nano Banana」的圖像模型Gemini 2.5 Flash,在台灣短短幾天內已生成超過500萬張圖片,Nano Banana的公仔教學文更熱爆。但Google官方團隊實際觀察到哪四種超夯用法?受歡迎的原因又為何?Google DeepMind產品經理薛倫現身說法,完整解密。

Google Gemini團隊推出、暱稱為「Nano Banana」的圖像模型Gemini 2.5 Flash,靠著模型的精細控制能力,很快引爆全球社群,在台灣短短幾天內更靠此模型生成超過500萬張圖片,Nano Banana的教學文也夯爆就可看出人氣。除了專家解析Nano Banana之於Google營收的重要性,Google官方團隊又觀察到哪四種超夯用法指令?以下是Google DeepMind產品經理薛倫的完整解密。

Nano Banana席捲全球,驚人使用數字揭曉 

Nano Banana有多紅?至今日(9/5)為止:

・使用者已經用它生成2億張圖片。

・替Gemini(應用程式)帶來1000萬名新用戶。

Google DeepMind產品經理薛倫(David Sharon)強調,亞太地區更是引領Nano Banana的潮流。以下節選APAC區域幾個國家的使用數字:

・菲律賓:生成2500萬張圖片。

・印尼:生成2000萬張圖片。

・泰國:生成1840萬張圖片。

・台灣:生成540萬張圖片,

而且,這個數字還在快速上升。

名字是半夜亂取?揭開「Nano Banana」命名原因 

正式名稱為Gemini 2.5 Flash,Nano Banana在命名上遵循Google基礎模型的的一貫傳統,都由Gemini開頭,中間加上版本數字,後方則是代表模型量級的型號,原先猶大大小,分為Ultra、Pro和Nano,後來考量回覆速度和成本,推出速度快、價格便宜但又不會過度犧牲品質的Flash。

然而,在Gemini 2.5 Flash尚未正式公開以前,社群上都以Nano Banana稱之,原因就是這款模型,曾經以Nano Banana之名,在模型排行榜LM Arena上的圖像編輯(image edit)類別登頂。

薛倫透露,會以Nano Banana命名,其實是出於偶然。「它是在凌晨兩點誕生的。團隊成員必須為一個匿名的模型排行榜提交名字⋯⋯有人在凌晨兩點想到了『Nano Banana』,覺得這大概不會讓人聯想到Google。」

因為名字簡單、好記,再加上模型能力強大,後來Google發布正式名稱以後,SEO關鍵字上Nano Banana還是佔有一席之地。

解鎖爆紅密碼,Nano Banana脫穎而出的三大亮點 

好名字或許能帶來關注,但Nano Banana的成功,來自於幾項技術特色。薛倫指出,Nano Banana有三大特色:

亮點一:理解力超群,讓使用者能夠得到符合預期的成果 

薛倫表示,Nano Banana的基礎是Gemini模型,因此能夠利用Gemini的邏輯、推理與世界知識來理解使用者的指令,不只是單純比對關鍵字而已。

這就是為什麼當使用者要求「80年代風格」時,它能自動匹配當時的髮型、妝容和服飾,因為它「理解」了那個年代的文化背景。

亮點二:高度一致性,讓使用者可以編輯自有圖像 

這項亮點,或許是Nano Banana最吸引人的地方。

薛倫透露,Gemini團隊一直都有聽到使用者反映,希望能夠編輯自己的圖像,但以人像來說,問題在於生成新內容時,很難保留既有的的肖像特徵。

Nano Banana設法改善這個問題,使用者可以上傳自己的照片,接著修改內容,AI 會「鎖住」原先的臉部輪廓,只改變被指定的元素。這項「角色一致性」的突破,讓使用者可以更換照片的旅遊背景、微調姿勢與表情、刪減物件,貼近日常使用。

亮點三:降低使用門檻,對話中逐步修改 

Nano Banana的標語是「用單一提示重塑你的照片。」薛倫表示,使用者不用一次就給出完美指令,而是可以像與創作伙伴溝通一樣逐步調整。

「加上一頂帽子,加上太陽眼鏡;我希望襯衫是黃色的,我希望它是紅色的」,這種直覺的互動模式,讓不熟悉專業圖像編輯工具的使用者,也能輕鬆創造出心中完美的圖像。 

Google精選APAC最紅4指令,不只能做公仔

強大的功能催生了病毒式的傳播。在記者會上,Google 展示了幾個已在全球爆紅的應用場景:

歡慶39週年!訂遠見兩年送一年(一年一度優惠只到9/30)>>

玩法一:將自己IP化,打造專屬3D公仔  

這是目前引爆亞太市場的使用案例。「在泰國、印尼、菲律賓爆紅的,就是公仔提示詞 (figurine prompt)」,薛倫指出。用戶只需上傳自己的照片,下達簡單指令,就能將自己生成為一個精緻的 3D 渲染公仔,連同專屬的玩具包裝盒一同呈現,效果極其逼真。 

玩法二:穿越時空的魔鏡,體驗不同年代的自己 

你是否好奇過父母那個年代的自己會是什麼樣子?Nano Banana可以扮演魔鏡,讓使用者穿越時空。

薛倫分享道:「你可以想像自己 80 年代會是什麼樣子,它會給你當時的髮型、妝容和服裝。」模型運用其龐大的世界知識,精準還原那個年代的流行元素,從蓬鬆的髮型到鮮豔的妝容,有著滿滿細節。

玩法三:穿越時空,與未來的自己相遇 

這個功能不僅有趣,更能創造深刻的情感連結。

薛倫分享了一個非常溫馨的個人故事:「我有兩個小孩,我給他們看了模型認為他們 15 歲、25 歲、35 歲、45 歲時會是什麼樣子。那是一個...那是我們之間一個很美好的時刻。」這項功能讓父母得以一窺孩子未來的輪廓,也讓孩子對成長充滿了想像。

玩法四:化身名畫主角,融入經典藝術與場景 

如果你曾夢想走進經典場景,現在機會來了。使用者可以問:「我在《六人行》的片場會是什麼樣子?」模型會幫你換上劇中風格的服裝,並完美融入經典的橘色沙發背景中。

不僅如此,你還能將自己變成世界名畫的一部分。薛倫也分享他的指令:「把自己放進《吶喊》這幅畫裡。你會看到那些著名的筆觸和那個尖叫的姿勢,然後你就會在圖像中看到你自己,這真的非常有趣。」

Nano Banana也會失靈?仍有技術挑戰待克服  

儘管表現驚人,但 Nano Banana 並非完美。薛倫在回答媒體提問時,坦率承認目前模型面臨的幾大「前沿研究問題」。 

・多輪對話後品質下降:當使用者連續編輯同一張圖片多次後,可能會發現品質下降。

・多角色場景不穩定:在一個畫面中生成多個特定角色,並保持其互動的穩定性,仍是挑戰。

・模型忽略編輯指令:有時你要求修改,模型卻返回原圖。薛倫坦言:「這是一個我們正在追蹤的首要問題之一。」

Nano Banana下一步?未來藍圖揭曉

那麼,Google的下一步是什麼?薛倫在回答媒體提問時,勾勒出Nano Banana的未來藍圖:

再往下一步,圖像升級影片 

當被問及是否會將圖像生成與影片生成結合時,薛倫難掩興奮:「我喜歡這個問題⋯⋯它絕對在我們的雷達上,我們非常興奮地看到從圖像到影片的跨模態使用。」可以看出,Gemini的終極目標是一個全面的多模態創作平台。事實上,Google原本就有專精影音的Veo 3,未來倘若能夠整合所有生成相關工具,吸引力將會更加驚人。

專注Gemini App,暫無獨立App計畫

不過,使用者不用期待Nano Banana變成像Photoshop那樣的獨立App。針對《遠見》提問,薛倫表示,暫無開發獨立應用的計畫,目前的目標仍是讓Gemini應用程式成為消費者使用Nano Banana的首選地點,集中火力,打造一個強大的Gemini。

你可能也喜歡

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務