Select Page
Google Nano Banana 公仔製作教學:一張自拍秒變桌上模型圖

Google Nano Banana 公仔製作教學:一張自拍秒變桌上模型圖

你是否曾想把自己的照片變成桌上擺放的公仔模型?現在可以透過 Google 最新的 Nano Banana 模型(亦稱 Gemini 2.5 Flash Image)!你只需在 Google AI StudioGemini App 上上傳人像照片,就能透過文字描述,生成一張效果逼真的「真人公仔照」,免費、免 VPN,簡單又好玩!

快速上手教學(適用 AI Studio 或 Gemini App)

  1. 前往 Google AI Studio 或使用 Gemini App
  2. 選擇模型為 Gemini 2.5 Flash Image(Nano Banana)
  3. 上傳你的照片(建議用正面自拍)。
  4. 輸入以下 prompt:
  5. A hyper-realistic 1/7 scale figurine of a character, designed as a finished commercial product, placed on an iMac computer desk with a white Apple keyboard. The figurine stands on a clean, round transparent acrylic base with no labels or text. Professional studio lighting highlights the sculpted details. On the iMac screen in the background, display the ongoing ZBrush modeling process of the same figurine, showing the contrast between “work in progress” and the finished product. Next to the figurine, place its packaging box with rounded corners and a transparent front window. The box is open at the top, revealing only the inner transparent plastic clamshell, and its height is slightly taller than the figure, realistically sized to contain it.
  6. 約莫 10 至 12 秒後,Nano Banana 將生成一張高質感的“公仔照”。
  7. 若不滿意,可繼續輸入新的指令,進行多回合優化。

Whisk

除了用 Gemini, Google AI Studio 之外,也有一個很親民的工具可以使用,Google Whisk 是 Google Labs 推出的一款 AI 圖像生成實驗工具,它的核心理念是「用影像提示取代文字提示」,讓創作過程更直觀、有趣又快速 。

使用方式總覽:

  • 使用者可以上傳或拖曳多張圖片,分別指定為 主體 (Subject)場景 (Scene)風格 (Style)
  • Whisk 會透過 Gemini 多模態 AI 生成每張圖片的描述(把圖像翻譯成文字),再透過 Imagen 3 來自動生成最終的合成圖像 。
  • 若使用者沒有圖片,也可以點擊類似骰子的按鈕,讓 Whisk 自動產生候選圖像作為創作起點。
  • 最終生成的作品同時附上自動生成的文字提示,使用者可收藏(favorite)、下載或進入「refine」(精修)模式繼續調整。

功能特色與優勢

特性說明
直觀的視覺提示流程不需撰寫冗長文字,只要用圖像即可引導 AI 創作,降低入門門檻。
高度創意自由度主體、場景、風格可任意混搭,產出意想不到的視覺效果。
可精調的 promptWhisk 生成的文字提示可供修改,讓你能微調構圖或細節。
迅速生成,適合腦力激盪非用於精細修圖,而是強調快速試想與探索多種視覺可能性。

背後技術架構

Whisk 的生成流程依靠兩大 Google 強力 AI 模型:

  1. Gemini:將使用者上傳的圖片轉換成文字描述(Image → Text)。
  2. Imagen 3:根據 Gemini 輸出的描述,生成新圖像(Text → Image)。

這種「I2T 加 T2I」方式,讓工具更懂得捕捉「精髓」而非複製細節,有助於創造富有變化的視覺作品


應用場景與用戶心得

適用於:

  • 創意構想:設計師、行銷、插畫師與教育者都能用它腦爆想法,例如試出角色在不同情境下的樣貌。
  • 教育工具:老師可以讓學生用上傳的照片快速生成故事插圖或原型設計。
  • 快速原型設計:用於生成貼紙、胸章、絨毛玩偶等產品概念,效率高又富創意。

最新資訊與發展動向

  • Whisk 自 2024 年底正式推出以來,已從初期美國限定,擴展至全球超過百個國家使用。
  • 隨著技術升級,Whisk 已經從最初的 Imagen 3 模型,陸續升級到更新、更強的 Imagen 4,圖像品質更高。
  • 雖然最近 Google 也廣為報導其視頻工具 Flow,但 Whisk 主要還是聚焦在圖像創作領域。

官網

https://aistudio.google.com/prompts/new_chat

https://gemini.google.com

參考資料