Google 最新 AI 影片生成工具 Gemini Omni 怎麼用?《遠見》實測4種素材——文字、圖片、影片、分鏡圖,帶你看懂風格轉換、知識解說影片怎麼生成,附上另一影片生成熱門應用Seedance 2費用方案比較。看看誰CP值最高?
Google近期推出最新AI影片生成模型Gemini Omni,結合邏輯推理與創作能力,打造更逼真且充滿創意的影片。無論是上傳文字、聲音、照片或影片,Gemini Omni都能以此為基礎,生成風格連貫的作品。本文進行了四項實測,使用各種形式的素材,生成料理ASMR和知識解說等不同類型的影片。另外也有網友喜愛使用Seedance,費用方案哪個比較划算?以下一起比較。
Gemini Omni是什麼?怎麼用?
Google 5月19日推出最新AI影片生成模型Gemini Omni,將取代先前的Gemini Veo 3.1,發揮邏輯推理能力,打造更貼近真實世界邏輯、同時也能讓使用者盡情發揮創意的影片生成體驗。
目前Gemini Omni已開放給訂閱Google AI Plus、Pro和Ultra方案的用戶,只要在聊天室中選擇「建立影片」,就可以使用官方範本或自己輸入指令生成影片。目前能調整的影片格式選項不多,僅有直式或橫式能選擇,無法直接指定秒數或風格。另經實測發現,生成影片的長度皆為10秒。
官方網址:請點此

若想上傳影片作為參考素材,需將影片剪輯至10秒內,若超過秒數可直接在Gemini中編輯想上傳的時間範圍。

此次推出的Gemini Omni Flash,是Omni系列中的第一款模型。Google表示,未來還會再推出能生成圖片、音訊等多元形式的模型。
Gemini Omni適合誰用?
- 社群內容創作者:可快速生成風格化短片,作為Reels素材。
- 行銷與品牌團隊:可將自家品牌或產品套入不同風格的影片中,預覽實際呈現效果。
- 廣告或活動企劃人員:可將文字腳本或手繪分鏡圖轉為動態影像,在提案時幫助客戶或主管更直觀地理解創意方向。
Gemini Omni教學1:AI影片風格轉換,以科幻為例
實測上傳一支在圖書館拍攝的短片,並在保留其原始場景和運鏡的前提下,將其改造為科幻風格,並加入懸疑配樂。
參考指令(由ChatGPT撰寫):
將原始影片保留同一場景、人物與運鏡,但整體轉化為高級近未來科幻電影風格。加入冷色霓虹光影、透明 hologram UI、微弱數據流、體積光與未來科技材質。保留原本空間結構與物件辨識度,不改變場景配置,只做科幻升級。整體風格參考《銀翼殺手 2049》,並加入緊張懸疑的配樂。 |
其生成的影片確實與原始影片有相同的場景和運鏡,只是將整體風格改造為科幻電影並加上配樂。
Gemini Omni教學2:將角色加入上傳影片中
混搭不同形式的素材是Gemini Omni的特色之一。實測上傳一張ChatGPT生成的邊境牧羊犬卡通角色圖,以及前一項實測使用的圖書館影片,生成狗狗在圖書館裡找書的影片。
參考指令(由ChatGPT撰寫):
請保留我上傳的圖書館影片原始場景、光線與運鏡,將我上傳的邊境牧羊犬卡通角色自然融入畫面中。影片內容是一隻認真又聰明的邊境牧羊犬,在安靜的圖書館裡尋找書籍、翻書、推小推車與思考。角色需維持原本設計風格與毛色,動作自然可愛但不要過度卡通化。整體風格偏向 Pixar 式真人融合動畫,溫暖、療癒、有輕微幽默感,並保留真實圖書館氛圍與電影感光影。 |

其生成的影片保留了圖書館的寫實場景,並在當中加入卡通風格的狗狗。影片內容有符合指令要求的狗狗推推車、翻書和思考的場景,但推車是從書架後方突然出現的,像是有人將推車推向狗狗,雖然還算合理但稍嫌不自然。
Gemini Omni教學3:文字生成影片
Gemini Omni不只能生成配樂,也能生成有人聲的解說影片。實測用文字指令,要求其生成手繪風格的解說影片,且旁白需要與畫面一致。
參考指令(由ChatGPT撰寫):
請製作一支以「大型語言模型(LLM)運作原理」為主題的手繪插畫風格 AI 解說影片,整體採用高級知識型 YouTube 動畫風格,結合手繪線條、水彩紙張質感、資訊圖解與溫暖科技感。影片必須包含完整中文旁白解說與同步字幕,旁白語氣專業、淺白易懂。 |
結果其能正確呈現中文字,旁白也有符合畫面變化,只是有些中文發音不標準,且受限於10秒的影片時間限制,無法實際講到什麼內容,因此實用性不高。此外,經實測發現需要選擇Pro模型,才能生成正確的中文字,否則文字會是亂碼。
Gemini Omni教學4:用分鏡圖生成料理影片
如果手邊有分鏡圖、草圖等素材,也很適合用Gemini Omni來生成影片。實測上傳9宮格的北非蛋烹飪分鏡圖,生成有ASMR感的料理影片。
參考指令(由ChatGPT撰寫):
請以「高級電影感料理短影片」風格生成,整體節奏偏慢、具有沉浸式 ASMR 感,畫面需保留食材油光、蒸氣、火焰與切菜聲的生活感。影片比例為 9:16,可用於 Reels、TikTok 與 Shorts。請根據參考圖片中的 9 宮格內容,自動延伸成完整動態料理影片。 |

其生成的影片與分鏡圖規劃大致相同,且音訊部分同時有配樂和切菜聲、水滾的聲音等環境音,讓影片更逼真。但細看影片後發現,打蛋的畫面是打在鍋子中間,但最後成品卻是四顆蛋排成方形。
Gemini Omni實測優缺點比較
整體而言,Gemini Omni目前最適合用於快速生成短秒數的概念影片或社群素材,以下整理實測後發現的優缺點:
優點
- 素材接受度高,文字、圖片、影片皆可作為輸入參考,組合靈活
- 能同時生成影像、配樂與人聲旁白,一站式完成影片製作
- 能維持輸入素材的場景、運鏡等風格連貫性
- 支援中文旁白與字幕(需選擇Pro模型)
缺點
- 影片長度固定為10秒,無法自由調整,對於需要完整敘事的內容實用性有限
- 輸入影片素材限制在10秒內,需要事前剪輯
- 細節仍有不合理之處,例如角色動線不自然、前後畫面邏輯不一致
- 中文語音發音仍不太準確
- 影片格式選項偏少,僅能選擇直式或橫式,客製化彈性不足
Gemini Omni與Seedance 2,台灣創作者怎麼選?
近期台灣影片創作者圈子裡,除了Google近期推出的Gemini Omni,其實早有不少人偏愛使用中國字節跳動旗下的Seedance 2模型生成影片。兩者的核心差異,在於使用門檻與彈性:Gemini Omni整合在Google 訂閱方案內,操作直覺但影片長度固定 10 秒;Seedance 2則有免費入口,影片長度更彈性,但存取方式較複雜。
Seedance 2主要有3種存取途徑:全球用戶可透過Dreamina 網頁平台免費試用;習慣影片剪輯的創作者可在剪映(CapCut) 內直接使用 AI 影片生成功能;有開發需求的用戶則可透過Atlas Cloud API 串接,按影片秒數計費、無月費門檻。選擇哪條路,取決於你的工作流程與生成量。
以下一表看懂:
| Gemini Omni Flash vs. Seedance 2 費用方案比較 | ||||
|---|---|---|---|---|
| 比較項目 | Gemini Omni Flash | Seedance 2 | ||
| 方案名稱 | 月費(TWD) | 存取方式 | 費用 | |
| 方案與定價 | ||||
| 免費方案 | ✗ 影片生成不適用免費版 | Dreamina 全球消費級應用 | 每日免費額度 超出可購買加值包 | |
| 免費方案 | ✗ | 剪映(CapCut) 中國消費級應用 | 每月免費配額 超出需 CapCut Pro 訂閱 | |
| 入門方案 | Google AI Plus | NT$260/月 含影片生成、Google Flow 200 點 | — | |
| 標準方案 | Google AI Pro | NT$650/月 含影片生成、Google Flow 1000 點 | — | |
| 進階方案 | Google AI Ultra | NT$3300/月起 Google Flow 10000 或 25000 點 | — | |
| 開發者方案(一般用戶可略過) | ||||
| API 標準版 | — | Atlas Cloud API (標準版) | $0.10 美元/秒 無免費層級 | |
| API 快速版 | — | Atlas Cloud API (快速版) | $0.081 美元/秒 無免費層級 | |
| 功能比較 | ||||
| 影片長度 | 固定 10 秒 無法自訂 | 可調整 依存取方式與點數 | ||
| 素材輸入 | 文字、圖片、影片、分鏡圖 | 文字、圖片、影片 | ||
| 中文支援 | 有限度 需選 Pro 模型,發音仍不標準 | ✓ 介面支援繁體中文 | ||
| 適合用戶 | 已訂閱 Google AI 方案、 需要風格轉換或概念影片 | 想免費試用或需要較長影片的 內容創作者 | ||
| 資料來源:Google官網及 Seedance官網彙整。資料整理:遠見編輯部。時間:2026/5 | ||||