遠見搶先看 遠見搶先看 AI 轉型,為何 CEO 必須親自下場?

Gemini Omni怎麼用?文字生成影片、風格改造四大實測

郭宇璇
user

郭宇璇

2026-06-02

瀏覽數

Google 最新 AI 影片生成工具 Gemini Omni 。取自Google官方部落格
Google 最新 AI 影片生成工具 Gemini Omni 。取自Google官方部落格

喜歡這篇文章嗎 ?

登入 後立即收藏 !
00:00
00:00

Google 最新 AI 影片生成工具 Gemini Omni 怎麼用?《遠見》實測4種素材——文字、圖片、影片、分鏡圖,帶你看懂風格轉換、知識解說影片怎麼生成,附上另一影片生成熱門應用Seedance 2費用方案比較。看看誰CP值最高? 

Google近期推出最新AI影片生成模型Gemini Omni,結合邏輯推理與創作能力,打造更逼真且充滿創意的影片。無論是上傳文字、聲音、照片或影片,Gemini Omni都能以此為基礎,生成風格連貫的作品。本文進行了四項實測,使用各種形式的素材,生成料理ASMR和知識解說等不同類型的影片。另外也有網友喜愛使用Seedance,費用方案哪個比較划算?以下一起比較。

Gemini Omni是什麼?怎麼用?

Google 5月19日推出最新AI影片生成模型Gemini Omni,將取代先前的Gemini Veo 3.1,發揮邏輯推理能力,打造更貼近真實世界邏輯、同時也能讓使用者盡情發揮創意的影片生成體驗。

目前Gemini Omni已開放給訂閱Google AI Plus、Pro和Ultra方案的用戶,只要在聊天室中選擇「建立影片」,就可以使用官方範本或自己輸入指令生成影片。目前能調整的影片格式選項不多,僅有直式或橫式能選擇,無法直接指定秒數或風格。另經實測發現,生成影片的長度皆為10秒。

官方網址:請點此

Google推出Gemini Omni,展示影片生成的創新技術

Google推出Gemini Omni,展示影片生成的創新技術

若想上傳影片作為參考素材,需將影片剪輯至10秒內,若超過秒數可直接在Gemini中編輯想上傳的時間範圍。

Gemini Omni可參考10秒內的影片素材。截自Gemini

Gemini Omni可參考10秒內的影片素材。截自Gemini

此次推出的Gemini Omni Flash,是Omni系列中的第一款模型。Google表示,未來還會再推出能生成圖片、音訊等多元形式的模型。

Gemini Omni適合誰用?

  • 社群內容創作者:可快速生成風格化短片,作為Reels素材。
  • 行銷與品牌團隊:可將自家品牌或產品套入不同風格的影片中,預覽實際呈現效果。
  • 廣告或活動企劃人員:可將文字腳本或手繪分鏡圖轉為動態影像,在提案時幫助客戶或主管更直觀地理解創意方向。

Gemini Omni教學1:AI影片風格轉換,以科幻為例

實測上傳一支在圖書館拍攝的短片,並在保留其原始場景和運鏡的前提下,將其改造為科幻風格,並加入懸疑配樂。

參考指令(由ChatGPT撰寫):

將原始影片保留同一場景、人物與運鏡,但整體轉化為高級近未來科幻電影風格。加入冷色霓虹光影、透明 hologram UI、微弱數據流、體積光與未來科技材質。保留原本空間結構與物件辨識度,不改變場景配置,只做科幻升級。整體風格參考《銀翼殺手 2049》,並加入緊張懸疑的配樂。

其生成的影片確實與原始影片有相同的場景和運鏡,只是將整體風格改造為科幻電影並加上配樂。

Gemini Omni教學2:將角色加入上傳影片中

混搭不同形式的素材是Gemini Omni的特色之一。實測上傳一張ChatGPT生成的邊境牧羊犬卡通角色圖,以及前一項實測使用的圖書館影片,生成狗狗在圖書館裡找書的影片。

參考指令(由ChatGPT撰寫):

請保留我上傳的圖書館影片原始場景、光線與運鏡,將我上傳的邊境牧羊犬卡通角色自然融入畫面中。影片內容是一隻認真又聰明的邊境牧羊犬,在安靜的圖書館裡尋找書籍、翻書、推小推車與思考。角色需維持原本設計風格與毛色,動作自然可愛但不要過度卡通化。整體風格偏向 Pixar 式真人融合動畫,溫暖、療癒、有輕微幽默感,並保留真實圖書館氛圍與電影感光影。

實測上傳卡通角色圖,將角色放進影片中。下載自ChatGPT

實測上傳卡通角色圖,將角色放進影片中。下載自ChatGPT

其生成的影片保留了圖書館的寫實場景,並在當中加入卡通風格的狗狗。影片內容有符合指令要求的狗狗推推車、翻書和思考的場景,但推車是從書架後方突然出現的,像是有人將推車推向狗狗,雖然還算合理但稍嫌不自然。

Gemini Omni教學3:文字生成影片

Gemini Omni不只能生成配樂,也能生成有人聲的解說影片。實測用文字指令,要求其生成手繪風格的解說影片,且旁白需要與畫面一致。

參考指令(由ChatGPT撰寫):

請製作一支以「大型語言模型(LLM)運作原理」為主題的手繪插畫風格 AI 解說影片,整體採用高級知識型 YouTube 動畫風格,結合手繪線條、水彩紙張質感、資訊圖解與溫暖科技感。影片必須包含完整中文旁白解說與同步字幕,旁白語氣專業、淺白易懂。

暑期旅遊必備|訂遠見兩年送雙行李箱!25吋+20吋一次到手,總價值16,760元現在僅需$4,980>>

結果其能正確呈現中文字,旁白也有符合畫面變化,只是有些中文發音不標準,且受限於10秒的影片時間限制,無法實際講到什麼內容,因此實用性不高。此外,經實測發現需要選擇Pro模型,才能生成正確的中文字,否則文字會是亂碼。

Gemini Omni教學4:用分鏡圖生成料理影片

如果手邊有分鏡圖、草圖等素材,也很適合用Gemini Omni來生成影片。實測上傳9宮格的北非蛋烹飪分鏡圖,生成有ASMR感的料理影片。

參考指令(由ChatGPT撰寫):

請以「高級電影感料理短影片」風格生成,整體節奏偏慢、具有沉浸式 ASMR 感,畫面需保留食材油光、蒸氣、火焰與切菜聲的生活感。影片比例為 9:16,可用於 Reels、TikTok 與 Shorts。請根據參考圖片中的 9 宮格內容,自動延伸成完整動態料理影片。


用於生成影片的料理分鏡圖。下載自ChatGPT

用於生成影片的料理分鏡圖。下載自ChatGPT

其生成的影片與分鏡圖規劃大致相同,且音訊部分同時有配樂和切菜聲、水滾的聲音等環境音,讓影片更逼真。但細看影片後發現,打蛋的畫面是打在鍋子中間,但最後成品卻是四顆蛋排成方形。

Gemini Omni實測優缺點比較

整體而言,Gemini Omni目前最適合用於快速生成短秒數的概念影片或社群素材,以下整理實測後發現的優缺點:

優點

  • 素材接受度高,文字、圖片、影片皆可作為輸入參考,組合靈活
  • 能同時生成影像、配樂與人聲旁白,一站式完成影片製作
  • 能維持輸入素材的場景、運鏡等風格連貫性
  • 支援中文旁白與字幕(需選擇Pro模型)

缺點

  • 影片長度固定為10秒,無法自由調整,對於需要完整敘事的內容實用性有限
  • 輸入影片素材限制在10秒內,需要事前剪輯
  • 細節仍有不合理之處,例如角色動線不自然、前後畫面邏輯不一致
  • 中文語音發音仍不太準確
  • 影片格式選項偏少,僅能選擇直式或橫式,客製化彈性不足

Gemini Omni與Seedance 2,台灣創作者怎麼選?

近期台灣影片創作者圈子裡,除了Google近期推出的Gemini Omni,其實早有不少人偏愛使用中國字節跳動旗下的Seedance 2模型生成影片。兩者的核心差異,在於使用門檻與彈性:Gemini Omni整合在Google 訂閱方案內,操作直覺但影片長度固定 10 秒;Seedance 2則有免費入口,影片長度更彈性,但存取方式較複雜。

Seedance 2主要有3種存取途徑:全球用戶可透過Dreamina 網頁平台免費試用;習慣影片剪輯的創作者可在剪映(CapCut) 內直接使用 AI 影片生成功能;有開發需求的用戶則可透過Atlas Cloud API 串接,按影片秒數計費、無月費門檻。選擇哪條路,取決於你的工作流程與生成量。

以下一表看懂:

Gemini Omni Flash vs. Seedance 2 費用方案比較
比較項目
Gemini Omni Flash
Seedance 2

方案名稱
月費(TWD)
存取方式
費用
方案與定價
免費方案

影片生成不適用免費版
Dreamina
全球消費級應用
每日免費額度
超出可購買加值包
免費方案

剪映(CapCut)
中國消費級應用
每月免費配額
超出需 CapCut Pro 訂閱
入門方案
Google AI Plus
NT$260/月
含影片生成、Google Flow 200 點

標準方案
Google AI Pro
NT$650/月
含影片生成、Google Flow 1000 點

進階方案
Google AI Ultra
NT$3300/月起
Google Flow 10000 或 25000 點

開發者方案(一般用戶可略過)
API 標準版

Atlas Cloud API
(標準版)
$0.10 美元/秒
無免費層級
API 快速版

Atlas Cloud API
(快速版)
$0.081 美元/秒
無免費層級
功能比較
影片長度
固定 10 秒
無法自訂
可調整
依存取方式與點數
素材輸入
文字、圖片、影片、分鏡圖
文字、圖片、影片
中文支援
有限度
需選 Pro 模型,發音仍不標準

介面支援繁體中文
適合用戶
已訂閱 Google AI 方案、
需要風格轉換或概念影片
想免費試用或需要較長影片的
內容創作者
資料來源:Google官網及 Seedance官網彙整。資料整理:遠見編輯部。時間:2026/5
72% 領先者已開啟【職場雷達】 立即開通!解鎖專屬服務 立即開啟
AI治理有方 新北市打造智慧城市資安新典範
數位專題

AI治理有方 新北市打造智慧城市資安新典範

洞察趨勢的新北市政府,以超前部署、積極布局的策略,致力打造宜居、創新的智慧城市,聚焦「基礎建設」、「關鍵技術」、「智慧應用」三大面向,新北市已同步展現具體成果,體現地方政府的前瞻思維與執行力。

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務