Google日前發布最新AI推理模型Gemini 2.5 Pro,如果想使用最新模型,免費版已經夠好用?為此花錢買付費版使用影片生成Veo3值得?《遠見》取得月付8150元台幣的 Ultra版,實測揭曉影片生成免費與付費差異,另外也比較聊天介面Gemini免費版,以及付費版Pro與Ultra差別。另外,許多專業開發者還知道可在Google AI Studio上免費使用進階Gemini模型。到底Google AI Studio是什麼?如何執行免費最強用法?
Google AI Studio是什麼?怎麼用?
Google AI Studio是讓開發者在圖形化介面試用Gemini API的平台,只要進入Google AI Studio網站,選擇左側選單的「Chat」就能立即使用,即使是不會寫程式的一般人也能輕鬆上手。
在右側選單中,還有其他可調整的功能,例如調整AI創造性的溫度(Temperature)參數、思考模式與參數、搜尋網頁、結構化輸出等。
此外,在Google AI Studio的左側選單中,有一些在Gemini網站中沒有的功能,例如文字轉語音的工具、GIF生成器等,以下介紹三個特色功能。
免費與付費影片生成(Veo2、Veo3比較)
Google AI Studio,其實有一個隱藏版好康:影片生成。目前若在Gemini網站上使用免費版,並沒有影片生成功能。但在Google AI Studio上,卻能免費使用Google 2024年底發布的影片生成模型Veo2。怎麼做?只要點進Google AI Studio左側選單的「Generate Media」、再選擇「Veo」,即可進入影片生成頁面。
影片生成頁面的右側選單,可以調整影片生成數量(1或2個)、影片比例(橫式16:9或直式9:16)、影片秒數(5至8秒),以及可以指定影片中不要出現的東西的負面指令。
測試影片生成指令(由ChatGPT撰寫):
三隻擬人化的小狗在清晨陽光灑落的街道上,一邊嬉鬧、一邊背著色彩繽紛的書包,開心地走在上學的路上。牠們穿著迷你版的校服,分別代表不同性格:一隻聰明伶俐,戴著眼鏡;一隻活潑好動,背著滑板;一隻溫和內向,手上拿著書本。沿途經過盛開的櫻花樹、公園的溜滑梯、還有一間正在營業的可麗餅早餐車。畫面風格溫馨、卡通感十足,色調明亮柔和,節奏輕快有朝氣,背景音樂為輕快的木吉他旋律。 |
然而免費版確實有不少缺陷,同時在熱門時段如晚上常常需要排隊。因此使用付費版方案做影片,效果明顯較佳。怎麼選用正確方案?
今年5月,Google發布最新影片生成模型Veo3,不僅畫面逼真,生成影片也自帶音訊,例如配樂或環境音等。但目前Veo3僅開放給Google AI Pro和Google AI Ultra的訂閱者優先使用,這兩個皆需要付費。月付650元的Pro方案可使用的是生成速度較快的Veo3 Fast,月付8150元新台幣的Ultra方案則可使用品質更高的Veo3。
因此也測試使用最高階方案Ultra,實測Veo3下相同的指令生成影片,並與Veo2比較。結果發現,影片節奏和畫面更加活潑,指令中的細節也幾乎都有達成,僅有小狗是溜著滑板、而不是揹著。影片中除了能聽到指令指定的吉他旋律,還有溜滑板和小狗叫聲的環境音,成果明顯比Veo2完整細緻許多。
Google AI Studio功能2:文字轉語音
在Google AI Studio左側選單的「Generate Media」中,還有一個Gemini網站沒有的功能,就是音訊生成工具Gemini speech generation。在這個工具中,可以輸入想轉換成語音的文字,成果可用於影片配音或Podcast製作。
在右方的選單中,可設定使用模型(目前有Gemini 2.5 Pro和Gemini 2.5 Flash可供選擇)、要生成單人語音或雙人對話、AI模型的溫度(Temperature)參數,越高代表生成內容的創造性愈高,以及有30種不同特色的聲音可供選擇。只要將語氣風格和對話內容寫在「Raw structure」,內容就會自動解析到「Script builder」中對應的欄位。
用中文生成語音的成品語調相當自然,只有少部分發音有些許誤差。
測試文字轉語音指令(由ChatGPT撰寫):
使用溫暖、愉快的語調 Speaker 1:哈囉~週末快到了,你有計畫去哪裡走走嗎? Speaker 2:如果還沒決定,不妨來場輕鬆的小旅行,換個心情,放慢腳步。 Speaker 1:搭火車去山裡喝杯咖啡,或是在海邊散步看夕陽,怎麼樣? Speaker 2:生活不一定要很遠才精采,有時候,一場說走就走的微旅行,就是最好的充電方式! |
Google AI Studio功能3:用文字建立App
用文字生成應用程式的「Build」功能,是Google今年5月時推出的新功能。只要輸入文字提示,就可以建立能在網頁上運作的應用程式,也能在上面參考和試用別人生成的作品。
其中一個有趣實用的工具為「Magical GIF Maker」,只要輸入文字描述,AI就會生成10張小插圖,並自動製作成會動且角色統一的GIF圖。
此外,也實測了以文字指令生成一個以魔法為主題的文字網頁遊戲。其不只能在短時間內生成多個程式文件,還能直接在畫面中試用成果。整體而言,只輸入一次指令,AI就能生成出完成度非常高、能直接遊玩的遊戲,並且即使沒有在指令中詳細說明視覺設計元素,其也有依照遊戲主題設計風格相符的視覺。
測試文字生成網頁App指令(由ChatGPT撰寫):
遊戲名稱叫《語者之塔》(Tower of the Word Mage),遊戲玩法如下: 1. 玩家是一名語言魔法師,要挑戰 10 層語言之塔,每一層都有一個語言謎題。
|
Google AI Studio VS 付費 Gemini VS 免費 Gemini 比較
最後針對可免費使用的Google AI Studio,以及Gemini網站的付費版和免費版進行比較:
項目 | 費用 | 可使用AI模型 | 影片生成 | 深度研究(Deep Research) | 優缺點 |
---|---|---|---|---|---|
Google AI Studio | 免費 | Gemini 2.5 Pro、Gemini 2.5 Flash、Gemini 2.5 Flash Preview 04-17(早期預覽版)、Gemini 2.5 Flash-Lite Preview 06-17(輕量版Flash) *此外還有更早的Gemini 2.0、開源模型Gemma等 | 可使用Veo2,早上等離峰時段生成速度可能較快 | 無,但可調整思考參數,決定模型思考能力 |
|
付費 Gemini | ● Pro:650元/月 (此費用另含雲端空間、NotebookLM等其他服務) | Gemini 2.5 Pro、Gemini 2.5 Flash | ● Pro:Veo3 Fast(快速版)● Ultra:Veo3(高品質版) | 可使用Gemini 2.5 Pro、Gemini 2.5 Flash的深度研究 |
|
免費 Gemini | 免費 | Gemini 2.5 Pro、Gemini 2.5 Flash *可使用次數較少 | 沒有影片生成功能 | 僅可使用Gemini 2.5 Flash的深度研究 | |
資料來源:Google Gemini 官網|資料整理:郭宇璇 |