Gemini 3登場！怎麼用？生成式介面如何顛覆互動體驗？

最近股神巴菲特創立的波克夏，積極投資持股Google，引發熱議。這間矽谷老牌平台公司，在AI時代下是否將有驚人進展？今日Google官方宣布正式推出最新一代模型Gemini 3，不管是消費者、開發者還是企業，都能直接在各自對應的入口使用Gemini 3。除了強調性能以外，在發布記者會上，Google勾勒出的願景益發抽象，卻希望使用者更加有感，為何如此？新功能「生成式介面」是什麼？如何顛覆現在的網路介面設計，將互動做到極致？

經歷LaMDA、PaLM等不同模型迭代以後，2023年1月，Google正式推出第一代旗艦模型Gemini 1.0，往後鑲嵌於產品、提供給開發者的模型便由Gemini所主宰。

再相隔一年，2024年2月，Google推出Gemini 2.0；邁入2025年的今天（11/19），Google正式宣布Gemini 3即刻上線。

開啟新一代互動模式，邁入生成式介面時代

每次發表新模型，都能看到Google官方強調不同重點。Gemini 1.0的核心是強調模型具備多模態能力，而且能夠理解長文本（long context），Gemini 2.0則更加擅長程式設計，且往能夠進階推理的代理時代（agentic era）邁進，中間的Gemini 2.5 Pro則是在與競爭對手比拚下確立其性能優異。

從追求具體的技術指標，進化到更抽象、更貼近使用者的代理式能力，這次的Gemini 3，在Google DeepMind技術長暨首席AI架構師武庫格魯（Koray Kavukcuoglu）口中，願景則是「將任何想法變為現實」，希望賦能使用者學習、創建和規劃任何事。

武庫格魯拋出幾個關於Gemini 3的關鍵字：注重事實、適合用來學習、多模態理解最優秀、最強大的代理模型、適合Vibe Coding。

Google DeepMind技術長柯瑞（Koray Kavukcuoglu，右一）表示，Gemini 3即日起將開放給消費者、開發者與企業，這也是Google首次在推出Gemini新版本的第一天就將其導入到搜尋服務中。曾子軒攝

這些能力上的特性，與Google的產品與策略串聯在一起，能夠帶來哪些改變？

負責Gemini應用程式的Google產品副總裁史德魯哈（Chris Struhar）指出，最直接的進步，體現在Gemini的對話上，更能夠回答使用者的問題，且格式更清楚、長度也更簡潔。

文字以外，生成圖像時，視覺效果的逼真度和豐富度也跟著提升。只要提升模型生成內容的品質，便能最直接改善消費者的使用體驗。

Gemini 3的生成式介面是什麼？

更進一步，Google還希望藉著模型的多模態理解與推理能力，推進介面設計的極限。「Gemini 3已經解鎖一種我們稱之為『生成式介面』（generative interfaces）的東西。」

史德魯哈解釋，這類介面不再只是呈現文字答案，而是讓模型能根據使用者需求即時生成全新的互動形式，包括排版、模組與操作邏輯，讓資訊超越既有框架，能夠以更直覺、更人性化的方式呈現。

他以兩個早期實驗為例：視覺布局（Visual Layouts）與動態版面（Dynamic Views），前者能生成沉浸式的雜誌風格布局，以照片與模組呈現資訊，這些元素不僅美觀，也會邀請使用者提供更多脈絡，讓回應變得更貼近個人。

倘若使用者希望規劃三天的羅馬之旅，過往Gemini可能列出一份文字報告，有列點、有表格，但進化後的Gemini則會生成一個配有圖片、可供探索的行程，讓消費者體驗更好。

動態版面則展現Gemini 3的代理式程式設計能力，模型會根據使用者的需求即時設計、編寫客製化的使用者介面。例如，你要求它解釋梵谷畫廊，並為每件作品附上生平背景，會得到一個完全互動式的回應，可供點擊、拖曳，並以文字無法達到的方式探索內容。

與Gemini應用程式對話以外，Google與其他競爭對手的差異，在於其手握多達15個5億使用者的產品，Google的老本行搜尋引擎便是一例。

訂閱遠見送Arowana 1:9前開式行李箱，20吋登機、輕旅超實用，趁現在入手最划算>>

Google搜尋的AI模式能夠在回答使用者的提問時，即時生成新的介面幫助使用者理解。Google提供

負責Google搜尋的Google產品副總裁史佃（Robby Stein）表示，深度結合Gemini的AI搜尋結果AI Mode，將不只是利用AI拆解問題、大量查詢、彙整資料而已，就像在Gemini應用程式中的改善，搜尋結果將能即時生成介面，例如使用者問及房貸，可以產生房貸計算器、房貸如何運作的解釋，讓使用者輸入財務狀況，並且看到結果。

持續增加解決複雜任務的代理能力

在改善互動介面以外，Google也持續改善Gemini執行任務的代理能力，例如在Gemini 裡面整理信箱，它能夠查看信件、排定優先順序，甚至草擬回信，最後再讓使用者確認。

「代理被設計成在進行關鍵操作之前會尋求確認，而且你可以隨時接管。」史德魯哈強調，這是邁向「真正通用代理」的一大步。

提升內容品質、提供生成式介面、增加代理能力，彙整起來便是Gemini 3的三大重點。雖然在釋出新模型時談的願景更加抽象，上升到改善使用者體驗的層次，但也能看見Google想要將難以掌握的AI能力，轉化為一般消費者也能有感的進步。

Gemini應用程式會自主分拆任務，並且在關鍵節點讓使用者確認。Google提供

另外，為了往Agent時代邁進，Google也同步推出全新的代理式開發平台Antigravity。

Google 在今年推出的新型開發工具 Antigravity，是一款以「代理」為核心打造的全新整合開發環境（IDE），目的在於讓大型語言模型（LLM）能更深度參與軟體開發流程。它內建專用的代理介面，使開發者能以高層次的任務方式下指令，而代理則能在編輯器、終端機與內建瀏覽器中自主操作，協助完成原本需要大量人工處理的複雜任務。

面對《遠見》記者提問Antigravity在Google現有開發者生態系中的定位時，武庫格魯表示，LLM 已經徹底改變工程師撰寫程式的方式，使他們能從細節中解放，改以目標導向的方式思考。Antigravity 的定位，就是在這種轉變上更往前推，把「代理協作」正式帶入下一代IDE。

他進一步解釋，雖然Google的模型仍會繼續支援其他IDE，也能讓開發者繼續調用API，但Antigravity的價值在於讓Google更可以直接理解開發者的真實使用情境與任務需求，並把這些回饋反映到模型設計上。

當被問及與Cursor等平台的競爭關係時，他明確表示，雙方其實有「非常密切的合作」，Google會繼續與眾多IDE保持伙伴關係。作為以代理為核心打造的新型 IDE，他強調Antigravity代表著重新思考軟體開發流程的起點，也有機會推動下一階段的工程效率提升。

武庫格魯指出，Antigravity讓開發者能夠擁有真正高層次、以任務為導向的代理式介面。Google提供