最近股神巴菲特創立的波克夏,積極投資持股Google,引發熱議。這間矽谷老牌平台公司,在AI時代下是否將有驚人進展?今日Google官方宣布正式推出最新一代模型Gemini 3,不管是消費者、開發者還是企業,都能直接在各自對應的入口使用Gemini 3。除了強調性能以外,在發布記者會上,Google勾勒出的願景益發抽象,卻希望使用者更加有感,為何如此?新功能「生成式介面」是什麼?如何顛覆現在的網路介面設計,將互動做到極致?
經歷LaMDA、PaLM等不同模型迭代以後,2023年1月,Google正式推出第一代旗艦模型Gemini 1.0,往後鑲嵌於產品、提供給開發者的模型便由Gemini所主宰。
再相隔一年,2024年2月,Google推出Gemini 2.0;邁入2025年的今天(11/19),Google正式宣布Gemini 3即刻上線。
開啟新一代互動模式,邁入生成式介面時代
每次發表新模型,都能看到Google官方強調不同重點。Gemini 1.0的核心是強調模型具備多模態能力,而且能夠理解長文本(long context),Gemini 2.0則更加擅長程式設計,且往能夠進階推理的代理時代(agentic era)邁進,中間的Gemini 2.5 Pro則是在與競爭對手比拚下確立其性能優異。
從追求具體的技術指標,進化到更抽象、更貼近使用者的代理式能力,這次的Gemini 3,在Google DeepMind技術長暨首席AI架構師武庫格魯(Koray Kavukcuoglu)口中,願景則是「將任何想法變為現實」,希望賦能使用者學習、創建和規劃任何事。
武庫格魯拋出幾個關於Gemini 3的關鍵字:注重事實、適合用來學習、多模態理解最優秀、最強大的代理模型、適合Vibe Coding。

這些能力上的特性,與Google的產品與策略串聯在一起,能夠帶來哪些改變?
負責Gemini應用程式的Google產品副總裁史德魯哈(Chris Struhar)指出,最直接的進步,體現在Gemini的對話上,更能夠回答使用者的問題,且格式更清楚、長度也更簡潔。
文字以外,生成圖像時,視覺效果的逼真度和豐富度也跟著提升。只要提升模型生成內容的品質,便能最直接改善消費者的使用體驗。
Gemini 3的生成式介面是什麼?
更進一步,Google還希望藉著模型的多模態理解與推理能力,推進介面設計的極限。「Gemini 3已經解鎖一種我們稱之為『生成式介面』(generative interfaces)的東西。」
史德魯哈解釋,這類介面不再只是呈現文字答案,而是讓模型能根據使用者需求即時生成全新的互動形式,包括排版、模組與操作邏輯,讓資訊超越既有框架,能夠以更直覺、更人性化的方式呈現。
他以兩個早期實驗為例:視覺布局(Visual Layouts)與動態版面(Dynamic Views),前者能生成沉浸式的雜誌風格布局,以照片與模組呈現資訊,這些元素不僅美觀,也會邀請使用者提供更多脈絡,讓回應變得更貼近個人。
倘若使用者希望規劃三天的羅馬之旅,過往Gemini可能列出一份文字報告,有列點、有表格,但進化後的Gemini則會生成一個配有圖片、可供探索的行程,讓消費者體驗更好。
動態版面則展現Gemini 3的代理式程式設計能力,模型會根據使用者的需求即時設計、編寫客製化的使用者介面。例如,你要求它解釋梵谷畫廊,並為每件作品附上生平背景,會得到一個完全互動式的回應,可供點擊、拖曳,並以文字無法達到的方式探索內容。
與Gemini應用程式對話以外,Google與其他競爭對手的差異,在於其手握多達15個5億使用者的產品,Google的老本行搜尋引擎便是一例。

負責Google搜尋的Google產品副總裁史佃(Robby Stein)表示,深度結合Gemini的AI搜尋結果AI Mode,將不只是利用AI拆解問題、大量查詢、彙整資料而已,就像在Gemini應用程式中的改善,搜尋結果將能即時生成介面,例如使用者問及房貸,可以產生房貸計算器、房貸如何運作的解釋,讓使用者輸入財務狀況,並且看到結果。
持續增加解決複雜任務的代理能力
在改善互動介面以外,Google也持續改善Gemini執行任務的代理能力,例如在Gemini 裡面整理信箱,它能夠查看信件、排定優先順序,甚至草擬回信,最後再讓使用者確認。
「代理被設計成在進行關鍵操作之前會尋求確認,而且你可以隨時接管。」史德魯哈強調,這是邁向「真正通用代理」的一大步。
提升內容品質、提供生成式介面、增加代理能力,彙整起來便是Gemini 3的三大重點。雖然在釋出新模型時談的願景更加抽象,上升到改善使用者體驗的層次,但也能看見Google想要將難以掌握的AI能力,轉化為一般消費者也能有感的進步。

另外,為了往Agent時代邁進,Google也同步推出全新的代理式開發平台Antigravity。
Google 在今年推出的新型開發工具 Antigravity,是一款以「代理」為核心打造的全新整合開發環境(IDE),目的在於讓大型語言模型(LLM)能更深度參與軟體開發流程。它內建專用的代理介面,使開發者能以高層次的任務方式下指令,而代理則能在編輯器、終端機與內建瀏覽器中自主操作,協助完成原本需要大量人工處理的複雜任務。
面對《遠見》記者提問Antigravity在Google現有開發者生態系中的定位時,武庫格魯表示,LLM 已經徹底改變工程師撰寫程式的方式,使他們能從細節中解放,改以目標導向的方式思考。Antigravity 的定位,就是在這種轉變上更往前推,把「代理協作」正式帶入下一代IDE。
他進一步解釋,雖然Google的模型仍會繼續支援其他IDE,也能讓開發者繼續調用API,但Antigravity的價值在於讓Google更可以直接理解開發者的真實使用情境與任務需求,並把這些回饋反映到模型設計上。
當被問及與Cursor等平台的競爭關係時,他明確表示,雙方其實有「非常密切的合作」,Google會繼續與眾多IDE保持伙伴關係。作為以代理為核心打造的新型 IDE,他強調Antigravity代表著重新思考軟體開發流程的起點,也有機會推動下一階段的工程效率提升。

Gemini App MAU達到6.5億,模型品質仍是關鍵
Gemini 3提升內容、介面、代理能力,讓消費者與開發者體驗更佳,先前的進步也反映在具體數字上。
史德魯哈分享,今年第三季的Gemini應用程式成長相當顯著,月活躍使用者從4.5億攀升至超過6.5億,其中,Nano Banana 在泰國、印尼、印度等地掀起病毒式傳播,成為推動使用量快速上升的關鍵之一;Gemini面向學生族群提供的優惠方案,也帶動大量年輕用戶把Gemini作為課業與學習的工具。
史德魯哈最後強調,模型品質仍是推動所有成長的核心,Gemini 2.5 Pro已展現出明顯成效,而隨著 Gemini 3正式上線,Google期待看到更多人透過新模型探索實際應用、創造新的互動方式,並推動下一階段的使用者成長。
「我們將持續拓展智慧、代理人及個人化的疆界,讓AI為每個人帶來實質的幫助。」Google執行長皮蔡在部落格中如此寫道。