Google於今日(05/20)台灣凌晨舉辦年度開發者大會Google I/O,端出Gemini 3.5、Gemini Omni、搜尋中的資訊代理、購物用的智慧購物車,以及可在背景持續運作的Gemini Spark等多項更新。相較去年著重AI Mode、Gemini Live與個人化體驗,今年Google把更多篇幅放在AI Agent(AI代理),讓消費者能夠在搜尋、購物、文件中,體驗到AI Agent的威力。《遠見》整理重點帶您一次看。
整理今年Google I/O的內容,大致有幾條主線:Gemini模型再升級、搜尋進一步AI化、購物流程納入代理能力、Gemini App改版,以及更多Workspace與日常工具的整合。
若要歸結各項更新背後的共通點,Google執行長皮蔡(Sundar Pichai)其中一段話值得注意。
「我們將代理功能帶給開發者與企業已經有一段時間了。現在,我們非常專注於將這種前沿的代理能力安全、可靠地帶給一般消費者,讓它能為所有人服務。」皮蔡說道。
對皮蔡來說,現階段Google最重要的工作,就是把AI能力落到人們每天會用到的產品裡。
Google Gemini模型升級在哪?
模型更新仍是Google I/O的重頭戲之一,今年Gemini模型同時有兩個方向的升級,Omni主打包含影音生成在內的多模態輸入與輸出,3.5 Flash則瞄準速度與代理任務。
Google DeepMind執行長哈薩比斯(Demis Hassabis)介紹,Google今年推出全新模型Gemini Omni,主打從「任何輸入」生成「任何輸出」,第一步先從影片開始。
他解釋,使用者不只能夠輸入文字,也可混合音訊、圖片與影片,讓模型產生新影片,或直接修改既有影片的角色、細節與風格。
首波產品化版本為Gemini Omni Flash,預計將會先開放給Google AI訂戶,落地產品包含Gemini App、Google Flow與YouTube Shorts,後續也會透過API提供給開發者與企業客戶。
另一條模型更新主線,則是Gemini 3.5系列。

皮蔡指出,Gemini 3.5 Flash是Google第一個結合「前沿智慧」與「行動力」的模型,在幾乎所有基準測試中都優於3.1 Pro,卻保有更快的輸出速度,而且,3.5 Flash在代理式開發、工具調用與長週期任務上進步明顯,適合處理更複雜的工作流程。
哈薩比斯另外提到,Gemini 3.5 Flash能支援長達數小時的自主作業,處理程式碼、重複式研究與資料分析等任務。
Google也預告下個月將推出更強大的Gemini 3.5 Pro。
正因為Gemini 3.5 Flash足夠聰明,又有強勁的成本優勢,才讓Google I/O上其他AI Agent功能成為可能。否則長時間、跨應用程式的任務消耗大量符元(token),若沒有Gemini 3.5 Flash支撐,皮蔡口中讓Agent能為所有人服務的願景恐怕很難實現。
AI搜尋再進化,另外加入代理版Google Alerts
搜尋仍是Google最重要的AI落地場景。
去年的Google I/O幾項更新中,最受外界關注的就是搜尋業務加入AI以後,使用者需等候更長時間,每次推論都更加昂貴,又不確定AI搜尋應該如何整合廣告。
經過一年時間,Google在財報上證明AI搜尋的確有利可圖,皮蔡也在大會上分享,AI總覽(AI Overviews)目前每月活躍用戶超過25億,AI Mode在一年內月活躍用戶突破10億。
Google搜尋負責人雷德(Liz Reid)則說,Google接下來會繼續把AI能力往搜尋核心推進。
這次更新裡,Google將AI Mode背後的模型升級為Gemini 3.5 Flash,並推出新的智慧搜尋框(Intelligent Search box)。

新的搜尋框會自動展開,支援更長、更口語化的查詢內容,也會利用AI協助使用者組織複雜提問,既能夠幫助使用者釐清意圖,也讓使用者可以更加深入地搜尋,有望替Google帶來更高的營收。
此外,AI Overview與AI Mode之間的切換也會更加順暢。使用者在看到AI摘要後,可直接延伸追問,進入更完整的對話式搜尋體驗。
雷德表示,搜尋行為正在改變,人們會提出更細節、更長的問題,也更常進行後續追問。她說,Google正在打造的,是「真正的AI搜尋體驗」。
今年的搜尋更新也納入代理能力。Google將推出資訊代理(Information Agents),近似於在既有的Google Alert上加入AI Agent的能力。
舉例來說,若想長期追蹤某個產業的市場變化,AI Agent可在背景持續監控條件、整理更新,並在關鍵時刻回報結果與相關連結。
除了追蹤資訊,Google也打算把生成式使用者介面帶入搜尋。搜尋可依照問題即時生成互動式圖表、小工具與具狀態記憶的mini-apps,讓使用者透過自然語言建立專屬工具。
AI搜尋的首波更新,預計將先向美國Google AI Pro與Ultra訂閱戶開放,再逐步擴大。
購物AI Agent強在哪?Google推智慧購物車與代理支付
購物是Google今年另一個大幅更新的場景。
Google廣告與商務團隊主管胥黎法珊(Vidhya Srinivasan)表示,Google每天有超過10億人次進行購物搜尋,背後依靠的是Google Shopping Graph,目前已收錄超過600億筆持續更新的商品清單。
在這個基礎上,Google今年提出「代理商務」的三項核心基礎。
第一是Universal Commerce Protocol(UCP),讓AI代理、商家與各類系統能在產品研究、結帳到物流追蹤等流程中使用共同標準協作。Google表示,Amazon、Meta、微軟、Salesforce與Stripe等公司已加入UCP技術委員會。
第二項是Agent Payments Protocol(AP2)。Google希望讓代理在明確的預算與條件限制下,安全地替使用者完成支付。
胥黎法珊表示,使用者可先設定品牌、商品與預算上限,只有在符合條件時,代理才會下單。她說,AP2的設計目的,是讓AI代理「在明確的界線與當責機制下,安全地代您進行支付」。Google也強調,AP2會保留可驗證的數位紀錄,處理退貨時,使用者與商家看到的是同一份資料。

第三項則是Universal Cart。這是一個可橫跨商家、裝置與跨Google產品運作的智慧購物車,使用者可在搜尋、Gemini、YouTube甚至Gmail中把商品放入購物車,之後系統會在背景追蹤價格、補貨、歷史價格走勢,甚至檢查商品間的相容性。
Google舉例,若使用者正在組裝客製化電腦,購物車可主動發現處理器與主機板不相容,並提出替代方案。Universal Cart預計今年夏天率先在美國上線,先支援搜尋與Gemini App,後續再擴及YouTube與Gmail。
Gemini App改版,Google推出自家AI助理
Gemini App也是今年更新的重心。
Google實驗室與Gemini團隊主管伍德沃德(Josh Woodward)表示,Gemini App目前月活躍用戶已超過9億,並已在230多個國家與地區上線,支援70多種語言。
在介面上,Google推出全新設計語言Neural Expressive,強調更鮮明的色彩、動畫效果、觸覺回饋,以及更便於閱讀的資訊排版;Gemini Live也會改為更即時、內嵌式的使用方式,不需要再切換不同模式,這套新介面將從5月19日起在Android、iOS與網頁版陸續推出。
創意功能方面,Gemini App將整合Gemini Omni,使用者可上傳照片或影片,套用範本生成新內容,甚至建立外貌與聲音都更接近自己的avatar。
在代理功能上,Google今年推出Daily Brief,讓Gemini在夜間整理收件匣、日曆與重要任務,形成每天早晨的個人化摘要,並提供後續行動建議。伍德沃德解釋,這項功能源自Google Labs先前測試的實驗項目,現在將正式整合進Gemini App中。
另一項新產品是Gemini Spark。皮蔡形容,Spark是「專屬個人AI代理」,可在Google Cloud的專屬虛擬機器上全天候運作。即使使用者關掉手機或筆電,Spark依然能在背景持續處理任務。

依照Google展示的情境,Spark可從Gmail、文件、試算表與簡報中擷取資訊,草擬進度報告;也可協助學生維護學習指南,或替小型企業管理收件匣。
後續Spark還會加入MCP串接、子代理、Chrome能力,以及Android Halo介面,用來顯示即時進度與任務狀態。伍德沃德說,AI代理「不再只是回答問題,它們會主動代表您去執行任務」。
Google表示,Spark會先以較保守的方式推出,先向受信任測試者開放,再向美國Google AI Ultra訂閱戶推出Beta版。
Google把對話式AI帶進更多日常產品
除了Gemini App,Google也把更自然的AI互動帶進既有產品。
皮蔡在簡報中提到,先前Google地圖迎來10年來最大升級,加入Ask Maps功能,讓使用者能提出更複雜、更長的問題。
現在,Google即將把與既有產品語音互動的功能,整合到YouTube和Google Doc當中。
皮蔡解釋,使用者透過YouTube找答案時,Ask YouTube功能可協助篩出更貼近興趣的影片,並直接跳到影片裡最相關的片段。Google目前已開始測試Ask YouTube,預計今年夏天在美國廣泛推出。

在生產力工具方面,Docs Live把語音輸入、文件編輯與個人資料整合,使用者可以直接用語音說出需求,Gemini會從Google雲端硬碟讀取履歷、從Gmail抓取相關信件資訊,協助建立文件草稿,再根據進一步指示調整成表格、補充提醒或改動排版。
皮蔡說,過去若要用Gemini建立文件,使用者得打出精確提示詞,有了Docs Live之後,只要把想法直接說出口即可。
皮蔡表示,Docs Live會在今年夏天先向Pro與Ultra訂閱戶推出,之後類似的語音能力也會進一步進入Gmail與Google Keep。
Antigravity 2.0與CodeMender同步亮相,代理平台也往開發者擴展
雖然今年簡報有不少消費者功能,Google也沒有忽略開發者端。卡夫克丘歐魯表示,Google將推出Antigravity 2.0,把原本的程式設計環境擴展為可管理自主代理團隊的平台。
新版本包含獨立桌面應用程式、CLI與SDK,讓開發者可同時編排多個代理處理寫碼、設計與架構規劃任務。Google同時推出CodeMender,利用Gemini模型自動發現與修補關鍵程式漏洞。今年的代理相關工具,也同步延伸到工程與安全流程。

Google從模型升級到AI Agent落地
本次Google I/O的更新,同樣橫跨Google旗下不同事業群,但背後共享的軸線,已和去年有些不同。
去年皮蔡強調智慧、代理與個人化,今年Google除了模型以外,更明確聚焦在深化舊入口,同時創造新入口。
模型,仍是Google所有更新的基礎。從Gemini 3.5 Flash到Gemini Omni,Google一方面強調更快的速度、更強的推理與開發能力,另一方面也把多模態能力從輸入延伸到輸出,讓模型不只理解文字、圖片與影片,也能直接生成與編輯內容。
深化舊入口,則是Google延續去年的主線,眼見AI Overview與AI Mode已在搜尋累積出明顯成效,Google也更有把握繼續利用AI改善既有產品體驗。Gmail、文件、YouTube與地圖等服務,仍是Google接觸使用者最重要的通路,今年AI Mode升級、Docs Live,還有對話式功能進一步進入地圖與YouTube,都顯示Google持續把AI能力往既有產品核心推進。
創造新入口,則是Google再多走一步。過去外界反覆談論「App已死」與全新人機介面,始終停留在概念階段;今年Google則試著透過AI agent,讓概念接近現實。使用者開始直接交辦任務,從Gemini Spark、Daily Brief到Information Agents與Universal Cart,Google已經超越改善既有入口,試圖創造新的接觸點。
模型、深化舊入口與創造新入口三者互相配合,構成Google今年I/O更新的共同方向。比起去年先替AI打地基,今年Google更進一步,開始測試如何把這些能力推進到使用者每天會碰到的產品與流程裡。