Google I/O 2026：Gemini 3.5、Omni、Spark登場，Google把AI代理帶進搜尋、購物與日常工作

Google於今日（05/20）台灣凌晨舉辦年度開發者大會Google I/O，端出Gemini 3.5、Gemini Omni、搜尋中的資訊代理、購物用的智慧購物車，以及可在背景持續運作的Gemini Spark等多項更新。相較去年著重AI Mode、Gemini Live與個人化體驗，今年Google把更多篇幅放在AI Agent（AI代理），讓消費者能夠在搜尋、購物、文件中，體驗到AI Agent的威力。《遠見》整理重點帶您一次看。

整理今年Google I/O的內容，大致有幾條主線：Gemini模型再升級、搜尋進一步AI化、購物流程納入代理能力、Gemini App改版，以及更多Workspace與日常工具的整合。

若要歸結各項更新背後的共通點，Google執行長皮蔡（Sundar Pichai）其中一段話值得注意。

「我們將代理功能帶給開發者與企業已經有一段時間了。現在，我們非常專注於將這種前沿的代理能力安全、可靠地帶給一般消費者，讓它能為所有人服務。」皮蔡說道。

對皮蔡來說，現階段Google最重要的工作，就是把AI能力落到人們每天會用到的產品裡。

掌握2026年的Google I/O
整理｜Google I/O 2026：Gemini 3.5、Omni、Spark登場，Google把AI代理帶進搜尋、購物與日常工作
分析｜Google I/O 2026：皮蔡的AI Agent新入口是什麼？

Google Gemini模型升級在哪？

模型更新仍是Google I/O的重頭戲之一，今年Gemini模型同時有兩個方向的升級，Omni主打包含影音生成在內的多模態輸入與輸出，3.5 Flash則瞄準速度與代理任務。

Google DeepMind執行長哈薩比斯（Demis Hassabis）介紹，Google今年推出全新模型Gemini Omni，主打從「任何輸入」生成「任何輸出」，第一步先從影片開始。

他解釋，使用者不只能夠輸入文字，也可混合音訊、圖片與影片，讓模型產生新影片，或直接修改既有影片的角色、細節與風格。

首波產品化版本為Gemini Omni Flash，預計將會先開放給Google AI訂戶，落地產品包含Gemini App、Google Flow與YouTube Shorts，後續也會透過API提供給開發者與企業客戶。

另一條模型更新主線，則是Gemini 3.5系列。

Google DeepMind執行長哈薩比斯（Demis Hassabis）表示，Google今年同步更新Gemini Omni與Gemini 3.5 Flash，前者擴大多模態生成能力，後者則主打速度、推理與代理任務。

皮蔡指出，Gemini 3.5 Flash是Google第一個結合「前沿智慧」與「行動力」的模型，在幾乎所有基準測試中都優於3.1 Pro，卻保有更快的輸出速度，而且，3.5 Flash在代理式開發、工具調用與長週期任務上進步明顯，適合處理更複雜的工作流程。

哈薩比斯另外提到，Gemini 3.5 Flash能支援長達數小時的自主作業，處理程式碼、重複式研究與資料分析等任務。

Google也預告下個月將推出更強大的Gemini 3.5 Pro。

正因為Gemini 3.5 Flash足夠聰明，又有強勁的成本優勢，才讓Google I/O上其他AI Agent功能成為可能。否則長時間、跨應用程式的任務消耗大量符元（token），若沒有Gemini 3.5 Flash支撐，皮蔡口中讓Agent能為所有人服務的願景恐怕很難實現。

AI搜尋再進化，另外加入代理版Google Alerts

搜尋仍是Google最重要的AI落地場景。

去年的Google I/O幾項更新中，最受外界關注的就是搜尋業務加入AI以後，使用者需等候更長時間，每次推論都更加昂貴，又不確定AI搜尋應該如何整合廣告。

經過一年時間，Google在財報上證明AI搜尋的確有利可圖，皮蔡也在大會上分享，AI總覽（AI Overviews）目前每月活躍用戶超過25億，AI Mode在一年內月活躍用戶突破10億。

Google搜尋負責人雷德（Liz Reid）則說，Google接下來會繼續把AI能力往搜尋核心推進。

這次更新裡，Google將AI Mode背後的模型升級為Gemini 3.5 Flash，並推出新的智慧搜尋框（Intelligent Search box）。

從AI Mode到Information Agents，Google持續把Gemini能力推進搜尋核心，讓搜尋從回覆問題延伸到背景追蹤任務。Google YouTube

新的搜尋框會自動展開，支援更長、更口語化的查詢內容，也會利用AI協助使用者組織複雜提問，既能夠幫助使用者釐清意圖，也讓使用者可以更加深入地搜尋，有望替Google帶來更高的營收。

此外，AI Overview與AI Mode之間的切換也會更加順暢。使用者在看到AI摘要後，可直接延伸追問，進入更完整的對話式搜尋體驗。

雷德表示，搜尋行為正在改變，人們會提出更細節、更長的問題，也更常進行後續追問。她說，Google正在打造的，是「真正的AI搜尋體驗」。

今年的搜尋更新也納入代理能力。Google將推出資訊代理（Information Agents），近似於在既有的Google Alert上加入AI Agent的能力。

舉例來說，若想長期追蹤某個產業的市場變化，AI Agent可在背景持續監控條件、整理更新，並在關鍵時刻回報結果與相關連結。

除了追蹤資訊，Google也打算把生成式使用者介面帶入搜尋。搜尋可依照問題即時生成互動式圖表、小工具與具狀態記憶的mini-apps，讓使用者透過自然語言建立專屬工具。

AI搜尋的首波更新，預計將先向美國Google AI Pro與Ultra訂閱戶開放，再逐步擴大。

清除腦袋的盲點，也順手理清生活的雜亂。點開看質感養成術>>

購物AI Agent強在哪？Google推智慧購物車與代理支付

購物是Google今年另一個大幅更新的場景。

Google廣告與商務團隊主管胥黎法珊（Vidhya Srinivasan）表示，Google每天有超過10億人次進行購物搜尋，背後依靠的是Google Shopping Graph，目前已收錄超過600億筆持續更新的商品清單。

在這個基礎上，Google今年提出「代理商務」的三項核心基礎。

第一是Universal Commerce Protocol（UCP），讓AI代理、商家與各類系統能在產品研究、結帳到物流追蹤等流程中使用共同標準協作。Google表示，Amazon、Meta、微軟、Salesforce與Stripe等公司已加入UCP技術委員會。

第二項是Agent Payments Protocol（AP2）。Google希望讓代理在明確的預算與條件限制下，安全地替使用者完成支付。

胥黎法珊表示，使用者可先設定品牌、商品與預算上限，只有在符合條件時，代理才會下單。她說，AP2的設計目的，是讓AI代理「在明確的界線與當責機制下，安全地代您進行支付」。Google也強調，AP2會保留可驗證的數位紀錄，處理退貨時，使用者與商家看到的是同一份資料。

Google把購物圖譜與Gemini模型結合，推出Universal Cart與AP2，進一步把AI帶進比價、追價與支付流程。Google YouTube

第三項則是Universal Cart。這是一個可橫跨商家、裝置與跨Google產品運作的智慧購物車，使用者可在搜尋、Gemini、YouTube甚至Gmail中把商品放入購物車，之後系統會在背景追蹤價格、補貨、歷史價格走勢，甚至檢查商品間的相容性。

Google舉例，若使用者正在組裝客製化電腦，購物車可主動發現處理器與主機板不相容，並提出替代方案。Universal Cart預計今年夏天率先在美國上線，先支援搜尋與Gemini App，後續再擴及YouTube與Gmail。

Gemini App改版，Google推出自家AI助理

Gemini App也是今年更新的重心。

Google實驗室與Gemini團隊主管伍德沃德（Josh Woodward）表示，Gemini App目前月活躍用戶已超過9億，並已在230多個國家與地區上線，支援70多種語言。

在介面上，Google推出全新設計語言Neural Expressive，強調更鮮明的色彩、動畫效果、觸覺回饋，以及更便於閱讀的資訊排版；Gemini Live也會改為更即時、內嵌式的使用方式，不需要再切換不同模式，這套新介面將從5月19日起在Android、iOS與網頁版陸續推出。

創意功能方面，Gemini App將整合Gemini Omni，使用者可上傳照片或影片，套用範本生成新內容，甚至建立外貌與聲音都更接近自己的avatar。

在代理功能上，Google今年推出Daily Brief，讓Gemini在夜間整理收件匣、日曆與重要任務，形成每天早晨的個人化摘要，並提供後續行動建議。伍德沃德解釋，這項功能源自Google Labs先前測試的實驗項目，現在將正式整合進Gemini App中。

另一項新產品是Gemini Spark。皮蔡形容，Spark是「專屬個人AI代理」，可在Google Cloud的專屬虛擬機器上全天候運作。即使使用者關掉手機或筆電，Spark依然能在背景持續處理任務。

Gemini App今年除了介面改版，也加入Daily Brief與Gemini Spark，讓AI從聊天工具往背景助理延伸。Google YouTube

依照Google展示的情境，Spark可從Gmail、文件、試算表與簡報中擷取資訊，草擬進度報告；也可協助學生維護學習指南，或替小型企業管理收件匣。

後續Spark還會加入MCP串接、子代理、Chrome能力，以及Android Halo介面，用來顯示即時進度與任務狀態。伍德沃德說，AI代理「不再只是回答問題，它們會主動代表您去執行任務」。

Google表示，Spark會先以較保守的方式推出，先向受信任測試者開放，再向美國Google AI Ultra訂閱戶推出Beta版。

Google把對話式AI帶進更多日常產品

除了Gemini App，Google也把更自然的AI互動帶進既有產品。

皮蔡在簡報中提到，先前Google地圖迎來10年來最大升級，加入Ask Maps功能，讓使用者能提出更複雜、更長的問題。

現在，Google即將把與既有產品語音互動的功能，整合到YouTube和Google Doc當中。

皮蔡解釋，使用者透過YouTube找答案時，Ask YouTube功能可協助篩出更貼近興趣的影片，並直接跳到影片裡最相關的片段。Google目前已開始測試Ask YouTube，預計今年夏天在美國廣泛推出。

Google把對話式AI能力帶進地圖、YouTube與文件編輯流程，進一步擴大Gemini在日常產品裡的角色。Google YouTube

在生產力工具方面，Docs Live把語音輸入、文件編輯與個人資料整合，使用者可以直接用語音說出需求，Gemini會從Google雲端硬碟讀取履歷、從Gmail抓取相關信件資訊，協助建立文件草稿，再根據進一步指示調整成表格、補充提醒或改動排版。

皮蔡說，過去若要用Gemini建立文件，使用者得打出精確提示詞，有了Docs Live之後，只要把想法直接說出口即可。

皮蔡表示，Docs Live會在今年夏天先向Pro與Ultra訂閱戶推出，之後類似的語音能力也會進一步進入Gmail與Google Keep。

Antigravity 2.0與CodeMender同步亮相，代理平台也往開發者擴展

雖然今年簡報有不少消費者功能，Google也沒有忽略開發者端。卡夫克丘歐魯表示，Google將推出Antigravity 2.0，把原本的程式設計環境擴展為可管理自主代理團隊的平台。

新版本包含獨立桌面應用程式、CLI與SDK，讓開發者可同時編排多個代理處理寫碼、設計與架構規劃任務。Google同時推出CodeMender，利用Gemini模型自動發現與修補關鍵程式漏洞。今年的代理相關工具，也同步延伸到工程與安全流程。

除了消費者產品，Google今年也把代理能力推向開發者工具，推出Antigravity 2.0。Google YouTube

Google從模型升級到AI Agent落地

本次Google I/O的更新，同樣橫跨Google旗下不同事業群，但背後共享的軸線，已和去年有些不同。

去年皮蔡強調智慧、代理與個人化，今年Google除了模型以外，更明確聚焦在深化舊入口，同時創造新入口。

模型，仍是Google所有更新的基礎。從Gemini 3.5 Flash到Gemini Omni，Google一方面強調更快的速度、更強的推理與開發能力，另一方面也把多模態能力從輸入延伸到輸出，讓模型不只理解文字、圖片與影片，也能直接生成與編輯內容。

深化舊入口，則是Google延續去年的主線，眼見AI Overview與AI Mode已在搜尋累積出明顯成效，Google也更有把握繼續利用AI改善既有產品體驗。Gmail、文件、YouTube與地圖等服務，仍是Google接觸使用者最重要的通路，今年AI Mode升級、Docs Live，還有對話式功能進一步進入地圖與YouTube，都顯示Google持續把AI能力往既有產品核心推進。

創造新入口，則是Google再多走一步。過去外界反覆談論「App已死」與全新人機介面，始終停留在概念階段；今年Google則試著透過AI agent，讓概念接近現實。使用者開始直接交辦任務，從Gemini Spark、Daily Brief到Information Agents與Universal Cart，Google已經超越改善既有入口，試圖創造新的接觸點。

模型、深化舊入口與創造新入口三者互相配合，構成Google今年I/O更新的共同方向。比起去年先替AI打地基，今年Google更進一步，開始測試如何把這些能力推進到使用者每天會碰到的產品與流程裡。

回顧2025年的Google I/O
歸納｜Google I/O：除Gemini 升級！還有哪些更新？
分析｜Google I/O ：從搜尋老本到AI工廠，皮蔡如何革命？