指定教師免費 指定教師免費 5/1-5/31期間登記,即可暢讀《遠見線上讀》一個月

Google I/O 2026:Gemini 3.5、Omni、Spark登場,Google把AI代理帶進搜尋、購物與日常工作

曾子軒
user

曾子軒

2026-05-20

瀏覽數

Google執行長皮蔡表示,Google當前最重要的工作,是把AI能力落到人們每天會用到的產品裡。Google YouTube
Google執行長皮蔡表示,Google當前最重要的工作,是把AI能力落到人們每天會用到的產品裡。Google YouTube
00:00
00:00

Google於今日(05/20)台灣凌晨舉辦年度開發者大會Google I/O,端出Gemini 3.5、Gemini Omni、搜尋中的資訊代理、購物用的智慧購物車,以及可在背景持續運作的Gemini Spark等多項更新。相較去年著重AI Mode、Gemini Live與個人化體驗,今年Google把更多篇幅放在AI Agent(AI代理),讓消費者能夠在搜尋、購物、文件中,體驗到AI Agent的威力。《遠見》整理重點帶您一次看。

整理今年Google I/O的內容,大致有幾條主線:Gemini模型再升級、搜尋進一步AI化、購物流程納入代理能力、Gemini App改版,以及更多Workspace與日常工具的整合。

若要歸結各項更新背後的共通點,Google執行長皮蔡(Sundar Pichai)其中一段話值得注意。

「我們將代理功能帶給開發者與企業已經有一段時間了。現在,我們非常專注於將這種前沿的代理能力安全、可靠地帶給一般消費者,讓它能為所有人服務。」皮蔡說道。

對皮蔡來說,現階段Google最重要的工作,就是把AI能力落到人們每天會用到的產品裡。

Google Gemini模型升級在哪?

模型更新仍是Google I/O的重頭戲之一,今年Gemini模型同時有兩個方向的升級,Omni主打包含影音生成在內的多模態輸入與輸出,3.5 Flash則瞄準速度與代理任務。

Google DeepMind執行長哈薩比斯(Demis Hassabis)介紹,Google今年推出全新模型Gemini Omni,主打從「任何輸入」生成「任何輸出」,第一步先從影片開始。

他解釋,使用者不只能夠輸入文字,也可混合音訊、圖片與影片,讓模型產生新影片,或直接修改既有影片的角色、細節與風格。

首波產品化版本為Gemini Omni Flash,預計將會先開放給Google AI訂戶,落地產品包含Gemini App、Google Flow與YouTube Shorts,後續也會透過API提供給開發者與企業客戶。

另一條模型更新主線,則是Gemini 3.5系列。

Google DeepMind執行長哈薩比斯(Demis Hassabis)表示,Google今年同步更新Gemini Omni與Gemini 3.5 Flash,前者擴大多模態生成能力,後者則主打速度、推理與代理任務。

Google DeepMind執行長哈薩比斯(Demis Hassabis)表示,Google今年同步更新Gemini Omni與Gemini 3.5 Flash,前者擴大多模態生成能力,後者則主打速度、推理與代理任務。

皮蔡指出,Gemini 3.5 Flash是Google第一個結合「前沿智慧」與「行動力」的模型,在幾乎所有基準測試中都優於3.1 Pro,卻保有更快的輸出速度,而且,3.5 Flash在代理式開發、工具調用與長週期任務上進步明顯,適合處理更複雜的工作流程。

哈薩比斯另外提到,Gemini 3.5 Flash能支援長達數小時的自主作業,處理程式碼、重複式研究與資料分析等任務。

Google也預告下個月將推出更強大的Gemini 3.5 Pro。

正因為Gemini 3.5 Flash足夠聰明,又有強勁的成本優勢,才讓Google I/O上其他AI Agent功能成為可能。否則長時間、跨應用程式的任務消耗大量符元(token),若沒有Gemini 3.5 Flash支撐,皮蔡口中讓Agent能為所有人服務的願景恐怕很難實現。

AI搜尋再進化,另外加入代理版Google Alerts

搜尋仍是Google最重要的AI落地場景。

去年的Google I/O幾項更新中,最受外界關注的就是搜尋業務加入AI以後,使用者需等候更長時間,每次推論都更加昂貴,又不確定AI搜尋應該如何整合廣告。

經過一年時間,Google在財報上證明AI搜尋的確有利可圖,皮蔡也在大會上分享,AI總覽(AI Overviews)目前每月活躍用戶超過25億,AI Mode在一年內月活躍用戶突破10億。

Google搜尋負責人雷德(Liz Reid)則說,Google接下來會繼續把AI能力往搜尋核心推進。

這次更新裡,Google將AI Mode背後的模型升級為Gemini 3.5 Flash,並推出新的智慧搜尋框(Intelligent Search box)。

從AI Mode到Information Agents,Google持續把Gemini能力推進搜尋核心,讓搜尋從回覆問題延伸到背景追蹤任務。Google YouTube

從AI Mode到Information Agents,Google持續把Gemini能力推進搜尋核心,讓搜尋從回覆問題延伸到背景追蹤任務。Google YouTube

新的搜尋框會自動展開,支援更長、更口語化的查詢內容,也會利用AI協助使用者組織複雜提問,既能夠幫助使用者釐清意圖,也讓使用者可以更加深入地搜尋,有望替Google帶來更高的營收。

此外,AI Overview與AI Mode之間的切換也會更加順暢。使用者在看到AI摘要後,可直接延伸追問,進入更完整的對話式搜尋體驗。

雷德表示,搜尋行為正在改變,人們會提出更細節、更長的問題,也更常進行後續追問。她說,Google正在打造的,是「真正的AI搜尋體驗」。

今年的搜尋更新也納入代理能力。Google將推出資訊代理(Information Agents),近似於在既有的Google Alert上加入AI Agent的能力。

舉例來說,若想長期追蹤某個產業的市場變化,AI Agent可在背景持續監控條件、整理更新,並在關鍵時刻回報結果與相關連結。

除了追蹤資訊,Google也打算把生成式使用者介面帶入搜尋。搜尋可依照問題即時生成互動式圖表、小工具與具狀態記憶的mini-apps,讓使用者透過自然語言建立專屬工具。

AI搜尋的首波更新,預計將先向美國Google AI Pro與Ultra訂閱戶開放,再逐步擴大。

購物AI Agent強在哪?Google推智慧購物車與代理支付

購物是Google今年另一個大幅更新的場景。

Google廣告與商務團隊主管胥黎法珊(Vidhya Srinivasan)表示,Google每天有超過10億人次進行購物搜尋,背後依靠的是Google Shopping Graph,目前已收錄超過600億筆持續更新的商品清單。

在這個基礎上,Google今年提出「代理商務」的三項核心基礎。

第一是Universal Commerce Protocol(UCP),讓AI代理、商家與各類系統能在產品研究、結帳到物流追蹤等流程中使用共同標準協作。Google表示,Amazon、Meta、微軟、Salesforce與Stripe等公司已加入UCP技術委員會。

建構AI創作邏輯 ,讓你不用再到處抄指令!職場必備AI文案力>>

第二項是Agent Payments Protocol(AP2)。Google希望讓代理在明確的預算與條件限制下,安全地替使用者完成支付。

胥黎法珊表示,使用者可先設定品牌、商品與預算上限,只有在符合條件時,代理才會下單。她說,AP2的設計目的,是讓AI代理「在明確的界線與當責機制下,安全地代您進行支付」。Google也強調,AP2會保留可驗證的數位紀錄,處理退貨時,使用者與商家看到的是同一份資料。

Google把購物圖譜與Gemini模型結合,推出Universal Cart與AP2,進一步把AI帶進比價、追價與支付流程。Google YouTube

Google把購物圖譜與Gemini模型結合,推出Universal Cart與AP2,進一步把AI帶進比價、追價與支付流程。Google YouTube

第三項則是Universal Cart。這是一個可橫跨商家、裝置與跨Google產品運作的智慧購物車,使用者可在搜尋、Gemini、YouTube甚至Gmail中把商品放入購物車,之後系統會在背景追蹤價格、補貨、歷史價格走勢,甚至檢查商品間的相容性。

Google舉例,若使用者正在組裝客製化電腦,購物車可主動發現處理器與主機板不相容,並提出替代方案。Universal Cart預計今年夏天率先在美國上線,先支援搜尋與Gemini App,後續再擴及YouTube與Gmail。

Gemini App改版,Google推出自家AI助理

Gemini App也是今年更新的重心。

Google實驗室與Gemini團隊主管伍德沃德(Josh Woodward)表示,Gemini App目前月活躍用戶已超過9億,並已在230多個國家與地區上線,支援70多種語言。

在介面上,Google推出全新設計語言Neural Expressive,強調更鮮明的色彩、動畫效果、觸覺回饋,以及更便於閱讀的資訊排版;Gemini Live也會改為更即時、內嵌式的使用方式,不需要再切換不同模式,這套新介面將從5月19日起在Android、iOS與網頁版陸續推出。

創意功能方面,Gemini App將整合Gemini Omni,使用者可上傳照片或影片,套用範本生成新內容,甚至建立外貌與聲音都更接近自己的avatar。

在代理功能上,Google今年推出Daily Brief,讓Gemini在夜間整理收件匣、日曆與重要任務,形成每天早晨的個人化摘要,並提供後續行動建議。伍德沃德解釋,這項功能源自Google Labs先前測試的實驗項目,現在將正式整合進Gemini App中。

另一項新產品是Gemini Spark。皮蔡形容,Spark是「專屬個人AI代理」,可在Google Cloud的專屬虛擬機器上全天候運作。即使使用者關掉手機或筆電,Spark依然能在背景持續處理任務。

Gemini App今年除了介面改版,也加入Daily Brief與Gemini Spark,讓AI從聊天工具往背景助理延伸。Google YouTube

Gemini App今年除了介面改版,也加入Daily Brief與Gemini Spark,讓AI從聊天工具往背景助理延伸。Google YouTube

依照Google展示的情境,Spark可從Gmail、文件、試算表與簡報中擷取資訊,草擬進度報告;也可協助學生維護學習指南,或替小型企業管理收件匣。

後續Spark還會加入MCP串接、子代理、Chrome能力,以及Android Halo介面,用來顯示即時進度與任務狀態。伍德沃德說,AI代理「不再只是回答問題,它們會主動代表您去執行任務」。

Google表示,Spark會先以較保守的方式推出,先向受信任測試者開放,再向美國Google AI Ultra訂閱戶推出Beta版。

Google把對話式AI帶進更多日常產品

除了Gemini App,Google也把更自然的AI互動帶進既有產品。

皮蔡在簡報中提到,先前Google地圖迎來10年來最大升級,加入Ask Maps功能,讓使用者能提出更複雜、更長的問題。

現在,Google即將把與既有產品語音互動的功能,整合到YouTube和Google Doc當中。

皮蔡解釋,使用者透過YouTube找答案時,Ask YouTube功能可協助篩出更貼近興趣的影片,並直接跳到影片裡最相關的片段。Google目前已開始測試Ask YouTube,預計今年夏天在美國廣泛推出。

Google把對話式AI能力帶進地圖、YouTube與文件編輯流程,進一步擴大Gemini在日常產品裡的角色。Google YouTube

Google把對話式AI能力帶進地圖、YouTube與文件編輯流程,進一步擴大Gemini在日常產品裡的角色。Google YouTube

在生產力工具方面,Docs Live把語音輸入、文件編輯與個人資料整合,使用者可以直接用語音說出需求,Gemini會從Google雲端硬碟讀取履歷、從Gmail抓取相關信件資訊,協助建立文件草稿,再根據進一步指示調整成表格、補充提醒或改動排版。

皮蔡說,過去若要用Gemini建立文件,使用者得打出精確提示詞,有了Docs Live之後,只要把想法直接說出口即可。

皮蔡表示,Docs Live會在今年夏天先向Pro與Ultra訂閱戶推出,之後類似的語音能力也會進一步進入Gmail與Google Keep。

Antigravity 2.0與CodeMender同步亮相,代理平台也往開發者擴展

雖然今年簡報有不少消費者功能,Google也沒有忽略開發者端。卡夫克丘歐魯表示,Google將推出Antigravity 2.0,把原本的程式設計環境擴展為可管理自主代理團隊的平台。

新版本包含獨立桌面應用程式、CLI與SDK,讓開發者可同時編排多個代理處理寫碼、設計與架構規劃任務。Google同時推出CodeMender,利用Gemini模型自動發現與修補關鍵程式漏洞。今年的代理相關工具,也同步延伸到工程與安全流程。

除了消費者產品,Google今年也把代理能力推向開發者工具,推出Antigravity 2.0。Google YouTube

除了消費者產品,Google今年也把代理能力推向開發者工具,推出Antigravity 2.0。Google YouTube

Google從模型升級到AI Agent落地

本次Google I/O的更新,同樣橫跨Google旗下不同事業群,但背後共享的軸線,已和去年有些不同。

去年皮蔡強調智慧、代理與個人化,今年Google除了模型以外,更明確聚焦在深化舊入口,同時創造新入口。

模型,仍是Google所有更新的基礎。從Gemini 3.5 Flash到Gemini Omni,Google一方面強調更快的速度、更強的推理與開發能力,另一方面也把多模態能力從輸入延伸到輸出,讓模型不只理解文字、圖片與影片,也能直接生成與編輯內容。

深化舊入口,則是Google延續去年的主線,眼見AI Overview與AI Mode已在搜尋累積出明顯成效,Google也更有把握繼續利用AI改善既有產品體驗。Gmail、文件、YouTube與地圖等服務,仍是Google接觸使用者最重要的通路,今年AI Mode升級、Docs Live,還有對話式功能進一步進入地圖與YouTube,都顯示Google持續把AI能力往既有產品核心推進。

創造新入口,則是Google再多走一步。過去外界反覆談論「App已死」與全新人機介面,始終停留在概念階段;今年Google則試著透過AI agent,讓概念接近現實。使用者開始直接交辦任務,從Gemini Spark、Daily Brief到Information Agents與Universal Cart,Google已經超越改善既有入口,試圖創造新的接觸點。

模型、深化舊入口與創造新入口三者互相配合,構成Google今年I/O更新的共同方向。比起去年先替AI打地基,今年Google更進一步,開始測試如何把這些能力推進到使用者每天會碰到的產品與流程裡。

AI治理有方 新北市打造智慧城市資安新典範
數位專題

AI治理有方 新北市打造智慧城市資安新典範

洞察趨勢的新北市政府,以超前部署、積極布局的策略,致力打造宜居、創新的智慧城市,聚焦「基礎建設」、「關鍵技術」、「智慧應用」三大面向,新北市已同步展現具體成果,體現地方政府的前瞻思維與執行力。

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務