Google I/O：除Gemini 升級！還有哪些更新？

Google本週（5/20）舉行2025年開發者大會（Google I/O），試圖將底層AI模型的能力注入終端產品，再結合Google橫跨各端的通路優勢，實現「資訊變智慧、智慧更個人」的願景。隨著最新版本的Gemini 2.5模型進一步升級，整合至搜尋、購物與個人助理後，使用者是否真的能感受到AI帶來的改變？《遠見》一文整理帶你掌握完整消息。

【目錄】
▌Gemini 2.5 Pro要做最強大模型，Flash力求性價比
▌AI搜尋進化，變身能夠深入對話的AI模式
▌購物加上AI能提問、試穿，還能提醒結帳
▌Gemini助理加強，即時看螢幕、說話就互動
▌結語：智慧、代理以及個人化，打好產品+AI地基

Google執行長皮蔡（Sundar Pichai）在2025 Google I/O上，向Google員工、媒體和開發者說，Google發布新技術和新產品的速度，比以往任何時候都快。

「更多智慧正普及到每一個人、每一個角落。全世界也正迅速回應，以前所未有的速度採用AI。」

Gemini 2.5 Pro要做最強大模型，Flash力求性價比

回顧過去一年的基礎模型戰場，OpenAI同時維持兩條軸線，一邊是重視推理能力的o開頭系列模型，以及遵循擴展定律（scaling law），另一邊則是增加參數和資料量的GPT-4開頭系列模型。

Anthropic持續更新Claude，且將重點放在企業端使用者，對寫程式的應用尤為重視；DeepSeek訴求以較低成本推出表現仍優異的模型，也在AI爭霸戰寫下濃墨重彩的一筆。

至於Google，腳步則相對穩定，持續帶給使用者更加進步的Gemini模型，表現可說是中規中矩。今年在Google I/O舉辦前，沒有留給競爭對手突襲機會，本月初（5/6）便預先推出Gemini 2.5 Pro I/O版。

Google多次強調，從客觀數字來看，Gemini 2.5 Pro是現在市面最強大的基礎模型之一，不僅好幾項關鍵基準測試表現最為優異，還在大模型競技場上名列前茅，而且廣受開發者喜愛。

Google的AI舵手哈薩比斯（Demis Hassabis）分享，Google正在引入「深度思考」（deep think）的新模式，讓模型在回覆前能夠考量多種不同假設（hypotheses），藉此將模型的能力推向極限。

至於回應速度更快的輕量Flash系列模型，皮蔡表示，若以每秒產生的符元（token）數量計算，Gemini靠著2.5 Flash的兩個版本和2.0 Flash就包辦了前三名，而且還達到極高的性價比。「價格和效能之間有著嚴峻的權衡，但我們一次又一次以最具成本效益的價格提供最好的模型。」

哈薩比斯補充，Gemini 2.5 Flash雖然能力比不上Gemini 2.5 Pro，但是在推理、多模態、寫程式和長文本等不同面向上，都更加有效率。

另外，Google同步推出原生語音輸出（native audio out），讓Gemini模型能以自然語氣、口音與風格進行語音互動，開發者用來打造語音互動對話時，可調整語音語調，例如講故事時加入戲劇張力，甚至能辨識使用者語音中的情緒，帶給使用者更有情感的回應。

隨著推理能力成為模型提供者的兵家必爭之地，Google另外提供思考摘要（thought summaries），讓開發者清楚了解模型在思考過程中的重點、使用哪些工具與邏輯；為了衡量成本，也將過往Flash模型就有的思考預算（thinking budgets），延伸到Pro模型，如此一來，開發者調用API時可以自訂模型「思考」所消耗的符元，在成本與品質之間尋求平衡。

雖然人們擔心Gemini應用程式的知名度和使用者比不上ChatGPT，也連帶關注Gemini模型的聲勢無法和GPT系列模型相比，但考慮到Google既有的龐大生態系，只要Gemini模型持續更新，就算Gemini應用程式使用者比不過對手，只要整合到產品裡，Google就有一戰本錢。

AI搜尋進化，變身能夠深入對話的AI模式

在Google老本行搜尋業務上，去年推出AI概覽（AI overview），今年Google升級搜尋體驗，正式端出3月預告的AI模式（AI mode），戮力展開金雞母業務的全面革新。

AI概覽是將搜尋結果摘要，提拱使用者更能對應搜尋意圖的內容，但分析師們總是擔心，AI推論（inference）將讓搜尋成本提高，而且，因為使用者不用造訪網頁，就能得到解答，進而減少點擊連結的誘因，可能影響Google搜尋廣告帶來的豐沛營收。

在I/O前接受All-in Podcast採訪時，皮蔡表示，隨著技術進展，AI推論花費下降飛快，成本不是大問題；以AI概覽的廣告收益來說，也已經達到基準線（baseline），即便使用者獲取資訊的方式出現典範轉移，從傳統搜尋轉向AI問答，也不會和Google的核心商業模式產生衝突。

皮蔡也在I/O上分享，人們實際使用AI概覽以後，對搜尋結果益發滿意，且搜尋頻率也愈來愈高，可以看出AI增進搜尋體驗的效果，他語氣強烈地表示，「（AI輔助搜尋）這是過去十年來搜尋領域最成功的發布之一。」

皮蔡樂觀表示，AI概覽帶動使用者的查詢，且預期成長會隨著時間推移增加。曾子軒攝

如果說AI概覽是Google的牛刀小試，則AI模式就是真槍實彈地全心投入。

Google副總裁暨搜尋負責人雷德（Liz Reid）認為，時代轉變之下，Google提供的價值已經從組織資訊，轉變為提供智慧，靠著底層模型的先進推理能力，深化搜尋的強度與深度，AI模式不只是排序、整理，更要重新編排，帶來更多洞見，回答使用者的複雜問題。

使用者運用AI模式時，AI會將使用者提出的問題分解成許多細項，再逐一尋找每個子題的內容，最後彙整成完整回答，如此一來，便不會局限在包含大量資訊、但未必能夠解決問題的網頁上。

皮蔡提到，AI模式早期測試者的查詢長度是傳統搜尋的兩到三倍，且可以深入對話、持續提出新問題，視覺查詢的數量更是年增超過65%。

AI模式之所以能夠運作，背後就是靠著Gemini 2.5系列模型，帶來推理與多模態理解能力。除了回應複雜提問，Google也預告深入研究功能，執行數百筆查詢並跨資訊來源整合，快速生成專家級、具引用來源的報告，節省大量研究時間。

另外，Google也結合過往就有的視覺查詢，以及智慧助理Gemini Live的即時問答功能，推出即時視覺搜尋（Search Live），使用者開啟相機以後，透過Lens或者AI模式的「Live」功能，便可一邊拍攝、一邊搜尋互動提問，獲得即時理解與建議。

從Google分享的指標來看，使用者提問的深度與複雜度正在提升。

《造山者》拍出台灣半導體的人情與選擇，7/31空中沙龍帶你聽見幕後真實｜立即報名＞＞

儘管AI可能推升搜尋成本、削弱始用者點擊廣告誘因，但AI帶來的新資訊獲取方式，也在填滿過去搜尋引擎難以承接的新需求。究竟是AI能夠推升更多使用量，還是AI搜尋會提前讓人看到營收減損？未來就看兩者能否取得平衡，讓Google的營收與利潤金雞母繼續生長。

購物加上AI能提問、試穿，還能提醒結帳

除了在搜尋場景中導入AI模式，Google也進一步將AI應用擴展至更具商業潛力的購物場域。

Google廣告與商務副總裁胥黎法珊（Vidhya Srinivasan）表示，平常Google上就有大量帶有購物意圖的行為，因為Google維護包含產品價格、顏色、供應情況等海量商品資料，將其整理成購物圖譜（shopping graph），每小時更新超過20億次。

因此，Google將Gemini模型與購物圖譜結合，推出全新的AI購物模式。當使用者搜尋商品時，系統除了提供常規結果外，也能進一步解析語句背後的需求與情境，主動引導使用者提問與探索。例如，若搜尋內容中提到即將前往某地旅遊，AI將考量當地天氣、氣溫等條件，推薦適合的商品。

不過，為何在眾多類型問題中，優先鎖定購物？針對《遠見》記者提問，Google副總裁暨搜尋負責人雷德指出，關鍵在於購物問題很適合用AI解答。「你會問一些複雜問題、有很多限制條件，有些過濾式的結構化資料，⋯⋯真正適合用對話來體驗。」

因爲挑選商品時，要對應使用者的購物意圖，剛好可以利用篩選、排序等功能，「人們實際上真的會從AI支援的體驗中受益匪淺。所以這是真正深入研究的案例之一。」

這樣的互動式搜尋體驗，也延伸至後續購物流程。Google另外推出AI試衣功能，只要點擊「試穿」按鈕並上傳自拍照，生成式模型便可渲染指定服飾穿在使用者身上，讓購衣者能夠眼見為憑。

從靈感探索、產品比對到模擬試穿，AI模式重塑使用者的購物決策歷程。在最後的結帳階段，Google也導入價格追蹤功能，當商品價格下跌時，AI Agent會即時發出通知，協助使用者在最適合時機完成交易。

Google進一步將AI應用擴展至更具商業潛力的購物場域。取自Google台灣官方部落格

Gemini助理加強，即時看螢幕、說話就互動

去年（2024）的年會上，Google誓言打造更通用且日常的AI助理，當時展示能夠看懂周遭環境、即時和使用者互動的實驗性專案Project Astra。

今年的年會上，Google讓研究落地成為產品，將Gemini Live開放給所有使用者，讓Gemini在文字對話以外，把感官延伸到能夠閱讀使用者的螢幕，還能用相機鏡頭向外看到更多，並且以距離消費者最近的聲音媒介互動。

想要走進生活，除了感知能力增強、互動更加方便以外，還需要能夠和使用者的日常產生連結。Google實驗室暨Gemini副總裁伍德沃德（Josh Woodward）表示，Gemini Live將開始整合地圖、日曆等Google生態系內的應用程式，讓助理掌握更多，能做的事情也更多。

伍德沃德也預告，Gemini即將整合至Google Chrome瀏覽器，初期可針對當前頁面摘要、解釋，未來將支援多分頁協作與自動導航，讓互動變得簡單，也更貼近生活。

皮蔡另外分享，Gemini將整合AI Agent能力，推出Agent模式（agent mode），發揮Agent所具有的能力，包含瀏覽網路、深度研究等能力，接收使用者所下指令後，自行規劃出詳細步驟，藉此處理更複雜的問題。

在生活助理面向以外，Gemini也保有其生產力工具的能力，例如使用深度研究（deep research）功能時，可以不只考慮外部資料，也讓使用者上傳個人檔案，整合兩者以後，提出的報告內容能夠更加完整。

此外，Google先前在Gemini推出方便使用者編輯的Canvas功能，提供一鍵轉換成網頁、資訊圖表與語音等多種形式，讓寫作變得更加容易，開發者也可以更好開發出產品原型。

對專業創作者來說，Google則推出以文生圖的新一代模型Imagen 4、生成影片的Veo 3，前者生成的圖像更加真實，且也可放上文字；後者則不只生成動態場景，同時直接加上聲音，不用再另外後製。

從文字、圖像到影音生成，再從深度研究到與使用者自然互動，Gemini不再只是對話機器人，而是朝向全方位AI助理邁進。Google明確宣示野心，要讓Gemini成為個人化、主動且強大的AI助理，佔據使用者的每個生活場景。

Gemini推出眾多更新。取自Google台灣官方部落格

結語：智慧、代理以及個人化，打好產品+AI地基

本次Google I/O的更新裡，和過往一樣橫跨Google旗下不同事業群，在不同產品裡加入更多AI功能。背後共享的軸線，是皮蔡強調的三件大事：智慧（intelligence）、代理（agent）和個人化（personlization）。

智慧，來自於基礎模型的進步。不管是Gemini 2.5 Pro增強推理能力，還是Gemini 2.5 Flash回覆更加快速，前者讓開發者能夠更有效率打造出網頁和產品，後者則讓面對消費者時能夠更加自然。

代理，是讓智慧能夠為人所用。AI Agent需要記憶、規劃和感知，還要能夠調用工具，Google針對每種能力都投入研究團隊各個擊破。Project Astra是增加感知能力，Project Marine則讓Agent更有辦法做到多模態理解和推理，再加上基礎模型更強的智慧和記憶力，代理上線以後，便能替使用者解決更多問題。

個人化，則是具備終端產品者的獨門武器。去年皮蔡提到，Google要把AI加到所有產品裡，讓產品更為強大；今年皮蔡則是強調，將回過頭來利用這些接觸使用者的通路，進一步改善使用者體驗。「在你的允許下，Gemini模型可以使用來自你所有Google應用程式的相關上下文，這種方式是私密的、透明的，並且完全由你控制。」

智慧、代理、個人化，三者互相加乘，替Google各項產品更新打好地基，也迎接AI競爭新局。

*吳季柔對本文亦有貢獻