Facebook Pixel
訂閱
快速註冊 已是會員,立即登入

為您推薦

會員權益

提升競爭力 提升競爭力 策略執行力實戰6天班,倒數計時,即刻報名

Google I/O:除Gemini 升級!還有哪些更新?

曾子軒
user

曾子軒

2025-05-21

瀏覽數 950+

帶領Google走向AI優先的皮蔡,正在將智慧帶給使用者,以AI Agent、個人化體驗等方式,替使用者解決問題。曾子軒攝。
帶領Google走向AI優先的皮蔡,正在將智慧帶給使用者,以AI Agent、個人化體驗等方式,替使用者解決問題。曾子軒攝。

喜歡這篇文章嗎 ?

登入 後立即收藏 !
00:00
00:00

Google本週(5/20)舉行2025年開發者大會(Google I/O),試圖將底層AI模型的能力注入終端產品,再結合Google橫跨各端的通路優勢,實現「資訊變智慧、智慧更個人」的願景。隨著最新版本的Gemini 2.5模型進一步升級,整合至搜尋、購物與個人助理後,使用者是否真的能感受到AI帶來的改變?《遠見》一文整理帶你掌握完整消息。

Google執行長皮蔡(Sundar Pichai)在2025 Google I/O上,向Google員工、媒體和開發者說,Google發布新技術和新產品的速度,比以往任何時候都快。

「更多智慧正普及到每一個人、每一個角落。全世界也正迅速回應,以前所未有的速度採用AI。」

Gemini 2.5 Pro要做最強大模型,Flash力求性價比 

回顧過去一年的基礎模型戰場,OpenAI同時維持兩條軸線,一邊是重視推理能力的o開頭系列模型,以及遵循擴展定律(scaling law),另一邊則是增加參數和資料量的GPT-4開頭系列模型

Anthropic持續更新Claude,且將重點放在企業端使用者,對寫程式的應用尤為重視;DeepSeek訴求以較低成本推出表現仍優異的模型,也在AI爭霸戰寫下濃墨重彩的一筆。

至於Google,腳步則相對穩定,持續帶給使用者更加進步的Gemini模型,表現可說是中規中矩。今年在Google I/O舉辦前,沒有留給競爭對手突襲機會,本月初(5/6)便預先推出Gemini 2.5 Pro I/O版。

Google多次強調,從客觀數字來看,Gemini 2.5 Pro是現在市面最強大的基礎模型之一,不僅好幾項關鍵基準測試表現最為優異,還在大模型競技場上名列前茅,而且廣受開發者喜愛。

Google的AI舵手哈薩比斯(Demis Hassabis)分享,Google正在引入「深度思考」(deep think)的新模式,讓模型在回覆前能夠考量多種不同假設(hypotheses),藉此將模型的能力推向極限。

至於回應速度更快的輕量Flash系列模型,皮蔡表示,若以每秒產生的符元(token)數量計算,Gemini靠著2.5 Flash的兩個版本和2.0 Flash就包辦了前三名,而且還達到極高的性價比。「價格和效能之間有著嚴峻的權衡,但我們一次又一次以最具成本效益的價格提供最好的模型。」

哈薩比斯補充,Gemini 2.5 Flash雖然能力比不上Gemini 2.5 Pro,但是在推理、多模態、寫程式和長文本等不同面向上,都更加有效率。

另外,Google同步推出原生語音輸出(native audio out),讓Gemini模型能以自然語氣、口音與風格進行語音互動,開發者用來打造語音互動對話時,可調整語音語調,例如講故事時加入戲劇張力,甚至能辨識使用者語音中的情緒,帶給使用者更有情感的回應。

隨著推理能力成為模型提供者的兵家必爭之地,Google另外提供思考摘要(thought summaries),讓開發者清楚了解模型在思考過程中的重點、使用哪些工具與邏輯;為了衡量成本,也將過往Flash模型就有的思考預算(thinking budgets),延伸到Pro模型,如此一來,開發者調用API時可以自訂模型「思考」所消耗的符元,在成本與品質之間尋求平衡。

雖然人們擔心Gemini應用程式的知名度和使用者比不上ChatGPT,也連帶關注Gemini模型的聲勢無法和GPT系列模型相比,但考慮到Google既有的龐大生態系,只要Gemini模型持續更新,就算Gemini應用程式使用者比不過對手,只要整合到產品裡,Google就有一戰本錢。

AI搜尋進化,變身能夠深入對話的AI模式 

在Google老本行搜尋業務上,去年推出AI概覽(AI overview),今年Google升級搜尋體驗,正式端出3月預告的AI模式(AI mode),戮力展開金雞母業務的全面革新。

AI概覽是將搜尋結果摘要,提拱使用者更能對應搜尋意圖的內容,但分析師們總是擔心,AI推論(inference)將讓搜尋成本提高,而且,因為使用者不用造訪網頁,就能得到解答,進而減少點擊連結的誘因,可能影響Google搜尋廣告帶來的豐沛營收。

在I/O前接受All-in Podcast採訪時,皮蔡表示,隨著技術進展,AI推論花費下降飛快,成本不是大問題;以AI概覽的廣告收益來說,也已經達到基準線(baseline),即便使用者獲取資訊的方式出現典範轉移,從傳統搜尋轉向AI問答,也不會和Google的核心商業模式產生衝突。

皮蔡也在I/O上分享,人們實際使用AI概覽以後,對搜尋結果益發滿意,且搜尋頻率也愈來愈高,可以看出AI增進搜尋體驗的效果,他語氣強烈地表示,「(AI輔助搜尋)這是過去十年來搜尋領域最成功的發布之一。」

皮蔡樂觀表示,AI概覽帶動使用者的查詢,且預期成長會隨著時間推移增加。曾子軒攝

皮蔡樂觀表示,AI概覽帶動使用者的查詢,且預期成長會隨著時間推移增加。曾子軒攝

如果說AI概覽是Google的牛刀小試,則AI模式就是真槍實彈地全心投入。

Google副總裁暨搜尋負責人雷德(Liz Reid)認為,時代轉變之下,Google提供的價值已經從組織資訊,轉變為提供智慧,靠著底層模型的先進推理能力,深化搜尋的強度與深度,AI模式不只是排序、整理,更要重新編排,帶來更多洞見,回答使用者的複雜問題。

使用者運用AI模式時,AI會將使用者提出的問題分解成許多細項,再逐一尋找每個子題的內容,最後彙整成完整回答,如此一來,便不會局限在包含大量資訊、但未必能夠解決問題的網頁上。

皮蔡提到,AI模式早期測試者的查詢長度是傳統搜尋的兩到三倍,且可以深入對話、持續提出新問題,視覺查詢的數量更是年增超過65%。

AI模式之所以能夠運作,背後就是靠著Gemini 2.5系列模型,帶來推理與多模態理解能力。除了回應複雜提問,Google也預告深入研究功能,執行數百筆查詢並跨資訊來源整合,快速生成專家級、具引用來源的報告,節省大量研究時間。

另外,Google也結合過往就有的視覺查詢,以及智慧助理Gemini Live的即時問答功能,推出即時視覺搜尋(Search Live),使用者開啟相機以後,透過Lens或者AI模式的「Live」功能,便可一邊拍攝、一邊搜尋互動提問,獲得即時理解與建議。

從Google分享的指標來看,使用者提問的深度與複雜度正在提升。

《造山者》拍出台灣半導體的人情與選擇,7/31空中沙龍帶你聽見幕後真實|立即報名>>

儘管AI可能推升搜尋成本、削弱始用者點擊廣告誘因,但AI帶來的新資訊獲取方式,也在填滿過去搜尋引擎難以承接的新需求。究竟是AI能夠推升更多使用量,還是AI搜尋會提前讓人看到營收減損?未來就看兩者能否取得平衡,讓Google的營收與利潤金雞母繼續生長。

購物加上AI能提問、試穿,還能提醒結帳 

除了在搜尋場景中導入AI模式,Google也進一步將AI應用擴展至更具商業潛力的購物場域。

Google廣告與商務副總裁胥黎法珊(Vidhya Srinivasan)表示,平常Google上就有大量帶有購物意圖的行為,因為Google維護包含產品價格、顏色、供應情況等海量商品資料,將其整理成購物圖譜(shopping graph),每小時更新超過20億次。

因此,Google將Gemini模型與購物圖譜結合,推出全新的AI購物模式。當使用者搜尋商品時,系統除了提供常規結果外,也能進一步解析語句背後的需求與情境,主動引導使用者提問與探索。例如,若搜尋內容中提到即將前往某地旅遊,AI將考量當地天氣、氣溫等條件,推薦適合的商品。

不過,為何在眾多類型問題中,優先鎖定購物?針對《遠見》記者提問,Google副總裁暨搜尋負責人雷德指出,關鍵在於購物問題很適合用AI解答。「你會問一些複雜問題、有很多限制條件,有些過濾式的結構化資料,⋯⋯真正適合用對話來體驗。」

因爲挑選商品時,要對應使用者的購物意圖,剛好可以利用篩選、排序等功能,「人們實際上真的會從AI支援的體驗中受益匪淺。所以這是真正深入研究的案例之一。」

這樣的互動式搜尋體驗,也延伸至後續購物流程。Google另外推出AI試衣功能,只要點擊「試穿」按鈕並上傳自拍照,生成式模型便可渲染指定服飾穿在使用者身上,讓購衣者能夠眼見為憑。

從靈感探索、產品比對到模擬試穿,AI模式重塑使用者的購物決策歷程。在最後的結帳階段,Google也導入價格追蹤功能,當商品價格下跌時,AI Agent會即時發出通知,協助使用者在最適合時機完成交易。

Google進一步將AI應用擴展至更具商業潛力的購物場域。取自Google台灣官方部落格

Google進一步將AI應用擴展至更具商業潛力的購物場域。取自Google台灣官方部落格

Gemini助理加強,即時看螢幕、說話就互動 

去年(2024)的年會上,Google誓言打造更通用且日常的AI助理,當時展示能夠看懂周遭環境、即時和使用者互動的實驗性專案Project Astra

今年的年會上,Google讓研究落地成為產品,將Gemini Live開放給所有使用者,讓Gemini在文字對話以外,把感官延伸到能夠閱讀使用者的螢幕,還能用相機鏡頭向外看到更多,並且以距離消費者最近的聲音媒介互動

想要走進生活,除了感知能力增強、互動更加方便以外,還需要能夠和使用者的日常產生連結。Google實驗室暨Gemini副總裁伍德沃德(Josh Woodward)表示,Gemini Live將開始整合地圖、日曆等Google生態系內的應用程式,讓助理掌握更多,能做的事情也更多。

伍德沃德也預告,Gemini即將整合至Google Chrome瀏覽器,初期可針對當前頁面摘要、解釋,未來將支援多分頁協作與自動導航,讓互動變得簡單,也更貼近生活。

皮蔡另外分享,Gemini將整合AI Agent能力,推出Agent模式(agent mode),發揮Agent所具有的能力,包含瀏覽網路、深度研究等能力,接收使用者所下指令後,自行規劃出詳細步驟,藉此處理更複雜的問題。

在生活助理面向以外,Gemini也保有其生產力工具的能力,例如使用深度研究(deep research)功能時,可以不只考慮外部資料,也讓使用者上傳個人檔案,整合兩者以後,提出的報告內容能夠更加完整。

此外,Google先前在Gemini推出方便使用者編輯的Canvas功能,提供一鍵轉換成網頁、資訊圖表與語音等多種形式,讓寫作變得更加容易,開發者也可以更好開發出產品原型。

對專業創作者來說,Google則推出以文生圖的新一代模型Imagen 4、生成影片的Veo 3,前者生成的圖像更加真實,且也可放上文字;後者則不只生成動態場景,同時直接加上聲音,不用再另外後製。

從文字、圖像到影音生成,再從深度研究到與使用者自然互動,Gemini不再只是對話機器人,而是朝向全方位AI助理邁進。Google明確宣示野心,要讓Gemini成為個人化、主動且強大的AI助理,佔據使用者的每個生活場景。

Gemini推出眾多更新。取自Google台灣官方部落格

Gemini推出眾多更新。取自Google台灣官方部落格

結語:智慧、代理以及個人化,打好產品+AI地基 

本次Google I/O的更新裡,和過往一樣橫跨Google旗下不同事業群,在不同產品裡加入更多AI功能。背後共享的軸線,是皮蔡強調的三件大事:智慧(intelligence)、代理(agent)和個人化(personlization)。

智慧,來自於基礎模型的進步。不管是Gemini 2.5 Pro增強推理能力,還是Gemini 2.5 Flash回覆更加快速,前者讓開發者能夠更有效率打造出網頁和產品,後者則讓面對消費者時能夠更加自然。

代理,是讓智慧能夠為人所用。AI Agent需要記憶、規劃和感知,還要能夠調用工具,Google針對每種能力都投入研究團隊各個擊破。Project Astra是增加感知能力,Project Marine則讓Agent更有辦法做到多模態理解和推理,再加上基礎模型更強的智慧和記憶力,代理上線以後,便能替使用者解決更多問題。

個人化,則是具備終端產品者的獨門武器。去年皮蔡提到,Google要把AI加到所有產品裡,讓產品更為強大;今年皮蔡則是強調,將回過頭來利用這些接觸使用者的通路,進一步改善使用者體驗。「在你的允許下,Gemini模型可以使用來自你所有Google應用程式的相關上下文,這種方式是私密的、透明的,並且完全由你控制。」

智慧、代理、個人化,三者互相加乘,替Google各項產品更新打好地基,也迎接AI競爭新局。

*吳季柔對本文亦有貢獻

你可能也喜歡

AI教父黃仁勳的創業領導成功之道
數位專題

AI教父黃仁勳的創業領導成功之道

AI晶片巨頭輝達(NVIDIA)執行長黃仁勳勢不可擋!1993年創立輝達以來,公司市值近來創下歷史新高,黃仁勳身價更是破千億美元榮登全球前15大富豪。隨著Computex 2024登場,他帶來的A

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務