Google Pixel 9問世再推AI功能,快了Apple Intelligence一大步

曾子軒
user

曾子軒

2024-08-14

瀏覽數 8,400+

Google台灣今日(8/13)宣布最新Pixel 9系列手機,帶著Gemini助理試圖定義AI手機應該有的模樣。曾子軒攝影。
Google台灣今日(8/13)宣布最新Pixel 9系列手機,帶著Gemini助理試圖定義AI手機應該有的模樣。曾子軒攝影。
00:00
00:00

Google台灣今日(8/13)宣布最新Pixel 9系列手機,搭載最新一代、為運行AI模型經過調校的Tensor G4晶片。Apple Intelligence尚未廣泛問世,Gemini Live搶先到來,Pixel 9試圖實現其在Google I/O大會上所揭露的願景,也就是將Gemini放入不同的裝置、廣泛滲透至人們生活的應用程式中,成為完美助理。Google能否就此定義出AI手機理想中該有的模樣?

去年(2023)釋出Pixel 8時,Google已從OpenAI的驚嚇中回神,推出橫跨語音、文字和圖像的AI功能。一年過去,Google大語言模型(Large Language Model,LLM)Gemini的最新版本已經攻頂,發展能放進裝置的小語言模型(Small Language Model,SLM)又頗有心得。這次搶在蘋果iPhone 16之前,發布新機Pixel 9系列。

Google硬體副總裁彭昱鈞表示,行動裝置上深度結合Gemini的特性,讓Pixel 9更有效面對每一天場景,也讓Gemini成為個人化的AI助理。

Google Pixel 9共有四種型號,分別是Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL和Pixel 9 Pro Fold,在硬體上例如螢幕、相機、晶片和電池續航能力都有升級,但最受注目的始終是其人工智慧功能。四隻手機全都搭載三星代工、Google DeepMind參與設計的Tensor G4晶片,經過最佳化(optimized)以便運行Google的AI模型。

Google硬體副總裁彭昱鈞表示指出,Tensor G4晶片經過優化,上網瀏覽、觀看影片都更為順暢,運行效率高且較為省電。除了日常工作以外,重點還有AI。曾子軒攝影。

Google硬體副總裁彭昱鈞表示指出,Tensor G4晶片經過優化,上網瀏覽、觀看影片都更為順暢,運行效率高且較為省電。除了日常工作以外,重點還有AI。曾子軒攝影。

彭昱鈞指出,Tensor G4是第一款能夠運行多模態(multimodal)小語言模型Gemini Nano的處理器,可以同時理解文字、圖像以及聲音。因為Pixel 9的記憶體大於前代,搭配G4晶片更能在裝置上順暢運行Gemini。

其實,今年6月Google就透過功能更新(feature drop)方式,讓Pixel 8和Pixel 8a用戶,就能在手機上開啟開發者模式後,使用部分Nano功能,原先尚未開放的原因就是因為記憶體僅有8G。

Google的AI王牌:整合應用程式、即時互動 

發表Pixel 8時,Google展示的AI功能還停留在提升特定任務品質的輔助面,例如透過AI降低錄音檔的噪音、刪去照片裡的物體、摘要與校對文字段落等。

對照之下,Pixel 9被Google描述成「為Gemini時代打造的手機」,最關鍵的AI功能,非以Gemini Live莫屬。今年五月Google I/O大會上,Google DeepMind揭露其AI代理人計畫「Project Astra」,企圖讓AI理解指令、分拆任務,逐步執行,藉此深入使用者所認知的世界。

能夠穿梭於Google體系應用程式的Gemini Live。取自Youtube@Google

在Pixel 9上,作為Project Astra開展先聲的,就是能夠穿梭於Google體系應用程式的Gemini Live。就基礎概念來說,Gemini和過往的Google助理、蘋果的Siri全無二致,同樣是利用對話問答、執行指令,差別之處在於,Gemini Live理解力更佳、對答更快更自然,對周遭環境認識更深,能夠執行的任務更多。

能力之所以可以提升,正是因為背後大語言模型的進步所致,包含使用較為輕量的模型如Gemini 1.5 Flash、改變處理聲音和影像的編碼(encode)方法、增加多模態能力,還有至關重要的兩點-分別是利用擴充功能(extension),讓Gemini逐步連接更多Google應用程式,以及深度整合Gemini與Android作業系統,因此同樣能夠像蘋果智慧(Apple Intelligence)一般,跨越應用程式之間的藩籬。

先前舉出ChatGPT和Bard(Gemini前身)能夠替人類分憂的例子時,常見的任務偏向趣味性,或者與創作有關,但當Gemini連接Workspace、Siri串起日曆和筆記時,智慧手機作為助理的效益便逐漸浮現,因為人類不再需要切換分頁與應用程式,只要下令就能從Gmail轉換到Google Calendar,再移動至Google Spreadsheet中。

在應用程式之間遨遊以外,Gemini的另一個突出之處在於,它能夠「懸浮」在應用程式上,就像案頭旁的童子,若是讀書乏了、看劇倦了,便會即時現身提供支援,例如閱讀媒體報導、觀看YouTube影片時出現疑問,可以請Gemini搜集資料、提出回答。

除此之外,Google還推出「截圖」(screenshot)功能,與微軟AI PC重要AI功能回憶(Recall)相似,Pixel 9能夠記住每張截圖的回憶,方便使用者重返截圖當下的時光,可能藉此找出想購買的商品、要記下的行銷案例。

使用者向Gemini提問,它不只能語音或者書面回答,還能夠將回答的內容串聯其他Google應用程式例如地圖。曾子軒攝影。

使用者向Gemini提問,它不只能語音或者書面回答,還能夠將回答的內容串聯其他Google應用程式例如地圖。曾子軒攝影。

除了Gemini Live和整合Android系統,Pixel 9本次推出的AI功能,還包含以文生圖工具、客製化AI天氣預報、照片和影像品質提升、改善通話品質、自動生成逐字稿並摘要電話、支援更多語言的即時字幕與轉逐字稿等。

另外,Pixel 9相機的所在位置(camera bar)略有不同。Pixel 8的相機裝在手機背後貫穿機身的直條,Pixel 9的相機則位於長型橢圓凸起之上。細看Pixel 9 Pro和Pixel 9 Pro XL,兩者差異只在手機尺寸、充電速度和功率,前者為6.3吋、後者為6.8吋,其餘規格相同。

至於折疊手機Pixel 9 Pro Fold,這是Google折疊手機首次在台上市,彭昱鈞表示,「我們希望他攜帶非常方便,要做到(折疊後)跟旗艦手機差不多大小。」除了攤開後的大螢幕以外,多功能的創新應用會是產品重點。

除了手機,Google也端出新一代的智慧手錶Pixel Watch 3,還有同樣強調AI的Pixel Buds Pro 2,Google指出它也支援Gemini Live,使用者能夠戴著耳機,直接詢問交通規劃、詢問推薦歌曲等。

Google Pixel 9系列新機一字排開,旁邊還放著智慧手錶和智慧耳機,曾子軒攝。

Google Pixel 9系列新機一字排開,旁邊還放著智慧手錶和智慧耳機,曾子軒攝。

【遠見 x 未來兒童雙刊共讀】週年限時優惠,不只加送一期,還送《未來兒童》知識庫權限!

就銷售通路來說,Google台灣裝置服務策略合作資深總監詹宗翰表示,台灣有兩家電信業者(中華電信、台灣大哥大),以及電商通路(蝦皮和momo)可以購買Pixel 9系列手機。

蘋果、Google AI功能相似,戰場在AI助理 

與Google對照,蘋果於今年六月全球開發者大會(WWDC)端出蘋果智慧,除藉由生成式AI提高生產效率以外,也維持其風格,強調不管AI推論是在雲端或者地端運作,都要保障使用者隱私。

蘋果發表中的最大亮點體現在助手Siri,其能力已出現質的提升。在蘋果勾勒的未來裡,使用者只要下令,Siri便能靈活地穿梭於不同應用程式之間,自主替使用者完成任務,這是AI代理(AI Agent)即將走入生活的近景。

其實,不管是現在回望,還是當時觀看WWDC,蘋果整合iOS、iPadOS與macOS與AI,並以Apple Intelligence重新譜寫AI敘事的招式同樣令人激賞,只是,在Gemini Live全面進駐Pixel 9後,蘋果智慧的的亮點就有些黯淡無光。

因為,若要比較Google手機的AI能力和蘋果手機上蘋果智慧的關鍵差異,短期來看,功能之爭並非重點,就文字、聲音和圖像等AI功能,以及整合應用程式並執行任務的AI助理概念而言,Google和蘋果的相同之處遠遠多過不同,所以差異會在於釋出速度和使用者體驗。

以最核心的AI助理來說,升級後的Siri背後有蘋果的裝置端小模型(Apple on-device model,官方未取名)和雲端模型(server model,同樣未取名),Google的Gemini助理,同樣有已經支援Pixel 9的Gemini Nano小模型,以及雲上的Gemini 1.5 pro大模型。

Pixel內建Gemini助理,並增添許多改善日常任務品質的功能。曾子軒攝影。

Pixel內建Gemini助理,並增添許多改善日常任務品質的功能。曾子軒攝影。

至於各個模態,文字上Gemini內建寫作功能,對應到蘋果寫作工具(writing tools),聲音部分,Pixel 9推出「通話筆記」(Call Notes)以AI摘要錄音檔,與WWDC上蘋果預告的新功能如出一轍。

將場景拉到日常使用量極大的拍照與照片管理,Google和蘋果都強調使用者可以更輕鬆且彈性地修圖,例如Pixel手機的「魔術修圖」(Magic Editor)和iphone的「清潔」(Clean Up)。而且,幾乎在同一時間,兩者都讓相簿應用程式配備視覺搜尋能力,Google以「向相簿提問」(Ask Photos)稱之,蘋果則用「圖像查詢」(Visual Look Up)命名。

至於以文生圖,蘋果持續改進模型,並推出圖像遊樂場(Image Playground),Google同樣有以擴散模型為基底的Imagen系列模型,先前曾以Imagen 2為基底釋出實驗性的工具imageFX,本次則在Pixel 9推出新一代Imagen 3驅動的Pixel Studio。Google表示,除了手機上運行的擴散模型以外,Imagen 3也在雲端上運作,但尚不確定其分工方式。

既然功能上相似,又因為蘋果並未釋出模型細節,論文中只有解釋開發流程與比較評測結果,暫且看不出模型能力高低,若要比較誰能搶先攻上AI手機山頭並揮舞大旗,還是要看誰的AI助理首先問世。

Google台灣發表Pixel 9的現場佈置中,以解答生活大小事為標語。若能不只解答、做到解決,則離真正的AI助理就會更接近了。曾子軒攝影。

Google台灣發表Pixel 9的現場佈置中,以解答生活大小事為標語。若能不只解答、做到解決,則離真正的AI助理就會更接近了。曾子軒攝影。

還沒等到蘋果AI,iphone慢了Pixel一步 

蘋果雖然已經宣布蘋果智慧,但至今仍只有部分iphone 15手機使用者能夠使用。儘管能以謹慎解讀較慢的步伐,因為欲速確實容易不至,至少蘋果就避開Google AI概覽(AI Overview)建議使用者用膠水讓起司黏住披薩的差錯,也沒有遇上Google Gemini生成圖片的種族偏見問題,但Gemini Live上市以後,Android系統手機的使用者體驗將得到大幅提升。

Google自Pixel 8系列起強調AI功能,且將Gemini的能力釋出,讓Android系統手機如三星、Motorola、小米和Oppo雨露均霑,這次Gemini Live也沒有獨厚Pixel 9,預計未來會支援三星手機。

「Made By Google」發表會重點集錦。取自Youtube@Google

以設計美學和使用者體驗取勝的蘋果,WWDC上能看到庫克(Tim Cook)所展示的遠大願景,既能夠無縫銜接不同應用程式,也能在滑手機時適時提出建議。然而,當時果粉的心心念念,已然在今日的Made by Google 2024發表會中實現。

修圖過程變得簡單、錄音品質得到有效改善、尋找相片時不用逐張翻找,這些功能的確都可以幫上使用者,但如果想讓用戶眼睛一亮,願意砸錢購買,則AI功能勢必得要在不同維度上競爭,例如串起所有應用程式的AI助理,或者是忠實紀錄使用軌跡的回憶能力,唯有如此,才是讓智慧型手機真正更深地融合在人類生活中。

如今,Google搶先蘋果一步做到了。

由左至右為Google台灣裝置服務策略合作資深總監詹宗翰、Google硬體副總裁彭昱鈞、Fitbit 穿戴裝置產品經理黃書榆以及Google Pixel相機產品經理傅敬文。曾子軒攝。

由左至右為Google台灣裝置服務策略合作資深總監詹宗翰、Google硬體副總裁彭昱鈞、Fitbit 穿戴裝置產品經理黃書榆以及Google Pixel相機產品經理傅敬文。曾子軒攝。

你可能也喜歡

AI教父黃仁勳的創業領導成功之道
數位專題

AI教父黃仁勳的創業領導成功之道

AI晶片巨頭輝達(NVIDIA)執行長黃仁勳勢不可擋!1993年創立輝達以來,公司市值近來創下歷史新高,黃仁勳身價更是破千億美元榮登全球前15大富豪。隨著Computex 2024登場,他帶來的A

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務