「大約五年前,當我們首次推出第一代Tensor晶片時,很少有人能想像到我們現在所處的這個世界,生成式AI已成為無所不在的工具。」Google Tensor晶片團隊產品經理席德(Jesse Seed)向記者說道。當年瞄準AI設計晶片的決定,奠定今日Pixel手機與AI模型緊密契合的基礎。究竟,Tensor晶片對Google的AI手機帶來哪些影響?
在今年的Made by Google發表會上,Google將大筆時間,用來解釋自家裝置端運行的AI功能。
以AI輔助、讓長焦提升為百倍的「Pro Res Zoom」、讓使用者用自己的聲音讓通話方聽到各自使用語言的「Voice Translate」,以及根據使用者的脈絡提供建議的「Magic Cue」,每項都毋需聯網,以低延遲、高隱私的方式服務Pixel 10使用者。
席德表示,能夠實現這些AI功能,關鍵就在於Tensor晶片。「它是第一款真正將使命錨定在機器學習上的行動SoC,這在今天的 Gemini 時代從未如此重要。」
從晶片、模型到應用,Google累積全端競爭力
事實上,Tensor G5的意義,不只作為Pixel 10系列的引擎,更是Google長達五年、專注於裝置端AI晶片戰略的成果展現。
「自五年前我們首次亮相以來,AI創新的複雜性以驚人的速度增長。」為了具體呈現變化,席德舉例,大約三年前,在Pixel上運行的頂級相機變焦模型參數大約為1萬,今年得到Tensor G5加持以後,模型參數量則達到10億水準。
不只是與相機搭配的變焦模型,在語音互動上,也能見到模型參數的大幅提升。席德表示,2021年時,想要在手機上運行10億參數的語音模型,宛若天方夜譚,但現在已經可以運作超過30億參數的模型。
實現這一切的底層基礎,就是Google標榜的全端方法(full-stack approach)。
席德指出,從開發Tensor G5開始,Pixel團隊就與Google的AI中樞DeepMind深度合作,讓模型端的Gemini和晶片端的Tensor,從設計之初就深度整合。
她解釋,DeepMind會提供改善模型品質的想法,而Tensor團隊則能根據手機在記憶體、運算和功耗上的限制,利用Tensor G5改良後的晶片能力,給予即時回饋,找出最適合手機的方案。
席德列舉了兩個共同創新的成果:概念上與ChatGPT自動模型選擇類似的「Matformer架構」,讓Pixel上的應用程式能夠動態選擇大模型或者較小的模型,藉此平衡速度和品質;「逐層嵌入(per-layer embeddings)」則在不犧牲品質的前提下,讓模型符合手機有限的記憶體預算。
「我們擁有全技術堆疊的優勢,所以我們會逐一檢視每個使用案例,然後評估,你知道,哪裡是(計算)運行的最佳地點?」席德認為,Google的優勢在於不用採取非此即彼的策略,因為自家同時有雲端業務,也有裝置,AI模型在哪運行是選擇而非妥協,這不是其他企業所能比擬。
今年度最重要決定之一,就是和台積電合作
陽明交通大學電機系特聘教授黃俊達先前接受《遠見》採訪時指出,在裝置端運行AI模型有好幾項挑戰,包含記憶體容量不足、傳輸符元頻寬不夠、算力不若GPU充沛、執行運算的耗能太多,無論是AI PC或者AI手機,都有同樣問題。
參與Google駐點科學家計畫時,他和Google工程團隊討論過端側AI的改進方向,其一是增加硬體運算能力,其二則是降低運算需求。具體做法則分別可以對應到改善硬體設計以提升效率,以及調整深度學習演算法、減少模型參數,兩者互相配合,便能讓端側AI更加可行。
對照席德所說,Google DeepMind與Tensor團隊的合作,正巧能夠呼應黃俊達所說,一方回頭調整Gemini Nano模型,另一方則想辦法讓SoC可以適配模型。
而且,Google推動的整合不僅發生在晶片與模型之間,也體現在整支手機的協同運作上。
以相機為例,席德指出,相機體驗不僅關乎TPU,其實會啟用整顆晶片。「從CPU到DSP(數位訊號處理單元),再到ISP(圖像信號處理單元),我們將相機管線的每個部分都在最適合的IP上運行,以滿足功耗和效能需求。」
要承載如此龐大的AI運算,硬體基礎的躍升至關重要。席德強調,Tensor G5是自從2021年推出由三星代工的Tensor首代以來,歷史上最大的一次升級。
在效能上,她提到Tensor G5的CPU平均快了34%,而作為AI核心的TPU,其運算能力提升高達60%。這些效能提升背後,和幾項硬體決策有關,其中自然也包含從三星轉向台積電。
「我們在(Tensor G5)晶片開發過程中,進行了更深度的客製化。今年做出的重要決定之一,就是轉向台積電的這款新製程(3奈米)節點。」
席德表示,團隊每年都會評估、做出取捨,雖然無法對未來的路線(roadmap)發表評論,但Google對於今年取得的成果感到非常滿意,「而製程節點是其中重要的一環。」她也補充,在台灣擴張包含晶片團隊在內的Pixel相關組織規模,與轉向台積電的決定契合,與台灣的合作關係中可以看到許多創新。
軟硬整合後,化AI為使用者體驗
當硬體進步,同時調校軟體以後,就要設法讓消費者有感。將上下文長度(context window)提升到3萬2千個符元(token),就是其中之一。「這幾乎是我們去年所支援的上下文長度的三倍,這樣的擴展真正確保Pixel 10能夠應對未來在生成式處理上的需求。」
在賦予用戶強大AI能力的同時,責任也是Google硬體團隊關注的重點。「我們如何證明一張照片沒有被修改過?」為此,Pixel 10成為第一款在相機中原生運行C2PA,一款用來建立內容憑證和媒體來源的產業標準的手機。
未來使用者編輯每張照片時,Pixel會記錄每一個動作,這當然也包含是否利用AI修圖、合成圖像。
展望未來道路,還有許多挑戰橫亙在Tensor團隊面前。
例如,Google與其他Android手機品牌合作,也會推送部分Pixel的AI功能給夥伴,如此一來,可能稀釋Tensor G5的獨特性;另外,倘若未來DeepMind團隊勾勒的通用助理要能夠成真,手機可能必須無間斷地收聽、觀察使用者環境,對能源管理和消耗符元來說都是挑戰。
「這是我們的五週年,但在許多方面,這其實才只是個開始。」如席德所說,對 Google 而言,Tensor G5不是終點,而是將AI功能下放到手機的重要起點。