AWS與OpenAI因算力合作深度綁定,又身兼Anthropic的投資人與基礎設施供應者;在雲端市場與Google正面競爭的同時,又在雲服務生態中維持微妙的合作關係。近期,Google TPU的亮眼進展與Gemini模型的攻勢再度拉高外界對AWS的期待:自家晶片Trainium能否壓下TPU的聲勢?Nova新模型又能吸引多少開發者採用?在這場每年於賭城上演的re:Invent雲端年會中,AWS正端出哪些新武器,迎戰全面升級的AI大戰?
「你們尚未看到與AI的承諾相匹配的回報,」在AWS雲端年會re:Invent上,AWS執行長加曼(Matt Garman)對台下數萬名開發者與企業高管直言,「但這一切正在迅速改變。」
他斷言,真正的轉捩點將是AI Agent的興起,這將使AI從技術奇蹟,轉變為能真正帶來價值的事物。
然而,要打造足夠聰明、具備知識並能自主執行任務的AI Agent,並非憑空生成。若沒有資料的存取權、沒有模型支撐、沒有完善的推論與整合平台,一切都只是空談。
這便是長達兩小時的演講中,加曼以AWS長期強調的全端方法(full-stack approach)為基調的原因。
加曼在介紹不同新產品時多次提到,滿足客戶需求並提供「選擇權」(choice),是AWS一貫的核心邏輯。他也用同樣的精神,逐一介紹其AI基礎設施、推論平台、企業資料整合、以及建構Agent的工具。
AWS意圖向市場證明,已為企業備妥從底層建設到頂端應用所需的一切彈藥,意圖在強敵環伺的AI戰局中,證明自己仍是企業的最佳選擇。
打造基礎建設,推自研晶片、建AI工廠
Google TPU從自用轉向外銷,不僅激化了雲端服務商在ASIC領域的軍備競賽,也讓市場將目光聚焦於推論時代下,GPU之外更具性價比的替代方案。

在最受關注、與台灣供應鏈也有密切關係的ASIC戰場上,無論是AWS還是Google,都擁有超過十年自研晶片的歷史。由於Google TPU大放異彩,AWS的Trainium也備受期待。
加曼在強調Trainium 3的優異性能之前,不忘先稱讚合作多年的伙伴NVIDIA。
「當你想到AI基礎設施時,首先想到的東西之一就是GPU。而AWS絕對是運行NVIDIA GPU 的最佳場所。」就連NVIDIA與OpenAI自身,都在AWS上運行其最大規模的AI叢集。這次的發表中,也包含搭載NVIDIA最新GB300晶片的P6e實例。
然而,提供選擇權始終是AWS的重點。加曼強調,AWS的AI晶片Trainium,就是以性價比著名,在市場上的領導者之一,尤其適合用於訓練任務上。
他也以自嘲口吻表示,將晶片命名為Trainium可能是個美麗的錯誤。「Trainium可以推論嗎?也可以。」因為其產品效益高,已成為AWS生成式AI平台Bedrock上多數模型的推論主力

回顧現況以後,加曼接著推出採用3奈米製程的Trainium 3 Ultra伺服器,並提前預告了Trainium 4的開發藍圖,承諾將帶來更為強大的運算性能,展現其在自研晶片上挑戰市場領導者的決心。
除此之外, AWS也針對主權AI與法遵需求,推出AI工廠解決方案,讓客戶能夠在自己的資料中心裡,部署AWS的整套AI基礎設施,加曼以「私有的AWS區域」形容。
模型選項持續增加、拋出「開放訓練」新概念
從基礎設施向上延伸,進入模型和平台層,也同樣重視選擇。
加曼表示,持續在Bedrock上引入Mistral AI、Google等不同供應商的第三方開放權重模型;同時,其自有模型家族Amazon Nova也迎來第二代,一口氣推出Lite、Pro、Sonic及Omni四款模型,藉此滿足不同應用場景。

最具特色的,則是新服務「Amazon Nova Forge」背後所謂「開放訓練模型(Open-Training Models)」的概念。
加曼解釋,企業若想要擁有專屬於自家的模型,通常有兩種路徑。首先,自然是像所有模型研發商一樣,從頭訓練模型,但成本極高;替代方案則是微調(Fine-tuning)既有的開放權重模型,但也有「忘記」既有能力的風險,讓效果大打折扣。
Nova Forge的解方是:允許客戶在一個前沿模型預訓練至特定階段時,將企業自有資料與AWS的資料集混合,共同完成最後的訓練過程。
此舉的目標是讓模型能深度理解企業獨有的專業領域知識,但又不會喪失其強大的基礎能力。AWS以社群平台Reddit的內容審核為例,稱其透過此方法,首次打造出兼具準確性與成本效益的客製化模型。

Agent時代來臨,企業應用重視風險控制
最能讓企業感受到AI價值的階段,則是在Agent與應用層。
加曼在演說中不斷強調,AI Agent正在產生回報,且未來每家公司都會有自己的AI Agent,也是AWS押寶、極力發展的商機。
不過,企業部署Agent的最大憂慮在於其高度的自主性,這也意味著行為難以預測與控制,他以養育青少年比喻,「你必須給他們自由,但你也想設置一些護欄。」
為此,AWS的Agent建構平台AgentCore迎來兩大關鍵更新,新增AgentCore Policy控制其邊界,讓企業能用自然語言設定Agent可存取的工具與可執行的操作,從源頭把關; AgentCore Evaluations則是以自動化方式評估Agent的行為品質,例如答案的正確性、是否有害,甚至是否符合品牌形象。

在AI戰爭持續上演的同時,對於模型開發者與算力提供者抱團取暖的擔憂有增無減,因此市場花費心思檢視AI實際效益,而加曼將重點轉向能帶來具體回報的AI Agent,正是對此趨勢的回應。
對比去年Amazon執行長賈西(Andy Jassy)親自坐鎮,並有蘋果高管為Trainium晶片背書的盛況,今年加曼獨挑大樑,來賓也轉為Sony、Adobe等更側重應用的合作伙伴,顯示AWS的溝通重點已從技術實力展示轉向商業價值落地。
發表內容雖多為既有產品線的延伸與深化,卻也反映出AI發展已從概念驗證,步入更為務實的規模化階段。
當然,全端方法並非AWS獨有,早已是雲端巨頭的標準配備;客戶除了考慮選擇權以外,也會逐模型性能與晶片效果而居。
AWS的突圍策略,是在這套框架下,將選擇權的價值最大化。相較於競爭對手更易形成單一模型或硬體的綁定,AWS意圖利用其市場領導地位,在晶片、模型到Agent的每一個環節,都提供最多元的選項,以此深化客戶黏著度。
AWS的AI工具箱現已備齊,但真正的挑戰才剛開始:如何協助數以百萬計的客戶,將這些複雜的技術轉化為可被衡量的營收增長或成本削減。這將是市場未來一年,檢驗加曼及其AI戰略是否奏效的最終標準。