生成式AI大戰延燒到聖誕!ChatGPT之父,OpenAI執行長奧特曼預告5日起,連續12天直播送出許多更新,已吸引12萬網友關注。此外,Google DeepMind則搶先推出新版基礎世界模型Genie 2。至於亞馬遜AWS,也在本週舉行的年度大會re:Invent 2024中,端出全新自研系列模型Nova迎戰。最神秘的AWS,此次大會終於揭露他們將如何打這場仗。無論哪個模型勝出,最開心的莫過於使用AI共學的網友們,滿滿新工具等著使用,一文拆解這場聖誕之戰。
作為雲端服務商(cloud service provider)的領先者,亞馬遜AWS(Amazon Web Services)正在逐步踏入每一個生成式AI的兵家必爭之地。
他們推出幫助員工提升生產力的Amazon Q、輔助企業開發AI應用的生成式AI平台Bedrock,也與Anthropic深度合作,訓練ChatGPT的強勁敵手Claude,讓客戶能夠藉此發掘應用場景。同時,在基礎模型和自研晶片上也都各有進展。
今年度的AWS re:invent上,AWS推出新系列自研模型Nova,並預告多模態對多模態模型的進度,同時持續在Bedrock上增加更多服務企業的功能,例如以推理能力檢查幻覺、支持多個代理(AI Agent)之間的協作,並分享自研晶片、伺服器和網絡事業的新進展。
亞馬遜的AI應用,瞄準的是企業用戶
在這場年度大會中,Amazon執行長賈西(Andy Jassy)和AWS執行長加曼輪流上陣,向台下觀眾端出一道道大菜。
其中,最受矚目的便是新一代的自研模型。先前,不管是市場上的聲量,還是生成式AI與基礎模型的推出速度,AWS似乎都慢上對手一截。
面對媒體時,加曼曾經強調,比起迅速推出聊天機器人(chatbot),AWS更在乎企業使用者的痛點,因此把重點放在提升安全性、規模化部署,以及帶給用戶更多選項,企圖回應人們對AWS速度的質疑。
在實際介紹Nova系列模型之前,賈西遵循相同基調,以AWS開發生成式AI應用的經驗為例,指出好模型不是成功的唯一要件,「你還需要設置正確的防範措施、確保訊息傳遞的流暢性、設計出合適的使用者介面(UI),並確保延遲低、體驗順暢,⋯⋯還要有合適的成本結構。」
因為從企業應用角度來說,不管是內部員工用來提升效率,還是實際面對消費者,夠好的模型只完成70%任務,「消費者對於那 30% 的不完善是非常敏感的,可能導致他們完全不接受這款應用。」
對AWS來說,在自行研發模型外,與眾多模型提供者合作,就成了必經之路。側面來看,這或許也能解釋AWS過往沒有那麼大力推廣自家模型的原因。
AWS Nova分哪四種模型?
本次賈西先介紹Nova系列的模型,他拋出幾個常用的關鍵字:選擇多、性價比高、運算速度快以及和Bedrock深度整合,其他還有針對企業用戶的功能。例如把模型變得更小更便宜的模型蒸餾、串連企業資料的知識庫、讓AI多步驟自主操作的代理行為(Agentic Behavior)等。
Nova共有四種型號,分別如下:
1. 純文字、適用簡單任務的Micro,
2. 參數量從小到大、原生就是多模態的Lite、Pro和 Premier,這三種型號皆能夠輸入和輸出文字、圖像和影片。
GPT-4o-mini可對比Lite, GPT-4o可對比Pro
因為沒有公開參數,僅能從賈西比較對象一窺Nova不同模型的大小。他用GPT-4o-mini對比lite、以GPT-4o和Claude 3.5 Sonnet v2比較Pro,可以看出兩者分別是輕量級和中級大小的模型,Premier模型沒有能夠對標者,賈西僅說它的規模最大、預計將於明年第一季推出。
就上述比較而言,應可推測三者關係就像Anthropic的Haiku、Sonnet和Opus,以及Gemini的Flash、Pro以及Ultra。
另外,除了文字和多模態模型,賈西也介紹圖像生成模型Nova Canvas,支援編輯圖像、調整色彩和版面控制,以及影片生成模型Nova Reel,同樣提供運動控制、旋轉與縮放功能,且兩者都有加上浮水印和內容審核以確保安全性。
賈西預告,明年AWS將推出語音對語音的模型,人們將可更流暢地和AI對話;年中則會推出不限制任何輸出與輸入形式,橫跨文字、語音、圖像和影像的多模態到多模態模型。
期待AI商品化,進入幕後成為背景
在模型以外,加曼持續公布晶片以及與Anthropic深度合作的消息。
舉例來說,雙方將共同開發名為「Project Rainier」的專案,預計利用數十萬個AWS自研、專攻訓練的Trainium2晶片,建立起規模為現在訓練Claude叢集五倍的大型運算叢集(UltraCluster),可帶來更大算力;明年預計將會推出採用3奈米製程、速度為前代兩倍的Trainium3。
從蘋果(Apple)出席AWS年會、高階主管出面背書,也讓人看見AWS自研晶片確實在拓展市場。
蘋果機器學習和人工智慧資深總監杜賓(Benoit Dupin)作為神秘嘉賓,緊接在加曼後上台,他分享蘋果利用基於ARM架構的CPU Graviton以及專攻推論的Inferentia 2執行推論任務如搜尋,有效提升效率;未來也在考慮利用Trainium2改進自有模型的訓練。
不管是加曼還是賈西,勾勒出從基礎設施到平台與工具的全端布局裡,都強調實際應用、注重安全與隱私,並將與合作伙伴持續向前,在他們的字裡行間,從資料庫、晶片再到模型,都在凸顯選擇(choices)的重要性。
就像承諾在晶片上持續與NVIDIA合作,能夠讓用戶降低訓練成本的晶片就是好晶片,模型端也不只有自研,AWS會持續將Claude送到客戶手中,能夠開發出生成式AI應用的模型就是好模型。
可以看出,雲端時代崛起、主打替企業省錢的AWS,在生成式AI的戰場上,也想打擅長的仗,他們調整步調、放低身姿,把AI論述導回熟悉的基準面上。
先前ikala創辦人程世嘉接受《遠見》專訪時曾說,生成式AI能夠崛起,就是以ChatGPT為首的對話式AI革新使用者介面與體驗,讓AI「從幕後走到幕前。」
不管是GPT、Claude或Nova,企業在意關鍵性能
對照之下,在AWS勾勒的未來裡,不管是GPT、Claude還是Nova,對企業與開發者來說,模型名字不是重點,關鍵在於性能、表現和適用場景,這也就是科技分析師湯普森(Ben Thompson)評論所說,AWS的賭注便是期待AI能夠重要到「最終它不會變得特別。」
當AI從幕前再度回到幕後,AWS的期待便會成真。一如智慧型手機成為標準配備的當下,沒人會再回頭對比按鍵式手機,到了AI熱潮退燒、在背後默默挹注營運之際,對GPT-5問世的期待消失、看見Computer Use的激情褪去,再也沒有人關心先進的推理能力,或者與通用人工智慧的距離。AI將只是任君挑選、符合客戶需求的商品(commodity)。