本週輝達(NVDA)股價、台積電(TSM)美股猛漲,除了業績佳,輝達官方週二揭露黃仁勳日前特地來台「催生」的 Rubin 下世代晶片完整細節,更獲得外界叫好。為何 Rubin 規劃 2026 年問世後,可望讓 AI 真正變成殺手級應用?半導體分析機構 SemiAnalysis 又如何拆解點出這個供應鏈將成重要新角色?一文詳解。
ChatGPT 問世近 3 年來,AI 模型在許多人眼中,常只是「堪用」,還算不上是超級好用的生產力工具。瓶頸在哪?
許多人可能有過類似的經驗:你可以請 GPT 或 Gemini 寫出一段簡單的程式碼,但若要求它理解整個大型專案,產出的結果可能漏洞百出;同樣地,Veo 等影片生成 AI 雖能做出幾秒鐘驚艷短片,卻還無法從零開始,忠實參照一本厚厚的劇本,完成 1 小時的電影長片。難怪根據 MIT 報告,美國 95%企業導入 AI 都失敗。部分原因雖是人為,也可能跟AI效能有限相關。
然而,在 9 日輝達官方正式宣布推出,曾讓黃仁勳旋風來台「催生」的下世代晶片「Rubin CPX」後,依據官方團隊闡釋的優勢,不僅可把競爭對手甩老遠,也可能解決 AI「只能堪用」的尷尬現況,終於榮登殺手級應用。
NVIDIA Rubin CPX 解決了哪些問題?
到底 Rubin CPX 解決了什麼問題?NVIDIA 加速計算資深總監哈里斯 Dion Harris 在介紹短片中解釋,其實人們目前每天和 AI 聊天請它解答問題,背後的運作是由兩種工作所組成:第一種是「Prefill(預填)」;第二種叫做解碼「(Decode)」。
所謂的「預填」(Prefill),就像 AI 在閱讀理解。它會一口氣讀完你給的所有資料——無論是一句話還是一整本書——在腦中建構一張完整的知識地圖。另外「解碼」(Decode)就是 AI 在發想生成答案的階段。它會根據腦中的地圖,一個字、一個字地生成最終回應。
然而,這兩個性質截然不同的工作,過往都交由同一顆晶片處理。這就像要求一位全能大廚,必須同時負責備料與烹飪。當訂單簡單、需要備的料不多時,他還能快速出餐。但當客人點了滿漢全席——也就是我們提供了海量資料庫、大型軟體專案這種複雜指令時——這位大廚光是備料就疲於應付了。
難怪,當提供太多資料後,整個系統的反應就會極其緩慢,許多人會發現 AI「卡住」很久才吐出第一個字。更糟的是,最終產出的回應品質也下降,出現前後矛盾或類似「失憶」的狀況。
哈里斯指出,由於現在人們愈來愈仰賴 AI 去解決更複雜的問題,「有一群新興的使用案例,需要晶片具備高達數百萬個詞元的推理能力」,Rubin CPX 就是專為這些企業設計的下世代產品。
NVIDIA Rubin CPX 晶片分哪兩種?為何贏對手?
輝達團隊如何解決「廚師難關」?哈里斯指出,其實就是把工作任務分離處理,下世代晶片 Rubin CPX 其實包含了兩種分別針對「預填」與「解碼」工作去設計的晶片。
首先,解碼是由「VR200」晶片擔當。據半導體分析機構 SemiAnalysis出具的拆解報告指出,由於這工作相當考驗資料吞吐速度,因此昂貴的超高頻寬記憶體 HBM,與先進 CoWoS 封裝都不可或缺。但負責「預填」的「CPX」晶片,優勢則在於極高的計算效率,以便處理海量資料。但是資料吞吐速度較不是重點,因此只需要主流 GDDR7 記憶體即可,也不需要 CoWoS。
難怪,半導體分析機構 SemiAnalysis 團隊,研究後讚嘆輝達這次新品是一次巨大的飛躍。現在像是 AMD 等競爭對手,才剛開始模仿輝達上一代的設計,現在又得費心思考如何超越輝達聰明又精省的雙晶片架構,等於是迫使對手「回到繪圖板前」,可能得從頭規劃整個產品路線圖。
輝達前後世代晶片細節
規格項目 | Blackwell | Rubin VR200 | Rubin CPX |
---|---|---|---|
AI 算力 | 15 PFLOPS | 33.3 PFLOPS | 20 PFLOPS |
記憶體速度 (頻寬) | 8 TB/s | 20.5 TB/s | 2 TB/s |
記憶體類型 | HBM3E | HBM4 | GDDR7 |
封裝技術 | CoWoS-L (先進) | CoWoS-L (先進) | FC-BGA (主流) |
功耗 (發熱量) | 1400W | 2300W | 800W |
晶片間的橋樑 | NVLink (高速私有) | NVLink (高速私有) | PCIe Gen6 (高速公用) |
資料來源:SemiAnalysis,NVIDIA 資料整理:遠見編輯部
Rubin CPX 概念股新秀
此外,由於塞入了 8 顆高達 800 瓦的 CPX 晶片,散熱更加挑戰。SemiAnalysis 團隊也發現 Rubin CPX 採用三明治設計,指出中間是一塊流動著冷卻液的金屬水冷板,上下兩層緊緊夾著發熱的晶片,用最高效的方式帶走熱量。 上世代其實是搭配部分風冷,Rubin時代將全面升級為液冷。
日前大摩已點名包括台積電在內的諸多半導體業者入Rubin概念股,因為他們將是製造這款輝達下世代晶片 Rubin 的關鍵廠商。不過在水冷板細節公布後,相關供應鏈值得密切關注未來合作發展。以下是根據Trendforce報告提出的台廠相關資訊。
延伸閱讀: 「液冷散熱」革命,概念股全拆解!
水冷板台廠相關供應鏈
產品類別 | 企業名稱 | 台股代號 |
---|---|---|
水冷板 (Cold Plate) | 台達電 | 2308 |
雙鴻 | 3324 | |
奇鋐 | 3017 | |
酷碼科技 | 未上市 | |
尼得科超眾 | 6230 |
資料來源:TrendForce
Rubin其他優異設計
NVIDIA也指出,過往模型可能需要使用多達 100 萬個詞元來處理一小時內容的影片,這已經達到傳統 GPU 運算的極限。然而,NVIDIA 超大規模與高效能運算副總裁 Ian Buck 日前演講強調,現在Rubin CPX 內建了4個 NVIDIA 視訊編碼器和四個解碼器,以及長情境推論處理技術,一起整合至單一晶片,未來AI視訊內容的處理和生成能力將有大規模提升。一些想運用生成式AI製作電影的公司,現在非常期待Rubin CPX的到來。
Rubin 何時問世?未來影響?
Rubin預計於2026年底上市。然而,除了投資人,一般民眾更關注的是晶片效能提升後的影響。從 NVIDIA 官方公開合作伙伴如程式AI開發平台 Cursor、影片生成AI模型商 Runway、AI代理開發商 Magic 高層對於可以處理超長上下文的 Rubin CPX 的期待,可以推敲出以下發展:
軟體開發:AI 目前多只能代替初階工程師工作,未來將能讀懂幾乎所有程式碼,提供「閃電般」的修改建議。
影片創作: Rubin 將讓 AI 能理解長篇劇本,未來不再只能做短片,而是生成具有連貫情節的電影等級長片。
AI 代理:AI 能消化數年文件和歷史,成為真正能自主工作的「AI 軟體工程師」。
這也是為何輝達團隊自信預測,未來當全新的 Vera CPU 與 Rubin CPX 相繼問世後,企業得以實現前所未有的盈利規模,每投資 1 億美元即可獲得 50 億美元的詞元收益。
因為許多過去因 AI 算力瓶頸而讓模型變笨的問題,在 Rubin 問世後可望改觀,AI 這回真的能成為對企業來說有用的助手。