2026/1/6更新:6日輝達(NVIDIA)黃仁勳於CES 2026展前主題演講,去年因Google TPU新一代橫空出世,讓輝達新一代晶片Vera Rubin備受關注。這次真的再甩對手了嗎?黃仁勳在演講中表示,宣布 Vera Rubin 已進入全面量產階段,預計今年投入市場。他並提及台積電(TSM)矽光子技術、以及許多台廠伙伴。這次又將有新概念股成軍?Rubin有哪些性能升級?一次看。
2026/1/6更新:
Google TPU新一代太強,輝達贏得了嗎?
近一個月NVIDIA美股股價小跌3%,主要是Google去年底揭露,內部Gemini模型訓練僅靠自家晶片TPU即可完成,讓股市投資人開始擔憂輝達的GPU競爭力。黃仁勳6日在CES 2026展前的演講,是否有扳回一城?
在本次演講中,黃仁勳明白表示,接班Blackwell的Vera Rubin新一代晶片不會讓外界等太久,現已進入全面量產階段,預計將在2026年進入市場。
另外,Vera Rubin這次最大的創新,是採取極致共同設計(Extreme Co-design),因應摩爾定律放緩,打破常規,一次性重新設計了系統中的6款關鍵晶片。
黃仁勳雖未在演講中直接提及如何面對Google TPU,但演講中他暗示著Vera Rubin的策略是透過讓CPU、網路晶片與GPU完美配合,來對抗客製化晶片。
至於他在展前演講中,也再次感謝多個台廠伙伴,促成Vera Rubin的誕生,包括:
台積電(2330):黃仁勳特別感謝台積電與NVIDIA共同創新(Co-innovated)了名為COUPE的矽光子製程技術。這是世界首款採用此製程的製造晶片,讓光訊號能直接進入晶片封裝,解決了傳輸瓶頸。
鴻海(2317)、廣達(2382)、緯創(3231):黃仁勳也感謝了伺服器製造伙伴,包括諸多台廠,因為他們都採用NVIDIA DGX架構。正因為這些伙伴的標準化支持,NVIDIA才能在Vera Rubin功耗增加兩倍的情況下,依然能順利整合進現有的資料中心基礎設施中,並讓組裝機櫃的時間從兩小時縮減到5分鐘。
此外,黃仁勳也談到新一代Vera Rubin已採取100%液體冷卻設計。這也讓台廠水冷概念股再度受到矚目。
延伸閱讀: 「液冷散熱」革命,概念股全拆解!
ChatGPT 問世近 3 年只是「堪用」,GPU瓶頸在哪?
許多人可能有過類似的經驗:你可以請 GPT 或 Gemini 寫出一段簡單的程式碼,但若要求它理解整個大型專案,產出的結果可能漏洞百出;同樣地,Veo 等影片生成 AI 雖能做出幾秒鐘驚艷短片,卻還無法從零開始,忠實參照一本厚厚的劇本,完成 1 小時的電影長片。難怪根據 MIT 報告,美國 95%企業導入 AI 都失敗。部分原因雖是人為,也可能跟AI效能有限相關。
然而,在 9 日輝達官方正式宣布推出,曾讓黃仁勳旋風來台「催生」的下世代晶片「Rubin CPX」後,依據官方團隊闡釋的優勢,不僅可把競爭對手甩老遠,也可能解決 AI「只能堪用」的尷尬現況,終於榮登殺手級應用。
NVIDIA Rubin CPX 解決了哪些問題?
到底 Rubin CPX 解決了什麼問題?NVIDIA 加速計算資深總監哈里斯 Dion Harris 在介紹短片中解釋,其實人們目前每天和 AI 聊天請它解答問題,背後的運作是由兩種工作所組成:第一種是「Prefill(預填)」;第二種叫做解碼「(Decode)」。
所謂的「預填」(Prefill),就像 AI 在閱讀理解。它會一口氣讀完你給的所有資料——無論是一句話還是一整本書——在腦中建構一張完整的知識地圖。另外「解碼」(Decode)就是 AI 在發想生成答案的階段。它會根據腦中的地圖,一個字、一個字地生成最終回應。
然而,這兩個性質截然不同的工作,過往都交由同一顆晶片處理。這就像要求一位全能大廚,必須同時負責備料與烹飪。當訂單簡單、需要備的料不多時,他還能快速出餐。但當客人點了滿漢全席——也就是我們提供了海量資料庫、大型軟體專案這種複雜指令時——這位大廚光是備料就疲於應付了。
難怪,當提供太多資料後,整個系統的反應就會極其緩慢,許多人會發現 AI「卡住」很久才吐出第一個字。更糟的是,最終產出的回應品質也下降,出現前後矛盾或類似「失憶」的狀況。
哈里斯指出,由於現在人們愈來愈仰賴 AI 去解決更複雜的問題,「有一群新興的使用案例,需要晶片具備高達數百萬個詞元的推理能力」,Rubin CPX 就是專為這些企業設計的下世代產品。
NVIDIA Rubin CPX 晶片分哪兩種?為何贏對手?
輝達團隊如何解決「廚師難關」?哈里斯指出,其實就是把工作任務分離處理,下世代晶片 Rubin CPX 其實包含了兩種分別針對「預填」與「解碼」工作去設計的晶片。
首先,解碼是由「VR200」晶片擔當。據半導體分析機構 SemiAnalysis出具的拆解報告指出,由於這工作相當考驗資料吞吐速度,因此昂貴的超高頻寬記憶體 HBM,與先進 CoWoS 封裝都不可或缺。但負責「預填」的「CPX」晶片,優勢則在於極高的計算效率,以便處理海量資料。但是資料吞吐速度較不是重點,因此只需要主流 GDDR7 記憶體即可,也不需要 CoWoS。
難怪,半導體分析機構 SemiAnalysis 團隊,研究後讚嘆輝達這次新品是一次巨大的飛躍。現在像是 AMD 等競爭對手,才剛開始模仿輝達上一代的設計,現在又得費心思考如何超越輝達聰明又精省的雙晶片架構,等於是迫使對手「回到繪圖板前」,可能得從頭規劃整個產品路線圖。
輝達前後世代晶片細節
| 規格項目 | Blackwell | Rubin VR200 | Rubin CPX |
|---|---|---|---|
| AI 算力 | 15 PFLOPS | 33.3 PFLOPS | 20 PFLOPS |
| 記憶體速度 (頻寬) | 8 TB/s | 20.5 TB/s | 2 TB/s |
| 記憶體類型 | HBM3E | HBM4 | GDDR7 |
| 封裝技術 | CoWoS-L (先進) | CoWoS-L (先進) | FC-BGA (主流) |
| 功耗 (發熱量) | 1400W | 2300W | 800W |
| 晶片間的橋樑 | NVLink (高速私有) | NVLink (高速私有) | PCIe Gen6 (高速公用) |
資料來源:SemiAnalysis,NVIDIA 資料整理:遠見編輯部
Rubin CPX 概念股新秀
此外,由於塞入了 8 顆高達 800 瓦的 CPX 晶片,散熱更加挑戰。SemiAnalysis 團隊也發現 Rubin CPX 採用三明治設計,指出中間是一塊流動著冷卻液的金屬水冷板,上下兩層緊緊夾著發熱的晶片,用最高效的方式帶走熱量。 上世代其實是搭配部分風冷,Rubin時代將全面升級為液冷。
日前大摩已點名包括台積電在內的諸多半導體業者入Rubin概念股,因為他們將是製造這款輝達下世代晶片 Rubin 的關鍵廠商。不過在水冷板細節公布後,相關供應鏈值得密切關注未來合作發展。以下是根據Trendforce報告提出的台廠相關資訊。
延伸閱讀: 「液冷散熱」革命,概念股全拆解!
水冷板台廠相關供應鏈
| 產品類別 | 企業名稱 | 台股代號 |
|---|---|---|
| 水冷板 (Cold Plate) | 台達電 | 2308 |
| 雙鴻 | 3324 | |
| 奇鋐 | 3017 | |
| 酷碼科技 | 未上市 | |
| 尼得科超眾 | 6230 |
資料來源:TrendForce
Vera Rubin其他優異設計
NVIDIA也指出,過往模型可能需要使用多達 100 萬個詞元來處理一小時內容的影片,這已經達到傳統 GPU 運算的極限。然而,NVIDIA 超大規模與高效能運算副總裁 Ian Buck 日前演講強調,現在Rubin CPX 內建了4個 NVIDIA 視訊編碼器和四個解碼器,以及長情境推論處理技術,一起整合至單一晶片,未來AI視訊內容的處理和生成能力將有大規模提升。一些想運用生成式AI製作電影的公司,現在非常期待Rubin CPX的到來。
Vera Rubin 何時問世?未來影響?
Rubin預計於2026年底上市。然而,除了投資人,一般民眾更關注的是晶片效能提升後的影響。從 NVIDIA 官方公開合作伙伴如程式AI開發平台 Cursor、影片生成AI模型商 Runway、AI代理開發商 Magic 高層對於可以處理超長上下文的 Rubin CPX 的期待,可以推敲出以下發展:
軟體開發:AI 目前多只能代替初階工程師工作,未來將能讀懂幾乎所有程式碼,提供「閃電般」的修改建議。
影片創作: Rubin 將讓 AI 能理解長篇劇本,未來不再只能做短片,而是生成具有連貫情節的電影等級長片。
AI 代理:AI 能消化數年文件和歷史,成為真正能自主工作的「AI 軟體工程師」。
這也是為何輝達團隊自信預測,未來當全新的 Vera CPU 與 Rubin CPX 相繼問世後,企業得以實現前所未有的盈利規模,每投資 1 億美元即可獲得 50 億美元的詞元收益。
因為許多過去因 AI 算力瓶頸而讓模型變笨的問題,在 Rubin 問世後可望改觀,AI 這回真的能成為對企業來說有用的助手。