免費報名 免費報名 感受新東方花藝大師 - 凌宗湧的生活美學

黃仁勳來台催生的「Rubin」如何甩對手?概念股更新

林士蕙
user

林士蕙

2025-09-12

瀏覽數 800+

輝達執行長黃仁勳。張智傑攝
輝達執行長黃仁勳。張智傑攝

喜歡這篇文章嗎 ?

登入 後立即收藏 !
00:00
00:00

本週輝達(NVDA)股價、台積電(TSM)美股猛漲,除了業績佳,輝達官方週二揭露黃仁勳日前特地來台「催生」的 Rubin 下世代晶片完整細節,更獲得外界叫好。為何 Rubin 規劃 2026 年問世後,可望讓 AI 真正變成殺手級應用?半導體分析機構 SemiAnalysis 又如何拆解點出這個供應鏈將成重要新角色?一文詳解。

ChatGPT 問世近 3 年來,AI 模型在許多人眼中,常只是「堪用」,還算不上是超級好用的生產力工具。瓶頸在哪?

許多人可能有過類似的經驗:你可以請 GPT 或 Gemini 寫出一段簡單的程式碼,但若要求它理解整個大型專案,產出的結果可能漏洞百出;同樣地,Veo 等影片生成 AI 雖能做出幾秒鐘驚艷短片,卻還無法從零開始,忠實參照一本厚厚的劇本,完成 1 小時的電影長片。難怪根據 MIT 報告,美國 95%企業導入 AI 都失敗。部分原因雖是人為,也可能跟AI效能有限相關。

然而,在 9 日輝達官方正式宣布推出,曾讓黃仁勳旋風來台「催生」的下世代晶片「Rubin CPX」後,依據官方團隊闡釋的優勢,不僅可把競爭對手甩老遠,也可能解決 AI「只能堪用」的尷尬現況,終於榮登殺手級應用。

NVIDIA Rubin CPX 解決了哪些問題?

到底 Rubin CPX 解決了什麼問題?NVIDIA 加速計算資深總監哈里斯 Dion Harris 在介紹短片中解釋,其實人們目前每天和 AI 聊天請它解答問題,背後的運作是由兩種工作所組成:第一種是「Prefill(預填)」;第二種叫做解碼「(Decode)」。

所謂的「預填」(Prefill),就像 AI 在閱讀理解。它會一口氣讀完你給的所有資料——無論是一句話還是一整本書——在腦中建構一張完整的知識地圖。另外「解碼」(Decode)就是 AI 在發想生成答案的階段。它會根據腦中的地圖,一個字、一個字地生成最終回應。

然而,這兩個性質截然不同的工作,過往都交由同一顆晶片處理。這就像要求一位全能大廚,必須同時負責備料與烹飪。當訂單簡單、需要備的料不多時,他還能快速出餐。但當客人點了滿漢全席——也就是我們提供了海量資料庫、大型軟體專案這種複雜指令時——這位大廚光是備料就疲於應付了。

難怪,當提供太多資料後,整個系統的反應就會極其緩慢,許多人會發現 AI「卡住」很久才吐出第一個字。更糟的是,最終產出的回應品質也下降,出現前後矛盾或類似「失憶」的狀況。

哈里斯指出,由於現在人們愈來愈仰賴 AI 去解決更複雜的問題,「有一群新興的使用案例,需要晶片具備高達數百萬個詞元的推理能力」,Rubin CPX 就是專為這些企業設計的下世代產品。

NVIDIA Rubin CPX 晶片分哪兩種?為何贏對手?

輝達團隊如何解決「廚師難關」?哈里斯指出,其實就是把工作任務分離處理,下世代晶片 Rubin CPX 其實包含了兩種分別針對「預填」與「解碼」工作去設計的晶片。

首先,解碼是由「VR200」晶片擔當。據半導體分析機構 SemiAnalysis出具的拆解報告指出,由於這工作相當考驗資料吞吐速度,因此昂貴的超高頻寬記憶體 HBM,與先進 CoWoS 封裝都不可或缺。但負責「預填」的「CPX」晶片,優勢則在於極高的計算效率,以便處理海量資料。但是資料吞吐速度較不是重點,因此只需要主流 GDDR7 記憶體即可,也不需要 CoWoS。

難怪,半導體分析機構 SemiAnalysis 團隊,研究後讚嘆輝達這次新品是一次巨大的飛躍。現在像是 AMD 等競爭對手,才剛開始模仿輝達上一代的設計,現在又得費心思考如何超越輝達聰明又精省的雙晶片架構,等於是迫使對手「回到繪圖板前」,可能得從頭規劃整個產品路線圖。

輝達前後世代晶片細節

規格項目BlackwellRubin VR200Rubin CPX
AI 算力15 PFLOPS33.3 PFLOPS20 PFLOPS
記憶體速度 (頻寬)8 TB/s20.5 TB/s2 TB/s
記憶體類型HBM3EHBM4GDDR7
封裝技術CoWoS-L
(先進)
CoWoS-L
(先進)
FC-BGA
(主流)
功耗 (發熱量)1400W2300W800W
晶片間的橋樑NVLink
(高速私有)
NVLink
(高速私有)
PCIe Gen6
(高速公用)

資料來源SemiAnalysisNVIDIA   資料整理:遠見編輯部

Rubin CPX 概念股新秀

此外,由於塞入了 8 顆高達 800 瓦的 CPX 晶片,散熱更加挑戰。SemiAnalysis 團隊也發現 Rubin CPX 採用三明治設計,指出中間是一塊流動著冷卻液的金屬水冷板,上下兩層緊緊夾著發熱的晶片,用最高效的方式帶走熱量。 上世代其實是搭配部分風冷,Rubin時代將全面升級為液冷。

遠見39週年|訂兩年再亞諾納25吋質感行李箱(價值$4,490)

日前大摩已點名包括台積電在內的諸多半導體業者入Rubin概念股,因為他們將是製造這款輝達下世代晶片 Rubin 的關鍵廠商。不過在水冷板細節公布後,相關供應鏈值得密切關注未來合作發展。以下是根據Trendforce報告提出的台廠相關資訊。

延伸閱讀: 「液冷散熱」革命,概念股全拆解!

水冷板台廠相關供應鏈

產品類別企業名稱台股代號
水冷板
(Cold Plate)
台達電2308
雙鴻3324
奇鋐3017
酷碼科技未上市
尼得科超眾6230

資料來源:TrendForce


Rubin其他優異設計

NVIDIA也指出,過往模型可能需要使用多達 100 萬個詞元來處理一小時內容的影片,這已經達到傳統 GPU 運算的極限。然而,NVIDIA 超大規模與高效能運算副總裁 Ian Buck 日前演講強調,現在Rubin CPX 內建了4個 NVIDIA 視訊編碼器和四個解碼器,以及長情境推論處理技術,一起整合至單一晶片,未來AI視訊內容的處理和生成能力將有大規模提升。一些想運用生成式AI製作電影的公司,現在非常期待Rubin CPX的到來。

Rubin 何時問世?未來影響?

Rubin預計於2026年底上市。然而,除了投資人,一般民眾更關注的是晶片效能提升後的影響。從 NVIDIA 官方公開合作伙伴如程式AI開發平台 Cursor、影片生成AI模型商 Runway、AI代理開發商 Magic 高層對於可以處理超長上下文的 Rubin CPX 的期待,可以推敲出以下發展:

軟體開發:AI 目前多只能代替初階工程師工作,未來將能讀懂幾乎所有程式碼,提供「閃電般」的修改建議。

影片創作: Rubin 將讓 AI 能理解長篇劇本,未來不再只能做短片,而是生成具有連貫情節的電影等級長片。

AI 代理:AI 能消化數年文件和歷史,成為真正能自主工作的「AI 軟體工程師」。

這也是為何輝達團隊自信預測,未來當全新的 Vera CPU 與 Rubin CPX 相繼問世後,企業得以實現前所未有的盈利規模,每投資 1 億美元即可獲得 50 億美元的詞元收益。

因為許多過去因 AI 算力瓶頸而讓模型變笨的問題,在 Rubin 問世後可望改觀,AI 這回真的能成為對企業來說有用的助手。

你可能也喜歡

科技股入場須知 一次掌握市場動態
數位專題

科技股入場須知 一次掌握市場動態

科技股投資日益成為趨勢,投資人瞭解市場動態成關鍵。近日《黃仁勳傳》作者史帝芬・維特訪台,在與張善政的對談中揭示輝達在桃園建立新總部如何彰顯台灣在全球半導體產業中的地位,與旺宏電子吳敏求一同解析台灣

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務