NVIDIA整合Groq LPU的目的為何？

NVIDIA整合Groq的LPU技術主要是為了提高AI推論的速度，讓回應速度快上約35倍，並降低Token生成的成本，從而提升整體使用體驗和互動性。

LPU技術如何影響ASIC晶片的競爭？

LPU技術的導入使得AI推論不再依賴單一晶片，而是強調整個系統的協同運作，這可能顛覆ASIC晶片原本的競爭邏輯，因為系統的完整性和效率變得更為重要。

NVIDIA的AI推論速度目標是什麼？

NVIDIA的目標是將GPU的推論速度提升到每秒1000至2000個Tokens，這將顯著提高AI在複雜問題上的回應速度，進一步推動AI應用的發展。

NVIDIA如何看待AI系統的設計？

NVIDIA強調「極致協同設計」，認為AI推論需要GPU、LPU和CPU等多種處理器的合作，並不斷優化整個系統，以移動瓶頸來提升性能。

未來的AI應用將如何發展？

未來的AI應用將朝向Agentic AI發展，這類AI不僅能回答問題，還能進行多個AI代理之間的協作，對速度的要求將更高，促進更多實際應用場景的出現。

GTC會後〉NVIDIA整合Groq LPU，那是什麼？ASIC晶片將被顛覆？

盧佳柔

盧佳柔

2026-04-02

瀏覽數

隨著AI應用進入推論時代，NVIDIA以GPU與LPU分工協作，重寫算力競爭規則，將焦點從單一晶片轉向整體系統效能與成本。盧佳柔攝

在AI競賽邁入推論時代之際，「秒回」正成為新的勝負關鍵，也讓自研ASIC晶片的競爭全面升溫。NVIDIA在2025年底以200億美元整合Groq公司的LPU（Language Processing Unit，語言處理單元）技術，正面迎戰雲端巨頭的自研布局。「導入LPU，最直接的改變就是速度，回應可以快上約35倍，讓互動更接近真人對話，」NVIDIA AI與資料中心GPU產品行銷總監夏爾．納拉辛漢（Shar Narasimhan）指出。這是一場圍繞即時性與成本效率展開的系統戰，當AI能夠幾乎即時回應、且以更低成本生成Token，ASIC的競爭邏輯也正被重新改寫。

「在AI世界裡，決定勝負的，不是單一晶片，而是整個系統能不能一起變快，」納拉辛漢用一句話點出AI領域的關鍵，也說明了NVIDIA近期導入LPU的核心思維。

多數人以為，雲端巨頭投入ASIC，是為了追求更好的效能與功耗比。但在納拉辛漢看來，真正的關鍵是成本。「開發者會選擇能獲得最佳解決方案的地方，」他說，「這也包括誰能提供最低的Token成本。」

當AI應用進入推論階段，每一次回應、每一個Token都代表成本。隨著應用變得愈來愈即時頻繁，Token成本會被無限放大。

也因此，NVIDIA導入LPU的第一個目標，就是降低這件事。

納拉辛漢指出，「導入LPU的好處，是速度可以快上約35倍，這讓AI的回應更快，也讓互動更自然。」這不只是效能提升，而是直接改變使用體驗。

當AI回應趨近即時，它不再只是工具，而更像是一個可以即時對話、持續互動的系統，甚至類似於真人對話。更關鍵的是，當NVIDIA能以更低成本生成Token，雲端巨頭自研晶片原本建立在「降低成本」上的經濟邏輯，也將隨之被動搖。

不跟你比晶片，而是打「系統戰」

面對自研晶片浪潮，NVIDIA並沒有選擇做更多晶片，而是選擇整合。納拉辛漢直言，AI推論已經不是單一晶片可以完成的任務。在大規模推論場景中，GPU和LPU是交錯運作，由GPU負責一部分工作，LPU負責另一部分工作，且彼此之間會不斷交換資料。
NVIDIA AI 與資料中心 GPU 產品行銷總監夏爾．納拉辛漢（Shar Narasimhan）強調，AI競爭關鍵不在單一晶片，而在整個系統的協同設計與成本效率。盧佳柔攝