傳奇晶片設計師Jim Keller打算設計比輝達(Nvidia)更高效的晶片,以降低AI應用價格並搶占市占率。
Jim Keller目前任AI晶片新創Tenstorrent執行長,認為很多市場輝達都沒服務到,隨著AI應用擴展到智慧手機、電動車和雲端服務,越來越多公司尋求更便宜的解決方案,很多小公司不願為輝達高階GPU支付2萬美元。
Jim Keller在晶片設計界享有盛譽,也是AMD Zen系列的首席設計師,許多人認為他幫助AMD東山再起、奮力追上英特爾。他也是開發特斯拉自駕軟體Autopilot 晶片組的重要人物。
日本人工智慧獨角獸公司Preferred Networks運算架構部門副總裁兼技術長Junichiro Makino形容「Jim Keller簡直就是傳奇」。
設計AI晶片時,選擇捨棄關鍵的HBM
Tenstorrent成立於2016年,準備年底推出第二代多用途AI晶片,稱某些領域比輝達AI GPU更高能效和處理效率。Galaxy系統比輝達DGX效率高三倍,價格更便宜 33%。
Keller之所以能做到這點,是因Tenstorrent沒用高頻寬記憶體(HBM)。「即使有用HBM的人,也為成本及構建HBM所需設計時間掙扎,決定不用此技術。」
HBM是生成式AI晶片的重要零件,對輝達產品成功有重要作用,然也是AI晶片能耗巨大、價格高昂的罪魁禍首之一。
典型人工智慧晶片組,GPU每次執行進程時向記憶體發送數據,需HBM高速數據傳輸能力。Tenstorrent設計自己的晶片,大幅減少傳輸。Keller指有了新方法,Tenstorrent晶片可在AI開發某些領域取代GPU和HBM。
Tenstorrent也設計產品以盡可能實現成本效益,許多公司也在追求更適合的記憶體解決方案,但Keller也坦承,要顛覆龐大HBM產業,還需數年時間。他預期與其一間公司取代輝達,不如出現更多新公司,填補美國公司未涉足的各種人工智慧市場。
Tentorrent晶片特點是百餘個核心,每核心都有小型CPU,即「大腦中的微型大腦」。通常情況單晶片核心只有一個小型電腦和記憶體,只負責解決一個任務,但Tenstorrent核心能獨立「思考」,決定先處理哪些數據,或放棄不重要任務,提高整體效率。
Tentorrent指每個核心都相對獨立,可將更多或更少核心堆疊起來,應用更廣泛。智慧手機或穿戴設備只需少量晶片,AI資料中心可將100個晶片組合,用途更靈活。Keller說還無法預測AI最佳應用是什麼,因此公司策略是打造出適合各種產品的技術。
參考資料:U.S. chip designer aims to bring down AI prices pushed up by Nvidia
本文轉載自2024.07.15「科技新報」,僅反映作者意見,不代表本社立場。