輝達股價最近因川普保護費「颱風」,高點震盪中。不過創辦人黃仁勳並未停止合作腳步。本日(24)宣布推出全新的NVIDIA AI Foundry服務和NVIDIA NIM™ 推論微服務,搭配臉書母公司Meta精心打造的Llama 3.1新開放模型。這個強強聯手代表哪些新意義?切入企業用市場,可說是祖克柏巧妙的盤算?對雙方股價前景有幫助?
NVIDIA創辦人暨執行長黃仁勳與Meta創辦人暨執行長馬克.祖克柏(Mark Zuckerberg),即將在下週美東時間7月29日下午3:00(台灣時間7月30日上午6:00),在「SIGGRAPH 2024」首度公開進行爐邊對談,探討AI和模擬的未來,以及研究在SIGGRAPH中的關鍵作用。
選在兩大AI巨頭會晤前夕,NVIDIA今(24)日宣布推出新的NVIDIA AI Foundry服務和 NVIDIA NIM™ 推論微服務,透過同樣新推出的Llama 3.1開放模型系列,可協助企業更快速、精準地開發和部署客製化生成式AI應用能力。
輝達表示,借助NVIDIA AI Foundry,企業和國家現在可以使用由臉書母公司Meta打造的 Llama 3.1 ,來結合 NVIDIA 軟體、運算和專業知識為其特定領域的產業用例創建客製化「超級模型」。
企業可以使用專有資料以及 Llama 3.1 405B 和 NVIDIA Nemotron™ Reward 模型產生的合成資料來訓練這些超級模型;並可根據自身的AI需求來擴展。
輝達黃仁勳:Meta推Llama 3.1 模型,是企業使用GAI的關鍵時刻
黃仁勳表示,Meta公開推出的Llama 3.1 模型代表了全球企業採用生成式 AI 的關鍵時刻。Llama 3.1 為每個企業和產業打開了建構最先進的生成式人工智慧應用的閘門。NVIDIA AI Foundry 已全面整合 Llama 3.1,並準備好協助企業建置和部署客製化 Llama 超級模型。
馬克.祖克伯(Mark Zuckerberg)指出,全新的Llama 3.1 系列模型為開源AI的超級重要一步。企業透過NVIDIA AI Foundry可以輕鬆創造和客製大家最想要的先進的AI服務,並透過 NVIDIA NIM 部署。「我很高興能把它交付到大家的手中。」
輝達表示,NVIDIA AI Foundry 提供端對端服務,可快速建立客製化超級模型。它將 NVIDIA 軟體、基礎設施和專業知識與 NVIDIA AI 生態系的開放社群模式、技術和支援相結合。企業還可將Llama 3.1 NIM 微服務與全新 NVIDIA NeMo Retriever NIM 微服務配對,為AI copilots、助理和數位人分身創建最先進的檢索管道。
另,此些新產品更可使特定領域的知識、來建立客製化的大型語言模型,像是企業內部或是欲制訂主權AI策略的國家等,用於反映其獨特的業務或文化的生成式AI應用。
輝達透露,醫療保健、金融服務、零售、運輸和電信領域的公司已經開始使用 NVIDIA NIM 微服務來支援 Llama。首批使用 Llama 3.1 新版 NIM 微服務的企業包括沙烏地阿拉伯國家石油公司、AT&T、Uber和其他產業領導者。
輝達:AI Foundry可訂製客製化模型
輝達表示,企業若想利用AI的力量,就需根據其特定產業需求來客製化模型。而NVIDIA AI Foundry這項新服務,能夠讓企業利用資料、加速運算及軟體工具來創建和部署能夠增強其生成式 AI 計畫的客製化模型。
就像台積電製造其他公司設計的晶片一樣,NVIDIA AI Foundry 提供基礎設施和工具,讓其他公司能夠透過使用 DGX Cloud、基礎模型、NVIDIA NeMo 軟體、NVIDIA 專業知識以及生態系工具和支援,開發和客製化AI模型。
關鍵差異在於產品:台積電生產實體的半導體晶片,而 NVIDIA AI Foundry 則協助創建客製化模型。兩者都促進創新,並連結到龐大的的工具和合作伙伴生態系。
企業用戶可以使用 AI Foundry 來客製化 NVIDIA 和開源社群模型,包括全新的 Llama 3.1 系列,以及 NVIDIA Nemotron、Google DeepMind 的 CodeGemma、CodeLlama、Google DeepMind 的 Gemma、Mistral、Mixtral、Phi-3、StarCoder2 等。目前已有:Amdocs、Capital One、Getty Images、KT、SAP、ServiceNow、Snowflake 和 Together AI 等在內的產業領導者,率先使用NVIDIA AI Foundry。
輝達NIM推論微服務提高模型精確度
為了協助開發人員有效率地取得最佳的專屬資料,為其AI應用產生有著豐富知識的回應內容,輝達今日同步發表NVIDIA NeMo Retriever NIM 推論微服務。
輝達指出,NeMo Retriever NIM 微服務加上今日宣布適用於 Llama 3.1 模型集合的 NVIDIA NIM 推論微服務,可讓企業擴展至代理式 AI 工作流程。而在此流程中,AI應用程式只需最少的人為干預或監督即可精確運作,同時提供最高精確度的檢索增強生成(RAG)。
NeMo Retriever 可讓組織將自訂模型無縫連接至各種業務資料,並且使用 RAG 為 AI 應用程式提供高準確度的回應。從本質上講,生產就緒型的微服務能夠檢索出高度精確的資訊,以建立極為精準的 AI 應用程式。
舉例來說,NeMo Retriever 可為開發人員提高模型精確度與吞吐量,以建立 AI 代理程式與客服聊天機器人、分析安全漏洞,或是從複雜的供應鏈資訊中提取重要見解。