NVIDIA 今日發(fā)布 NVIDIA AI 平臺的多項重要更新。該平臺是一套致力于推進語音、推薦系統(tǒng)、超大規(guī)模推理等工作負(fù)載的軟件套件,目前已被 Amazon, Microsoft, Snap 和日本電信電話株式會社等全球行業(yè)領(lǐng)導(dǎo)者所采用。
NVIDIA 也宣布了 NVIDIA? AI 加速計劃,以助力確保 NVIDIA 軟件和解決方案合作伙伴所開發(fā) AI 應(yīng)用的性能和可靠性。該計劃針對各種經(jīng)過驗證的 AI 加速應(yīng)用增加了可見性,使企業(yè)客戶能夠放心地在 NVIDIA AI 平臺上進行部署。Adobe、紅帽(Red Hat)和 VMware 等 100 多家合作伙伴參與了計劃啟動儀式。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示: “NVIDIA AI 可定義為全球 AI 社區(qū)的軟件工具箱,從 AI 研究者和數(shù)據(jù)科學(xué)家們,到數(shù)據(jù)和機器學(xué)習(xí)的運營團隊。NVIDIA 在 GTC 2022上有著大量的新發(fā)布。無論是創(chuàng)建互動能力更強的聊天機器人和虛擬助手,還是構(gòu)建更加智能的推薦系統(tǒng)來幫助消費者做出更完善的購買決策,亦或是以最大的規(guī)模編排 AI 服務(wù),NVIDIA AI 始終能夠針對您的需求提供強大的助力?!?/p>
NVIDIA AI 可供開發(fā)者免費使用,包括用于語音 AI 的 NVIDIA Riva 和用于智能推薦系統(tǒng)的 NVIDIA Merlin?,這兩款軟件均已正式全面上線。而整個軟件套件也進行了更新,包括 NVIDIA Triton、NeMo、Maxine 和 TAO 工具包等工具。?
此外,NVIDIA AI Enterprise 2.0 現(xiàn)已經(jīng)過優(yōu)化和認(rèn)證,并支持所有主要的數(shù)據(jù)中心和云平臺,包括裸金屬服務(wù)器、虛擬化基礎(chǔ)設(shè)施和純 CPU 系統(tǒng)。該套件現(xiàn)在支持 Red Hat OpenShift 和 VMware vSphere with Tanzu。
用于構(gòu)建領(lǐng)先AI應(yīng)用的軟件工具
NVIDIA AI 是由多項具有關(guān)鍵功能的 SDK 和工具所組成,可用于跨多個節(jié)點上對 AI 工作負(fù)載進行快速部署、管理和擴展,為復(fù)雜的訓(xùn)練和機器學(xué)習(xí)工作負(fù)載提供有力的支持。它包含以下軟件和工具:
- NVIDIA Triton? :NVIDIA Triton 是一款多功能開源超大規(guī)模模型推理解決方案。其最新版本包含三項關(guān)鍵更新:用于加速部署優(yōu)化模型的模型導(dǎo)航器、用于在 Kubernetes 中進行高效擴展的管理服務(wù),以及能夠?qū)跇涞哪P瓦M行推理的森林推理庫,其具有可解釋性,可在每個應(yīng)用中實現(xiàn)快速、經(jīng)過優(yōu)化和可擴展的AI。
- NVIDIA Riva 2.0:這款領(lǐng)先的語音 AI SDK 包含具有領(lǐng)先識別率的預(yù)訓(xùn)練模型,使開發(fā)者能夠為其行業(yè)定制實時語音AI應(yīng)用程序,其準(zhǔn)確率比普通服務(wù)高 2 倍。Riva 2.0 包含 7 種語言的語音識別、基于深度學(xué)習(xí)仿真人發(fā)音的語音合成(包括男聲和女聲)以及可通過 NVIDIA TAO 工具包進行的自定義調(diào)優(yōu)。NVIDIA 還發(fā)布了涵蓋企業(yè)級支持的付費產(chǎn)品 NVIDIA Riva Enterprise。
- NVIDIA NeMo Megatron 0.9:NeMo Megatron 是一個用于訓(xùn)練大型語言模型(LLM)的框架。研究者和企業(yè)能夠用它來訓(xùn)練模型,使模型能夠收斂和擴展至數(shù)萬億個參數(shù),以便用于對話式 AI、推薦系統(tǒng)和基因組學(xué)等應(yīng)用。其最新版本中新增的優(yōu)化和方法能夠縮短端到端開發(fā)和訓(xùn)練時間,并添加對云端訓(xùn)練的支持。NVIDIA 加速計算 LLM 的早期用戶包括京東、AI Sweden、Naver 和佛羅里達(dá)大學(xué)。
- NVIDIA Merlin 1.0:這是一個加速端到端推薦 AI 框架,用于大規(guī)模構(gòu)建高性能推薦系統(tǒng)。它包含兩個新庫:Merlin Models 和 Merlin Systems。這些庫使數(shù)據(jù)科學(xué)家和機器學(xué)習(xí)工程師能夠確定哪些功能和模型最適合他們的應(yīng)用場景,并將推薦系統(tǒng)流水線部署為微服務(wù)。 ? ? ? ?
- NVIDIA Maxine:這個音頻和視頻質(zhì)量增強 SDK 使用 AI 重塑實時通信,并引入回聲消除和音頻超分辨率。這兩項新功能能夠提高音頻質(zhì)量,帶來更清晰的通信體驗。
NVIDIA AI 深受客戶的歡迎
各個行業(yè)的領(lǐng)導(dǎo)者正在使用 NVIDIA AI 來提高成本效益、打造更具吸引力的客戶體驗并優(yōu)化 AI 應(yīng)用的功能。
Snap 對話式 AI 負(fù)責(zé)人 Alan Bekker 表示:“在 Snapchat 上,我們的社區(qū)每天使用 Lenses 超過 60 億次。Snap 正在使用 NVIDIA Riva 來優(yōu)化基于 AI 的語音功能,并將這些功能提供給 Lens Studio 創(chuàng)作者,助力其打造新一代高質(zhì)量 AR 體驗。”
微軟技術(shù)研究員兼 Azure AI 首席技術(shù)官黃學(xué)東表示:“Microsoft Azure 認(rèn)知服務(wù) Translator 中的文件翻譯功能,能夠在翻譯文件時保留源文件的格式和結(jié)構(gòu),提高企業(yè)與客戶的互動效率。通過 NVIDIA Triton,我們能夠部署最新的 Z-Code 模型,在保證低延遲的前提下大幅提高文檔翻譯質(zhì)量,為用戶提供一流的翻譯服務(wù)?!?/p>
NVIDIA AI Enterprise 支持跨數(shù)據(jù)中心和云的容器化 AI
作為一款端到端、云原生的 AI 和數(shù)據(jù)分析工具與框架套件,NVIDIA AI Enterprise 2.0 軟件套件能夠加速各個行業(yè)的 AI 開發(fā)和部署。Red Hat OpenShift 是領(lǐng)先的企業(yè)級 Kubernetes 平臺,獲得 Red Hat OpenShift 認(rèn)證的客戶能夠通過 VMware vSphere 使用容器化機器學(xué)習(xí)工具,更輕松地在裸金屬或虛擬化系統(tǒng)上構(gòu)建、擴展和共享模型。
紅帽合作伙伴生態(tài)系統(tǒng)部門高級副總裁 Stefanie Chiras 表示:“NVIDIA AI Enterprise 已獲得 Red Hat OpenShift 認(rèn)證,并且 OpenShift 已在 NVIDIA LaunchPad 上線,因此用戶可以同時獲得頂尖的 AI 開發(fā)工具以及具有一致性的混合云基礎(chǔ)?,F(xiàn)在,IT 團隊和數(shù)據(jù)科學(xué)家可以在 Red Hat OpenShift 上構(gòu)建并管理 NVIDIA AI,幫助企業(yè)加快實際生產(chǎn)中的智能應(yīng)用交付速度?!?/p>
NVIDIA AI Enterprise 2.0 還引入了更多支持訓(xùn)練和推理的 NVIDIA AI 軟件容器。對 NVIDIA TAO 工具包的支持使企業(yè)開發(fā)者能夠?qū)?NVIDIA 預(yù)訓(xùn)練 AI 模型進行微調(diào)和優(yōu)化,從而簡化自定義生產(chǎn)就緒模型的創(chuàng)建,而無需具備 AI 專業(yè)知識或大量訓(xùn)練數(shù)據(jù)。該軟件套件還包含最新發(fā)布的 NVIDIA Triton 推理服務(wù)器。
日本電信電話株式會社是日本電信電話集團旗下的全球領(lǐng)先信息和通信技術(shù)解決方案提供商。該公司已采用 NVIDIA AI Enterprise 來助力研發(fā)團隊加速構(gòu)建自然語言處理(NLP)和智能視頻分析應(yīng)用。
日本電信電話株式會社創(chuàng)新中心技術(shù)部總監(jiān) Shoichiro Henmi 表示:“我們的許多應(yīng)用開發(fā)者現(xiàn)在都在使用加速計算,并有賴于內(nèi)部基礎(chǔ)設(shè)施來提供易于使用且具有高成本效益的 GPU 環(huán)境。我們認(rèn)為 NVIDIA AI Enterprise 是作為支持 AI 平臺的理想解決方案,它將為我們在 VMware vSphere、Kubernetes 和云基礎(chǔ)設(shè)施中的大規(guī)模開發(fā)工作提供支持。
”
客戶可以授權(quán) NVIDIA AI Enterprise 在 NVIDIA 認(rèn)證系統(tǒng)(NVIDIA-Certified Systems?)上運行,也可以在沒有 NVIDIA GPU 的相同型號服務(wù)器上運行,包括來自思科、戴爾科技、新華三、慧與(HPE)、浪潮、聯(lián)想、寧暢和超微等領(lǐng)先制造商的服務(wù)器。
企業(yè)還可以選擇在托管于全球各地 Equinix International Business Exchange?(IBX? )數(shù)據(jù)中心的服務(wù)器上進行部署?,F(xiàn)已支持來自 AWS、谷歌云和 Microsoft Azure 的云實例。NVIDIA AI Enterprise 現(xiàn)已包含于 NVIDIA DGX 系統(tǒng)中。
供貨情況
作為 NVIDIA 開發(fā)者計劃的一部分,開發(fā)者均可使用 NVIDIA 的 AI 軟件集。
??
企業(yè) IT 團隊和 AI 開發(fā)者可以在 NVIDIA LaunchPad 實驗室中體驗 NVIDIA AI 軟件,其是由 Equinix Metal 在全球九座 Equinix IBX 數(shù)據(jù)中心提供的免費托管計劃。新增加的 LaunchPad 實驗室包括 Riva 語音 AI 實驗室,以及多個可以體驗 Red Hat OpenShift、VMware vSphere with Tanzu、TAO 工具包和 Triton 推理服務(wù)器(帶有 FIL 后端)的 NVIDIA AI Enterprise 實驗室。 ?
觀看 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛的 GTC 2022 主題演講,進一步了解NVIDIA Hopper 和 H100。免費注冊 GTC 2022,與NVIDIA和行業(yè)領(lǐng)導(dǎo)者共襄盛會。
?