Supermicro基于NVIDIA GH200超級(jí)芯片的服務(wù)器平臺(tái)借助緊密集成的CPU和GPU提高了AI工作負(fù)載的性能,并納入了最新的DPU網(wǎng)絡(luò)和通信技術(shù)
Supermicro,Inc. (納斯達(dá)克股票代碼:SMCI)為AI、云端、存儲(chǔ)和 5G/邊緣領(lǐng)域的全方位IT解決方案制造商,近日宣布推出業(yè)內(nèi)目前最廣泛的新型GPU系統(tǒng)組合之一。這些產(chǎn)品均基于英偉達(dá)(NVIDIA)參考架構(gòu),搭載了最新的NVIDIA GH200 Grace Hopper和NVIDIA Grace CPU超級(jí)芯片。這種新的模塊化架構(gòu)旨在通過(guò)緊湊的1U和2U規(guī)格將AI基礎(chǔ)設(shè)施和加速計(jì)算標(biāo)準(zhǔn)化,同時(shí)面向當(dāng)前及未來(lái)的GPU、DPU和CPU提供高靈活性和擴(kuò)展度。Supermicro先進(jìn)的液冷技術(shù)有助于實(shí)現(xiàn)非常高密度的硬件配置,例如搭載2顆NVIDIA GH200 Grace Hopper超級(jí)芯片的1U 2節(jié)點(diǎn)配置,兩者借助高速互連技術(shù)整合在一起。Supermicro每月可通過(guò)全球的工廠交付數(shù)以千計(jì)的機(jī)架級(jí)AI服務(wù)器,并確保即插即用兼容性。
Supermicro總裁兼首席執(zhí)行官梁見(jiàn)后(Charles Liang)表示:“Supermicro是推動(dòng)當(dāng)前AI革命的公認(rèn)領(lǐng)先企業(yè)。我們助力數(shù)據(jù)中心轉(zhuǎn)型,助力將AI用于各種工作負(fù)載內(nèi)。對(duì)于我們來(lái)說(shuō),為快速發(fā)展的AI技術(shù)帶來(lái)高度模塊化、可擴(kuò)展性和通用性的服務(wù)器系統(tǒng)至關(guān)重要。Supermicro基于NVIDIA MGX的解決方案不但證明我們的Building Block伺服器解決方案能使我們迅速將最新系統(tǒng)引進(jìn)市場(chǎng),也是產(chǎn)業(yè)中工作負(fù)載最佳化性能非常高的解決方案。通過(guò)攜手英偉達(dá),我們正助力加速合作企業(yè)產(chǎn)品上市時(shí)間,并助其在開(kāi)發(fā)新AI應(yīng)用程式的同時(shí)簡(jiǎn)化部署程序,降低對(duì)環(huán)境的影響。我們新推出的一系列服務(wù)器採(cǎi)用了針對(duì)AI最佳化的最新產(chǎn)業(yè)技術(shù),包括NVIDIA GH200 Grace Hopper超級(jí)芯片、BlueField和PCIe 5.0 EDSFF插槽。”
英偉達(dá)超大規(guī)模和高性能計(jì)算副總裁Ian Buck表示:"英偉達(dá)和Supermicro長(zhǎng)期以來(lái)一直在合作開(kāi)發(fā)一些高性能的人工智能系統(tǒng)。NVIDIA MGX模塊化參考設(shè)計(jì)與Supermicro的服務(wù)器專業(yè)技術(shù)相結(jié)合,將創(chuàng)造出採(cǎi)用我們Grace和Grace Hopper超級(jí)芯片的新一代人工智能系統(tǒng),使全球客戶和行業(yè)受益?!?/p>
Supermicro NVIDIA MGX平臺(tái)總覽
Supermicro的NVIDIA MGX平臺(tái)旨在提供面向未來(lái)AI技術(shù)需求的一系列服務(wù)器。這條新產(chǎn)品線可以應(yīng)對(duì)AI服務(wù)器獨(dú)特的散熱、功耗和硬件挑戰(zhàn)。
新的Supermicro MGX系列服務(wù)器包括:
- ARS-111GL-NHR —— 1顆NVIDIA GH200 Grace Hopper超級(jí)芯片,風(fēng)冷
- ARS-111GL-NHR-LCC —— 1顆NVIDIA GH200 Grace Hopper超級(jí)芯片,液冷
- ARS-111GL-DHNR-LCC —— 2顆NVIDIA GH200 Grace Hopper超級(jí)芯片,2個(gè)節(jié)點(diǎn),液冷
- ARS-121L-DNR —— 2個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)2顆NVIDIA Grace超級(jí)芯片,共288個(gè)內(nèi)核
- ARS-221GL-NR —— 2U,1顆NVIDIA Grace CPU超級(jí)芯片
- SYS-221GE-NR —— 搭載雙插槽的第4代Intel Xeon可擴(kuò)展處理器,并可搭配最多4個(gè)NVIDIA H100 Tensor Core或4個(gè)NVIDIA PCIe GPU
每個(gè) MGX 平臺(tái)都可通過(guò) NVIDIA BlueField?-3 DPU 和/或 NVIDIA ConnectX?-7 互連實(shí)現(xiàn)高性能 InfiniBand 或以太網(wǎng)聯(lián)網(wǎng)。
硬件規(guī)格
Supermicro的1U NVIDIA MGX系統(tǒng)最多搭載2顆NVIDIA GH200 Grace Hopper超級(jí)芯片,共包含2個(gè)NVIDIA H100 GPU和2個(gè)NVIDIA Grace CPU。每個(gè)系統(tǒng)為CPU配備480GB的LPDDR5X內(nèi)存,而為GPU配備96GB的HBM3內(nèi)存或144GB的HBM3e內(nèi)存。內(nèi)存一致、高帶寬、低時(shí)延的NVIDIA-C2C以900GB/s的速度將CPU、GPU和內(nèi)存互連,是PCIe 5.0的7倍。該系統(tǒng)的模塊化架構(gòu)提供多個(gè)PCIe 5.0 x16 FHFL插槽,以連接用于云端和數(shù)據(jù)管理的DPU,并可進(jìn)行額外的GPU、網(wǎng)絡(luò)和存儲(chǔ)硬件擴(kuò)展。
具備2個(gè)NVIDIA GH200 Grace Hopper 超級(jí)芯片的1U 2節(jié)點(diǎn)設(shè)計(jì)及Supermicro成熟的Direct-to-Chip液冷解決方案可將運(yùn)營(yíng)成本降低40%以上,同時(shí)提高計(jì)算密度,并簡(jiǎn)化大型語(yǔ)言模型(LLM)集群和HPC應(yīng)用的機(jī)架級(jí)部署。
2U機(jī)箱設(shè)計(jì)的Supermicro NVIDIA MGX平臺(tái)支持NVIDIA Grace和x86架構(gòu)的CPU,以及最多4個(gè)全尺寸數(shù)據(jù)中心GPU,如NVIDIA H100 PCIe、H100 NVL或L40S,并同時(shí)提供3個(gè)用于I/O連接的額外PCIe 5.0 x16插槽和8個(gè)熱插拔EDSFF硬盤托架。
Supermicro提供NVIDIA網(wǎng)絡(luò)技術(shù),能保護(hù)并加速其 MGX 平臺(tái)上的人工智能工作運(yùn)行。這包括NVIDIA BlueField-3 DPU(提供 2x 200Gb/s 連接,用于加速用戶到云和數(shù)據(jù)存儲(chǔ)訪問(wèn))和ConnectX-7 適配器(在 GPU 服務(wù)器之間提供最高 400Gb/s 的 InfiniBand 或以太網(wǎng)連接)的組合。
開(kāi)發(fā)者可以快速透過(guò)這些新系統(tǒng)與NVIDIA軟件服務(wù)來(lái)處理各種不同產(chǎn)業(yè)的工作負(fù)載。該軟件服務(wù)包含NVIDIA AI Enterprise——一款的企業(yè)級(jí)軟件,能夠驅(qū)動(dòng)NVIDIA AI平臺(tái)并簡(jiǎn)化生產(chǎn)就緒的生成式人工智能、計(jì)算機(jī)視覺(jué)、語(yǔ)音人工智能等的開(kāi)發(fā)和部署。此外,NVIDIA HPC 軟件開(kāi)發(fā)工具包提供了推動(dòng)科學(xué)計(jì)算發(fā)展所需的基本工具。
從智能散熱設(shè)計(jì)到組件選擇,Supermicro NVIDIA MGX系統(tǒng)的方方面面均旨在提高效率。NVIDIA Grace超級(jí)芯片的CPU具有144個(gè)內(nèi)核,每瓦性能高達(dá)當(dāng)前行業(yè)標(biāo)準(zhǔn)x86 CPU的2倍。特定的Supermicro NVIDIA MGX系統(tǒng)可在1U機(jī)箱中配置2個(gè)節(jié)點(diǎn),能夠搭載具有最高共288個(gè)內(nèi)核的2組Grace CPU超級(jí)芯片,可以在超大規(guī)模和邊緣數(shù)據(jù)中心提供突破性的計(jì)算密度和能效。