加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

使用 NVIDIA Spectrum-3 交換機,展現卓越的云計算、AI 和存儲性能

2021/10/14
386
閱讀需 8 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

交換機重要嗎?

網絡矩陣是現代化數據中心性能的關鍵。這對數據中心的交換機提出了很多要求,而其中最基本的要求,是為所有客戶提供等量的帶寬,以便均勻地共享資源。如果沒有公平的網絡,所有應用都會因吞吐量惡化、延遲、分布式應用緩慢等原因,而出現性能不可預測的情況。

為了回答交換機是否重要這個問題,Tolly Group 對 NVIDIA Spectrum-3 12.8Tbps 交換機的云、AI 和存儲應用性能進行了基準測試,并將結果與典型的(商品級)12.8Tbps 數據中心交換機的性能進行了同類比較。

Tolly Group

Tolly Group 是一家第三方獨立 IT 行業(yè)實驗室,30 多年來,一直從事對 IT 產品的性能測試和實際評估。Tolly Group 的定位是提供證據證明產品達到,或超越營銷主張,并且不產生與 Tolly Group 公平測試憲章相沖突的報告。這一性能證明可以讓客戶知道自己是否可以放心地進行部署。

分布式應用的性能(AI 和 SPARK)

每個交換機都有一個緩沖區(qū)以防止丟包。每當送入交換機的流量超過可以送出交換機的流量時,緩沖區(qū)就會通過吸收數據包突發(fā),來保護應用性能。這有時被稱為 incast 流量模式。AI 和 Spark 等分布式應用因其性質而會受到 incast 流量模式的困擾。

兩種交換機在其數據表中顯示二者緩沖區(qū)大小相同。但 Tolly Group 發(fā)現,NVIDIA Spectrum-3 能夠吸收的數據包是典型數據中心交換機的 4 - 8 倍,因此需要 8 臺商品級交換機才能提供相當于 Spectrum-3 交換機的數據包吸收能力。

圖1 NVIDIA Spectrum-3 和商品級交換機對比

最大吸收能力固然重要,但光考慮這一點還不夠。交換機必須均勻吸收來自所有發(fā)送方的微突發(fā)流量,一個節(jié)點的延緩就會使整個集群變慢。

Tolly Group 發(fā)現,Spectrum-3 在所有情況下都能均勻吸收來自所有發(fā)送方的微突發(fā)流量,而商品級交換機則會使多個節(jié)點變慢,導致計算資源未得到充分利用。

公有云和私有云性能

公有云和私有云環(huán)境中會出現“吵鬧的鄰居”問題,即當多個租戶使用一個共享資源,如 CPU 周期或網絡帶寬時,出現了一個租戶占用了這些資源,這個租戶被稱為“吵鬧的鄰居”。

“吵鬧的鄰居”問題可能因交換機租戶之間的隔離能力不足,使得一個租戶的使用而降低另一個租戶的體驗。數據中心交換機必須保護租戶不受其他租戶活動的影響,既要防止惡意攻擊,也要防止“吵鬧的鄰居”的影響。

Tolly Group 發(fā)現,Spectrum-3 交換機完全保護了每個租戶。而其他的交換機卻未能保護租戶,因為“吵鬧的鄰居”的流量模式,使一些租戶的成為受害者,嚴重匱乏帶寬。

在擴展多租戶環(huán)境時,Spectrum-3 同樣保護了每個租戶。但在這種情況下,“吵鬧的鄰居”問題規(guī)模遠大于商品級交換機,擴展到交換機端口總數的一半。換言之,多達 70 個端口可能成為受害者并出現帶寬匱乏。

如果一個交換機不能保護租戶免受“吵鬧的鄰居”的影響,該交換機就不符合云架構交換機的基本要求。

圖2 “吵鬧的鄰居”隔離

換句話說:使用 Spectrum-3,“吵鬧的鄰居”流量模式就不會產生影響。而如果使用商品級交換機,受害租戶就會出現帶寬匱乏。

存儲性能

如今,數據中心的大多數存儲流量都在以太網上運行。具體而言,存儲通常使用 9KB 的巨幀。因此,這種數據包的大小變得比以往任何時候都重要,現在大多數交換機都支持 9KB 默認數據包大小。

但典型數據中心交換機僅僅支持 9KB 數據包,這并不意味著它們?yōu)榇鎯眠M行了優(yōu)化。為了測量和比較每個交換機的存儲性能水平,Tolly Group 使用 IXIA 的標準網絡測試工具來測量 9KB 數據包。

Tolly Group 發(fā)現,Spectrum-3 在所有情況下都能為所有存儲節(jié)點提供可預測和公平的性能。商品級交換機在使用 9KB 數據包時,顯示出不公平的流量共享,迫使一個存儲節(jié)點的運行速度比其他存儲節(jié)點慢 17 倍。這些不可預測的結果嚴重影響了存儲性能。

這會對現實世界產生影響。比如本來計劃并預計運行一個存儲備份的時間為 2 小時,但最終用了 34 小時才完成。

混合應用性能

大多數數據中心運行多種不同的應用,每個應用數據包大小不盡相同。即使是單個應用也會使用各種不同大小的數據包。再加上控制流量模式,最終,網絡上可能會出現更多不同大小的數據包。

Tolly Group 發(fā)現,無論數據包大小如何,Spectrum-3 始終能夠實現公平性。而商品級交換機上,使用較小數據包的應用總會陷入帶寬匱乏。更糟糕的是,隨著數據包大小差距的增加,小數據包的情況變得越發(fā)糟糕。

圖3 因幀的大小而產生的懸殊性能

在商品級交換機中,混合數據包大小所帶來的帶寬匱乏會對云、存儲和分布式應用產生不利的影響。

為何會如此?

一言以蔽之,因為架構。

Spectrum 交換機有一個現代的、完全共享的緩沖區(qū)架構,以及靈活的流水線架構,該架構專為優(yōu)化數據中心應用性能和安全而設計。進一步了解評估結果,請下載新的 Tolly Group 性能評估報告。該報告解釋了 Spectrum 交換機和商品級交換機的架構及其優(yōu)勢與劣勢。

架構是一個真正的零和游戲。但與其他許多廠商不同,NVIDIA 同時開發(fā)了 ASIC 和交換機,使用戶可以兼得“魚與熊掌”,并且其出色的結果也得到了 Tolly Group 驗證的。

英偉達

英偉達

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設計業(yè)務,隨著公司技術與業(yè)務發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務、科學研究、制造業(yè)、汽車等領域的計算解決方案提供支持。

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設計業(yè)務,隨著公司技術與業(yè)務發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務、科學研究、制造業(yè)、汽車等領域的計算解決方案提供支持。收起

查看更多

相關推薦

電子產業(yè)圖譜

關注Mellanox,關注最頂尖的數據中心網絡技術.歡迎訂閱,搶先知曉業(yè)內動態(tài),覆蓋云計算、HPC、大數據、Web2.0等多領域.