加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 云上HPC成為未來趨勢(shì)
    • 自研芯片的進(jìn)階之路
    • 自研Graviton3E處理器,為HPC打造高性價(jià)比
    • 解決云上HPC的“兩難”問題
    • 寫在最后
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

從“芯”出發(fā),高性能計(jì)算的云上普及之路

2022/12/20
1693
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

“云的規(guī)模正在重新定義HPC(高性能計(jì)算),它帶來的應(yīng)用和創(chuàng)新改變了游戲規(guī)則。如果沒有針對(duì)每個(gè)特定工作負(fù)載優(yōu)化的一系列實(shí)例,就無法為HPC創(chuàng)建具有成本效益的性能基礎(chǔ),而HPC的極端規(guī)模意味著即使看似很小的資源差異也可能對(duì)性能、成本和運(yùn)行速度產(chǎn)生重大影響”,亞馬遜云科技CEO Adam Selipsky在2022 re:Invent全球大會(huì)發(fā)表演講時(shí)說道。

HPC可以說是科技領(lǐng)域最"硬核"的行業(yè)之一,代表著計(jì)算技術(shù)的頂尖水平。長(zhǎng)期以來,HPC一直在科研等高精尖領(lǐng)域發(fā)揮著重要價(jià)值,例如天氣預(yù)報(bào)、基因組測(cè)序、地理分析、計(jì)算流體動(dòng)力學(xué) (CFD) 等工作負(fù)載方面。在普遍性的行業(yè)應(yīng)用中,HPC通常很難發(fā)揮價(jià)值,除了應(yīng)用需求使然,一個(gè)重要原因是HPC需要高昂的成本,普通行業(yè)的成本投入難以支持。

不過,隨著數(shù)字化轉(zhuǎn)型在各行各業(yè)的深入,隨著數(shù)據(jù)量的快速增長(zhǎng),算力逐漸成為企業(yè)的戰(zhàn)略性資源,而云端近乎無限的集群算力,使越來越多的行業(yè)與場(chǎng)景創(chuàng)新可以通過云端HPC來完成。在可預(yù)見的未來,云上HPC的規(guī)模擴(kuò)張成為必然,也正如Adam Selipsky所言——即使是很小的差異也會(huì)產(chǎn)生巨大影響。

云上HPC成為未來趨勢(shì)

在本地構(gòu)建基礎(chǔ)設(shè)施來運(yùn)行HPC工作負(fù)載,需要高昂的前期投資,包括冗長(zhǎng)的采購周期、監(jiān)控軟硬件更新等持續(xù)的管理開銷,而當(dāng)基礎(chǔ)設(shè)施需要升級(jí)時(shí),又面臨靈活性受限的挑戰(zhàn)。因此,一些行業(yè)用戶轉(zhuǎn)向在云中運(yùn)行其HPC工作負(fù)載,能夠充分利用云提供的安全性、可擴(kuò)展性和彈性。

從產(chǎn)業(yè)效率來看,盡管多數(shù)HPC任務(wù)目前仍然依賴超算中心和本地硬件,但是,在云端實(shí)現(xiàn)高性能、高安全且極具經(jīng)濟(jì)效益的高性能計(jì)算,可以說是產(chǎn)業(yè)創(chuàng)新的大勢(shì)所趨。根據(jù)Hyperion Research數(shù)據(jù),2022年底將有18.8%的HPC在云端運(yùn)行,而2021年,這一數(shù)據(jù)是12.3%。

看好云上HPC的發(fā)展前景,多年來,亞馬遜云科技通過持續(xù)的投入,目前在HPC領(lǐng)域已經(jīng)形成了兩大核心差異點(diǎn):芯片、云、存儲(chǔ)、軟件、AI等領(lǐng)域的技術(shù)經(jīng)驗(yàn)的高度融合;以及面向行業(yè)需求與用戶痛點(diǎn),進(jìn)行了大量高度產(chǎn)業(yè)指向的軟硬件生態(tài)。通過高度可定制的 HPC 計(jì)算平臺(tái),為用戶帶來多樣化的異構(gòu)計(jì)算資源、定制化的計(jì)算實(shí)例,以及大量低成本的軟件,幫助用戶解決管理與調(diào)度等領(lǐng)域的問題。

自研芯片的進(jìn)階之路

自研芯片對(duì)亞馬遜云科技的云上進(jìn)階具有非常關(guān)鍵的作用。自2013年推出Amazon Nitro系統(tǒng)以來,亞馬遜云科技已經(jīng)開發(fā)了多個(gè)自研芯片,包括五代Nitro系統(tǒng)、致力于為各種工作負(fù)載提升性能和優(yōu)化成本的三代Graviton芯片、用于加速機(jī)器學(xué)習(xí)推理的兩代Inferentia芯片,以及用于加速機(jī)器學(xué)習(xí)訓(xùn)練的Trainium芯片。

實(shí)踐證明,亞馬遜云科技更現(xiàn)代化、更節(jié)能的半導(dǎo)體處理確保了芯片的快速迭代及交付。每推出一款新的芯片,亞馬遜云科技都進(jìn)一步提升了這些芯片支持的Amazon EC2實(shí)例的性能、效率以及更優(yōu)化的成本。并且,這些實(shí)例都針對(duì)工作負(fù)載需求進(jìn)行了優(yōu)化,包括更快的處理速度、更高的內(nèi)存容量、更快的存儲(chǔ)輸入/輸出(I/O)和更高的網(wǎng)絡(luò)帶寬等。

在2022 re:Invent全球大會(huì)上,亞馬遜云科技宣布推出三款由自研芯片支持的Amazon Elastic Compute Cloud(Amazon EC2)實(shí)例,能夠?yàn)閺V泛的工作負(fù)載提供更高性價(jià)比。三款最新的Amazon EC2新實(shí)例分別是:

第一,Amazon EC2 Hpc7g實(shí)例采用最新款的Amazon Graviton3E處理器,為HPC工作負(fù)載提供極佳的性價(jià)比;
第二,Amazon EC2 C7gn配備新一代Amazon Nitro,具有增強(qiáng)的網(wǎng)絡(luò)處理能力,是目前Amazon EC2網(wǎng)絡(luò)優(yōu)化型實(shí)例中,提供最高網(wǎng)絡(luò)帶寬和數(shù)據(jù)包轉(zhuǎn)發(fā)性能的實(shí)例;
第三,Amazon EC2 Inf2實(shí)例,采用最新款的Amazon Inferentia2機(jī)器學(xué)習(xí)加速推理芯片,在Amazon EC2上以最低的延遲與成本,大規(guī)模地運(yùn)行大型的深度學(xué)習(xí)模型。

亞馬遜云科技Amazon EC2副總裁David Brown表示:“從Graviton到Trainium、Inferentia再到Nitro,亞馬遜云科技每一代自研芯片都為客戶的各種工作負(fù)載提供更高的性能、更優(yōu)化的成本和更高的能效。我們不斷推陳出新讓客戶獲得卓越的性價(jià)比,這也一直驅(qū)動(dòng)著我們的持續(xù)創(chuàng)新。最新推出的Amazon EC2實(shí)例為高性能計(jì)算、網(wǎng)絡(luò)密集型工作負(fù)載和機(jī)器學(xué)習(xí)推理工作負(fù)載提供了顯著的性能提升,客戶有了更多的實(shí)例選擇來滿足他們的特定需求?!?/p>

自研Graviton3E處理器,為HPC打造高性價(jià)比

在HPC算力層,亞馬遜云科技可提供包括CPU、GPU、Arm芯片在內(nèi)的多樣化異構(gòu)計(jì)算支持,以及定制化的彈性計(jì)算實(shí)例,滿足用戶在AI等HPC高發(fā)任務(wù)中的計(jì)算資源需求。除已有的基于 AMD Milan 處理器的 Hpc6a 實(shí)例以外,亞馬遜云科技推出了基于最新Graviton3E的Hpc7g實(shí)例、以及基于Intel處理器的Hpc6id實(shí)例,為高性能計(jì)算場(chǎng)景提供多種選擇。

其中,自研的Arm芯片在打造高性能、高性價(jià)比方向,帶來了足夠的差異化優(yōu)勢(shì)。以最新配備了Graviton3E處理器的Hpc7g實(shí)例來看,它提供了更多的網(wǎng)絡(luò)功能,擁有更高的內(nèi)存帶寬和200Gbps的EFA彈性結(jié)構(gòu)適配器網(wǎng)絡(luò);與當(dāng)前一代C6gn實(shí)例相比,浮點(diǎn)性能提高了2倍;與當(dāng)前一代Hpc6a實(shí)例相比性能提高了20%,為亞馬遜云科技上的高性能計(jì)算工作負(fù)載提供了超高性價(jià)比。

據(jù)了解,基于Arm架構(gòu)的Graviton3E系列芯片,專為支持高性能計(jì)算工作負(fù)載而設(shè)計(jì)。相比現(xiàn)有的Graviton系列,有著更高的性能提升,對(duì)依賴矢量指令的工作負(fù)載的性能提高了35%。

HPC7g 適用于天氣預(yù)報(bào)、生命科學(xué)、工程計(jì)算等高性能計(jì)算場(chǎng)景,這種新的實(shí)例類型有多種大小,最多具有64個(gè) vCPU 和 128GiB 內(nèi)存,這些實(shí)例有望在2023年初正式投入商用。

為了適配更多網(wǎng)絡(luò)密集型工作負(fù)載需求,亞馬遜云科技還推出了新的 Graviton 3E 實(shí)例類型 C7gn,由Graviton3E 處理器提供支持,可支持200Gbps 網(wǎng)絡(luò)帶寬,并提高50%的數(shù)據(jù)包處理性能。相比于 C7g 實(shí)例,C7gn 實(shí)例為要求更為嚴(yán)苛的網(wǎng)絡(luò)密集型工作負(fù)載而設(shè)計(jì):包含網(wǎng)絡(luò)虛擬設(shè)備(防火墻、虛擬路由器、負(fù)載均衡器等)、數(shù)據(jù)分析和緊密耦合的集群計(jì)算作業(yè)場(chǎng)景。

此外還有EC2 Hpc6id實(shí)例,它基于Amazon Nitro系統(tǒng)構(gòu)建,Hpc6id 實(shí)例旨在為數(shù)據(jù)和內(nèi)存密集型HPC工作負(fù)載提供領(lǐng)先的性價(jià)比,具有更高的每核內(nèi)存帶寬、更快的本地 SSD 存儲(chǔ)以及帶有彈性結(jié)構(gòu)適配器的增強(qiáng)網(wǎng)絡(luò)。Hpc6id實(shí)例提供 200Gbps 彈性結(jié)構(gòu)適配器網(wǎng)絡(luò),用于高吞吐量節(jié)點(diǎn)間通信,使客戶 HPC 工作負(fù)載能夠大規(guī)模運(yùn)行。

解決云上HPC的“兩難”問題

工程師、研究人員和科學(xué)家在使用Amazon EC2 網(wǎng)絡(luò)優(yōu)化型實(shí)例(如 C5n、R5n、M5n 和 C6gn)運(yùn)行HPC工作負(fù)載,這些實(shí)例提供了極致的計(jì)算能力和服務(wù)器之間的高網(wǎng)絡(luò)帶寬,以實(shí)現(xiàn)數(shù)千個(gè)內(nèi)核處理和交換數(shù)據(jù)。

雖然這些實(shí)例的性能足以滿足目前大多數(shù)HPC場(chǎng)景,人工智能自動(dòng)駕駛汽車等新興應(yīng)用仍需要HPC優(yōu)化實(shí)例,以擴(kuò)展到數(shù)萬個(gè)甚至更多的內(nèi)核,進(jìn)一步解決難度系數(shù)持續(xù)增加的問題,并降低HPC工作負(fù)載的成本。

針對(duì)高性能計(jì)算的模擬仿真應(yīng)用場(chǎng)景,亞馬遜云科技在re:Invent2022全球大會(huì)還推出了完全托管的計(jì)算服務(wù)Amazon SimSpace Weaver,基于亞馬遜云科技的高性能算力,可以幫助用戶構(gòu)建、操作和運(yùn)行大規(guī)模的空間模擬仿真系統(tǒng)。借助Amazon SimSpace Weaver,用戶可以部署空間模擬應(yīng)用,對(duì)具有多個(gè)數(shù)據(jù)點(diǎn)的動(dòng)態(tài)系統(tǒng)進(jìn)行建模(例如整個(gè)城市的交通、場(chǎng)館內(nèi)流動(dòng)的人群或工廠車間的布局),模擬可視化的物理空間,運(yùn)行沉浸式的訓(xùn)練模型,獲得不同情景下的關(guān)鍵指標(biāo)并做出明智的決策。

基于Amazon SimSpace Weaver,用戶可模擬出100萬個(gè)以上、實(shí)時(shí)交互的仿真對(duì)象,創(chuàng)建比以往更加復(fù)雜的環(huán)境,同時(shí)將模擬仿真系統(tǒng)部署的時(shí)間從數(shù)年縮短至數(shù)月。

寫在最后

亞馬遜云科技在re:Invent2022全球大會(huì)上新發(fā)布的芯片,再一次展示了其自研芯片為不同工作負(fù)載所能帶來的優(yōu)化空間。特別是在HPC領(lǐng)域的重大突破,能夠幫助HPC用戶應(yīng)對(duì)不同的工作負(fù)載需求:如計(jì)算密集型負(fù)載、計(jì)算和網(wǎng)絡(luò)密集型負(fù)載、數(shù)據(jù)和內(nèi)存密集型負(fù)載等。最重要的是,這些實(shí)例所能提供超高的性價(jià)比,有助于進(jìn)一步推動(dòng)HPC的普及,這對(duì)于未來的算力規(guī)?;蛢?yōu)化具有重大意義。

 

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
USB2514BI-AEZG-TR 1 SMSC USB Bus Controller, CMOS
$4.43 查看
ATSAMD21G18A-MUT 1 Atmel Corporation RISC Microcontroller, 32-Bit, FLASH, CORTEX-M0 CPU, 48MHz, CMOS, MO-220VKKD-4, QFN-48

ECAD模型

下載ECAD模型
$3.52 查看
ATXMEGA192D3-MH 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, 9 X 9 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, MO-220VMMD, MLF-64
$5.62 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費(fèi)電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢(shì)。歡迎交流~