加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

AMD 超越摩爾定律之路

2019/08/24
87
閱讀需 33 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

現(xiàn)代數(shù)據(jù)中心和 HPC 環(huán)境的快速變化要求技術(shù)行業(yè)提供更強(qiáng)大的算力,而該行業(yè)在提供算力容量方面遇到重大障礙?;蛟S很少有人比 AMD 總裁兼首席執(zhí)行官蘇姿豐更了解這一事實(shí)。

?

?

設(shè)備的數(shù)量正在激增,大量的數(shù)據(jù)正在被生成,需要處理分析,所以我們利用機(jī)器學(xué)習(xí)來(lái)教計(jì)算機(jī)去做這些事情,因?yàn)槿祟惡退麄兙帉懙捻樞虼a跟不上處理節(jié)奏。人工智能、數(shù)據(jù)分析、軟件定義的存儲(chǔ)和沉浸式計(jì)算——它們都需要更多的計(jì)算能力,蘇姿豐在斯坦福大學(xué)的 Hotchips 會(huì)議上的演講中解釋道。

蘇姿豐說(shuō),所有這一切的關(guān)鍵信息是,無(wú)論您談?wù)摰氖悄男?yīng)用,您都需要更多的算力才能取得進(jìn)展,如果沒有摩爾定律的約束,這將會(huì)變得有趣,但更有趣的是,應(yīng)用需要我們超越摩爾定律。我們需要比業(yè)界過(guò)去做得更多,因?yàn)?a class="article-link" target="_blank" href="/tag/%E5%BA%94%E7%94%A8%E7%A8%8B%E5%BA%8F/">應(yīng)用程序和數(shù)據(jù)需要更多的算力。

當(dāng)然,說(shuō)起來(lái)容易做起來(lái)難。十多年來(lái),CPU 和 GPU 的性能每?jī)赡甓喾€(wěn)步提高一倍,晶體管密度每三年翻一番,能效也花了近四年的時(shí)間來(lái)提高一倍。蘇姿豐提供了一組數(shù)據(jù)數(shù)據(jù),如下,自 2006 年以來(lái)兩個(gè)套接字服務(wù)器的浮點(diǎn)和整數(shù)性能,此時(shí)公共云真正開始起飛:

以下是晶體管密度和功率效率趨勢(shì):

然而,為了保持或擴(kuò)展性能曲線,還需要做一些事情,在過(guò)去十年中,工藝技術(shù)占工作量的 40%左右,模具尺寸和額外的 TDP 占另外 20%,其余部分由微架構(gòu)、電源管理編譯器組成。

想要進(jìn)一步提升高性能計(jì)算的性能(一般意義上,不意味著模擬和建模)變得越來(lái)越困難,障礙包括摩爾定律的放緩和模具尺寸的增加成本的上升。下面是摩爾定律曲線:

可以看到,曲線正在彎曲,因?yàn)檫B續(xù)節(jié)點(diǎn)需要更多時(shí)間才能上市,同時(shí),隨著開發(fā)和軟件成本的上升以及工程和制造設(shè)備成本的提高,將芯片推向市場(chǎng)的成本也在上升。如下圖,我們可以看到每個(gè)制程花費(fèi)的成本曲線:

具有諷刺意味的是,早在 AMD 在 Opteron 時(shí)代談?wù)撾娫葱蕰r(shí),它比英特爾的至強(qiáng)處理器具有優(yōu)勢(shì)時(shí),數(shù)據(jù)中心公司還不太關(guān)心這一原始性能。但是現(xiàn)在,所有處理器,無(wú)論你在芯片設(shè)計(jì)上與系統(tǒng)集成了多少,都面臨著巨大的電源和冷卻挑戰(zhàn)。

蘇姿豐表示,把優(yōu)化電源放在第一位的想法在過(guò)去的七到八年間就已經(jīng)出現(xiàn),我們一直在推動(dòng)。對(duì)于我們性能最高的處理器以及我們的競(jìng)爭(zhēng)對(duì)手,我們不斷努力推動(dòng)電源的包絡(luò)。我們?cè)诶鋮s技術(shù)和冷卻能力方面已經(jīng)做的足夠好了,但是也只是獲得了一點(diǎn)點(diǎn)性能的提升。我們將繼續(xù)嘗試推動(dòng)電源的包絡(luò),但不要忘記,芯片冷卻有一些重要的物理極限。

AMD 工程師在開發(fā)公司的 Zen 架構(gòu)時(shí)考慮到了所有這些,該架構(gòu)于 2017 年首次亮相 Epyc 服務(wù)器處理器,隨后在本月早些時(shí)候推出了第二代 Epyc "羅馬"芯片和 Zen 2 架構(gòu)。

在 Hotchips 會(huì)議上,蘇姿豐用 AMD 的 Zen 1 和 Zen 2 的設(shè)計(jì)和架構(gòu)工作舉例說(shuō)明作為行業(yè)需要做些什么來(lái)跟上對(duì)更多計(jì)算能力日益增長(zhǎng)的需求,同時(shí)克服傳統(tǒng)芯片工作固有的障礙。一般來(lái)說(shuō),這意味著要從整體上看待挑戰(zhàn),不僅使用芯片,還包括系統(tǒng)和軟件,開發(fā)針對(duì)它們運(yùn)行的工作負(fù)載優(yōu)化的微架構(gòu),并創(chuàng)建合作伙伴生態(tài)系統(tǒng)。這也意味著,要向下看未來(lái)幾代產(chǎn)品,以確保它們繼續(xù)提高性能并控制成本。

我們?cè)?2013-2014 年的時(shí)間范圍內(nèi)看到了這兩個(gè)趨勢(shì),蘇姿豐表示,有些事情必須改變。你不能只做越來(lái)越大的單片芯片,雖然做到這一點(diǎn)不難,但你并不會(huì)得到性能的提升,所以我們?cè)诙嘈酒軜?gòu)上進(jìn)行了大量的投資。

這就是著利用多芯片模塊的芯片,這也是從第一代 Zen 架構(gòu)到第二代架構(gòu)發(fā)生的重大轉(zhuǎn)變。

蘇姿豐說(shuō),這樣做的目的是為了賺更多的錢。這是為了確保您以更好的成本點(diǎn)獲得更高的性能,因此我們通過(guò)使用更小的模具獲得更好的產(chǎn)量,還獲得了一個(gè)不錯(cuò)的架構(gòu)。當(dāng)我們遷移到 7 nm 時(shí),我們強(qiáng)調(diào)了小芯片的概念,要對(duì)晶體管做出正確的優(yōu)化。在第二代 EPYC 中,我們認(rèn)為最有價(jià)值的晶體管是 CPU,所以我們用 7nm 制程制作。但是,I/O 和內(nèi)存,坦率地說(shuō),沒有那么大的價(jià)值,所以我們實(shí)際上用的 12nm。因此,我們可以看到每個(gè) IP 都使用了符合它的最佳工藝技術(shù)。實(shí)際上,這是一個(gè)非常好的架構(gòu),它打破了一些傳統(tǒng)趨勢(shì),坦率地說(shuō),它給了我們非常強(qiáng)大的靈活性。使用相同的基本設(shè)計(jì),我們可以覆蓋高性能桌面處理器、高性能工作站和高性能服務(wù)器。這是一個(gè)例子,圍繞小芯片架構(gòu)的創(chuàng)新確實(shí)可以為未來(lái)帶來(lái)回報(bào)。

與標(biāo)準(zhǔn)行業(yè)趨勢(shì)相比,性能顯著提升。

系統(tǒng)設(shè)計(jì)與芯片設(shè)計(jì)同樣重要,蘇姿豐說(shuō)。關(guān)鍵是了解正在運(yùn)行的應(yīng)用程序,然后能夠優(yōu)化芯片和系統(tǒng)。芯片很重要,但系統(tǒng)需要的不僅僅是通用 CPU。還有有 GPU、現(xiàn)場(chǎng)可編程門陣列FPGA)和自定義 ASIC,不同的應(yīng)用程序需要不同的比率。異構(gòu)平臺(tái)還要求節(jié)點(diǎn)之間的高速互連,AMD 的羅馬芯片便使用 PCI-Express 4.0 和先進(jìn)的無(wú)限結(jié)構(gòu)架構(gòu)來(lái)滿足上述要求。

如果芯片供應(yīng)商要提供現(xiàn)代工作負(fù)載所需的性能,他們還需要了解軟件和應(yīng)用程序。

無(wú)論我們?nèi)绾慰创?,我們作?a class="article-link" target="_blank" href="/tag/%E8%8A%AF%E7%89%87%E5%85%AC%E5%8F%B8/">芯片公司需要確保我們的芯片盡可能可編程以提供最佳的系統(tǒng)性能,她說(shuō)。從這個(gè)角度來(lái)看,有一大堆東西在"充分利用你的芯片"。我們?cè)噲D讓庫(kù)、分析器、調(diào)試器、編譯器,所有這些東西都盡可能為芯片優(yōu)化。我們也堅(jiān)信,在開源環(huán)境中,能夠做得更好,這樣每個(gè)人都能為此做出貢獻(xiàn)。

例如,當(dāng)開發(fā)人員將 TensorFlow 或 PyTorch 用于機(jī)器學(xué)習(xí)應(yīng)用時(shí),芯片制造商必須確保其產(chǎn)品針對(duì)該軟件進(jìn)行優(yōu)化。

機(jī)器學(xué)習(xí)推動(dòng)對(duì)更多計(jì)算能力的需求的應(yīng)用程序。CPU 和 GPU 的計(jì)算能力每?jī)赡曜笥視?huì)翻倍。但是,對(duì)機(jī)器學(xué)習(xí)算法的更多訓(xùn)練的需求是每 3.5 個(gè)月算力消耗就要翻番。

這實(shí)際上是一件令人難以置信的事情,蘇姿豐說(shuō),這意味著你可以想出這些偉大的算法,或者你花非常長(zhǎng)的時(shí)間找出問(wèn)題,或者你建立大型計(jì)算場(chǎng),或者你試圖獲得更高效的計(jì)算,你可能做上述的每一件事情。

超級(jí)計(jì)算機(jī)的性能,如機(jī)器 500 強(qiáng)排名所體現(xiàn)的,是需要解決的挑戰(zhàn)的另一個(gè)例子。超級(jí)計(jì)算機(jī)仍在加速,每 1.2 年翻一番,但速度正在放緩。下面是一個(gè)常見的經(jīng)典的高性能計(jì)算應(yīng)用程序:

需要?jiǎng)?chuàng)新才能使曲線回到正軌,而針對(duì)特定工作負(fù)載優(yōu)化的系統(tǒng)是關(guān)鍵。但重要的是不要過(guò)分概括,蘇姿豐通過(guò)比較傳統(tǒng) HPC 工作負(fù)載和更現(xiàn)代的 AI 工作負(fù)載的數(shù)據(jù)指出,這兩個(gè)工作負(fù)載都可以在類似的 GPU 加速系統(tǒng)上運(yùn)行:

在上圖中,兩個(gè) HPC 應(yīng)用程序具有不同的計(jì)算需求,分子動(dòng)力學(xué)的 NAMD 應(yīng)用程序是 GPU 密集型應(yīng)用程序,而用于自然語(yǔ)言處理的機(jī)器學(xué)習(xí)應(yīng)用程序需要比你預(yù)期更多的 CPU 性能需求。

這里我想說(shuō)的是,如果你這樣做,一切就很完美,但是事實(shí)并非如此,蘇姿豐解釋道,你要做到這一切,必須優(yōu)化 CPU、GPU、互連、內(nèi)存和網(wǎng)絡(luò)帶寬,才能真正在 HPC 中推動(dòng)包絡(luò)。

鑒于上述情況,她指出,圍繞 CPU 和 GPU 開展的工作很多,但連接性創(chuàng)新的速度卻沒有跟上,內(nèi)存帶寬也是滯后的。

蘇姿豐說(shuō),盡管我們繼續(xù)投資內(nèi)存和計(jì)算元素之間緊密的耦合,但隨著時(shí)間的推移,內(nèi)存帶寬并沒有真正跟上,我們是高帶寬內(nèi)存的忠實(shí)信徒。高帶寬內(nèi)存具有強(qiáng)大的路線圖,對(duì)于芯片繼續(xù)高速發(fā)展非常重要。我們還查看了模具中的大量?jī)?yōu)化,因此片上緩存層次結(jié)構(gòu)可以對(duì)這些內(nèi)存帶寬產(chǎn)生更大的影響。隨著我們不斷推進(jìn),可以想象會(huì)用 3D 堆疊或其他集成方法將幫助拓寬內(nèi)存帶寬曲線。

蘇姿豐指出,當(dāng) AMD 和 Cray(由 HPE 以 13 億美元收購(gòu))為橡樹嶺國(guó)家實(shí)驗(yàn)室建造的 1.5 臺(tái)超大規(guī)模超級(jí)計(jì)算機(jī)"Frontier"在 2021 年推出時(shí),更多的優(yōu)化工作將被展出。它將具有高度優(yōu)化的 CPU 和 GPU,這是兩者之間一致的互連,以及低延遲節(jié)點(diǎn)到節(jié)點(diǎn)功能。它還能夠運(yùn)行傳統(tǒng)的 HPC 工作負(fù)載,還可以利用 AI 和機(jī)器學(xué)習(xí)進(jìn)行商業(yè)應(yīng)用程序。蘇姿豐說(shuō),最終,該系統(tǒng)中的許多技術(shù)將進(jìn)入更多的商業(yè)系統(tǒng)。

我們絕對(duì)相信這一點(diǎn),這就是它應(yīng)有的工作方式。

與非網(wǎng)編譯內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!

AMD

AMD

AMD公司成立于1969年,總部位于美國(guó)加利福尼亞州桑尼維爾。AMD(NYSE: AMD)是一家創(chuàng)新的科技公司,致力于與客戶及合作伙伴緊密合作,開發(fā)下一代面向商用、家用和游戲領(lǐng)域的計(jì)算和圖形處理解決方案。

AMD公司成立于1969年,總部位于美國(guó)加利福尼亞州桑尼維爾。AMD(NYSE: AMD)是一家創(chuàng)新的科技公司,致力于與客戶及合作伙伴緊密合作,開發(fā)下一代面向商用、家用和游戲領(lǐng)域的計(jì)算和圖形處理解決方案。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜