AI的快速發(fā)展和廣泛應(yīng)用下,使得數(shù)據(jù)量激增、帶寬擴大、效率提升以及與日俱增的安全威脅等現(xiàn)象,變得愈發(fā)關(guān)鍵。對于下一代存儲器和主機連接方面, DDR5預(yù)計在未來幾年內(nèi)將主導(dǎo)市場DRAM類型。同時,CXL內(nèi)存連接技術(shù)預(yù)計在2024至2029年間將實現(xiàn)212%的年復(fù)合增長。目前,已有半數(shù)的服務(wù)器支持CXL,預(yù)計未來將有更多服務(wù)器加入這一行列。應(yīng)對AI時代挑戰(zhàn),更快速的主機連接、更豐富的內(nèi)存資源以及更高效的接口技術(shù),推動了PCIe Gen 6、LPDDR5X和CXL 3.1等技術(shù)的加速演講,用于滿足行業(yè)需求。
日前,AMD推出第二代Versal Premium系列自適應(yīng)SoC,旨在面向各種工作負載提供最高水平系統(tǒng)加速。這是FPGA行業(yè)首款在硬IP中采用CXL 3.1、PCIe Gen6并支持LPDDR5存儲器的器件。該系列產(chǎn)品通過采用先進的接口和存儲技術(shù),實現(xiàn)了系統(tǒng)加速,能夠滿足了數(shù)據(jù)密集型工作負載的需求。全新技術(shù)使得處理器和加速器之間的數(shù)據(jù)訪問和遷移更加快速高效,特別適合數(shù)據(jù)中心、通信和測試測量市場的需求。AMD的這一創(chuàng)新有助于提升系統(tǒng)吞吐量和存儲器資源利用率,從而提高整體性能,并支持從云端到邊緣計算的嚴(yán)苛應(yīng)用。
面向數(shù)據(jù)密集型高帶寬應(yīng)用
基于第一代產(chǎn)品,第二代Versal Premium系列主要在I/O、收發(fā)器和存儲/內(nèi)存控制器等方面進行了創(chuàng)新,這種設(shè)計復(fù)用模式有助于產(chǎn)品的快速推廣和部署。此外,第二代產(chǎn)品還新增了LDPC解碼器模塊,適用于高通量的解碼需求。
AMD自適應(yīng)與嵌入式計算事業(yè)部( AECG ) Versal產(chǎn)品營銷總監(jiān)Manuel Uhm表示,相比第一代產(chǎn)品,第二代AMD Versal Premium系列的核心優(yōu)勢在于它通過更高效地管理系統(tǒng)內(nèi)存來助力計算,而這正是AI模型和數(shù)據(jù)集成當(dāng)前最迫切的需求。他強調(diào),第二代AMD Versal Premium系列是對現(xiàn)有產(chǎn)品線的補充,而非替代,400G、800G網(wǎng)絡(luò)加速等應(yīng)用仍然是目標(biāo)應(yīng)用,也是Versal Premium系列所適配的。
據(jù)AMD自適應(yīng)和嵌入式計算事業(yè)部( AECG ) 高級產(chǎn)品線經(jīng)理Mike Rather介紹,為滿足大數(shù)據(jù)和高計算密度的需求,AMD第二代Versal Premium系列主要實現(xiàn)了三大創(chuàng)新突破:第一,符合PCIe Gen 6和CXL3.1規(guī)范加速主機連接,實現(xiàn)了高達64Gb/s的連接速度;采用LPDDR5X和DDR5分別提供了8533Mb/s和6400Mb/s的高速數(shù)據(jù)傳輸,同時通過采用CXL存儲器擴展模塊,進一步增強了存儲器接口的能力;在數(shù)據(jù)安全方面,通過數(shù)據(jù)加密IDE、DDR加密和400G高速加密引擎確保數(shù)據(jù)安全性。
加速主機連接
CXL是處理器與器件(例如,基于 FPGA 的加速器)之間的開放式行業(yè)標(biāo)準(zhǔn)互連技術(shù),AMD通過支持CXL 來倡導(dǎo)開放式創(chuàng)新。
據(jù)介紹,第二代 Versal Premium 器件支持業(yè)界當(dāng)前最快的主機接口CXL 3.1和PCIe Gen6,可實現(xiàn)行業(yè)領(lǐng)先的高帶寬主機CPU到加速器連接。與支持PCIe Gen4或Gen5的FPGA相比,PCIe Gen6能提供2至4倍的線速率,而運行PCIe Gen6的CXL 3.1在類似時延下則能提供使用CXL 2.1器件的雙倍帶寬,以及增強的架構(gòu)和一致性功能。
此外,通過將第二代 Versal Premium 系列搭配 AMD EPYC CPU,系統(tǒng)架構(gòu)師能夠利用經(jīng) CXL或PCIe連接到高性能CPU的最新AMD FPGA器件,以加速數(shù)據(jù)密集型應(yīng)用并滿足快速的數(shù)據(jù)增長需求。CXL 還能提供內(nèi)存一致性的額外益處,有助于實現(xiàn)真正的異構(gòu)加速計算。
提高存儲器帶寬及利用率
第二代AMD Versal Premium系列自適應(yīng)SoC能以最高8533Mb/s的快速LPDDR5存儲器連接加速存儲器帶寬,帶來更快速的數(shù)據(jù)傳輸和實時響應(yīng)。與采用LPDDR4/5存儲器的同類器件相比,這種超快的增強型DDR存儲器可將主機連接速度提升至高2.7倍。
與CXL存儲器擴展模塊進行連接,較單獨使用LPDDR5X存儲器,可使總帶寬高出最多2.7倍。因此,第二代 Versal Premium 系列允許為多個加速器實現(xiàn)可擴展的內(nèi)存池和擴展,進而優(yōu)化存儲器利用率并增加帶寬和容量。
通過為多個器件動態(tài)分配內(nèi)存池,第二代 Versal Premium系列自適應(yīng)SoC旨在提高多頭單邏輯器件(MH-SLD)的存儲器利用率,使其無需架構(gòu)或交換機即可運行,同時支持至多兩個CXL主機。
加強數(shù)據(jù)安全
增強的安全功能有助于第二代Versal Premium系列在傳輸和靜態(tài)狀態(tài)下均可快速、安全地傳輸數(shù)據(jù)。
值得注意的是,第二代Versal Premium是業(yè)界首款在硬IP中提供集成PCIe完整性和數(shù)據(jù)加密(IDE)支持的FPGA器件。硬核DDR內(nèi)存控制器內(nèi)置的內(nèi)聯(lián)加密可助力保護靜態(tài)數(shù)據(jù),而400G高速加密引擎則能幫助器件以最高2倍的線速率保護用戶數(shù)據(jù),從而實現(xiàn)更快速的安全數(shù)據(jù)事務(wù)。
據(jù)介紹,第二代AMD Versal Premium 系列開發(fā)工具預(yù)計將于2025年第二季度提供,隨后于2026年初提供芯片樣片。預(yù)計將于2026年下半年開始量產(chǎn)出貨。
適用應(yīng)用和用例
第二代AMD Versal Premium系列上述特性,使其非常適用于一些專屬應(yīng)用和用例:
擴大數(shù)據(jù)中心的CXL范圍
由于采用了CXL 3.1和PCIe Gen 6,與CXL 2.0相比可實現(xiàn)帶寬翻倍,并且可與現(xiàn)有軟件集成,支持NUMA。在操作模式方面,支持CXL.io、CXL.mem和CXL.cache,既可以作為內(nèi)存控制器,也可以使用主機模式連接CXL擴展模塊。在用例方面,第二代AMD Versal Premium系列還支持多主機單邏輯設(shè)備(MH-SLD)架構(gòu)和系統(tǒng)可組合性。
用于GPU集群和橫向擴展
對于部署GPU集群的大規(guī)模數(shù)據(jù)中心來說,標(biāo)準(zhǔn)網(wǎng)絡(luò)接口可能無法滿足這些場景下GPU的性能和靈活性需求。而第二代AMD Versal Premium可提供高帶寬和靈活性,能夠滿足這些應(yīng)用需求。
Mike強調(diào),采用自適應(yīng)網(wǎng)絡(luò)技術(shù)的好處在于,Versal Premium系列包含非??焖俚木W(wǎng)絡(luò)接口,包括400G以太網(wǎng)接口。此外能夠?qū)嵤┓浅l`活的內(nèi)存搬運,包括支持RDMA。
測試與測量領(lǐng)域,推進下一代協(xié)議
在測試與測量領(lǐng)域,行業(yè)對開發(fā)PCIe Gen 7器件、下一代MIPI攝像機等測試儀非常關(guān)注,而這些應(yīng)用需要128 Gb/s的收發(fā)器。
Mike指出,這些應(yīng)用非常依賴芯片上的DSP引擎、內(nèi)存帶寬和其他接口能力。同時,開發(fā)測試設(shè)備的企業(yè),所支持的協(xié)議可能包括C-PHY和D-PHY,這也是第二代AMD Versal Premium系列所支持的。
與第一代Versal Premium采用7nm制程相比,第二代Versal Premium采用6nm制程。Manuel指出,隨著摩爾定律放緩,制程的重要性相對在減弱,更重要的是架構(gòu)設(shè)計。并且,關(guān)鍵問題在于要選擇合適的計算引擎來針對具體的用例。Versal系列產(chǎn)品能夠非常精準(zhǔn)地針對一些關(guān)鍵應(yīng)用,確保通過最合適的算力、I/O以及內(nèi)存組合,來實現(xiàn)最高的性價比。