隨著數(shù)據(jù)中心對(duì)人工智能和機(jī)器學(xué)習(xí)(AI/ML)的利用率越來(lái)越高,大量數(shù)據(jù)不斷被產(chǎn)生和消耗,這給數(shù)據(jù)中心快速而高效地存儲(chǔ)、移動(dòng)和分析數(shù)據(jù)提出了巨大挑戰(zhàn)。
而中國(guó)的情況尤其如此:隨著中國(guó)不斷推進(jìn)人工智能的發(fā)展,對(duì)高性能處理的需求持續(xù)增長(zhǎng),而傳統(tǒng)數(shù)據(jù)中心已然成為必須解決的瓶頸。為應(yīng)對(duì)這一挑戰(zhàn),中國(guó)公布了《新型數(shù)據(jù)中心發(fā)展三年行動(dòng)計(jì)劃》。與傳統(tǒng)數(shù)據(jù)中心相比,新型數(shù)據(jù)中心具有高技術(shù)、高算力、高能效和高安全的特征。
在市場(chǎng)需求和產(chǎn)業(yè)政策支持的雙驅(qū)動(dòng)下,數(shù)據(jù)中心服務(wù)器迫切需要更大的內(nèi)存帶寬和容量,以更好地支持AI/ML的持續(xù)發(fā)展。
自2013年推出以來(lái),高帶寬存儲(chǔ)器(HBM)日益被視為將數(shù)據(jù)中心服務(wù)器和AI加速器的性能提升至新高度的理想方式之一。HBM是一種基于3D堆棧工藝的高性能SDRAM架構(gòu),能夠?qū)崿F(xiàn)巨大的內(nèi)存帶寬。
2018年年底,JEDEC固態(tài)技術(shù)協(xié)會(huì)宣布了HBM2E標(biāo)準(zhǔn),以支持更高的帶寬和容量。HBM2E每個(gè)引腳的傳輸速率上升到3.6Gbps,可以實(shí)現(xiàn)每個(gè)堆棧461GB/s的內(nèi)存帶寬。此外,HBM2E最高支持12個(gè)DRAM的堆棧高度,并且單堆棧內(nèi)存容量高達(dá)24GB。
在HBM2E中,四個(gè)連接到處理器的堆棧將提供超過(guò)1.8TB/s的帶寬。通過(guò)內(nèi)存的3D堆疊,HBM2E可以在極小的空間內(nèi)實(shí)現(xiàn)高帶寬和高容量。在此基礎(chǔ)上,下一代的HBM3內(nèi)存將數(shù)據(jù)傳輸速率和容量推向了新的高度。
Rambus HBM3內(nèi)存子系統(tǒng)針對(duì)高帶寬和低延遲進(jìn)行了專(zhuān)門(mén)優(yōu)化,能夠以緊湊的架構(gòu)和高效能的封裝提供最佳的性能和靈活性。這一解決方案由完全集成的PHY和數(shù)字控制器組成,包含完整的HBM3內(nèi)存子系統(tǒng)。
相比HBM2E,Rambus HBM3內(nèi)存子系統(tǒng)將最大數(shù)據(jù)傳輸速率提高了一倍以上,達(dá)到每個(gè)數(shù)據(jù)引腳8.4Gbps(當(dāng)此速度下的DRAM可用時(shí))。該系統(tǒng)接口具有16個(gè)獨(dú)立通道,每個(gè)通道包含64位,總數(shù)據(jù)寬度為1024位。在最大數(shù)據(jù)傳輸速率下,可以提供1075.2GB/s的總接口帶寬,換言之,帶寬超過(guò)1TB/s。
這一內(nèi)存子系統(tǒng)專(zhuān)為2.5D架構(gòu)設(shè)計(jì),帶有一個(gè)內(nèi)插器,以在SoC上的3D DRAM堆棧和PHY之間傳輸信號(hào)。同時(shí),這種信號(hào)密度和堆疊架構(gòu)的組合還要求特殊的設(shè)計(jì)考量。為提高設(shè)計(jì)的易實(shí)施性和靈活性,Rambus對(duì)整個(gè)2.5D架構(gòu)的內(nèi)存子系統(tǒng)進(jìn)行了完整的信號(hào)和電源完整性分析,以確保滿(mǎn)足所有的信號(hào)、電源和熱量要求。除此之外,Rambus還提供中介層參考設(shè)計(jì)。
憑借在高速信號(hào)處理方面逾30年的專(zhuān)業(yè)知識(shí),以及在2.5D內(nèi)存系統(tǒng)架構(gòu)設(shè)計(jì)和實(shí)現(xiàn)方面的深厚積淀,Rambus正引領(lǐng)HBM的演變。Rambus提供了業(yè)界最快的HBM2E內(nèi)存子系統(tǒng);如今通過(guò)數(shù)據(jù)傳輸速率高達(dá)8.4Gbps的HBM3內(nèi)存子系統(tǒng),Rambus更進(jìn)一步地提高了HBM的帶寬標(biāo)準(zhǔn)。