有人說,啟哥聽你一直說新型存儲如何如何,科普下唄。
好吧,我就從我所掌握的信息給大家講一下我的觀點,這些觀點不成為各位看官老爺買賣股票的理由。
不過我判斷,也許2年內(nèi),不知道什么時候新型存儲有可能成為下一個半導體板塊的炒作熱點題材,就像四年我預判碳化硅,氮化鎵那些化合物半導體一樣,我認為一定會有這樣的機會存在,屬于提前2年預判市場的預判。
存儲行業(yè)的現(xiàn)狀
存儲器,英文就是Memory,記得有個網(wǎng)劇神字幕:海記憶體知己,天涯若比鄰。因為內(nèi)存在日本,中國臺灣地區(qū)翻譯成記憶體,所以會出現(xiàn)這種傻X一樣的臺詞字幕。
尼瑪,這簡直是用“如果”這個詞造句,牛奶不如果汁好喝的既視感。
從存儲的介質(zhì)上來講,有磁盤,有光盤,有利用電荷特性的半導體存儲技術(shù)等等,當然今天聊的是半導體存儲特性。
從讀取性質(zhì)又能分RAM隨機性和ROM只讀。
從是否斷電能保存數(shù)據(jù),又分為易失性和非易失性。
從實際產(chǎn)品上講,易失性的主要產(chǎn)品就是DRAM和SRAM,它們速度很快,但是斷電不保存數(shù)據(jù)了,所以叫易失性存儲。
SRAM是靜態(tài)隨機存取存儲器,它的速度非???,但是需要浪費大量晶體管來存儲數(shù)據(jù),現(xiàn)在SRAM作為單獨的芯片幾乎看不到了,大多早就被整合到SoC核里,變成L2緩存了。
DRAM叫“動態(tài)隨機存取存儲器”,也就是常說的內(nèi)存條,而大家看到的DDR5內(nèi)存,實際是指DDR SDRAM 第5代內(nèi)存技術(shù)標準。DDR只是DRAM其中的一種技術(shù)標準
非易失性是就是指斷電能繼續(xù)保存數(shù)據(jù)的,也就是各類FLASH,翻譯過來就是閃存,它的作用和傳統(tǒng)機械式硬盤一樣,永久保存各類數(shù)據(jù)。
FLASH也有兩大類,NAND 和Nor,其中NAND占絕對主導。比如我的手機是128G的容量,這個容量就是由NAND提供的。NAND FLASH的成本已經(jīng)降低到非常低的水準,我看了一下,現(xiàn)在1T的固態(tài)硬盤也就300塊錢左右,價格和1T的機械硬盤沒啥區(qū)別,所以NAND的固態(tài)硬盤對傳統(tǒng)機械式硬盤已經(jīng)全面替代了。
Nor容量不大,速度也不快,但是可以支持芯片內(nèi)執(zhí)行。說白了Nor上可以灌系統(tǒng),程序和算法,而且這些程序在直接在Nor內(nèi)部就能運行,不需要拷貝到RAM(內(nèi)存)再進行處理,因此省下了RAM這個器件,所以Nor在一些嵌入式領(lǐng)域用途十分廣泛,Nor和其他處理器芯片比如MCU綁在一起做一個小方案內(nèi)部就能執(zhí)行程序,且無需RAM,因此在工控領(lǐng)域用的非常多,當然TWS藍牙耳機爆發(fā),Nor也受益不少。
非易失性的除了FLASH,之外還有EEPROM,OTP等小眾產(chǎn)品,這類芯片占比更小,EEPROM是電子可擦寫式的只讀存儲器,只在類似門禁卡,測量儀器,水表,煤氣表,遙控器之類的地方有應用。
總結(jié)起來就一句話,DRAM和NAND FLASH占市場的絕對大頭占到95%,Nor和其他類占小頭只有5%都不到。
整個存儲市場在2022年總規(guī)模達到1334億美金,占到整個集成電路市場的23%,是集成電路里最大細分領(lǐng)域,所以整個存儲器的漲跌,會極大影響整個半導體市場的表現(xiàn),堪比CPI,China Pig index。
上一輪的存儲大周期是從2015年-2018年智能手機爆發(fā)式增長大年帶起來的節(jié)奏。2018年巔峰期整個存儲行業(yè)市場規(guī)模超過1700億美金,但是去年就不行了,由于智能手機出貨量和巔峰期相比削掉了足足三成,因此存儲也下滑到只有1300多億美金的市場規(guī)模。
但是目前來看,Ai,高性能計算,大數(shù)據(jù)模型的訓練等市場的爆發(fā),又望再次帶起存儲的景氣周期,今年預計整個存儲又能到1400億美金左右的規(guī)模。這就是我上一篇文章說的問題。這點上我越來越樂觀,存儲周期拐點已經(jīng)是非常確定的,三個月內(nèi)自然見分曉。
所以,盡管都是半導體,但是每個細分市場的冷暖周期并不完全一樣。
存儲器就像大宗商品,隨著整個經(jīng)濟冷暖周期漲跌起伏巨大,而功率半導體更像是一個穩(wěn)定增長的市場。得力于新能源和新能源汽車的雙輪驅(qū)動,目前每年穩(wěn)定增長15%-20%,功率半導體更像是你家吃的鹽,雖然總量占比不多,但是隨著人口增加而穩(wěn)定增長。
存儲器的制約
既然今天要講新型存儲,肯定是原有的存儲方案和技術(shù)有不完美的地方,所以需求方在尋找更好的替代方案,這才有新型存儲的發(fā)揮空間。
從系統(tǒng)的角度講,內(nèi)存DRAM和NAND之間速度差別非常大,但是性質(zhì)又完全不同,NAND是非易失性的永久保存數(shù)據(jù)得靠它,但是這速度起不來始終是個大問題,會成為系統(tǒng)瓶頸。
DRAM的提速已經(jīng)有了完美的解決方案,就是HBM。
從系統(tǒng)的角度考慮講,隨著高性能計算,Ai大數(shù)據(jù)模型訓練,大量數(shù)據(jù)計算對CPU/GPU和DRAM之間的通信變的非常重要,在這種背景下,HBM內(nèi)存+TSV通孔硅直連的方案開始崛起。有一個算一個,從英偉達,AMD到英特爾,早已經(jīng)開始玩這些東西了。
HBM是幾顆DRAM顆粒進行堆疊,能提供超強的傳輸速度。
在2022年1月份,JEDEC組織發(fā)布了HBM 第三代的標準規(guī)范,編號JESD238。
單針腳傳輸率為6.4Gbps,配合1024-bit位寬,單顆最高帶寬可達819GB/s,4顆就是3.2TB/s,6顆可達4.8TB/s。
獨立通道從8翻倍到16個,再加虛擬通道技術(shù)單顆支持32通道。
支持4層/8層/12層 TSV通孔硅堆棧技術(shù),未來會拓展到16顆內(nèi)部堆疊。
目前主流的12顆堆疊帶寬能提供驚人的896GB/s,各位要知道這已經(jīng)是普通DDR5 內(nèi)存的十幾倍!當然價格也很嚇人,這個成本普通用戶是用不起的,只有那些云計算,數(shù)據(jù)中心的大公司才玩得起。
只有這種性能的內(nèi)存才能滿足那些變態(tài)的高性能處理器,才能讓內(nèi)存不成為系統(tǒng)的短板。
當然HBM嚴格意義上并不是新型存儲,它是原有內(nèi)存技術(shù)的一次升級,通過多顆裸Die堆疊,提供恐怖的傳輸速度和帶寬。
HBM3產(chǎn)品落地后,再加上把SoC和HBM內(nèi)存直接封裝到一起,顯然內(nèi)存不再是系統(tǒng)瓶頸,大數(shù)據(jù)存放的NAND FLASH才是。
那NAND怎么發(fā)展呢?
新型存儲技術(shù)百花齊放
NAND FLASH也就是目前普及的固態(tài)硬盤,它比機械硬盤速度快多了,而且工作的時候可靠性更強(機械硬盤很容易壞),但是它們在海量的數(shù)據(jù)存儲讀取擦寫面前依然不夠強大。
目前企業(yè)級用的固態(tài)硬盤,大多是SLC的NAND固態(tài)硬盤。
所謂SLC,MLC,TLC,QLC的意思是每一個Cell能表示幾位比特的信息,SLC就是1個,MLC是2個,TLC是3個,QLC是4個。
顯然同一個Cell單元要表示4比特的信息要比1比特容量大很多,但是隨之而來的問題是電壓太接近,一旦有干擾就很容易發(fā)生錯誤。因此QLC雖然成本最便宜,單位存儲密度最高,但是它的尋址時間,讀取時間,擦寫時間,可讀寫次數(shù)壽命等性能指標都是最差的。
SLC的存儲密度,單顆NAND可用容量是最低的,但是各方面性能是最強的,和QLC剛好相反。當然企業(yè)級用戶,要的不是性價比,人家追求的是極致性能。容量不夠?那就再加錢唄,上更多的固態(tài)硬盤。
但是NAND無論怎么提升,讀寫速度極限擺著這里,有沒有更快,更好的方案?
于是各種新型存儲的技術(shù)開始百花齊放,包括PCM,MRAM,F(xiàn)eRAM,RRAM等。
下面一個個介紹,順帶科普,如果說法有錯誤,往大佬指正。
生不逢時的PCM
PCM是第一個商業(yè)化的新型存儲技術(shù),但是它遇到了傻逼英特爾高管制定的蠢到家的產(chǎn)品策略。
PCM是相變材料phase change material,是指在物質(zhì)發(fā)生相變時,可吸收或釋放大量能量(即相變焓)的一類材料。由于相變材料是利用潛熱儲能,儲熱密度大,蓄熱裝置結(jié)構(gòu)緊湊,并且在相變過程中本身溫度基本不變,易于管理,現(xiàn)在成為新型存儲的一個主要方向。
PCM存儲器是一種高性能、非易失性存儲器,基于硫?qū)倩衔锊AУ男滦痛鎯ζ?。與基于NAND的傳統(tǒng)非易失性存儲器不同,PCM可以實現(xiàn)幾乎無限數(shù)量的寫入。此外,PCM器件的優(yōu)勢還包括:訪問響應時間短、字節(jié)可尋址、隨機讀寫等,也是諸多被稱為能夠“改變未來”的存儲技術(shù)之一。從2006年開始,英特爾和美光搞了將近十年,直到2015年,驚艷亮相,取名3D Xpoint,英特爾的傲騰存儲系列中部分型號的就用上3D Xpoint 相變存儲器。
PCM相變存儲對比原來NAND FLASH有更快的讀寫速度,幾乎永久的使用壽命,存儲密度極高,而且有特殊的抗輻照特性在國防軍工領(lǐng)域有特殊應用,當然由于相變材料的原因功耗大于普通NAND,最大優(yōu)點便是速度直逼DRAM,遠超當下的NAND,讓NAND他媽的尾車燈都看不到的那種,同時在斷電的情況下可永久保存數(shù)據(jù),相當于DRAM和NAND FLASH功能二合一。
聽起來很牛逼對吧,雖然二合一看起來可牛逼了,但是反過來說,到PCM定位到底是替代DRAM呢?還是替代NAND呢?還是介于兩者之間的一個補充?
顯然,PCM和DRAM相比,除了價格,全他媽是缺點;
PCM和NAND相比,除了價格,全他媽是優(yōu)點。
這就尬住了,你是把PCM當硬盤用,還是當內(nèi)存用???這個定位有點謎啊!
企業(yè)級用戶當內(nèi)存用嫌它慢,當NAND用,又嫌棄它貴,同理普通消費級用戶,花這么貴的價格上PCM相變存儲圖啥?
不管如何,英特爾當年也確實把它商業(yè)化了。
英特爾把這東西定位于DRAM和固態(tài)硬盤之間的融合。
從上面這個圖大家也能看出來,PCM比DRAM速度略慢,但是能永久保存數(shù)據(jù),它和NAND同樣能斷電保存數(shù)據(jù)但是速度快很多,且讀寫壽命和隨機讀寫性能是碾壓NAND的,唯一的缺點是大容量傳輸?shù)臅r候和NAND比沒有明顯優(yōu)勢。
英特爾為3D Xpoint技術(shù)找了兩個產(chǎn)品落地點。
第一、是針對數(shù)據(jù)中心客戶提供傲騰持久內(nèi)存產(chǎn)品,它將3D Xpoint技術(shù)封裝到內(nèi)存條中,用來代替?zhèn)鹘y(tǒng)的DRAM內(nèi)存,傲騰DIMM比DRAM擁有更高的位密度,并且擁有持久性和非易失性特性,在斷電之后也不會丟失數(shù)據(jù),依賴于大內(nèi)存工作的數(shù)據(jù)中心可以更快在重啟中實現(xiàn)快速響應,這在以往是不敢想象的。
第二、是給服務器和客戶端PC市場提供高性SSD產(chǎn)品,為其提供當時HDD和SSD都不具備的高速緩存表現(xiàn)。
但是成本上的缺點和產(chǎn)品定位上的錯誤,直接把3D Xpoint 按死在地板上。
3D Xpoint設計雖然可以通過層級堆疊實現(xiàn)更高的容量,但是3D Xpoint每比特的制造成本遠高于NAND,因此和最貴的SLC的NAND SSD固態(tài)硬盤比,傲騰的價格還是高高在上。
再加上英特爾非常封閉,又不開放IP,又不開放技術(shù)讓別人代工,連和英特爾合作開發(fā)3D Xpoint的美光鬧了半天也沒有拿到任何核心東西。
沒人陪你玩,就不可能通過大規(guī)模投入來拉低成本把整個行業(yè)做大,技術(shù)再好也難以推廣,畢竟商業(yè)市場,拋開成本談技術(shù)是耍流氓行為。但是英特爾當時還沒有感受到生存危機,不敢做出違背祖宗的決定,于是一直這么狹隘封閉,腦子跟短路一樣。
所以真正的數(shù)據(jù)中心以及企業(yè)級用戶覺得PCM有點雞肋,但是好歹還有不少其他高端用戶可以用啊。
于是英特爾決定推出一款小容量的,價格還勉強能接受的產(chǎn)品,叫傲騰900。
然后這個時候英特爾又干了一件更腦殘的事,他媽的竟然想讓16G/32G傲騰來加速機械硬盤,還取了名字叫“傲騰內(nèi)存”,然后還很沙雕的和客戶特意解釋:“這個內(nèi)存不是真正的內(nèi)存,是插在M.2接口上給傳統(tǒng)HDD機械硬盤加速的?!?/p>
我他媽服了這智商。
尼瑪,M.2接口,在主板上一般就一個,很寶貴,正常人一般都會插一塊M.2接口的SSD固態(tài)盤會當系統(tǒng)盤用,誰他媽會想到給機械硬盤當加速盤/緩存盤用???
而且這個價格比普通SSD貴多了,沒有任何性價比,效果也一般。
而且英特爾還偷懶,根本不想開發(fā)專門的主控,實際上就是把一個小容量傲騰和第三方主控的QLC SSD整合到一起,安裝到電腦后還要設置一番,否則就只能在系統(tǒng)中看到兩個獨立的盤,一個傲騰、一個QLC SSD。
見過雞肋的產(chǎn)品,但沒見過這么雞肋的。
所以3D Xpoint技術(shù)推出以來,盡管技術(shù)非常驚艷,但是商業(yè)化非常緩慢,市場叫好不叫座,產(chǎn)品線始終處于虧損狀態(tài)。產(chǎn)品定位不清楚,讓3D Xpoint根本沒有很好的應用場景,始終沒有客戶埋單。
2021年,美光在對英特爾徹底失望了。在合同到期后,宣布將把位于美國猶他州Lehi廠的原來生產(chǎn)3D Xpoint芯片工廠出售給德州儀器,這筆資產(chǎn)出售的的交易價格為15億美元,而十年間英特爾前前后后的巨額投入全部打了水漂。
2022年英特爾出售了自己旗下的存儲業(yè)務給海力士,從此這個以內(nèi)存起家的英特爾徹底告別了存儲市場了。
驚艷一時的 3D Xpoint PCM相變存儲器就這樣落幕了。
想當年,英特爾在奔騰4剛開始時候,強行捆綁銷售i850主板和Rumbus內(nèi)存條。盡管RumBus的內(nèi)存技術(shù)非常強,遠強于當時普通的SDRAM,但是由于過于封閉的生態(tài),高昂的換制程成本,導致所有內(nèi)存廠都無法接受,連紅極一時的奔騰4處理器都差點搭進去,最后不得不揮淚砍掉,所以同樣的錯誤,英特爾犯了兩次。
所以說PCM是個非常有創(chuàng)意的新型存儲技術(shù),只可惜它誕生于英特爾,生不逢時的PCM就這樣隕落了。
蓄勢待發(fā)的MRAM
MRAM是Magnetic Random Access Memory,中文名稱“磁性隨機存取存儲器”,它的核心是MTJ,Magnetic Tunnel Junction,中文名稱“磁性隧道結(jié)。
MRAM的技術(shù)核心原理是“自旋電子學”,這技術(shù)可是獲得了2007年諾貝爾物理學獎!所以MRAM也算是自旋電子學理論發(fā)展的重要產(chǎn)物。
不同于半導體存儲技術(shù)利用的是電子的電荷特性,MRAM利用的是電子自旋特性實現(xiàn)存儲功能,也就是說自旋磁性方向會出現(xiàn)不同的電阻特性,低電阻和高電阻,這兩種截然不同的電阻狀態(tài)來代表二進制的“0”和“1”。
從自身特性講,MRAM具有非易失性、讀寫速度快、能耗低、集成密度高、耐久力強、天然抗輻射和隨工藝節(jié)點等比微縮等優(yōu)點,等于兼具Flash的非易失性、媲美DRAM的高速讀寫特性、媲美FeRAM的極高擦寫次數(shù),在工業(yè)控制、企業(yè)級存儲、人工智能、汽車電子、高可靠等應用領(lǐng)域有廣泛的應用前景。
優(yōu)點總結(jié)下來有以下幾點:
1、MRAM能耗很低,其工作電壓和邏輯電壓差不多在1.1V左右,遠低于eFLASH的8-10V,且寫入過程不需要先擦寫。MRAM在改善功耗方面遠超硅基SRAM和NAND,特別適用于部署在邊緣端設備。
2、速度快,耐久強。MRAM可以達到納秒級別,高于eFLASH的微秒級別.
3、集成度高于硅,隨著工藝等比微縮,具有良好的成本優(yōu)勢。MRAM只需要一組隧穿結(jié)就能是存儲單元,而SRAM的6個晶體管代表一個存儲單位,而且MRAM隨著工藝微縮可以做到7nm以下,但是FLASH在因為自身物理機制限制,28nm以下就比較困難了,因此存儲密度優(yōu)勢非常明顯。
最關(guān)鍵的是MRAM工藝方面比PCM友好太多了,80%以上的工藝和CMOS工藝兼容,只有在頂層金屬互聯(lián)方面磁性存儲部分需要一些特殊的工藝,但是整體也僅僅增加了3層額外掩膜而已。
MRAM并不是很新的技術(shù),和PCM一樣,在業(yè)內(nèi)已經(jīng)探索十余年了,到現(xiàn)在市場也慢慢接受了MRAM,至少大家普遍認為MRAM在28nm以下的嵌入式存儲技術(shù)上是不錯的解決方案,因此便成為eFLASH和eSRAM,L3以及層級緩存的應用的最佳替代方案。
所以相比PCM的定位模糊,MRAM就非常明確,我要替代eFLASH和部分SRAM功能,最直接的說法就是對Nor 進行降維打擊。
從商業(yè)模式上而言,MRAM可以直接賣知識產(chǎn)權(quán)IP,在FAB給客戶制造的時候直接抽成,也可以直接做成芯片,替代Nor FLASH。當然賣IP賺不了大錢,賣芯片能賺更多,但是要考慮終端應用場景,得搞成pin-to-pin,讓現(xiàn)有Nor客戶能直接無縫銜接,畢竟人家積累的多年的代碼要灌進去。
不過根據(jù)灑家行業(yè)內(nèi)了解情況是,現(xiàn)在MRAM用量太小,能代工的FAB非常有限,而且MRAM特殊的工藝,有和其他產(chǎn)品交叉污染的風險。雖然早在好幾年前三星,臺積電,包括國內(nèi)一些FAB都開發(fā)出來了相對應的工藝包,但是實際上并沒有大規(guī)模量產(chǎn)的經(jīng)驗。
磁性材料的需要特殊的設備,國內(nèi)有家半導體設備新勢力叫魯汶儀器,出道就是專門干磁性材料刻蝕設備的公司,所以一個行業(yè)要靠大家共同搞,你搞設備,我搞材料,他做工藝,我出IP,才能共同進步,共同繁榮。
左右迷茫的FeRAM
FeRAM 也就是鐵電存儲器,這個鐵電和金屬鐵沒有關(guān)系,是一種包含可以自發(fā)極化的鐵電體晶體材料。
它有兩種狀態(tài),可以通過外部電場逆轉(zhuǎn)。當對鐵電晶體施加電場時,中心原子沿電場方向在晶體中移動。當一個原子移動時,它會穿過一個能壘,導致電荷擊穿。內(nèi)部電路對電荷擊穿作出反應并設置存儲器。去除電場后,中心原子保持極化狀態(tài),使材料具有非易失性,因此保持了存儲器的狀態(tài)。因為整個物理過程沒有原子碰撞,
因此,在外加電場作用下,鐵電材料的極化特性會發(fā)生變化。當這個電場被移除時,數(shù)據(jù)仍然可以被保存。在沒有外加電場的情況下,極化特性有兩種穩(wěn)定狀態(tài)。圖1是鐵電材料電容器的磁滯回線,顯示了鐵電電容器在不同外加電場下的不同極性。其中,最重要的兩個參數(shù)是剩余極化程度Pr和矯頑場Ec。在沒有電場效應的情況下,+/-Pr 代表“0”和“1”兩種狀態(tài)。要獲得這兩種狀態(tài),所施加的電場必須大于+/- Ec,此時還確定了所需的閾值電壓。
經(jīng)過多年的研發(fā),主流鐵電材料主要有兩種PZT鋯鈦酸鉛和SBT鉭酸鍶鉍。
PZT是研究最多和應用最廣泛的。它的優(yōu)點是可以通過濺射和 MOCVD 在較低溫度下制造。具有剩余極化大、原料便宜、結(jié)晶溫度低等優(yōu)點。它的缺點是疲勞退化問題,并導致對環(huán)境的污染。此外,這些材料的薄膜沉積過程已被證明是非常具有挑戰(zhàn)性的。同時,這些材料極高的介電常數(shù)是它們集成到晶體管中的一大障礙。
由于PZT有污染問題基本被禁用,只能是搞SBT材料。
SBT最大優(yōu)點是不存在疲勞退化的問題,而且不含鉛,符合歐盟環(huán)保標準,但是缺點是工藝溫度高,工藝集成困難。
換句話說鐵電材料,在沒有找到更好的材料之前,無論是PZT還是SBT都存在沒有辦法合理的商業(yè)化路徑的問題。
盡管看起來很美妙,F(xiàn)eRAM和MRAM,PCM特性也非常相似,斷電能保存數(shù)據(jù),同時速度比NAND快很多,功耗低,讀寫速度快,具有抗輻照能力等優(yōu)點。
但是FeRAM,工藝困難,就是價格貴,而且不如MRAM有持續(xù)挖掘存儲密度的潛力,換句話說,容量做不大。只能是類似PDA,電表,智能卡,穿戴設備之類,業(yè)內(nèi)對突然斷電有數(shù)據(jù)保存要求的領(lǐng)域有一些機會。
迷茫的FeRAM,何去何從?
逆襲的RRAM
RRAM,是憶阻,輪“工齡”比MRAM,PCM等都要長,一路走來足足花了25年。
2008年,惠普公司提出一種被稱為憶阻器(memristor)的 RRAM,將其用在面向未來的系統(tǒng)“The Machine”上。但惠普在這項技術(shù)上努力多年之后卻轉(zhuǎn)向了一種更加傳統(tǒng)的內(nèi)存方案,退出了憶阻器的道路。
2014年前后,自2011年開始與索尼一同開發(fā)RRAM的美光退出項目,轉(zhuǎn)而開始與英特爾合作重點開發(fā)另一種存儲技術(shù) 3D XPoint。
從1990s到2010s,RRAM走過了功能機時代,跨過了智能終端時代,一直被研究,從未被大規(guī)模應用,幾乎被時代遺忘。
而現(xiàn)如今,RRAM在Ai時代,再次被提起,成為“破除存儲墻”的關(guān)鍵之一。國
內(nèi)外大廠又重新拾起RRAM,RRAM重燃希望。
2022年11月,英飛凌和臺積電宣布,兩家公司正準備將臺積電的電阻式RAM(RRAM)非易失性存儲器(NVM)技術(shù)引入英飛凌的下一代AURIX?MCU微控制器。
過去業(yè)內(nèi)對于RRAM最大的質(zhì)疑,無外乎“工藝不成熟、商業(yè)化遲遲不能落地”。
2021年,晶圓代工廠臺積電現(xiàn)身,為RRAM站臺:宣布40nmRRAM進入量產(chǎn),28nm和22nmRRAM準備量產(chǎn),此外UMC,SMIC,等都建立可量產(chǎn)的商業(yè)化RRAM工藝線。
昕原半導體主導建設的RRAM 12寸中試生產(chǎn)線順利完成了自主研發(fā)裝備的裝機驗收工作,實現(xiàn)中試線工藝流程的通線,并成功流片,合肥睿科微等也已經(jīng)研發(fā)出相應的產(chǎn)品,并成功流片。
質(zhì)疑被一步步打破,RRAM正式迎來自己的逆襲之路。
要想避免PCM過去的失敗,首先就要找準應用方向。目前業(yè)內(nèi)沿著存儲應用和存算應用開始前進。
在存儲上,英特爾,松下宣布將RRAM用于MCU領(lǐng)域,也就是前文說的,AURIX ?MCU微控制器。
在存算應用領(lǐng)域上,首先RRAM找自己明確的定位,由于擦寫次數(shù)的問題,以及容量無法做大,于是有公司主攻內(nèi)存緩存,打破“存儲墻”。
打破存儲墻
隨著AI算力需求走向100Tops、1000Tops甚至更高水平,以及對于能效比需求走向10TOPS/W、甚至100TOPS/W以上,傳統(tǒng)馮·諾伊曼架構(gòu)“招架不住”了。
這是因為在馮·諾伊曼架構(gòu)之下,芯片的存儲、計算區(qū)域是分離的。計算時,數(shù)據(jù)需要在兩個區(qū)域之間來回搬運,而隨著神經(jīng)網(wǎng)絡模型層數(shù)、規(guī)模以及數(shù)據(jù)處理量的不斷增長,數(shù)據(jù)已經(jīng)面臨“跑不過來”的境況,成為高效能計算性能和功耗的瓶頸,也就是業(yè)內(nèi)俗稱的“存儲墻”。
存儲墻相應地也帶來了能耗墻、編譯墻(生態(tài)墻)的問題。例如編譯墻問題,是由于大量的數(shù)據(jù)搬運容易發(fā)生擁塞,編譯器無法在靜態(tài)可預測的情況下對算子、函數(shù)、程序或者網(wǎng)絡做整體的優(yōu)化,只能手動、一個個或者一層層對程序進行優(yōu)化,耗費了大量時間。
這“三堵墻”導致算力無謂浪費:據(jù)統(tǒng)計,在大算力的AI應用中,數(shù)據(jù)搬運操作消耗90%的時間和功耗,數(shù)據(jù)搬運的功耗是運算的650倍,打破“存儲墻”勢在必行。
于是,能夠打破這三堵墻的“存算一體架構(gòu)”漸入人們的視野。該架構(gòu)將存儲和計算的融合,徹底消除了訪存延遲,并極大降低了功耗。同時,由于計算完全耦合于存儲,因此可以開發(fā)更細粒度的并行性,獲得更高的性能和能效。
目前,實現(xiàn)存算一體有兩種存儲器件的選擇:
1、第一種是基于傳統(tǒng)的易失性存儲器,例如DRAM和SRAM,但由于DRAM制造工藝和邏輯計算單元的制造工藝不同,無法實現(xiàn)良好的片上融合,而SRAM難以進行片上大規(guī)模集成,同時,因為SRAM和DRAM是易失性存儲器,需要持續(xù)供電來保存數(shù)據(jù),仍存在功耗的問題。
2、第二種是結(jié)合非易失性新型存儲器。新型存儲器通過阻值變化來存儲數(shù)據(jù),而存儲器加載的電壓等于電阻和電流的乘積,相當于每個單元可以實現(xiàn)一個乘法運算,再匯總相加便可以實現(xiàn)矩陣乘法。在這種情況下,同一單元就可以完成數(shù)據(jù)存儲和計算,消除了數(shù)據(jù)訪存帶來的延遲和功耗,是真正意義上的存算一體。
另外,傳統(tǒng)存儲器所具有的易失性、微縮性差等問題可以被新型非易失性存儲器很好地解決。隨著RRAM工藝逐漸成熟,可以支持大算力芯片的量產(chǎn)。此時,RRAM具備的“低功耗、低延遲性、高密度”等優(yōu)勢愈發(fā)凸顯,通過將RRAM存儲技術(shù)與存算一體架構(gòu)結(jié)合,無疑會產(chǎn)生1+1>2的效果,從而打造高算力、高能效比的AI芯片,特別其低功耗,在邊緣側(cè)Ai是絕佳的應用場景。
瑞科微,就是抓住行業(yè)痛點,主攻內(nèi)存緩存,把RRAM做成內(nèi)存的緩存,進一步提升系統(tǒng)能效比。
當然不僅僅是RRAM,從道理上來講,PCM,F(xiàn)eRAM,MRAM歸根到底都是要打破存儲墻,填補DRAM和NAND之間的空白地帶。
結(jié)語
從產(chǎn)業(yè)角度而言,新型存儲確實自己獨特優(yōu)勢但是也有其弱點,有些是成本, 有些是工藝難度,有些是自身特性的限制。但是只要找準落地應用場景,配合合理的產(chǎn)品線,能夠做到揚長避短,加以時日新型存儲必然成為半導體又一風口,就像多年前的碳化硅一樣。現(xiàn)在大家都知道碳化硅是種很好的材料,但是一直沒有找到突破口,直到特斯拉宣布碳化硅上車,大家猛然發(fā)現(xiàn),碳化硅的各種特性完美匹配電動汽車的應用場景。到現(xiàn)在,但凡搞功率半導體的廠家,都在紛紛進入碳化硅領(lǐng)域,開發(fā)相關(guān)工藝和產(chǎn)品,積極布局碳化硅。也許有一天,DRAM,NAND,Nor公司,特別是Nor公司也會像當年功率半導體公司擁抱碳化硅一樣,去擁抱PCM,MRAM,F(xiàn)eRAM,RRAM等新型存儲,從實際應用角度出發(fā),在傳統(tǒng)DRAM和NAND之間,找到完美的落腳地。