10月17日,美國(guó)對(duì)中國(guó)半導(dǎo)體限制再次加碼,為堵塞之前限制條款的漏洞,美國(guó)商務(wù)部進(jìn)一步擴(kuò)大了出口限制范圍,新增加了一個(gè)新的參數(shù),旨在阻止中國(guó)獲得先進(jìn)芯片,以減緩中國(guó)在小芯片(Chiplet)技術(shù)領(lǐng)域的發(fā)展。
禁令一出,英偉達(dá)股價(jià)應(yīng)聲暴跌,市值一夜蒸發(fā)4000億。其實(shí)英偉達(dá)等公司都在為出口限制付出代價(jià),而中國(guó)AI芯片行業(yè)或?qū)⒁虼双@得一些機(jī)會(huì)。
從“互連帶寬”到“性能密度閾值”
根據(jù)美國(guó)商務(wù)部工業(yè)與安全局(BIS)提交了對(duì)某些先進(jìn)計(jì)算設(shè)備實(shí)施額外出口管制的臨時(shí)最終規(guī)則,并更改了參數(shù),將13家中國(guó)公司列入實(shí)體名單。規(guī)則生效日期為2023年11月16日。
BIS刪除了“互連帶寬”作為識(shí)別受限芯片的參數(shù),修改了原有的性能閾值,并添加了一個(gè)名為“性能密度閾值”的新參數(shù),以針對(duì)中國(guó)芯片制造商正在開(kāi)發(fā)的小芯片技術(shù)。BIS還對(duì)其他半導(dǎo)體制造設(shè)備實(shí)施了限制,包括一些DUV光刻系統(tǒng)。
“互連帶寬”是能被互連傳輸且未造成有效損耗的最高正弦波分量,是用來(lái)衡量行業(yè)如何充分利用其互連潛力的度量標(biāo)準(zhǔn)。帶寬基本單位是比特每秒(bps)或比特率。而“性能密度”并沒(méi)有對(duì)應(yīng)解釋,它與帶寬、IOPS(每秒輸入/輸出操作數(shù))有關(guān),性能密度越高帶寬和IOPS越大。
BIS的新參數(shù)適用于分類為ECCN 3A090和4A090的產(chǎn)品,將影響英偉達(dá)并不限于A100、A800、H100、H800、L40、L40S和RTX 4090芯片的使用。
被列入實(shí)體名單的13家總部位于中國(guó)的實(shí)體,大部分是壁仞科技和摩爾線程的子公司。美國(guó)政府認(rèn)為這些實(shí)體參與了先進(jìn)計(jì)算芯片的開(kāi)發(fā)。這些芯片可用于進(jìn)一步開(kāi)發(fā)大規(guī)模殺傷性武器、先進(jìn)武器系統(tǒng)以及引起國(guó)家安全擔(dān)憂的高科技監(jiān)控應(yīng)用。
此外,新規(guī)則將制定一項(xiàng)全球許可證要求,只要其母公司總部位于中國(guó)、澳門和其他受美國(guó)武器禁運(yùn)或美國(guó)視為國(guó)家安全威脅的國(guó)家,即可停止向這些公司交付芯片。
美國(guó)商務(wù)部長(zhǎng)Gina Raimondo在聲明中表示,更新后的規(guī)則將提高出口管制的有效性,并進(jìn)一步切斷規(guī)避限制的途徑。這些控制措施保持了對(duì)軍事應(yīng)用的明確關(guān)注,同時(shí)可以應(yīng)對(duì)中國(guó)政府軍民融合戰(zhàn)略對(duì)國(guó)家安全構(gòu)成的威脅。
中國(guó)政府已聲明強(qiáng)烈反對(duì)補(bǔ)充限制,認(rèn)為這些限制是由政治議程任意施加的。這些措施違背了市場(chǎng)經(jīng)濟(jì)和公平競(jìng)爭(zhēng)的原則,并威脅到全球經(jīng)濟(jì)和貿(mào)易框架。
壁仞科技和摩爾線程做了什么?
與英偉達(dá)一樣,壁仞在技術(shù)研發(fā)、商業(yè)應(yīng)用等方面都進(jìn)行了布局,同時(shí)也在打造完備、易用的軟件平臺(tái),幫助用戶實(shí)現(xiàn)不同軟件生態(tài)的無(wú)縫遷移。事實(shí)上,由于不在同一起跑線,壁仞與英偉達(dá)之間技術(shù)差距還不小。在性能方面,英偉達(dá)的H100 SXM的INT8算力達(dá)3958TOPS,而壁仞的BR100算力約為2048TOPS。
在能耗方面,同樣實(shí)現(xiàn)3026TOPS計(jì)算,英偉達(dá)H100 PCLe為350W,而壁仞的BR100功耗高達(dá)550W。對(duì)AI廠商而言,能耗高低會(huì)影響企業(yè)的商業(yè)決策。
不過(guò),BR100的16位浮點(diǎn)算力超過(guò)1000T、8位定點(diǎn)算力超過(guò)2000T,單芯片峰值算力達(dá)到PFLOPS級(jí)別,是國(guó)際廠商在售旗艦產(chǎn)品的3倍以上,創(chuàng)造了全球通用GPU的算力記錄。
反觀成立于2020年的摩爾線程,旨在致力于創(chuàng)新面向元計(jì)算應(yīng)用的新一代GPU,構(gòu)建融合視覺(jué)計(jì)算、3D圖形計(jì)算、科學(xué)計(jì)算及人工智能計(jì)算的綜合計(jì)算平臺(tái),建立基于云原生GPU計(jì)算的生態(tài)系統(tǒng)。
從公開(kāi)信息看,摩爾線程并未采用小芯片技術(shù)。2022年11月,其推出基于第二代MUSA架構(gòu)的處理器“春曉”GPU,以及基于“春曉”的面向消費(fèi)領(lǐng)域的國(guó)產(chǎn)芯片顯卡MTT S80和面向服務(wù)器應(yīng)用的MTTS3000顯卡。
相比之前的“蘇堤”芯片,“春曉”內(nèi)置的四大計(jì)算引擎全面升級(jí),性能顯著提升:圖形渲染能力平均提升3倍;編碼能力提升4倍,解碼能力提升2倍;AI計(jì)算加速平均提升4倍,物理仿真計(jì)算性能提升2.5倍;同時(shí)引入了新技術(shù)支持窄帶高清,節(jié)約帶寬30%以上。
有報(bào)道稱,“春曉”基于全國(guó)產(chǎn)化平臺(tái),對(duì)比國(guó)內(nèi)外同類代表產(chǎn)品,其全功能GPU性能在各種標(biāo)準(zhǔn)測(cè)評(píng)項(xiàng)目上均有2-3倍提升。就是這樣一家主打消費(fèi)類GPU的公司居然也上了實(shí)體名單!
小芯片是一種分段異構(gòu)集成
在開(kāi)發(fā)每一代處理器時(shí),工藝節(jié)點(diǎn)的改進(jìn)可使芯片不斷縮小,為提高產(chǎn)品功能和性能提供了一種方法,而無(wú)需使用大而昂貴的芯片。事實(shí)是,邏輯電路可以跟隨工藝節(jié)點(diǎn)的進(jìn)步而縮小,但模擬電路幾乎沒(méi)有變化,SRAM也開(kāi)始達(dá)到極限。因此,采用同一工藝節(jié)點(diǎn)制造所有電路的成本效益越來(lái)越低。
小芯片是一種分而治之的方法——處理器分段。它不是將每個(gè)部分集成到一個(gè)芯片中(單片方法),而是先制造出特定部分的單獨(dú)芯片,然后利用復(fù)雜的連接系統(tǒng)將這些單獨(dú)的芯片封裝在一起。這種方法可以縮小部件尺寸,提高工藝效率,并將它們封裝在更多組件中。此外,一些芯片可以使用傳統(tǒng)而經(jīng)濟(jì)的方法生產(chǎn)。雖然制造這類處理器的過(guò)程很復(fù)雜,但通??傮w成本較低,還有利于代工廠管理來(lái)源廣泛的產(chǎn)品組件。
根據(jù)國(guó)際半導(dǎo)體技術(shù)路線圖(ITRS),3D集成是未來(lái)關(guān)鍵發(fā)展技術(shù)之一,有助于實(shí)現(xiàn)小型化,克服信號(hào)延遲的“布線危機(jī)”。在后摩爾時(shí)代,各種數(shù)字功能將從板級(jí)向封裝級(jí)、芯片級(jí)、堆疊芯片過(guò)渡。
SiP可以在一個(gè)封裝中集成一個(gè)CPU、一些DRAM和NAND閃存、多個(gè)控制器和其他組件。這在2016年發(fā)布的Series 1 Apple Watch中就已成為現(xiàn)實(shí)。而將不同的系統(tǒng)放在一個(gè)芯片上就是SoC(系統(tǒng)級(jí)芯片),但這種方法無(wú)法利用不同節(jié)點(diǎn)的價(jià)格優(yōu)勢(shì)來(lái)分而治之地制造每個(gè)組件。
2017年,AMD發(fā)布了Zen架構(gòu)單芯片Ryzen臺(tái)式CPU,在一顆SoC上集成了內(nèi)核到I/O和控制器的所有部分。幾個(gè)月后,AMD的多芯片產(chǎn)品線Threadripper和EPYC亮相,后者擁有多達(dá)四個(gè)芯片,在結(jié)構(gòu)上依舊采用了小芯片設(shè)計(jì)。
兩年后Zen 2發(fā)布,AMD將大部分在更簡(jiǎn)單、更便宜的工藝節(jié)點(diǎn)制造的模擬部分從處理器中移出,將它們放入一個(gè)單獨(dú)的芯片中,更先進(jìn)的工藝節(jié)點(diǎn)只用于邏輯和緩存。
至此,小芯片也越來(lái)越流行。
小芯片開(kāi)始走到技術(shù)最前沿
事實(shí)上,新一代處理器迭代需要增加電路集成度,特別是更大的邏輯電路和SRAM模塊。過(guò)去,向更高密度邏輯電路持續(xù)前進(jìn)意味著要持續(xù)收縮光刻,但隨著晶體管尺寸不斷縮小,制造工藝也變得更加復(fù)雜和昂貴。
2022年,處理器產(chǎn)業(yè)已到了接近FinFET(鰭式場(chǎng)效應(yīng)晶體管)時(shí)代終結(jié)的時(shí)刻,3nm和2nm的全環(huán)繞柵極(gate-all-around)晶體管架構(gòu)即將到來(lái)。隨著這些節(jié)點(diǎn)的設(shè)計(jì)成本急劇增加,人們對(duì)其他設(shè)計(jì)和小芯片等集成方法越來(lái)越感興趣。
從20nm節(jié)點(diǎn)開(kāi)始,從3個(gè)節(jié)點(diǎn)的平面轉(zhuǎn)向FinFET,每平方毫米峰值晶體管增加了約3倍,晶體管便宜了60%,而每平方毫米成本和每個(gè)晶體管成本也有增加。到了2nm節(jié)點(diǎn),從FinFET到全環(huán)繞柵極,每平方毫米峰值晶體管可增加約16倍,晶體管便宜了40%,每平方毫米成本和每個(gè)晶體管成本也在相應(yīng)增加。
2022年晶體管尺寸縮小對(duì)成本的影響
事實(shí)上,小芯片已走在遍地開(kāi)花的路上。之前,雖然小芯片的使用已有幾十年歷史,但僅限于一些特定目的。現(xiàn)在,它終于走到技術(shù)最前沿,全球已有數(shù)以百萬(wàn)計(jì)的臺(tái)式PC、工作站和服務(wù)器中有了它的身影。
多年來(lái),摩爾定律一直是半導(dǎo)體行業(yè)發(fā)展的準(zhǔn)繩。通過(guò)工藝節(jié)點(diǎn)的不斷改進(jìn)實(shí)現(xiàn)了CPU和GPU邏輯和內(nèi)存方面的巨大進(jìn)步,芯片也變得越來(lái)越小。不過(guò),無(wú)論出現(xiàn)什么新的工藝節(jié)點(diǎn),這種趨勢(shì)都不會(huì)永遠(yuǎn)持續(xù)下去。
AMD和英特爾等行業(yè)巨頭沒(méi)有等待摩爾定律達(dá)到極限,就另辟蹊徑轉(zhuǎn)向了小芯片,探索芯片組合的各種方式,以繼續(xù)創(chuàng)造更強(qiáng)大的處理器,并利用小芯片重新獲得創(chuàng)新前沿的優(yōu)勢(shì)地位。
頭部處理器玩家領(lǐng)跑
小芯片很快就會(huì)成為計(jì)算世界的標(biāo)準(zhǔn),這話有它的道理,從行業(yè)引領(lǐng)者到一些初創(chuàng)企業(yè)都在進(jìn)行這方面的探索。
Yole Intelligence計(jì)算與軟件業(yè)務(wù)的高級(jí)技術(shù)與市場(chǎng)分析師John Lorenz 認(rèn)為:“隨著芯片節(jié)點(diǎn)的設(shè)計(jì)成本不斷上升,業(yè)界對(duì)替代性設(shè)計(jì)和集成方法的興趣也越來(lái)越濃厚,特別是小芯片。小芯片旨在利用先進(jìn)封裝技術(shù)解決對(duì)更小且可重復(fù)使用的設(shè)計(jì)的需求。小芯片集成的突飛猛進(jìn)正在推動(dòng)2.5D和3D封裝的發(fā)展。”
目前,處理器市場(chǎng)基本上由英特爾、AMD、英偉達(dá)和高通等幾家頭部企業(yè)主導(dǎo),這些巨頭占據(jù)了54%的市場(chǎng)總份額。隨著亞馬遜和阿里巴巴等科技巨頭進(jìn)軍CPU賽場(chǎng),競(jìng)爭(zhēng)日趨激烈。高通、聯(lián)發(fā)科和蘋果在APU領(lǐng)域領(lǐng)先,共占據(jù)32%的市場(chǎng)份額。SoC FPGA和AI ASIC這兩個(gè)細(xì)分市場(chǎng)由AMD、英特爾,以及谷歌和亞馬遜這樣的科技巨頭領(lǐng)導(dǎo)。
2022年收入排名前十的處理器玩家
英特爾、臺(tái)積電、AMD、英偉達(dá)和三星等主要廠商正在引領(lǐng)這一發(fā)展趨勢(shì),足見(jiàn)小芯片已成為當(dāng)今半導(dǎo)體工藝發(fā)展的重中之重。隨著時(shí)間的推移,各種應(yīng)用中硅中介層(Interposer)和混合鍵合等高性能封裝平臺(tái)的關(guān)鍵地位也與日俱增。
值得注意的是,近年來(lái)處理器初創(chuàng)企業(yè)動(dòng)作頻繁,籌集了大量資金,特別是在AI領(lǐng)域。在投資和不斷豐富的生態(tài)系統(tǒng)推動(dòng)下,中國(guó)半導(dǎo)體產(chǎn)業(yè)正在持續(xù)發(fā)展。
小芯片越小越好?
從制造上看,通過(guò)使用較小的芯片,每個(gè)晶圓可以生產(chǎn)更多芯片。晶圓被切割得越小,隨機(jī)分布的缺陷導(dǎo)致芯片失效的可能性就越小,生產(chǎn)過(guò)程也更具成本效益。另外,相同的小芯片可用于多種型號(hào)的產(chǎn)品,增加了靈活性。
隨著小型化互連技術(shù)的成熟,多模塊、小芯片設(shè)計(jì)開(kāi)始變得司空見(jiàn)慣。例如今年6月,英特爾發(fā)布Meteor Lake架構(gòu)酷睿處理器,通過(guò)小型化模塊連接實(shí)現(xiàn)2.5D和3D封裝,實(shí)現(xiàn)了高密度連接,體現(xiàn)了產(chǎn)品功耗、成本、性能優(yōu)勢(shì)。
小芯片的統(tǒng)治才剛剛開(kāi)始??梢韵胍?jiàn),未來(lái)普通PC內(nèi)可能裝有更大的CPU和GPU,但取下散熱器,下面是許多微型芯片巧妙地平鋪或堆疊在一起。