在探討Chiplet(小芯片)之前,摩爾定律是繞不開的話題。戈登·摩爾先生在1965 年提出了摩爾定律:每年單位面積內(nèi)的晶體管數(shù)量會(huì)增加一倍,性能也會(huì)提升一倍。這意味著,在相同價(jià)格的基礎(chǔ)上,能獲得的晶體管數(shù)量翻倍。不過,摩爾先生在十年后的1975年,把定律的周期修正為24個(gè)月。至此,摩爾定律已經(jīng)影響半導(dǎo)體行業(yè)有半個(gè)世紀(jì)。
隨著集成電路技術(shù)的不斷演進(jìn),半導(dǎo)體行業(yè)發(fā)現(xiàn)摩爾定律在逐漸失效。上圖右上部分是英特爾x86 CPU 1970-2025年的演化歷史,可看出每顆芯片的晶體管數(shù)量持續(xù)增加(右上深藍(lán)色線條),但時(shí)鐘速度(右上天藍(lán)色線條)和熱設(shè)計(jì)功耗(右上灰色線條)自2005年之后就變化不大。于此同時(shí),受先進(jìn)工藝高成本支出的影響,晶體管成本降幅在2012年后趨緩,甚至越往后還有成本增加的趨勢(shì)。
從上圖右下的統(tǒng)計(jì)數(shù)據(jù)可看出,芯片制程在持續(xù)微縮和演進(jìn),晶體管數(shù)也在相應(yīng)的增長。在2019年以前,單芯片晶體管數(shù)量和工藝幾何尺寸演進(jìn),一直與摩爾定律高度相關(guān)。因?yàn)閱挝幻娣e內(nèi)的晶體管數(shù)量,每一周期就會(huì)增加一倍,所以在理想情況下,Die的尺寸可保持不變。但是據(jù)右下綠色標(biāo)識(shí)的區(qū)域顯示,可以看到單芯片Die尺寸在日趨增大,這也從另一個(gè)角度說明,單芯片晶體管數(shù)量的增加,也有Die增大的原因所致。由于Die尺寸的增長,受光罩尺寸、工藝良率等因素制約,這代表通過加大Die Size來提升單芯片算力已經(jīng)越來越困難。
總而言之,隨著集成電路技術(shù)的發(fā)展和演進(jìn),每24個(gè)月已經(jīng)很難讓單位面積內(nèi)的晶體管數(shù)量翻倍。這意味著,現(xiàn)在芯片性能的提升遭遇了瓶頸,性能無法單純由工藝技術(shù)驅(qū)動(dòng),也需要由架構(gòu)創(chuàng)新來驅(qū)動(dòng)。因此,業(yè)界必須找到新的解決方案。
Chiplet幫助芯片生產(chǎn)降本增效
在摩爾定律逐漸失效的情況下,Chiplet技術(shù)在半導(dǎo)體行業(yè)應(yīng)運(yùn)而生。整體來看,Chiplet具備高集成度、高良率、低成本三大特點(diǎn),它被視為延續(xù)摩爾定律的關(guān)鍵技術(shù)。
曾克強(qiáng)介紹說,Chiplet通過多個(gè)芯片的片間集成,可以突破傳統(tǒng)單芯片的上限,進(jìn)一步提高芯片的集成度。比如,左上圖的單片集成的SoC是通過統(tǒng)一工藝制程,導(dǎo)致芯片上各個(gè)部分都要同步進(jìn)行迭代,其開發(fā)時(shí)間長達(dá)三至四年,缺陷數(shù)量可達(dá)數(shù)百個(gè)。左上圖的單獨(dú)IP集成Chiplet通過將不同的功能切開,再對(duì)部分單元的工藝做選擇性迭代,迭代裸片后可制造出下一代產(chǎn)品,這樣就能加速產(chǎn)品的上市周期。Chiplet芯片集成應(yīng)用較為廣泛和成熟的裸片,就有效降低了Chiplet芯片研制風(fēng)險(xiǎn),也減少了重新流片和封裝的次數(shù),進(jìn)而能為芯片企業(yè)節(jié)省研發(fā)投入。
Chiplet可以提升復(fù)雜SoC芯片的良率,該方案將復(fù)雜SoC芯片分成更小的芯片。單芯片的面積越大其良率越低,它對(duì)應(yīng)的芯片制造成本也就越高,芯片設(shè)計(jì)成本也會(huì)隨著制程的演進(jìn)而成本增長,切割小芯片可有效降低芯片設(shè)計(jì)成本。此外,在SoC設(shè)計(jì)中,模擬電路、大功率IO對(duì)制程并不敏感,不需要太高端的芯片制程,可將SoC中的功能模塊,劃分成單獨(dú)的Chiplet,針對(duì)功能來選擇合適的制程,從而讓芯片實(shí)現(xiàn)最小化,提高芯片的良率、降低芯片成本。
Chiplet有兩個(gè)常見的應(yīng)用案例:同構(gòu)(聚合系統(tǒng))和異構(gòu)(分割系統(tǒng))。同構(gòu)是通過高速接口和先進(jìn)的封裝技術(shù),適用于CPU、TPU、AI SoC等,這種方式是將多個(gè)Die緊密相連,以相同的Die設(shè)計(jì)實(shí)現(xiàn)計(jì)算能力的擴(kuò)展,其接口要求低延遲和低誤碼率;異構(gòu)是將芯片按功能拆分,先進(jìn)制程的Die提供高算力和性能,成熟制程的Die負(fù)責(zé)常規(guī)或者特色的功能,這些不同制程的Die被封裝在一起。
在使用案例方面,AMD服務(wù)器CPU Epyc系列的第一代和第二代,分別采用了同構(gòu)和異構(gòu)的方法。第一代Epyc采用7nm制程,利用同構(gòu)方法聚合4個(gè)相同的Die,該系統(tǒng)可擴(kuò)展,只需多個(gè)Die的互聯(lián),即可提高計(jì)算能力;第二代 Epyc將芯片功能拆分為CCD運(yùn)算Die(Compute Core Die)和IO Die,通過異構(gòu)方法它們集成到一起,實(shí)現(xiàn)了先進(jìn)工藝與成熟工藝的巧妙融合。
通過高速接口和先進(jìn)封裝技術(shù),把多顆Die融合在一顆大芯片內(nèi),以此來實(shí)現(xiàn)算力的擴(kuò)展,這適用于CPU、FPGA、通信芯片等產(chǎn)品。同時(shí),Chiplet也對(duì)接口提出了標(biāo)準(zhǔn)化、兼容性、可移植性的要求,要具備低延時(shí)和低誤碼率的優(yōu)勢(shì),廠商選擇接口時(shí)還需考慮生態(tài)系統(tǒng)問題。
曾克強(qiáng)總結(jié)說:“Chiplet可提升大芯片設(shè)計(jì)良率,降低芯片研發(fā)的風(fēng)險(xiǎn),縮短芯片的上市時(shí)間,還可增加芯片產(chǎn)品組合,延長產(chǎn)品生命周期。因此,它被視為有效延續(xù)摩爾定律的新方式。”
Chiplet的發(fā)展趨勢(shì)及生態(tài)布局
Chiplet應(yīng)用在芯片中的時(shí)間還不長,但自2020年開始其發(fā)展就非???,年復(fù)合增長率達(dá)到36.4%。預(yù)測(cè)到2031年,全球Chiplet行業(yè)市值有望達(dá)到470億美元(上圖左邊)。
因?yàn)镃hiplet把芯片切分成不同的小芯片并互聯(lián),所以相關(guān)接口IP市場(chǎng)也有新的需求。上圖右邊是各類傳統(tǒng)接口IP市場(chǎng)的發(fā)展趨勢(shì),藍(lán)色方塊體現(xiàn)了小芯片互聯(lián)接口IP的趨勢(shì)。雖然小芯片互聯(lián)接口IP的發(fā)展時(shí)間較短,但是其增長速度最為迅猛,預(yù)計(jì)從2021年到2026年,年復(fù)合增長率會(huì)高達(dá)50%。至2026年,全球產(chǎn)值將達(dá)3.2億美元。
Chiplet技術(shù)需要切分、堆疊整合,該技術(shù)將推動(dòng)芯片產(chǎn)業(yè)鏈的變革。曾克強(qiáng)預(yù)測(cè),Chiplet的發(fā)展將分為幾個(gè)階段:2023年之前的兩三年是Chiplet生態(tài)早期階段,芯片公司對(duì)芯片進(jìn)行分拆,并尋找先進(jìn)封裝組合,各家都按自己的定義協(xié)議來做產(chǎn)品,該階段并未形成統(tǒng)一的標(biāo)準(zhǔn)。
進(jìn)入到2023年,隨著工藝制程進(jìn)入3納米接近物理極限,摩爾定律失效越來越明顯,而摩爾先生的去世,似乎也在印證舊時(shí)代正在落幕。與此同時(shí),屬于Chiplet的新時(shí)代正在開啟。設(shè)計(jì)廠商對(duì)自己設(shè)計(jì)的Chiplet進(jìn)行自重用和自迭代,同時(shí)工藝逐漸成型,互聯(lián)標(biāo)準(zhǔn)日趨統(tǒng)一。
預(yù)計(jì)到2027年,Chiplet生態(tài)將進(jìn)入成熟期,真正進(jìn)入IP硬化時(shí)代。屆時(shí),會(huì)誕生一批新公司:Chiplet小芯片設(shè)計(jì)公司、集成小芯片的大芯片設(shè)計(jì)公司、有源基板供應(yīng)商、支持集成Chiplet的EDA公司。
主要有四個(gè)重要角色參與Chiplet生態(tài)鏈:EDA供應(yīng)商,IP廠商,封裝廠,F(xiàn)ab廠。尤其對(duì)于IP供應(yīng)商而言,基于IP復(fù)用的模式,設(shè)計(jì)能力較強(qiáng)的IP供應(yīng)商有潛力演變?yōu)镃hiplet供應(yīng)商。而IP供應(yīng)商也需要具備高端芯片的設(shè)計(jì)能力,以及多品類的IP布局和平臺(tái)化的運(yùn)作能力,以上都對(duì)IP供應(yīng)商提出了更高的要求。又由于Chiplet加入了更多的異構(gòu)芯片和各類總線,相應(yīng)的EDA覆蓋工作就變得更加復(fù)雜,需要更多的創(chuàng)新功能。國內(nèi)EDA企業(yè)需要提升相關(guān)技術(shù),應(yīng)對(duì)堆疊設(shè)計(jì)帶來的諸多挑戰(zhàn),例如對(duì)熱應(yīng)力、布線、散熱、電池干擾等的精確仿真,在封裝方面需要2.5D和3D先進(jìn)封裝技術(shù)支持,同時(shí)Fab方面也需要相關(guān)技術(shù)的支持。
經(jīng)過了幾年的發(fā)展,國際上出現(xiàn)了一些Chiplet標(biāo)準(zhǔn),主流標(biāo)準(zhǔn)包括XSR、BOW、OpenHBI、UCIe(詳見上圖右表)。右表中的綠色代表技術(shù)優(yōu)勢(shì),紅色代表劣勢(shì)。可以看出UCIe標(biāo)準(zhǔn)在多個(gè)角度都占據(jù)優(yōu)勢(shì),它定義了邏輯 PHY、訓(xùn)練機(jī)制、初始化序列、邊帶和鏈路控制。此外,它還重用了成熟的PCIe和CXL生態(tài)系統(tǒng),這將加快這一新標(biāo)準(zhǔn)的采納,并得到代工廠、封裝廠、無晶圓廠和系統(tǒng)公司的支持。
從左側(cè)的圖表中可以看出,UCIe提供了最高帶寬、最佳能效比和最低延遲的最佳組合。具體來看,UCIe定義了完整的協(xié)議層,繼承了CXL和PCIe生態(tài)系統(tǒng)的優(yōu)勢(shì)。UCIe 16G將主導(dǎo)標(biāo)準(zhǔn)封裝和先進(jìn)封裝行業(yè),UCIe 32G將在更先進(jìn)封裝工藝和高端應(yīng)用方面將被采納。
如何解決Chiplet面臨的挑戰(zhàn)
Chiplet的發(fā)展剛起步不久,還面臨著非常多的挑戰(zhàn),它需要產(chǎn)業(yè)鏈及技術(shù)升級(jí)配合。這些挑戰(zhàn)主要分為兩大類:上圖藍(lán)色部分展示的是多個(gè)Chiplet堆疊整合的挑戰(zhàn),綠色部分是怎么系統(tǒng)分割設(shè)計(jì)方面的挑戰(zhàn)。
堆疊整合往下還細(xì)分為封裝技術(shù)、電路設(shè)計(jì)、協(xié)議標(biāo)準(zhǔn)三方面的挑戰(zhàn)。
首先,Chiplet技術(shù)把單個(gè)大硅片“切”成多個(gè)小芯片,再把這些小芯片封裝在一起,單顆硅片上的布線密度和信號(hào)傳輸質(zhì)量遠(yuǎn)高于不同小芯片,這就要求必須要發(fā)展出高密度、大帶寬布線的先進(jìn)封裝技術(shù),盡可能提升在多個(gè)Chiplet之間布線的數(shù)量并提升信號(hào)傳輸質(zhì)量。Intel和臺(tái)積電都已經(jīng)有了相關(guān)的技術(shù)儲(chǔ)備,通過中介層(Interposer)將多個(gè)Chiplet互連起來,目前這些技術(shù)仍在不斷演進(jìn)中,并在不斷推出更新的技術(shù)。
其次,用于Chiplet之間的高速通信接口電路設(shè)計(jì)。Chiplet之間的通信雖然可以依靠傳統(tǒng)的高速Serdes電路來解決,甚至能完整復(fù)用PCIe這類成熟協(xié)議。但這些協(xié)議主要用于解決芯片間甚至板卡間的通信,在Chiplet之間通信用會(huì)造成面積和功耗的浪費(fèi)。
再次,通信協(xié)議是決定Chiplet能否“復(fù)用”的前提條件。Intel公司推出了AIB協(xié)議、TSMC和Arm合作推出LIPINCON協(xié)議,但在目前Chiplet仍是頭部半導(dǎo)體公司才會(huì)采用的技術(shù),這些廠商缺乏與別的Chiplet互聯(lián)互通的動(dòng)力。目前,UCIe聯(lián)盟最重視協(xié)議,如果實(shí)現(xiàn)了通信協(xié)議的統(tǒng)一,IP公司就有可能實(shí)現(xiàn)從“賣IP”到“賣Chiplet”的轉(zhuǎn)型。
先進(jìn)封裝解決了如何“拼”的問題,更重要的是要解決如何“切”的問題。英偉達(dá)在決策下一代GPU要采用Chiplet技術(shù)時(shí),思考和驗(yàn)證如何把完整的大芯片設(shè)計(jì)劃分成多個(gè)Chiplet,這其實(shí)是設(shè)計(jì)方法學(xué)的初步體現(xiàn)。要讓基于Chiplet的設(shè)計(jì)方法從“可用”變?yōu)椤昂糜谩?需要定義完整的設(shè)計(jì)流程,以及研制配套的設(shè)計(jì)輔助工具。
在中國發(fā)展Chiplet面臨哪些挑戰(zhàn)?從技術(shù)上面看來,中國現(xiàn)在產(chǎn)業(yè)鏈發(fā)展最大的挑戰(zhàn)是技術(shù)封鎖,由封鎖所帶來的自主需求也是一大機(jī)遇。在單位硅片面積上增加晶體管數(shù)量有困難,轉(zhuǎn)而追求在單個(gè)封裝內(nèi)部持續(xù)提升晶體管數(shù),這也是目前發(fā)展Chiplet技術(shù)對(duì)國內(nèi)芯片產(chǎn)業(yè)的最大意義。
但是現(xiàn)在我們?nèi)匀狈Ρ匾夹g(shù)、經(jīng)驗(yàn)、標(biāo)準(zhǔn)協(xié)議、人才、知識(shí)產(chǎn)權(quán)和專利積累,而且中國芯片公司的規(guī)模都不大,無法單靠某一家或某幾家公司來打造Chiplet生態(tài)。這需要不同的公司分工合作,共同打造Chiplet產(chǎn)業(yè)鏈。
中國要發(fā)展自己的Chiplet生態(tài)鏈就需要有自己的標(biāo)準(zhǔn)。國內(nèi)的CCITA聯(lián)合集成電路企業(yè)和專家,共同主導(dǎo)定義了小芯片接口總線技術(shù)要求,這是中國首個(gè)原生Chiplet標(biāo)準(zhǔn),在去年12月15日通過了工信部電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)的審定并發(fā)布。
該標(biāo)準(zhǔn)與UCIe主要有兩大區(qū)別:UCIe只定義了并口,CCITA的Chiplet標(biāo)準(zhǔn)既定義了并口,也定義了串口,兩者的協(xié)議層自定義數(shù)據(jù)包格式也不同,但CCITA的標(biāo)準(zhǔn)與UCIe兼容,可直接使用已有生態(tài)環(huán)境。在封裝層面,UCIe支持英特爾先進(jìn)封裝、AMD封裝,CCITA定義的Chiplet標(biāo)準(zhǔn)主要采用國內(nèi)可實(shí)現(xiàn)的封裝技術(shù)。
芯耀輝的接口IP方案
據(jù)曾克強(qiáng)介紹說,芯耀輝參與協(xié)議組織推動(dòng)Chiplet發(fā)展,作為重點(diǎn)貢獻(xiàn)企業(yè)參與了標(biāo)準(zhǔn)協(xié)議制定與推廣,以此確保其產(chǎn)品和研發(fā)能力始終走在產(chǎn)業(yè)發(fā)展最前沿,依靠對(duì)標(biāo)準(zhǔn)協(xié)議深度理解,能給產(chǎn)業(yè)帶來更多優(yōu)秀的IP產(chǎn)品。
比如,芯耀輝D2D IP把互連擴(kuò)展到短距離PCB,以滿足中國本地市場(chǎng)需求。D2D IP解決方案涵蓋綠色箭頭所示的全部封裝類型,與目前國內(nèi)生產(chǎn)加工能力高度適配,目前112G PAM4測(cè)試芯片已經(jīng)成功實(shí)測(cè)。
曾克強(qiáng)表示,Chiplet不只是簡(jiǎn)單的IP技術(shù),也包括整個(gè)系統(tǒng)的設(shè)計(jì)和生產(chǎn)測(cè)試,比如子系統(tǒng)的設(shè)計(jì)、封裝設(shè)計(jì)、PCB設(shè)計(jì)、ATE測(cè)試等等。芯耀輝從一開始做IP設(shè)計(jì)時(shí),就把SoC集成、系統(tǒng)應(yīng)用需求及下游封裝測(cè)試等對(duì)Chiplet的要求轉(zhuǎn)化為對(duì)IP設(shè)計(jì)規(guī)格的要求,一開始就考慮到后端要實(shí)現(xiàn)Chiplet所需要的特性,從IP源頭來解決這些挑戰(zhàn)。比如說從控制器、PHY、子系統(tǒng)方面來實(shí)現(xiàn)高性能、低功耗、低延遲,一般供應(yīng)商會(huì)追求最佳的PPA,但客戶產(chǎn)品應(yīng)用不一樣對(duì)PPA的需求也不一樣,所以我們提供可靈活配置的PHY,更適配客戶的特定應(yīng)用,幫助不同的客戶都能得到適合自己的最佳PPA。并且對(duì)關(guān)鍵的與頻率相關(guān)的部分,我們提供的都是硬核,保證客戶的時(shí)序收斂。另外,我們?cè)赑HY中還嵌入了許多在Silicon之后的測(cè)試功能,特別是大家都關(guān)注的KGD(Know Good Die)測(cè)試,因?yàn)樵谝粋€(gè)封裝里面多個(gè)Die互聯(lián)以后,沒法像常規(guī)芯片一樣放探針來確定里面的Die是否正常工作或者Die與Die之間的互聯(lián)是否出現(xiàn)短路,所以我們的PHY提供了豐富的D2D KGD測(cè)試功能。還有控制器和子系統(tǒng)也是如此,我們都是在IP設(shè)計(jì)的源頭就來解決這些挑戰(zhàn),而不是將挑戰(zhàn)推向系統(tǒng)設(shè)計(jì)和生產(chǎn)測(cè)試以適應(yīng)IP。這樣就提供了完整的解決方案,加快客戶芯片上市時(shí)間和一次流片成功率。
目前,D2D IP已經(jīng)實(shí)現(xiàn)客戶項(xiàng)目的成功量產(chǎn),主要有數(shù)據(jù)中心、5G、網(wǎng)絡(luò)交換機(jī)應(yīng)用,客戶項(xiàng)目導(dǎo)入的實(shí)例類似AMD第一代服務(wù)器,采用的是同構(gòu)聚合方式來實(shí)現(xiàn)多個(gè)Die的互聯(lián)。