作者:暢秋
晶圓廠的兩大命根子——良率與性能——的重要性愈加凸顯,同時(shí),良率與性能之間的關(guān)系也在發(fā)生著變化。
近期,半導(dǎo)體業(yè)倍受關(guān)注的一大熱點(diǎn)事件是三星官宣量產(chǎn)3nm制程芯片。實(shí)際上,在官方消息發(fā)出之前,業(yè)界就一直在議論此事,焦點(diǎn)就是良率問題。由于在追趕臺(tái)積電的道路上不遺余力,三星幾乎用盡渾身解數(shù),這一次,在臺(tái)積電即將于下半年量產(chǎn)3nm制程之前,搶先宣布量產(chǎn),比拼的意味濃厚。但從近些年的情況來看,在先進(jìn)制程工藝方面,屢屢被臺(tái)積電碾壓,一個(gè)很重要的原因就是三星難以保證良率,這在獲取客戶信心方面是個(gè)很大的減分項(xiàng)。
前些年,在10nm和7nm制程剛量產(chǎn)的時(shí)候,高通驍龍845 SoC由三星代工生產(chǎn),驍龍855、865則由臺(tái)積電7nm制程工藝生產(chǎn),英偉達(dá)原計(jì)劃由三星生產(chǎn)的7nm制程GPU芯片,也轉(zhuǎn)移到了臺(tái)積電。那時(shí),三星在良率方面就落后于臺(tái)積電,訂單量明顯少于對(duì)手。
2021年,4nm制程興起,高通將驍龍 8 Gen1 Plus的生產(chǎn)訂單轉(zhuǎn)給了臺(tái)積電,很重要的原因就是三星4nm制程工藝的良率僅為35%左右,與臺(tái)積電超過70%的良率相比差太多。
今年2月,據(jù)韓媒Infostock Daily報(bào)道,三星電子懷疑旗下晶圓代工廠的產(chǎn)量及良率報(bào)告存在造假行為,因此,三星DS部門受到了管理咨詢部門對(duì)其晶圓代工廠5nm制程良率的調(diào)查,緊隨其后的將是4nm和3nm調(diào)查。該事件的起因是,三星晶圓代工業(yè)務(wù)飽受低良率之苦,特別是4/5nm制程量產(chǎn)后,出現(xiàn)了良率極其低下的情況,交貨時(shí)間不斷延后,招致了三星高層的懷疑。一位熟悉三星電子內(nèi)部情況的高管表示:“由于晶圓代工業(yè)務(wù)交付的數(shù)量難以滿足最近的訂單需求,我們對(duì)非內(nèi)存工藝的良率表示懷疑,眾所周知,基于該良率(指此前良率報(bào)告的數(shù)據(jù))是可以滿足訂單交付的。”管理咨詢部門的懷疑對(duì)象是DS部門現(xiàn)任及前任高管,調(diào)查內(nèi)容包括:之前遞交的良率報(bào)告是否真實(shí),用于提升良率的資金究竟流向何方。
今年6月,三星任命了內(nèi)存制造技術(shù)中心副總裁Kim Hong-shik領(lǐng)導(dǎo)晶圓代工技術(shù)創(chuàng)新團(tuán)隊(duì)。通過改組,三星調(diào)動(dòng)存儲(chǔ)芯片專家來領(lǐng)導(dǎo)代工業(yè)務(wù)的核心部門。此次,晶圓代工部門的重組,也是為了改善3nm芯片良率,努力反超臺(tái)積電。
臺(tái)積電之所以能在先進(jìn)制程方面領(lǐng)先全球,高良率是殺手锏。據(jù)悉,該公司7nm制程在量產(chǎn)開始3個(gè)季度后,其不良率降至每平方厘米0.09,5nm制程量產(chǎn)初期,不良率低于同期的7nm,缺陷密度大約為每平方厘米0.10~0.11,隨著5nm芯片量產(chǎn)進(jìn)程的推進(jìn),不良率降至0.10以下。
另一大芯片巨頭英特爾也飽受良率困擾,2020年7月,該公司發(fā)布消息稱,原計(jì)劃于2021年底上市的7nm芯片,因工藝存在缺陷,導(dǎo)致良率下降,發(fā)布時(shí)間推遲6個(gè)月。在此之前,英特爾在10nm制程的研發(fā)過程中就遇到了很多困難,多次延期,2019年初才實(shí)現(xiàn)量產(chǎn)。
綜上,芯片良率的重要性可見一斑。
芯片良率簡(jiǎn)析
簡(jiǎn)單的說,芯片良率就是晶圓上合格芯片數(shù)量與芯片總數(shù)的比值,這個(gè)數(shù)值越大,說明有用芯片數(shù)量越多,浪費(fèi)越少,成本也就越低,利潤(rùn)越高。
良率還可以細(xì)分為wafer(硅晶圓)良率、die良率和封測(cè)良率,這三種良率的乘積則是總良率??偭悸适撬芯A廠的核心機(jī)密,外界很難知曉。它可以反應(yīng)出這家晶圓廠制造芯片的總體水平和營(yíng)收能力。
芯片制造的每一個(gè)階段,從晶圓制造、中測(cè)、封裝到成測(cè),每一步都會(huì)對(duì)總良率產(chǎn)生影響,其中,晶圓制造是影響良率的主要因素。
良率還受設(shè)備、原材料等因素影響,要想達(dá)到較高水平,需要穩(wěn)定工藝設(shè)備,定期做工藝能力恢復(fù)。另外,環(huán)境因素對(duì)以上提到的三種良率都會(huì)產(chǎn)生影響,如塵埃、濕度、溫度和光照亮度等,芯片制造和封測(cè)過程需要在超潔凈的工作環(huán)境中進(jìn)行。
另外,wafer的尺寸會(huì)直接影響良率,一般情況下,中心區(qū)域的良率較高,邊緣區(qū)域的良率較低(這是由制造工藝決定的)。wafer尺寸越大,中心區(qū)面積占總面積比例也大,良率越高。
良率不是一成不變的,它會(huì)隨著工藝技術(shù)的不斷成熟而提升。一般情況下,新制程工藝剛量產(chǎn)的時(shí)候,良率比較低,隨著生產(chǎn)的推進(jìn),以及導(dǎo)致低良率的因素被發(fā)現(xiàn)和改進(jìn),良率會(huì)不斷提升,較為成熟的產(chǎn)線良率可以達(dá)到95%以上。
很多半導(dǎo)體公司都有專門從事良率提升工作的工程師,在晶圓廠,有專門的良率提高(YE)部門,良率工程師負(fù)責(zé)提高晶圓良率;在IC設(shè)計(jì)企業(yè),運(yùn)營(yíng)部門有專業(yè)的產(chǎn)品工程師(PE)負(fù)責(zé)提高良率。
拿什么拯救你,我的良率
芯片良率如此重要,全行業(yè)都非常關(guān)注,晶圓廠、IC設(shè)計(jì)企業(yè)、半導(dǎo)體設(shè)備和材料廠商,以及行業(yè)科研機(jī)構(gòu)都在進(jìn)行各種研究探索,為提升芯片良率添磚加瓦。
當(dāng)然,提升良率的主戰(zhàn)場(chǎng)依然是晶圓廠(IDM廠或晶圓代工廠)。要提升良率,首先需要深入研究芯片良率與可靠性之間的關(guān)系,而可靠性與芯片缺陷有直接關(guān)系,因此,減少芯片生產(chǎn)過程中的缺陷數(shù)量可以提升基準(zhǔn)良率,同時(shí)可以提高器件的可靠性。
為了提高可靠性,需要投入時(shí)間、資金和相關(guān)資源,以提高良率,這就需要進(jìn)行權(quán)衡,因?yàn)椴煌愋托酒瑢?duì)可靠性的要求不同,與之對(duì)應(yīng)的資源投入也不同,這也會(huì)直接影響利潤(rùn)。例如,消費(fèi)類電子產(chǎn)品用芯片對(duì)可靠性要求沒有那么高(與工業(yè)和汽車芯片相比),因此,對(duì)于這類芯片,達(dá)到一定良率之后,晶圓廠不會(huì)做再高的追求,而是將資源分配到開發(fā)下一個(gè)節(jié)點(diǎn)的制程和設(shè)備,這樣可以提高成熟節(jié)點(diǎn)的盈利能力。而對(duì)于高可靠性要求的芯片(如車用芯片,其可靠性要求比消費(fèi)類芯片高兩至三個(gè)數(shù)量級(jí)),晶圓廠必須追求更高的基準(zhǔn)良率水平,也就需要在制程工藝和設(shè)備方面投入更多資源。不過,高性能與高良率之間是存在矛盾關(guān)系的,很難兼顧。
對(duì)于晶圓廠而言,大多數(shù)影響良率的系統(tǒng)性問題都已解決,實(shí)際良率損失主要是由制程設(shè)備或環(huán)境的隨機(jī)缺陷造成的。為了檢測(cè)出可靠性缺陷,晶圓廠的產(chǎn)線必須具備相應(yīng)的制程控制設(shè)備和檢測(cè)取樣機(jī)制,采用的缺陷檢測(cè)系統(tǒng)必須具備所需的缺陷靈敏度,并維護(hù)良好且達(dá)到規(guī)格。檢測(cè)取樣必須針對(duì)制程步驟達(dá)到足夠的頻次,以快速檢測(cè)到制程或設(shè)備的偏移。此外,必須有足夠的檢測(cè)產(chǎn)能用以支持加速異常偵測(cè)。
在實(shí)際操作過程中,常見的難點(diǎn)是精確找出基準(zhǔn)缺陷的出處,有時(shí),缺陷產(chǎn)生之后經(jīng)過多個(gè)制程步驟才被檢測(cè)到,這對(duì)設(shè)備監(jiān)控系統(tǒng)和機(jī)制的要求很高,做不好的話,常常找不出問題的根源在哪。為了解決這個(gè)問題,系統(tǒng)會(huì)先檢測(cè)一片晶圓,使其在指定的制程設(shè)備中運(yùn)行,然后再次檢測(cè),第二次檢測(cè)發(fā)現(xiàn)的任何新缺陷必定是由該指定的制程設(shè)備產(chǎn)生的,這樣,就可以找出缺陷的根源所在。因此,設(shè)置好一套靈敏的檢測(cè)機(jī)制,可以揭示源自每個(gè)制程設(shè)備的隨機(jī)良率損失并將其解決。
此外,晶圓廠可以對(duì)每個(gè)設(shè)備上出現(xiàn)的缺陷進(jìn)行分類,并生成資料庫,可作為現(xiàn)場(chǎng)故障的失效分析參考。這種方法需要非常頻繁的設(shè)備認(rèn)證(至少每天一次)。
通過以上這些措施和方法,晶圓廠可以有效控制缺陷,從而提升芯片良率水平。當(dāng)然,除了這些,晶圓廠還有其它提升良率的方式方法,這里就不再贅述了。
除了晶圓廠產(chǎn)線的流程控制,產(chǎn)業(yè)鏈上游的半導(dǎo)體材料廠商,特別是硅晶圓廠商,也可以通過創(chuàng)新技術(shù),在晶圓層面為提升良率提供保障。
例如,來自韓國科學(xué)與信息通信技術(shù)部下屬的韓國機(jī)械與材料研究所(KIMM)和新加坡南洋理工大學(xué)(NTU)的科學(xué)家開發(fā)了一種技術(shù)——新型納米轉(zhuǎn)移印刷技術(shù)(Nanotransfer-basedprinting),它可以制造出高度均勻的硅晶圓。他們將無化學(xué)粘合劑打印技術(shù)與金屬輔助化學(xué)蝕刻相結(jié)合,可以用于增強(qiáng)表面對(duì)比度以使納米結(jié)構(gòu)可見。
這種納米轉(zhuǎn)移印刷技術(shù)是通過在相對(duì)低溫(160°C)下將金(Au)納米結(jié)構(gòu)層轉(zhuǎn)移到硅襯底上,形成具有納米線(nanowires)的高度均勻的晶圓,以實(shí)現(xiàn)在制造過程中控制所需的厚度。這種技術(shù)允許快速、均勻、大規(guī)模制造晶圓,同時(shí),制造的晶圓幾乎沒有缺陷,生產(chǎn)出的芯片良率非常高。在實(shí)驗(yàn)室測(cè)試中,能夠?qū)?9%的20nm厚Au薄膜轉(zhuǎn)移到6英寸晶圓上。當(dāng)采用該方法加工6英寸晶圓時(shí),結(jié)果顯示印刷層保持完整,在蝕刻過程中彎曲最小,證明該Nanotransfer-basedprinting技術(shù)具有出色的均勻性和穩(wěn)定性。
KIMM-NTU團(tuán)隊(duì)認(rèn)為該技術(shù)可以很容易地?cái)U(kuò)展到12英寸晶圓上,而這是三星,英特爾、臺(tái)積電和GlobalFoundries等晶圓廠產(chǎn)線中的主流晶圓尺寸。
性能與良率之爭(zhēng)
談到芯片良率,就不能不談性能,因?yàn)檫@兩者之間是存在矛盾關(guān)系的。在消費(fèi)類電子產(chǎn)品芯片大行其道的時(shí)代,良率占絕對(duì)上風(fēng),因?yàn)?a class="article-link" target="_blank" href="/tag/%E6%B6%88%E8%B4%B9%E7%94%B5%E5%AD%90/">消費(fèi)電子產(chǎn)品對(duì)性能的要求沒那么高。但隨著近些年消費(fèi)電子市場(chǎng)的疲軟,相應(yīng)地,高性能計(jì)算(HPC)、汽車電子市場(chǎng)快速發(fā)展,且潛力巨大,而這些類型的芯片對(duì)性能要求極高,此時(shí),良率就不得不做些讓步了,因?yàn)樵诮^對(duì)高性能的量產(chǎn)要求下,良率不可能做得像消費(fèi)類芯片那么高。
這樣,各種新型芯片架構(gòu)就涌現(xiàn)了出來。最具代表性的,也是最極端的就是Cerebras的晶圓級(jí)大芯片。
2019年8月,人工智能初創(chuàng)公司Cerebras Systems發(fā)布了Cerebras Wafer Scale Engine(WSE)處理器,這是一個(gè)超大芯片,由一個(gè)12英寸晶圓制成。而傳統(tǒng)芯片則很小,一個(gè)12英寸晶圓可以制造出三、四百個(gè)芯片。
WSE擁有1.2萬億個(gè)晶體管,專門面向AI任務(wù)開發(fā),這顆巨型芯片,面積達(dá)到42225平方毫米。
通常情況下,晶圓廠不會(huì)制造這么大的芯片,因?yàn)樵趩蝹€(gè)晶圓的加工過程中通常會(huì)出現(xiàn)一些雜質(zhì),雜質(zhì)會(huì)直接影響芯片良率,而單個(gè)芯片越大,整體良率越低。像Cerebras這么大的芯片,其良率保障是個(gè)凸出的問題。不過,Cerebras Systems公司表示,其設(shè)計(jì)的芯片留有冗余,一種雜質(zhì)不會(huì)導(dǎo)致整個(gè)芯片都不能用。
2021年4月,Cerebras Systems公司又推出了WSE的升級(jí)版WSE-2,集成了2.6萬億個(gè)晶體管。該公司稱設(shè)計(jì)出了一個(gè)可以繞過任何制造缺陷的系統(tǒng)來實(shí)現(xiàn)100%的良率,最初,Cerebras有1.5%的額外內(nèi)核允許缺陷的存在。
之所以會(huì)出現(xiàn)WSE這樣的超大芯片,原因在于,高性能計(jì)算市場(chǎng)對(duì)性能的敏感度高于價(jià)格,高性能計(jì)算市場(chǎng)的主要客戶并非C端,而是B端的行業(yè)客戶,他們對(duì)成本不敏感,最關(guān)心的是性能。特別是近些年,AI在云計(jì)算市場(chǎng)的應(yīng)用風(fēng)起云涌,云端AI芯片的客戶主要是谷歌這樣的互聯(lián)網(wǎng)巨頭,在這些巨頭眼里,算力就是王道,它們對(duì)算力的追求幾乎是無止境的,這一點(diǎn)和信奉“夠用就好”的消費(fèi)電子市場(chǎng)完全不同。
當(dāng)然,像Cerebras Systems公司這樣的芯片屬于極端案例,大多數(shù)情況下,高性能計(jì)算市場(chǎng)的芯片尺寸還是在傳統(tǒng)范圍以內(nèi)。但良率與性能之間的矛盾問題還是有增無減。需要有新的解決方案。
此時(shí),Chiplet應(yīng)運(yùn)而生,它在兼顧性能和良率方面有獨(dú)到之處。如果要提升性能就必須減少片外通信,而想提升良率則必須保證單一芯片面積不能太大。Chiplet方案恰恰能同時(shí)兼顧這兩點(diǎn)。Chiplet可將單一芯粒(die)面積做?。ù_保良率),并用高級(jí)封裝技術(shù)把不同的芯粒集成在一起。這樣,芯粒之間的通信并不需要走PCB板,可以在封裝內(nèi)進(jìn)行,這就大大降低了片外通信的開銷。AMD最先在數(shù)據(jù)中心商用了Chiplet方案,且取得了良好的效果,看到商機(jī)后,英特爾也在跟進(jìn),開發(fā)了一整套先進(jìn)制程工藝和封裝技術(shù)。
總之,在先進(jìn)制程不斷迭代的今天,芯片良率問題變得越來越突出,與此同時(shí),高性能需求也在給良率找麻煩。一切都好難,能夠玩轉(zhuǎn)這些的廠商恐怕會(huì)越來越少。