作者:暢秋
從2023上半年開始,英偉達(dá)的AI服務(wù)器用GPU(特別是H100)就供不應(yīng)求了,這種狀況一直持續(xù)到今天。之所以如此,問題出在生產(chǎn)環(huán)節(jié),主要涉及臺積電的先進(jìn)制程和封裝產(chǎn)能,特別是CoWoS封裝,市場上具備這種先進(jìn)封裝量產(chǎn)能力的廠商并不多,而臺積電沒有預(yù)料到市場對英偉達(dá)GPU的需求增長爆發(fā)力如此之強(qiáng),在2023年第二季度才開始大規(guī)模擴(kuò)增CoWoS產(chǎn)能。
近期,市場傳來了一個(gè)好消息,瑞銀(UBS)的最新報(bào)告顯示,英偉達(dá)大幅縮短了AI GPU的交貨周期,從2023年底的8~11個(gè)月縮短到了現(xiàn)在的3-4個(gè)月。這對英偉達(dá)客戶來說是非常利好的。
CoWoS封裝產(chǎn)能是關(guān)鍵
交貨時(shí)間縮短,表明臺積電擴(kuò)增的CoWoS封裝產(chǎn)能開始釋放。據(jù)悉,臺積電要在2024年底前將相關(guān)產(chǎn)能從2023年中的水平增加一倍,從目前的情況來看,臺積電及其合作伙伴的CoWoS產(chǎn)能擴(kuò)增進(jìn)展快于預(yù)期,使得以H100為代表的高性能GPU交貨時(shí)間大幅縮短。
產(chǎn)業(yè)人士分析,從2023年7月到年底,臺積電積極調(diào)整CoWoS封裝產(chǎn)能,已逐步擴(kuò)充并穩(wěn)定量產(chǎn),去年12月,臺積電CoWoS月產(chǎn)能增加到1.4萬~1.5萬片。
雖然臺積電在積極擴(kuò)產(chǎn),但只這一家的產(chǎn)能還是無法滿足市場需求,因此,英偉達(dá)已經(jīng)在2023年向臺積電以外的專業(yè)封測代工廠(OSAT)尋求幫助,主要包括日月光和安靠(Amkor),其中,安靠在2023年第四季度已開始提供相關(guān)產(chǎn)能,日月光投控旗下矽品也于2024年第一季度開始供應(yīng)CoWoS封裝產(chǎn)能。
2024年,AI芯片用先進(jìn)封裝產(chǎn)能依然會(huì)供不應(yīng)求,包括臺積電、日月光、安靠、力成、京元電在內(nèi)的專業(yè)封測代工廠,將會(huì)在今年擴(kuò)大資本支出,以布局先進(jìn)封裝產(chǎn)能。
根據(jù)臺積電的擴(kuò)產(chǎn)節(jié)奏,預(yù)計(jì)到今年第四季度,該晶圓代工龍頭的CoWoS月產(chǎn)能將大幅擴(kuò)充到3.3萬~3.5萬片。
今年,日月光的資本支出規(guī)模將同比增長40%~50%,其中,65%的投資用于封裝,特別是先進(jìn)封裝項(xiàng)目。日月光投控營運(yùn)長吳田玉表示,今年的先進(jìn)封裝與測試營收占比會(huì)更高,AI相關(guān)先進(jìn)封裝收入將翻倍,今年相關(guān)營收至少增加2.5億美元。力成也在擴(kuò)大先進(jìn)封裝產(chǎn)能,該公司董事長蔡篤恭表示,下半年將積極擴(kuò)大資本支出,規(guī)模有望達(dá)到100億元新臺幣。力成主要布局扇出型基板封裝(fan out on substrate)技術(shù),整合ASIC和HBM先進(jìn)封裝,在AI用HBM內(nèi)存方面,力成有望在今年第四季度量產(chǎn)相關(guān)產(chǎn)品。為滿足CoWoS封裝后的晶圓測試需求,今年,京元電相關(guān)晶圓測試產(chǎn)能將擴(kuò)充兩倍。
競爭對手雪上加霜
近些年,全球AI核心處理器市場幾乎被英偉達(dá)GPU壟斷,此次,該公司供貨能力進(jìn)一步提升,對于各家競爭對手來說,真是雪上加霜,有些廠商的日子更難過了,特別是一些對標(biāo)英偉達(dá)產(chǎn)品的創(chuàng)業(yè)公司,有的已經(jīng)接近倒閉。
據(jù)The Information統(tǒng)計(jì),在北美地區(qū),至少有12家AI芯片創(chuàng)業(yè)公司想從英偉達(dá)獨(dú)享的生成式AI算力紅利中分一杯羹。在這些創(chuàng)業(yè)公司中,創(chuàng)辦時(shí)間最長的不超過8年,有5家都是2022年創(chuàng)辦的,有4家創(chuàng)始成員有谷歌背景。
這12家AI芯片創(chuàng)業(yè)公司,有的定位做訓(xùn)練,有的主攻推理,有些則更進(jìn)一步,將其產(chǎn)品定位瞄準(zhǔn)特定類型的AI模型。推理一直是更受歡迎的選擇,因?yàn)楹芏嗫蛻羰褂没蛭⒄{(diào)已經(jīng)被訓(xùn)練過的模型,而不是從頭開始構(gòu)建一個(gè)新模型。AI芯片創(chuàng)業(yè)公司d-Matrix、Etched.ai、Extropic、SiMa.ai、Groq正在構(gòu)建專門用于某些模型架構(gòu)的芯片,如為OpenAI和Anthropic的大語言模型提供動(dòng)力的Transformer。這些公司認(rèn)為,專用芯片比英偉達(dá)、Cerebras、Lightmatter、Rain AI、Tenstorrent等的通用芯片更快、效率更高。
還有幾家創(chuàng)業(yè)公司正在開發(fā)新GPU技術(shù)和產(chǎn)品,包括專用的AI加速器和針對特定應(yīng)用優(yōu)化的定制芯片。如果這些創(chuàng)業(yè)公司的技術(shù)被證明優(yōu)于老牌企業(yè),他們可能會(huì)成為顛覆者,但是,從過去幾年的技術(shù)和產(chǎn)品發(fā)展情況來看,短時(shí)間內(nèi),要想顛覆英偉達(dá)的產(chǎn)品和生態(tài)系統(tǒng),難度非常大,已經(jīng)有幾家公司支撐不住了,由于它們開發(fā)的新技術(shù)和產(chǎn)品很難在市場上銷售出去,導(dǎo)致資金鏈非常緊張。
以英國的Graphcore為例,該公司正在考慮出售給外國買家,據(jù)媒報(bào)道,Graphcore一直在與主要科技公司進(jìn)行談判,因?yàn)樗趯で筚Y金來彌補(bǔ)日益增長的虧空。2023年,Graphcore就曾表示,在銷售額下降46%且虧損增加后,它需要新的資金。
中國市場緊迫感增加
目前,全球AI市場用到的GPU,先進(jìn)且用量最大的是H100,但該產(chǎn)品在巨大的中國大陸市場難以實(shí)現(xiàn)大規(guī)模銷售。對于英偉達(dá)來說,產(chǎn)能問題的解決,可以實(shí)現(xiàn)更多訂單,對于中國大陸市場來說,全球市場GPU供應(yīng)量的增加,會(huì)進(jìn)一步增加本土AI服務(wù)器和應(yīng)用企業(yè)的緊迫感,因?yàn)槿駻I應(yīng)用水平會(huì)隨GPU供應(yīng)量的大幅增加而提升進(jìn)步速度,在類似于H100這樣的主芯片供應(yīng)受限的情況下,中國市場必須另謀出路,才能保證本土市場AI服務(wù)器系統(tǒng)和應(yīng)用水平不掉隊(duì)。
在A800和H800芯片被禁售以后,英偉達(dá)又為中國大陸市場提供了新的方案——H20、L20和L2。但是,在目前這種情況下,中國客戶是否愿意大規(guī)模采用英偉達(dá)這些降級版本AI芯片呢?
據(jù)報(bào)道,自2023年11月以來,阿里巴巴和騰訊等互聯(lián)網(wǎng)大廠一直在測試英偉達(dá)降級版本芯片,這些中國企業(yè)已經(jīng)向英偉達(dá)表示,他們計(jì)劃在2024年訂購的芯片數(shù)量將大大低于他們最初的計(jì)劃。測試人員強(qiáng)調(diào),與英偉達(dá)常規(guī)GPU相比,需要更多的H20芯片來抵消性能差異,從而導(dǎo)致費(fèi)用大幅增加?;诖耍袊就猎O(shè)計(jì)制造的相關(guān)芯片對買家更具吸引力,阿里巴巴和騰訊等企業(yè)正在將更多訂單轉(zhuǎn)移到本土芯片供應(yīng)商。
這種采購行為的轉(zhuǎn)變在包括百度和字節(jié)跳動(dòng)在內(nèi)的其它主要芯片買家中也很明顯。據(jù)TrendForce統(tǒng)計(jì),中國云計(jì)算公司使用的高端AI芯片中,約有80%來自英偉達(dá),但這一比例在未來5年內(nèi)可能會(huì)下降至50%~60%。
與此同時(shí),百度和阿里巴巴等中國CSP也在積極投資自研AI芯片。
百度于2020年推出了首款自研的AI芯片昆侖芯,并在2021年推出第二代,計(jì)劃在2024年推出第三代。在收購中天微并成立T-Head Semiconductor(平頭哥)后,阿里巴巴也開始設(shè)計(jì)AI芯片,代表產(chǎn)品是含光800。雖然T-Head最初與外部公司合作進(jìn)行ASIC芯片設(shè)計(jì),但從2023年開始,阿里巴巴將主要依賴內(nèi)部資源來加強(qiáng)其下一代ASIC芯片設(shè)計(jì),特別是阿里云的AI基礎(chǔ)設(shè)施。
近些年,華為、寒武紀(jì)、天數(shù)智芯等中國本土企業(yè)也在潛心研究高性能AI芯片,產(chǎn)品力不斷升級。以華為昇騰910為例,該款芯片采用7nm制程,集成了超496億個(gè)晶體管,可以提供320TFLOPS的FP16計(jì)算速度或640TOPS的INT8算力,略高于英偉達(dá)A100的FP16計(jì)算速度(312TFLOPS,不采用英偉達(dá)稀疏技術(shù))。
AI服務(wù)器生產(chǎn)和代工的商機(jī)
從目前的發(fā)展情況來看,2024年,AI服務(wù)器和相關(guān)系統(tǒng)將會(huì)加快組裝、生產(chǎn)和應(yīng)用節(jié)奏,TrendForce認(rèn)為,2024年,全球AI服務(wù)器數(shù)量將超過160萬臺(包含采用高端GPU的AI訓(xùn)練服務(wù)器,以及采用中低端GPU、FPGA、ASIC的AI推理服務(wù)器),同比增長40%,這將為相關(guān)芯片和電子制造代工業(yè)務(wù)(EMS)帶來更多商機(jī),特別是中國臺灣和中國大陸相關(guān)廠商,有更多可以挖掘的市場空間。
目前,各大云服務(wù)提供商正在競相布局LLM與生成式AI應(yīng)用,如Google的Gemini,Amazon也在訓(xùn)練新的LLM。預(yù)計(jì)中小語言模型會(huì)是2024年新興競爭領(lǐng)域,許多更為定制化、符合運(yùn)算效率的模型將陸續(xù)出現(xiàn),例如Llama-2、Microsoft Phi-2、Google Gemini Nano 2等。而隨著英偉達(dá)GPU供應(yīng)能力的提升,這些AI應(yīng)用面市的速度會(huì)加快,對相關(guān)服務(wù)器生產(chǎn)和代工的需求也會(huì)提升。
近期,中國臺灣AI服務(wù)器供應(yīng)鏈高度關(guān)注AI芯片供應(yīng)狀況的變化。供應(yīng)鏈人士表示,鴻海是英偉達(dá)板卡主要供應(yīng)商,也是HGX、DGX等服務(wù)器平臺供應(yīng)商,市占率超過70%,許多產(chǎn)品甚至獨(dú)家供應(yīng)。鴻海董事長劉揚(yáng)偉先前公開表示,鴻海AI服務(wù)器業(yè)務(wù)接單狀況相當(dāng)好。
廣達(dá)同樣看好今年AI服務(wù)器出貨,該公司預(yù)期,如果AI芯片供貨緩解,最快5月起,AI服務(wù)器出貨量將明顯提升,下半年將進(jìn)入出貨爆發(fā)期,今年AI服務(wù)器營收增長幅度將達(dá)到兩位數(shù)百分比。
據(jù)悉,緯創(chuàng)手握英偉達(dá)CoWoS AI芯片基板85%訂單,也是AMD和英特爾AI芯片模組、基板的獨(dú)家供應(yīng)商。緯創(chuàng)表示,今年AI相關(guān)營收增長幅度將達(dá)到三位數(shù)百分比。
在中國大陸,AI服務(wù)器出貨量也在快速增長。中商產(chǎn)業(yè)研究院發(fā)布的《2022-2027年中國服務(wù)器行業(yè)需求預(yù)測及發(fā)展趨勢前瞻報(bào)告》顯示,2022年,AI服務(wù)器市場出貨量約28.4萬臺,同比增長25.66%,2023年約為35.4萬臺。中商產(chǎn)業(yè)研究院分析師預(yù)測,2024年,中國大陸AI服務(wù)器出貨量將達(dá)到42.1萬臺。
從全球市場來看,AI服務(wù)器TOP10廠商中,中國大陸廠商占據(jù)4席,其中,浪潮信息是本土最大AI服務(wù)器廠商。在中國大陸市場,AI服務(wù)器市場集中度較高,排名前三的廠商為浪潮信息、寧暢和華為,這三家的市占率總和達(dá)70.40%。另外,新華三的產(chǎn)品也值得關(guān)注。
浪潮的代表產(chǎn)品是NF5688M6,它是為超大規(guī)模數(shù)據(jù)中心研發(fā)的NVLink AI服務(wù)器,支持2個(gè)英特爾Ice Lake CPU和8個(gè)英偉達(dá)A800 GPU,單機(jī)可提供5PFlops的AI計(jì)算性能。對比核心硬件來看,NF5688M6采用英偉達(dá)中國特供版芯片A800,在浮點(diǎn)計(jì)算能力、顯存帶寬、顯存容量等性能指標(biāo)上,與先進(jìn)算力芯片A100基本一致,主要差異在于芯片的數(shù)據(jù)傳輸速度,約為A100的三分之二。
華為的AI服務(wù)器融合了自研加速卡和英特爾CPU,代表產(chǎn)品是Atlas 800推理服務(wù)器系列,旗下有型號3000、3010、9000和9010,其中,3000基于昇騰310芯片,3010基于英特爾CPU,9000基于華為鯤鵬920+昇騰910處理器,9010基于英特爾CPU+華為昇騰910芯片。產(chǎn)品最高擁有2.24 PFLOPS FP16的算力。
新華三的AI服務(wù)器可覆蓋各種訓(xùn)練負(fù)載要求,代表產(chǎn)品包括R4900 G5、R5300 G5、R5500 G5等,可分別針對不同訓(xùn)練負(fù)載要求,滿足大小規(guī)模的推理/訓(xùn)練任務(wù)。軟件層面,該公司通過新華三傲飛AI/HPC融合管理平臺,提升AI作業(yè)效率約32%。
結(jié)語
2024年,無論是AI芯片提供商,還是AI服務(wù)器生產(chǎn)和代工廠商,都將迎來更廣闊的商機(jī)。
芯片方面,英偉達(dá)憑借AI用GPU的火爆,已經(jīng)賺得盆滿缽滿。在制造方面,以臺積電為代表的晶圓代工廠和封測廠大力擴(kuò)增先進(jìn)封裝產(chǎn)能,將在2024年得到回報(bào)。
在AI服務(wù)器生產(chǎn)和代工方面,相關(guān)廠商更是商機(jī)無限。一般來說,通用服務(wù)器的價(jià)格是幾千美金/臺,AI服務(wù)器的價(jià)格則達(dá)到10-15萬美金/臺,價(jià)格提升了將近20倍,在供不應(yīng)求的當(dāng)下,這么高的售價(jià)還不一定能拿到貨。
高端AI服務(wù)器的價(jià)格就更夸張了,據(jù)悉,搭載英偉達(dá)A800的AI服務(wù)器價(jià)格已經(jīng)從120萬元/臺漲到了140多萬元/臺,搭載8個(gè)H800的AI服務(wù)器價(jià)格已經(jīng)漲到了280萬元/臺。