蘋果在近日召開的2024年WWDC全球開發(fā)者大會(huì)上開啟了AI新篇章:推出全新AI系統(tǒng)Apple Intelligence,宣布與OpenAI的合作,ChatGPT集成將于今年晚些時(shí)候登陸iOS、iPadOS和macOS。
蘋果大舉發(fā)力AI之后,股價(jià)應(yīng)聲上漲。美東時(shí)間6月11日,蘋果股價(jià)收盤漲幅超過7%,是蘋果自2022年11月以來最大的單日漲幅,市值接近3.2萬(wàn)億美元。截至美東時(shí)間6月13日收盤,蘋果最新市值達(dá)到3.29萬(wàn)億美元,暫時(shí)反超微軟成為全球最大市值公司。此前,媒體已經(jīng)報(bào)道受益于AI浪潮,英偉達(dá)、AMD等相關(guān)公司股價(jià)一路狂飆。AI“潑天的富貴”正到處揮灑,各行各業(yè)皆有望從中受益,AI服務(wù)器也將是其中之一。
AI服務(wù)器成長(zhǎng)力道強(qiáng)勁
服務(wù)器作為一種高性能計(jì)算機(jī),通常用于處理網(wǎng)絡(luò)上的數(shù)據(jù)、存儲(chǔ)和傳輸數(shù)據(jù),并提供各種網(wǎng)絡(luò)服務(wù),以滿足客戶端請(qǐng)求與需要,在網(wǎng)絡(luò)環(huán)境中扮演十分重要的角色。
AI服務(wù)器即專門為人工智能應(yīng)用設(shè)計(jì)的高性能計(jì)算平臺(tái),與傳統(tǒng)服務(wù)器相比,在用途上AI服務(wù)器專門設(shè)計(jì)用于處理大規(guī)模數(shù)據(jù)和提供高效計(jì)算能力以支持人工智能應(yīng)用;在硬件配置上,二者皆采用高速網(wǎng)絡(luò)技術(shù)與硬件加速技術(shù),與傳統(tǒng)服務(wù)器以CPU為主要算力的形式不同,AI服務(wù)器需要滿足AI算法下高性能計(jì)算、高存儲(chǔ)需求,因而配置更加復(fù)雜,除了CPU之外,通常還需配備GPU、FPGA、ASIC等加速芯片,以滿足AI算法訓(xùn)練和推理過程中對(duì)高吞吐量計(jì)算的需求,此外也需要配備大內(nèi)存、高速SSD等存儲(chǔ)產(chǎn)品。
當(dāng)前AI服務(wù)器多屬于“機(jī)架服務(wù)器”,一個(gè)機(jī)柜放多個(gè)服務(wù)器機(jī)箱,規(guī)格以U為代稱,比如1U、2U、4U、7U等,AI需求越高,數(shù)字則越大。
AI大模型有訓(xùn)練(Training)、推理(Inference)兩大應(yīng)用場(chǎng)景需求,以此劃分,AI服務(wù)器主要有訓(xùn)練型與推理型兩類,其中訓(xùn)練型AI服務(wù)器算力要求極高,多數(shù)部署于云端,推理型AI服務(wù)器則對(duì)算力無(wú)太高需求,主要部署于云端與邊緣側(cè)。
在AI需求推動(dòng)下,AI服務(wù)器成長(zhǎng)力道強(qiáng)勁。全球市場(chǎng)研究機(jī)構(gòu)TrendForce集邦咨詢預(yù)估,2024年全球AI服務(wù)器(包含AI Training及AI Inference)將超過160萬(wàn)臺(tái),年成長(zhǎng)率達(dá)40%。
此外今年3月,科技大廠戴爾大幅上調(diào)了AI服務(wù)器全球TAM(潛在市場(chǎng)規(guī)模),該公司預(yù)計(jì)2025年與2027年全球AI服務(wù)器TAM分別達(dá)到1050億美元與1520億美元,高于此前預(yù)期的910億美元與1240億美元。
產(chǎn)業(yè)鏈環(huán)節(jié)中,AI服務(wù)器上游為服務(wù)器零部件,包括芯片、PCB、電源、散熱模組等;中游為整合組裝,將芯片組裝進(jìn)服務(wù)器硬件中,并增加必要的網(wǎng)絡(luò)、存儲(chǔ)設(shè)備,形成完整的AI服務(wù)器解決方案;下游應(yīng)用領(lǐng)域則包括互聯(lián)網(wǎng)廠商、運(yùn)營(yíng)商、通信、政府、制造業(yè)、教育、金融與醫(yī)療等。
圖片來源:全球半導(dǎo)體觀察制圖
上游:AI芯片是核心
AI芯片是構(gòu)建AI服務(wù)器的核心硬件產(chǎn)品,用于處理大量數(shù)據(jù)并運(yùn)行復(fù)雜計(jì)算任務(wù)。
圖片來源:全球半導(dǎo)體觀察
按照技術(shù)分類,AI服務(wù)器芯片主要包含GPU、FPGA、ASIC三類,GPU是目前AI服務(wù)器中常用的算力芯片,占比超過70%,常用于訓(xùn)練以及推理階段,代表廠商包括英偉達(dá)、AMD、英特爾等國(guó)外企業(yè),以及海光信息、寒武紀(jì)、燧原科技、摩爾線程、壁仞科技等國(guó)內(nèi)公司。
值得一提的是,AI服務(wù)器中,GPU往往搭配HBM(高帶寬內(nèi)存)使用,HBM是專為GPU設(shè)計(jì)的內(nèi)存技術(shù),通過多個(gè)DRAM芯片層疊在一起,并使用高密度的硅通孔(TSV)和微凸點(diǎn)(microbumps)技術(shù),實(shí)現(xiàn)與GPU的垂直互連。HBM目前呈現(xiàn)三星、SK海力士與美光“三分天下”的格局,已經(jīng)發(fā)展至第五代(HBM3E),第六代HBM4預(yù)計(jì)有望最早于2025年亮相。
GPU之后是ASIC,為全定制芯片,在AI服務(wù)器市場(chǎng)中占比約兩成,同樣用于訓(xùn)練與推理階段,代表廠商包括谷歌、亞馬遜AWS等。
最后是FPGA,為半定制芯片,產(chǎn)品主要用于推理階段,目前占比較低(個(gè)位數(shù)占比),代表廠商包括AMD、賽靈思、英特爾等。
除了上述廠商外,前文提及的蘋果也對(duì)AI服務(wù)器芯片有所布局。今年5月媒體報(bào)道蘋果已經(jīng)開始構(gòu)建基于M2 Ultra芯片的AI服務(wù)器,富士康正在組裝相關(guān)產(chǎn)品,同時(shí)蘋果還計(jì)劃在2025年年底推出采用M4芯片的AI服務(wù)器。另有報(bào)道指出蘋果正為數(shù)據(jù)中心自研AI服務(wù)器芯片,該芯片項(xiàng)目代號(hào)為ACDC(Apple Chips in Data Center),專注于推理模型。或許在不遠(yuǎn)的將來,蘋果AI服務(wù)器芯片產(chǎn)品將會(huì)正式公開。
中游:AI服務(wù)器的兩類“玩家”
服務(wù)器領(lǐng)域中游環(huán)節(jié)“玩家”眾多,大致可以分為ODM廠商與品牌服務(wù)器廠商。服務(wù)器相關(guān)組件準(zhǔn)備完成后,將由ODM廠商進(jìn)行組裝代工,再送至品牌服務(wù)器廠商處銷售,或者是ODM廠商直接與下游(通常是云端業(yè)者)客戶合作,根據(jù)客戶的需求進(jìn)行定制化生產(chǎn),不通過品牌服務(wù)器廠商。AI服務(wù)器同樣以此分為兩類:
圖片來源:全球半導(dǎo)體觀察
其中,ODM代表廠商包括廣達(dá)、工業(yè)富聯(lián)、英業(yè)達(dá)、緯創(chuàng)、Supermicro等,它們與云端業(yè)者、上游芯片廠商深度綁定,有著穩(wěn)定的供應(yīng)鏈、快速交付能力、較低售價(jià)等優(yōu)勢(shì),基于低成本和快速部署服務(wù)器以建設(shè)大規(guī)模數(shù)據(jù)中心的考量,近年云端業(yè)者與ODM廠商合作日益頻繁。
受惠于云端數(shù)據(jù)中心領(lǐng)域訂單帶動(dòng),今年各大ODM廠商AI服務(wù)器出貨強(qiáng)勁。工業(yè)富聯(lián)今年已斬獲Oracle訂單,同時(shí)也承接部分AWS ASIC訂單。5月15日工業(yè)富聯(lián)一季度業(yè)績(jī)說明會(huì)上,該公司表示2024年預(yù)計(jì)AI貢獻(xiàn)占公司云計(jì)算總收入40%,公司AI服務(wù)器將達(dá)全球市場(chǎng)份額的40%;英業(yè)達(dá)除了北美客戶之外,今年字節(jié)跳動(dòng)需求強(qiáng)勁,有望共同推動(dòng)AI服務(wù)器出貨成長(zhǎng);廣達(dá)訂單主要來自北美云端客戶如Microsoft及AWS,5月廣達(dá)透露預(yù)期本季起AI服務(wù)器出貨將溫和成長(zhǎng),下半年AI服務(wù)器可望迎來出貨爆發(fā)期,除了云端客戶外,也已拿到其他新客戶訂單;Supermicro每季出貨HGX等高端AI服務(wù)器的主要客戶群,以歐美二線數(shù)據(jù)中心為主,如CoreWeave與Tesla等,另外也開始積極拓展蘋果、Meta等客戶AI訂單。
品牌廠商方面,AI服務(wù)器代表廠商包括戴爾、HPE、甲骨文、惠普、聯(lián)想、浪潮信息、新華三、寧暢、超聚變等,它們擁有服務(wù)器方案自主設(shè)計(jì)能力與核心技術(shù)專利,此前委托ODM代工廠商生產(chǎn)標(biāo)準(zhǔn)化服務(wù)器產(chǎn)品,再對(duì)外進(jìn)行銷售,不過隨著云計(jì)算、AI需求不斷增加,部分品牌服務(wù)器廠商也逐漸開始生產(chǎn)定制化產(chǎn)品,與ODM廠商形成了既合作又競(jìng)爭(zhēng)的關(guān)系。如浪潮信息近年提出了JDM(Joint Design Manufacture,聯(lián)合開發(fā)模式),不再單純把產(chǎn)品賣給客戶,而是與客戶合作,讓客戶參與到服務(wù)器產(chǎn)品的設(shè)計(jì)、研發(fā)和交付的流程中,從而提升供應(yīng)鏈效率,滿足客戶需求。
在AI浪潮推動(dòng)下,品牌AI服務(wù)器同樣呈現(xiàn)供不應(yīng)求狀況。戴爾截至2024年5月3日的2025財(cái)年第一季度財(cái)報(bào)顯示,AI服務(wù)器助力,戴爾實(shí)現(xiàn)了自2022年以來的首次營(yíng)收同比增長(zhǎng),超出市場(chǎng)預(yù)期。其中,服務(wù)器與網(wǎng)絡(luò)營(yíng)收同比增長(zhǎng)42%至55億美元,創(chuàng)下歷史新高。戴爾表示,公司AI優(yōu)化服務(wù)器的出貨量較上季度環(huán)比增超100%至17億美元,此類服務(wù)器的訂單積壓量環(huán)比躍升30%至38億美元。
HPE財(cái)報(bào)顯示,受益于AI服務(wù)器需求旺盛,截至今年4月30日的第二財(cái)季HPE凈營(yíng)收72.0億美元,同比增長(zhǎng)3.3%,超過業(yè)界預(yù)期,服務(wù)器業(yè)務(wù)創(chuàng)造了38.7億美元的收入,AI服務(wù)器系統(tǒng)銷售額超過了9億美元,比第一財(cái)季翻了一番。HPE透露,AI服務(wù)器系統(tǒng)目前的積壓訂單達(dá)到31億美元。
紫光股份總裁王竑弢今年4月對(duì)外表示,AI服務(wù)器訂單在今年一季度有很大提升,產(chǎn)能滿足市場(chǎng)需求不存在問題;公司有各類型GPU服務(wù)器滿足AI場(chǎng)景應(yīng)用,特別針對(duì)GPT場(chǎng)景而優(yōu)化的GPU服務(wù)器已經(jīng)完成開發(fā),將在今年二季度全面上市。資料顯示,紫光股份旗下新華三擁有多款A(yù)I服務(wù)器產(chǎn)品,可滿足不同場(chǎng)景對(duì)智能算力的需求。
5月,聯(lián)想集團(tuán)公布的最新財(cái)報(bào)顯示,服務(wù)器業(yè)務(wù)迎來拐點(diǎn),ISG基礎(chǔ)設(shè)施業(yè)務(wù)集團(tuán)重拾增長(zhǎng)動(dòng)能,營(yíng)收同比增速達(dá)15.1%,創(chuàng)下同期歷史新高。同時(shí),聯(lián)想表示ISG仍然會(huì)堅(jiān)定開發(fā)全面的人工智能產(chǎn)品組合。此前3月,聯(lián)想首臺(tái)搭載最新國(guó)產(chǎn)AI算力芯片的聯(lián)想問天WA5480 G3成功投產(chǎn)下線并交付。
業(yè)界認(rèn)為,受益于臺(tái)積電CoWoS產(chǎn)能持續(xù)擴(kuò)張以及NVIDIA AI GPU出貨量的穩(wěn)定,AI服務(wù)器芯片供應(yīng)有望于2024年第二季度緩解,屆時(shí)AI服務(wù)器整機(jī)出貨量將陸續(xù)提升。
下游:CSP為高階AI服務(wù)器主要需求動(dòng)能
AI服務(wù)器的下游客戶廣泛,包括互聯(lián)網(wǎng)企業(yè)、云計(jì)算企業(yè)、數(shù)據(jù)中心服務(wù)商、以及政府、金融、醫(yī)療等行業(yè),當(dāng)前AI服務(wù)器市場(chǎng)需求(尤其是高階AI服務(wù)器)動(dòng)能主要來自大型CSP(云端服務(wù)業(yè)者),包括微軟、谷歌、亞馬遜AWS、Meta、CoreWeave等美系廠商,以及BBAT(字節(jié)跳動(dòng)、百度、阿里巴巴、騰訊)等國(guó)內(nèi)廠商。
集邦咨詢調(diào)查顯示,以2024年全球主要CSP對(duì)高階AI 服務(wù)器(包含搭載NVIDIA、AMD或其他高端ASIC芯片等)需求量觀察,預(yù)估美系四大CSP業(yè)者包括Microsoft、Google、AWS、Meta各家占全球需求比重分別達(dá)20.2%、16.6%、16%及10.8%,合計(jì)將超過6成,居于全球領(lǐng)先位置。
國(guó)內(nèi)高階AI服務(wù)器需求占比目前較低,不過在政策支持、國(guó)產(chǎn)化趨勢(shì)以及國(guó)內(nèi)科技廠商持續(xù)布局大規(guī)模數(shù)據(jù)中心環(huán)境下,國(guó)內(nèi)高階AI服務(wù)器需求將持續(xù)上升,AI服務(wù)器產(chǎn)業(yè)有望持續(xù)受益。
隨著消費(fèi)電子市場(chǎng)逐漸復(fù)蘇,加上ChatGPT、Sora等大模型“火爆出圈”,此前步入下行周期的半導(dǎo)體行業(yè)逐漸釋放利好信號(hào)。不過與此同時(shí),半導(dǎo)體行業(yè)還面臨高性能AI芯片供應(yīng)短缺、晶圓代工成熟制程產(chǎn)能過剩等隱憂,行業(yè)發(fā)展仍有一定不確定性。
展望未來,半導(dǎo)體與存儲(chǔ)器產(chǎn)業(yè)將何去何從?產(chǎn)業(yè)發(fā)展又將迎來哪些技術(shù)變革?又將有哪些機(jī)遇與挑戰(zhàn)?2024年6月19日(周三),TrendForce集邦咨詢將在深圳舉辦“2024集邦咨詢半導(dǎo)體產(chǎn)業(yè)高層論壇(TrendForce Semiconductor Seminar 2024)”。
屆時(shí),集邦咨詢多位重量級(jí)資深分析師將針對(duì)AI浪潮推動(dòng)下,聚焦晶圓代工、DRAM、NAND Flash等關(guān)鍵領(lǐng)域發(fā)表主題演講。敬請(qǐng)期待!