最近這段時(shí)間,美國(guó)股票市場(chǎng)的動(dòng)靜比較大。有兩個(gè)科技股概念,突然變得很火,引起了市場(chǎng)的高度關(guān)注,漲幅驚人。這兩個(gè)概念,分別是ASIC和量子計(jì)算。
今天這篇文章,我們主要說(shuō)說(shuō)ASIC。
按資本市場(chǎng)的說(shuō)法,ASIC正在加速崛起,威脅GPU在AI計(jì)算中的統(tǒng)治地位。而博通,作為ASIC最重要的概念股,股價(jià)一路猛漲,一度從180飆到了250,市值也突破了萬(wàn)億美元。相比之下,英偉達(dá)反而成了昨日黃花,股價(jià)一路下跌,甚至不到130美元。
那么,ASIC時(shí)代真的到來(lái)了嗎?博通真的會(huì)取代英偉達(dá),成為新的AI之王?
█?ASIC和GPU是什么
ASIC和GPU,都是用于計(jì)算功能的半導(dǎo)體芯片。因?yàn)槎伎梢杂糜贏I計(jì)算,所以也被稱為“AI芯片”。
準(zhǔn)確來(lái)說(shuō),除了它倆,計(jì)算芯片還包括大家更熟悉的CPU,以及FPGA。
行業(yè)里,通常會(huì)把半導(dǎo)體芯片分為數(shù)字芯片和模擬芯片。其中,數(shù)字芯片的市場(chǎng)規(guī)模占比較大,達(dá)到70%左右。
數(shù)字芯片,還可以進(jìn)一步細(xì)分,分為:邏輯芯片、存儲(chǔ)芯片以及微控制單元(MCU)。CPU、GPU、FPGA、ASIC,全部都屬于邏輯芯片。
芯片的分類
邏輯芯片,就是計(jì)算芯片。它包含了各種邏輯門電路,可以實(shí)現(xiàn)運(yùn)算與邏輯判斷功能。
四個(gè)芯片里,CPU和GPU是通用芯片,可以完成多種任務(wù)。尤其是CPU,是全能型選手,單核主頻高,啥都能干,所以經(jīng)常被拿來(lái)做主處理器。
而GPU,本來(lái)是用來(lái)做圖形處理(顯卡)的。它的內(nèi)核數(shù)量特別多(大幾千個(gè)),適合做并行計(jì)算,也就是擅長(zhǎng)同時(shí)做大量的簡(jiǎn)單計(jì)算任務(wù)。(圖形處理,就是同時(shí)處理大量的像素計(jì)算。)
AI計(jì)算和圖形計(jì)算一樣,也是典型的并行計(jì)算型任務(wù)。
AI計(jì)算中包括大量并行的矩陣相乘、卷積、循環(huán)層、梯度運(yùn)算等任務(wù),所以,特別適合GPU去完成。CPU不適合AI計(jì)算,這也是英特爾股價(jià)跌到20美元以下的原因之一。
2023年以來(lái),AI浪潮爆發(fā),大部分企業(yè)的AI訓(xùn)練,采用的是英偉達(dá)的GPU集群。如果進(jìn)行合理優(yōu)化,一塊GPU卡,可以提供相當(dāng)于數(shù)十其至上百臺(tái)CPU服務(wù)器的算力。這直接導(dǎo)致了英偉達(dá)的股價(jià)猛漲了幾十倍,而且還買不到。
再來(lái)看看ASIC和FPGA。
ASIC(Application Specific Integrated Circuit,專用集成電路),是一種專用于特定任務(wù)的芯片。ASIC的官方定義,是指:應(yīng)特定用戶的要求,或特定電子系統(tǒng)的需要,專門設(shè)計(jì)、制造的集成電路。
Google公司大名鼎鼎的TPU(Tensor Processing Unit,張量處理單元),還有前幾年很火的比特幣礦機(jī),英特爾的Gaudi 2 ASIC芯片,IBM的AIU,AWS的Trainium,都屬于ASIC芯片。
這幾年非常火的DPU(Data Processing Unit,數(shù)據(jù)處理單元)和NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元),也是ASIC芯片。
FPGA(Field Programmable Gate Array,現(xiàn)場(chǎng)可編程門陣列),是半定制芯片,也被人稱為“萬(wàn)能芯片”。FPGA可以根據(jù)用戶的需要,在制造后,進(jìn)行無(wú)限次數(shù)的重復(fù)編程,以實(shí)現(xiàn)想要的數(shù)字邏輯功能。
ASIC和FPGA的區(qū)別在于,AISC是全定制芯片,功能寫死,沒(méi)辦法改。而FPGA是半定制芯片,功能靈活,可玩性強(qiáng)。FPGA不需要流片(很燒錢的一個(gè)工序),但因?yàn)榭删庉?,冗余功能比較多,一旦用于單一目的,就會(huì)存在浪費(fèi)。大規(guī)模生產(chǎn)的情況下,F(xiàn)PGA的成本比ASIC高,且極致能效不如ASIC。
所以,F(xiàn)PGA現(xiàn)在多用于產(chǎn)品原型的開發(fā)、設(shè)計(jì)迭代,以及一些低產(chǎn)量的特定應(yīng)用,或者用于培訓(xùn)和教學(xué)。它適合那些開發(fā)周期必須短的產(chǎn)品,也經(jīng)常用于ASIC的驗(yàn)證。
反正,大家記住,大規(guī)模出貨用于AI計(jì)算,一般不考慮FPGA。
所以,AI芯片,也就是GPU和ASIC之爭(zhēng)。
█ GPU和ASIC,到底誰(shuí)厲害?
ASIC作為專用定制芯片,基于芯片所面向的專項(xiàng)任務(wù)。它的計(jì)算能力和計(jì)算效率都是嚴(yán)格匹配于任務(wù)算法的。芯片的核心數(shù)量,邏輯計(jì)算單元和控制單元比例,以及緩存等,整個(gè)芯片架構(gòu),也是精確定制的。
所以,ASIC可以實(shí)現(xiàn)極致的體積、功耗。這類芯片的可靠性、保密性、算力、能效,都會(huì)比通用芯片(GPU)更強(qiáng)。
例如,在同等預(yù)算下,AWS的Trainium 2(ASIC芯片)可以比英偉達(dá)的H100 GPU更快速完成推理任務(wù),且性價(jià)比提高了30-40%。明年計(jì)劃推出的Trainium3,計(jì)算性能更是提高了2倍,能效提高40%。
但是,為什么這兩年一直火的都是GPU呢?
主要是因?yàn)橛ミ_(dá)太猛。
英偉達(dá)在AI上也是歪打正著。當(dāng)年AI大佬辛頓(就是那個(gè)新晉諾貝爾獎(jiǎng)得主)帶著徒弟使用GPU做AI訓(xùn)練,獲得巨大突破,才讓英偉達(dá)發(fā)現(xiàn)自己竟然還有這樣的潑天富貴。
然后,英偉達(dá)就開始在AI發(fā)力,拼命做更厲害的GPU(當(dāng)然,也有游戲的帶動(dòng))。
在英偉達(dá)的持續(xù)努力下,GPU的核心數(shù)和工作頻率一直在提升,芯片面積也越來(lái)越大。算力越強(qiáng),有利于縮短訓(xùn)練時(shí)間,加快產(chǎn)品發(fā)布,這也是重要優(yōu)勢(shì)。
當(dāng)然,算力變強(qiáng),功耗也水漲船高。但是,靠工藝制程、水冷等被動(dòng)散熱,勉強(qiáng)也能兜得住,反正不會(huì)燒掉。
除了硬件之外,英偉達(dá)在軟件和生態(tài)方面也很會(huì)布局。
他們搗鼓出來(lái)的CUDA(AI開發(fā)的軟件套件),是GPU的一個(gè)核心競(jìng)爭(zhēng)力?;贑UDA,初學(xué)者都可以很快上手。所以,英偉達(dá)的GPU方案,被全球用戶廣泛接受,形成了牢固的生態(tài)。
相比之下,F(xiàn)PGA和ASIC的開發(fā)還是太過(guò)復(fù)雜,不適合普及。
ASIC之所以在AI上干不過(guò)GPU,和它的高昂成本、超長(zhǎng)開發(fā)周期、巨大開發(fā)風(fēng)險(xiǎn)有很大關(guān)系?,F(xiàn)在AI算法變化很快,ASIC這種開發(fā)周期,很要命。
綜合上述原因,GPU才有了現(xiàn)在的大好局面。
值得一提的是,前面說(shuō)了,AI計(jì)算分為訓(xùn)練和推理兩種。訓(xùn)練任務(wù),需要更強(qiáng)大的算力,所以在AI訓(xùn)練上,廠商們主要以GPU為主。
推理任務(wù)的話,算力要求要低一點(diǎn),也不需要什么并行,所以GPU的算力優(yōu)勢(shì)沒(méi)那么明顯。很多企業(yè),就會(huì)開始采用更便宜、更省電的FPGA或ASIC,進(jìn)行計(jì)算。
這個(gè)情況,一直持續(xù)到了現(xiàn)在。AI芯片,GPU的占比能達(dá)到70%以上。
如今,因?yàn)榇蠹覍?shí)在是“苦英偉達(dá)久矣”,不想總被英偉達(dá)“卡脖子”,所以非常希望算力多元化。再有,大模型現(xiàn)在從“訓(xùn)練熱”走向了“推理熱”。推理類的AI計(jì)算需求增加,給了ASIC機(jī)會(huì)。
所以,扶持ASIC產(chǎn)業(yè)鏈,提升ASIC芯片在AI領(lǐng)域的占有率,成為了大家的共識(shí)。這才有了博通和Marvell股價(jià)的猛漲。(據(jù)說(shuō),博通正與三個(gè)大型客戶開發(fā)AI芯片,預(yù)計(jì)2025年AI芯片業(yè)務(wù)收入達(dá)到150億-200億美元。)
那么,取代就真的那么容易嗎?ASIC會(huì)很快淘汰掉GPU嗎?
顯然不是的。
憑借前面提到的性能、生態(tài)、集成能力等方面的優(yōu)勢(shì),英偉達(dá)的GPU仍然會(huì)是中短期內(nèi)的AI芯片首選。英偉達(dá)的軟硬件網(wǎng)絡(luò)整套方案都很成熟,技術(shù)和資金實(shí)力太強(qiáng),GPU的存量和出貨量依然很大,市場(chǎng)地位難以撼動(dòng)。
ASIC的崛起速度雖然很快,但仍需要一定的時(shí)間走向成熟。AI ASIC芯片的研發(fā),也具有很高的風(fēng)險(xiǎn)。即使研發(fā)成功,也需要時(shí)間被用戶所接受。
這就意味著,在很長(zhǎng)的一段時(shí)間內(nèi),GPU和ASIC都將處于共存狀態(tài)?;诓煌膱?chǎng)景,用戶會(huì)選擇最適合自己的芯片。發(fā)展自研ASIC,更多是有利于廠商們和英偉達(dá)進(jìn)行談判砍價(jià)。
未來(lái)的情況還是比較難預(yù)測(cè)的。量子計(jì)算是不是會(huì)對(duì)計(jì)算領(lǐng)域造成顛覆式影響,現(xiàn)在也是討論的熱點(diǎn)。
好了,以上就是今天文章的全部?jī)?nèi)容。感謝大家的耐心閱讀!