作者:鵬程
隨著聊天機(jī)器人和其他生成式AI應(yīng)用程序變得越來越流行,人們對AI推理的需求將呈指數(shù)級增長,該市場規(guī)模最終將達(dá)到數(shù)百億美元。AI芯片需求快速增長,市場規(guī)模增長顯著。
從谷歌的TPU、蘋果的M1和M2、微軟Maia 100和Cobalt 100、Meta的MTIA、亞馬遜的Trainium和Inferentia、特斯拉的Dojo,到英特爾的FPGA系列、AMD的MI300系列……
巨頭們一次次沖擊著英偉達(dá)的帝國圍墻。而在AI競速的大時(shí)代里,涌現(xiàn)了一大批初創(chuàng)GPU、AI芯片公司,這些從業(yè)者和科技廠商們無不在找尋突破口。全球初創(chuàng)企業(yè)如今正試圖證明它們可以在某些應(yīng)用領(lǐng)域提供比行業(yè)巨頭英偉達(dá)更好的芯片解決方案。
雖然英偉達(dá)的GPU繼續(xù)主導(dǎo)人工智能(AI)領(lǐng)域,但AI初創(chuàng)企業(yè)認(rèn)為,GPU的高能耗和龐大的設(shè)計(jì)留下了市場空隙,供新興企業(yè)填補(bǔ),希望分享AI技術(shù)繁榮帶來的利益。
?01、AI芯片技術(shù)層出不窮,初創(chuàng)公司大量涌現(xiàn)
AI芯片也被稱為AI加速器或計(jì)算卡,從廣義上講只要能夠運(yùn)行人工智能算法的芯片都叫作AI芯片。但是通常意義上的 AI 芯片指的是針對人工智能算法做了特殊加速設(shè)計(jì)的芯片。按技術(shù)架構(gòu)分類,AI芯片可分為CPU、GPU、FPGA、ASIC、神經(jīng)擬態(tài)芯片等。
CPU不適用于AI計(jì)算,但是在AI應(yīng)用領(lǐng)域也是必不可少,比較常見的是CPU+GPU,CPU+NPU等組合。GPU是一種通用型芯片,ASIC是一種專用型芯片,而FPGA則處于兩者之間,具有半定制化的特點(diǎn)。
CPU:CPU是馮諾依曼架構(gòu)下的處理器,在執(zhí)行計(jì)算任務(wù)過程中,數(shù)據(jù)需要先獲取并存入RAM,然后解碼獲得指令,然后在ALU計(jì)算模塊計(jì)算,最終將計(jì)算結(jié)果返回RAM。整個(gè)流程更強(qiáng)調(diào)控制和決策,在并行計(jì)算效率上有較大提升空間。
GPU:GPU最早用于圖像處理領(lǐng)域,減少了大量數(shù)據(jù)預(yù)取和決策模塊,增加了計(jì)算單元ALU的占比,從而在并行化計(jì)算效率上有較大優(yōu)勢。
FPGA:FPGA的設(shè)計(jì)使得計(jì)算邏輯十分靈活,它不像CPU和GPU那樣只能執(zhí)行編譯和匯編的內(nèi)容,F(xiàn)PGA因?yàn)閹缀鯖]有控制模塊,所有模塊都是ALU計(jì)算模塊,而且所有模塊都可定制開發(fā)。但這也是FPGA的主要缺陷,因?yàn)榫邆浜軓?qiáng)的靈活度,導(dǎo)致設(shè)計(jì)難度和復(fù)雜度較高。
ASIC:ASIC是專門針對某一領(lǐng)域設(shè)計(jì)的芯片,比如神經(jīng)網(wǎng)絡(luò)計(jì)算芯片NPU、Tensor計(jì)算芯片TPU等。因?yàn)槭轻槍μ囟I(lǐng)域定制,所以ASIC往往可以表現(xiàn)出比GPU和CPU更強(qiáng)的性能,ASIC也是目前國內(nèi)外許多AI芯片設(shè)計(jì)公司主要研究的方向,可以預(yù)見未來市面上會(huì)逐漸有大量AI領(lǐng)域的ASIC芯片出現(xiàn)。
神經(jīng)擬態(tài)芯片:神經(jīng)擬態(tài)計(jì)算是模擬生物神經(jīng)網(wǎng)絡(luò)的計(jì)算機(jī)制。神經(jīng)擬態(tài)計(jì)算從結(jié)構(gòu)層面去逼近大腦,其研究工作還可進(jìn)一步分為兩個(gè)層次,一是神經(jīng)網(wǎng)絡(luò)層面,與之相應(yīng)的是神經(jīng)擬態(tài)架構(gòu)和處理器。其邏輯結(jié)構(gòu)與傳統(tǒng)馮·諾依曼結(jié)構(gòu)不同:它的內(nèi)存、CPU 和通信部件完全集成在一起,因此信息的處理在本地進(jìn)行,克服了傳統(tǒng)計(jì)算機(jī)內(nèi)存與 CPU 之間的速度瓶頸問題。
按功能分類,可分為訓(xùn)練(training)和推理(inference)兩個(gè)環(huán)節(jié),對應(yīng)的AI芯片則分別是訓(xùn)練卡和推理卡。訓(xùn)練卡一般都可以作為推理卡使用,而推理卡努努力不在乎時(shí)間成本的情況下大部分也能作為訓(xùn)練卡使用,但通常不這么做。主要原因在于二者在架構(gòu)上就有很大的差別,推理芯片通常針對前向傳播過程進(jìn)行了高度優(yōu)化,以實(shí)現(xiàn)高效的預(yù)測和分類任務(wù)。因此,它們的架構(gòu)和指令集對于訓(xùn)練過程所需的大量參數(shù)更新和反向傳播操作支持能力就弱了很多。此外,訓(xùn)練芯片通常擁有更高的計(jì)算能力和內(nèi)存帶寬,以支持訓(xùn)練過程中的大量計(jì)算和數(shù)據(jù)處理。
相比之下,推理芯片通常會(huì)在計(jì)算資源和內(nèi)存帶寬方面受到一定的限制。同時(shí),二者支持的計(jì)算精度也通常不同,訓(xùn)練階段需要高精度計(jì)算,因此常用高精度浮點(diǎn)數(shù)如:fp32,而推理階段一般只需要int8就可以保證推理精度。
除了高帶寬高并行度外,就片內(nèi)片外的存儲(chǔ)空間而言訓(xùn)練芯片通常比較“大”,這是訓(xùn)練過程中通常需要大量的內(nèi)存來存儲(chǔ)訓(xùn)練數(shù)據(jù)、中間計(jì)算結(jié)果以及模型參數(shù)。相較而言推理芯片可能無法提供足夠的存儲(chǔ)容量來支持訓(xùn)練過程。AI浪潮席卷全球,一批AI初創(chuàng)新貴企業(yè)如雨后春筍般出現(xiàn),新技術(shù)新產(chǎn)品層出不窮。
近期,斯坦福大學(xué)的一份《2024年人工智能指數(shù)報(bào)告》中的數(shù)據(jù),展示了過去十年間AI初創(chuàng)公司活動(dòng)最多的15個(gè)國家。數(shù)據(jù)表明,美國、中國、英國、以色列等已成為全球AI創(chuàng)新領(lǐng)域的領(lǐng)先者。美國情況來看,美國AI初創(chuàng)企業(yè)涵蓋大模型公司Reka AI、DPU新貴DreamBig Semiconductor、規(guī)?;斯ぶ悄堋⒆詣?dòng)化機(jī)器學(xué)習(xí)平臺DataRobot、AI芯片設(shè)計(jì)新企Tenstorrent、軟件和機(jī)器人初創(chuàng)企業(yè)Bright Machines、AI芯片創(chuàng)企Etched.ai、訓(xùn)練AI模型新貴Scale AI、邊緣AI領(lǐng)軍企業(yè)Blaize、人工智能模型創(chuàng)企Augment、AI協(xié)助工具新企Cognition、硅光子創(chuàng)新企業(yè)Celestial AI、大模型開源企業(yè)Together AI等等。
中國方面在政策利好和市場急速發(fā)展下,一批AI創(chuàng)企殺出重圍,優(yōu)質(zhì)標(biāo)的包括大模型玩家商湯科技、百川智能、智譜AI、第四范式、Minimax稀宇科技等等,以及人工智能AIGC大模型零一萬物、通用人工智能研究月之暗面、多模態(tài)大模型企業(yè)智子引擎、視頻生產(chǎn)大模型愛詩科技、AI芯片新貴愛芯元智、人工智能視覺技術(shù)企業(yè)影譜科技等等。英國在AI領(lǐng)域有著悠久的歷史,幾十年來圍繞這個(gè)領(lǐng)域建立了豐富的生態(tài)系統(tǒng)。從艾倫·圖靈早期奠定AI領(lǐng)域基礎(chǔ)的工作,到世界級的研究機(jī)構(gòu)推動(dòng)AI技術(shù)的發(fā)展(如帝國理工學(xué)院、劍橋大學(xué)、愛丁堡大學(xué)、牛津大學(xué)、倫敦大學(xué)學(xué)院)以及2015年DeepMind的成立,英國一直是AI人才的重要聚集地。
深厚的AI研究歷史和頂尖的研究機(jī)構(gòu)使得英國成為AI人才重要聚集地。近年來,英國涌現(xiàn)了包括AI獨(dú)角獸Wayve、知識圖譜初創(chuàng)企業(yè)Oxford Semantic、AI語音客戶服務(wù)企業(yè)PolyAI、AI智能員工和軟件創(chuàng)企Artisan AI、大模型應(yīng)用創(chuàng)企Robin AI等。
以色列高科技行業(yè)發(fā)達(dá),AI初創(chuàng)企業(yè)包括有人工智能工具企業(yè)AI21、人工智能芯片明星企業(yè)Habana Labs、量子芯片企業(yè)Quantum、高性能微處理器公司NeoLogic、深度學(xué)習(xí)和人工智能解決方案架構(gòu)顛覆企業(yè)NeuReality、AI芯片冷卻革命者ZutaCore等等。
?02、行業(yè)巨頭大規(guī)模收購AI芯片初創(chuàng)公司
過去兩年,AI初創(chuàng)公司在資本市場上的表現(xiàn)可謂風(fēng)頭無兩,吸引了數(shù)十億美元的投資。然而,隨著市場對AI技術(shù)的懷疑情緒日益增長,加之生成式AI技術(shù)的高成本和長周期回報(bào)特性,在邁過前兩年的投資高峰熱潮后,AI新貴如今面臨新的融資危機(jī)。
就美國而言,過去一年,美國AI初創(chuàng)企業(yè)失敗率躍升了60%,盡管數(shù)十億美元的風(fēng)險(xiǎn)投資流入AI公司,但初創(chuàng)企業(yè)倒閉的數(shù)量仍在急劇上升,原因是相關(guān)AI企業(yè)創(chuàng)始人在2021-2022年科技繁榮時(shí)期籌集的資金近年來已經(jīng)耗費(fèi)大半。不止美國企業(yè)如此,全球AI新貴無疑都面臨著同樣困境。行業(yè)金融投資相關(guān)人士表示,短期大量資金涌入導(dǎo)致某些AI初創(chuàng)公司的估值過高,但是這些企業(yè)都面臨著巨大的風(fēng)險(xiǎn),如資金枯竭、投資回報(bào)率下降或市場飽和等。
目前,市場投資者已經(jīng)變得更加謹(jǐn)慎,開始評估AI初創(chuàng)公司的長期可行性和盈利能力,而不是僅僅基于其技術(shù)潛力進(jìn)行投資。與此同時(shí),AI頭部企業(yè)虎視眈眈,意圖吞下更多優(yōu)質(zhì)AI標(biāo)的,快速補(bǔ)充短板,以占領(lǐng)更大市場份額。一場AI芯片并購戰(zhàn),在AI新貴和頭部AI大企中悄然拉開。許多初創(chuàng)公司發(fā)現(xiàn)自己難以為繼,其中不少被迫選擇“賣身”求生。頭部企業(yè)通過收購AI初創(chuàng)公司,快速拓展產(chǎn)品線,布局新的技術(shù)和業(yè)務(wù),還消滅了潛在的競爭對手。AI芯片巨頭企業(yè)并購案正在爆發(fā)。
英偉達(dá):英國咨詢機(jī)構(gòu) Dealroom曾對英偉達(dá)2023年間的一級市場交易進(jìn)行了統(tǒng)計(jì),僅2023年英偉達(dá)就投資了超30家AI初創(chuàng)公司,融資總價(jià)值超過50億美元。投資過程中,英偉達(dá)似乎沒有排斥任何應(yīng)用場景,亦不在乎標(biāo)的的輪次與大小。無論是上游的通用大模型,中游的企業(yè)SaaS,下游的To C垂直應(yīng)用,還是大模型基礎(chǔ)設(shè)施建設(shè)中動(dòng)輒百億的B、C輪項(xiàng)目,To C端不到百萬的種子輪。而今年以來,英偉達(dá)投資的AI企業(yè)更是超17家,其中有兩筆投資所在輪次融資金額不低于10億美元。收購方面,英偉達(dá)則陸續(xù)收購了AI創(chuàng)企Run.ai、Deci。
AMD:過去一年時(shí)間里,AMD向十幾家AI公司投資了超過1.25億美元,其中包括Firework AI、AI數(shù)據(jù)平臺Scale AI等,另外還收購了Mipsology 、 Nod.ai等超7家AI公司,以擴(kuò)展AMD AI生態(tài)系統(tǒng)、支持合作伙伴,并提升AMD計(jì)算平臺的領(lǐng)導(dǎo)地位。近期該公司就有兩筆大手筆并購——49億美元收購服務(wù)器制造商ZT Systems,以及6.65億美元全現(xiàn)金收購歐洲最大的私人AI實(shí)驗(yàn)室Silo AI。不過AI巨頭的并購也非一帆風(fēng)順,特別是跨國并購面臨著各國巨大的反壟斷壓力。比如,英偉達(dá)曾嘗試以400億美元的巨額收購Arm,但由于全球監(jiān)管機(jī)構(gòu)的反對和市場擔(dān)憂,這筆交易最終以失敗告終。
?03、AI芯片初創(chuàng)公司前路如何?
當(dāng)下,AI初創(chuàng)公司面臨的主要困境在于,生成式AI的研發(fā)和維護(hù)需要數(shù)億美元的前期投資,而這些投資往往在短期內(nèi)難以獲得回報(bào)。許多初創(chuàng)公司發(fā)現(xiàn),他們根本沒有足夠的資源和渠道來實(shí)現(xiàn)這一目標(biāo)。
目前來看,投資者對于初創(chuàng)公司的耐心也在減少,越來越多投資者退出這場AI游戲,導(dǎo)致一些初創(chuàng)公司不得不尋找新的融資渠道和合作伙伴。比如一些AI芯片公司正在尋求IPO上市。而就在日前,AI芯片獨(dú)角獸燧原科技同中金公司簽署輔導(dǎo)協(xié)議,正式啟動(dòng)IPO進(jìn)程。
此前,燧原科技已經(jīng)完成了近70億元的融資,其中騰訊是最大的投資者之一,天眼查數(shù)據(jù)顯示,騰訊持股比例為20.4944%。值得注意的是,自燧原科技成立以來,騰訊已經(jīng)在公司的六輪融資中都有投資。通過IPO,企業(yè)可以向公眾發(fā)行股票融資,提供可觀的資金來源,有助于企業(yè)擴(kuò)大規(guī)模、增加投資,維持企業(yè)運(yùn)轉(zhuǎn)。
此外,一些AI芯片公司正在尋求合并,以應(yīng)對行業(yè)巨頭的巨大壓力。目前各國都意識到了AI芯片的重要性,AI芯片巨頭在跨國并購上收到了極大的限制。為了扶持本國企業(yè),各國政府一方面通過政策和資金扶持萌芽的AI芯片企業(yè)。另一方面,也在推動(dòng)這些公司之間的整合合并。日前,韓國國內(nèi)兩家人工智能(AI)芯片制造商Sapeon Korea和Rebellions簽署了正式合并協(xié)議。
合并后的新公司的價(jià)值預(yù)計(jì)將超過1萬億韓元(合7.438億美元),將成為代表韓國人工智能芯片產(chǎn)業(yè)的獨(dú)角獸企業(yè),并將在全球市場上具有更強(qiáng)的競爭力,最終能夠與英偉達(dá)、AMD等巨頭相抗衡。隨著AI技術(shù)的發(fā)展與普及,行業(yè)對高性能、低功耗的AI芯片的需求不斷增加,全球半導(dǎo)體企業(yè)將繼續(xù)在該領(lǐng)域展開激烈角逐。