作者:九林
在數(shù)據(jù)中心需求增長的趨勢(shì)下,核心芯片的角逐越演越烈。各方力量不留余力的推動(dòng)自身數(shù)據(jù)中心的發(fā)展時(shí),服務(wù)器作為數(shù)據(jù)中心最核心的硬件,其芯片也備受關(guān)注。
早期的服務(wù)器芯片,由RISC架構(gòu)一統(tǒng)天下。后來隨著,英特爾推出X86架構(gòu),逐漸擠壓RISC處理器市場,在很長的一段時(shí)間內(nèi),AMD和英特爾都占據(jù)著服務(wù)器市場的主流,其中英特爾市場份額超過90%,AMD則吃掉剩下的部分。
多年來,業(yè)界一直在問:“ARM架構(gòu)能夠在數(shù)據(jù)中心覓得一席之地嗎?”
早年的折戟
ARM架構(gòu)進(jìn)攻服務(wù)器市場并非易事。ARM陣營進(jìn)入服務(wù)器芯片市場的謀劃已有多年,早在2008年,ARM就開始醞釀服務(wù)器芯片計(jì)劃,惠普、AMD、博通、高通等美國企業(yè)都曾發(fā)布過ARM架構(gòu)的服務(wù)器芯片,但全都折戟。
Calxeda早已倒閉,Applied Micro后來將ARM架構(gòu)服務(wù)器芯片業(yè)務(wù)賣掉,甚至連三星都在產(chǎn)品開發(fā)完成之前就終止了業(yè)務(wù),從服務(wù)器領(lǐng)域溜之大吉。
當(dāng)時(shí),很多人將這些公司失敗的原因歸結(jié)于性能。認(rèn)為ARM服務(wù)器芯片完全無法媲美x86競品的性能。但是在2018年,高通推出了首款A(yù)RM的高效服務(wù)器芯片Centriq 2400,最低40核,最高48核,基于三星10nm工藝打造。使用的是自研FalkorCPU核心,三緩為60MB,旗艦級(jí)價(jià)格為1995刀。
當(dāng)時(shí)高通號(hào)稱,當(dāng)運(yùn)行SPECint_2006時(shí),Centriq 2460性能比英特爾 Purley鉑金8160高出7%,芯片性能數(shù)據(jù)非常出色。
盡管高通還請(qǐng)來了阿里、鏗騰、安邁等巨頭撐腰,但一陣吵吵嚷嚷之后,最后也只有一家表示DDOS防御平臺(tái)從X86更換成了ARM。后來,高通宣布削減在“非核心”產(chǎn)品領(lǐng)域的支出,計(jì)劃關(guān)閉服務(wù)器芯片部門,而高通一手操辦服務(wù)器芯片的Anand Chandrasekher也離職了。
高通轟轟烈烈的ARM服務(wù)器芯片最終也以失敗結(jié)尾。
從性能角度來看,高通當(dāng)年推出的CPU不輸當(dāng)時(shí)的主流服務(wù)器芯片,但高通仍然失敗了。
這其中,一部分原因在于高通想要削減在“非核心”產(chǎn)品領(lǐng)域的支出,從而減少了在新領(lǐng)域探索的力度,但更大一部分原因在于當(dāng)時(shí)ARM服務(wù)器市場的生態(tài)尚未搭建成功。
直到2019年,ARM的Neoverse平臺(tái)路線圖的推出,其對(duì)服務(wù)器市場的滲透率開始有了實(shí)質(zhì)提升。2020年蘋果、微軟相繼宣布將發(fā)布基于ARM 的 PC 產(chǎn)品,華為鯤鵬、亞馬遜、Facebook等紛紛布局基于 ARM 的自研服務(wù)器芯片,完善ARM架構(gòu)生態(tài)。
隨著全球最大云計(jì)算亞馬遜在自己云計(jì)算的ARM架構(gòu)CPU Graviton真正部署起來,并且占到自己數(shù)據(jù)中心絕對(duì)量的20%時(shí),這才標(biāo)志著ARM架構(gòu)CPU在服務(wù)器行業(yè)上量的轉(zhuǎn)折。
崛起的背后
根據(jù)TrendForce數(shù)據(jù)預(yù)測(cè),隨著云數(shù)據(jù)中心的采用逐漸增長,預(yù)計(jì)到2025年,ARM架構(gòu)在數(shù)據(jù)中心服務(wù)器市場滲透率將達(dá)到22%。這個(gè)數(shù)據(jù)意味著基于ARM架構(gòu)的服務(wù)器,將在未來3年實(shí)現(xiàn)翻倍增長,這也意味著ARM將帶來不可逆的行業(yè)變化。
為什么曾經(jīng)使得眾多企業(yè)“折戟”的ARM服務(wù)器芯片,現(xiàn)在卻開始嶄露頭角?
這需要從三個(gè)方面來看:
第一個(gè)方面,是服務(wù)器芯片的巨大市場。服務(wù)器的市場就非常龐大,知名研究公司IDC的數(shù)據(jù)顯示,去年云計(jì)算基礎(chǔ)設(shè)施的總支出為739億美元,同比增長8.8%。彭博行業(yè)研究分析師曼迪普·辛格(Mandeep Singh)指出,僅數(shù)據(jù)中心處理器每年就能創(chuàng)造280億美元的收入。
巨大的服務(wù)器市場,需要的是巨額的服務(wù)器芯片。而在這個(gè)高端計(jì)算市場,單顆芯片的售價(jià)高達(dá)數(shù)千美元。以高通為例,目前,高通提供的手機(jī)芯片通常定價(jià)在幾十美元。相比之下,最高端的服務(wù)器處理器每顆芯片的價(jià)格超過1萬美元。這就是服務(wù)器芯片能夠帶來的巨額利潤,在這種情況下,類似高通的芯片廠商也希望能夠在服務(wù)器市場中分上一杯羹。
第二個(gè)方面,是ARM產(chǎn)品的最強(qiáng)優(yōu)勢(shì)——低功耗。在數(shù)據(jù)中心領(lǐng)域,功耗早就成為了一個(gè)重要的問題,隨著服務(wù)器群的擴(kuò)展,每個(gè)大服務(wù)器群都將消耗驚人的電量。眾所周知,ARM架構(gòu)正是憑借其低功耗的優(yōu)勢(shì),占領(lǐng)了手機(jī)領(lǐng)域的市場。
現(xiàn)在,憑借這一優(yōu)勢(shì),ARM同樣打入了云服務(wù)器廠商中。許多AWS的客戶表示,與現(xiàn)有英特爾、AMD的服務(wù)器CPU相比,他們租用基于ARM架構(gòu)的Graviton芯片節(jié)省了10%~40%的計(jì)算成本。
正因如此,ARM服務(wù)器芯片最先落地的領(lǐng)域就在云服務(wù)器廠商。對(duì)這些云計(jì)算廠商來說,能夠節(jié)省巨額的功耗,就能帶來不少的收益。
第三方面,是曾經(jīng)被詬病的性能。雖然,在過去的一段時(shí)間內(nèi),ARM架構(gòu)處理器性能沒有x86架構(gòu)處理器性能強(qiáng),甚至業(yè)內(nèi)一度認(rèn)為X86架構(gòu)芯片能夠輕而易舉的阻擋ARM架構(gòu)芯片。但是,現(xiàn)在ARM架構(gòu)處理器的性能已經(jīng)趕上甚至超越X86架構(gòu)處理器。
ARM單核的面積僅為 X86 核的 1/7,同樣芯片尺寸下可以繼承更多核心數(shù)。通過“堆核”的方式,使得ARM架構(gòu)處理器在性能快速提升下,也能保持較低的功耗。根據(jù)Ampere給出的數(shù)據(jù),其CPU的性能超越傳統(tǒng)x86處理器3倍,性能功耗比領(lǐng)先近4倍。與 x86 服務(wù)器CPU相比,Ampere Altra 系列可用50%的能耗,提供200%的性能。
ARM奔向戰(zhàn)場
近年來,ARM架構(gòu)的的興起下,許多巨頭紛紛開始自研ARM架構(gòu)的服務(wù)器芯片,包括國外的亞馬遜、谷歌甚至微軟,國內(nèi)的騰訊、阿里巴巴、華為等等都積極參與其中。
曾經(jīng)失敗的高通似乎也在嘗試再次進(jìn)軍服務(wù)器芯片市場,去年收購了芯片創(chuàng)業(yè)公司Nuvia,而Nuvia創(chuàng)立的目標(biāo)是打造高性能的ARM服務(wù)器芯片。
ARM的服務(wù)器芯片有三大目標(biāo)市場即云計(jì)算、HPC和邊緣計(jì)算。
云計(jì)算陣營
在云計(jì)算領(lǐng)域上,ARM可以說已經(jīng)取得了相對(duì)領(lǐng)先的成功。亞馬遜云、甲骨文云、Azure和阿里云等巨頭紛紛入局ARM云主機(jī)市場。
騰訊云在2021年底發(fā)布了CVM 標(biāo)準(zhǔn)型SR1服務(wù)器,可用于各種類型和規(guī)模的企業(yè)級(jí)應(yīng)用等。這款服務(wù)器吸引人的地方不在于其他配置,而是內(nèi)置的ARM處理器——2.8GHz的Ampere Altra處理器。根據(jù)相關(guān)評(píng)測(cè),SR1服務(wù)器的算力性價(jià)比超過了同等配置的S5(配置Intel至強(qiáng)Platinum 8255C CPU)服務(wù)器,最高有83%的性能提升。
去年,阿里旗下的平頭哥發(fā)布自研云芯片倚天 710,它基于 ARM 架構(gòu),官方稱之為 “全球性能領(lǐng)先的云原生處理芯片”,性能超過業(yè)界標(biāo)桿 20%,能效比提升 50% 以上。
作為少數(shù)IT服務(wù)商轉(zhuǎn)型而來的云廠商,華為云可以利用華為在服務(wù)器等硬件方面的優(yōu)勢(shì),可以提供基于華為鯤鵬芯片的ARM實(shí)例,作為自研的ARM主機(jī)提供商,華為與亞馬遜云和阿里云屬于一類,一方面可以靠鯤鵬生態(tài),一方面要靠華為服務(wù)行業(yè)的經(jīng)驗(yàn)。
2021年,UCloud也推出了基于Ampere Altra處理器的主機(jī),UCloud官方列出了與同等配置x86主機(jī)的價(jià)格差異,大致相差35%,應(yīng)用場景方面,包括各類數(shù)據(jù)庫系統(tǒng)、Redis集群、分布式開源存儲(chǔ)方案,安卓相關(guān)的仿真測(cè)試和開發(fā)測(cè)試,云手機(jī)以及嵌入式開發(fā)等。
此前一直沒有采用ARM芯片的谷歌云,在今年也宣布將開始采用基于ARM技術(shù)的芯片,使用將基于Ampere Computing的Altra芯片。
在較大的云廠商中,似乎只有IBM云,目前還沒有使用ARM架構(gòu)芯片。
當(dāng)然,也有的規(guī)模較小的云廠商覺得,現(xiàn)階段推出ARM主機(jī)的做法不劃算,并沒有推出ARM服務(wù)器的的打算,對(duì)于采用AMD的x86服務(wù)器倒是更熱衷一些,目前,還是x86的實(shí)用性更強(qiáng)一些。
自研也好,用第三方的ARM平臺(tái)也好,整體而言,ARM服務(wù)器的云浪潮開始涌起。
HPC陣營和邊緣計(jì)算陣營
在HPC方面,日本RIKEN實(shí)驗(yàn)室的“Fugaku”超級(jí)計(jì)算機(jī)憑借152064個(gè)48核富士通A64FX處理器位列世界第二。Fugaku使用的ARM架構(gòu)CPU,采用定制的ARM V8架構(gòu),依托7納米FinFET制程技術(shù)生產(chǎn)。浮點(diǎn)運(yùn)算部分是與ARM合作開發(fā)的SVE指令擴(kuò)展,使用512 bit浮點(diǎn)運(yùn)算單元,大幅強(qiáng)化運(yùn)算能力。
美國能源部下屬的桑迪亞國家實(shí)驗(yàn)室宣布建造ARM處理器的超算Astra,浮點(diǎn)性能達(dá)到2.3PFLOPS。
英偉達(dá)也推出主要面向大型數(shù)據(jù)密集型 HPC的Grace ,內(nèi)置下一代 ARM Neoverse 內(nèi)核,每個(gè)CPU能在 SPECrate2017_int_base 基準(zhǔn)測(cè)試中單位時(shí)間運(yùn)行超過 300 個(gè)實(shí)例。
邊緣計(jì)算方面,英偉達(dá)正擴(kuò)大與 Marvell 的合作,將基于 ARM 的 OCTEON DPU 與 GPU 相結(jié)合,加速 AI 工作負(fù)載,實(shí)現(xiàn)網(wǎng)絡(luò)優(yōu)化和安全。
實(shí)際上,ARM自身也在不斷推出助力芯片企業(yè)進(jìn)入高性能計(jì)算場景的平臺(tái),先后相繼推出了Neoverse V系列、Neoverse N系列和Neoverse E系列。
目前有三家國內(nèi)的初創(chuàng)公司正進(jìn)行基于Neoverse N2的相關(guān)產(chǎn)品開發(fā)。其中,遇賢微電子和鴻鈞微電子是致力于云原生服務(wù)器 CPU 的開發(fā),云豹智能則是針對(duì) DPU 領(lǐng)域。
總結(jié)
我國廠商在 ARM 生態(tài)中布局甚廣,華為鯤鵬和天津飛騰芯片均有 ARM 架構(gòu)臺(tái)式機(jī)和服務(wù)器芯片,ARM 生態(tài)整機(jī)廠商包括長城、浪潮、同方、曙光等,國產(chǎn)操作系統(tǒng)亦廣泛支持。
從服務(wù)器芯片的發(fā)展歷程來看,在2010年,很多企業(yè)只能采用X86芯片,經(jīng)過2010年到2020年的十年攻關(guān),完成了X86向ARM架構(gòu)的軟件移植?,F(xiàn)在,ARM憑借著自身優(yōu)勢(shì),開始在服務(wù)器領(lǐng)域沖鋒陷陣。