網(wǎng)絡(luò)芯片哪家強(qiáng)?啟哥科普來幫忙!
網(wǎng)絡(luò)芯片這個概念,很多人看起來會覺得依稀平常,但其實都誤解了,它其實是個大類,不同的領(lǐng)域,不同設(shè)備上,不同的應(yīng)用場景,不同的通信方式,不同的互聯(lián)協(xié)議,以及不同的下游客戶,所謂的網(wǎng)絡(luò)芯片概念都是不同的!但是由于這個概念非常常見且容易理解,以致于很多人甚至專業(yè)的投資機(jī)構(gòu)都不覺得它很高精尖。
今天就打開了聊,徹底把這玩意兒給說清楚。
首先講一個十多年前的灑家的真實故事。
十多年前,灑家還是大學(xué)時代,利用寒暑假期,我會去杭州文三路電腦城的頤高旗艦廣場打零工,所謂打零工其實就是:老板,買電腦嗎?買電腦看一下!給您報個價?。?!
當(dāng)時還沒有現(xiàn)在這么發(fā)達(dá)的網(wǎng)購平臺,也沒有這么多懂行的人。當(dāng)時買一臺電腦要么就是品牌機(jī),要么就是自己組裝一臺。俗稱DIY。當(dāng)時品牌機(jī)都比較貴,不僅貴且性能拉胯, 除了CPU等表面功夫做足,其他配件全是偷工減料的垃圾貨。比如某想,6000多的主機(jī)里面奔騰4的CPU給你配一個VIA的主板,別人400內(nèi)存,它給你整個333的,還是單通道的,呵呵。
心疼錢想追求性價比的都是自己DIY電腦,所以那些年,你別說電腦城生意還是可以的。
但是畢竟懂行的少,不懂的居多,所以遇到不太懂的人,各位銷售人員想盡一切辦法宰上幾刀,也是現(xiàn)在俗稱的“奸商”行為,品牌機(jī)宰得,我為什么宰不得?
這些“奸商”銷售人員,一般臉上笑臉相迎,三分鐘熟絡(luò)后跟你稱兄道弟,等最后談總價的時候各種飆演技,“哎呀,這個價真的做不了,太低了,老板多少也留點利潤?”…………
實際上隨便怎么討價還價,總能想辦法宰一刀,實在遇到懂行的沒轍,直接跑過來跟你說,您要的XX顯卡沒有貨了,要不換個XX品牌,反正一樣的價格,都是9600顯卡,都是256M顯存,但凡你一點頭,算了算了,換一個就換一個,懂的都懂,這一換就是300+的利潤差價。
反正憑借我人畜無害的長相且真誠的嘴臉,以及專業(yè)的硬件知識(十三年《微信計算機(jī)》老粉),再加上天花亂墜的忽悠本事,于是年紀(jì)輕輕就走上了“奸商”的道路,而且還是頂級奸商。甚至很多被我宰過的客戶居然還記得我的好,覺得我比較實誠,甚至還有回頭客戶!這就是做銷售的最高境界,各位,學(xué)著點!
打住,今天不是來裝X的。
當(dāng)年,那個大部分電腦都還是10M網(wǎng)絡(luò)口的時候,我記得我賣過一塊英特爾的千兆網(wǎng)卡。
當(dāng)時是一個有點懂,但是又不是很懂的人,來配臺公司用的服務(wù)器。當(dāng)時戴爾,惠普,IBM的服務(wù)器巨貴無比,小公司當(dāng)然是用不起的,于是選擇自己配。
我還記得當(dāng)時用的英特爾的志強(qiáng)CPU,ECC內(nèi)存,以及15000轉(zhuǎn)機(jī)械硬盤,然后我發(fā)現(xiàn),當(dāng)時配的所謂華碩的服務(wù)器主板,居然不是千兆網(wǎng)卡是百兆的!然后我靈機(jī)一動,一堆專業(yè)術(shù)語一頓忽悠之下,最后他加了一塊英特爾的千兆網(wǎng)卡,由于這塊網(wǎng)卡非常冷門,一般電腦商家哪懂這個?也問不到價格,屬于最不透明那種,進(jìn)價大概2000多,最后賣他4800,因此就這塊千兆網(wǎng)卡的利潤比其他幾個部件加一起都賺的多!
那次也是我第一次知道,原來英特爾除了CPU,還做網(wǎng)卡這玩意兒。(微軟:我他媽還做鼠標(biāo)呢,IE3.0紅光鯊聽說過閥?。?/p>
后來打工賺來的錢,我買了一個微軟IE3.0鼠標(biāo)用于提高我CS競技水平
所以今天從服務(wù)器網(wǎng)卡開始,一邊講行業(yè),一邊講技術(shù),今天把網(wǎng)絡(luò)芯片徹底聊透!
服務(wù)器端:從網(wǎng)卡到DPU的發(fā)展歷程
一個大型計算機(jī)中心,有著各種各樣的設(shè)備,比如服務(wù)器,網(wǎng)絡(luò)交換機(jī),路由器,它們在行業(yè)內(nèi)統(tǒng)稱ICT,即信息,通信和技術(shù)三個單詞首字母。
它是一個涵蓋性術(shù)語,覆蓋所有通信設(shè)備,應(yīng)用軟件等。
它的上游主要核心硬件就是集成電路行業(yè)的各種芯片,包括網(wǎng)絡(luò)芯片,計算芯片,存儲芯片,內(nèi)存芯片,以及各種配套的電源管理IC,PCB板,電容電感等各種被動件在內(nèi)的電子元器件。
中游就是IT基礎(chǔ)設(shè)備,比如服務(wù)器,大型存儲設(shè)備,交換機(jī),路由器,網(wǎng)關(guān),防火墻,基站等…………以及圍繞這些硬件的設(shè)備制造商,比如中科曙光,浪潮信息,還有菲菱科思這種做網(wǎng)絡(luò)設(shè)備代工的公司。
然后下游就是運營管理這些設(shè)備的服務(wù)商,比如數(shù)據(jù)中心服務(wù)商,云計算服務(wù)商,IaaS運營商,電信運營商等。
終端客戶都是to G,to B,to C的各類用戶,比如電信業(yè),政府,銀行,金融業(yè),各種互聯(lián)網(wǎng)企業(yè),以及消費者等等。
近年來隨著我國經(jīng)濟(jì)的不斷發(fā)展及各行業(yè)信息化建設(shè)推進(jìn),我國ICT技術(shù)行業(yè)市場規(guī)模不斷擴(kuò)大。根據(jù)數(shù)據(jù)顯示,中國ICT技術(shù)市場規(guī)模從2017年的4.4萬億元上漲至2022年的5萬億元。同比2021年增長1.21%。
先聊服務(wù)器。
服務(wù)器上的基本結(jié)構(gòu)其實和個人PC差不多,它由一堆CPU,GPU、GPGPU,推理運算單元,AI運算單元等各種高性能計算芯片,外加一堆外圍的如主板北橋芯片,南橋芯片,電源管理IC, 模擬芯片,當(dāng)然還有重要的外部通信接口,就是由各種網(wǎng)卡芯片組成。
以前服務(wù)器用用千兆,萬兆網(wǎng)卡,隨著數(shù)據(jù)量越大越大,現(xiàn)在高端的都是光模塊,從25G到400G不等,未來甚至有800G,1.6T,可見半導(dǎo)體下游應(yīng)用中,通信細(xì)分排第一不是沒有道理的,畢竟我們身處信息社會中。
這個網(wǎng)卡,以前叫NIC,即基礎(chǔ)網(wǎng)卡,或者叫以太網(wǎng)控制器,網(wǎng)絡(luò)適配器,它以有線網(wǎng)線和其他網(wǎng)絡(luò)設(shè)備連接,因為價格便宜而且以太網(wǎng)標(biāo)準(zhǔn)普遍存在,應(yīng)用非常廣泛。
前面我當(dāng)奸商的小故事里,賣的英特爾千兆網(wǎng)卡的就是這個。
在國內(nèi)這是一個80-100億市場的規(guī)模,并且還以年均增長13.5%左右的增速和國內(nèi)2000多億的服務(wù)器市場遙相呼應(yīng)。
隨著公有云中虛擬化技術(shù)的發(fā)展以及軟件定義網(wǎng)絡(luò)(SDN)技術(shù)的興起,對端系統(tǒng)協(xié)議棧提出了更高的要求,而傳統(tǒng)的高性能網(wǎng)卡已經(jīng)難以滿足這些要求。所以,智能網(wǎng)卡(Smart NIC)技術(shù)逐漸發(fā)展起來。不同于傳統(tǒng)網(wǎng)卡,智能網(wǎng)卡同時具備高性能及可編程的能力,既能處理高速的網(wǎng)絡(luò)數(shù)據(jù)流,又能對網(wǎng)卡進(jìn)行編程,實現(xiàn)定制化的處理邏輯。
和傳統(tǒng)網(wǎng)卡相比,智能網(wǎng)卡有了很大的變化。其中硬件中普遍卸載了部分傳輸層和路由層的處理邏輯,如校驗和計算、傳輸層分片重組等,來減輕CPU的處理負(fù)擔(dān)。甚至有些網(wǎng)卡如RDMA網(wǎng)卡還將整個傳輸層的處理都卸載到網(wǎng)卡硬件上,以完全解放CPU。得益于這些硬件卸載技術(shù),服務(wù)器端系統(tǒng)的網(wǎng)絡(luò)協(xié)議棧處理才能與現(xiàn)有的高速網(wǎng)絡(luò)相匹配。
不同的加速工作負(fù)載,智能網(wǎng)卡又分成基本連接型NIC,面向網(wǎng)路加速型的智能網(wǎng)卡,以及面向存儲加速型的智能網(wǎng)卡等。
智能網(wǎng)卡的內(nèi)部結(jié)構(gòu)方案也五花八門,有多個CPU組合的ASIC,有基于FPGA(可編程門整列)的,或者是FPGA+ASIC的方案。
這個存儲加速型的方向我特別看好,后面細(xì)聊。
再往下一代就是現(xiàn)在炒的火熱的DPU?。?!
DPU,也就是Date Processing Unit ,也就是數(shù)據(jù)處理器。
它和CPU,GPU/GPGPU不同的是,專門針對大型算力中心的網(wǎng)絡(luò)信息處理進(jìn)行優(yōu)化。
在數(shù)據(jù)中心里,時時刻刻都有大量的數(shù)據(jù)在進(jìn)行傳輸。主機(jī)在收發(fā)數(shù)據(jù)時,需要進(jìn)行海量的網(wǎng)絡(luò)協(xié)議處理。根據(jù)傳統(tǒng)的計算架構(gòu),這些協(xié)議處理都是由CPU完成的。
有人統(tǒng)計過,想要線速處理10G(萬兆)的網(wǎng)絡(luò),需要的約4個英特爾志強(qiáng)CPU的核。也就是說,僅僅是進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)包的處理,就要占用個8核CPU的一半滿負(fù)荷時候的算力?,F(xiàn)在數(shù)據(jù)中心網(wǎng)絡(luò)不斷升級,從10G到40G 、100G,400G,以及未來還有800G,1.6T的網(wǎng)絡(luò)速率,這些性能開銷顯然是承受不起的。把大量寶貴的CPU運算資源浪費在這上面,顯然是毫無必要的,所以就有把網(wǎng)絡(luò)處理協(xié)議先從CPU“卸載”到智能網(wǎng)卡上,分擔(dān)CPU負(fù)荷這樣的操作。2015年,云計算廠商AWS就率先使用這種智能網(wǎng)卡,同步他們也收購了Annapurna LABS公司,并于2017年推出Nitro系統(tǒng)。同年阿里云也搞出了類似功能的神龍(X-Dragon)架構(gòu)。
再然后的故事大家都知道。2019年3月,英偉達(dá)花費69億美金的巨資收購了以色列芯片公司Mellanox(麥洛斯)。英偉達(dá)將 Mellanox 的 ConnectX 系列高速網(wǎng)卡技術(shù)與自己的已有技術(shù)相結(jié)合,于2020年正式推出了兩款 DPU 產(chǎn)品:BlueField-2 DPU 和 BlueField-2X DPU 。因此2020年也稱為DPU元年,之后國內(nèi)的DPU初創(chuàng)公司如雨后春筍一般冒出來,扎堆DPU領(lǐng)域。從某種角度上來講,DPU也可以說是智能網(wǎng)卡的擴(kuò)展升級版。
DPU在智能網(wǎng)卡的基礎(chǔ)上,將存儲,安全,虛擬化等工作從CPU上“卸載”然后加載到自己身上,等于把CPU從部分繁重且和計算沒關(guān)系的工作拆出來,讓DPU來處理。
綜上所述,DPU 芯片的作用本質(zhì),就是卸載、加速和隔離——把 CPU 的部分工作卸載到自己身上;利用自己的算力特長,對這些工作進(jìn)行加速運算,整個過程實現(xiàn)了計算的隔離,增加性能,減輕CPU的負(fù)荷。所以有人說DPU也是大型服務(wù)器中心的三大U,CPU,GPU/GPGPU,DPU,也對。
下面這個圖應(yīng)該非常清楚了。
到現(xiàn)在為了配合Ai和加速計算而設(shè)計的DPU,DPU針對多用戶,云生態(tài)環(huán)境進(jìn)行各種優(yōu)化,提供數(shù)據(jù)中心級的軟件定義和硬件加速的網(wǎng)絡(luò)、存儲、安全和管理的等各種服務(wù)。
到2025年,有專業(yè)機(jī)構(gòu)預(yù)測這個DPU,有望超過120億美金的市場空間!
在這個領(lǐng)域,國內(nèi)國外公司就非常多了,包括英特爾,英偉達(dá)(?Mellanox),博通,還有微軟,亞馬遜,Marvell等。當(dāng)然主要就是英特爾,英偉達(dá),博通這三家。國內(nèi)目前這類公司也不少,比如云豹智能,網(wǎng)迅,星云智聯(lián),芯啟源,中科馭數(shù),無錫沐創(chuàng),大禹智芯,云脈芯聯(lián),江蘇為是,賽芯半導(dǎo)體,楠菲微電子,以及上市公司*ST左江(300799)?。?!
總結(jié),過去服務(wù)器都是用普通的千兆,萬兆網(wǎng)卡的那就是用NIC網(wǎng)絡(luò)適配器,俗稱網(wǎng)卡芯片。之后開始升級,出現(xiàn)了智能網(wǎng)卡分擔(dān)一部分CPU的功能,到現(xiàn)在出現(xiàn)DPU,實現(xiàn)更多功能,至于連接方式,也早不再是網(wǎng)線,而是光纖。
兩幅圖幫助各位理解:
DPU的定位。
網(wǎng)卡僅僅是承擔(dān)了網(wǎng)絡(luò)連接功能服務(wù)器端的網(wǎng)絡(luò)芯片就講到這里。
網(wǎng)絡(luò)設(shè)備端:路由,交換與無線設(shè)備的心臟!
網(wǎng)絡(luò)設(shè)備就是指各種路由器,交換機(jī),以及無線設(shè)備。
這些設(shè)備是整個網(wǎng)絡(luò)的核心硬件,它通過使用數(shù)據(jù)包交換來接受數(shù)據(jù),轉(zhuǎn)發(fā)數(shù)據(jù)來到計算機(jī)網(wǎng)絡(luò)里指定的設(shè)備上。在整個網(wǎng)絡(luò)設(shè)備,交換機(jī)規(guī)模排第一,大概占56%,其次是路由器占比為約30%,其余是網(wǎng)絡(luò)無線設(shè)備占比約14%。在交換機(jī)領(lǐng)域,有家大家都非常熟悉的美國公司,Cisco,思科。
我當(dāng)年參加過CCNA的認(rèn)證考試(思科網(wǎng)絡(luò)工程師的資格認(rèn)證考試,有初級CCNA,中級CCNP,高級專家CCIE三種),為了敲這篇文章,把我書架上灰都三尺后的這本書拿出來,再好好地復(fù)習(xí)了一遍!看在我如此認(rèn)真的份上,各位記得打個賞。
交換機(jī)領(lǐng)域經(jīng)過這些年的發(fā)展,其實國內(nèi)外競爭格局非常穩(wěn)定。國外就是思科,Arista,HPE惠普這些。其中思科獨霸全球市場40%以上;Arista排第二,國內(nèi)互聯(lián)網(wǎng)公司也有不少用它的設(shè)備,因此國內(nèi)也有一定的市場份額;HPE惠普主要是服務(wù)器市場多,交換機(jī)不多,但是由于收購了Aruba Networks(阿魯巴),在企業(yè)級無線領(lǐng)域有一定的占有率。而國內(nèi),華為+新華三+銳捷三兩家則占了90%左右的市場份額,其余幾家分剩下的那點市場份額。華為,新華三不說了,國內(nèi)占主導(dǎo)地位。銳捷以前專注教育網(wǎng),在醫(yī)療網(wǎng)絡(luò)也比較厲害,現(xiàn)在也往B端客戶,如數(shù)據(jù)中心,服務(wù)器中心,互聯(lián)網(wǎng)企業(yè)此類客戶去切。
此外就是中興,但是中興的交換機(jī)不是強(qiáng)項,它的強(qiáng)項是無線基站,固定網(wǎng)絡(luò)通信,家里的FTTH,光纖到家光貓,以及中心匯聚那些。新華三歷史上換過多次大股東,從華為+3COM的合資公司,到惠普,再到紫光,最近紫光股份想收255億收購剩余的股份但被暫緩。
講完交換機(jī)再講路由器的格局。
在路由器領(lǐng)域,基本就是思科和華為兩家,處于寡頭壟斷,兩家加一起占了60%的份額,其他就是瞻博(Juniper),新華三分剩下的,零零散散還有烽火通信,騰達(dá),TP-LINK(普聯(lián))等公司主要是消費級市場,家用為主,在大企業(yè)端市場基本沒有存在感。
在無線領(lǐng)域,又分兩部分,第一是基站側(cè),傳統(tǒng)電信運營商那種就是華為,諾基亞,愛立信,中興等傳統(tǒng)電信設(shè)備巨頭;Wifi端包括企業(yè)級就是思科,華為,銳捷,中興,以及收了阿魯巴的惠普,而消費級就是普聯(lián)技術(shù),D-LINK,Netgate網(wǎng)件這種,這個太多了按下不表。隨著Ai計算,數(shù)據(jù)中心,大型服務(wù)器的崛起,這個網(wǎng)絡(luò)硬件領(lǐng)域變的越來越重要,特別是交換機(jī)。9月11日,IDC發(fā)布數(shù)據(jù)顯示,2023年第二季度,全球以太網(wǎng)交換機(jī)市場收入同比增長38.4%,達(dá)到118億美元,算是一個快速增長的市場。光大證券發(fā)布研究報告稱,隨著數(shù)據(jù)流量增長,高帶寬業(yè)務(wù)開展和部署對網(wǎng)絡(luò)設(shè)備要求增多,交換機(jī)由集線器(一層交換機(jī))升級為第四代多業(yè)務(wù)產(chǎn)品,數(shù)據(jù)中心場景由于東西向流量占據(jù)主流葉脊網(wǎng)絡(luò)架構(gòu)取代傳統(tǒng)三層網(wǎng)絡(luò)架構(gòu),AI大模型訓(xùn)練南北向流量增加,或驅(qū)動向“Fat-Tree”架構(gòu)轉(zhuǎn)變,增加交換機(jī)使用數(shù)量,交換機(jī)在數(shù)據(jù)中心市場迎來巨大發(fā)展空間。所以從行業(yè)發(fā)展趨勢來看,交換機(jī)市場是最大的增量紅利!
了解完這個行業(yè)大概之后,再來聊聊設(shè)備里的芯片。先從交換機(jī)的核心心臟——交換機(jī)芯片,Switch Chip!
交換機(jī)的心臟
以太網(wǎng)交換設(shè)備在邏輯層次上遵從 OSI 模型開放式通信系統(tǒng)互聯(lián)參考模型,包括物理層,數(shù)據(jù)鏈路層,網(wǎng)絡(luò)層,傳輸層,會話層,表示層,應(yīng)用層,一共7層。對,學(xué)過網(wǎng)絡(luò)的小伙伴對這個一定不陌生,這個就是OSI 7層模型。
以前交換機(jī)主要工作在物理層、數(shù)據(jù)鏈路層這兩層上;而路由器則工作在網(wǎng)絡(luò)層和傳輸層上。
但是現(xiàn)在交換機(jī)和路由器定位也逐漸模糊?,F(xiàn)在很多數(shù)據(jù)中心,如果也不是單純用幾個大型路由器組網(wǎng),這樣成本太高了?,F(xiàn)在做交換機(jī)設(shè)備的公司,會把部分帶有路由功能芯片裝入交換機(jī)里面,比如在思科在自己的交換機(jī)里面加上博通的芯片,讓交換機(jī)具有一定的路由功能,這樣客戶側(cè)組網(wǎng)的成本會大大降低,特別是那些互聯(lián)網(wǎng)公司已經(jīng)不再單純依賴路由器組網(wǎng),而是選擇使用帶有路由功能的交換機(jī)組網(wǎng)來降低硬件投入成本。
當(dāng)然,傳統(tǒng)電信公司還是走傳統(tǒng)路線,該用啥用啥,但是不可否認(rèn)的是交換機(jī)功能越來越強(qiáng)大,市場份額也在擴(kuò)大。思科之前收購過一家澳大利亞的FPGA的芯片公司, Exablaze,并把它芯片用于自家交換機(jī)上,等于交換機(jī)內(nèi)部帶有編程功能,可以在物理層做低延遲,優(yōu)化過后特別適用于期貨,證券交易這類客戶,因此這個各領(lǐng)域思科還是很有競爭力的。以太網(wǎng)交換設(shè)備擁有一條高帶寬的背部總線和內(nèi)部交換矩陣,在同一時刻可進(jìn)行多個端口對之間的數(shù)據(jù)傳輸和數(shù)據(jù)報文處理。
MicroChip??KSZ8563RNX的內(nèi)部結(jié)構(gòu)
為了實現(xiàn)這些功能,一個交換機(jī)里包括以太網(wǎng)交換芯片,CPU,PHY芯片,接口/端口等各種芯片和元件組成,當(dāng)然帶高級路由功能的交換機(jī),更復(fù)雜,還有帶FPGA,路由芯片之類的東西。
這是一個AR8327的網(wǎng)絡(luò)交換機(jī)芯片,高通的,來舉例。
這上面一共7個端口,其中1-5接了PHY芯片,這些端口只接終端設(shè)備;端口0和端口6屬于靈活部署,可接PHY,也可以接MAC,這兩個端口可以根據(jù)開發(fā)者需求自己定義,修改CPU可以自定義的端口。
以太網(wǎng)交換芯片為用于交換處理大量數(shù)據(jù)及報文轉(zhuǎn)發(fā)的專用芯片,是針對網(wǎng)絡(luò)應(yīng)用優(yōu)化的專用集成電路。以太網(wǎng)交換芯片內(nèi)部的邏輯通路由數(shù)百個特性集合組成,在協(xié)同工作的同時保持極高的數(shù)據(jù)處理能力,因此其架構(gòu)實現(xiàn)具有復(fù)雜性;CPU 是用來管理登錄、協(xié)議交互的控制的通用芯片;PHY 用于處理電接口的物理層數(shù)據(jù)。也有部分高端的把以太網(wǎng)交換芯片將 CPU、PHY 集成在以太網(wǎng)交換芯片內(nèi)部,形成一顆大核SoC方案。
交換機(jī)SoC芯片好壞,直接決定了交換機(jī)性能,畢竟核心芯片支持交換機(jī)最大能支持多少端口速率,是百兆,還是千兆,萬兆,還是25G,100G?性能區(qū)別非常大。
其次交換機(jī)主要功能是提供子網(wǎng)內(nèi)的高性能和低延時交換,而高性能交換的功能主要由交換芯片完成。同時由于交換機(jī)的部署 節(jié)點多、規(guī)模大,需要交換機(jī)具備更低的功耗、和更低的成本,對交換芯片功耗和成本提出了更高的要求。
就當(dāng)下而言,由于近幾年數(shù)字經(jīng)濟(jì)的高速發(fā)展,推動了云計算,大數(shù)據(jù),物聯(lián)網(wǎng),人工智能,大型算力中心的發(fā)展,這些對網(wǎng)絡(luò)帶寬提出了新的要求,100G以上的以太網(wǎng)交換機(jī)芯片增多,400G會成為下一代主流,因此誰能研發(fā)出高端的交換機(jī)芯片,誰就在未來具有核心競爭力。這個領(lǐng)域根據(jù)不同的客戶有不同的商業(yè)模式,這個領(lǐng)域交換機(jī)分為品牌交換機(jī),裸機(jī)交換機(jī),和白盒交換機(jī)。品牌機(jī),就是思科,華為,HPE惠普這類;
裸機(jī)交換機(jī),主要中國臺灣的企業(yè),比如Accton,Quanta QCT,Alpha Networks,Delta此類ODM公司。
白盒交換機(jī)相當(dāng)于買了裸機(jī)交換機(jī)和一個操作系統(tǒng),買回去你自己折騰,這類廠商有Juniper,Arista,銳捷等。這些廠家中,有些實力強(qiáng), 核心芯片用的是自研的芯片;有些實力弱,只能用第三方的芯片方案,當(dāng)然也有根據(jù)不同系列高低檔次產(chǎn)品,自家的和第三方的搭配使用。巨頭思科、華為等大公司,當(dāng)然都是自研芯片用于自家交換機(jī)上,其他廠商外購第三方廠商以太網(wǎng)交換芯片為主,這些多在白牌上比較常見。這種商業(yè)格局點類似SSD主控芯片領(lǐng)域。原廠如三星,海力士都有自己的主控芯片,但是也有慧榮,聯(lián)蕓,得一微,英韌,鵬鈦,國科微,這種三方的SSD主控方案商,在其他普通品牌上常見,反正各有各的市場和客戶群,憑自己本事賺錢。國內(nèi)剛剛上市的盛科通信(688702),就是干這個的,屬于第三方芯片方案商,賣給類似新華三,銳捷這樣的客戶。
來自盛科通信的IPO資料
當(dāng)然國內(nèi)在這個領(lǐng)域除了華為,基本就是弟弟。因為國外有巨無霸博通,此外還有barefoot,這家公司2019年被英特爾收購,還有Innovium,今年8月被Marvell以11億美金收購了,中低端市場還有“小螃蟹”,Realtek。因此這個領(lǐng)域占主導(dǎo)的要么就是自研型的思科,華為,要么就是三方大公司博通,Marvell,英特爾,國內(nèi)公司除華為之外目前無論技術(shù)實力還是市占率離國外大公司還是有些差距。交換機(jī)里的CPU就沒啥好說的,主要就是英格爾和AMD,兩家CPU巨頭,不過國內(nèi)目前也在力爭上游,有用ARM構(gòu)架的,RISC-V構(gòu)架的基于各種構(gòu)架在開發(fā)的各種CPU,還有用FPGA類芯片來滿足特定的功能。
然后配套CPU的還有各種存儲,包括各種DRAM,以及Nor FLASH之類的東西。
此外就是PHY芯片。
PHY芯片是物理層子系統(tǒng),它負(fù)責(zé)將鏈路層設(shè)備(如交換芯片)連接到物理介質(zhì)(如光纖,或普通網(wǎng)線),并將鏈路上的模擬信號轉(zhuǎn)化為數(shù)字化的以太網(wǎng)幀。在PHY芯片上,還有端口子系統(tǒng),端口子系統(tǒng)負(fù)責(zé)讀取端口配置、檢測已安裝端口的類型、初始化端口以及為端口提供與PHY芯片交互的接口。說白了,PHY芯片就是一個轉(zhuǎn)換接口芯片,屬于數(shù)模混合類芯片。懂的都懂,涉及數(shù)模轉(zhuǎn)換的都不簡單,盡管看起來不起眼,但是要做好還真的挺難!
對,這個上市公司裕太微(688515)就是干這個PHY芯片的活,此外還有景略半導(dǎo)體之類初創(chuàng)公司,其他還有一些大大小小的初創(chuàng)公司,比如杭州的鵬瞰,他們是搞的是機(jī)器人內(nèi)部的總線通信芯片。當(dāng)然裕太微不止做交換機(jī)PHY,它還有其他網(wǎng)絡(luò)上用的PHY芯片,比如車載網(wǎng)絡(luò)的PHY芯片。
這里多提一句,裕太微和盛科通信未來基本面的問題。雖然裕太微的PHY芯片沒有盛科通信做的交換機(jī)核心芯片這么高大上,也不如無錫沐創(chuàng),楠菲微電子那樣玩服務(wù)器的智能網(wǎng)卡芯片,以后能講DPU的故事,前景看起來非常牛逼,因此裕太微看起來似乎成長空間有限。但是反過來說,裕太微只要當(dāng)好小弟,做好PHY芯片就能活下去,等一個汽車的機(jī)會,畢竟汽車上才是大賽道!因為灑家認(rèn)為以后汽車總線構(gòu)架必然大改,博世主導(dǎo)的CAN構(gòu)架根本不適應(yīng)未來汽車智能化演進(jìn)方向,因為它速率實在太慢了,以后車載以太網(wǎng)構(gòu)架將會成為主流,這裕太微機(jī)會不就來了么!反觀盛科通信,在信息技術(shù)時代,國產(chǎn)化,安全化太重要了,“棱鏡門”竊聽事件歷歷在目,網(wǎng)絡(luò)芯片安全性非常重要,都必須得用國產(chǎn)芯片,所以盛科的短期基本面沒有任何問題,無憂無慮,但是遠(yuǎn)期來看競爭格局確實有尷尬之處。打個比方,盛科現(xiàn)有的客戶新華三,銳捷會不會考慮自研?假如自研就比較尷尬了,豈不是有被邊緣化的風(fēng)險了?而且在終端市場上華為又比較強(qiáng)勢,新華三和銳捷以后能不能和華為保持三足鼎立的態(tài)勢?假如頂不住華為的強(qiáng)勢進(jìn)攻,市場份額被華為占了,那盛科咋辦?這不是唇亡齒寒的故事么。所以這個問題留給各位思考,手動狗頭,我只是假設(shè)說的,不是故意唱黑盛科也不是吹捧裕太微,盛科的粉絲別來打我。有人問,網(wǎng)絡(luò)芯片里最重要的都講差不多了,炒火熱的光模塊在哪里?
簡聊光模塊
光模塊在前文提到的服務(wù)器和網(wǎng)絡(luò)設(shè)備上都有,目前高端的光模塊從10G開始,25G,100G,400G,800G,以及未來的1.6T都用的是光口通信,而低端的1G(千兆),10G(萬兆),多用普通網(wǎng)線口俗稱電口通信。
所以現(xiàn)在電口和光口,可謂涇渭分明,電口也就是普通網(wǎng)絡(luò)口,普通網(wǎng)絡(luò),PC,小企業(yè),消費級用;大型計算機(jī)中心,云計算中心,服務(wù)器中心,電信級運營商,都是用光口,也就是光模塊通信。
說起光模塊,我相信很多小伙伴都紛紛表示,這個我熟!
畢竟上半年A股光模塊的主線,高潮迭起,相信各位賺到盆滿缽滿!比如中際旭創(chuàng),新易盛這種大牛股。我就簡單說幾句。
光模塊和前面提到的普通網(wǎng)線口其實基本功能差不多,但是速度快很多,主要用于大型服務(wù)器中心的數(shù)據(jù)交互,它也是工作在OSI的物理層上。
光模塊里最重要的就是光發(fā)射和光接收芯片,此外還有各種無源被動件,放大器,驅(qū)動,CDR,調(diào)制解調(diào)等等。
在光發(fā)射由于使用的發(fā)光芯片不同,又分為比如半導(dǎo)體激光器LD,發(fā)光二極管LED,還有垂直腔體發(fā)射的VCSEL,甚至還有法布里FP,分布式反饋激光器DFB,電吸收調(diào)制激光器EML等等等。發(fā)射類型又分邊射型(EEL)和VCSEL垂直發(fā)射型。
接收端,主要是就是PIN結(jié)型二極管 ,以及APD雪崩二極管這種光探測芯片。
在光發(fā)射芯片材料,基本都是磷化銦(InP),砷化鎵(GaAs),甚至還有氮化鎵(GaN)等,主要是由3-5族的化合物半導(dǎo)體材料制造。而光接收,也就是光的探測芯片,基本都是磷化銦這種材料做的。這下小伙伴們應(yīng)該知道磷化銦和砷化鎵,以及氮化鎵在光模塊里是干嘛的了吧,當(dāng)時炒云南鍺業(yè),就是講這個故事。整個過程就是發(fā)射端的光芯片,發(fā)射響應(yīng)速率的調(diào)制過的光信號,通過光纖傳輸后到光接收芯片,然后由光接收探測到之后轉(zhuǎn)化為電信號,再經(jīng)過前置發(fā)大器,屬于響應(yīng)碼率的電信號。
由于光有不同的波長,在實際應(yīng)用中,一般以850nm(多模),1310nm(單模),1550nm(單模),三種波長的較為常見,這和光在光纖傳播的損耗有密切關(guān)系,故業(yè)內(nèi)多用這三種損耗小波長的光。
損耗越小,光纖的傳輸距離就越遠(yuǎn),光信號的質(zhì)量就越好。在光傳輸?shù)那昂?,還有CDR(時鐘恢復(fù)),調(diào)制解調(diào)部分,放大器,驅(qū)動部分等各種芯片,它們負(fù)責(zé)光電信號的互相轉(zhuǎn)換,即電信號到光信號,然后再從光信號到信號。
很不幸,這部分芯片全是德儀,ADI,Lumentum,美信,Marvell,瑞薩,博通之類的大公司,國內(nèi)水平連弟弟都算不上。因為這屬于最高端的模擬電路,國內(nèi)沒有特別出彩的公司。
然后為了組成100G,400G,甚至800G的帶寬。業(yè)內(nèi)會有各種各種的光路多通道的組合方案,比如25*4=100G,或者100G*4=400G,這種這里就涉及光的拆分和復(fù)合的技術(shù)了。牛逼的都是多路復(fù)合光路,這樣在同樣的光纖上傳輸?shù)男畔⒕透?,速率也就更快,帶寬更大。哪有人問,中際旭創(chuàng),新易盛有什么芯片是自己的?難道只是一個組裝方案商?
對,從嚴(yán)格意義上來講,國內(nèi)這些個光模塊公司,它們僅僅是一個光模塊封裝方案商罷了。
因為光發(fā)射/接收以及光電轉(zhuǎn)換,各種驅(qū)動,以及CDR,調(diào)制解調(diào)器,放大器之類的芯片都不是自己的。當(dāng)然了,?也不是說封裝不重要,現(xiàn)在光模塊的封裝方案,發(fā)展實在太快了,看得我都眼花繚亂。
包括遠(yuǎn)古時期的GBIC,XENPAK,后面的XFP,SFP,SFP+,SFP28,QSFP,QSFP28,CFP,CFP2,QSFP-DD,OSFP等等等,大大小小幾十種,連我也搞不清楚其中的區(qū)別。只知道不同的封裝方案,適用不同的速率,有些支持1.25Gbps,有些支持25Gbps,10Gbps,有些是50Gbps。然后還對應(yīng)不同的傳輸距離,包括100米到160公里的不等。然后調(diào)制解調(diào)格式,也是五花八門,包括NRZ,PAM4,DP-QPSK;接口工作方式也分雙向的Depluxh和單向的BiDi。總之各位記住,光發(fā)射,光接收,以及光電轉(zhuǎn)換和驅(qū)動這些個芯片領(lǐng)域,國內(nèi)和國外比差很遠(yuǎn)。但是不管怎么說,這些公司的業(yè)績增長也是實打?qū)嵉模瑢儆谝粋€高增長的市場,今年上半年光模塊概念炒火熱的也確實有基本面邏輯。
講到這里網(wǎng)絡(luò)芯片相關(guān)概念大家應(yīng)該都有一個清晰的認(rèn)識了。
我再幫各位總結(jié)一下。
在服務(wù)器端上,所謂網(wǎng)絡(luò)芯片是指網(wǎng)卡芯片從以前的普通的以太網(wǎng)控制器NIC, 開始向Smart NIC智能網(wǎng)卡,甚至DPU方向發(fā)展,核心邏輯是把部分浪費CPU算力資源的工作,從CPU的轉(zhuǎn)移到智能網(wǎng)卡和DPU上,好剛用在刀刃上的思路。
在網(wǎng)絡(luò)交換機(jī)上所謂的網(wǎng)絡(luò)芯片,是指內(nèi)部核心的交換機(jī)核心,以及配套的電口PHY芯片,以及光口,光模塊相關(guān)芯片。
所以網(wǎng)絡(luò)芯片其實是個很寬泛的概念。講完這些,回到各位最熱切關(guān)注的DPU上。
打破馮諾依曼構(gòu)架?存算分離?
現(xiàn)代計算機(jī)的構(gòu)架分成,控制器、運算器,存儲器(寄存器),輸入和輸出系統(tǒng),五個系統(tǒng)。
這就是馮諾依曼的計算機(jī)體系結(jié)構(gòu),相信各位學(xué)計算機(jī)的小伙伴并不陌生。
和當(dāng)年第一臺電子計算機(jī)的“埃尼亞克”號相比,現(xiàn)代計算機(jī)性能有著巨大的提升,但是基本構(gòu)架都是一樣的,幾十年過去了并沒有改變。
但是發(fā)展至今,各種問題都來了,且聽我仔細(xì)分析。
還是從存儲角度入手,現(xiàn)在最大的系統(tǒng)瓶頸出現(xiàn)在存算上。
現(xiàn)在有兩個存算概念,一個叫存算一體,一個叫存算分離。
有人說,你這不是上海宛平南路600號么,突出一個精神分裂,自相矛盾?
別急,聽我講。存儲方面又分:內(nèi)存和外存。
所謂內(nèi)存,狹義上理解成內(nèi)存條,它類似一個臨時倉庫,速度很快,但是斷電不保存數(shù)據(jù),也叫易失性,實際廣義上的內(nèi)存包括了內(nèi)存條DRAM,以及SoC芯片內(nèi)部的SRAM緩存區(qū)域,俗稱L1級緩存,L2級緩存等。(一級放地址,二級放數(shù)據(jù))。
實際上SRAM區(qū)域在一顆CPU內(nèi)部占的面積是非常大的,比計算單元面積大多了。
外存,就是過去的機(jī)械硬盤,當(dāng)然現(xiàn)在機(jī)械硬盤都不用了,改用NAND FLASH顆粒做成固態(tài)硬盤來永久保存數(shù)據(jù),它能在斷電情況下永久保存數(shù)據(jù),因此叫非易性存儲。
外存從嚴(yán)格意義上來講,并不屬于馮諾依曼構(gòu)架存儲器,而是屬于輸入輸出的外存。
盡管內(nèi)存條的速度對于硬盤來講快很多,但是對于CPU內(nèi)部的速度而言還是太慢了,而且大量的能耗浪費在進(jìn)進(jìn)出出的數(shù)據(jù)搬運上。
在馮諾伊曼架構(gòu)之下,芯片的存儲、計算區(qū)域是分離的。計算時,數(shù)據(jù)需要在兩個區(qū)域之間來回搬運,而隨著神經(jīng)網(wǎng)絡(luò)模型層數(shù)、規(guī)模以及數(shù)據(jù)處理量的不斷增長,數(shù)據(jù)已經(jīng)面臨“跑不過來”的境況,成為高效能計算性能和功耗的瓶頸,也就是業(yè)內(nèi)俗稱的“存儲墻”。
這存儲墻,能耗墻,編譯墻的“三堵墻”導(dǎo)致算力無謂浪費:據(jù)統(tǒng)計,在大算力的AI應(yīng)用中,數(shù)據(jù)搬運操作消耗90%的時間和功耗,數(shù)據(jù)搬運的功耗是運算的650倍,打破“存儲墻”勢在必行。
因此當(dāng)下解決方案是在CPU外掛HBM,拉進(jìn)計算和存儲之間的距離,用異構(gòu)架的思路來打破“存儲墻”,也就是Chiplet的解決思路!
對,直接把CPU/GPU和HBM高寬帶內(nèi)存封裝到一起!進(jìn)一步提升系統(tǒng)速度!畢竟插主板上的速度和在芯片內(nèi)部封裝到一起的相比,速度差了成千上萬倍!
這就是存算一體?。。?/p>
再來聊存算分離。
一般來講,在主板上以前有北橋芯片和南橋芯片之分,北橋芯片負(fù)責(zé)CPU和內(nèi)存條之間的通信,當(dāng)然了現(xiàn)在CPU都和HBM封到了一起了,CPU內(nèi)部都有內(nèi)存控制器直連了,北橋當(dāng)然不需要了。
南橋芯片負(fù)責(zé)各種輸入輸出設(shè)備的接口,這其中包括硬盤和CPU之間的通信。
那么有沒有一種可能,現(xiàn)在CPU和內(nèi)存都在一起了,系統(tǒng)瓶頸是不是轉(zhuǎn)移到硬盤和CPU之間了?
有沒有辦法把最后的一道系統(tǒng)瓶頸給打破?
比如別用南橋芯片了,直接學(xué)CPU+HBM的方案算了,直接用一條高速總線,把硬盤和CPU直連得了!
這樣其中一塊服務(wù)器的主板上,就只要一個個高性能計算單元,而另外一塊服務(wù)器上,只插各種硬盤,然后用高速光模塊,把計算服務(wù)器和存儲服務(wù)器連接在一起?最大程度節(jié)省資源?
這樣不僅能省服務(wù)器的硬件成本,而且還能提供更快的連接帶寬?
前面提到過,DPU中有一項重要功能:
“不同的加速工作負(fù)載,又分成基本連接型NIC,面向網(wǎng)路加速型的智能網(wǎng)卡,以及面向存儲加速型的智能網(wǎng)卡。”
“到現(xiàn)在為了配合Ai和加速計算而設(shè)計的DPU,DPU針對多用戶,云生態(tài)環(huán)境進(jìn)行各種優(yōu)化,提供數(shù)據(jù)中心級的軟件定義和硬件加速的網(wǎng)絡(luò)、存儲、安全和管理的等各種服務(wù)。”
對,非常的棒,如果這個方案可以試試,那可以把DPU功能再升級一下,進(jìn)一步分?jǐn)侰PU的工作,用一條高速通信的總線+光模塊的方案把兩個不同功能的服務(wù)器連接到一起,打破系統(tǒng)瓶頸,進(jìn)一步提升性能。
因此在DPU的1.0功能時代,DPU也就分擔(dān)了CPU網(wǎng)絡(luò)通信功能,但是到2.0時代,DPU還能分擔(dān)存儲分離后數(shù)據(jù)預(yù)處理的功能!個人認(rèn)為這才是未來DPU發(fā)展的重要方向,是不是非常哇塞?
這么一看,三大U里的DPU在未來分量真的非常重要,各位DPU初創(chuàng)公司是不是又有新的故事可以講給投資人聽了?
洋洋灑灑敲了11000多字,今日科普到此,希望各位看官老爺看完都有所收獲。
全文完。
最近咨詢的人越來越多,而且還有好多小白問我各種基礎(chǔ)芯片問題,我真的回答不過來了,琢磨著,要不直接開知識付費課。
我講課,各位放心,干貨滿滿,通俗易懂!絕對對得起各位花的每一分錢!
具體請加《半導(dǎo)體投資課程》小助理的微信,課程內(nèi)容和時間到時候群里通知,第一節(jié)課暫定本月月底。
加微信時請注明:啟哥半導(dǎo)體課程咨詢。
參考資料:
生成式AI帶火的不止GPU,網(wǎng)絡(luò)芯片迎來下一輪大戰(zhàn);
核心Switch/PHY 芯片加持,千兆以太網(wǎng)持續(xù)放量;
中金 | 交換芯片:下游應(yīng)用驅(qū)動規(guī)模及性能雙升,長期受益國產(chǎn)替代;
中國路由器行業(yè)市場高度集中,前三企業(yè)占據(jù)接近90%的市場份額;
866.5億,全球以太網(wǎng)交換機(jī)市場排名;
數(shù)據(jù)中心交換機(jī)芯片總結(jié);
以太網(wǎng)交換設(shè)備及芯片行業(yè)發(fā)展概況;
光模塊芯片方案淺析;
路由器市場格局;
中國交換機(jī)行業(yè)前景分析;
計算機(jī)馮諾依曼構(gòu)架結(jié)構(gòu);
2023全球計算機(jī)市場網(wǎng)絡(luò)設(shè)備制造規(guī)模及競爭格局;
…………