- 云端增長(zhǎng)正在加速成長(zhǎng),英特爾還在享受著在服務(wù)器芯片領(lǐng)域的壟斷地位;
- 然而,隨著摩爾定律放緩,云計(jì)算向更加復(fù)雜的應(yīng)用進(jìn)行轉(zhuǎn)移,因此英特爾的領(lǐng)導(dǎo)地位會(huì)受到威脅;
- 其它解決方案,如 GPU 和 FPGA,現(xiàn)在的谷歌 TPU 可以更有效地解決云計(jì)算不斷變化的需求;
摩爾定律的放緩可能會(huì)產(chǎn)生重要影響,尤其是對(duì)英特爾來(lái)說(shuō)。其在手機(jī)領(lǐng)域已經(jīng)失手,PC 銷量在不斷下滑,但是迄今為止,這些大部分已經(jīng)從服務(wù)器領(lǐng)域獲得拯救,因?yàn)樵谠擃I(lǐng)域它還處于壟斷地位。
后者已經(jīng)受到了來(lái)自英偉達(dá)的 GPU 的攻擊,這些 GPU 執(zhí)行了一些任務(wù),尤其是并行處理了與人工智能相關(guān)的大數(shù)據(jù)任務(wù)。
英偉達(dá)在數(shù)據(jù)中心行業(yè)的發(fā)展可圈可點(diǎn),去年的增長(zhǎng)率高達(dá) 126%。
英特爾正在進(jìn)行反擊。如今數(shù)據(jù)中心的芯片優(yōu)先采用新的處理器平臺(tái)(節(jié)點(diǎn)),并且它已經(jīng)收購(gòu)了 Altera,可以提供 FPGA 技術(shù)以加速云計(jì)算。賽靈思是這條路線的另一個(gè)玩家。
FPGA 是摩爾定律放緩打擊通用 CPU 的一個(gè)手段,因?yàn)樗恰艾F(xiàn)場(chǎng)可編程”,也就是可以在生產(chǎn)后根據(jù)用戶需求重新配置。
英特爾 FPGA 能夠用于加速大型數(shù)據(jù)系統(tǒng)的性能。英特爾 FPGA 通過(guò)提供定制化高帶寬、低延遲連接到網(wǎng)絡(luò)和存儲(chǔ)系統(tǒng),實(shí)現(xiàn)高速數(shù)據(jù)處理。另外,英特爾 FPGA 提供壓縮、數(shù)據(jù)過(guò)濾和算法加速。通過(guò)帶有 OpenCL 的英特爾 FPGA SDK,你可以為計(jì)算和存儲(chǔ)系統(tǒng)快速研發(fā)加速方案。帶有 OpenCL 的英特爾 FPGA SDK 能夠讓軟件開發(fā)者很容易通過(guò) FPGA 進(jìn)行設(shè)計(jì),它允許工程師利用高級(jí)語(yǔ)言進(jìn)行快速開發(fā)。
谷歌似乎找到另一種解決這個(gè)問(wèn)題的方法。所采用的方案不是像 CPU 和 GPU 這樣的通用芯片,也不是 FPGA 等可編程芯片,而是專用芯片,如專用加速器。
Google 正在做這件事,介紹(見文件)Tensor 處理單元(TPU):
“谷歌的 TPU 在機(jī)器學(xué)習(xí)測(cè)試中超過(guò)英特爾的 Xeon 和英偉達(dá)的 GPU 一個(gè)數(shù)量級(jí)。TPU 和基準(zhǔn)測(cè)試表明,它的速度比商業(yè)芯片快了 15 倍,性能提升 30 倍?!?/p>
令人印象深刻的是,所使用的基準(zhǔn)并不是最前沿的(本文認(rèn)為,2015 年的測(cè)試,英特爾已經(jīng)提供了 14 納米 CPU,而 Nvidia 擁有新的 16 納米 GPU),因?yàn)闇y(cè)試是在 2015 年進(jìn)行的,但是再一次,TPU 本身也不是特別尖端的(在頻率和處理器節(jié)點(diǎn)方面):
“40-W TPU 是運(yùn)行在 700 MHz 的 28 nm 芯片,旨在加速 Google 的 TensorFlow 算法。 其主要邏輯單元包含 65,536 個(gè) 8 位乘法累加單元和 24 MB 緩存,提供每秒 92 個(gè) tera 操作?!?/p>
把產(chǎn)品遷移到更小的節(jié)點(diǎn)上會(huì)提高性能,還有其它技巧:
“如果我們比較更新的芯片,顯示,我們可以通過(guò)使用 K80 的 GDDR5 內(nèi)存將 28nm、0.7GHZ、40W 的 TPU 性能提升三倍。(成本增加 10W)”
如果不這樣的話,隨著 TPU 的成熟,它的性能可能會(huì)超過(guò)競(jìng)爭(zhēng)對(duì)手?jǐn)U大自身優(yōu)勢(shì):
“該 TPU 的數(shù)量級(jí)性能優(yōu)勢(shì)很少,這可能導(dǎo)致它會(huì)成為某些特定領(lǐng)域架構(gòu)的原型。我預(yù)計(jì)很多會(huì)構(gòu)建繼承者,它們的水平會(huì)提高很多。谷歌表示,關(guān)于短至 15 個(gè)月的設(shè)計(jì)周期表阻止了 TPU 中的許多節(jié)能功能。
TPU 已經(jīng)應(yīng)用于谷歌的數(shù)據(jù)中心,但是公司沒(méi)有提供任何關(guān)于廣泛應(yīng)用的信息,也沒(méi)有說(shuō)升級(jí)方式以及是否會(huì)將 TPU 賣給第三方?!?/p>
這對(duì)英特爾有明顯的警告,對(duì)英偉達(dá)屬于小幅度的:
TPU 項(xiàng)目從 2013 年隨著從 FPGA 實(shí)驗(yàn)開始?!爱?dāng)我們看到 FPGA 的性能無(wú)法和 GPU 相比的時(shí)候,我們拋棄了它,并且運(yùn)行速度加快 TPU 功耗會(huì)比 GPU 更低?!眻?bào)告指出。
總結(jié)
不久前,英特爾還沉迷于快速增長(zhǎng)的服務(wù)器市場(chǎng)的壟斷地位。但是隨著摩爾定律的放緩,尤其是不管是存儲(chǔ)、簡(jiǎn)單應(yīng)用還是復(fù)雜 AI 開始向云端轉(zhuǎn)移,英特爾的 GPU 無(wú)法有效地做這些工作,并且尋找有效的解決方案。
早期的替代者是英偉達(dá)的 GPU 或者 Altera 和賽靈思的 FPGA。它們對(duì)英特爾沒(méi)有造成威脅,因?yàn)榉?wù)器仍然在跑 CPU,幾乎全部來(lái)自英特爾,但是即使這樣,一些來(lái)自 AMD、IBM 和 ARM 基礎(chǔ)設(shè)計(jì)的新興競(jìng)爭(zhēng)出現(xiàn)了。
但是 GPU 和 FPGA 的處理能力越來(lái)越強(qiáng),英特爾來(lái)自數(shù)據(jù)中心的增長(zhǎng)收益開始變少。
如今在復(fù)雜加速器似乎出現(xiàn)了一種新的模塊,如谷歌的 TPU。這會(huì)造成多大的威脅?
對(duì)于初學(xué)者,你必須認(rèn)識(shí)到就像 GPU 和 FPGA 一樣,TPU 無(wú)法在服務(wù)器中取代 CPU。它通過(guò)有效地執(zhí)行一些任務(wù)就可以提供附加的處理能力。
或者,有人會(huì)死或它可能會(huì)威脅到 GPU 和 FPGA,但是似乎他們根據(jù)用戶的需求有各自的優(yōu)勢(shì)。但是,像 GPU 和 GPGA,TPU 會(huì)從英特爾占主導(dǎo)地位的 CPU 轉(zhuǎn)移處理能力。
因此,對(duì)英特爾來(lái)說(shuō),最好的方案是它的使用仍然局限于谷歌云自身。目前還沒(méi)有跡象表明谷歌是否計(jì)劃將 TPU 給第三方。它可能應(yīng)用 TPU 去加強(qiáng)自身的云應(yīng)用的性能優(yōu)勢(shì),或者限制其對(duì)第三方供應(yīng)商的依賴。
但是高級(jí)芯片業(yè)務(wù)受益于巨大的經(jīng)濟(jì)規(guī)模,所以我們認(rèn)為谷歌不太可能將其作為專有解決方案。
更重要的是,谷歌似乎開啟了一扇數(shù)據(jù)中心全新解決方案之門,而且是在 15 個(gè)月內(nèi)研發(fā)出來(lái)的。其它廠商跟了多久了?
與非網(wǎng)編譯內(nèi)容,不經(jīng)允許,不得轉(zhuǎn)載!
?