去年,英偉達 GPU 技術(shù)大會上,首席執(zhí)行官黃仁勛在演講中公布了新的 Pascal GPU 架構(gòu),第一款產(chǎn)品便是 Tesla P100。雖然沒有提及消費級顯卡,但是表示基于 Pascal 的 GTX 1080 將在幾個月后發(fā)布。
在今年的 GPU 大會上,英偉達發(fā)布了最新的 GPU 架構(gòu) Volta。Volta 架構(gòu)的第一款產(chǎn)品是 Tesla V100,將用于數(shù)據(jù)中心。Tesla V100 有兩種,一種是通過英偉達專有的 NVLink 與服務(wù)器(或者其他 V100)互連的夾層卡(如下圖所示);另一種是雙寬 PCIE 卡。
?
V100 相比 P100,要大一些、更強悍、更具震懾力。芯片面積為 815mm,采用臺積電先進的 12nm FinFET 工藝,擁有 210 億個晶體管。
對這個一時間走紅的 V100,我們?nèi)绾卫硇钥创?/p>
對于臺積電 12nm FinFET 工藝,只是 16nm FF 工藝的一個稍稍改進版。這在晶體管面密度方面,Volta 與 Pascal 近乎相同。工藝的改進,帶來的優(yōu)勢主要在功率方面。不過,V100 的確是一個令人印象深刻的芯片。
Volta 獨特之處在于包含了 640 個新增的張量核(Tensor Core)。Tensor Core 執(zhí)行專門的矩陣運算。谷歌 TPU 以及 ASIC 對通用 AI 芯片造成威脅。英偉達的戰(zhàn)略就是,將 TPU 融入自己的產(chǎn)品中,粗暴地將 TPU 作為一個專門的子處理器融合入其 GPU 中。Tensor Core 的速度非??欤啾?Pascal,速度提升了 5 倍。
Tensor Core 有助于提升推理處理的性能。英偉達聲稱 V100 在推理處理方面大約是 P100 的 3 倍,但是英偉達并沒有與谷歌 TPU 進行對比。很明顯,英偉達盡全力表現(xiàn)自己就是為了否定 TPU 以及 ASIC 的獨特優(yōu)勢。
去年,英偉達推出 DGX-1 這個超級計算機,今年 DGX-1 已經(jīng)升級為 DGX-1V,配備 Volta V100 和新的 NVLink 2.0(帶寬為舊接口的兩倍)。
02
在黃仁勛 GTC 2017 主題演講中,也可以了解到下一代 PX 平臺 Xavier 的細節(jié)。Xavier 性能表現(xiàn)的關(guān)鍵在于內(nèi)置了 Volta GPU,而 Tensor Core 的存在使 Xavier 的高效能性得以實現(xiàn)。
自動去年 10 月英偉達 Drive PX 2 被特斯拉采用,英偉達逐漸建立起其在自動駕駛領(lǐng)域的地位,并獲得了高速的發(fā)展與增長。
今年,英偉達似乎會加快 Xavier 在自動駕駛領(lǐng)域的部屬。英偉達還宣布和豐田合作,豐田將采用英偉達 DRIVE PX 車載 AI 計算平臺,并希望在 2020 年左右將自動駕駛車推向市場。
我相信英偉達在自駕車的處理器方面遙遙領(lǐng)先,汽車行業(yè)將或多或少將英偉達的處理平臺作為標準。即便英特爾將 Mobileye 收入囊中,但似乎已經(jīng)太晚了。
說了這么多,我對于英偉達的關(guān)注已經(jīng)很久,我相信消費級基于 Volta 的產(chǎn)品也不會太遙遠。
更多有關(guān)英偉達的資訊,歡迎訪問 與非網(wǎng)英偉達專區(qū)
與非網(wǎng)編譯內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!