加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 芯片領域成為熱點
    • 國內首款云端全功能芯片
    • 基于 FPGA 打造的昆侖芯片
    • 昆侖芯片的閃光點
    • 強強合作提升領域發(fā)展
    • 昆侖芯片未來落腳點
    • 結尾
  • 相關推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

新銳丨基于FPGA打造,百度昆侖芯片有多能打

2020/04/20
269
閱讀需 7 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作為 Al 芯片的積極布局者與應用者,百度對外發(fā)布 AI 云端芯片“昆侖”,備受業(yè)界矚目。在中國產(chǎn)業(yè)智能化進程的逐步深入,市場對于 AI 算力的需求超大規(guī)模增長,在端側部署 AI 芯片也成為企業(yè)應用 AI 的重要一環(huán)。

?

芯片領域成為熱點

我國在人工智能芯片領域不斷取得創(chuàng)新突破。各個平臺型企業(yè)也紛紛基于數(shù)據(jù)、算法和應用優(yōu)勢,宣布進軍人工智能芯片領域。AI 領域已經(jīng)成為世界科技巨頭爭奪的制高點, AI 應用的爆發(fā)對運算能力提出越來越高的要求,基于傳統(tǒng)芯片的 AI 運算加速,已經(jīng)不能滿足需求。

軟件領域的谷歌、Facbook,硬件廠商英偉達、英特爾等全都宣布了自己的芯片規(guī)劃以及未來遠景。在這個大背景下,以百度昆侖芯片為代表的國產(chǎn)技術,能夠突破國際巨頭技術體系的壓制,成為國內業(yè)界普遍關注國產(chǎn)代表。

國內首款云端全功能芯片

中國首款云端 Al 全功能 AI 芯片“昆侖”是中國在大規(guī)模 AI 運算實踐中催生出的芯片。

與市面上已發(fā)布的適用于垂直場景的芯片不同,百度之所以將“昆侖”定義為國內首款云端全功能芯片,是因為其可高效地同時滿足訓練和推斷的需求,除了常用深度學習算法等云端需求,還能適配諸如自然語言處理,大規(guī)模語音識別自動駕駛,大規(guī)模推薦等具體終端場景的計算需求。

基于 FPGA 打造的昆侖芯片

眾所周知,GPU 是打造 AI 芯片的重要手段之一。百度昆侖芯片是基于 FPGA 所打造的 AI 芯片采用了 XPU 架構。在 FPGA 方面,百度擁有超過 8 年的 FPGAAI 加速器積累,累計上線超過了 1 萬個。其 XPU 架構及軟件棧也在實際業(yè)務中,有了超過 8 年的持續(xù)迭代。

昆侖芯片與 GPU 和專用 AI 芯片相比,在實行性能和性價比上都有一定的優(yōu)勢。昆侖芯片非常通用且靈活,既可以做訓練也可以做推理,XPU 的功能架構也在百度內部很多應用中得到驗證,相對而言,它是一款全功能的 Al 芯片。
?

昆侖芯片的閃光點

百度昆侖采用了 14nm 三星工藝、260Tops 性能、512GB/s 內存帶寬、100+?瓦特功耗,由幾萬個小核心構成。昆侖芯片可以在 100 瓦+功耗下提供 260TOPS ,每秒 260 萬億次定數(shù)運算性能。此前,NVIDIA 用于汽車 L 4.L .5 自動駕駛的 Xavier 芯片,8 核 ARM CPU+512 顆 CUDA 的性能是 30TOPS。

架構方面:昆侖芯片有 2 個計算單元,512GB/S 的內存帶寬,16MBSRAM/unit。16MB 的 SRAM 對 AI 推理很有幫助,XPU 架構上的 XPU-SDNN 是為 Tensor 等而設計,XPU-Cluster 則能夠滿足通用處理的需求。

昆侖第一代芯片沒有采用 NVLink,而是通過 PCIE4.0 接口進行互聯(lián)。在三星 14nm 的制造工藝和 2.5D 封裝的支持下,昆侖芯片峰值性能可以達到 260TOPS,功耗為 150W。

在靈活性和易用性方面:昆侖面向開發(fā)者提供類似英偉達 CUDA 的軟件棧,可以通過 C/C++語言進行編程,降低開發(fā)者的開發(fā)難度。

基于第一代昆侖芯片,百度推出了兩款 AI 加速卡,K100 和 K200,前者算力和功耗都是后者的兩倍。在語音常用的 Bert/Ernie 測試模型下,昆侖也有明顯性能優(yōu)勢。在線上性能數(shù)據(jù)的表現(xiàn)上,昆侖的表現(xiàn)相比英偉達 T4 更加穩(wěn)定,且延遲也有優(yōu)勢。

強強合作提升領域發(fā)展

2019 年 12 月 18 日,三星宣布代工百度首款云到邊緣 AI 芯片“昆侖”,借由三星 14 納米處理技術及其 I-Cube(Interposer-Cube)封裝解決方案生產(chǎn)。

三星的 14nm 工藝是其最廣泛使用的制造節(jié)點之一,該工藝的晶體管密度為 32.5 MTr /mm,主要用于英偉達的 GeForce 10 系列,以及許多高通和三星芯片。它有多種變體,包括 14nm LPE(Low Power Early)和 14nm LPP(Low Power Plus)。

目前昆侖芯片已完成開發(fā),并將批量生產(chǎn)。昆侖芯片首先將會用于百度的自家產(chǎn)品當中,能解決工業(yè)智能遇到的計算問題以及和飛騰 ARM 處理器的適配。

昆侖芯片未來落腳點

工業(yè)上百度昆侖芯片也正式在微億智造的工業(yè)智能質檢設備上部署上線。百度智能云以整機一體化方式,向微億智造交付搭載百度昆侖芯片的百度云質檢一體機。

預計在今年以內,微億智造的數(shù)千臺智能質檢設備將全部應用上百度昆侖芯片,而百度昆侖還將在更多場景中部署應用,百度的 AI 能力將成為“新基建”的重要基礎,推動工業(yè)制造業(yè)的產(chǎn)業(yè)智能化升級。

結尾

未來“昆侖”既將實現(xiàn)對數(shù)據(jù)中心、公有云等云端場景的全覆蓋,也將用于滿足自然語言處理、語音識別、自動駕駛等終端場景的計算需求。此次“昆侖”能成功落地,有望形成人工智能芯片與平臺應用相互促進的良性循環(huán)。

百度

百度

百度是擁有強大互聯(lián)網(wǎng)基礎的領先AI公司。是全球為數(shù)不多的提供AI芯片、軟件架構和應用程序等全棧AI技術的公司之一,被國際機構評為全球四大AI公司之一。百度以“用科技讓復雜的世界更簡單”為使命,堅持技術創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。

百度是擁有強大互聯(lián)網(wǎng)基礎的領先AI公司。是全球為數(shù)不多的提供AI芯片、軟件架構和應用程序等全棧AI技術的公司之一,被國際機構評為全球四大AI公司之一。百度以“用科技讓復雜的世界更簡單”為使命,堅持技術創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。收起

查看更多

相關推薦

電子產(chǎn)業(yè)圖譜

AI芯天下是智能芯片行業(yè)垂直自媒體。采用媒體+行業(yè)的模式,堅持從芯出發(fā),用心服務的理念,致力于豐富的網(wǎng)絡基礎資源建設。官網(wǎng):http://www.world2078.com/ 公眾號:World_2078