加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

AI芯片受限,海光信息DCU能否扛起國產(chǎn)替代“大旗”?

2024/04/03
4285
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

除了英偉達(dá)之外,中國是否具備AI芯片自主替代的能力?

眾所周知,隨著非市場因素的不斷變化,中國相關(guān)產(chǎn)業(yè)和企業(yè)在發(fā)展AI的過程中,獲得和使用英偉達(dá)AI芯片的限制越來越多。那么問題來了,除了英偉達(dá)之外,中國是否具備自主替代的能力?近日,媒體頻頻報道稱,海光信息的DCU有望成為英偉達(dá)芯片最佳替代者。

事實(shí)真的如此嗎?如果是,在替代的過程中,海光信息又面臨怎樣的機(jī)遇和挑戰(zhàn)?

海光DCU系列產(chǎn)品以GPGPU架構(gòu)為基礎(chǔ),兼容通用的“類CUDA”環(huán)境以及國際主流商業(yè)計算軟件人工智能軟件,可廣泛應(yīng)用于大數(shù)據(jù)處理、人工智能、商業(yè)計算等領(lǐng)域。

值得一提的是,與目前全球主流人工智能企業(yè)都在使用的英偉達(dá)A100產(chǎn)品相比,海光信息DCU的第一代產(chǎn)品海光“深算一號”生產(chǎn)工藝同為7nm制程,內(nèi)存頻率和顯存位寬與A100基本相當(dāng),顯存容量、顯存帶寬和顯存頻率相當(dāng)于A100的50%左右,差距比較大的是多卡協(xié)同的交互速率,只有A100的30%??傮w來講,海光“深算一號”的性能應(yīng)該能達(dá)到英偉達(dá)A100的40%以上水平。

海光信息于2023年第三季度發(fā)布的“深算二號”性能相對于“深算一號”提升100%以上,據(jù)此估計,此款產(chǎn)品性能至少已達(dá)到A100的80%,等到正在研發(fā)中的“深算三號”上市,其趕上甚至超越A100應(yīng)該沒有太大問題。

雖然單純從性能來看,最新的“深算三號”可以達(dá)到甚至超越A100的水平;但事實(shí)上,發(fā)展AI芯片不僅關(guān)乎硬件,還關(guān)乎軟件生態(tài)。一類芯片可能無法支持所有現(xiàn)有的深度學(xué)習(xí)框架和算法,這將限制芯片的應(yīng)用范圍。

具體到GPU,由于當(dāng)前全球主流深度學(xué)習(xí)框架均使用CUDA平臺進(jìn)行開發(fā),國產(chǎn)GPU可以通過兼容CUDA的部分功能,快速打開市場,降低開發(fā)難度和用戶移植成本。然而,CUDA本身涵蓋功能非常廣泛,且許多功能與英偉達(dá)GPU硬件深度耦合,包含了許多英偉達(dá)GPU的專有特性,這些特性并不能在國產(chǎn)AI芯片上全部體現(xiàn)。

有觀點(diǎn)認(rèn)為,海光DCU并不適合做訓(xùn)練,尤其不適合做大模型的訓(xùn)練(因為浮點(diǎn)性能低和無法集群組網(wǎng))。一方面是推理場景性價比低,大約為2022年主流專用推理芯片10%~15%的性能;另一方面由于海光DCU在最初得到Mi100授權(quán)時,把與訓(xùn)練有關(guān)的性能和關(guān)鍵特性做了裁剪,導(dǎo)致“高不成(訓(xùn)練)、低不就(推理)”。

而更大的挑戰(zhàn)還在于,由于海光DCU始于兼容通用的“類CUDA”,英偉達(dá)可能禁止使用第三方硬件,也就是非英偉達(dá)的GPU通過使用模擬層運(yùn)行CUDA軟件,而之前英偉達(dá)只是在在線EULA用戶協(xié)議中提出警告而已。雖然業(yè)內(nèi)對此持有不同的看法,因為英偉達(dá)此前僅是警告,始終沒有付諸行動;但在筆者看來,鑒于目前日益嚴(yán)峻的非市場環(huán)境因素,我們不應(yīng)再抱有僥幸心理,而應(yīng)未雨綢繆,即通過提升自身的軟硬件實(shí)力,構(gòu)筑屬于自己的軟硬件生態(tài)。

可喜的是,有報道稱,百度、阿里等互聯(lián)網(wǎng)企業(yè)已認(rèn)證通過海光的DCU產(chǎn)品并推出聯(lián)合方案,打造全國產(chǎn)軟硬件一體全棧AI基礎(chǔ)設(shè)施;此外,科大訊飛、商湯和云從等國內(nèi)頭部AI企業(yè),已有大量模型移植并運(yùn)行在海光DCU平臺上。

而為了完善通用計算平臺的國產(chǎn)生態(tài),海光還發(fā)起成立了海光產(chǎn)業(yè)生態(tài)合作組織,聯(lián)合了體制內(nèi)外的高校、科研院所和產(chǎn)業(yè)鏈上下游企業(yè),開展“產(chǎn)學(xué)研”相結(jié)合的協(xié)同攻關(guān),為突破行業(yè)內(nèi)關(guān)鍵共性技術(shù)提供助力。

所謂“萬事開頭難”,隨著海光信息DCU產(chǎn)品的不斷迭代以及其對生態(tài)建設(shè)的重視和推進(jìn),趕上甚至超越,直至替代英偉達(dá)的AI芯片,也許只是時間早晚的問題。

*本文刊載于《通信世界》總第940期 2024年3月25日 第6期原文標(biāo)題:《AI芯片受限 海光信息DCU能否擔(dān)起替代重任?

作者:孫永杰

責(zé)編/版式:王禹蓉

審校:王 濤?梅雅鑫

監(jiān)制:劉啟誠

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
TMS320F28335PGFA 1 Texas Instruments C2000™ 32-bit MCU with 150 MIPS, FPU, 512 KB flash, EMIF, 12b ADC 176-LQFP -40 to 85

ECAD模型

下載ECAD模型
$29.61 查看
FT2232HL-REEL 1 FTDI Chip USB Bus Controller, CMOS, PQFP64, LEAD FREE, LQFP-64

ECAD模型

下載ECAD模型
$6.27 查看
ATXMEGA256A3U-AU 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQFP64, 14 X 14 MM, 1 MM THICKNESS, 0.80 MM PITCH, GREEN, PLASTIC, MS-026AEB, TQFP-64

ECAD模型

下載ECAD模型
$6.75 查看
海光信息

海光信息

海光信息技術(shù)股份有限公司成立于2014年,主要從事高端處理器、加速器等計算芯片產(chǎn)品和系統(tǒng)的研究、開發(fā),目標(biāo)成為中國最重要的計算機(jī)芯片設(shè)計企業(yè),為中國信息產(chǎn)業(yè)的強(qiáng)盛提供核心計算引擎。作為國產(chǎn)先進(jìn)微處理器產(chǎn)業(yè)的推動者,海光公司以務(wù)實(shí)的態(tài)度、創(chuàng)新的理念、先進(jìn)的技術(shù)和可靠的產(chǎn)品,致力于促進(jìn)我國信息產(chǎn)業(yè)核心競爭力的提升。

海光信息技術(shù)股份有限公司成立于2014年,主要從事高端處理器、加速器等計算芯片產(chǎn)品和系統(tǒng)的研究、開發(fā),目標(biāo)成為中國最重要的計算機(jī)芯片設(shè)計企業(yè),為中國信息產(chǎn)業(yè)的強(qiáng)盛提供核心計算引擎。作為國產(chǎn)先進(jìn)微處理器產(chǎn)業(yè)的推動者,海光公司以務(wù)實(shí)的態(tài)度、創(chuàng)新的理念、先進(jìn)的技術(shù)和可靠的產(chǎn)品,致力于促進(jìn)我國信息產(chǎn)業(yè)核心競爭力的提升。收起

查看更多

相關(guān)推薦