加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

國產(chǎn)GPU能否驅(qū)動大模型落地?

2023/07/26
3984
閱讀需 4 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

2012年,谷歌團隊推出著名的八層卷積神經(jīng)網(wǎng)絡(luò)模型AlexNet,在人臉識別方面大幅提升了圖像識別準確率,帶動了硬件層面卷積的普及。

2017年,谷歌團隊又推出基于自注意力機制的模型Transformer,在語義理解方面大幅提升了語音翻譯效果,帶動了硬件層面GEMM的普及。

2018年,OpenAI團隊推出一種預(yù)訓(xùn)練語言模型GPT(Generative Pre-trained Transformer),也就是最初代的GPT-1(12層),并通過了圖靈測試。

圖源:WAIC,天數(shù)智芯

也許在GPT-1時代,大眾還沒有什么感受,但GPT-3、GPT-4架構(gòu)下的ChatGPT人工智能成功出圈,并產(chǎn)生了全球性的“大模型AIGC”。于是,我們從硬件的角度來看,GPT到底帶來了哪些變革?

事實上,算力是關(guān)乎大模型產(chǎn)品成功與否的關(guān)鍵,那么大模型需要多少算力呢?天數(shù)智芯副總裁鄒翾表示:“對于頭部企業(yè)來講,預(yù)計需要1萬張最新的主流GPU,而對于追隨企業(yè)來講,為了追趕頭部企業(yè)的步伐,他們在基礎(chǔ)設(shè)施方面的需求可能更大?!?/p>

正是在這樣的大算力需求下,市面上英偉達芯片貴出天際。據(jù)悉,國內(nèi)幾家頭部互聯(lián)網(wǎng)廠家都向英偉達下了1.5萬-1.6萬的A800和H800訂單,每家的金額在十幾億美金左右,而這些產(chǎn)能將在2024年得到基本保障。

在這樣的大背景下,我們看到新聞,竟然有人開始走私GPU卡,特斯拉CEO馬斯克對此表示:“目前,GPU比毒品更難獲得”。當(dāng)然,違法的行為不可取,但我們真切地看到了大模型“算力發(fā)動機”的威力。

換言之,大模型對硬件的最大需求就是要有可用的算力,那么這個“可用”到底如何體現(xiàn)呢?通??梢詮娜齻€方面來理解:

  • 易用

需要利舊現(xiàn)有算法模塊,且調(diào)優(yōu)經(jīng)驗可借鑒

  • 通用

需要可支持模型的快速變形,快速支持新算子,以及快速支持新通訊(重組)

  • 靈活并行

需要滿足訪存全交換和計算全互聯(lián)

結(jié)合當(dāng)前市場上的可用產(chǎn)品,主要包括GPU和ASIC芯片。然而,相比于ASIC芯片,GPGPU具有更強的通用性,所以在主流的AI加速芯片市場上,GPGPU占到了90%的市場份額。

?此外,雖然說大模型不像中、小模型那樣依賴CUDA生態(tài),看上去GPGPU和ASIC在大模型上的差距沒有那么大,但不管是模型的訓(xùn)練還是部署,大模型早期的開放框架都是基于GPGPU架構(gòu)實現(xiàn)的,因此GPGPU的軟件生態(tài)會更為成熟,而ASIC還處在開局階段。

對此,鄒翾表示:“天數(shù)智芯作為國內(nèi)第一家實現(xiàn)設(shè)計、制造、量產(chǎn)的GPGPU企業(yè),當(dāng)前已經(jīng)實現(xiàn)了商業(yè)閉環(huán),并在大模型訓(xùn)練領(lǐng)域取得了階段性進展,完成了百億級參數(shù)大模型訓(xùn)練。”

下圖中為天數(shù)智芯推出的天垓100加速卡已經(jīng)支持的模型訓(xùn)練集合:

圖 | 天垓100已支持百億級參數(shù)大模型訓(xùn)練

從市場方面來看,鄒翾認為:“去年還主要是天垓100在出貨,而今年天垓100和智鎧100一起出貨,在整體市場體量方面會更加趨好?!?/p>

 

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
AT89C51CC03UA-SLSUM 1 Atmel Corporation Microcontroller, 8-Bit, FLASH, 8051 CPU, 60MHz, CMOS, PQCC44, GREEN, PLASTIC, LCC-44

ECAD模型

下載ECAD模型
$8.45 查看
MK64FN1M0VLL12R 1 NXP Semiconductors FLASH, 120MHz, RISC MICROCONTROLLER, PQFP100
暫無數(shù)據(jù) 查看
MC56F8345VFGE 1 Freescale Semiconductor 16-bit DSC, 56800E core, 128KB Flash, 60MHz, QFP 128
$22 查看
天數(shù)智芯

天數(shù)智芯

上海天數(shù)智芯半導(dǎo)體有限公司(簡稱“天數(shù)智芯”)于 2018 年正式啟動通用并行 云端計算芯片設(shè)計,是中國通用GPU 云端芯片及超級算力系統(tǒng)提供商。

上海天數(shù)智芯半導(dǎo)體有限公司(簡稱“天數(shù)智芯”)于 2018 年正式啟動通用并行 云端計算芯片設(shè)計,是中國通用GPU 云端芯片及超級算力系統(tǒng)提供商。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)副主編 通信專業(yè)出身,從事電子研發(fā)數(shù)余載,擅長從工程師的角度洞悉電子行業(yè)發(fā)展動態(tài)。