燧原科技今日發(fā)布第二代人工智能訓練產品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓練加速卡和“云燧T21”訓練OAM模組,全面升級的“馭算TopsRider”軟件平臺以及全新的“云燧集群”,成為國內首家發(fā)布第二代人工智能訓練產品組合的公司。
燧原科技第二代通用人工智能訓練芯片“邃思2.0”
經過全新升級迭代后,邃思2.0的計算能力、存儲和帶寬、互聯(lián)能力較第一代訓練產品有巨大提升,對超大規(guī)模的模型支持能力獲得顯著增強。而同步升級的馭算TopsRider軟件平臺,成為燧原科技構建原始創(chuàng)新軟件生態(tài)的基石。完全自研的軟硬件架構,助力燧原科技在知識產權和產品升級迭代上可以自主掌控方向和節(jié)奏。?
燧原科技第二代通用人工智能訓練加速卡“云燧T20”
?
燧原科技第二代通用人工智能訓練模組“云燧T21”
四大核心升級 打造全新產品矩陣與智算集群
架構升級實現(xiàn)算力飛躍:邃思2.0進行了大規(guī)模的架構升級,新一代全自研的GCU-CARA全域計算架構,針對人工智能計算的特性進行深度優(yōu)化,夯實了支持通用異構計算的基礎;支持全面的計算精度,涵蓋從FP32、TF32、FP16、BF16到INT8,并成為中國首款支持單精度張量TF32數(shù)據精度的人工智能芯片。單精度FP32峰值算力達到40 TFLOPS,單精度張量TF32峰值算力達到160 TFLOPS,均為國內第一。
HBM2E存儲帶來海量吞吐:邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64 GB內存,帶寬達1.8 TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內存的產品。
高速互聯(lián)支撐算力擴展:GCU-LARE全域互聯(lián)技術是燧原專為人工智能訓練集群研發(fā)的互聯(lián)技術,提供雙向300 GB/s互聯(lián)帶寬,支持數(shù)千張云燧CloudBlazer加速卡互聯(lián),實現(xiàn)優(yōu)異的線性加速比。
全新軟件駕馭澎湃算力:馭算TopsRider是燧原科技自主知識產權的計算及編程平臺,通過軟硬件協(xié)同架構設計,充分發(fā)揮邃思2.0的性能;基于算子泛化技術及圖優(yōu)化策略,支持主流深度學習框架下的各類模型訓練;利用Horovod分布式訓練框架與GCU-LARE互聯(lián)技術相互配合,為超大規(guī)模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
建設原始創(chuàng)新的通用算力和自主生態(tài),加速產品商業(yè)化
“第二代人工智能訓練產品的發(fā)布,是燧原科技開發(fā)原始創(chuàng)新的算力產品和構建自主生態(tài)又一重要的里程碑。通過芯片架構和軟件平臺的升級迭代,提升產品競爭力,滿足市場需求,從而加速產品商業(yè)化的步伐?!膘菰萍糃EO趙立東指出,“在復雜的國際大環(huán)境下,原始創(chuàng)新和自主生態(tài)成為發(fā)展趨勢,這也是燧原科技自創(chuàng)立以來始終堅持的戰(zhàn)略選擇,是支撐技術和業(yè)務長遠發(fā)展,不斷拉近與世界先進水平的距離,并在市場競爭中取得主動的基礎。面向泛互聯(lián)網、傳統(tǒng)行業(yè)(金融、交通、電力、醫(yī)療、工業(yè)等)以及新基建三大業(yè)務方向,燧原科技正以全新、更具競爭力的產品,服務市場和客戶。”
燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發(fā)布“云燧T20”訓練加速卡和“邃思2.0”芯片
燧原科技COO張亞林介紹道:“邃思2.0大幅提升了算力指標,升級后的馭算軟件平臺更加便捷易用和客戶友好,燧原科技也可針對客戶的場景和業(yè)務模型提供軟件定制化服務和優(yōu)化,打造差異化解決方案。此外,基于云燧T20和T21訓練產品、GCU-LARE互聯(lián)技術和新一代馭算,燧原科技可以打造超大規(guī)模的集群產品CloudBlazer Matrix,有效降低人工智能超算集群的整體復雜度和成本,同時通過與合作伙伴的聯(lián)合開發(fā),一起構建超大規(guī)模的液冷智能數(shù)據中心,以響應國家‘低碳算力’和‘綠色一體化智能計算’的戰(zhàn)略方向?!?/p>