北京2024年9月28日?/美通社/ -- 9月27日,我國算力產(chǎn)業(yè)領(lǐng)域的頂級盛會——中國算力大會在鄭州召開,會上浪潮信息聯(lián)合信通院發(fā)布了《人工智能算力高質(zhì)量發(fā)展評估體系報告》(以下簡稱報告)。報告首次完整地構(gòu)建了人工智能時代高質(zhì)量算力的理論體系,并探索性提出業(yè)界首個 "五位一體"的高質(zhì)量算力評估體系。
在當(dāng)前由大模型和AIGC驅(qū)動的AI時代,算力需求暴增,同時還面臨供給不足、供需匹配難、能耗激增等挑戰(zhàn),亟需算力產(chǎn)業(yè)由"量"向"質(zhì)"加速高質(zhì)量發(fā)展。為了推動算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展,去年10月工業(yè)和信息化部等六部門聯(lián)合印發(fā)了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》。報告的發(fā)布,為該政策的進(jìn)一步落實提供實踐路徑,加速高質(zhì)量算力從概念到落地。
"三高三可"促進(jìn)算力"提質(zhì)增效"
報告對人工智能時代的"高質(zhì)量算力"予以明確定義:高質(zhì)量算力是基于最新人工智能理論,采用先進(jìn)人工智能的計算架構(gòu),與算法、數(shù)據(jù)深度結(jié)合的高水平計算能力。高質(zhì)量算力具備高算效、高智效、高碳效、可持續(xù)、可獲得、可評估"三高三可"六大特征。
高算效是指在提高算力理論算效的同時考慮更高的實測性能和資源利用率。理論算效主要體現(xiàn)的是部件和系統(tǒng)能力,2023年年底,全國在用算力中心平均理論算效為11.8GFLOPS/W,僅達(dá)到GB/T 43331-2023《互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)技術(shù)和分級要求》中通用算力算效第三等級,表明算效水平仍有很大提升空間。實測性能體現(xiàn)的是應(yīng)用場景下的實測性能,如單位時間內(nèi)處理的Token數(shù)量、運行時延、模型訓(xùn)練時間、數(shù)據(jù)處理質(zhì)量等指標(biāo)。當(dāng)前算力集群實測性能和理論性能差距過大問題明顯,部分算力實際性能不足理論性能的10%。資源利用率則關(guān)注的是算力資源利用水平。據(jù)公開數(shù)據(jù)顯示,傳統(tǒng)模式下的智算中心GPU利用率平均數(shù)值低于30%。高算效就是要破解上述算效水平不高、算力資源利用率較低等問題。
高智效體現(xiàn)的是算力面向人工智能業(yè)務(wù)的高效處理能力。在以大模型為代表的人工智能技術(shù)上,更高的模算效率是體現(xiàn)高智效的主要指標(biāo)。模算效率正比于模型精度與模型的計算效率。模型本身精度越高、在對應(yīng)軟件上對硬件性能利用率越高、推理及訓(xùn)練所需算力越小,模算效率越高,整體反映被測模型在人工智能業(yè)務(wù)應(yīng)用中的綜合處理效率。當(dāng)前大模型發(fā)展百花齊放,大模型的智能涌現(xiàn)能力大幅提升,但是現(xiàn)有大模型模算效率普遍不高,在算力供需矛盾凸顯的當(dāng)下,提升模算效率,以更低算力實現(xiàn)更高智能是智效水平提升的核心目標(biāo)。
高碳效指的是算力在最低碳排放前提下實現(xiàn)最大化算力輸出。高碳效不僅關(guān)注算力單純的能源消耗、算力輸出水平,更要注重算力的全生命周期碳足跡管理,通過綠色采購、綠色設(shè)計、清潔生產(chǎn)、綠色包裝、回收處理等環(huán)節(jié)降低算力系統(tǒng)的碳排放。算力中心是公認(rèn)的高耗能基礎(chǔ)設(shè)施,據(jù)中國信通院數(shù)據(jù)顯示,截至2023年我國算力中心耗電量,達(dá)到1500億千瓦時,預(yù)計到2030年將超過4000億千瓦時,二氧化碳排放或?qū)⒊?億噸。面對人工智能對算力的旺盛需求,算力產(chǎn)業(yè)在高速發(fā)展的同時亟需提高碳效,實現(xiàn)"雙碳目標(biāo)"。
此外,高質(zhì)量算力還具備可持續(xù)、可獲得和可評估三大特征。可獲得是指算力普適普惠,能夠適用各種應(yīng)用場景,同時算力使用成本較低??沙掷m(xù)是指算力具備技術(shù)兼容、供應(yīng)鏈完備、生態(tài)開放的特性,能夠保證算力持續(xù)供給和升級迭代??稍u估是指可通過完整、有效的評估體系反映算力系統(tǒng)實際應(yīng)用情況。
聚焦高質(zhì)量算力"三高三可"特征,報告提出了以系統(tǒng)設(shè)計提升算效、協(xié)同驅(qū)動提升智效、全生命周期管理提升碳效、基建先行推動算力普適普惠、繁榮生態(tài)推動算力可持續(xù)發(fā)展、多元評估加速算力規(guī)范化發(fā)展的高質(zhì)量算力發(fā)展路徑,有效推動算力發(fā)展"提質(zhì)增效",讓高質(zhì)量算力助力經(jīng)濟(jì)社會實現(xiàn)數(shù)智化轉(zhuǎn)型和高質(zhì)量發(fā)展。
"五位一體"評估體系引導(dǎo)算力高質(zhì)量發(fā)展
只有通過精準(zhǔn)的性能評估與測試,發(fā)現(xiàn)算力系統(tǒng)的瓶頸,才能促進(jìn)算力技術(shù)創(chuàng)新和改善產(chǎn)品設(shè)計,不斷提升算力質(zhì)量發(fā)展水平。然而,現(xiàn)有算力評估體系評估場景簡單,無法全面、深入地反映算力應(yīng)用的實際效果,如何準(zhǔn)確評估算力的質(zhì)量是當(dāng)前算力建設(shè)者和使用者共同面臨的問題。為此,報告結(jié)合人工智能時代算力發(fā)展面臨的機(jī)遇與挑戰(zhàn),推出面向人工智能時代的"五位一體"高質(zhì)量算力評估體系。
"五位一體"高質(zhì)量算力評估體系遵循系統(tǒng)性、全面性等原則,針對算力系統(tǒng)從算效水平、智效水平、碳效水平、可獲得水平、可持續(xù)水平5個維度搭建高質(zhì)量算力評估體系,指標(biāo)涉及理論算效、實測性能、模算效率等12個指標(biāo),進(jìn)行多維、多元評估。
這套"五位一體"的高質(zhì)量算力評估體系涵蓋了算效、智效、碳效、可獲得、可持續(xù)等算力系統(tǒng)建設(shè)運營關(guān)鍵因素,能夠多維度客觀評估我國算力質(zhì)量情況,彌補(bǔ)了現(xiàn)有算力評估體系評估場景簡單、評估維度單一、無法全面反映算力應(yīng)用的實際效能與發(fā)展?jié)摿Φ炔蛔恪?/p>
作為業(yè)界推出的首個高質(zhì)量算力評估體系,對促進(jìn)我國算力產(chǎn)業(yè)規(guī)范化、高質(zhì)量發(fā)展具有重要意義,不但可以幫助企業(yè)用戶識別和優(yōu)化資源配置,提高算力資源使用效率,并激勵企業(yè)進(jìn)行技術(shù)研發(fā)和創(chuàng)新,進(jìn)而推動整個行業(yè)的技術(shù)進(jìn)步,而且能夠在算力項目的規(guī)劃期、建設(shè)期、運營期等不同階段,引導(dǎo)算力實現(xiàn)全生命周期可持續(xù)發(fā)展。