1846年1月,料峭寒風中,一行長短不一的電碼,從紐約發(fā)出。
130公里開外,費城的交易員收到了這行代表著股價信息的電報,緊接著熟練地按下操作鍵,整個用時不到十秒,相比同行,快了整整半個小時。
時間就是生命,資本市場更是如此,哪怕華爾街巨們需要為此付出10個單詞收費25美分的巨額成本。憑借著時間帶來的巨額差價空間,華爾街巨頭們賺得盆滿缽滿,并自此一舉確立了華爾街作為全球資本市場中心的地位。
不只是資本市場的快速躍進,依托電力基礎(chǔ),美國的重工業(yè)開始替代輕工業(yè),成為時代發(fā)展的主旋律,電氣、化學(xué)、石油等新興工業(yè)部門站在電力的肩膀之上誕生。
一切都在明明白白昭示著一件事——電力,即生產(chǎn)力。
坐在轟轟烈烈的電力工業(yè)化車輪之上,五十年后,美國正式取代英國登頂全球第一,世界的格局變化,也自此埋下清晰地注腳。
然而,當兩百年時間過去,新的時代之問產(chǎn)生了,誰將接棒電力,成為新的生產(chǎn)力?
答案已經(jīng)呼之欲出。
先看數(shù)據(jù),根據(jù)國際權(quán)威機構(gòu)IDC發(fā)布的《2019—2020全球計算力指數(shù)評估報告》:全球范圍內(nèi),算力指數(shù)平均每提高1個點,數(shù)字經(jīng)濟和GDP將分別增長3.3‰和1.8‰。信通院數(shù)據(jù)則測算,2020年我國算力規(guī)模為2億元,直接帶動的經(jīng)濟總產(chǎn)出為1.7萬億,間接帶動6.3萬億,換算來看,每在算力市場投入1元,將帶動大約4元的經(jīng)濟產(chǎn)出。
大處著眼,全球算力規(guī)模前20的國家中,有17個,都是全球前20的超級經(jīng)濟體。
中觀來看,依托于算力的大發(fā)展,alpha go打敗人類,摘取圍棋的桂冠;一個超級APP中每天播出十億條視頻成為可能;基因測序、天文測算、蛋白質(zhì)分析進入新的發(fā)展階段;半導(dǎo)體、消費電子、互聯(lián)網(wǎng)、元宇宙,一個又一個產(chǎn)業(yè)憑借著算力進入繁榮井噴期。
數(shù)字經(jīng)濟時代,算力就是生產(chǎn)力,已經(jīng)毋庸置疑。
不過,算力成為生產(chǎn)力的過程,并沒有這么簡單。
01算力距離生產(chǎn)力,還有多遠
事實上,距離華爾街巨頭使用電報傳輸訊息五十年后,電力才真正得以普及。五十年中,隨著交流電技術(shù)的成熟,電力傳輸過程中的高損耗問題得以解決,便宜、便捷、隨時可用且好用的電力這才順著交流電網(wǎng)進入尋常百姓家。
算力同理。算力距離生產(chǎn)力還有多遠的根本,在于算力是否像電力一樣,可以做到隨取隨用且好用?
目前來看,答案是否定的。
背后的原因主要有三:
第一層原因來自資源的分布不均。
作為算力的主要承載,數(shù)據(jù)中心的成本一般可以拆分為兩部分,建設(shè)以及運營。建設(shè)成本主要是土建、服務(wù)器采購等固定成本;一般來說,西部由于人力成本、土地成本的低廉,在建設(shè)成本端,較東部地區(qū)具備較大優(yōu)勢。
運營成本,則可以拆分為運維費、管理費用、電費等,運維以及管理費用一般僅占運營成本的兩成;而電費則可以占據(jù)運營成本的五成,甚至更多。
但電費同樣存在著嚴重的東西差異。近幾年來,在西部,火電發(fā)達的內(nèi)蒙古,僅需0.5元,風電光伏發(fā)達的新疆不到0.4元,水電發(fā)達的四川,川藏交界處的電價更是可以低至0.2元。隨著經(jīng)濟的高速發(fā)展,大部分東部地區(qū),工業(yè)電價已經(jīng)在0.8-0.9元每度上下浮動,用電荒與高電價之下,部分東部地區(qū)甚至一度把數(shù)據(jù)中心作為高能耗產(chǎn)業(yè)而限制其發(fā)展。
也是因此,優(yōu)質(zhì)的算力資源呈現(xiàn)出了在西部的區(qū)域性集中。
第二層原因則來自供需的不平衡。
與西部具備優(yōu)質(zhì)資源形成鮮明對比,全國80%的算力需求都集中在東部地區(qū)。這就造成了一個問題:西部空有資源,缺乏需求;而東部需求爆炸,但缺乏優(yōu)質(zhì)普惠的算力資源。
為了對接?xùn)|部的需求與西部的算力,今年2月以來,國家發(fā)展改革委、中央網(wǎng)信辦、工業(yè)和信息化部、國家能源局聯(lián)合印發(fā)文件,在全國八大地區(qū)建設(shè)算力樞紐節(jié)點,并規(guī)劃了十大國家數(shù)據(jù)中心集群,促進西部算力支持東部數(shù)據(jù)運算,東數(shù)西算工程正式開啟。
不過,不是數(shù)據(jù)中心建好,就萬事大吉。海量數(shù)據(jù)從東部傳送至西部,計算結(jié)果再從西部轉(zhuǎn)回東部,中間首先需要做好應(yīng)用與算力之間的精準連接;其次,對于分散各處、橫跨中國的零散算力,還需要通過在架構(gòu)、網(wǎng)絡(luò)層面做好統(tǒng)一協(xié)調(diào),將整個算力作為一個整體對外提供服務(wù),算網(wǎng)連接算力,解決算力分配不均的必要環(huán)節(jié)。
第三層原因則在于算力類型的千差萬別。
雖然都是算力,但算力來源上,復(fù)雜的任務(wù),需要更高的CPU算力,自動駕駛、數(shù)據(jù)分析需要更簡單高效的GPU算力;算力應(yīng)用上,互聯(lián)網(wǎng)、制造、科研、農(nóng)業(yè)、天文、金融,不同行業(yè)需要不同的算力。互聯(lián)網(wǎng)行業(yè)需要時常應(yīng)對雙十一等活動的高并發(fā),制造需要極度的穩(wěn)定;農(nóng)業(yè)需要更低的成本;金融需要超高的安全性……這中間的根本問題在于,面對不同的算力與需求,要如何同時滿足?
總結(jié)來說,只有做好了算力與應(yīng)用的連接適配,讓算力加速應(yīng)用的運行,算力才能真正產(chǎn)生價值,成為真正的生產(chǎn)力。
02、方向:算力將去往何方
一個不為人知的故事是,在電力發(fā)展的初期階段,如今隨處可見的燈泡其實是一個罕見商品。但很快,聰明的工廠主們發(fā)現(xiàn)了一件事,用燈泡照明,那么所有生產(chǎn)力的勞動時間將會被極大提高,夜間勞作,解放生產(chǎn)力,也就成為了可能。
同時,也正是隨著燈泡這一超級應(yīng)用出現(xiàn),電力開始在全球范圍內(nèi)風靡,帶動了產(chǎn)業(yè)乃至生產(chǎn)模式的巨大變革。
正如T型車之于石油,電燈之于電力,算力普及成為生產(chǎn)力的另一個前提,是超級應(yīng)用的出現(xiàn)。
那么對于算力來說,超級應(yīng)用究竟是什么?業(yè)內(nèi)的一個共識是:科學(xué)計算(理化生、氣象天文等)、工程計算(CAD、EDA等)、智能計算(深度學(xué)習、自動駕駛等),正是算力成為生產(chǎn)力的超級應(yīng)用。
比如疫情期間,一個名叫Folding@home的蛋白質(zhì)動力學(xué)模擬項目,積累的算力一度突破1 exaflops(每秒100億億次浮點運算),并成功完成了新冠病毒S蛋白的第一張結(jié)構(gòu)圖。自動駕駛領(lǐng)域,原生的Robotaxi算法需要的算力更是高達數(shù)百乃至上千T,對算力的需求和高性能硬件的高成本,已然成為自動駕駛落地階段最大的掣肘。
不難發(fā)現(xiàn),這些超級應(yīng)用,對算力的需求,并不只是簡單的服務(wù)器部署就能解決的,而是需要同時解決高密計算+人工智能+不同領(lǐng)域的專業(yè)知識的不同需求。
落到對算力本身的需求上,就需要能夠同時做到巨量計算、多元計算以及專用計算。
所謂巨量計算,主要應(yīng)對的是現(xiàn)如今機器學(xué)習領(lǐng)域最為流行的大模型趨勢。
最典型的應(yīng)用在于,OpenAI發(fā)布的GPT-3模型,其所擁有的參數(shù)高達1750億,使用的最大數(shù)據(jù)集在處理前容量可以達到45TB,訓(xùn)練過程需要355個GPU年的算力(一塊GPU運行355年的算力)。但很顯然,并不可能真的只用一塊顯卡跑355年,為了OpenAI的訓(xùn)練,微軟直接構(gòu)建了一個包含一萬塊GPU的分布式集群,其中單次的訓(xùn)練費用可以高達460萬美元。
不過,不是所有企業(yè)都像微軟財大氣粗,可以一擲千金買下一萬塊顯卡,并且具備長期的巨量運算需求,因此借助于云計算、智算中心,就成了一個明確的行業(yè)趨勢。
多元計算也很好理解,在不同業(yè)務(wù)類型當中,對于算法、模型以及芯片、計算系統(tǒng)的需求其實不盡相同,這就需要算力本身具備多元計算能力。
氣象預(yù)測、蛋白質(zhì)結(jié)構(gòu)模擬領(lǐng)域,需要更高的精度,否則就是一次極端天氣預(yù)測的失誤,人類自我認知的偏差。電商領(lǐng)域,典型特征是計算量大、規(guī)則多,但計算本身相對簡單,屬于典型的數(shù)據(jù)密集型計算。Alpha go 、人臉識別等典型的AI訓(xùn)練,則對精度要求不高,但需要大量的數(shù)據(jù)投喂,最終做到以最快的速度最低的成本實現(xiàn)規(guī)?;渴?。金融領(lǐng)域,則不僅需要快速,更需要絕對的安全。
可以說,多元算力支撐,是促進算力在千行百業(yè)落地開花的根本保證。
專用計算同理,理論上,一塊CPU可以解決大部分計算問題,但在現(xiàn)實中,針對復(fù)雜運算,需要更多的CPU,出于成本、效率等等原因,自動駕駛,我們選擇通用的GPU芯片,谷歌訓(xùn)練alpha GO時會選擇自己的TPU芯片,不同的計算,需要專門的算力。
就比如,在科學(xué)領(lǐng)域,算力經(jīng)常被用于基因測序以及蛋白質(zhì)結(jié)構(gòu)模擬,這也是突破人類對自我認知的第一步。一個最基礎(chǔ)的生物學(xué)常識是,氨基酸構(gòu)成多肽,多肽不同的空間結(jié)構(gòu)形成蛋白質(zhì);也就是說解密蛋白質(zhì),需要對其3D結(jié)構(gòu)進行還原,如果以枚舉法測算蛋白質(zhì)結(jié)構(gòu),那么將消耗10的300次冪的搜索空間。過去五十多年,我們僅解析了17%的人類蛋白質(zhì)。
但是基于專用算力的加持,算力系統(tǒng)的處理器、內(nèi)存帶寬、網(wǎng)絡(luò)、運算方式、系統(tǒng) I/O、存儲被全面升級,如今AlphaFold2算法已經(jīng)可以對出98.5%的人類蛋白質(zhì)結(jié)構(gòu)進行預(yù)測,并具備六成的可信度。
也就是說,只有服務(wù)好專用的計算需求,才能做好真正的落地,解決不同場景中的實際問題。
當然,巨量、多元、專用,挑出任何一個,看似都不是什么大問題,但對于現(xiàn)實業(yè)務(wù)來說,這三個要求,往往不是一個三選一,而是我都要。
03、解法:全國一體化算力服務(wù)平臺的長路
如何做好需求與算力的連接,同時滿足巨量、多元、專用的算力需求,讓算力突破成為新時代的生產(chǎn)力?
作為算力服務(wù)賽道領(lǐng)軍企業(yè),曙光智算給出的參考答案是,將過去多年建設(shè)中留下的寶貴算力資源,用高速網(wǎng)絡(luò)統(tǒng)籌連接;通過統(tǒng)一的算網(wǎng)中樞,智能判斷不同任務(wù)需要哪些不同的算力,為無論身處任何位置、任何行業(yè)的用戶,提供最合適的資源;最后,根據(jù)科學(xué)計算、工程計算、智能計算等不同的需求,提供多元、巨量且專用的服務(wù)。
將這一套組合拳,拆解來看:
針對算力分配不均、供需不平衡這兩大門檻。曙光智算推出了“全國一體化算力服務(wù)平臺”,最大的特點就是在于具備一體化的架構(gòu),可以將不同資源池、不同地域的計算資源匯聚,通過計算服務(wù)總線,滿足不同用戶的不同需求。
翻譯一下,就是搭建了一張電網(wǎng)一樣的“算網(wǎng)”。從前你在東部用數(shù)據(jù)中心,那么哪怕東部電價也貴、地價也貴,你也得把數(shù)據(jù)中心蓋在東部,類似在哪里用電,就在旁邊蓋電廠。
現(xiàn)在,有了“全國一體化算力服務(wù)平臺”,東部要用算力,但機房其實就蓋在低成本的西部。或者更復(fù)雜一點的,需要及時反饋的算力放在東部,不著急取用的算力放在西部。整體的算網(wǎng)結(jié)構(gòu),就像一條特高壓線路+錯綜復(fù)雜的電網(wǎng),把西部源源不斷的優(yōu)質(zhì)電力,輸送到東部。
解決了連接問題后,如何讓更好的服務(wù)超級應(yīng)用,同樣是一門學(xué)問。
針對不同需求算力的千差萬別,曙光智算選擇將不同算力所需的不同芯片、服務(wù)器、軟件架構(gòu)全部隱去,以API接口的形式,將其包裝成一個打開即用的產(chǎn)品,讓用戶零門檻的享受算力、算網(wǎng)、算能服務(wù)。正如同我們并不需要知道電力如何在電網(wǎng)中流轉(zhuǎn),以及中間經(jīng)歷過多少次變頻變壓,插上插頭就能隨時用電。
當然,做好產(chǎn)品封裝只是第一步,畢竟只有產(chǎn)品不一定能解決所有問題。就像給一個普通人一把廚神專用廚具,也做不出滿漢全席。因此做好算力服務(wù)網(wǎng)絡(luò),還需要做好產(chǎn)品以及相關(guān)的服務(wù)。
“全國一體化算力服務(wù)平臺”的思路是,結(jié)合上下游一同發(fā)力,為客戶提供包含技術(shù)培訓(xùn)、營銷支持等等一系列的解決方向。相當于為客戶用電網(wǎng)通好了電,還同時附送好了插頭,以及使用說明書,提供全流程服務(wù)。
但這就夠了嗎?顯然不是。給了用戶說明書,也依然會出現(xiàn)家里突然跳閘、短路,再或者家里有大功率用電需求需要電路改造,這怎么辦?
應(yīng)對這一層面的需求,曙光智算可以提供標準化運營、隨時響應(yīng)的一站式服務(wù)還有統(tǒng)一的平臺,相當于家里用電出了任何問題,打個電話,供電局就有專門的電工上門服務(wù),提供高質(zhì)量售后。
基于“全國一體化算力服務(wù)平臺”低門檻、產(chǎn)品化的算力服務(wù),越來越多的技術(shù)與應(yīng)用突破逐漸誕生:
“全國一體化算力服務(wù)平臺”自規(guī)劃到上線以來,短短一年時間里,平臺的作業(yè)提交量已經(jīng)突破3000萬,用戶數(shù)量突破10萬個。
以時下熱門的測序技術(shù)為例,隨著全球基因組數(shù)據(jù)以指數(shù)級別飛速增長,全國一體化算力服務(wù)平臺通過為生命科學(xué)領(lǐng)域研究提供全棧算力及云存儲基礎(chǔ)設(shè)施解決方案,以及兼具彈性及個性化的計算、網(wǎng)絡(luò)、存儲等資源,與高性能、易擴展的數(shù)據(jù)計算、存儲與網(wǎng)絡(luò)設(shè)施,越來越多的企業(yè)與科研機構(gòu),得以擺脫建設(shè)、維護、升級算力中心的煩惱,將精力放在主營業(yè)務(wù)以及科研之上,卸掉包袱全力奔跑,AI for Science成為課程,人類解密自身得到了最基礎(chǔ)的算力支撐。
除此之外,通過“全國一體化算力服務(wù)平臺”提供的對計算、存儲、文件傳輸?shù)荣Y源適配定制以及原生的底層資源、市場化的運營機制、開放的生態(tài)體系以及融合多樣的算力供給,菲沙基因糾正了生物學(xué)領(lǐng)域一直以來認為黃花菜含有秋水仙堿的誤判;安徽省得以在汛期內(nèi)也能為用戶精準氣象監(jiān)測預(yù)報;復(fù)旦大學(xué)類腦科學(xué)與技術(shù)研究院完成了860億神經(jīng)元類腦計算,上海交大宇宙學(xué)團隊則實現(xiàn)了模擬和再現(xiàn)宇宙……
當然,可能也有人會問,為什么會是曙光智算?
答案也很簡單,因為曙光智算,背后站著的,是來自曙光乃至整個中科院體系這幾十年來對算力的探索,以及對應(yīng)用落地的經(jīng)驗。
當越來越多的企業(yè)站在全國一體化算力服務(wù)平臺的肩膀之上,算力成為生產(chǎn)力的進程,也被按下了加速鍵。
04、尾聲
降低門檻、打造超級應(yīng)用之后,算力的發(fā)展將走向何方?
電力的發(fā)展,或許同樣是一個可以借鑒的路徑。
我們會發(fā)現(xiàn),在當年,電力從發(fā)現(xiàn)到普及,其實歷經(jīng)了足足百年的時光。它的發(fā)現(xiàn)往往只是千里之行的第一步,無論是技術(shù)路線的選擇,超級應(yīng)用的培育,新舊勢力的博弈,新事物的撥云見月,是一個漫長又曲折的過程。
但在此之后,電燈的出現(xiàn),帶來了人們的生產(chǎn)力的提升;電話的出現(xiàn),改變了千年來的通信模式;電機的出現(xiàn),再次將人類解放,機械成為主要的生產(chǎn)力來源;緊接著,電視、電腦、手機、VR、機器人,越來越多的新技術(shù)、新產(chǎn)品在電的基礎(chǔ)之上涌現(xiàn)。
算力也是一樣,即便我們深知目的地所在,但在這個過程中,也會有無數(shù)像巨量運算、多元計算等等問題跳出來拷問我們:這條路能做好嗎?
但與此同時,隨著算網(wǎng)的搭建,我們會看到,越來越多的東部算力需求得以緩解;貴州、四川、內(nèi)蒙古,越來越多的西部地區(qū)最優(yōu)秀的資源,在算力的疏導(dǎo)下得以發(fā)揮更高的效用。經(jīng)濟的發(fā)展,新興職業(yè)的誕生,都隨著算網(wǎng)的搭建成為現(xiàn)實。
算力的爆發(fā),則帶來了越來越多的行業(yè)開始復(fù)制互聯(lián)網(wǎng)、人工智能的奇跡;微觀到基因的排列組合,蛋白質(zhì)的空間結(jié)構(gòu);宏觀到宇宙的組成,天文的預(yù)測,那些從前不敢想,做不到的事情,都因為算力而變得可想、可及,變革著我們最日常的生活,與最底層的認知。
回到一開始的問題,算力距離生產(chǎn)力還有多遠?只要一直在路上,路就不遠。