如何讓AI開發(fā)、落地更容易?這應(yīng)該是每一位AI從業(yè)者關(guān)注的焦點。深度學(xué)習(xí)方法極大提高了機器自學(xué)習(xí)的能力,推動AI應(yīng)用走向爆發(fā)的同時,一個巨大的痛點也浮現(xiàn)出來:深度學(xué)習(xí)的“深”和神經(jīng)網(wǎng)絡(luò)的復(fù)雜度緊密相關(guān),隨著參數(shù)量增大、網(wǎng)絡(luò)模型層數(shù)增多、硬件芯片選型難等問題出現(xiàn),這意味著深度學(xué)習(xí)的開發(fā)和訓(xùn)練難度越來越大。
在3月31日的百度 AI 開放日《AI呀,我去!》第五期線下活動中,百度 AI 技術(shù)生態(tài)總經(jīng)理馬艷軍博士提出,“深度學(xué)習(xí)框架在人工智能整個開發(fā)鏈條中,屬于‘腰部力量’, 它所處的位置非常重要,向下對接芯片、向上支撐各種各樣的應(yīng)用開發(fā)。打造開源開放的框架非常關(guān)鍵,它能夠發(fā)揮巨大的杠桿效應(yīng),使AI和行業(yè)迅速結(jié)合,最終賦能千行百業(yè)?!?/p>
?
百度 AI 技術(shù)生態(tài)總經(jīng)理 ?馬艷軍博士
國產(chǎn)深度學(xué)習(xí)框架如何從國際競爭中突圍?
在全球深度學(xué)習(xí)領(lǐng)域,開發(fā)者主要基于谷歌TensorFlow、臉書PyTorch等國外深度學(xué)習(xí)框架進行人工智能算法、模型的開發(fā)、訓(xùn)練與部署。
事實上,深度學(xué)習(xí)框架自主可控的重要性不亞于芯片。如果中國開發(fā)者主要依賴于國外框架進行研發(fā),這將面臨著核心技術(shù)容易形成代差、技術(shù)封鎖的潛在風(fēng)險、國家重要領(lǐng)域數(shù)據(jù)泄露等諸多隱患。
馬艷軍指出,中國自研深度學(xué)習(xí)框架要在國際競爭中取得領(lǐng)先,還有很長的路要走。當(dāng)前我國深度學(xué)習(xí)框架的發(fā)展仍需突破三大關(guān)鍵點:技術(shù)實力、功能體驗、生態(tài)規(guī)模。
首先,技術(shù)創(chuàng)新方面,深度學(xué)習(xí)框架的研發(fā)需要人工智能領(lǐng)域底層技術(shù)人才,我國在這一領(lǐng)域的儲備仍有不足。其次,在應(yīng)用體驗方面,我國是全球產(chǎn)業(yè)鏈最為完備的國家,同時這也意味著產(chǎn)業(yè)體系復(fù)雜。中小企業(yè)雖然有強烈的轉(zhuǎn)型需求,但在應(yīng)用AI的過程中,僅一項技術(shù)應(yīng)用,從實驗室到產(chǎn)業(yè)落地就至少需要 3-6 個月時間,一個低門檻甚至零門檻的開發(fā)平臺極為重要。第三,在開發(fā)應(yīng)用生態(tài)方面,深度學(xué)習(xí)是一個典型的共創(chuàng)型技術(shù)領(lǐng)域,只有構(gòu)建了自己的生態(tài)才實現(xiàn)持續(xù)迭代和發(fā)展。生態(tài)的構(gòu)建絕非易事,周期長、成本高,而且只有當(dāng)國產(chǎn)框架的技術(shù)和功能體驗足以滿足開發(fā)者的需求時,才有機會培育起自主創(chuàng)新的AI開發(fā)應(yīng)用生態(tài)。
正因如此,國產(chǎn)深度學(xué)習(xí)框架的技術(shù)突破,已經(jīng)成為國家戰(zhàn)略層面的關(guān)注焦點。在十四五規(guī)劃中,將科技前沿領(lǐng)域攻關(guān)分為七大項,瞄準(zhǔn)了新一代人工智能、量子信息、生命健康等前沿領(lǐng)域。在核心的“新一代人工智能”領(lǐng)域,明確提出要加強深度學(xué)習(xí)框架、專用芯片領(lǐng)域的科研攻關(guān)。
早在2017年,國家發(fā)改委正式批復(fù),由百度牽頭籌建深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實驗室,這是業(yè)內(nèi)首個也是目前唯一的深度學(xué)習(xí)領(lǐng)域國家工程實驗室,堪稱“深度學(xué)習(xí)國家隊”。百度與清華大學(xué)、北京航空航天大學(xué)、中國信息通信研究院、中國電子技術(shù)標(biāo)準(zhǔn)化研究院等單位共建實驗室。
五年來,深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實驗室已經(jīng)取得了成果,百度產(chǎn)業(yè)級深度學(xué)習(xí)開源開放平臺飛槳就是最核心的成果,讓中國人工智能底層基礎(chǔ)技術(shù)與國際巨頭并駕齊驅(qū),并在部分領(lǐng)域?qū)崿F(xiàn)了國際領(lǐng)先。
飛槳國產(chǎn)芯片適配量第一
對于深度學(xué)習(xí)框架在產(chǎn)業(yè)應(yīng)用中的意義,馬艷軍表示,和PC時代的操作系統(tǒng)Windows、移動互聯(lián)網(wǎng)時代的iOS和安卓類似,深度學(xué)習(xí)框架是智能時代的“操作系統(tǒng)”,和芯片共同構(gòu)成了人工智能底層的基礎(chǔ)設(shè)施。
目前,飛槳已經(jīng)和包括百度昆侖芯、華為昇騰、英特爾、英偉達(dá)在內(nèi)的22家國內(nèi)外硬件廠商,完成了31種芯片的適配和優(yōu)化,覆蓋全部國內(nèi)外主流芯片,國產(chǎn)芯片適配量排名第一。
截至2021年12月,飛槳已經(jīng)沖破了過去在中國市場上谷歌、Facebook的壟斷局面,實現(xiàn)了在中國深度學(xué)習(xí)平臺綜合市場份額第一。目前,飛槳平臺已經(jīng)匯聚了406萬開發(fā)者,創(chuàng)建了47.6萬個 AI 模型,累計服務(wù)15.7萬企事業(yè)單位,覆蓋工業(yè)、農(nóng)業(yè)、醫(yī)療、城市管理、交通、金融等領(lǐng)域。經(jīng)過對大量真實生產(chǎn)場景的反復(fù)打磨,飛槳已經(jīng)能夠使傳統(tǒng)企業(yè)在智能化轉(zhuǎn)型中實現(xiàn)高性能開發(fā)、大規(guī)模訓(xùn)練、不同場景和不同軟硬件平臺的敏捷部署,最大程度幫助企業(yè)降本增效。
助力中國AI產(chǎn)業(yè)走得更快、更遠(yuǎn)
據(jù)馬艷軍介紹,“飛槳”取自于宋代朱熹的詩句“聞?wù)f雙飛槳,翩然下廣津”,“飛槳”直意是“很快的快船”,表達(dá)了希望借助飛槳助推中國AI產(chǎn)業(yè) 走得更快、更遠(yuǎn)。
要實現(xiàn)這一目標(biāo),開源開放是發(fā)展的關(guān)鍵。通過開源開放能夠形成完整的平臺,圍繞這個平臺會有各種各樣的角色來一起做貢獻,最終形成一個越來越完善的工具平臺。基于這一共建的平臺,各方無需重復(fù)造輪子,從而形成良性迭代、共同發(fā)展。
截至2021年,飛槳官方支持的產(chǎn)業(yè)級開源算法模型超過400個,并發(fā)布13個PP系列模型,在精度和性能上達(dá)到平衡,將推理部署工具鏈徹底打通,產(chǎn)業(yè)應(yīng)用能力全方位升級。其中,飛槳企業(yè)版EasyDL平臺作為當(dāng)前應(yīng)用和落地最廣泛的AI開發(fā)平臺,全新升級模型部署能力,自動又高效,5分鐘就可讓邊緣硬件如機器狗學(xué)會手勢識別的新技能。飛槳EasyDL桌面版更是實現(xiàn)了一鍵極速安裝、本地高效建模,讓AI真正變得“觸手可得”。
隨著AI和實體產(chǎn)業(yè)進行更廣泛、更深度的碰撞和融合,未來的挑戰(zhàn)依然艱巨。馬艷軍表示,下一個十年,飛槳會看到更多機會,也會激發(fā)更多創(chuàng)新,但是要始終保有“板凳甘坐十年冷”的心態(tài)和意識,繼續(xù)專注于深度學(xué)習(xí)技術(shù)的積淀,更廣泛地與工業(yè)、農(nóng)業(yè)、能源、城市、科學(xué)計算等多個領(lǐng)域深度結(jié)合,助力各行各業(yè)智能化升級。