在Gartner的《數(shù)據(jù)科學和機器學習平臺魔力象限》報告中,MathWorks連續(xù)兩年都被評為年度領導者。該報告主要針對全球有影響力的機器學習、人工智能平臺進行評估,MathWorks 作為數(shù)學計算軟件開發(fā)商,主要有MATLAB 和Simulink兩大類產(chǎn)品平臺。MATLAB 被稱為“科學家和工程師的語言”,是一個集算法開發(fā)、數(shù)據(jù)分析、可視化和數(shù)值計算于一體的編程環(huán)境;Simulink 則是一個模塊化建模環(huán)境,面向多域和嵌入式工程系統(tǒng)的仿真和基于模型的設計。目前,這兩類產(chǎn)品平臺被廣泛用于軍工、航空、航天、半導體等20幾個行業(yè),用于人工智能、大數(shù)據(jù)處理、仿真設計等工作。
作為全球領先的數(shù)學計算軟件開發(fā)商,2020年起每年追蹤并發(fā)布全球人工智能發(fā)展趨勢,已經(jīng)成為MathWorks的慣例。日前,MathWorks最新發(fā)布了對2022年以后的十大人工智能趨勢預測,MathWorks中國區(qū)行業(yè)市場經(jīng)理李靖遠(Jason)接受了<與非網(wǎng)>等媒體采訪。
趨勢一:人工智能在工程和科學學科、整個行業(yè)和學術(shù)界廣泛普及
盡管落地應用、發(fā)展現(xiàn)狀有一定區(qū)別,但人工智能確實已經(jīng)在很多行業(yè)蓬勃發(fā)展。在智能家居、自動駕駛、機器人、網(wǎng)絡安全、醫(yī)療設備等新興行業(yè)中,得益于良好的數(shù)字化技術(shù)基礎,人工智能的發(fā)展和落地較為領先。在數(shù)字化基礎相對落后一些的傳統(tǒng)行業(yè),例如電力、化工等領域,人工智能、大數(shù)據(jù)、數(shù)字化的普及與轉(zhuǎn)型可以說正處在起步階段,還需要大量的數(shù)字化積累。
趨勢二:AI將工程、計算機科學、數(shù)據(jù)科學和IT部署整合起來
人工智能可以將工程、計算科學、數(shù)字科學和IT部署聯(lián)合起來,而之前這些是彼此相對獨立的。包括傳統(tǒng)意義所指的開發(fā)流程、部署流程和企業(yè)運營流程,它們將通過人工智能、無代碼、低代碼等趨勢緊密結(jié)合在一起,形成有機整體。低代碼、無代碼的工具在進行建模仿真之后,可以自動地生成代碼,然后再部署到CPU/MCU/GPU/FPGA等多種類型的邊緣設備之上。
趨勢三:模型可解釋性有助于增強在安全關鍵系統(tǒng)中使用人工智能的信心
在航空航天、軍工等安全關鍵領域中,對于機械模型設計、虛擬仿真技術(shù)的要求,是所涉及到的模型必須具備清晰的可解釋性,才會導入應用。但一直以來,人工智能通過機器學習、深度學習等算法生成的模型,在可解釋性方面不如直接建模清晰,被視作一種黑盒式的系統(tǒng)建模方法。隨著人工智能的發(fā)展,模型的可解釋性也在不斷提高,也將在更多的注重高安全的關鍵領域得以應用。
趨勢四:仿真和測試將邁入三維時代且更加逼真
仿真和測試不只是局限于自動駕駛、機器人、虛擬現(xiàn)實等環(huán)節(jié),甚至醫(yī)療行業(yè)等應用場景中,人工智能會推動更多的3D仿真和測試技術(shù)的應用,使得場景更加真實、可靠、具體。
趨勢五:將有更多的AI模型部署到更多低功耗、低成本的嵌入式設備中
將有更多的人工智能模型部署到更低功耗、更低成本的系統(tǒng)設備中。日常生活中,大到飛機、汽車,小到家用電器,都內(nèi)置著大量的嵌入式系統(tǒng)。在2014年前后,大部分的人工智能算法都需要基于GPU甚至GPU集群進行訓練,受限于硬件算力,之前部署到這些設備上較為困難。但是隨著越來越多的方法可以將AI整合到更多邊緣系統(tǒng),從FPGA到MCU,更多低成本、低功耗設備得到了廣泛的硬件支持,并為工程師所用。
借助量化和剪枝等方法減小要部署的模型,并采用深度學習社區(qū)提供的高效預訓練模型,可以實現(xiàn)AI的高效部署,并能夠讓基于AI的系統(tǒng)在今后得到更為廣泛的應用。
趨勢六:人工智能幫助應對全球挑戰(zhàn)
不論是傳染病大流行還是氣候變化,還有能源問題、包括碳中和方向,人工智能都在幫助人類應對全球挑戰(zhàn)。越來越多的科學家在使用MATLAB數(shù)據(jù)處理和AI算法分析新冠病毒的流行趨勢,對大氣進行長期的空氣質(zhì)量監(jiān)測,利用數(shù)據(jù)分析大氣的氣候變化等等。
趨勢七:以數(shù)據(jù)為中心的人工智能
以往的很多人工智能應用專注于模型和算法本身,但從2019年開始,相關研究方向開始專注于改善提供給模型和數(shù)據(jù)管理系統(tǒng)的數(shù)據(jù),也就是說要給予模型更好更優(yōu)的算法、更優(yōu)的數(shù)據(jù),數(shù)據(jù)的優(yōu)化代表著能產(chǎn)生更優(yōu)秀的模型。
趨勢八:無代碼/低代碼/自動編碼:為擴大AI用戶群體帶來巨大好處
無代碼、低代碼和自動編碼等應用,為AI的普及帶來助推力。傳統(tǒng)的行業(yè)領域有很多專家,不過他們的經(jīng)驗往往集中于自己的垂直領域。如何讓他們快速將人工智能算法與自身擅長的領域相結(jié)合?無代碼和低代碼就起到了關鍵作用,利用MathWorks所提供的深度學習、機器學習,包括強化學習工具箱,專家們就算并不擅長編程,也能很快地掌握無代碼/低代碼的人工智能學習方案。
趨勢九:AI驅(qū)動跨框架、跨平臺和多學科團隊之間的協(xié)作
目前AI框架類型較多,比如Tensorflow、PyTorch、Keras、Caffe等,這些框架各自專注的領域往往不同,沒有任何一個框架可以解決所有問題,因此跨框架的協(xié)同和互操作非常重要。MathWorks通過以MATLAB/Simulink為基礎平臺,將其他框架中的算法導入MATLAB/Simulink中,使之成為整個大系統(tǒng)仿真的一部分,以此來促進不同學科之間的交流,以及整個平臺系統(tǒng)級的仿真。
趨勢十:人工智能大量用于應用科學研究
從人工智能的發(fā)展趨勢來看,應用學科越來越成為新的熱點應用。例如遷移學習使研究人員更容易在工作中應用人工智能,他們只需在實際應用中對訓練好的模型進行一定幅度的微調(diào),就可以快速地部署在實際場景中。此外,研究人員利用GAN等技術(shù)生成對抗網(wǎng)絡,以及通過PIML促進機器學習和物理知識的融合等,都是新技術(shù)在應用學科研究方向的案例。
MathWorks在企業(yè)人工智能工程領域的進展?
海量大中小型企業(yè)是人工智能應用的積極實踐者,特別是對于那些具有一定規(guī)模和行業(yè)地位的企業(yè),已經(jīng)走在了應用前列。顯然,針對這些用戶的工具、服務等,都非常重要。
在MathWorks官網(wǎng)上,僅使用MATLAB AI解決工程問題的案例就超過了100個。MathWorks提供的機器學習和深度學習工具箱,也已經(jīng)滲透到各類企業(yè)行業(yè)應用的方方面面,例如日本Daihatsu公司分析汽車發(fā)動機產(chǎn)生爆震的原因;三星公司研究降低無線通信電路的噪音;韓國能源研究所對風機,尤其是海上風機進行故障監(jiān)測……
針對企業(yè)級部署需求,MathWorks在開發(fā)側(cè)推出了MATLAB Production Server和Web App Server,配合海量數(shù)據(jù)處理、無代碼/低代碼建模系統(tǒng)軟件、自動化代碼生成,能夠幫助運維人員將算法快速部署在企業(yè)IT/OT系統(tǒng)中,做到開發(fā)和運營一體化部署。
對于現(xiàn)階段的AI應用來說,數(shù)據(jù)仍是重中之重。除了數(shù)據(jù)的獲取,對不同數(shù)據(jù)類型的分類、標注,對于下一階段的處理應用非常關鍵。如果能夠自動為數(shù)據(jù)標注標簽,之后再對其進行訓練、調(diào)優(yōu)以及可視化,不僅能夠提高工作效率,對于更精準的訓練、應用都大有裨益。
MathWorks在這方面提供了完整的AI工具鏈,除了“打標簽”,還包括對采集到的數(shù)據(jù)進行預處理,例如通過算法擬合補充丟失的數(shù)據(jù),過濾“臟”數(shù)據(jù)等等,之后再進行人工智能的建模、仿真、測試和部署。據(jù)李靖遠介紹,企業(yè)級AI應用比較復雜,因此跨平臺、跨框架的支持必不可少,為了方便在各個平臺中互相調(diào)用,增強互操作性。MATLAB還針對幾種主流框架提供了導入器工具,Tensorflow、Keras、 Caffe、Pytorch等框架中的模型可以通過導入器自動進入MATLAB中,形成系統(tǒng)級仿真。
降階模型和邊緣AI趨勢
李靖遠強調(diào)了一個重要趨勢:今后將使用一些降階模型去替代高保真仿真模型,來加速仿真速度。由于很多非線性系統(tǒng),包括流體力學中的多維系統(tǒng),在實際仿真過程中需要的并不是高保真仿真模型,而是整個系統(tǒng)模型的輸入、輸出要盡量接近真實。此時,就可以用降階模型作為系統(tǒng)的一部分來加快仿真速度。
不過,目前一些降階技術(shù)還是需要結(jié)合具體的系統(tǒng)來實現(xiàn)最適合的方案,并不是對所有系統(tǒng)都具備普適性。據(jù)李靖遠介紹,目前降階模型的主要適用場景:一是針對非線性模型,傳統(tǒng)意義上很難找到其中的規(guī)律,就可以用人工智能訓練出來的降階模型來替代它;二是在仿真過程中,理想模型與降階模型的吻合度相對比較高,就可以用降階模型替代實際模型進行仿真。當然,這主要是為了提高仿真速度,在仿真效果和仿真速度之間取得的折中平衡,并不適用于所有系統(tǒng)。如果追求高保真的仿真效果,降階模型是不適用的。
針對邊緣AI的應用趨勢,李靖遠表示,現(xiàn)實中有龐大的邊緣系統(tǒng)需求,涉及航空航天、汽車、工業(yè)、通信、家電、醫(yī)療、能源、可穿戴設備、手機、電子手表等等,邊緣AI未來的需求一定是巨大的。
但與此同時,邊緣AI的落地部署仍有三大制約因素:第一是硬件效率的制約,受限于硬件算力、算法效率等原因,一些比較復雜的算法還是不太適合部署在邊緣設備上。第二是AI算法代碼的精煉度,AI算法生成模型,最后代碼是要部署在邊緣設備上,代碼的精煉度可能對邊緣設備的部署有一定影響。第三是AI的產(chǎn)品化,AI算法如何能夠適用于更多的通用場景、部署在更多的邊緣設備,也是一個制約因素。要提高通用性,勢必要增加代碼,對算力的要求會更高,因此會對部署產(chǎn)生一定的制約。