加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 01
    • TinyML+ AutoML 的價值何在?
    • 02
    • 什么是 AutoML?
    • 03
    • 應(yīng)用場景有哪些?
    • 04
    • 初創(chuàng)公司&各類資源
    • ---- 寫在最后 ----
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

物聯(lián)網(wǎng)領(lǐng)域正涌入大批不領(lǐng)工資的“數(shù)據(jù)科學家”【物女心經(jīng)】

2020/06/01
114
閱讀需 23 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

導(dǎo)? 讀:TinyML 是指在毫瓦(mW)功率范圍以下的設(shè)備上,實現(xiàn)機器學習的方法、工具和技術(shù)。這里的關(guān)鍵詞是“毫瓦功率范圍以下的設(shè)備”。TinyML 功耗極低,不僅適用于邊緣硬件,還可用于物聯(lián)網(wǎng)終端設(shè)備,支持各種不同的電池驅(qū)動的設(shè)備,和需要始終在線的應(yīng)用。最近 TinyML 與 AutoML 正在快速融合,構(gòu)建嵌入式自動化機器學習算法,發(fā)揮更大的效力。

? ??

AIoT 智聯(lián)網(wǎng)是 AI(人工智能)和 IoT(物聯(lián)網(wǎng))技術(shù)在實際應(yīng)用中的落地融合。近年來,智聯(lián)網(wǎng) AIoT 一詞熱度劇增,她正在以極快的速度從襁褓中的嬰兒長大成人。

昨天,All inAIoT 還是單個企業(yè)的市場宣言;今天,AIoT in All 已經(jīng)成為各行各業(yè)嘗試轉(zhuǎn)型以及尋找下一增長點的主力。

根據(jù)中國信息通信研究院統(tǒng)計預(yù)測數(shù)據(jù)顯示,2020 年全球人工智能市場將達到 6800 億元人民幣。據(jù)研究機構(gòu) Markets and Markets 在 2019 年發(fā)布的報告稱,2019 年全球 AIoT 市場規(guī)模為 51 億美元。到 2024 年,這一數(shù)字將增長至 162 億美元,復(fù)合年增長率為 26.0%。

AIoT 的成熟,一方面需要企業(yè)的重視與投入,另一方面需要技術(shù)的支撐與迭代。上周,我們談到阿里投百億加速 AIoT 布局的“大手筆”;這周,我們來看看 AIoT 的領(lǐng)域吹起的技術(shù)“新風向”。

在文章《一文讀懂即將引爆的 TinyML:在邊緣側(cè)實現(xiàn)超低功耗機器學習》中,我曾經(jīng)介紹過一個新趨勢:TinyML,并提到將會持續(xù)追蹤 TinyML 的進展。

TinyML 是指在毫瓦(mW)功率范圍以下的設(shè)備上,實現(xiàn)機器學習的方法、工具和技術(shù)。這里的關(guān)鍵詞是“毫瓦功率范圍以下的設(shè)備”。TinyML 功耗極低,不僅適用于邊緣硬件,還可用于物聯(lián)網(wǎng)終端設(shè)備,支持各種不同的電池驅(qū)動的設(shè)備,和需要始終在線的應(yīng)用。

這些設(shè)備包括智能攝像頭、遠程監(jiān)控設(shè)備、可穿戴設(shè)備、音頻采集硬件以及各種傳感器等…TinyML 是一個新興領(lǐng)域,是快速增長的機器學習技術(shù)和應(yīng)用,是一片巨大的、未被充分開發(fā)的藍海。

最近 TinyML 與 AutoML 正在快速融合,構(gòu)建嵌入式自動化機器學習算法,發(fā)揮更大的效力。

AutoML 全稱是 Automated Machine Learning,自動化機器學習,這是 2014 年以來,機器學習和深度學習領(lǐng)域最炙手可熱的領(lǐng)域之一。

我們都知道,機器學習的應(yīng)用需要大量的人工干預(yù),這些人工干預(yù)表現(xiàn)在:特征提取、模型選擇、參數(shù)調(diào)節(jié)等各個方面。AutoML 試圖將這些與特征、模型、優(yōu)化、評價有關(guān)的重要步驟進行自動化地學習,使得機器學習模型無需人工干預(yù)即可被應(yīng)用。

就在今年 3 月,谷歌證明了 AutoML 可以走得更遠。根據(jù)谷歌已將代碼開源的 AutoML-Zero,如今有可能僅使用基本的數(shù)學運算作為構(gòu)建塊,就可以自動“進化”為完整的機器學習算法。

因此本文將介紹 TinyML 與 AutoML 相結(jié)合的最新進展,值得你關(guān)注的包括:

TinyML 與 AutoML“攜手”的最大價值體現(xiàn)在哪里?

嵌入式自動化機器學習算法的具體應(yīng)用場景有哪些?

這個領(lǐng)域的初創(chuàng)公司和各類資源的情況如何?

01

TinyML+ AutoML 的價值何在?

21 世紀最性感的工作是什么?

你可能已經(jīng)腦補了五花八門的答案,但《哈佛商業(yè)評論》(Harvard Business Review)認為是“數(shù)據(jù)科學家”。HBR 在文章中寫道,“如果‘性感’意味著擁有非常搶手的稀有品質(zhì),那么數(shù)據(jù)科學家就是?!?/p>

數(shù)據(jù)科學家很難招到、工資很高、更難留住,這也許是每個試圖嘗試 AI 應(yīng)用的物聯(lián)網(wǎng)企業(yè)都會頭疼的問題。

數(shù)據(jù)顯示,在 2018 年,初級數(shù)據(jù)科學家的平均工資為 11.5 萬美元 / 年,能夠管理 10 至 15 人團隊的數(shù)據(jù)科學家則可以拿到 35 萬美元的年薪。

2019 年,全球?qū)?shù)據(jù)科學家的需求量是供應(yīng)量的 1.5 倍。超過 40%的公司認為招聘不到數(shù)據(jù)科學家是嚴重阻礙他們競爭力的原因之一。超過 60%的公司試圖通過內(nèi)部培訓,讓現(xiàn)有員工變身成為數(shù)據(jù)科學家。

在物聯(lián)網(wǎng)領(lǐng)域,數(shù)據(jù)科學家除了稀有,還面臨另一個問題:在物聯(lián)網(wǎng)終端,很多 AI 絕技無法施展。分布最廣的物聯(lián)網(wǎng)設(shè)備往往體積很小、電量有限。它們被作為終端硬件,通過嵌入式傳感器采集各種數(shù)據(jù);計算能力有限,對功耗極為敏感。物聯(lián)網(wǎng)領(lǐng)域占比超過 95%以上,都是需要超低功耗、占用極少存儲空間、完成實時數(shù)據(jù)處理的場景。能夠在這類設(shè)備上實現(xiàn)機器學習的人才,更是精英中的高階精英。

TinyML 與 AutoML“攜手”,就是試圖讓物聯(lián)網(wǎng)領(lǐng)域的機器學習,突破人才稀缺和硬件受限的掣肘,讓機器學習算法在物聯(lián)網(wǎng)終端自我進化,讓非技術(shù)人員可以輕松的使用人工智能進行數(shù)據(jù)分析,讓原本“物以稀為貴”的機器學習以親民的方式“飛入百姓家”。

02

什么是 AutoML?

為了更好的理解 AutoML,清華校友翟偉所在公司 Qeexo 通過一個有趣的對比進行了解釋。

在某種程度上,人工智能與印刷術(shù)非常相似,它們的誕生都是人類歷史上的巨大轉(zhuǎn)折,而且演進過程也有一定的可比性。

印刷術(shù)發(fā)明之前,文化的傳播主要靠手抄的書籍。手抄費時、費事,又容易抄錯、抄漏,既阻礙了文化的發(fā)展,又給文化的傳播帶來不應(yīng)有的損失。

就像在人工智能誕生之前,工程師們要自己寫計算程序完成數(shù)據(jù)分析,不僅效率低而且有可能存在很多誤判。

印章和石刻給印刷術(shù)提供了直接的經(jīng)驗性啟示,用紙在石碑上墨拓的方法,直接為雕版印刷指明了方向。

雕版印刷的版料,一般選用紋質(zhì)細密堅實的木材,然后把木材鋸成一塊塊木板,把要印的字寫在薄紙上,反貼在木板上,再根據(jù)每個字的筆劃,用刀一筆一筆雕刻成陽文,使每個字的筆劃突出在板上。木板雕好以后,就可以印書了。

就像在人工智能的初始階段,工程師們?yōu)槊總€用例,從零開始寫機器學習的代碼,一個用例對應(yīng)一塊“雕版”,在不同用例之間代碼很難重復(fù)利用,靈活性差、對工程師的技藝要求高。

活字制版避免了雕版的不足,只要事先準備好足夠的單個活字,就可隨時拼版,大大地加快了制版時間?;钭职嬗⊥旰螅梢圆鸢妫钭挚芍貜?fù)使用,且活字比雕版占有的空間小,容易存儲和保管。這樣活字的優(yōu)越性就表現(xiàn)出來了。

就像隨著人工智能的發(fā)展,工程師們開始使用解耦的思維,使用現(xiàn)有的機器學習模塊與框架活用拼湊 AI。這個階段開發(fā)一個上手的應(yīng)用或許很簡單,但是要開發(fā)真正的產(chǎn)品卻很難,需要一個團隊的專業(yè)人士,花費幾個星期的時間完成。

而現(xiàn)在,我們每個人都知道如何使用電腦打字,并使用打印機將文稿印出。

AutoML 就是試圖將人工智能也帶入到同樣階段的做法,讓一位非專業(yè)人士,花費幾分鐘的時間,即可完成多個人工智能模型。在這個階段,合適的 AutoML 工具是關(guān)鍵。

谷歌最近發(fā)布了一篇論文名為《AutoML-Zero:從零開始的自動機器學習》,AutoML-Zero:Evolving Machine Learning Algorithms From Scratch。

AutoML-Zero 這個名字難免讓人產(chǎn)生聯(lián)想。當年 AlphaGo 戰(zhàn)勝了人類最強棋手,但前提是它先學會了人類棋譜,離不開人類指導(dǎo)。接著谷歌又推出了 AlphaGo Zero,只讓 AI 知道圍棋規(guī)則,從零開始學下棋,結(jié)果再次登上棋藝頂峰。

AutoML-Zero 似乎想要證明,既然 AI 能從零學習圍棋,也可以從零開始摸索機器學習算法。

谷歌這篇論文的全文可以通過文末的提示下載閱讀。

現(xiàn)在谷歌已將 AutoML-Zero 的開源程序提交到 GitHub,普通電腦只需 5 分鐘就能體驗一下它的實際效果。GitHub 網(wǎng)址:

https://github.com/google-research/google-research/tree/master/automl_zero

03

應(yīng)用場景有哪些?

目前一些智能可穿戴設(shè)備,包括智能耳機和智能手表已經(jīng)在使用相關(guān)技術(shù)。通過加速度傳感器陀螺儀輔以相應(yīng)的嵌入式自動化機器學習算法,可以更好的分析用戶行為,并且支持自定義手勢創(chuàng)建、情境感知、活動分類、步態(tài)分析,提供更加貼合用戶自身的服務(wù)。

智能家居也是應(yīng)用場景之一。智能水壺和智能灶臺可以通過聲學傳感器和算法,檢測水是否燒開、燒開的水是否溢出、壺和鍋的溫度有沒有過高。還可以監(jiān)測智能微波爐中的玉米花是否爆開,以便及時關(guān)閉設(shè)備。

當然,你也許會想,這些場景都是“小兒科”,只有在最復(fù)雜的工業(yè)場景中實現(xiàn)應(yīng)用,才能驗證“TinyML+AutoML”嵌入式自動化機器學習算法真正有效。如你所料,有些企業(yè)正在將嵌入式機器學習自動算法用于預(yù)測性維護。

對于預(yù)測性維護(PDM)的發(fā)展階段進行簡單劃分,可分為 4 個階段:

PDM 1.0—反應(yīng)性維護:當問題出現(xiàn)時再來解決它,例如救火。

PDM 2.0—預(yù)防性維護:包括外觀檢測,以及能夠提供更具體、更客觀的有關(guān)機器或系統(tǒng)狀況相關(guān)信息的定期資產(chǎn)檢測。

PDM 3.0—基于規(guī)則的預(yù)測性維護:也就是“狀態(tài)監(jiān)測”。傳感器持續(xù)收集來自設(shè)備的數(shù)據(jù),并根據(jù)預(yù)先設(shè)定的規(guī)則,包含在預(yù)先設(shè)定的臨界值出現(xiàn)時發(fā)出警報。

PDM 4.0—基于機器學習的預(yù)測性維護:依靠大量的歷史數(shù)據(jù)或者測試數(shù)據(jù),結(jié)合為不同情境定制的機器學習算法,預(yù)測錯誤出現(xiàn)的時間和位置,然后發(fā)出警報。

PDM 4.0 是通過先進的分析技術(shù)對資產(chǎn)的技術(shù)條件、使用、環(huán)境、維修歷史、其他類似設(shè)備以及任何可能與之相關(guān)的大數(shù)據(jù)進行分析,預(yù)測未來將會發(fā)生的故障,并最終制定出最有效的預(yù)防措施。

在這個過程中,聽聲能力很重要,就像維護維修專家能夠通過汽車引擎的聲音,來診斷車輛的問題一樣,工業(yè)設(shè)備如果擁有了一雙遠程的“順風耳”,結(jié)合振動分析,就可以讓 PDM 方案更精確。聲音同樣還能被用于診斷液體泄露、管道腐蝕和液位測量。

PDM4.0 還面臨一個規(guī)?;瘧?yīng)用的窘境,由于每個設(shè)備的安裝條件、載重性能和外部環(huán)境都不相同,單一的 AI 模型可能無法在類似的電機上批量復(fù)制。

TinyML+AutoML 使用時間序列傳感器,包括模擬和數(shù)字麥克風,可以自適應(yīng)的創(chuàng)建 AI 模型。通過聲音傳感與分析,有助于識別預(yù)測性維護應(yīng)用的問題。

04

初創(chuàng)公司&各類資源

關(guān)于 TinyML+AutoML,有很多現(xiàn)成的工具和軟件可以使用,物聯(lián)網(wǎng)企業(yè)不需要招聘昂貴的數(shù)據(jù)科學家,也不需要擴充團隊,就可以初步嘗試。

這里介紹比較有代表性的初創(chuàng)公司和資源,包括 QEEXO、MindsDB 和 Cartesiam。

QEEXO

這家公司成立于 2012 年,總部位于加利福尼亞州山景城,機器學習的研發(fā)團隊位于賓夕法尼亞州匹茨堡,在北京和上海擁有工程師團隊。

目前已經(jīng)有 260 多種硬件平臺,超過 3 億臺設(shè)備,搭載了 QEEXO 的機器學習引擎。

知名的包括在華為手機中嵌入的指關(guān)節(jié)操作技術(shù)。

指關(guān)節(jié)操作功能通過使用指關(guān)節(jié)在屏幕上敲擊或勾畫,快速調(diào)用系統(tǒng)功能,支持利用指關(guān)節(jié)雙擊全屏截屏、敲擊并畫圈局部截屏、敲擊并畫字母 S 滾動截屏、雙指關(guān)節(jié)雙擊錄屏、直線分屏等 5 種手勢操作。今年 5 月,榮耀發(fā)布了新機榮耀 X10,指關(guān)節(jié)操作功能首次下放給了“千元機”。

QEEXO 與瑞薩電子等領(lǐng)先硬件廠商進行合作,完成了多種硬件的適配。QEEXO 可支持 Arm Cortex – M0 到 M4 核的單片機,如瑞薩 RA6M3 組單片機產(chǎn)品。

據(jù)悉,QEEXO 的自動機器學習算法將在亞馬遜 AWS 上架,以 SaaS 年度訂閱的方式提供服務(wù),并將在下周周一,6 月 8 日進行全球商用版 Qeexo AutoML 的正式發(fā)布。

MindsDB

MindsDB 公司成立于 2017 年,總部位于加利福尼亞州伯克利,源自美國加州大學伯克利分校的研究項目,其同名服務(wù)已在 GitHub 上發(fā)布開源版本。GitHub 網(wǎng)址:

https://github.com/mindsdb/mindsdb#mindsdb

最近 MindsDB 完成了一筆 300 萬美元的融資,用于擴充團隊和驗證商業(yè)模式。

Cartesiam

Cartesiam 公司創(chuàng)立于 2016 年,總部位于法國土倫,商務(wù)運營中心位于巴黎和紐約,主要實現(xiàn)讓普通的 ARM 微控制器都能運行的無監(jiān)督學習 AI。

今年 2 月,Cartesiam 發(fā)布了一個名為 NanoEdge AI Studio 的軟件系統(tǒng),該系統(tǒng)能夠安全地生成 AI 算法,并且生成的算法只需兩分鐘就可在 ARM 微處理器上運行,容量大小僅為 4~16KB RAM。

法國的工業(yè)電子制造商 Eolane 與 Cartesiam 合作推出了一款名為 Bob Assistant 的溫度 / 振動傳感器,主要用于預(yù)測工業(yè)維修。目前,該解決方案已經(jīng)被許多歐洲客戶所采用,成為首個大規(guī)模部署的工業(yè) 4.0 預(yù)測性維護解決方案。

5 月 19 日,Cartesiam 發(fā)布了針對 STM32 開發(fā)板優(yōu)化的新版 NanoEdge AI Studio 軟件工具。STM32 是意法半導(dǎo)體開發(fā)的微控制器。新版提供一個新的硬件平臺選項,讓開發(fā)者可以直接選擇意法半導(dǎo)體的 Nucleo-F401RE 或 Nucleo-L432KC 開發(fā)板。在選擇之后,用戶可以解鎖設(shè)計流程的最后一步,下載可在所選硬件平臺上立即運行的自定義機器學習庫。

---- 寫在最后 ----

看似微小的 TinyML 和自我進化的 AutoML 蘊含大機會,物聯(lián)網(wǎng)企業(yè)需要轉(zhuǎn)變的首先是思維,積極擁抱和勇于嘗試,或許就會開辟一番新天地。

【掃碼下方二維碼,下載論文《AutoML-Zero:從零開始的自動機器學習》。】

最后,衷心感謝清華校友、QEEXO 中國區(qū)市場負責人翟偉在寫作過程中幫我提供的大量資料以及各種支持。6 月 8 日,QEEXO 嵌入式自動化機器學習服務(wù)的商用版本即將正式發(fā)布,邀請你與我們共同見證。

本文總結(jié):

TinyML 與 AutoML 正在快速融合,構(gòu)建嵌入式自動化機器學習算法。

TinyML 與 AutoML“攜手”,讓原本“物以稀為貴”的機器學習以親民的方式“飛入百姓家”。

嵌入式自動化機器學習算法具有廣泛的應(yīng)用領(lǐng)域,包括智能家居硬件、智能可穿戴設(shè)備、建筑物振動監(jiān)測和工業(yè)預(yù)測性維護。

這個領(lǐng)域中比較有代表性的初創(chuàng)公司和資源,包括 QEEXO、MindsDB 和 Cartesiam。

參考資料:

1. 一文讀懂即將引爆的 TinyML:在邊緣側(cè)實現(xiàn)超低功耗機器學習【物女心經(jīng)】,來源:物聯(lián)網(wǎng)智庫

2.ThisIs How Algorithms Will Evolve Themselves, by Courtney Linder, popularmechanics.com

3.Googleclaims new AutoML will ‘evolve’ without human intervention, techhq.com

4.ComparingMindsDB with Sklearn and Tensorflow, mindsdb.com

5.WhyTinyML is a giant opportunity, by TX ZHUO and FIKA VENTURES, venturebeat.com

6.QeexoAutoML is Now Live on Amazon Web Services, prweb.com

7.EtaCompute 與 EdgeImpulse 合作,以促進邊緣端機器學習的開發(fā)和部署,times.hinet.net

8.BackingMindsDB - Automated Machine Learning for the Software Developer, by SamuelHields, blog.openocean.vc

9.STMicroelectronicsand Cartesiam announce general availability of NanoEdge AI Studio now optimizedfor STMicroelectronics development boards, cartesiam.ai

10.Why, Hello FPGA and AI - HowNice to See You Together, by Max Maxfield, eejournal.com

11.TOP AUTOML PLATFORMS TO LOOKOUT FOR IN 2020, by?Smriti Srivastava, analyticsinsight.net

12.Machine Learning at the Pushof a Button, by Jim Turley, eejournal.com

13.Do You Hear What I Hear?Connecting IoT Devices with Sound, engineering.com

相關(guān)推薦

電子產(chǎn)業(yè)圖譜