加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

Socionext 和日本東北大學(xué)顯著加快基于深度學(xué)習(xí)的 SLAM 處理

2021/11/23
190
閱讀需 4 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

Socionext Inc. 與Takayuki Okatani 教授領(lǐng)導(dǎo)的日本東北大學(xué)研究小組合作,開發(fā)了一種新方法,可以減少 SLAM(同步定位和映射)所需的處理時間, 這對于執(zhí)行自主控制的設(shè)備至關(guān)重要,時間僅為傳統(tǒng)技術(shù)所需時間的 1/60。這種新方法使得在一些CPU 性能有限以及功耗有限的邊緣設(shè)備的 SoC進(jìn)行高級 SLAM 處理成為可能,例如自動駕駛汽車、AGV(自動導(dǎo)引車)、機(jī)器人無人機(jī)和其他執(zhí)行自主的設(shè)備控制,以及諸如 AR(增強(qiáng)現(xiàn)實)眼鏡之類的設(shè)備。

該研究工作已被 ICCV(計算機(jī)視覺領(lǐng)域最負(fù)盛名的會議之一)接受為演講報告。 這種新方法在 10 月 11 日至 17 日在線舉行的ICCV 2021會議上進(jìn)行了介紹。

根據(jù)用于獲取物體周圍 3D 信息的傳感方法,SLAM 可以分為兩種主要類型。 一種是 LiDAR(光探測和測距),它使用激光測量距離。 另一種是Visual SLAM,它使用相機(jī)圖像。 視覺 SLAM 正在顯著發(fā)展,因為所使用的相機(jī)相對便宜,并且除了同時定位之外,還可以將該方法與使用圖像識別的各種控制過程相結(jié)合,從而可以期待許多應(yīng)用。

近年來,隨著深度學(xué)習(xí)的引入,圖像識別技術(shù)取得了顯著的進(jìn)步,深度學(xué)習(xí)的應(yīng)用成為了視覺SLAM演進(jìn)的重要因素。 然而,基于特征點和相機(jī)方向優(yōu)化地標(biāo)的未知 3D 信息的束調(diào)整(BA)所需的大量計算是傳統(tǒng)方法的瓶頸。 對于 CPU 處理能力有限的邊緣型 SoC 設(shè)備,這會使實際處理變得困難。 (圖1)

(圖1)

為了應(yīng)對這一挑戰(zhàn),研究團(tuán)隊提出了一種使用“圖網(wǎng)絡(luò)(GN)"[1] (一種圖神經(jīng)網(wǎng)絡(luò))通過推理進(jìn)行近似計算的方法。 新方法包括從 GN block輸入的關(guān)鍵幀和地標(biāo)信息中推斷更新信息(圖 2),并通過多堆棧 GN 結(jié)構(gòu)收斂到最終值(圖 3)。 與使用傳統(tǒng) Levenberg-Marquardt 方法的標(biāo)準(zhǔn)束平差相比,這些使得推理處理所需的計算量更少。

(圖2)

?

(圖3)

研究團(tuán)隊使用這種新的推理方法實現(xiàn)了 Visual SLAM 捆綁調(diào)整,并將其與當(dāng)今廣泛使用的方法“g2o”[2]進(jìn)行了比較。 PC 仿真結(jié)果證實,與 g2o 相比,新方法可以將處理時間縮短至 1/60。(圖 4)

?

(圖4)

Socionext 將從這項研究工作中積累經(jīng)驗,并將 Visual SLAM 技術(shù)確立為公司定制 SoC 解決方案的產(chǎn)品之一。 該公司將為工業(yè)設(shè)備和移動等需要圖像識別領(lǐng)域的客戶系統(tǒng)提出創(chuàng)新的性能改進(jìn)方案。 此外,公司將繼續(xù)研發(fā)通過新的推理方法提高處理效率,并將其使用擴(kuò)展到圖像識別以外的新客戶應(yīng)用。

相關(guān)推薦

電子產(chǎn)業(yè)圖譜