5月30日全球頂尖學術期刊《Nature》(《自然》),封面文章刊登了由我國清華大學研究團隊發(fā)表的論文《面向開放世界感知具有互補通路的視覺芯片》(A Vision Chip with Complementary Pathways for Open-world Sensing)。
該重磅研究成果報道獲等多家權威媒體轉(zhuǎn)發(fā),據(jù)新華社報道,清華大學類腦計算研究中心團隊研制出了世界首款類腦互補視覺芯片“天眸芯”(Tianmouc),這是該團隊繼異構融合類腦計算“天機芯”后,第二次登上《自然》封面,標志著在類腦計算和類腦感知兩個方向上均取得了基礎性突破。
這是一款全面超越現(xiàn)有傳統(tǒng)圖像傳感器和神經(jīng)形態(tài)傳感器的視覺傳感器芯片,是智能感知芯片領域的一個重大突破,不僅為智能革命的發(fā)展提供了強大的感知技術支持,還為未來自動駕駛、具身智能等重要應用,開辟了新的道路?!疤祉尽钡募尤雽⒛軌蜻M一步完善類腦智能生態(tài),有力推動人工通用智能的發(fā)展。
清華大學施路平教授、趙蓉教授為論文共同通訊作者,此外精密儀器系楊哲宇博士(現(xiàn)北京靈汐科技有限公司研發(fā)經(jīng)理)、精密儀器系 2020 級博士生王韜毅、林逸晗為論文共同第一作者。研究團隊依托清華大學精密儀器系的類腦計算研究中心。
該新型視覺傳感器芯片長什么樣?有什么特點?有什么優(yōu)勢?
目前,我們主流中使用的視覺傳感器,主要是CMOS圖像傳感器和CCD圖像傳感器。
然而現(xiàn)有圖像傳感器在開放世界中處理動態(tài)、多樣化和不可預測的場景時,存在許多的不足,如向高速、高分辨率、大動態(tài)范圍和高精度方向發(fā)展,受到功率和帶寬的限制。
論文通訊作者、清華大學精密儀器系教授施路平在媒體采訪中介紹,在開放世界中,智能系統(tǒng)不僅要應對龐大的數(shù)據(jù)量,還需要應對如駕駛場景中的突發(fā)危險、隧道口的劇烈光線變化和夜間強閃光干擾等極端事件。而傳統(tǒng)視覺感知芯片面對此類場景往往出現(xiàn)失真、失效或高延遲,限制系統(tǒng)的穩(wěn)定性和安全性。
“該范式借鑒了人類視覺系統(tǒng)的基本原理,將開放世界的視覺信息拆解為基于視覺原語的信息表示,并通過有機組合這些原語,模仿人視覺系統(tǒng)的特征,形成兩條優(yōu)勢互補、信息完備的視覺感知通路?!?/p>
與傳統(tǒng)圖像傳感器相比,人類視覺系統(tǒng)在開放世界環(huán)境中以其多功能性、適應性和魯棒性而脫穎而出。人類視覺系統(tǒng)將視覺刺激解釋為多種視覺,如顏色、方向和運動,并以互補的方式將其分配給腹側(cè)和背側(cè)通路。
當前已有一系列模仿人類視覺系統(tǒng)特定特征的器件,包括硅視網(wǎng)膜、神經(jīng)形態(tài)視覺傳感器、脈沖頻率調(diào)制和近傳感器計算芯片等。然而,在有限的功率和帶寬的限制下,實現(xiàn)具有高空間分辨率、高速、高精度和大動態(tài)范圍的圖像傳感器仍然存在挑戰(zhàn)。
因此,研究團隊提出一種受人類視覺系統(tǒng)(HVS)多級特性啟發(fā)的互補感知范式,該范式涉及將視覺信息解析為基于視覺原語的表示,并通過有機組合這些原語,模仿人視覺系統(tǒng)的特征,形成兩條優(yōu)勢互補、信息完備的視覺感知通路:用于準確認知的面向認知的路徑和用于快速認知的面向行動的路徑。
為了實現(xiàn)這一范式,研究團隊開發(fā)了世界首款類腦互補視覺芯片「天眸芯」(Tianmouc),該芯片結(jié)合了混合像素陣列和并行異構讀出架構,利用互補視覺通路的特性,可以在極低的帶寬(降低 90%)和功耗條件下,實現(xiàn)每秒 10000 幀的高速、10bit 的高精度、130dB 的高動態(tài)范圍視覺信息采集。它不僅突破了傳統(tǒng)視覺感知范式的性能瓶頸,而且能夠高效應對各種極端場景,確保系統(tǒng)的穩(wěn)定性和安全性。
下圖為類腦互補視覺芯片「天眸芯」的測試系統(tǒng)。被處理的數(shù)據(jù)首先會傳輸?shù)?FPGA 版上,F(xiàn)PGA 板采集原始數(shù)據(jù),然后通過 PCIe 傳輸?shù)街鳈C,主機再負責數(shù)據(jù)處理,以完成測試等任務。
▲“天眸芯”(Tianmouc)芯片測試系統(tǒng)
基于 Tianmouc 芯片,研究團隊將其與自動駕駛系統(tǒng)集成,展示了其即使在開放道路上具有挑戰(zhàn)性的極端情況下也能實現(xiàn)準確、快速和穩(wěn)健感知的能力。基于基元的互補傳感范式有助于克服為各種開放世界應用開發(fā)視覺系統(tǒng)的基本限制。
“天眸芯”(Tianmouc)互補視覺芯片怎么設計?采用90nm CMOS背照式技術制造!
在物理傳感系統(tǒng)中,想實現(xiàn)互補傳感范式有幾個必須解決的挑戰(zhàn)。首先,設計像素陣列至關重要,這需要同時解析同一焦平面上相應圖元的光電信息轉(zhuǎn)換。其次,兩條路徑的讀出架構必須包含異構構建塊,這些構建塊可以使用不同的數(shù)據(jù)分布和格式對電信息進行編碼。
如圖 2 所示,「天眸芯」采用 90 nm CMOS 背照式技術制造,由兩個核心部分組成:
- 用于將光學信息轉(zhuǎn)換為電信號的混合像素陣列;
- 用于構建兩個 CVP 的并行異構讀出架構。
受感光細胞的啟發(fā),混合像素陣列包括錐體和桿體像素,具有不同的特性,如顏色、響應模式、分辨率和靈敏度。這些像素可以將視覺信息解析為特定的顏色(紅色、綠色、藍色)和白色光譜,充當顏色對立圖元。
研究團隊對「天眸芯」的量子效率、動態(tài)范圍、響應速度、功率和帶寬等性能指標進行了全面的評估。該芯片在 COP 和 AOP 中均表現(xiàn)出較高的量子效率,530 nm 最高可實現(xiàn) 72% 的 AOP 和 69% 的 COP。「天眸芯」通過利用互補的 COP 和 AOP 中不同增益模式的動態(tài)范圍來實現(xiàn)高動態(tài)范圍。
可以說,全面超越了現(xiàn)有的神經(jīng)形態(tài)傳感器和傳統(tǒng)圖像傳感器,同時仍能保持低功耗和低帶寬消耗。
以自動駕駛為示例,“天眸芯”(Tianmouc)的表現(xiàn)有多強悍?
「天眸芯」的互補感知范式為自動化系統(tǒng)提供了巨大的想象空間,它可以作為感知算法的優(yōu)質(zhì)數(shù)據(jù)源。為了在開放世界場景中評估這些能力,研究人員開發(fā)了一個集成「天眸芯」的汽車駕駛感知系統(tǒng)(圖 4a),以評估在開放道路上行駛,涉及各種極端情況,例如強光干擾、高動態(tài)范圍場景、域偏移問題(異常物體)和具有多個極端情況的復雜場景。
▲圖 4:開放世界感知實驗。
為了利用天眸芯架構的優(yōu)勢,作者設計了一種多路徑算法,專門用于利用 AOP 和 COP 的互補特性。在感知層面,圖元的完整性使得原始場景的重建和對極端照明的適應成為可能。同時在感知層面,AOP 提供對變化、紋理和運動的即時感知,而 COP 提供精細的語義細節(jié)。通過同步這些結(jié)果,我們可以讓 AI 系統(tǒng)全面了解場景。
圖 4b 所示的第一種場景評估了突然強光環(huán)境的感知能力,在光照快速變化的情況下,傳感器的魯棒性受到了考驗。天眸芯對這種強光表現(xiàn)出了極強的適應能力,同時在正常情況下也保持了較高的感知性能。對于實時高動態(tài)范圍感知(圖 4c),兩條通路的互補靈敏度使天眸芯能夠感知高亮度對比度而不會犧牲速度。
在感知層面,AOP 上的高速光流濾波器補充了異常檢測能力,其中 AOP-TD 和 AOP-SD 之間的協(xié)作可以精確計算運動方向和速度以識別異常(圖 4d)。圖 4e 顯示了自然光照昏暗、交通環(huán)境混亂、人造光突然干擾的復雜場景,需要在采樣速度、分辨率和動態(tài)范圍方面具有不同的感知能力。CVP 上的算法提供了互補和多樣化的結(jié)果,為這些場景中的進一步?jīng)Q策提供了充足的空間。
根據(jù) mAP_0.50(平均精度),與圖 4 中所有情況下僅使用單一路徑相比,CVP 具有更優(yōu)的整體檢測性能。值得注意的是,它在實現(xiàn)這一目標的同時消耗了不到 80 MB s^(-1) 的帶寬和 328 mW 的平均功耗。實驗結(jié)果表明,天眸芯可以有效適應極端光環(huán)境并提供領域不變的多級感知能力。
天眸芯擅長捕捉復雜的認知細節(jié),同時可對快速不可預測的突發(fā)情況和運動作出響應。它提供高速、高動態(tài)范圍和高精度,同時保持了自適應低帶寬的特性。同樣重要的是,它的高可擴展性允許通過先進的制造工藝實現(xiàn)高級空間分辨率,從而促進具有低功耗和帶寬要求的分辨率敏感應用。作者認為,新的范式為開發(fā)用于開放世界應用的先進計算機視覺理論、算法和系統(tǒng)開辟了一條新途徑。
本文部分資料來自:
機器之心《清華「天眸芯」登Nature封面:全球首款類腦互補視覺芯片》
神經(jīng)形態(tài)感存算一體電子《清華大學最新Nature:“天眸芯”——世界首款受人類視覺系統(tǒng)啟發(fā)的互補型視覺芯片》
上海證券報《芯片重磅!世界首款!我國科學家研制》
由動感傳感整理,轉(zhuǎn)載請注明傳感器專家網(wǎng)