蓋世汽車訊 據(jù)外媒報(bào)道,日本綜合性研究機(jī)構(gòu)RIKEN腦科學(xué)中心的Andrea Benucci及其同事開發(fā)出一種創(chuàng)建人工神經(jīng)網(wǎng)絡(luò)的方法,可以學(xué)習(xí)更快、更準(zhǔn)確地識別物體。該研究重點(diǎn)關(guān)注未被注意到的眼球運(yùn)動,并表示眼球運(yùn)動在穩(wěn)定識別物體方面發(fā)揮著重要作用。這些發(fā)現(xiàn)可以應(yīng)用于機(jī)器視覺,例如,使自動駕駛汽車更容易學(xué)習(xí)識別道路上的重要特征。
圖片來源:RIKEN
頭部和眼睛一整天都在不停移動,但人類不會因此看不清物體,即使視網(wǎng)膜上的物理信息不斷變化。使這種感知穩(wěn)定性成為可能的是運(yùn)動命令的神經(jīng)副本(neural copies)。 每次移動時,這些副本都會發(fā)送到整個大腦,并被認(rèn)為可以讓大腦解釋自身的運(yùn)動并保持感知穩(wěn)定。
除了穩(wěn)定的感知之外,有證據(jù)表明,眼球運(yùn)動及其運(yùn)動副本也可能有助于穩(wěn)定地識別世界上的物體,但具體是如何發(fā)生的還不得而知。Benucci開發(fā)出一個卷積神經(jīng)網(wǎng)絡(luò)(CNN),在眼睛移動時優(yōu)化視覺場景中的對象分類,或可解決上述問題。
首先,該神經(jīng)網(wǎng)絡(luò)經(jīng)過訓(xùn)練,可將60,000張黑白圖像分為10個類別。盡管該網(wǎng)絡(luò)在這些圖像上表現(xiàn)良好,但當(dāng)使用模擬眼睛移動時自然改變的視覺輸入的移位圖像進(jìn)行測試時,其性能急劇下降到偶然水平。然而,在使用移位圖像訓(xùn)練網(wǎng)絡(luò)后,只要還包括導(dǎo)致移位的眼球運(yùn)動的方向和大小,分類顯著提高。
特別的是,將眼球運(yùn)動及其運(yùn)動副本添加到網(wǎng)絡(luò)模型中,系統(tǒng)能夠更好地應(yīng)對圖像中的視覺噪聲。Benucci表示:“這一進(jìn)步將有助于避免機(jī)器視覺中的危險(xiǎn)錯誤。憑借更高效、更強(qiáng)大的機(jī)器視覺,像素更改(也稱為‘對抗性攻擊’)會減少錯誤率,例如,自動駕駛汽車將停車標(biāo)志標(biāo)記為燈桿,或軍用無人機(jī)錯誤將醫(yī)院大樓分類為敵方目標(biāo)。”
Benucci解釋說:“模仿眼球運(yùn)動及其傳出副本意味著‘強(qiáng)制’機(jī)器視覺傳感器具有受控類型的運(yùn)動,同時通知負(fù)責(zé)處理關(guān)于自生運(yùn)動相關(guān)圖像的視覺網(wǎng)絡(luò),將使機(jī)器視覺更加強(qiáng)大,并且類似于人類的視覺體驗(yàn)。”
來源:蓋世汽車
作者:劉麗婷