該項(xiàng)目將介紹語(yǔ)音控制AI攝像機(jī)背后的建筑設(shè)計(jì)。主要思想是通過(guò)語(yǔ)音界面控制攝像頭以拍攝照片,并向其發(fā)送一封電子郵件,其中包含所觀察到的照片的描述。該項(xiàng)目包含多個(gè)組件,從諸如Matrix Voice,Jetson Nano和RPIU2之類的硬件模塊,到諸如SNIPS AI的軟件框架,當(dāng)然也包括構(gòu)成神經(jīng)后端引擎的自定義Python AI腳本。
因此,簡(jiǎn)而言之,我們將利用Snips AI平臺(tái)和Matrix Voice作為語(yǔ)音接口,并將在Jetson Nano SBC上運(yùn)行的Keras / Tenorflow DNN用于圖像推理AI。
設(shè)置了附加的演示代碼,因此,如果檢測(cè)到人,則將帶有來(lái)自AI引擎的帶有注釋圖像的電子郵件發(fā)送給用戶。但是可以更改類。