在90年代的電腦上實現(xiàn)CNN是一種什么體驗?
最近,一位日本小哥武田廣正(音譯)就在1990年的電腦PC-9801上實現(xiàn)了CNN來識別手寫字符。
就像這樣。
可能因為電腦性能的限制,整個識別過程要消耗一分多鐘。
原來30年前CNN是這樣實現(xiàn)的。
他還將整個過程分享到了推特上,得到了大量的關(guān)注。
不少網(wǎng)友驚嘆之余,還表示,心疼這個電腦,學(xué)習(xí)AI一定很難……
如何實現(xiàn)?
雖然目前這項技術(shù)還沒有開源,但早在93年就已經(jīng)有人將CNN玩得很溜了。
這個人就是LeCun。
前不久,一段關(guān)于LeCun93年的視頻火了。視頻中展現(xiàn)的是,當(dāng)時的文字識別系統(tǒng)已經(jīng)用上了CNN。
他首先是電腦的系統(tǒng)中編寫了一種網(wǎng)絡(luò)數(shù)據(jù)結(jié)構(gòu)的編譯器,并生成了可編譯的 C 語言代碼,在源代碼中以權(quán)重和網(wǎng)表(netlist)代表文字。
整套系統(tǒng)是在算力為20MFLOPS 的DSP版上運行。
當(dāng)時,手寫數(shù)字?jǐn)?shù)據(jù)集 MNIST還沒有問世,LeCun則用攝像拍攝來構(gòu)建文字識別系統(tǒng)的。除此之外,還需要解決文字縮放、位置等問題。
只需在紙上寫好任意數(shù)字,不管任意大小形狀,或者帶有一定的“藝術(shù)性”,只要用攝像頭導(dǎo)入電腦,就可以識別。
而這位日本小哥則是在MNIST數(shù)據(jù)集上構(gòu)建的,電腦上清晰展現(xiàn)了識別過程。
首先,讀取MNIST的數(shù)字圖像的信息。
隨后,進行一波卷積、池化等操作。
最后經(jīng)過SoftMax層,每個數(shù)字轉(zhuǎn)換成概率或者權(quán)重,按照權(quán)重大小選出所得數(shù)字。
背后的作者
武田廣正,來自巖手縣立大學(xué)信息學(xué)研究院,喜歡操作系統(tǒng)以及研究復(fù)古電腦,曾撰寫《Raspberry Pi GPGPU入門》
因為這個項目,他在enPiT的PBL活動中獲得了優(yōu)秀獎。
他表示,會將這一教程編寫進《令和的PC-98編程》一起發(fā)行,源代碼將在GitHub上提供。
參考鏈接:
https://twitter.com/T_taisyou/status/1357655009618399232