對于 AI 技術(shù)來說,我們?nèi)梭w簡直就是一個(gè)大數(shù)據(jù)的寶藏。
最近發(fā)表在《自然·生物醫(yī)學(xué)工程》雜志上的“斯坦福智能馬桶”,成為人們熱議的“最有味道”的 AI 應(yīng)用。這款馬桶可不是那種只會“自動清洗、烘干、除臭”的偽智能馬桶,而是可以分析人的糞便、尿液,同時(shí)還能識別人的菊(gang)紋的真智能馬桶。
斯坦福研究人員表示,正如世界上沒有兩片完全相同的樹葉,世界上也沒有兩片完全相同的——菊紋(為此,研究者特意新造了一個(gè)組合詞 Analprint)。
菊紋識別的用處,倒是沒有什么直接診斷疾病的功能,而只是一個(gè)身份識別功能。因?yàn)檠芯咳藛T細(xì)心地發(fā)現(xiàn)智能馬桶并不只是由一個(gè)人使用,盡管在沖水按鈕上安裝了指紋識別,但也可能存在便后不沖水的可能,這樣會出現(xiàn)“人便不一”的情況。
那菊紋識別就完美地解決了這一問題,畢竟排便的同時(shí)就做到身份識別,那自然是百分百準(zhǔn)確無誤了。為斯坦福研究人員的機(jī)智點(diǎn)贊,并配上一張美圖來沖淡下大家腦補(bǔ)出的畫面!
恭喜人類,在有了人臉、指紋、聲紋、虹膜、DNA 之后,我們又解鎖了一種識別人類身份的新技能。當(dāng)然,人體的大數(shù)據(jù)富礦還有很多,利用 AI 技術(shù)對于人類大數(shù)據(jù)的研究可謂層出不窮。
借此機(jī)會,我們可以對近兩年來 AI 在人體特征、疾病以及行為等研究做一場浮光掠影式的總結(jié),看看 AI 技術(shù)在人類身上有哪些奇葩的識別應(yīng)用?
人體大寶藏,就是一個(gè)行走的數(shù)據(jù)庫
AI 進(jìn)入我們的日常生活,已經(jīng)是一個(gè)不爭的事實(shí),其差別只是我們是否能夠意識到 AI 的存在。人臉識別、指紋識別幾乎是每天都在用的手機(jī)功能。智能音箱的語音識別在隨時(shí)等候你的召喚,你常用的輸入法在預(yù)測你接下來想打的字,你??吹男侣効蛻舳撕投桃曨l在記錄你的偏好,推薦你喜好的內(nèi)容……
比你更了解你的,不再是你的媽媽,而是無處不在的 AI。比做自己來得更真實(shí)的你,不再是你立下的 Flag,而是你無時(shí)無刻留下來的數(shù)據(jù)。如果你還操心《西部世界》里仿真人的自由和解放,還不如多了解下 AI 對我們身體了如指掌的程度。
人體的大數(shù)據(jù)庫還有哪些有趣的寶藏被 AI 挖掘出來呢?
在菊紋識別之外,其實(shí)還有一種少為人知的判別個(gè)人身份的 AI 技術(shù),那就是步態(tài)識別。由于我們每個(gè)人的生理結(jié)構(gòu)不同,行走習(xí)慣也或多或少有細(xì)微不同,那么 AI 就可以根據(jù)人的走路姿勢來識別人的身份。
相比較人臉、指紋、聲紋、虹膜等身份識別,步態(tài)識別具有遠(yuǎn)距離、全視角、難偽裝的優(yōu)點(diǎn)。特別是在安防領(lǐng)域抓“壞人”、找走丟的老人孩子的時(shí)候,他們要么是會做刻意的偽裝,要么是卷入茫茫人群中。通過遍布公共區(qū)域的攝像頭的大范圍遠(yuǎn)距離拍攝,就可以根據(jù)人們的步態(tài)識別來追蹤。
當(dāng)然識別的前提是需要前期數(shù)據(jù)錄入做對照,或者在敏感區(qū)域做排除法。未來步態(tài)識別可能最先應(yīng)用于有違法犯罪記錄的人群,除了拍照錄 DNA,這些人還得在攝像頭面前走兩步。
唇語識別,也是最近日臻成熟的一項(xiàng) AI 技術(shù)。對于能聽能說能看的正常人來說,這個(gè)技術(shù)非常小眾。但對于全世界人口 5%的聽障人群,則是一大福音。通過這一新的唇語閱讀 AI 系統(tǒng),聽力障礙者可以獲得專家級唇語翻譯的結(jié)果。
未來最可行的方法就是聽障人士佩帶類似谷歌眼鏡的智能設(shè)備,通過隱藏?cái)z像頭讀取對方的唇語,通過 AR 增強(qiáng)來顯示翻譯出來的文字……這樣的界面就會比較友好了。
同樣類似的一個(gè)手型識別,則更為靈活小巧。通過目標(biāo)檢測 - 分類(SSD-MobileNet)的算法,就可以很快訓(xùn)練出識別手勢手型的 AI 模型了。至于作用么,發(fā)明者想到用它來隔空發(fā)送 Emoji,雖然實(shí)用性不高,但是用來表白還是很 Sweety 的。
最新發(fā)布的一項(xiàng) AI 識別應(yīng)用,技術(shù)含量就非常高了。那就是上個(gè)月英特爾和康奈爾大學(xué)共同推出的 AI 嗅覺識別技術(shù)。通過一款英特爾正在研發(fā)的 Loihi 人工智能芯片以及一系列化學(xué)傳感器,開發(fā)出的 AI 算法可以采取類人類的嗅覺能力,分辨出數(shù)十種有毒化學(xué)氣味,并且能夠標(biāo)注出來。
這讓早已對機(jī)器視覺、語音識別脫敏的人們,又可以小小的興奮一把了。我們大腦里負(fù)責(zé)嗅覺的部位頂多告訴我們這個(gè)氣味有點(diǎn)怪異,而在 Loihi 芯片上訓(xùn)練好的模型就能告訴我們這個(gè)氣味是啥了。未來做家居、新房驗(yàn)收以及一些封閉空間的氣體檢測,可能只需要一只探測筆就能搞定了。
此外,還有一些醫(yī)療上的典型場景,比如帕金森病患者會帶有某種奇怪的特殊味道。通過 AI 嗅覺識別,可以及早的發(fā)現(xiàn)以及早的預(yù)防和治療。
說到人的疾病的識別診斷和預(yù)測,AI 在其中發(fā)揮的作用也多到你想象不到。
人類的疾病問題,不過是數(shù)據(jù)出現(xiàn)異常
對于人類疾病的診斷,AI 技術(shù)的參與早已司空見慣。新冠疫情初期,由于核酸檢測試劑的不足,疑似病例的肺部 CT 影像的 AI 診斷就成了當(dāng)時(shí)關(guān)鍵的補(bǔ)充。AI 看片把 CT 診斷的效率從十幾分鐘提高到 20 秒,確診準(zhǔn)確度達(dá)到 96%,可見 AI 技術(shù)在醫(yī)療診斷中的戰(zhàn)斗力。
除了這些大規(guī)模的 AI 診斷的應(yīng)用,我們還注意到一些非常小眾的應(yīng)用。
阿爾茨海默癥的早期識別就是 AI 技術(shù)的一個(gè)重要應(yīng)用。以前,當(dāng)阿爾茨海默癥的臨床癥狀出現(xiàn),并最終確診的時(shí)候,患者的大腦的神經(jīng)元已經(jīng)損傷非常嚴(yán)重了,也基本錯(cuò)過了干預(yù)治療的可能。而將機(jī)器學(xué)習(xí)應(yīng)用于 PET 神經(jīng)成像掃描,讓 AI 算法學(xué)習(xí)大腦當(dāng)中葡萄糖蛋白水平的微妙變化,通過對一個(gè)大型數(shù)據(jù)集 ADNI 的學(xué)習(xí),這一系統(tǒng)可以提早大約 6 年時(shí)間來識別出阿爾茲海默癥的診斷。識別準(zhǔn)確度能夠達(dá)到 98%。
當(dāng)然,這一 AI 技術(shù)還需要在更多的國家和更多的人群中進(jìn)行學(xué)習(xí),以校準(zhǔn)算法的準(zhǔn)確性。
臨終關(guān)懷,對于我們可能還是一個(gè)陌生的詞匯,但也是近幾年開始在醫(yī)療機(jī)構(gòu)普及的一種護(hù)理手段。但臨終關(guān)懷會遇到一個(gè)棘手的問題:如果實(shí)施地過早,會造成不必要的資源浪費(fèi);如果實(shí)施地過晚,等病人病入膏肓,又達(dá)不到臨終關(guān)懷的目的。如果可以找到在三個(gè)月到一年內(nèi)死亡的病人,就可以進(jìn)行更適合的醫(yī)療干預(yù)措施。
2016 年來自斯坦福的一個(gè) AI 團(tuán)隊(duì),通過神經(jīng)網(wǎng)絡(luò)對 20 萬份的患者的醫(yī)療記錄的學(xué)習(xí),在對其中的 16 萬份進(jìn)行了“死亡算法”的訓(xùn)練后,對剩下的 4 萬名患者進(jìn)行了測試,算法對在 3 到 12 個(gè)月內(nèi)死亡的患者的識別準(zhǔn)確率達(dá)到了 90%,對存活期超過 1 年的患者,準(zhǔn)確率達(dá)到 95%。
當(dāng)然,這套“死亡算法”的過程仍然具有黑箱性,重癥患者的樣本也只是根據(jù)醫(yī)療水平較高的美國醫(yī)院的數(shù)據(jù)得出,并不具有普適性。壽命和死亡對于大多數(shù)人而言,也只有一個(gè)平均數(shù)值的參考,生死大限仍然是一個(gè)復(fù)雜因素決定的事情,難以被精確預(yù)測。
與預(yù)測重癥患者死亡時(shí)間這種較為客觀化數(shù)據(jù)不同的是,通過 AI 預(yù)測自殺就是一件更艱難的事情了。本身自殺的原因就是復(fù)雜而不確定的。我們往往只能在悲劇發(fā)生之后,才會對其進(jìn)行各種原因的追溯。
可能一個(gè)人自殺的成因由幾十種甚至上百種因素導(dǎo)致,心理的、生理的以及經(jīng)濟(jì)上的。人類的預(yù)測基本跟瞎猜的概率差不多。而機(jī)器學(xué)習(xí)可以根據(jù)大量有過自殺傾向和自殘行為的病患的醫(yī)療記錄,來訓(xùn)練 AI 識別這些企圖自殺的人。來自美國范德堡大學(xué)的演技團(tuán)隊(duì)通過這一算法測試的結(jié)果表明,其預(yù)測一個(gè)人是否會在未來兩年內(nèi)自殺的準(zhǔn)確率為 80-90%,而預(yù)測一個(gè)人是否會在一周內(nèi)自殺的準(zhǔn)確率為 92%。
但這一預(yù)測也僅僅針對有過入院治療記錄的病患。而事實(shí)上很多自殺傾向的人并不會去醫(yī)院接受治療。另外,預(yù)測自殺概率的成因也很難解釋,但研究人員發(fā)現(xiàn),患者的睡眠障礙與自殺概率有很大的關(guān)系。這一點(diǎn),值得我們警惕。
盡管這些 AI 算法對于人類疾病的診斷還存在著這樣那樣的缺陷,但是預(yù)測識別算法在醫(yī)療領(lǐng)域的應(yīng)用則是一項(xiàng)創(chuàng)新的嘗試,AI 或許將徹底改變現(xiàn)在的醫(yī)療診斷和疾病治療方法,從流感到癌癥,從抑郁癥到自殺干預(yù),AI 的引入將大大提前病患的診斷時(shí)間,能夠進(jìn)行及時(shí)的干預(yù)和治療。
伴隨爭議的 AI 相面,靠譜嗎?
俗話說,相由心生,那么反之,通過相貌可以判斷一個(gè)人的內(nèi)在特征嗎?比如,性取向。這一點(diǎn)似乎正在得到來自 AI 算法的支持。
專門搞事情不嫌事大的斯坦福團(tuán)隊(duì)在 2017 年就推出了這一看臉預(yù)測性取向的 AI 算法,僅僅根據(jù)面部特征就能判斷一個(gè)人是否是同性戀,男女生的判斷準(zhǔn)確度高達(dá) 81%和 74%。
一位來自南非的學(xué)生約翰重現(xiàn)了這一 AI 算法,并從某約會網(wǎng)站上抓取了 50 萬張照片,選出一個(gè) 2 萬張的性別、性取向平衡分布的數(shù)據(jù)集。然后他又將照片中的面部特征進(jìn)行提取,轉(zhuǎn)換成四千多個(gè)元素的特征向量,來訓(xùn)練出一個(gè)回歸模型,從而預(yù)測新的照片中人物的性取向,測試成績也達(dá)到了男生 68%、女生 77%的準(zhǔn)確率。
顯然,這一發(fā)現(xiàn)是極具爭議的。除了對于同性戀等少數(shù)群體在個(gè)人隱私上的冒犯和人身安全的威脅外,單純這一識別模型也只是證明了面部特征和性取向之間的相關(guān)性,而非因果關(guān)系。
然而相關(guān)性的研究也很要命。因?yàn)樗固垢F(tuán)隊(duì)的研究不止是用 AI 相面來判斷性取向,也可以來判斷人的智商、政治傾向,甚至犯罪傾向。
當(dāng)然,我們?nèi)祟愖约阂灿羞@樣的一套直覺或經(jīng)驗(yàn)判斷系統(tǒng)。我們也會根據(jù)一個(gè)人的表情、神態(tài)來判斷其聰明程度、暴力傾向等。這似乎是從小孩子就開始的自然能力,而像久經(jīng)考驗(yàn)的老警察更能從茫茫人群中發(fā)現(xiàn)那些可疑人員。這種能力確實(shí)非常神秘,但我們也常常出錯(cuò)。網(wǎng)上流傳著馬云老師屢屢被投資人錯(cuò)過的例子,就是一個(gè)很好的反例。光看外表很難斷定一個(gè)人的才能。
而 AI 算法通過對特定人群的相關(guān)面部數(shù)據(jù)的學(xué)習(xí),很快就能進(jìn)行準(zhǔn)確度還不錯(cuò)的特征判斷。但這其中包含著種種問題。
首先,如果使用了有偏見的數(shù)據(jù),就有可能訓(xùn)練出有偏見的算法模型,比如同性戀者可能更在意自己的外表,會化妝或者對照片進(jìn)行美化,又比如,較高犯罪率的人群數(shù)據(jù)是來自有偏頗的司法機(jī)構(gòu)提供的。
其次,本身這些特征在人群當(dāng)中就存在著一些均衡分布比例。AI 給出的識別的概率并不比這些自然概率高出多少。只要存在著一定比例的錯(cuò)誤,那么 AI 的預(yù)測的結(jié)果就會造成一些嚴(yán)重的后果和風(fēng)險(xiǎn)。
由于我們本身就有這樣的預(yù)測沖動,現(xiàn)在又有了 AI 算法的幫忙,幾乎更加難以抑制研究人員和商業(yè)公司將這些算法應(yīng)用到生產(chǎn)生活當(dāng)中的沖動了。
比如說 AI 面試。如果僅憑一張照片就能讓 AI 給你的職業(yè)能力和職場表現(xiàn)打分,你可能會覺得非常不公平。雖然這有效地提高了一些大公司的簡歷的篩選效率,但同時(shí)也可能造成眾多的“誤傷”。也許就是你在拍照時(shí),嘴角不夠上揚(yáng),眼神不夠堅(jiān)定導(dǎo)致了分?jǐn)?shù)低下。
還比如說 AI 性格測試。來自澳大利亞墨爾本大學(xué)的團(tuán)隊(duì)設(shè)計(jì)了一種 AI 生物識別模型,通過把面部特征和其個(gè)性特征相關(guān)聯(lián)進(jìn)行深度學(xué)習(xí),可以分析檢測者的出十幾種性格特征。
這些研究和應(yīng)用盡管都極具吸引力,但是在實(shí)際的應(yīng)用仍然要小心謹(jǐn)慎。雖然偏見和歧視無處不在,但如果 AI 技術(shù)為這些偏見和歧視提供強(qiáng)大的相關(guān)性佐證,那對于普通人來說,顯然不是一件值得慶幸的事情。
通過以上的 AI 識別技術(shù)的速覽,我們才驚訝地發(fā)現(xiàn)原來人體的眾多秘密正在被 AI 揭示。從最基礎(chǔ)的身體數(shù)據(jù)的識別檢測,再到復(fù)雜一些的疾病的識別和成因的判斷,再到人類深層次行為的識別和預(yù)測,AI 正在步步深入其中,試圖把人類的行為徹底還原為一件可預(yù)測、可計(jì)算的既定程序。
從理論上來說,這是有可能的。我們必須克服 AI 算法的黑箱屬性,找到高識別率背后的的復(fù)雜成因。最終讓 AI 變成可解釋的,可溯源的一種技術(shù)。而從情感上,我們?nèi)匀幌M约菏亲杂傻模说哪承┬袨椴豢赡鼙煌耆饨缈陀^因素決定的。
在 AI 的應(yīng)用上,我們始終要保持著一種警惕,那就是 AI 算法在復(fù)雜成因的行為的識別和預(yù)測都只存在著相關(guān)性,而非因果性。具體到一些實(shí)際的 AI 應(yīng)用場景中,其結(jié)果仍然只是具有參考價(jià)值,而不能成為人們判斷的最終依據(jù)。就像不能因?yàn)?AI 認(rèn)為一個(gè)人犯罪傾向高就提前把他逮捕,一個(gè)人被判斷智商不足,就剝奪其受教育的權(quán)利。
我們同樣要留給 AI 技術(shù)不斷演化、升級的空間。畢竟,執(zhí)掌最終判斷的權(quán)力仍然還在人類自己的手中。也許不久之后,這些奇奇怪怪的 AI 應(yīng)用就會充斥在我們身邊,成為我們規(guī)劃、指導(dǎo)未來生活的重要參考。