關于機器人現(xiàn)在和未來的實戰(zhàn)和推演,真正的智能何時到來?
機器人無疑是大賽道,不過2022年的機器人賽道,個中滋味可能只有從業(yè)者最清楚。
經歷了兩年多的狂歡,掃地機器人逐漸告別高增長,根據IDC預測,2022年市場出貨量同比下降23.8%,市場壓力陡增。相形之下,人形機器人在2022年頗受矚目,戴森、特斯拉、小米……大佬趕集式布局,不過,重磅亮相之后,兩極化的市場反響、對商業(yè)前景的質疑,不絕于耳。
如果說掃地機器人代表現(xiàn)在,人形機器人代表未來,機器人真正進入、并良好融入我們的生活,會比想象中更快還是更慢?從現(xiàn)在到未來,還有哪些難題待解?
“誰來保護我的隱私?”
“亂撞”、“不智能”、“掃不干凈”……這些槽點后,掃地機器人最近又攤上了一個新“罪名”:泄露隱私數(shù)據。事情起源于《麻省理工科技評論》的一篇長文調查,曝光了國外某品牌的掃地機器人自帶攝像頭拍攝用戶的事件,包括用戶在家上廁所的動態(tài),甚至人臉信息都清晰可見,都被拿去給AI模型做訓練數(shù)據。這讓用戶對家中的智能設備再次產生了擔憂:誰來保護我的隱私?
越來越多的掃地機器人轉向計算機視覺,而為了讓視覺導航實現(xiàn)更好的效果,就需要在更多高質量、多樣化的數(shù)據集上對AI模型進行訓練。在上述調查所提到的案例中,一些具體的物體、場景畫面都被加上了標注,用以進行訓練。這些隱私信息理論上應該處于非常嚴格的存儲和訪問控制之下,雖然公司本身沒有泄露數(shù)據,卻在交給第三方進行數(shù)據標注的環(huán)節(jié)出現(xiàn)了紕漏,被負責標注的員工分享到了網上。
攝像頭讓掃地機器人不那么智障的同時,卻帶來視覺數(shù)據特別是隱私數(shù)據被泄露的風險,這讓AI應用再次觸及到了“數(shù)據隱私”這個紅線。
汪清在掃地機器人領域從事研發(fā)工作,他告訴<與非網>,技術易實現(xiàn),但法律合規(guī)卻是一個繞不開的難題。如何防止隱私被偷窺?如何規(guī)避法律風險?成為產品落地時必須面對的問題。
當前,中高端掃地機器人基本都配置了AI攝像頭,用于輔助識別物體并執(zhí)行特定的清掃策略。然而,受到成本和算力的限制,AI掃地機器人只能滿足輔助清掃的基本需求,因此,提升識別準確度、降低誤識別概率,就成了產品的主要賣點之一。
那么,如何提高識別準確度?很重要的一環(huán)就是投喂量足夠大、足夠好的數(shù)據,來進行數(shù)據訓練。對于商業(yè)公司來說,獲得數(shù)據來源最簡單直接的方式就是將用戶數(shù)據上傳到云端采集,經過訓練優(yōu)化模型后,再以固件更新的形式發(fā)布。
汪清指出,這其中可能就包括了隱私被偷窺的風險,也成為了產品進一步升級時必須面對的問題。一方面,消費者要盡量選擇有保障的品牌產品,并且在使用過程中注重數(shù)字密碼安全等問題;另一方面,也需要廠商提升設備安全性能、加強云端數(shù)據安全。但最重要的,是相關法律法規(guī)的不斷完善,在此基礎上的技術創(chuàng)新才能推動更為安全的數(shù)據生態(tài)。
機器智能:終極AI的最后一公里
人形機器人可以說是最符合人類理想的機器人形態(tài),也始終在吸引著更大的市場興趣。馬斯克甚至認為,“當有一天我們解決了汽車的自動駕駛問題(即現(xiàn)實世界的 AI 問題)后,就可以將 AI 技術推廣到人形機器人身上。這將比汽車具有更廣闊的應用前景?!睂τ谔厮估瓩C器人的定位,他表示,最初是替代人們從事重復枯燥、具有危險性的工作,但遠景目標是讓其服務于千家萬戶,比如做飯、修剪草坪、照顧老人等。
要真正讓機器人走進現(xiàn)實生活中,還有無數(shù)個難題要攻克。除了技術、機械挑戰(zhàn),一個最為核心的問題還是人形機器人的“大腦”。市場上有研究者“拆解”了機器人的機械構造,發(fā)現(xiàn)雖然零部件是成本占比最高的部分,但“大腦”需要AI技術助推,是“把機器轉化為機器人”的關鍵。
從AI大廠離開的李卓,正全身心沉浸在包括認知科學等在內的心理學研究中,他告訴<與非網>,現(xiàn)階段的人工智能,仍以模仿人類為主,不論是計算機視覺、自然語言處理還是生成式AI(包括AIGC、數(shù)字人等),其內核還是算力、算法和數(shù)據的有效結合和應用。
放眼未來的人工智能,應該是有感知、有認知、會學習、自成長的機器智能。那么,如何才能實現(xiàn)這種更高階的、或者說理想中的智能形態(tài)?
李卓指出,首先,人類屬于碳基智能體,是一種具身智能;而機器智能屬于硅基智能體,是一種人工智能,其生成來自于人類的大規(guī)模芯片制造,進化則來自大數(shù)據喂養(yǎng)下算法的快速迭代。
對于機器智能體來說,先天的不足——是其芯片組件往往來自人類的預先設計,一旦制成,在整個生命周期中無法動態(tài)修改,無法在環(huán)境的交互中動態(tài)優(yōu)化。不過,隨著芯片設計、封裝、制造等技術的演進,包括chiplet、量子芯片等發(fā)展,機器智能體的計算方式也在發(fā)生變化,迭代進化速度將不斷加快。
其次,人類的活動空間是寬泛的,既可以是物理空間,也可以是數(shù)字空間;而AI的活動空間是數(shù)字空間,要想對周圍的物質或能量產生效果,需要通過傳感器的采集和執(zhí)行器的操作才能實現(xiàn)。更為重要的是,人可以通過移動從多個視角去感知所處空間,而機器人暫時還不具備這種能力,往往只能處在某一個場景簡單的專業(yè)環(huán)境中,缺乏人類在通用環(huán)境中廣泛的活動和社交能力,這是其局限之處。
第三,AI往往參考馮諾依曼架構進行計算,局限在數(shù)字空間,在解決特定問題時更高效,有一種“大數(shù)據,小任務”的感覺。
而人類的思考方式往往是感知-認知-運動類學習,大腦通過觀察感覺輸入如何隨著運動而變化,去學習世界模型再去反應。其思維的過程就是數(shù)百億神經元的活動,每個神經元都有數(shù)以千計的突出,與成千上萬個其他神經元相連,人類所知的一切都存儲在這些神經元的聯(lián)接中。人類的思考往往具有一種“小數(shù)據,大任務”的感覺,通過分層分級,上一層的價值決定這一層的策略,比如基于一個人的價值觀,就能大致判斷出他的行動策略。
在可預見的未來,兩種智能將走向融合,在物質的聯(lián)網(交通網)、能量的聯(lián)網(能源網),信息的聯(lián)網(物聯(lián)網&互聯(lián)網)基礎之上,將會形成智能的聯(lián)網——也就是是人類智能體和機器智能體的融合,并且這種融合將會逐步疊加、互相滲透,例如大腦、器官、義肢、神經元等,將形成更深層的融合。
“所謂的元宇宙,其實就是人類智能體和機器智能體共生的環(huán)境”,李卓表示,“在這個混合時空中,機器智能體從數(shù)字空間拓展到物理空間,伴生著人類進一步拓展更多個性化的時空,未來,如何構建共同的混合智能倫理和社會將成為我們面臨的挑戰(zhàn)。”
伴隨著AI的發(fā)展,其實人類對機器人的感情——可謂是又慕又怕,人類既享受作為“造物者”的智力探索,又懼怕制造出有自主意識、不受人類控制,甚至反攻人類的恐怖對手。
就比如人形機器人,這種具有自主特點的機器智能體,一旦大規(guī)模進入社會生活領域后,將會很快進步、積累出世界模型的通用知識和底層邏輯,發(fā)展速度會非???。那最終會不會出現(xiàn)電影《終結者》中的局面?馬斯克的答案是不會,因為已經在設計過程中考慮到了這些因素,設計了很多安全保障,本地有停止按鈕,可以終止它的行為,也可以通過遠程控制進行干預。
未來,最終的智能形態(tài)將會主要受環(huán)境所驅動,就像大自然的平衡、生物多樣性一樣,人類智能和機器智能會共存。李卓補充說,比如在人類的活動空間中,還是人類智能主導和控制的智能形態(tài);但是,假設拓展到星際智能、深海智能、地心智能……這些超出人類現(xiàn)存空間的領域,就更需要機器智能。
“更智能的代價”
知乎上有一個有趣的帖子,是關于那場著名的對弈——“AlphaGo 和人類棋手比起來誰消耗的資源更多”。其中的一些討論,也適用于對機器人落地的思考。
在這場比賽中,一邊是1202個CPU、176個GPU和100多名科學家在背后,另一邊是一個人腦和一杯咖啡。這難道說明人腦效率遠高于電腦、AI是靠著幾百上千倍的能源消耗才取勝嗎?
不全是。
時隔一年后,AlphaGo從內到外又都煥然一新。內部軟件算法升級,不再拘泥于人類棋譜而是自我對弈,比原先的暴力檢索大大改觀,幾秒鐘就能下一手棋;外部硬件核心全盤更換為Google新研制的TPU,這種專為AI而生的芯片在特定場合比CPU和GPU的性能有了極大提升,以至于與柯潔對弈的AlphaGo版本只需靠一臺物理機上的4個TPU即可運行,而單枚TPU的設計功耗僅為40W。
僅僅一年,AlphaGo的實力又升了幾個臺階,而功耗卻縮減到千分之一,和人類幾乎處于同一數(shù)量級。再過一年、五年、十年,將會怎樣?
這些都是人類在通往更智能的路上所需要付出的代價,比如:你愿意承擔多少能源消耗、投入多少人才、付出多大成本、給予多長的時間周期……但最后都要回到一個終極問題上:場景在哪里?
就像把機器人比作一個要踏入職場的應屆生,你能給它找到一份什么樣的工作?這是值得去更多思考的。
寫在最后
機器人賽道難,難在哪里?難在頂不了天,落不了地。
像掃地機器人這樣的新興賽道,高速發(fā)展期過后,成本、受眾、創(chuàng)新等問題都逐漸暴露眼前,都是對下一步拓展市場的挑戰(zhàn)。而人形機器人這樣的未來項目,自身的打磨仍需要足夠長的時間周期,更需要找到適合大規(guī)模落地的實際場景。
工信部數(shù)據顯示,過去兩年我國機器人行業(yè)仍處于虧損經營階段。尤其是2020年,規(guī)模以上機器人企業(yè)凈利潤同比下降26.9%,行業(yè)利潤率僅3.33%。就連滲透率、普及率較高的清潔機器人、工業(yè)機器人賽道,尚且沒有完全擺脫虧損。
在交流中,汪清告訴<與非網>,機器人乃至AI落地的最大挑戰(zhàn),主要還是應用的客戶和需求尚未明確。AI落地的第一波推動力量是學術界的力量、應用場景的突破以及資本的加持,再加上熱點事件的助力,打響了產業(yè)落地第一戰(zhàn),也形成了廣泛共識——技術成熟、可商業(yè)化,只要找到用戶就可以形成標志示范效應廣泛推廣。
但是,這個階段的AI公司沒有盈利業(yè)務支撐研發(fā),只能通過不斷嘗試不同行業(yè)場景下的落地實踐,提供完整的交付并反饋才能完成落地閉環(huán)。人力成本、經營成本高昂,試錯成本過高,也不得不依賴多次融資,反復打通場景更換項目來維持活躍性,這是AI初創(chuàng)企業(yè)在新場景落地面臨的困難之一。
這不僅是人力成本和經營成本無法匹配項目營收的困難,也是項目定制化帶來的成本高昂的泡沫。對于初創(chuàng)AI公司來說,獲客成本高,對傳統(tǒng)企業(yè)轉型AI來說,更多是對現(xiàn)有客戶的增值,特別是在服務碎片化市場客戶的時候,比如細分的機器人賽道,這樣的基礎差別就會更大。