李根 發(fā)自 副駕寺,智能車參考 | 公眾號 AI4Auto
“跟L4的朋友們還有聯(lián)系嗎?”
元戎啟行CEO周光,沒有正面回答。
三年前在深圳福田,周光帶隊打造的元戎啟行Robotaxi測試車,帶我穿過了鬧市晚高峰,后來還一路送我到深圳機(jī)場,全程自動駕駛,即便是在深圳會展中心商廈的臨時停車車流里,元戎Robotaxi也見縫插針穿了出去——沒有宕機(jī),沒有遠(yuǎn)程協(xié)助,沒有接管。
作為元戎啟行CEO,周光三年前談?wù)摰乃性掝}都自帶語境限定:L4級自動駕駛。元戎啟行的對外介紹,也是一家L4級自動駕駛公司。
在自動駕駛行業(yè)術(shù)語中,L4是一個分水嶺,區(qū)別于L3,L4徹底擺脫了人類駕駛員依賴;而區(qū)別于L5,L4還只能在限定場景和范圍里使用,即所謂的ODD(Operational design domain)區(qū)域,L5才能真正實現(xiàn)完全無人駕駛。
但三年后的2024年,周光以背叛者、布道者形象在更正、在反復(fù)強(qiáng)調(diào):
L4是偽概念,或者說L4不存在了。
因為端到端的全新AI范式,正在重塑所有產(chǎn)業(yè),包括交通場景下的自動駕駛。
端到端、無圖、AI 2.0
周光強(qiáng)調(diào)的端到端,更具體指代的是正在洶涌的AI算法范式。
簡單粗暴理解,就是以前自動駕駛可能會按照不同功能劃分為感知模塊、控制模塊、定位模塊、規(guī)劃決策模塊……但從2023年CVPR最佳論文直接頒向端到端前后,新范式涌出的新高度。
端到端范式下,整個自動駕駛系統(tǒng)只有一個模塊,或者說只有一個神經(jīng)網(wǎng)絡(luò)——你也可以理解為AI大腦,感知數(shù)據(jù)信號輸出,最后決策數(shù)據(jù)信號輸出,宛如人類開車駕駛。
在自動駕駛領(lǐng)域,周光現(xiàn)在是端到端的布道者、絕對信徒。
他說之前自動駕駛的模塊和堆棧,開發(fā)時涉及模塊之間的參數(shù)傳遞,人為定義接口,必然會過濾到一些信息,最后導(dǎo)致處理的場景有限。
同時因為每個模塊之間“不可求導(dǎo)”,導(dǎo)致各個模塊只能達(dá)到模塊上的局部最優(yōu),而無法實現(xiàn)整體的全局最優(yōu)。
更直白來說,一旦在自動駕駛場景中,依然依賴于人為規(guī)則的算法,機(jī)器就永遠(yuǎn)會遇到長尾場景,無法消除。自動駕駛車輛,很難有“人味”,即像人類一樣隨機(jī)應(yīng)變地處理場景挑戰(zhàn)。
周光拿來舉例的場景體驗是變道——四車道變道,人類的駕駛基本是一條線拉到底完成變道,但規(guī)則算法驅(qū)動下的機(jī)器,只會像鯉魚一樣,一條道一條道變道。
這種產(chǎn)品體驗上的不同,背后技術(shù)上的高下也非常明顯。
周光解釋,端到端的優(yōu)勢就在于,當(dāng)你做一些決策需要高級別的時候可能非常完美,像傳統(tǒng)的自動駕駛可能只需要看1、2秒就行了,你的決策可能就基于這1、2秒,稍微長點(diǎn)就會決策不準(zhǔn)。但是端到端,可以做到10秒鐘左右精準(zhǔn)的判斷,10秒跟1、2秒差很多。
這種技術(shù)上展現(xiàn)的高下之別,讓他驚喜、興奮,周光認(rèn)為:自動駕駛甚至整個機(jī)器人行業(yè)的AI 1.0時代結(jié)束了。
1.0時代是什么時代?
靠人編程寫規(guī)則,教神經(jīng)網(wǎng)絡(luò)學(xué)會開車,然后不斷定義和處理Coner Case的時代,即便追求的完全無人的自動駕駛,也需要在一定階段里有ODD、限定條件和區(qū)域的時代,即L4的時代。
AI2.0又是什么時代?
整個AI司機(jī)的大腦就是一個神經(jīng)網(wǎng)絡(luò)大模型,不分模塊,不分堆棧,它接收感知信號,然后輸出決策信號。
更眾所周知的實踐是特斯拉FSD的V12版本,馬斯克下令剔除了幾乎所有人類規(guī)則代碼,99%以上決策都交給了神經(jīng)網(wǎng)絡(luò),最后整個FSD反而有了質(zhì)變提升,并且被馬斯克視為升維Robotaxi的關(guān)鍵里程碑。
周光跟馬斯克有著一樣的看法。
但據(jù)說周光對外分享這個認(rèn)知比馬斯克更早,在2023年3月份的時候,周光和某大佬會面談到了這個,后來5月份該大佬在硅谷和馬斯克見面,馬斯克談到正在往端到端路線推進(jìn)——這也讓該大佬意識到元戎啟行的年輕CEO有點(diǎn)東西。
周光對這個很激動也很感慨,他的說法是如果你連續(xù)選對了技術(shù)判斷,多少意味著點(diǎn)什么……這個連續(xù),連的是端到端之前,周光和元戎啟行團(tuán)隊提倡的前融合,以及無圖。
無圖就是不靠高精度地圖。在華為開始在無圖智駕、城區(qū)NOA的“遙遙領(lǐng)先”攻勢開始前,高精度地圖被視為自動駕駛的標(biāo)配,作為一種“冗余”,高精度地圖讓智駕在高速、快速路上進(jìn)展很快,但一度也因為高精地圖,大大制約了智駕落地量產(chǎn)的速度,特別是進(jìn)城的速度。高精度地圖也是L4落地中的必備要素。
周光透露,元戎今年去做量產(chǎn)、去做資質(zhì)審核的時候,直接拿的就是導(dǎo)航地圖,有導(dǎo)航地圖的地方就能智駕,但發(fā)現(xiàn)其他玩家并非如此,比如在一些十字路口,會有高精度地圖輔助打補(bǔ)丁。
所以元戎啟行CEO強(qiáng)調(diào)自己的方案是“真無圖”,這是技術(shù)先進(jìn)性的體現(xiàn),因為只有端到端才能真無圖,沒有無圖就沒有端到端,也只有端到端和真無圖了才能更快實現(xiàn)全域覆蓋落地,全國都能開。
實際上,元戎啟行和華為一度傳出過緋聞,而且周光談?wù)摰姆桨福A為智駕最新發(fā)布的也大同小異。
但被追問與華為之間的真實情況時,周光選擇了不回答。
江湖上的一種說法是,華為的“遙遙領(lǐng)先”背后實際就是元戎啟行的供應(yīng);另一種說法則是元戎只是和華為有過智駕層面的接觸和交流。
但不論哪一種說法,現(xiàn)如今展現(xiàn)的事實很明確:
第一,華為和元戎啟行都選擇了無圖、端到端的智駕推進(jìn)路線。
第二,華為智駕方案,現(xiàn)在公開的說法很明確:完全自研。
所以元戎啟行的量產(chǎn)方案,又上車了哪里?
周光再次表示出于“客戶第一”,無法奉告。
但在采訪現(xiàn)場,他似乎在等一個隨時可能前來展臺的客戶,他多次交代同事:門開著,不要關(guān),X總來了我需要馬上出去。
而X總正是某巨頭車廠的總裁。
智駕也分高階和低階
我問周光,他是不是太過在意手段上的分辨——如果自動駕駛的終點(diǎn)都一致,最后就是要實現(xiàn)AI司機(jī)對各種路況和場景的接管,有圖無圖、端到端與否、算不算AI2.0……是不是都不本質(zhì)?
周光不認(rèn)同,他認(rèn)為認(rèn)知上、理念上的洞藏很重要,決定了過程,也會決定結(jié)果。
他反復(fù)說的一句話是:編程不等于AI了,靠rule base實現(xiàn)不了通用……只有端到端才能實現(xiàn)通用自動駕駛,或者說現(xiàn)實世界駕駛場景里的通用人工智能。
所以周光的觀點(diǎn)是,端到端、AI2.0帶來的影響的直接影響是什么?是L4這個AI1.0時代被劃分出來的概念和階段,被證偽了。
端到端會打破限定區(qū)域和條件,L4就不再有意義,不存在了。
這個觀點(diǎn),周光更早一些的時候公開表達(dá)過,引發(fā)軒然大波,其后在一家知名L4獨(dú)角獸公司的交流現(xiàn)場,這個觀點(diǎn)也被作為問題拋了出來。
那家L4獨(dú)角獸CEO的回答,大意是L4很難,做不出來的玩家,自然認(rèn)為L4是偽概念。
而周光則不打算回應(yīng)這種回應(yīng)了,他舉起雙手像投降又像鼓掌,“我無話可說,我祝福,別人愿意在他堅持的道路上想跑多遠(yuǎn)就跑多遠(yuǎn),跑越遠(yuǎn)越好。”
他現(xiàn)在的認(rèn)知很明確,量產(chǎn)自動駕駛(L2+L3),然后就是完全無人駕駛(L5)。
因為無圖會加速智能駕駛普及,周光特別強(qiáng)調(diào)的是二線、三線城市的普及和落地,這才是真正考驗技術(shù)實力的地方。
然后普及帶來的數(shù)據(jù)雪球,會在端到端的網(wǎng)絡(luò)和迭代中,實現(xiàn)質(zhì)變,或者說涌現(xiàn)。
周光類比的是iPhone,他認(rèn)為端到端意味著AI2.0的開始,意味著iPhone被發(fā)明出來了,然后數(shù)據(jù)雪球會加速實現(xiàn)質(zhì)變性的那一代iPhone,大勢所趨。
周光還強(qiáng)調(diào),端到端帶來的影響,不止是自動駕駛層面,在智能駕駛賽道,也會迎來新的格局重塑。
當(dāng)前在智能駕駛領(lǐng)域,梯隊格局是按照技術(shù)軸和量產(chǎn)軸來實現(xiàn)的,能實現(xiàn)城區(qū)NOA被認(rèn)為技術(shù)上第一梯隊,智能駕駛方案量產(chǎn)進(jìn)展,被視為數(shù)據(jù)上的核心變量,技術(shù)和數(shù)據(jù)綜合起來構(gòu)成了整體競爭力。
周光認(rèn)同技術(shù)和數(shù)據(jù)兩大維度,但他的觀點(diǎn)是,城區(qū)NOA的落地、體驗,會成為最關(guān)鍵變量。
不能實現(xiàn)城區(qū)NOA的,包括高速NOA,都只能稱之為“低階智駕”。低階智駕可以靠高精度地圖、靠rule base……但高階智駕不行,只能端到端。
而元戎啟行,現(xiàn)在是高階智駕賽道里的玩家——至少拿到了入場券。
在周光的看來,高階智駕的競速才剛剛開始,如果讓他列供應(yīng)商名單,包括元戎在內(nèi),他認(rèn)為國內(nèi)只有三家。
事實上,端到端對元戎啟行的影響才是根本性的。
元戎啟行創(chuàng)辦的5年,或者更早的那段時間里,公司的愿景說的還是L4、自動駕駛。
但最近,周光帶隊做了調(diào)整:“打造物理世界的通用人工智能”。
相比自動駕駛,這是一個更宏大的目標(biāo),包含自動駕駛,也包含了機(jī)器人,或者更時髦的具身智能。
不過周光也強(qiáng)調(diào),汽車是實現(xiàn)這種愿景——物理世界通用人工智能——唯一途徑,因為端到端系統(tǒng)需要海量數(shù)據(jù),現(xiàn)如今除了汽車,沒有其他的機(jī)器人形態(tài)可以提供和實現(xiàn)。
所以在被問到“跟L4的朋友們還有聯(lián)系嗎”時,元戎啟行CEO給出了這樣的回答:
“我現(xiàn)在跟AGI的人交流比較多,我喜歡跟厲害的人交流。”