自動(dòng)駕駛版的“ChatGPT”來了。
4月11日,第八屆 HAOMO AI DAY舉辦。作為中國聚焦自動(dòng)駕駛技術(shù)的盛會(huì)之一,這次AI DAY的行業(yè)關(guān)注度也很高。
過去在這個(gè)會(huì)上,毫末智行都會(huì)發(fā)布最新的一些自動(dòng)駕駛行業(yè)技術(shù)動(dòng)向,比如2021年9月發(fā)布的數(shù)據(jù)智能系統(tǒng),去年4月份舉行AI DAY上發(fā)布毫末城市NOH,發(fā)布毫末小魔駝2.0等。
今年的AI DAY,有一些特別。
2月17日,毫末智行宣布自動(dòng)駕駛認(rèn)知大模升級(jí)為DriveGPT,并表示將在AI DAY上公布進(jìn)展。
DriveGPT的發(fā)布,宣告著自動(dòng)駕駛正在邁進(jìn)3.0時(shí)代,接下來毫末還會(huì)有什么動(dòng)作,其實(shí)是外界比較關(guān)心的事情。比如,新技術(shù)能夠產(chǎn)生怎樣的影響?接下來行業(yè)會(huì)發(fā)生怎樣的變化?
這次AI DAY中也許就有答案。
自動(dòng)駕駛生成式大模型升級(jí):DriveGPT雪湖·海若
毫末的AI DAY,總是不讓人失望,每次都有新體驗(yàn)、新技術(shù)、新動(dòng)態(tài)。
三個(gè)月一次的舉辦節(jié)奏很有深意,而且每次都有重磅信息披露,科技行業(yè)要做到“季更”,其實(shí)不太容易,背后需要有充足的技術(shù)儲(chǔ)備和迭代能力,另外“季更”也能倒逼著企業(yè)研發(fā)不斷迭代。
這次AI DAY上,毫末主要宣布了這么幾件事:
發(fā)布DriveGPT雪湖·海若,MANA 架構(gòu)全新升級(jí)。
宣布與三大主機(jī)廠合作,量產(chǎn)裝機(jī)爭(zhēng)奪戰(zhàn)開始。
2024年毫末城市NOH落地百城。
末端物流與商業(yè)進(jìn)一步落地。
信息量很大,但人們關(guān)注的焦點(diǎn)很清晰:業(yè)內(nèi)首個(gè)自動(dòng)駕駛生成式大模型——DriveGPT雪湖·海若。
董事長張凱在演講中提到,毫末其實(shí)提前兩年就開始布局 AI 大模型,ChatGPT還沒有像現(xiàn)在這么人盡皆知。直到ChatGPT火了之后,人們對(duì)大模型才開始有所了解。
在打“提前量”這件事上,毫末還是很認(rèn)真的,畢竟毫末是行業(yè)內(nèi)最早一批堅(jiān)定做漸進(jìn)路線的自動(dòng)駕駛企業(yè),也是最早圍繞著商業(yè)化、落地去布局的玩家。
與ChatGPT相似的是,雪湖·海若也是通過RLHF(人類反饋學(xué)習(xí)強(qiáng)化學(xué)習(xí))算法,對(duì)自動(dòng)駕駛技術(shù)本身進(jìn)行優(yōu)化。
不同之處在于,ChatGPT用人們聊天對(duì)話輸入,然后用文字輸出,雪湖·海若(DriveGPT)則是輸入駕駛數(shù)據(jù),比如駕駛場(chǎng)景、駕駛習(xí)慣。輸出的是能力更強(qiáng)的自動(dòng)駕駛技術(shù)。
相比技術(shù)細(xì)節(jié),其實(shí)更需要關(guān)注的是,雪湖·海若的發(fā)布意味著什么?
在談擎說AI看來,接下來可能會(huì)有這么幾個(gè)變化:
1、重塑了汽車智能化的技術(shù)路線。
過去的汽車智能化,更多是產(chǎn)品的智能化,并不是核心技術(shù)的智能化。
比如智能座艙,他能帶來智能化體驗(yàn),這個(gè)是用戶最能感知到的,比如語音交互、情感智能等等,主打智能化概念。做這種類型的智能汽車,需要的是產(chǎn)業(yè)整合能力,但缺的是核心技術(shù)護(hù)城河,這類車企最多,寒冬來了之后也最危險(xiǎn)。
真正的智能化技術(shù)是能夠自我學(xué)習(xí),自我生長的,真正的自動(dòng)駕駛,也應(yīng)如此。過去的自動(dòng)駕駛技術(shù),本質(zhì)上還是需要人去優(yōu)化算法,調(diào)整參數(shù)。
雪湖·海若對(duì)行業(yè)最大影響在于,用技術(shù)去“培育”技術(shù),這可能會(huì)產(chǎn)生深遠(yuǎn)影響。自此,自動(dòng)駕駛技術(shù)自身有了自我進(jìn)化的能力,自動(dòng)駕駛技術(shù)演化的方式就此改變。
2、極大地拓展毫末城市NOH產(chǎn)品的能力,幫助毫末城市NOH進(jìn)一步量產(chǎn)迭代。
雪湖·海若對(duì)行業(yè)的影響會(huì)更直接。按照毫末的說法是:DriveGPT 可以逐步應(yīng)用到城市 NOH、并且提升城市輔助駕駛的能力。
ChatGPT之所以強(qiáng),是因?yàn)楦淖兞薃I本身演化的方式,更有效率,更成熟。
DriverGPT雪湖·海若則“重新開了一個(gè)主線”,人類反饋強(qiáng)化學(xué)習(xí)(RLHF)算法下,大量的老司機(jī)面臨的真實(shí)的場(chǎng)景數(shù)據(jù)去訓(xùn)練AI決策。
也就是說,在雪湖·海若的幫助下,將來毫末城市NOH的能力可能會(huì)更強(qiáng),場(chǎng)景感知能力、自動(dòng)駕駛能力也能快速迭代,搭載毫末城市NOH的車輛也能有“老司機(jī)”一樣的能力。
只要數(shù)據(jù)樣本夠多,那么城市NOH面臨的長尾場(chǎng)景問題,可能會(huì)更容易被解決,這有助于毫末城市NOH進(jìn)一步量產(chǎn)迭代。
3、把行業(yè)帶入“大模型”時(shí)代。
發(fā)布會(huì)上,一個(gè)頗為重要的信息是,雪湖·海若的能力對(duì)行業(yè)來說是開放的。
目前,北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院、高通、火山引擎、華為云、京東科技、四維圖新、魏牌新能源、英特爾等多家企業(yè)和機(jī)構(gòu)已經(jīng)加入。
毫末方面還表示, DriveGPT 會(huì)面向公眾逐步開放三大應(yīng)用場(chǎng)景,包括駕駛場(chǎng)景自動(dòng)標(biāo)注、駕駛行為驗(yàn)證、困難場(chǎng)景脫困等。
自動(dòng)駕駛技術(shù)發(fā)展到現(xiàn)在,硬件性能早已不是天花板,關(guān)鍵是自動(dòng)駕駛感知決策能力以及數(shù)據(jù)樣本的量級(jí)。ChatGPT的成功表明,大模型可能才是行業(yè)最終的解決方案。
雪湖·海若的發(fā)布只是一個(gè)開始,接下來大模型在自動(dòng)駕駛領(lǐng)域的應(yīng)用規(guī)模會(huì)更大。
自動(dòng)駕駛3.0時(shí)代,量產(chǎn)導(dǎo)向、降本、規(guī)模化
過去,自動(dòng)駕駛行業(yè)經(jīng)歷過估值高光也經(jīng)歷過寒冬。
整個(gè)行業(yè)從熱到冷再到熱,最后經(jīng)過驗(yàn)證錘煉得出來一個(gè)方向:“行泊一體,量產(chǎn)為王”。
當(dāng)下行業(yè)中的玩家們也不再爭(zhēng)論L4還是L2,而是都埋下頭去做量產(chǎn)方案,去做滿足主機(jī)廠需求的方案。
原因很簡(jiǎn)單,前裝市場(chǎng)的商業(yè)化規(guī)模在進(jìn)一步增長。
毫末智行董事長張凱提到一個(gè)數(shù)據(jù):2022年中國乘用車市場(chǎng)L2及以上輔助駕駛前裝搭載率升至 29.40%,前裝標(biāo)配交付 585.99 萬輛,預(yù)估2025 年高級(jí)別輔助駕駛搭載率超過 70%。
也就是說,行泊一體的解決方案NOA產(chǎn)品,將會(huì)在23、24年大規(guī)模落地。對(duì)于自動(dòng)駕駛企業(yè)來說,這意味著服務(wù)主機(jī)廠需要的能力也在變化。
在談擎說AI來看,城市輔助駕駛來到前裝量產(chǎn)階段,技術(shù)之外,降本和規(guī)?;彩呛诵母?jìng)爭(zhēng)力。
量產(chǎn)的1.0時(shí)代,需要的是工程化能力,所以一些L4廠商做L2的過程中,也需要補(bǔ)足工程化能力。到了量產(chǎn)的2.0時(shí)代,不僅需要工程能力,更需要降本增效能力。
但降本這件事,不僅靠供應(yīng)鏈資源整合能力,也靠的是對(duì)工程、技術(shù)的理解。
在降本上,毫末其實(shí)很有一套。
比如,毫末把視覺 BEV 感知框架引入到了車端魚眼相機(jī),做到了在 15 米范圍內(nèi)達(dá)到 30cm 的測(cè)量精度,2 米內(nèi)精度高于 10cm 的視覺精度效果。結(jié)果就是,這樣的精度下,泊車場(chǎng)景下純視覺就能替代超聲波雷達(dá),從而進(jìn)一步降低成本。
再比如,海若DriveGPT的幫助下,可實(shí)現(xiàn) 4D Clip 數(shù)據(jù)自動(dòng)化標(biāo)注的規(guī)?;a(chǎn),降低行業(yè)使用數(shù)據(jù)的成本。據(jù)悉,單幀圖片整體標(biāo)注成本僅相當(dāng)于行業(yè)的 1/20。
這些技術(shù)、工程能力,最終反饋到產(chǎn)業(yè)鏈上,就是終端車型的智能化成本可能會(huì)更低。長期來看,汽車終端市場(chǎng)價(jià)格內(nèi)卷是大趨勢(shì),能幫助車企降低成本的一級(jí)供應(yīng)商,才是好的供應(yīng)商。
降本之后,終端價(jià)格打下來,城市輔助駕駛、自動(dòng)駕駛產(chǎn)品才能進(jìn)一步完成規(guī)模化,合作伙伴才能越來越多。
規(guī)模化能力上,就是能不能持續(xù)打開新的市場(chǎng),不斷地?cái)U(kuò)充“朋友圈”。
毫末也公布了最新的商業(yè)化進(jìn)展:
DriveGPT 首發(fā)車型新摩卡 DHT-PHEV,即將量產(chǎn)上市;搭載毫末NOH車型即將上市;海若大模型進(jìn)一步升級(jí)感知能力。
另外一個(gè)重要的消息是,毫末官宣了與三大主機(jī)廠合作。
毫末智行表示,目前已經(jīng)與三家主機(jī)廠簽署戰(zhàn)略合作協(xié)議,達(dá)成面向 L2+級(jí)別智能駕駛領(lǐng)域的全方位戰(zhàn)略合作,相關(guān)項(xiàng)目已經(jīng)在交付中。
這個(gè)簽約,其實(shí)很有分量。對(duì)于行業(yè)來說,意味著打響了量產(chǎn)裝機(jī)“爭(zhēng)奪戰(zhàn)”,是商業(yè)化的重要節(jié)點(diǎn)。
這靠的其實(shí)還是技術(shù)能力。
比如,技術(shù)的前瞻性。
目前,毫末被國際頂會(huì)收錄的學(xué)術(shù)論文達(dá)到 6 篇 ,最新的兩篇分別入選計(jì)算機(jī)視覺識(shí)別領(lǐng)域三大頂會(huì)之一的 CVPR 和全球首個(gè)智能車專業(yè)期刊 IEEE TIV,走在AI算法前沿領(lǐng)域。
技術(shù)壁壘夠強(qiáng),就更容易打開商業(yè)化空間。
一方面,與三大主機(jī)廠達(dá)成合作,意味著毫末靠技術(shù)優(yōu)勢(shì)打破了汽車行業(yè)的“門派之見”,接下來商業(yè)化空間更大。
另一方面,最能體現(xiàn)技術(shù)能力,還是雪湖·海若DriveGPT。
DriveGPT對(duì)于自動(dòng)駕駛公司來說,味著成長性,意味著引領(lǐng)行業(yè)的能力。
這就像是比亞迪的“刀片電池”,能夠代表行業(yè)最頂尖的能力,這讓毫末智行城市NOH有更多的信心走出去,成長為參天大樹。
談擎說AI認(rèn)為,長期來看DriveGPT+前裝規(guī)?;?,會(huì)改變自動(dòng)駕駛行業(yè)格局,DriveGPT正在把行業(yè)帶入一個(gè)全新的3.0量產(chǎn)時(shí)代。
技術(shù)驅(qū)動(dòng)行業(yè)中,技術(shù)代差能快速改變市場(chǎng)格局。(這也是谷歌這么忌憚OpenAI的原因)
過去,自動(dòng)駕駛行業(yè)中,大家其實(shí)技術(shù)水平整體差距沒有想象中那么大,而DriveGPT的出現(xiàn),可能意味著一次“技術(shù)爆炸”。
從ChatGPT2到ChatGPT4 的變化是明顯的,但OPEN AI的創(chuàng)始人透露,這里面其實(shí)更多的是數(shù)據(jù)量級(jí)的差異。
DriveGPT也是如此,訓(xùn)練的數(shù)據(jù)量越大,技術(shù)越成熟,越容易拉開與行業(yè)其他玩家的差距。
此次AI DAY上,毫末也透露出了自動(dòng)駕駛數(shù)據(jù)智能體系 MANA的升級(jí)情況。
目前,MANA 計(jì)算基礎(chǔ)服務(wù)針對(duì)大模型訓(xùn)練在參數(shù)規(guī)模、穩(wěn)定性和效率方面做了專項(xiàng)優(yōu)化,感知和認(rèn)知相關(guān)大模型能力統(tǒng)一整合到 DriveGPT 中。數(shù)據(jù)顯示,MANA 的學(xué)習(xí)時(shí)長超過 56 萬小時(shí),虛擬駕齡相當(dāng)于人類司機(jī) 6.8 萬年?,F(xiàn)在這些數(shù)據(jù)仍然在不斷增長。
數(shù)據(jù)量變會(huì)不會(huì)引發(fā)自動(dòng)駕駛的“質(zhì)變”?自動(dòng)駕駛行業(yè)中每個(gè)人都希望知道答案。
目前來看,這個(gè)最重要的問題,可能需要毫末來回答。
結(jié)語:
從此次AI DAY來看,DriveGPT很可能正在開啟自動(dòng)駕駛的另一個(gè)時(shí)代。
自動(dòng)駕駛未來是確定的,AI的未來也是確定的,問題在于實(shí)現(xiàn)的過程需要探索。這么多公司在前仆后繼,不斷改良,勇攀技術(shù)高峰,就是不斷探索的過程。
DriveGPT是自動(dòng)駕駛行業(yè)階段性探索的成果。這個(gè)成果對(duì)于整個(gè)AI的發(fā)展也有重要意義,接下來AIGPT能力進(jìn)一步深化,可能會(huì)有更多GPT 出現(xiàn)。
接下來,關(guān)于AI的歷史會(huì)如何書寫,值得期待。