“Hey Mercedes(你好,奔馳),附近最適合游泳的海灘在哪里?”“你可以去這里游泳,曬日光浴或者沖浪。另外,你可以散步、野餐,或者只是放松和看書。如果你精力充沛,你還可以和朋友玩沙灘排球或者飛盤。無論你選擇做什么,我希望你能玩得開心?!币欢握鎸嵱脩舻捏w驗視頻揭開了搭載ChatGPT后奔馳AI智能語音助手的神秘面紗。
近日,ChatGPT掀起的大模型之火,蔓延到了智能汽車場景之中。梅賽德斯-奔馳和微軟官宣正在合作測試車載ChatGPT人工智能,并將面向約90萬車主開啟測試。這是ChatGPT首次“上車”,標(biāo)志著智能汽車領(lǐng)域的大模型之戰(zhàn)正式開啟。
智能汽車的“ChatGPT時刻”來了?
大模型將重構(gòu)各行各業(yè)雖已成為業(yè)界共識,但ChatGPT“上車”遠比預(yù)想中來得更快。作為繼家庭和辦公場所之外的“第三空間”,汽車正在變成一個新型智能終端。人車交互是汽車智能化的標(biāo)簽,而AI語音助手則成為了智能汽車的“標(biāo)配”。
與普通的語音助手不同,奔馳的車載ChatGPT語音助手可以處理完整的對話,例如追問,并且能保持對前后文的理解。據(jù)悉,微軟還在與梅賽德斯-奔馳探索ChatGPT的插件生態(tài)系統(tǒng),為第三方服務(wù)集成開辟可能性。駕駛員未來有望通過車載系統(tǒng)就能完成預(yù)訂餐廳、預(yù)定電影票等任務(wù),進一步提高便利性和生產(chǎn)力。
大模型上車帶來的不僅是AI語音助手的升級,還將推動智能駕駛技術(shù)的進階。繼奔馳搭載ChatGPT之后,理想汽車也發(fā)布了自研大模型MindGPT,宣布新一代理想汽車不再依賴高精地圖的城市NOA產(chǎn)品,將做到接近人類司機的駕駛表現(xiàn)。業(yè)內(nèi)專家分析稱,大模型具備對海量數(shù)據(jù)的處理能力以及多維度分析能力,可以提供更精準(zhǔn)、更全面的數(shù)據(jù)分析和預(yù)測能力,持續(xù)優(yōu)化模型,提高智能駕駛的準(zhǔn)確性和可靠性。
與此同時,車載操作系統(tǒng)正在被大模型重塑。近日,斑馬智行第三代汽車AI能力體系Banma Co-Pilot在阿里通義千問大模型的賦能下,實現(xiàn)了AliOS車載操作系統(tǒng)的全面升級。開源證券研報指出,大模型時代,第三方科技巨頭的加入有望通過提供強大工具鏈形成自動駕駛行業(yè)的“安卓”,幫助整車廠構(gòu)建自己的自動駕駛算法和數(shù)據(jù)閉環(huán)系統(tǒng),同時依靠大模型的數(shù)據(jù)生成能力,縮小與頭部玩家在數(shù)據(jù)領(lǐng)域的差距。
此外,大模型還將激起汽車產(chǎn)業(yè)的生產(chǎn)、研發(fā)模式的創(chuàng)新變革。理想汽車創(chuàng)始人李想舉了這樣一個例子:“過去我們一年要做大概1000萬幀的自動駕駛圖像的人工標(biāo)定,所以我們請了很多外包公司進行標(biāo)定,大概6元到8元錢一張,一年的成本接近一億元,這僅僅是來做自動駕駛方面的圖片標(biāo)定。但是當(dāng)我們使用大模型,通過訓(xùn)練的方式進行自動化標(biāo)定,過去需要用一年做的事情基本上3個小時就能完成,效率是人的1000倍。”如何快速和汽車產(chǎn)業(yè)原有的知識體系相融合,如何與大模型的學(xué)習(xí)能力、泛化能力協(xié)同,形成更有效率的生產(chǎn)、研發(fā)方式,正在成為汽車產(chǎn)業(yè)接下來研究的核心課題。
可見,大模型正在從研發(fā)設(shè)計模式、人機交互、智能駕駛、用戶生態(tài)等方方面面給整個汽車產(chǎn)業(yè)帶來深刻影響,加速驅(qū)動產(chǎn)業(yè)生態(tài)的智能化、高效化、安全化和可持續(xù)發(fā)展。
國內(nèi)汽車廠商圍繞大模型展開多方探索
盡管奔馳與微軟的合作被稱作是ChatGPT在汽車領(lǐng)域的首個應(yīng)用,但也有觀點認(rèn)為,奔馳實際上是趕了個“晚集”。在前不久的上海汽車展上,國內(nèi)眾多汽車廠商皆展示了大模型方面的布局。
“ChatGPT成功后,如今正向多應(yīng)用生態(tài)發(fā)展,車企也想將GPT的熱度引導(dǎo)到智能車聯(lián)網(wǎng)領(lǐng)域?!闭憬髮W(xué)國際聯(lián)合商學(xué)院數(shù)字經(jīng)濟與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤和林表示。從功能上來看,目前人工智能在汽車上主要有兩種落地形式:一類是用于人工智能交流對話領(lǐng)域,多數(shù)應(yīng)用在智能座艙,比如百度的文心一言,已有東風(fēng)日產(chǎn)、紅旗、長城等近十家車企宣布接入;上海車展期間,商湯科技亮相日日新Sensenova大模型,展示了其中文語言模型“商量SenseChat”以及“如影SenseAvatar”等與座艙的結(jié)合;此前阿里巴巴也宣布AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進行測試等。
另一類是聚焦智能駕駛,比如毫末智行發(fā)布了自動駕駛生成式大模型DriveGPT,幫助解決認(rèn)知決策問題,最終實現(xiàn)端到端的自動駕駛。理想汽車自研大模型MindGPT,擺脫對高精地圖的依賴,讓汽車做到更接近人類司機的駕駛表現(xiàn)。蔚來、小鵬、長城、奇瑞四家車企也已注冊申請了多個與GPT相關(guān)的商標(biāo)。
乘聯(lián)會數(shù)據(jù)顯示,2022全年我國銷售新能源乘用車523.3萬輛,其中智能汽車240.4萬輛,占比45.94%。比亞迪、長安、嵐圖、問界等國內(nèi)品牌已經(jīng)走在智能汽車行業(yè)前列。
相較于通用型大模型,垂直領(lǐng)域的大模型訓(xùn)練和使用成本較低,或許會成為更容易實現(xiàn)商業(yè)落地的領(lǐng)域。業(yè)內(nèi)人士分析稱,汽車有著明確的交互需求,且相較于通用大模型,垂直領(lǐng)域的應(yīng)用場景相對較小,對參數(shù)的量級要求也沒有通用型AI那么大。因此,無論是傳統(tǒng)汽車廠商、造車新勢力,還是大模型科技廠商,普遍認(rèn)為智能汽車最有可能成為率先實現(xiàn)大模型落地的B端場景。
大模型真正“上車”仍需時日
ChatGPT的首發(fā)“上車”已經(jīng)拉開了智能汽車領(lǐng)域大模型之爭的序幕,但需要指出的是,現(xiàn)階段距離大模型真正落地汽車行業(yè)還有一段距離。
專家普遍認(rèn)為,目前汽車領(lǐng)域?qū)τ诖竽P偷膽?yīng)用仍處于初期的嘗試階段。對于想做大模型的汽車廠商而言,多模態(tài)數(shù)據(jù)的收集、處理、訓(xùn)練是一個難題。自動駕駛所需傳感器數(shù)據(jù)包括激光雷達、毫米波雷達、超聲波雷達,以及高清攝像頭、GPS等。這些數(shù)據(jù)來自不同的坐標(biāo)系,帶有不同的觸發(fā)時間戳,且要考慮到硬件損壞等問題;同時,需要大量的場景數(shù)據(jù),比如交通標(biāo)志線、交通流、行為模型等。這讓汽車大模型的研發(fā)、訓(xùn)練門檻變得很高。
數(shù)據(jù)來源:汽車銷量數(shù)據(jù)為上險數(shù)據(jù),汽車之家研究院
中國工程院院士、清華大學(xué)教授、國家智能網(wǎng)聯(lián)汽車創(chuàng)新中心首席科學(xué)家李克強指出,模型數(shù)據(jù)調(diào)動管理需要利用智能網(wǎng)聯(lián)汽車以及計算技術(shù)平臺、云控技術(shù)平臺等平臺,只有大量的數(shù)據(jù)匯聚才可做交叉,特別是垂直領(lǐng)域,這和娛樂系統(tǒng)、服務(wù)系統(tǒng)不一樣,從產(chǎn)業(yè)互聯(lián)網(wǎng)的角度來看,若基礎(chǔ)云平臺不能打通,很難實現(xiàn)向深層領(lǐng)域推進。
在加拿大工程研究院院士、人工智能與數(shù)字經(jīng)濟廣東省實驗室(深圳)執(zhí)行主任于非看來,駕駛中有信息系統(tǒng)模型、思考模型、執(zhí)行模型三部分,生成式的AI大模型意味著在知識方面和信息方面取得了突破,但并不意味著目前它能在汽車上執(zhí)行,也就是控制層面取得突破。于非也認(rèn)為,“車路人云”協(xié)同可以讓行業(yè)產(chǎn)生大裂變,但要AI大模型發(fā)展對智能網(wǎng)聯(lián)汽車發(fā)展產(chǎn)生突破性影響還需要時間。
地平線CTO黃暢認(rèn)為,GPT在自動駕駛場景中最先應(yīng)用的很可能是環(huán)境模型的預(yù)測和交互式規(guī)控和規(guī)劃?!斑@個場景不需要特別的大規(guī)模參數(shù)模型,因為它不是一個完整的端到端閉環(huán),尤其因為它更關(guān)注于預(yù)測和規(guī)劃,不用花太多精力在感知這個層面上,因此很可能在百Tops級別的算力平臺上就能應(yīng)用,在3~5年內(nèi)就可以初步上線。而從感知到定位地圖到規(guī)控,整個端到端的閉環(huán)做出來,則需要一個更大規(guī)模的參數(shù)模型,大概需要5~10年的時間?!彼f。
從部署方面看,大模型需要高規(guī)格的硬件配置,包含高性能計算能力、大容量內(nèi)存和低時延等特點,但車載設(shè)備的硬件條件相對有限,無法提供足夠的計算資源支撐大模型運行。例如在自然語言處理領(lǐng)域的 GPT-3 模型就需要數(shù)萬億Tops的計算能力。這要求芯片的算力至少要在萬級Tops以上才能夠勝任大型模型的計算任務(wù)。但是,在車載部署場景下,芯片的算力往往只有數(shù)百Tops,遠遠達不到大型模型的要求。
智算中心被視為大模型落地汽車行業(yè)必不可少的基礎(chǔ)設(shè)施。特斯拉發(fā)布了獨立的云端智算中心——Dojo,總計使用了1.4萬個英偉達的GPU來訓(xùn)練AI模型。小鵬汽車和阿里云合建了智算中心“扶搖”,專門用于自動駕駛模型訓(xùn)練,算力規(guī)模達600PFLOPS。毫末和火山引擎聯(lián)合打造了國內(nèi)自動駕駛行業(yè)最大的智算中心“雪湖·綠洲(MANA OASIS)”,每秒浮點運算可達67億億次。有業(yè)內(nèi)人士呼吁,自動駕駛行業(yè)的大模型要成功,全自動駕駛行業(yè)的數(shù)據(jù)需要像互聯(lián)網(wǎng)數(shù)據(jù)一樣公開,這需要監(jiān)管機構(gòu)、行業(yè)參與者等共同推進。
此外,奧緯咨詢董事合伙人張君毅表示,車企們爭相獨立布局大語言模型技術(shù),技術(shù)資源和注意力容易被分散,由于基層算法人才的趨利流動和大算力GPU的分配,有可能會在一定程度上影響干擾自動駕駛的市場發(fā)展。產(chǎn)業(yè)鏈上下游應(yīng)加強分工合作,避免“重復(fù)造輪子”。
作者丨宋婧? 編輯丨劉晶
美編丨馬利亞? 監(jiān)制丨連曉東