賈浩楠 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
上海車(chē)展,60多家主機(jī)廠(子品牌合并計(jì)算)正在集中秀智能秀新車(chē)。
汽車(chē)產(chǎn)業(yè)憋3年,這是一次空前釋放。
誰(shuí)技術(shù)最好?誰(shuí)能代表智能化未來(lái)?還真不好說(shuō)。
但有30多家車(chē)企,卻不約而同“商量”了一下:
商湯絕影,車(chē)展上諸多熱門(mén)車(chē)型上都有它的身影,或智駕或智艙。而商湯絕影自己的展臺(tái),還展現(xiàn)出了平臺(tái)型AI公司給智能車(chē)帶來(lái)的新想象空間。
大模型“商量”、AIGC平臺(tái)“秒畫(huà)”融入智艙系統(tǒng),突破了現(xiàn)在“平板電腦”式的車(chē)內(nèi)交互。
通過(guò)AI數(shù)字人可喚醒“商量”,而它則會(huì)根據(jù)用戶(hù)屬性、應(yīng)用場(chǎng)景,身兼多職。比如行車(chē)過(guò)程中收到郵件時(shí),商量化身“郵件助手”,自動(dòng)提煉關(guān)鍵信息、回復(fù)郵件:
它還是位聰明的“會(huì)議助理”,可以自動(dòng)生成會(huì)議紀(jì)要,大大節(jié)省用戶(hù)行車(chē)時(shí)處理工作的時(shí)間和精力。
“商湯秒畫(huà)SenseMirage”文生圖創(chuàng)作平臺(tái)還會(huì)根據(jù)乘客的屬性和喜好,生成各類(lèi)風(fēng)格的圖像:
大模型上車(chē)所帶來(lái)的全新場(chǎng)景體驗(yàn),讓車(chē)圈談?wù)摂?shù)年的“第三生活空間“概念似乎已近在眼前。
官宣不過(guò)1年多時(shí)間,絕影展現(xiàn)出的智能汽車(chē)技術(shù)量產(chǎn)落地的情況是:合作主機(jī)廠30多家、超50個(gè)生態(tài)合作伙伴,定點(diǎn)3100萬(wàn)輛,而且覆蓋智駕智艙兩個(gè)領(lǐng)域。
這也讓商湯絕影成了車(chē)展上最不顯山不露水的贏家之一。
而回溯商湯的歷史,這樣的劇本似乎早就寫(xiě)好了——ChatGPT帶火的AI大模型能力,是商湯從2019年就開(kāi)始就投入探索建設(shè)的。
“絕影”出沒(méi)車(chē)展
絕影,三國(guó)曹操的坐騎,與赤兔、的盧一樣青史留名的千里馬。這屆車(chē)展上,這匹“絕影”頻繁出沒(méi)于各大主機(jī)廠的展臺(tái)。
廣汽埃安旗下主打?qū)嵱眯缘闹行蚐UV LX Plus,搭載具備高速領(lǐng)航輔助能力的ADAS系統(tǒng),背后的支持,是商湯絕影的環(huán)視BEV感知能力和通用目標(biāo)感知能力。
而商湯絕影的全棧智能駕駛能力,搭載在了新勢(shì)力哪吒的轎跑新車(chē)S上,將為消費(fèi)者帶來(lái)安全可靠、高效舒適的高速領(lǐng)航輔助駕駛體驗(yàn)。
至于商湯絕影的智能座艙技術(shù),量產(chǎn)落地范圍就更廣了。
比如蔚來(lái)NT2.0平臺(tái)的ET7/ET5/ES7等等,支持出行場(chǎng)景下對(duì)駕駛員的疲勞狀態(tài)進(jìn)行實(shí)時(shí)提醒,同時(shí)助力提供Face ID、兒童遺忘檢測(cè)系統(tǒng)(CPD -Child Presence Detection)等乘員感知技術(shù)。
前段時(shí)間亮相的極氪兩廂純電小鋼炮X,首次采用了完全無(wú)門(mén)把手的設(shè)計(jì),而是在B柱上集成了包括FaceID在內(nèi)的感應(yīng)交互功能,同樣是由商湯絕影提供。
長(zhǎng)安逸達(dá)還搭載了絕影健康檢測(cè)產(chǎn)品,可在不到半分鐘內(nèi)檢測(cè)出車(chē)艙乘員的多種健康指標(biāo),帶來(lái)車(chē)載健康管理新體驗(yàn)。
在本屆車(chē)展亮相的東風(fēng)猛士917、廣汽傳祺E9、影酷以及M8宗師、高合HiPhi等車(chē)型,也都用了商湯絕影駕駛員感知和乘員感知的多項(xiàng)功能。
總結(jié)一下,今年全球汽車(chē)行業(yè)首個(gè)A級(jí)車(chē)展上,60多個(gè)主機(jī)廠卷的主題依然是智能化,而這其中,有30多家已經(jīng)和商湯絕影達(dá)成合作,定點(diǎn)3100萬(wàn)輛。
“絕影”確如其名,展現(xiàn)的同樣是千里馬躡影追風(fēng)的速度。
絕影展現(xiàn)出了怎樣的技術(shù)能力?
商湯絕影在量產(chǎn)車(chē)方向,提供的主要是智艙和智駕兩個(gè)產(chǎn)品。
智能車(chē)艙SenseAuto Cabin由駕駛員感知系統(tǒng)(DMS)、車(chē)艙感知系統(tǒng)(OMS)、智能進(jìn)入系統(tǒng)及車(chē)艙APP等產(chǎn)品組成。
最基本的功能如“刷臉開(kāi)車(chē)門(mén)”。DMS能夠根據(jù)駕駛員身份同步完成座椅、后視鏡等調(diào)節(jié)。駕駛過(guò)程中,還可以對(duì)駕駛員行車(chē)狀態(tài),對(duì)疲勞、分心及危險(xiǎn)行為進(jìn)行預(yù)警,并且根據(jù)駕駛員注視區(qū)域及視線方向,提供安全的無(wú)接觸式交互。
甚至還有更加個(gè)性化的功能設(shè)置。比如可以根據(jù)乘客需要,提供基于年齡、性別等屬性的多種定制化服務(wù)。
智能駕駛SenseAuto Pilot則是行泊一體的方案,充分共享行車(chē)傳感器與泊車(chē)傳感器的感知數(shù)據(jù),統(tǒng)一行車(chē)域與泊車(chē)域的軟件架構(gòu)以及在計(jì)算平臺(tái)的部署,降低軟硬件成本,同時(shí)提升芯片算力的利用效率,推進(jìn)智能駕駛?cè)珗?chǎng)景打通和落地應(yīng)用。
在高速場(chǎng)景下,可支持智能導(dǎo)航變道、靈活效率變道等L2+功能,同時(shí)可以支持大曲率匝道通行、異性車(chē)輛識(shí)別與響應(yīng),進(jìn)一步提高功能體驗(yàn)。在城市領(lǐng)航下,絕影通過(guò)豐富的感知元素識(shí)別能力和識(shí)別精度,可以支持路口紅綠燈啟停、無(wú)保護(hù)左轉(zhuǎn)、擁堵場(chǎng)景跟車(chē)等功能。
商湯絕影記憶泊車(chē)產(chǎn)品支持跨層停車(chē)場(chǎng)的路徑記憶、路徑循跡、 智能避讓以及目標(biāo)車(chē)位泊入功能,可實(shí)現(xiàn)大型多層停車(chē)場(chǎng)的跨層路線記憶。
針對(duì)高性?xún)r(jià)比車(chē)型,商湯絕影還推出SenseAuto Pilot Entry(6V1R)方案,行車(chē)功能可以有效復(fù)用泊車(chē)的魚(yú)眼相機(jī),最大程度共用傳感器,壓縮計(jì)算資源,實(shí)現(xiàn)主動(dòng)安全、L2 駕駛輔助與 APA 泊車(chē)輔助功能。
所以,能看出商湯絕影無(wú)論座艙還是智駕,提供區(qū)別于其他供應(yīng)商的獨(dú)特功能,以及在同等體驗(yàn)下實(shí)現(xiàn)成本控制的基礎(chǔ),都是通用視覺(jué)識(shí)別能力——商湯一貫的強(qiáng)項(xiàng)和核心優(yōu)勢(shì)。
實(shí)際上感知技術(shù)被稱(chēng)為智能車(chē)業(yè)務(wù)的先手環(huán)節(jié)。
無(wú)論是交通、醫(yī)療、金融等等行業(yè)的AI落地應(yīng)用,幾乎無(wú)一例外要求極佳視覺(jué)感知能力,以及決策能力,這兩項(xiàng)為商湯建設(shè)的通用AI能力核心。
從2019年開(kāi)始,商湯從10億參數(shù)的視覺(jué)模型研發(fā),到今天有320億全球最大規(guī)模的通用視覺(jué)的模型,實(shí)現(xiàn)了高性能的目標(biāo)檢測(cè)、圖像分割和多物體識(shí)別算法,并在自動(dòng)駕駛、工業(yè)質(zhì)檢、醫(yī)療影像等多個(gè)領(lǐng)域得到廣泛應(yīng)用。
決策方面,商湯聯(lián)合上海人工智能實(shí)驗(yàn)室推出了OpenDILab決策AI平臺(tái)。這其中的DI-drive是一套自動(dòng)駕駛仿真訓(xùn)練平臺(tái),可通過(guò)決策AI在仿真器中構(gòu)建訓(xùn)練和評(píng)測(cè)場(chǎng)景,讓AI在自動(dòng)駕駛的復(fù)雜交互環(huán)境中實(shí)現(xiàn)更加精準(zhǔn)的決策、規(guī)劃和控制。
絕影將決策 AI 引入到自動(dòng)駕駛中的規(guī)劃控制,正逐步改變以往人為規(guī)則驅(qū)動(dòng)的開(kāi)發(fā)模式,高效助力在駕乘體驗(yàn)、數(shù)據(jù)閉環(huán)效率的巨大提升。
這些AI大模型的建設(shè),并不是商湯在2017開(kāi)始布局汽車(chē)業(yè)務(wù)時(shí)才開(kāi)始的,而是貫穿了商湯自創(chuàng)業(yè)以來(lái),在各個(gè)場(chǎng)景落地使用AI技術(shù)的過(guò)程。
所以說(shuō),商湯絕影的進(jìn)展,不是單一的車(chē)業(yè)務(wù)輸出,而是平臺(tái)型AI公司在智能車(chē)?yán)顺敝械讓雍诵哪芰Φ膹?fù)用和釋放。
通用感知技術(shù)、AI決策能力,讓商湯絕影能在最合適的時(shí)間“上新”“交貨”,而他們的背后,離不開(kāi)商湯對(duì)AI大裝置的長(zhǎng)期投入建設(shè)。
什么讓商湯“絕影”
算法能力來(lái)自大模型,而大模型離不開(kāi)“大裝置”的支持。
商湯AI大裝置SenseCore是支撐商湯軟件平臺(tái)的通用人工智能基礎(chǔ)設(shè)施,用了5年時(shí)間建設(shè)??偣灿?7000塊的GPU芯片卡,可以輸出5.0 exaFLOPS的總算力,是亞洲目前最大的智能計(jì)算平臺(tái)之一。
可實(shí)現(xiàn)批量的算法模型生產(chǎn)、部署和迭代升級(jí),支持超大參數(shù)通用大模型訓(xùn)練。
基于大裝置的能力,商湯構(gòu)建了計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、AI內(nèi)容生成、多模態(tài)、決策智能等多個(gè)領(lǐng)域的大模型,持續(xù)演進(jìn)能力并廣泛支持各種應(yīng)用。
在智能車(chē)產(chǎn)品的研發(fā)和迭代中,這樣的能力發(fā)揮出重要作用。
比如智能駕駛量產(chǎn)方向上,商湯發(fā)布的多模態(tài)多任務(wù)通用大模型“書(shū)生(INTERN)2.5”。其擁有30億參數(shù),是目前全球開(kāi)源模型中ImageNet準(zhǔn)確度最高、規(guī)模最大,同時(shí)也是物體檢測(cè)標(biāo)桿數(shù)據(jù)集COCO中唯一超過(guò)65.0 mAP的模型。
而OpenGVLab通用視覺(jué)開(kāi)源平臺(tái)通過(guò)“書(shū)生”大模型實(shí)現(xiàn)了4類(lèi)核心視覺(jué)任務(wù)的全覆蓋,包括10萬(wàn)多標(biāo)簽的智能識(shí)別,為商湯絕影提供強(qiáng)大通用感知能力。
通用感知能力的提前布局,讓絕影成為業(yè)內(nèi)率先將BEVFormer++的感知算法實(shí)現(xiàn)大規(guī)模量產(chǎn)落地的玩家。
智能座艙方向,商湯絕影在車(chē)展上展示的未來(lái)座艙,首次將語(yǔ)言大模型“商湯商量SenseChat”以及AIGC文生圖平臺(tái)“商湯秒畫(huà)SenseMirage”上車(chē)。
類(lèi)GPT的能力,使得智能座艙的功能、交互方式、體驗(yàn)有了全新的形式,顛覆了一直以來(lái)智能座艙=平板電腦的模式。
這也是智能車(chē)領(lǐng)域值得關(guān)注的最新趨勢(shì):全能型AI玩家入場(chǎng),用大模型大裝置能力改變了以往艙駕分離,各自為戰(zhàn)的格局。
對(duì)大模型能力的前瞻建設(shè),保證了商湯絕影在智艙智駕技術(shù)和產(chǎn)品本身層面的競(jìng)爭(zhēng)力和使用體驗(yàn)。
而商湯在通用AI能力建設(shè)、落地過(guò)程中沿途點(diǎn)亮的“燈”,又給了商湯絕影業(yè)務(wù)更大的潛力空間。
怎么說(shuō)?
智能駕駛覆蓋ODD范圍不斷擴(kuò)大,使得座艙之內(nèi)的交互、應(yīng)用需求也快速增長(zhǎng),“智慧出行空間”的概念,從來(lái)沒(méi)離普通用戶(hù)這么近過(guò)。
自然而然,商湯以往在其他領(lǐng)域落地的AI技術(shù),現(xiàn)在也能開(kāi)始在智能車(chē)這個(gè)平臺(tái)上輸出:
智能車(chē)本身作為娛樂(lè)、健康、交通服務(wù)的需求者同時(shí),也是各種感知、視覺(jué)數(shù)據(jù)的生產(chǎn)的源頭。
深度挖掘這些數(shù)據(jù)蘊(yùn)含的價(jià)值,商湯可以以車(chē)為核心,以過(guò)往業(yè)務(wù)為節(jié)點(diǎn),連接起一個(gè)包含各個(gè)行業(yè)的生態(tài)。
全能型玩家入場(chǎng),智能車(chē)的游戲規(guī)則可能很快就會(huì)被改寫(xiě)。