行業(yè)需求及現(xiàn)狀
智能駕駛進(jìn)入數(shù)據(jù)驅(qū)動(dòng)時(shí)代,數(shù)據(jù)閉環(huán)是智能駕駛量產(chǎn)落地的核心飛輪:更多場(chǎng)景,需要更多數(shù)據(jù),訓(xùn)練更復(fù)雜的算法模型。
隨著近兩年的技術(shù)迭代,智能駕駛發(fā)展的重心已從技術(shù)研發(fā)比拼轉(zhuǎn)移到商業(yè)化落地的競(jìng)爭(zhēng),自2022年起,頭部車(chē)企紛紛宣布城市場(chǎng)景NOA(Navigate on Autopilot,自動(dòng)輔助導(dǎo)航駕駛)的量產(chǎn)落地計(jì)劃。據(jù)預(yù)測(cè),2025年中國(guó)城市NOA前裝市場(chǎng)規(guī)模將達(dá)到76億元。實(shí)現(xiàn)城市NOA是智能駕駛商業(yè)化向前邁出的一大步,而智能駕駛的成熟依賴(lài)于高效的算力、完善的算法模型和大量有效的數(shù)據(jù)。
圖1 2021—2025年中國(guó)城市NOA市場(chǎng)規(guī)模預(yù)測(cè)(億元)
智能駕駛所需的場(chǎng)景數(shù)據(jù)應(yīng)該盡可能多地涵蓋Corner Case,算法模型的升級(jí)迭代也需要新場(chǎng)景數(shù)據(jù)的不斷投喂,數(shù)據(jù)重要性日益凸顯,從主機(jī)廠到Tier 1,智能駕駛產(chǎn)業(yè)上下游各玩家都將目光投向了智能駕駛數(shù)據(jù)閉環(huán)的打造。智能駕駛進(jìn)入下半場(chǎng)之后,那些無(wú)法在數(shù)據(jù)閉環(huán)能力上取得突破的公司在一方面會(huì)被“高成本”和“低效率”拖累,另一方面還會(huì)因?yàn)閷?duì)Corner Case的解決能力無(wú)法取得突破,而難以令終端消費(fèi)者滿(mǎn)意。
對(duì)智能駕駛來(lái)說(shuō),更高質(zhì)量的訓(xùn)練數(shù)據(jù)在其場(chǎng)景化落地中發(fā)揮不可或缺的作用,擁有一套完整的數(shù)據(jù)服務(wù)工具對(duì)實(shí)現(xiàn)智能駕駛數(shù)據(jù)閉環(huán)的高效運(yùn)轉(zhuǎn)至關(guān)重要。依據(jù)全國(guó)信息安全標(biāo)準(zhǔn)化技術(shù)委員會(huì)發(fā)布的《汽車(chē)采集數(shù)據(jù)處理安全指南》,汽車(chē)采集數(shù)據(jù)指通過(guò)汽車(chē)傳感設(shè)備、控制單元采集的數(shù)據(jù),以及對(duì)其進(jìn)行加工后產(chǎn)生的數(shù)據(jù)。汽車(chē)采集數(shù)據(jù)經(jīng)過(guò)標(biāo)注、處理、存儲(chǔ)、管理等處理,形成有效數(shù)據(jù)集,進(jìn)一步存儲(chǔ)在云端服務(wù)器中,之后傳輸至算法模型,經(jīng)過(guò)訓(xùn)練部署到車(chē)端進(jìn)行應(yīng)用驗(yàn)證,形成一套由數(shù)據(jù)驅(qū)動(dòng)算法迭代,進(jìn)而驅(qū)動(dòng)智能駕駛能力升級(jí)的閉環(huán)模型。
智能駕駛數(shù)據(jù)服務(wù)的痛點(diǎn)與難點(diǎn)
獲取低成本、高質(zhì)量的數(shù)據(jù)
智能駕駛的真正落地需要大量高質(zhì)量、安全無(wú)偏差的數(shù)據(jù),但目前獲取低成本、高質(zhì)量的數(shù)據(jù)仍然是行業(yè)發(fā)展的一大痛點(diǎn)。對(duì)于數(shù)據(jù)標(biāo)注公司來(lái)說(shuō),質(zhì)量的提升也就意味著更多成本投入,這與客戶(hù)控制成本的理念相違背。另一方面,智能駕駛在不同場(chǎng)景的數(shù)據(jù)需求要求數(shù)據(jù)標(biāo)注公司提供持續(xù)穩(wěn)定的數(shù)據(jù),這對(duì)于多數(shù)數(shù)據(jù)服務(wù)商來(lái)說(shuō)也是高難度的挑戰(zhàn)。
采集標(biāo)注、分析處理、管理的難度和復(fù)雜度
在數(shù)據(jù)的整體生產(chǎn)環(huán)節(jié)中,數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)管理等各個(gè)環(huán)節(jié)都涉及海量數(shù)據(jù),若處理不當(dāng),可能會(huì)導(dǎo)致項(xiàng)目質(zhì)量問(wèn)題和項(xiàng)目啟動(dòng)延遲,但由于各個(gè)模塊的自動(dòng)化程度都不夠高,導(dǎo)致AI從業(yè)者將80%以上精力都花在數(shù)據(jù)管理上。另一方面,當(dāng)前解決各種Corner Case的方式主要是實(shí)車(chē)采集足夠多的相關(guān)數(shù)據(jù),然后訓(xùn)練模型,讓模型具備應(yīng)對(duì)能力,這種方式效率較低,而且很多特殊場(chǎng)景出現(xiàn)頻率低,實(shí)車(chē)很難采集到。
數(shù)據(jù)標(biāo)注的效率
傳統(tǒng)的智能駕駛數(shù)據(jù)閉環(huán),在數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注等環(huán)節(jié)效率較低。例如,多數(shù)公司在數(shù)據(jù)標(biāo)注環(huán)節(jié)都會(huì)依靠“人海戰(zhàn)術(shù)”,即依靠人工一個(gè)個(gè)地對(duì)采集回來(lái)的數(shù)據(jù)做場(chǎng)景分類(lèi),不僅效率較低,而且會(huì)有一定概率產(chǎn)生誤差,對(duì)結(jié)果影響較大。
為了解決智能駕駛數(shù)據(jù)服務(wù)的痛點(diǎn),早在2021年,云測(cè)數(shù)據(jù)就推出了新智能駕駛數(shù)據(jù)解決方案1.0,面向智能駕駛領(lǐng)域不同落地場(chǎng)景下的高質(zhì)量AI訓(xùn)練數(shù)據(jù)需求,通過(guò)場(chǎng)景數(shù)據(jù)庫(kù)、定制化數(shù)據(jù)采集標(biāo)注、數(shù)據(jù)標(biāo)注&數(shù)據(jù)管理平臺(tái)等服務(wù),一站式解決智能駕駛從研發(fā)初期到落地的訓(xùn)練數(shù)據(jù)需求,從而大幅降低AI模型訓(xùn)練成本,加速智能駕駛相關(guān)應(yīng)用的落地迭代周期,節(jié)省研發(fā)時(shí)間和成本。
云測(cè)數(shù)據(jù)的智能駕駛解決方案
提供豐富的高質(zhì)量數(shù)據(jù)集
云測(cè)數(shù)據(jù)是Testin云測(cè)旗下AI數(shù)據(jù)標(biāo)注服務(wù)品牌,通過(guò)自建數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室和數(shù)據(jù)標(biāo)注基地,可為智能駕駛、智慧城市、智能家居、智慧金融、新零售等眾多領(lǐng)域提供高精度、場(chǎng)景化的數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注服務(wù),全方位支持文本、語(yǔ)音、圖像、視頻等各類(lèi)型數(shù)據(jù)的處理。目前,云測(cè)數(shù)據(jù)深度合作伙伴覆蓋了汽車(chē)、手機(jī)、工業(yè)、家居、金融、安防、教育、新零售、地產(chǎn)、生態(tài)系統(tǒng)等行業(yè)。在智能駕駛領(lǐng)域,云測(cè)數(shù)據(jù)憑借高質(zhì)量的AI訓(xùn)練數(shù)據(jù)交付實(shí)力已與業(yè)內(nèi)包括自主、合資車(chē)企,大型Tier1、Tier2,以及無(wú)人出租車(chē)、智能駕駛等眾多廠商,建立了持久良好的合作關(guān)系。
圖2 云測(cè)數(shù)據(jù)介紹
全新升級(jí)迭代的完整數(shù)據(jù)工具鏈
針對(duì)當(dāng)下智能駕駛應(yīng)用場(chǎng)景更加豐富,數(shù)據(jù)閉環(huán)已經(jīng)成為智能駕駛量產(chǎn)落地的核心飛輪的發(fā)展趨勢(shì)。云測(cè)數(shù)據(jù)以集成數(shù)據(jù)底座為核心,全面升級(jí)了數(shù)據(jù)標(biāo)注及數(shù)據(jù)管理工具鏈,在今年推出智能駕駛數(shù)據(jù)解決方案2.0。相較于1.0版本,2.0版本在數(shù)據(jù)閉環(huán)能力、自動(dòng)標(biāo)注能力、數(shù)據(jù)管理工具鏈、人工效能評(píng)估等方面進(jìn)行了全新升級(jí):通過(guò)系統(tǒng)集成將大模型預(yù)標(biāo)注能力與人工標(biāo)注完美結(jié)合,提升了數(shù)據(jù)集和場(chǎng)景化數(shù)據(jù)服務(wù)能力,助力企業(yè)數(shù)據(jù)流轉(zhuǎn)效率的全面提升。
圖3 云測(cè)數(shù)據(jù)智能駕駛解決方案2.0
支持大模型的高效數(shù)據(jù)標(biāo)注平臺(tái)
云測(cè)數(shù)據(jù)升級(jí)人工標(biāo)注與自動(dòng)標(biāo)注算法交互能力,全面提升了數(shù)據(jù)標(biāo)注效率。通過(guò)將云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)與眾多行業(yè)大模型緊密結(jié)合,幫助企業(yè)更好地提質(zhì)增效。2.0方案集成了不同模型的預(yù)標(biāo)注能力,包括圖像整幀、自選物體、區(qū)域、點(diǎn)云批次識(shí)別和文本識(shí)別等,重新定義了基于預(yù)標(biāo)注的人工標(biāo)注效能,如能效看板、綜合看版等。
針對(duì)特定算法類(lèi)型的數(shù)據(jù)持續(xù)優(yōu)化迭代,涵蓋點(diǎn)云4D疊幀、語(yǔ)義分割聯(lián)合標(biāo)注和智能ID軌跡預(yù)測(cè)。數(shù)據(jù)集也更加豐富,納入了更多場(chǎng)景數(shù)據(jù),標(biāo)注方法也從原來(lái)以點(diǎn)線(xiàn)面體為主進(jìn)化到融合4D標(biāo)注規(guī)則。在云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)的加持下,針對(duì)不同場(chǎng)景的Corner Case的識(shí)別和判斷能力和在算法持續(xù)迭代的數(shù)據(jù)閉環(huán)階段,數(shù)據(jù)預(yù)處理能力、數(shù)據(jù)挖掘能力、數(shù)據(jù)標(biāo)注能力等方面,都表現(xiàn)出了明顯提升。
圖4 云測(cè)數(shù)據(jù)點(diǎn)云4D疊幀演示
支持BEV-Transformer標(biāo)注,順應(yīng)智能駕駛發(fā)展趨勢(shì)
面對(duì)當(dāng)下主流感知大模型的數(shù)據(jù)服務(wù)能力升級(jí),云測(cè)數(shù)據(jù)解決方案支持了更多智能駕駛標(biāo)注類(lèi)型,如現(xiàn)在諸多企業(yè)基于BEV+Transformer算法研發(fā),對(duì)BEV視角環(huán)視拼接加點(diǎn)云融標(biāo)注成為了主流。支持特定類(lèi)型也使云測(cè)數(shù)據(jù)能更快速響應(yīng)客戶(hù)數(shù)據(jù)標(biāo)注需求;同時(shí)可實(shí)現(xiàn)自動(dòng)標(biāo)注結(jié)果校驗(yàn),并提升大模型標(biāo)注能力和評(píng)測(cè)服務(wù)能力,助力智駕企業(yè)實(shí)現(xiàn)更自然、更智能、更多樣化的人機(jī)交互方式。
在數(shù)據(jù)標(biāo)注效率方面,與人工標(biāo)注相比,BEV空間標(biāo)注效率約提升1.5倍以上。例如,人工標(biāo)注3D點(diǎn)云拉框需要先選擇屬性,再選擇車(chē)頭朝向?,F(xiàn)在,人工只需大致框選一個(gè)區(qū)域,就完成了自動(dòng)貼合,基于一些特定標(biāo)簽類(lèi)別就能實(shí)現(xiàn)自動(dòng)選擇。其效率比人工拉框至少快了1.5倍到兩倍。又如4D標(biāo)注地面箭頭,原來(lái)需要每幀標(biāo)注,現(xiàn)在基于4D標(biāo)注加空間坐標(biāo),只要標(biāo)注對(duì)應(yīng)一幀,通過(guò)映射即可將30幀結(jié)果疊在一起,完成多傳感器融合4D標(biāo)注,效率更高。