4月24日,地平線在北京正式發(fā)布征程6系列芯片,發(fā)布會(huì)現(xiàn)場(chǎng)我們能看到基于征程6系列芯片的域控制器展示,預(yù)示著征程6系列芯片進(jìn)入量產(chǎn)車輛就在2024年底,可以說這開創(chuàng)了汽車智能駕駛芯片最快上車的先例。
征程6系列不是人們之前猜測(cè)的3款芯片,而是6款,足以覆蓋智能駕駛的各個(gè)場(chǎng)景和價(jià)位。發(fā)布會(huì)上重點(diǎn)介紹了征程6B、6E、6M和6P,筆者認(rèn)為B應(yīng)該是Base,L是Light,E是Efficiency,M是Medium,H是High,P是Performance或Premium。地平線沒有公開征程6L和6H的參數(shù),預(yù)估6H的AI算力是256-300 TOPS,CPU算力是250-300K DMIPS。6L的AI算力是30-40TOPS,CPU算力是40-50K DMIPS。
征程6系列與5系列相比,升級(jí)最明顯的是CPU算力。征程5的CPU是8核心Cortex-A55,算力大致是25-30K DMIPS,這次除了最低的征程6B,其余CPU算力都大幅度提高。
征程6系列的另一個(gè)升級(jí)是BPU架構(gòu),所謂BPU就是地平線對(duì)AI加速器的另一種稱呼,B代表Brain,可以稱為類腦處理器,第一代BPU,地平線致敬數(shù)學(xué)家伯努利,伯努利分布是最簡(jiǎn)單的離散型概率分布模型。第二代BPU,地平線致敬英國數(shù)學(xué)家貝葉斯,他推導(dǎo)出貝葉斯定理,貝葉斯定理是一個(gè)由結(jié)果倒推原因的概率算法,當(dāng)年默默無聞,在人工智能的今天大放異彩。
征程6的第三代BPU架構(gòu)則致敬博弈論創(chuàng)始人納什,稱之為納什架構(gòu)。約翰·納什,生于1928年6月13日,著名經(jīng)濟(jì)學(xué)家、博弈論創(chuàng)始人、《美麗心靈》男主角原型,并且還是前麻省理工學(xué)院助教,后任普林斯頓大學(xué)數(shù)學(xué)系教授,主要研究博弈論、微分幾何學(xué)和偏微分方程。由于他與另外兩位數(shù)學(xué)家(經(jīng)濟(jì)學(xué)家,約翰·C·海薩尼和萊因哈德·澤爾騰)在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響,而獲得1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。
博弈論主要針對(duì)智能車與智能車,智能車與非智能車之間決策交互產(chǎn)生的影響,目前大部分智能駕駛都是基于單車的,未考慮其他車輛對(duì)智能車決策的影響,這使得智能車有時(shí)候看起來不十分靈活,比如對(duì)向車主動(dòng)讓道讓智能車先走,但智能車無法理解對(duì)向車的意圖,還是傻傻地等對(duì)向車先走。也就是智能駕駛的策略,大多都有強(qiáng)化學(xué)習(xí)的影子,強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)旨在通過與環(huán)境(可以是虛擬的也可以是真實(shí)的)的交互來使智能體(我們的「模型」)學(xué)習(xí)。RL 一開始是根據(jù) Markov 過程提出的,我們讓智能體處于不確定的固定環(huán)境中,并試圖通過獎(jiǎng)勵(lì)/懲罰機(jī)制來學(xué)習(xí)到一個(gè)最優(yōu)策略。在單智能體的情況下,這種方法被證明是收斂的。
但是,如果是將多個(gè)智能體放置在同一環(huán)境中(多智能體強(qiáng)化學(xué)習(xí),MARL),情況就復(fù)雜多了。
假設(shè)我們正在試著用智能車來改善城市的交通情況,這時(shí)每輛車的決策都會(huì)影響其他車的決策與表現(xiàn),比如智能車與智能車之間很可能會(huì)發(fā)生沖突,因?yàn)榭赡軐?duì)于兩輛智能車而言,沿著某條路線行駛都是最方便的(獲得最多的獎(jiǎng)勵(lì))。博弈論有個(gè)RL算法,它使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行函數(shù)逼近,迭代計(jì)算子游戲的收益矩陣(Gt)。這個(gè)子游戲就是上文提到的 stage games。在每個(gè)時(shí)間 t 處(每個(gè) stage game),都會(huì)計(jì)算出符合 NE 的回應(yīng)(σ),并得到最優(yōu)策略(π),然后添加新的策略來擴(kuò)展 Gt 為 Gt + 1,繼續(xù)重復(fù)上述過程。這是最高明的智能駕駛決策算法。
征程6全系列的AI加速都是納什架構(gòu)。征程6B主打極致性價(jià)比,CPU可能是6核心的Cortex-A55,制造工藝可能是14或28納米,征程6B的國際意向客戶是博世和電裝,國內(nèi)意向客戶是四維圖新、福瑞泰克和Minieye。主要對(duì)手可能是Mobileye的EyeQ5M/H和EyeQ6L。
征程6系列主打產(chǎn)品是E/M。
征程6系列將于2024年內(nèi)開啟首個(gè)前裝量產(chǎn)車型交付,并預(yù)計(jì)于2025年實(shí)現(xiàn)超10款車型量產(chǎn)交付。面向中階智駕市場(chǎng),地平線推出普惠城區(qū)性價(jià)比方案最優(yōu)解——征程6M,以及極致體驗(yàn)高速NOA最優(yōu)解——征程6E,并提供符合AEC-Q104車規(guī)標(biāo)準(zhǔn)的SiP模組和Matrix 6域控參考設(shè)計(jì),以超高集成度實(shí)現(xiàn)更低的功耗和更優(yōu)的系統(tǒng)成本。發(fā)布會(huì)上,地平線官宣與多家Tier1、軟硬件合作伙伴達(dá)成征程6E/M的合作,并公布到2024年第二季度將有超過50家生態(tài)伙伴推出基于征程6E/M的準(zhǔn)量產(chǎn)級(jí)產(chǎn)品。
圖片來源:地平線
大家最關(guān)注的還是征程6系列的旗艦征程6P。
征程6P的AI算力是560TOPS,地平線謹(jǐn)慎地做了標(biāo)注,560TOPS是在1/2稀疏網(wǎng)絡(luò)下的等效算力,地平線未提及精度,應(yīng)該還是INT8位。這個(gè)算力實(shí)際遠(yuǎn)超4片Orin合并的算力,再強(qiáng)調(diào)一次,以目前車載領(lǐng)域用的最頂級(jí)車載以太網(wǎng)交換機(jī)帶寬不超過1.25GB/s,典型的PCIe 4.0交換機(jī),帶寬不超過32GB/s,即便是價(jià)格遠(yuǎn)超Orin 的PCIe 6.0交換機(jī),帶寬也不超過120GB/s。想要像服務(wù)器行業(yè)那樣是用4個(gè)H100就讓算力增加4倍,帶寬至少要做到900GB/s,而這根本做不到,用最頂級(jí)的車載以太網(wǎng)交換機(jī)連接4個(gè)Orin,算力頂多是1.2倍單個(gè)Orin算力,也就是300TOPS。這也是英偉達(dá)要花十幾億美元開發(fā)NVLINK的原因,也是NVLINK被美國管制嚴(yán)禁出口的原因。
CPU是18核心的ARM Cortex-A78AE,算力是410K DMIPS,英偉達(dá)Orin-X是12核心,內(nèi)核也是ARM Cortex-A78AE,算力是227K DMIPS,因?yàn)镺rin的GPU發(fā)熱量比較大,所以其CPU的頻率較低,而地平線的GPU算力只有200GFLOPS,發(fā)熱量很低,所以CPU頻率可以高點(diǎn),算力幾乎是英偉達(dá)的兩倍,華為的昇騰610的CPU則是16核心,算力是200K DMIPS。
征程6P里面添加了一個(gè)微型GPU,算力很低,只有200GFLOPS,主要是為了將智能駕駛領(lǐng)域的圖像輸出到儀表或中控屏上。
為了降低成本,更好管理供應(yīng)鏈,也為了減少軟件復(fù)雜度,征程6P內(nèi)部添加了一個(gè)達(dá)到ASIL-D級(jí)的MCU島,算力是10K DMIPS,目前大家都是使用單獨(dú)的安全MCU來控制車輛底盤,通常是英飛凌的TC397,TC397價(jià)格比較高,且價(jià)格波動(dòng)大,供應(yīng)狀況不穩(wěn)定,最高算力是4K DMIPS,典型算力是2.7K DMIPS。地平線沒有公布詳細(xì)信息,應(yīng)該是和高通SA8650/SA8255/SA8775那樣的4核心ARM Cortex-R52內(nèi)核,運(yùn)行頻率估計(jì)是800-1000MHz。
存儲(chǔ)帶寬方面,升級(jí)到了LPDDR5,帶寬達(dá)205GB/s,與英偉達(dá)Orin相同。前視感知支持1800萬像素,圖像帶寬5.3Gpixel/s。
內(nèi)部采用TB/s級(jí)高性能總線,訪存延時(shí)低至130納秒。
為應(yīng)對(duì)新一代大模型Transformer較多的矢量運(yùn)算,特別添加了VPU,即矢量浮點(diǎn)運(yùn)算加速單元。
地平線征程P6的晶體管數(shù)量高達(dá)370億,英偉達(dá)Orin只有170億,Xavier只有90億。
與征程6系列一同發(fā)布的還有全場(chǎng)景智能駕駛解決方案SuperDrive,它聚焦擬人化體驗(yàn)突破,打造好用的智駕系統(tǒng)2.0。憑借動(dòng)態(tài)、靜態(tài)、OCC(Occupancy占用網(wǎng)絡(luò))三網(wǎng)合一的端到端感知架構(gòu),數(shù)據(jù)驅(qū)動(dòng)的交互式博弈算法,SuperDrive在任何道路環(huán)境下都能兼顧場(chǎng)景通過率、通行效率和行為擬人,在擁堵匯流、路口交互-動(dòng)態(tài)Driveline、禮讓騎行人、擁堵?lián)Q道、城市環(huán)島通行等城區(qū)復(fù)雜場(chǎng)景下,均能夠?yàn)橛脩魩韮?yōu)雅不慫、從容篤定的智能駕駛體驗(yàn)。
動(dòng)態(tài)、靜態(tài)、Occupancy三網(wǎng)合一的感知端到端架構(gòu)是精準(zhǔn)還原客觀物理世界的有效手段。在此架構(gòu)下遮擋準(zhǔn)召率提升70%,動(dòng)態(tài)代碼行數(shù)降低90%,網(wǎng)絡(luò)負(fù)載降低50%,有效解決當(dāng)前行業(yè)感知架構(gòu)時(shí)延高、規(guī)則多、負(fù)載重的問題。數(shù)據(jù)驅(qū)動(dòng)的交互博弈可帶來更擬人的最優(yōu)解,使得SuperDrive像老司機(jī)一樣靈活處理復(fù)雜交通流,在擁堵場(chǎng)景下變道成功率提升50%,路口通過率提升67%。
隨著美國對(duì)中國高科技領(lǐng)域的敵意持續(xù)升級(jí),英偉達(dá)Thor大概率不會(huì)允許出口到中國,芯片領(lǐng)域的國產(chǎn)替代大潮即將到來。
免責(zé)說明:本文觀點(diǎn)和數(shù)據(jù)僅供參考,和實(shí)際情況可能存在偏差。本文不構(gòu)成投資建議,文中所有觀點(diǎn)、數(shù)據(jù)僅代表筆者立場(chǎng),不具有任何指導(dǎo)、投資和決策意見。