加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

高通第四代汽車SoC芯片分析,聚焦CPU,AI無所謂

06/27 11:50
4461
閱讀需 11 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

高通在汽車領域快速崛起,壟斷中高端座艙領域,但在高通整體營收上,汽車業(yè)務所占比例很低。在其最近的財季里,高通手機領域收入62億美元,汽車業(yè)務收入6.03億美元,IoT業(yè)務收入12億美元。高通近期特別聚焦于AI PC領域,其潛在的市場規(guī)模遠高于市場,看看英特爾的利潤率便知AI PC的利潤率也不會低于汽車領域。

高通也在2024年Computex大會上做了“PC產業(yè)將開始重生(Reborn)”的演講。

高通的第四代汽車SoC芯片仍然是和筆記本電腦、手機等共用核心架構,這樣做并無不妥,如今汽車SoC芯片越來越像PC用的CPU,特別是和AI PC的CPU的要求幾乎完全一致。

高通第三代代表作SA8295實際就是筆記本電腦領域里的Snapdragon 8cx Gen 3,高通第四代大概率就是Snapdragon X Elite的車規(guī)版,不會有太大差異。

Snapdragon X Elite有三款芯片,主要差別是CPU的頻率。高通也罕見公開了Snapdragon X Elite的詳細架構信息,基本上完全聚焦于CPU領域,花了90%的篇幅講解,對AI則一句帶過,從關鍵的存儲帶寬135GB/s看,雖然較第三代提升了一倍,但與2019確定設計范圍的英偉達Orin高達205GB/s的帶寬相比,仍然很低。

高通更多地考慮汽車座艙和L2級的艙駕一體,這樣的市場定位不需要太高的AI性能,45TOPS足以滿足99.9%的應用場景,座艙領域所謂的大模型AI都完全依賴云端計算,端側部署成本太高,可能高達數千美元,即便端側部署,體驗也和云端計算有很大差距。

高通Snapdragon X系列芯片架構

高通對Snapdragon X系列芯片的Oryon CPU是這樣描述的:Oryon CPU Architecture: One Well-Engineered Core For All,能夠適用于所有領域。

高通采用全大核心設計,有兩個核心的頻率可以加速,這種全大核心設計也用在高通SA8775上,SA8295的四個大核心則是Kryo 695,最高頻率是2.5GHz,四個中核心是Kryo 670 Gold,最高頻率2.05GHz,SA8775的8核心完全相同,最高運行頻率都是2.35GHz,Kryo 680 Gold Prime和Kryo 695一樣都是基于ARM Cortex-X1而來的。

Oryon采用共享L2緩存的設計,通常L2緩存都是針對每個核心的,不共享,且規(guī)模很小,如SA8775的L2緩存是512kB。一般L3緩存是幾個核心共享的,如SA8295是8MB的L3緩存,SA8775是4MB的L3緩存。Oryon的共享緩存高達12MB,每個核心可以分到3MB,這樣的規(guī)模足以和英特爾Xeon這樣的服務器芯片媲美,當然成本也增加很多,估計車規(guī)版會減小到4-8MB。

ARM架構的性能對比表

整理:佐思汽研

對于CPU,關鍵的參數主要有兩個,一個是IPC解碼寬度,另一個就是緩存,ARM是擠牙膏式的,每年做一次小升級,讓利潤最大化。蘋果則一步到位,性能最大化,以至于蘋果連續(xù)數年都無法升級性能,安卓手機受困于ARM的擠牙膏,性能始終無法和蘋果看齊,這也是高通拋棄ARM的主要原因。即便如此,Snapdragon x系列單核性能仍然無法和蘋果匹敵,很簡單,L2緩存僅為3MB,還是低于蘋果的4MB。IPC解碼寬度方面,Snapdragon x系列是8位,遠比SA8295用的ARM X1要高。

受高通拋棄的刺激,ARM也發(fā)狠,X4和2024年宣布的旗艦X925的IPC解碼寬度都是10位,比蘋果還高,用X925的單核性能肯定可以超過蘋果。

Oryon的后段IXU兩大特色,一是對AI運算的支持,包括128比特寬度的NEON SIMD(這個寬度屬實有點窄了,英特爾最高已是1024比特),每周期最高4個FP32精度的ADD/WUL/MLA的指令執(zhí)行,支持INT8INT16FP16FP32多種精度,這些基本上是常規(guī)操作,不過高通最高可以支持FP32和FP64這種訓練才會用到的高精度。這里唯一值得注意的遺漏是BF16,這是 AI 工作負載的常見數據類型,可能BF16是NPU的工作范圍。另一個特色是超大規(guī)模的ROB重排序緩沖,超過650個微操作,相比之下ARM Cortex-X4只有384個,X1只有224個。

LSU(Load-Store Unit)方面,支持加載/存儲單元的 L1 數據緩存本身也相當大。完全一致的6路關聯(lián)緩存大小為 96KB,是英特爾Meteor Lake中P核心緩存的兩倍,不過英特爾新一代產品也是96KB。

MMU方面,頁表緩存即TLB很強,TLB又稱轉址旁路緩存,為CPU的一種緩存,由內存管理單元用于改進虛擬地址到物理地址的轉譯速度。目前所有的桌面型及服務器型處理器皆使用TLB。TLB具有固定數目的空間槽,用于存放將虛擬地址映射至物理地址的標簽頁表條目。PC領域的較高,手機領域的比較低,但目前計算全都轉向PC領域,需要更高的TLB,對比ARM Cortex-x3,其TLB只有4路1536個,X4估計是3072個,高通有8路,大于8000個,遠比ARM 要強。

硬件表遍歷器也是特色。如果緩存行不在 L1 或 L2 緩存中,該單元負責將緩存行移至外圍 DRAM,最多支持 16 次并發(fā)表遍歷。完整的 Snapdragon X 芯片一次最多可以進行 192 次表遍歷。

L3緩存不大,只有6MB,因為高通的L2緩存足夠大,總計有36MB,因此L3緩存可以很小,也有助于降低功耗。SA8295是8MB的L3緩存,SA8775是4MB的L3緩存,減少L3緩存是個趨勢。驍龍X 具有 128 位內存總線,支持 LPDDR5X-8448,最大內存帶寬為 135GB/秒。在目前的LPDDR5X容量下,驍龍 X 最多可以處理64GB的RAM。

GPU方面,與前面幾代沒什么大的變化,Adreno X1 GPU 架構是高通公司正在研發(fā)的 Adreno 架構系列的最新版本,其中 X1 代表第 7代,SA8295與SA8755都是第六代。Adreno 本身基于15年前從ATI收購而來(Adreno 是 Radeon的字母變位詞),多年來,高通公司的 Adreno架構一直是安卓領域最強大的GPU。Adreno X1 GPU分為6個著色器處理器 (SP) 塊,每個塊提供256個FP32 ALU,總共1536個ALU。峰值時鐘速度為1.5GHz,這讓驍龍 X 上的集成GPU的最大吞吐量達到4.6 TFLOPS(低端SKU的吞吐量較低)。

每個uSPTP 提供128個FP32 ALU。還有一組單獨的256個FP16 ALU,這意味著Adreno X1在處理FP16和FP32數據時不必共享資源,可以用于小規(guī)模的深度學習訓練場景。不過車規(guī)版應該會取消FP16單元,FP16精度在車上基本用不到,FP32也可以對應FP16。最后,有16個基本功能單元 (EFU),用于處理超越函數,例如 LOG、SQRT和其他罕見(但重要)的數學函數。對于車載領域,GPU算力有1.3TFLOPS就足夠,再向上就是要在車內玩3A游戲了,不過該芯片無法支持完整的DirectX 12 Ultimate(功能級別 12_2)功能集,顯然這不是高通擅長的,AMD和英偉達更擅長游戲領域。

對于AI運算的NPU,還是高通的六角DSP,缺乏亮點,乏善可陳,高通一句話帶過,沒有多說。

高通的第四代芯片上車預計要到2026年,以高端目前的壟斷態(tài)勢,換句話說,高通決定了3年后的汽車座艙和艙駕一體將會是什么樣的應用狀況。整車廠和Tier1只能被高通牽著鼻子走,環(huán)顧宇內,亦步亦趨地跟著ARM走是遠遠追不上高通的,至少在座艙領域,高通已沒有對手。

免責說明:本文觀點和數據僅供參考,和實際情況可能存在偏差。本文不構成投資建議,文中所有觀點、數據僅代表筆者立場,不具有任何指導、投資和決策意見。

推薦器件

更多器件
器件型號 數量 器件廠商 器件描述 數據手冊 ECAD模型 風險等級 參考價格 更多信息
TMS320F28335PGFA 1 Texas Instruments C2000™ 32-bit MCU with 150 MIPS, FPU, 512 KB flash, EMIF, 12b ADC 176-LQFP -40 to 85

ECAD模型

下載ECAD模型
$29.61 查看
ATXMEGA128D4-MH 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQCC44, 7 X 7 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, PLASTIC, MO-220VKKD-3, VQFN-44
$5.3 查看
ATMEGA8515L-8AU 1 Microchip Technology Inc IC MCU 8BIT 8KB FLASH 44TQFP

ECAD模型

下載ECAD模型
$4.23 查看
高通

高通

高通(英文名稱:Qualcomm,中文簡稱:高通公司、美國高通或美國高通公司)創(chuàng)立于1985年,總部設于美國加利福尼亞州圣迭戈市,高通的基礎科技賦能了整個移動生態(tài)系統(tǒng),每一臺3G、4G和5G智能手機中都有其發(fā)明。高通公司是全球3G、4G技術研發(fā)的領先企業(yè),已經向全球多家制造商提供技術使用授權,涉及了世界上所有電信設備和消費電子設備的品牌。在中國,高通開展業(yè)務已逾20年,與中國生態(tài)伙伴的合作已拓展至智能手機、集成電路、物聯(lián)網、大數據、軟件、汽車等眾多行業(yè)。

高通(英文名稱:Qualcomm,中文簡稱:高通公司、美國高通或美國高通公司)創(chuàng)立于1985年,總部設于美國加利福尼亞州圣迭戈市,高通的基礎科技賦能了整個移動生態(tài)系統(tǒng),每一臺3G、4G和5G智能手機中都有其發(fā)明。高通公司是全球3G、4G技術研發(fā)的領先企業(yè),已經向全球多家制造商提供技術使用授權,涉及了世界上所有電信設備和消費電子設備的品牌。在中國,高通開展業(yè)務已逾20年,與中國生態(tài)伙伴的合作已拓展至智能手機、集成電路、物聯(lián)網、大數據、軟件、汽車等眾多行業(yè)。收起

查看更多

相關推薦

電子產業(yè)圖譜

佐思汽車研究:致力于汽車、TMT、新能源(特別是新能源汽車、智能汽車、車聯(lián)網)領域的產業(yè)研究、專項調研、戰(zhàn)略規(guī)劃和投資咨詢服務。