幾周前,Apple發(fā)布了iPhone 13,搭載了最新的A15芯片。但Apple對(duì)A15的宣傳有點(diǎn)奇怪,主要是因?yàn)锳pple沒(méi)有將A15與A14之間進(jìn)行任何代際比較,而只進(jìn)行了競(jìng)品的簡(jiǎn)單對(duì)比,雖然Apple這樣做并非罕見(jiàn),但在今年的iPhone發(fā)布會(huì)上,這一點(diǎn)似乎比往常更突出。
我們看一下A15的幾個(gè)具體細(xì)節(jié),CPU采用了新的設(shè)計(jì)、更快的Neural Engine,新的4核/5核GPU、新的display engine和video encoder/decoder,還有新的ISP用于提高相機(jī)質(zhì)量。
在CPU方面,改進(jìn)是非常模糊的,蘋(píng)果稱比競(jìng)爭(zhēng)對(duì)手快50%。而GPU性能指標(biāo)也是類似的論調(diào),4核GPU比競(jìng)爭(zhēng)對(duì)手快30%,而5核快50%。國(guó)外媒體已對(duì)A15進(jìn)行了初步測(cè)試,我們來(lái)看下A15的確切性能和效率指標(biāo)。
頻率提升:3.24GHz性能核、2.0GHz能效核
我們從CPU開(kāi)始。新的A15采用了兩種新的CPU微架構(gòu),既包括性能核,也包括能效核。關(guān)于新內(nèi)核性能的前幾份報(bào)告主要是圍繞頻率展開(kāi)的,我們現(xiàn)在可以在測(cè)試結(jié)果中證實(shí)這一點(diǎn)。
與A14相比,新的A15將兩個(gè)性能核的單核頻率峰值提高了8%,達(dá)到了3240MHz,而上一代的頻率為2998MHz。當(dāng)兩個(gè)性能核都處于活動(dòng)狀態(tài)時(shí),它們的工作頻率實(shí)際上提升了10%,與上一代的2890MHz相比,現(xiàn)在都以3180MHz運(yùn)行。
總的來(lái)說(shuō),Apple在這里的頻率提升是相當(dāng)激進(jìn)的,因?yàn)橐纳祁l率設(shè)計(jì)是相當(dāng)困難的,特別是當(dāng)我們對(duì)新工藝節(jié)點(diǎn)方面的主要性能提升沒(méi)有期待的時(shí)候。A15應(yīng)該是在TSMC的N5P節(jié)點(diǎn)上制造的,盡管兩家公司都沒(méi)有真正披露設(shè)計(jì)的確切細(xì)節(jié)。TSMC宣稱頻率比N5增加了5%,因此Apple的頻率設(shè)計(jì)如果超越了N5就意味著功耗的增加,當(dāng)我們深入研究CPU的功率特性時(shí),要記住這一點(diǎn)。
A15的能效核現(xiàn)在能夠達(dá)到2016MHz,比A14增加了10.5%。這里的頻率是獨(dú)立于性能核的,就像集群中的線程數(shù)量不會(huì)影響到其他集群,反之亦然。Apple對(duì)這一代的小內(nèi)核做了一些更有趣的改變,稍后會(huì)講到。
巨大的cache:性能核L2達(dá)到12MB,SLC達(dá)到32MBApple在發(fā)布會(huì)上透露的一個(gè)更直接的技術(shù)細(xì)節(jié)是,與A14相比,A15現(xiàn)在的系統(tǒng)cache是A14的兩倍。兩年前,我們知道A13的新SLC從A12的8MB增加到16MB,這個(gè)大小在A14也維持沒(méi)變。Apple聲稱他們已經(jīng)將其增加了一倍,這意味著在A15中是32MB。
在對(duì)A15的延遲測(cè)試中,我們現(xiàn)在確實(shí)可以確認(rèn),SLC現(xiàn)在已經(jīng)翻倍到32MB,進(jìn)一步推動(dòng)了內(nèi)存深度達(dá)到DRAM。Apple的SLC可能是該芯片能效的一個(gè)關(guān)鍵因素,它能在同一硅片上進(jìn)行內(nèi)存訪問(wèn),而不是轉(zhuǎn)到速度更慢、能效更低的DRAM上。我們已經(jīng)看到更多的SoC供應(yīng)商采用了這些類型的末級(jí)緩存,但是在32MB的容量上,新的A15使競(jìng)爭(zhēng)對(duì)手相形見(jiàn)絀,比如Snapdragon 888上的3MB SLC或Exynos 2100大約6-8MB的SLC。
Apple沒(méi)有透露的是,性能核的L2 cache緩存也有變化,現(xiàn)在已經(jīng)從8MB增加到12MB,增加了50%。這實(shí)際上與Apple M1的L2 cache大小相同,只是這次它只為2個(gè)性能核服務(wù),而不是4個(gè)。訪問(wèn)延遲似乎已經(jīng)從A14的16個(gè)周期上提高到了A15的18個(gè)周期。在性能核上,我也看到了L1速度的一些變化,因?yàn)樗坪跄軌驅(qū)ache line行進(jìn)行1個(gè)周期的訪問(wèn),只要它們?cè)谕粋€(gè)頁(yè)面,A14上的相同類型的訪問(wèn)需要3個(gè)周期。
12MB的L2也是巨大的,與其他設(shè)計(jì)如Snapdragon 888的L3+L2的組合(4+1+3x0.5=6.5MB)相比,高出了一倍??磥?lái)Apple在今年這一代SoC中投入了大量的SRAM。
今年的能效核似乎沒(méi)有改變cache的大小,仍然是64KB的L1D和4MB的共享L2,但我們看到Apple已經(jīng)將L2 TLB(Translation Look-aside Buffer)增加到2048項(xiàng),現(xiàn)在覆蓋了32MB,可能是為了優(yōu)化SLC訪問(wèn)延遲。有趣的是,Apple今年讓能效核有更快的DRAM訪問(wèn),現(xiàn)在的延遲約為130ns,而A14的延遲為+215ns。
CPU微架構(gòu)的變化:一個(gè)緩慢的年份?
今年的CPU微架構(gòu)沒(méi)什么驚喜。今年早些時(shí)候,Arm宣布了新的Armv9 ISA,主要由新的SVE2 SIMD指令集定義,以及該公司新架構(gòu)下的新Cortex系列CPU IP。早在2013年,Apple就率先在市場(chǎng)上推出Armv8 CPU,這是第一個(gè)具有64位功能的移動(dòng)設(shè)計(jì)。鑒于這種情況,一般可能預(yù)計(jì)今年這一代產(chǎn)品也會(huì)引入v9,但A15似乎不是這種情況。
從微架構(gòu)上看,A15的性能核似乎與去年的設(shè)計(jì)沒(méi)太大區(qū)別。雖然還未查看設(shè)計(jì)的每個(gè)角落,但至少處理器的后端與A14性能核心相比,在吞吐量和延遲方面是相同的。
能效核有更多的變化,除了一些內(nèi)存子系統(tǒng)TLB的變化外,新的能效核現(xiàn)在增加了一個(gè)額外的整數(shù)ALU(Arithmetic and Logic Unit),總數(shù)從之前的3個(gè)增加到4個(gè)。其實(shí)一直以來(lái)該內(nèi)核無(wú)論如何都不能被稱為是“小核”,而且今年似乎增長(zhǎng)得更多。
Apple今年的微架構(gòu)變化更加溫和的可能原因是幾個(gè)因素的疊加。蘋(píng)果已經(jīng)失去了大核的首席架構(gòu)師和部分設(shè)計(jì)團(tuán)隊(duì),2019年轉(zhuǎn)投了Nuvia(今年早些時(shí)候被Qualcomm收購(gòu))。向Armv9的轉(zhuǎn)變可能也意味著在設(shè)計(jì)上需要做更多的工作,而疫情可能也導(dǎo)致了這部分進(jìn)展的并不順利。我們需要再等到明年的A16,才能真正確定蘋(píng)果的設(shè)計(jì)節(jié)奏是否已經(jīng)放緩,或者這僅僅是一個(gè)小滑坡,又或者僅僅是在下一個(gè)微架構(gòu)的更大變化之前的一個(gè)沉寂。
當(dāng)然,這里的基調(diào)描繪了A15的CPU相當(dāng)保守的改進(jìn),但從性能和效率上來(lái)看,就不是這樣了。
[參考文章]
The Apple A15 SoC Performance Review: Faster & More Efficient — Andrei Frumusanu