加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專(zhuān)業(yè)用戶(hù)
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

Apple M1 Pro & M1 Max性能上的全面發(fā)力

2021/10/20
825
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

昨晚Apple的MacBook Pro 14”和16”的神秘面紗終于揭開(kāi),新的M1 Pro和M1 Max芯片也終于亮相。

M1 Pro和Max是去年M1的后續(xù)產(chǎn)品,Apple開(kāi)始用自研芯片全面取代x86芯片。M1取得了很大成功,展示出了筆記本市場(chǎng)上最優(yōu)秀的能效。盡管M1速度很快,但仍然屬于小型SoC(甚至還支撐著iPad Pro產(chǎn)品線(xiàn)),以及相應(yīng)的較低的TDP,仍然在競(jìng)爭(zhēng)中不及更大、更大功耗的芯片。

但這次的兩款芯片,Apple全力在追趕性能,更多的CPU內(nèi)核、GPU內(nèi)核…… 蘋(píng)果現(xiàn)在也增加了功耗預(yù)算,和iPhone與iPad的性質(zhì)完全不同。

M1 Pro:10核CPU、16核GPU、337億個(gè)晶體管,245mm²

先來(lái)看M1 Pro,為Apple所謂的no-compromise筆記本電腦SoC奠定了基礎(chǔ)。

Apple從封裝開(kāi)始演示,M1 Pro仍然非常有特點(diǎn),包括SoC和內(nèi)存封裝在單個(gè)PCB上。這與其他傳統(tǒng)芯片形成鮮明對(duì)比,例如AMD或Intel的DRAM要么在DIMM插槽,要么焊在主板上。Apple的方式顯然會(huì)提高能效。

Apple透露,與M1相比,M1 Pro的內(nèi)存總線(xiàn)增加了一倍,從128bit LPDDR4X接口轉(zhuǎn)向更寬、更快的256bit LPDDR5接口,提供高達(dá)200GB/s的系統(tǒng)帶寬。我們不知道這個(gè)數(shù)字是精確的還是四舍五入,但LPDDR5-6400接口的帶寬將達(dá)到204.8GB/s。

Apple還非常給力地展示了M1 Pro和M1 Max的die shot,芯片的布局一目了然。從內(nèi)存接口開(kāi)始看,這些接口現(xiàn)在更加集成到SoC的兩側(cè),而不是像M1那樣沿著兩條邊緣展開(kāi)。由于接口寬度的增加,我們看到內(nèi)存控制器占了相當(dāng)大部分。更有趣的是,Apple現(xiàn)在顯然在內(nèi)存控制器后面直接使用了兩個(gè)系統(tǒng)級(jí)緩存(SLC)塊。

Apple的SLC一直很突出,因?yàn)樗鼈兎?wù)于整個(gè)SoC,能夠擴(kuò)大帶寬,減少延遲,或只是通過(guò)避免內(nèi)存任務(wù)中斷來(lái)節(jié)省功耗,從而極大地提高了能效。這個(gè)新一代SLC與M1大不相同。SRAM單元區(qū)域看起來(lái)比M1大,雖然現(xiàn)在無(wú)法完全確認(rèn)這一點(diǎn),但可能意味著每個(gè)SLC中有16MB的緩存。因此M1 Pro的總SLC緩存可能是32MB。

CPU方面,Apple已將能效核的數(shù)量從4個(gè)減到2個(gè)。我們不知道這些核是否會(huì)與M1相似,或者Apple采用了A15 SoC的新IP,A15在這方面有一些更大的微架構(gòu)變化。

在性能核方面,Apple增加了一倍,達(dá)到了8核。Apple的性能核在M1上令人印象深刻,但在多線(xiàn)程(MT)性能方面遜于其他8核SoC。性能核翻倍應(yīng)該會(huì)有巨大的MT性能提升。

在die shot中,我們看到Apple似乎正在鏡像兩個(gè)4核塊,L2 cache也鏡像了。盡管Apple在這里引用了24MB的L2,但它相當(dāng)像2*12MB的設(shè)置,使用的是類(lèi)似AMD的core-complex設(shè)置。這意味著兩個(gè)性能集群的一致性正在超越結(jié)構(gòu)和SLC。當(dāng)然,這是目前的猜測(cè)。

CPU性能指標(biāo)方面,Apple與競(jìng)爭(zhēng)對(duì)手進(jìn)行了一些比較。特別是這里比較的SKU是Intel的Core i7-1185G7,以及Intel最新的Tiger Lake 10nm“SuperFin”CPU的Core i7-11800H、4核和8核版本。

Apple聲稱(chēng),在多線(xiàn)程性能方面,性能都大大優(yōu)于Intel的任何芯片,且功耗要低得多。呈現(xiàn)的性能/功率曲線(xiàn)表明,在30W的相同功耗下,M1 Pro和Max的CPU吞吐量比11800H快1.7倍,11800H的功耗曲線(xiàn)非常陡峭。在相同性能水平上(使用了11800H的峰值性能),Apple表示,M1 Pro/Max相同性能水平下低70%的功耗。這個(gè)數(shù)字差異大的甚至有些尷尬。

除了強(qiáng)大的CPU外,Apple還在擴(kuò)大他們定制的GPU架構(gòu)。M1 Pro現(xiàn)在采用了16核GPU,計(jì)算吞吐量為5.2 TFLOP。有趣的是,這個(gè)巨大的GPU將得到更大的內(nèi)存總線(xiàn)支持,以及可能是32MB的SLC。后者的作用基本上類(lèi)似于AMD現(xiàn)在通過(guò)其GPU無(wú)限緩存實(shí)現(xiàn)的功能。

據(jù)稱(chēng),Apple的GPU性能遠(yuǎn)超任何上一代競(jìng)爭(zhēng)對(duì)手的集成顯卡性能,因此他們選擇直接與中端筆記本電腦的獨(dú)顯進(jìn)行比較。在這種情況下,M1 Pro與GeForce RTX 3050 Ti 4GB對(duì)比,Apple的芯片以70%的功耗達(dá)到了相似的性能。這里的功耗約30W,目前還不清楚這是SoC的總功耗還是系統(tǒng)功耗,還是GPU本身。

除了GPU和CPU,Apple還指出他們大幅改進(jìn)的Media Engine,現(xiàn)在可以處理ProRes和ProRes RAW的硬件加速解碼和編碼,這對(duì)內(nèi)容創(chuàng)作者和專(zhuān)業(yè)攝像師來(lái)說(shuō)是非常有吸引力的。Mac在視頻編輯方面一直享有美譽(yù),但RAW格式的硬件加速引擎將是一個(gè)殺手級(jí)應(yīng)用,對(duì)這些專(zhuān)業(yè)用戶(hù)來(lái)說(shuō)是直接的賣(mài)點(diǎn)。

M1 Max:570億個(gè)晶體管、432mm²的32核GPU怪物雖然M1 Pro在性能方面趕超了競(jìng)爭(zhēng)對(duì)手,但M1 Max的目標(biāo)是提供前所未有的性能,將GPU增加到32核。本質(zhì)上,它不再是具有集成GPU的SoC,而是圍繞著SoC的GPU。

M1 Max的封裝略有變化,因?yàn)楦?。最明顯的變化是DRAM從2增加到4個(gè),這也與內(nèi)存接口寬度從256bit增加到512bit相對(duì)應(yīng)。Apple強(qiáng)調(diào)了400GB/s的巨大帶寬,如果是LPDDR5-6400,可能更準(zhǔn)確地說(shuō)是409.6GB/s。這種帶寬在SoC中聞所未聞,但在非常高端的GPU中是正常的。

在M1 Max的die shot上,看起來(lái)相當(dāng)奇怪。首先,GPU上方芯片的整個(gè)頂部看起來(lái)與M1 Pro基本相同,指出Apple正在重復(fù)使用大部分設(shè)計(jì),Max只是在塊布局中向下生長(zhǎng)的。

另外兩個(gè)128bit LPDDR5是很明顯的,有趣的是,它們也在增加SLC塊的數(shù)量。如果確實(shí)是每個(gè)16MB,那么整個(gè)SoC使用的是64MB片上通用緩存。除了明顯的GPU用途外,確實(shí)想知道CPU能用如此巨大的內(nèi)存帶寬資源實(shí)現(xiàn)什么。

M1 Max真的很大。Apple說(shuō)M1 Pro晶體管數(shù)量為337億個(gè),而M1 Max的晶體管數(shù)量高達(dá)570億個(gè)。AMD宣傳說(shuō)520mm²的Navi 21 GPU為268億個(gè)晶體管,采用的是TSMC 7nm工藝。由于Apple使用TSMC先進(jìn)的5nm工藝,Apple用更小芯片尺寸裝下了更多的晶體管數(shù)量。即使與NVIDIA最大的7nm芯片540億個(gè)晶體管的GA100相比,M1 Max的晶體管數(shù)量仍然更龐大。

Apple展出了M1、M1 Pro和M1 Max的尺寸對(duì)比,它們確實(shí)為1:1的比例。在這種情況下,我們已經(jīng)知道M1是120mm²,M1 Pro 245mm²,M1 Max約為432mm²。

32核GPU占據(jù)了大部分面積,Apple說(shuō)GPU達(dá)到了10.4TFLOP。回到die shot,似乎基本反映了16核GPU的布局。這里首先想到的是,2個(gè)GPU協(xié)同工作,但GPU的兩半之間似乎確實(shí)有一些共享邏輯。一旦我們看到系統(tǒng)的軟件行為,可能會(huì)更清楚地了解這一點(diǎn)。

在性能方面,Apple正在與市場(chǎng)上最好的產(chǎn)品進(jìn)行競(jìng)爭(zhēng),將M1 Max的性能與GeForce RTX 3080的性能進(jìn)行比較,功耗要低100W(60W vs 160W)。Apple還與RTX 3080的100W TDP進(jìn)行了比較,性能仍然優(yōu)于Nvidia的獨(dú)立GPU,同時(shí)功耗低40%。

我們等待新款M1系列芯片已經(jīng)有一年多了,Apple不僅滿(mǎn)足了這些期望,甚至超越了預(yù)期。M1 Pro和M1 Max看起來(lái)都是極具差異化的設(shè)計(jì),與我們?cè)诠P記本電腦領(lǐng)域見(jiàn)過(guò)的任何設(shè)計(jì)大不相同。如果M1表明Apple在芯片方面的成功,那么M1 Pro/Max也毫無(wú)疑問(wèn)為蘋(píng)果的Mac產(chǎn)品奠定了更堅(jiān)固的基礎(chǔ),已將競(jìng)爭(zhēng)對(duì)手遠(yuǎn)遠(yuǎn)甩在了后面。

[參考文章]Apple Announces M1 Pro & M1 Max: Giant New Arm SoCs with All-Out Performance — Andrei Frumusanu

蘋(píng)果

蘋(píng)果

蘋(píng)果公司(Apple Inc.),是美國(guó)的一家跨國(guó)科技公司,總部位于美國(guó)加州庫(kù)比蒂諾硅谷,由史蒂夫·喬布斯和斯蒂夫·蓋瑞·沃茲尼亞克共同創(chuàng)立。公司最初從事電腦設(shè)計(jì)與銷(xiāo)售業(yè)務(wù),后發(fā)展為包括設(shè)計(jì)和研發(fā)電腦、手機(jī)、穿戴設(shè)備等電子產(chǎn)品,提供計(jì)算機(jī)軟件、在線(xiàn)服務(wù)等業(yè)務(wù) 。

蘋(píng)果公司(Apple Inc.),是美國(guó)的一家跨國(guó)科技公司,總部位于美國(guó)加州庫(kù)比蒂諾硅谷,由史蒂夫·喬布斯和斯蒂夫·蓋瑞·沃茲尼亞克共同創(chuàng)立。公司最初從事電腦設(shè)計(jì)與銷(xiāo)售業(yè)務(wù),后發(fā)展為包括設(shè)計(jì)和研發(fā)電腦、手機(jī)、穿戴設(shè)備等電子產(chǎn)品,提供計(jì)算機(jī)軟件、在線(xiàn)服務(wù)等業(yè)務(wù) 。收起

查看更多

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶(hù)資源
  • 寫(xiě)文章/發(fā)需求
立即登錄