?
眾所周知,微處理器(CPU)在現(xiàn)代計算設備里是核心,是大腦,但是對于大多人來說,CPU 只不過就是一個名詞、一個符號或者代表著某一項參數(shù),是名副其實的“幕后”英雄。雖然在本文中陸續(xù)展示了點滴的代表性產(chǎn)品、與之相關的重要人物及其事跡,但是更多的無名英雄,依舊是很少被人認知贊美的。
回顧歷史,1971 年 11 月 15 日,全球第一款微處理器“Intel 4004”從 Intel 公司誕生,時至今日已走過 45 年的歲月,它改變了人類的思維方式、生活方式和提升了工作效率和生活品質,那么將來的發(fā)展趨勢如何呢?
在解答這個問題之前,首先瀏覽下面的畫卷。
1. 圖解 CPU 發(fā)展史簡
由圖可見,經(jīng)過了以上 40 多年的發(fā)展,如今,CPU 就象一匹脫韁的野馬,正以異乎尋常的速度向前發(fā)展,在大大小小的媒體上,市場充斥著與之相關的聲音:頻率提升、功耗降低、新品發(fā)布、人機大戰(zhàn)、操作系統(tǒng)的升級等等。如果說顯卡、聲卡的更新是技術上的創(chuàng)新,那么 CPU 的升級換代就是技術上的革命!
因此,不禁要問 CPU 將來的發(fā)展方向是什么?到底能夠跑多快?它的發(fā)展還會帶給人們哪些變革?或許下面的內容會給出一些答案!
2. 總趨勢分析
在最初研發(fā) CPU 的時候,人們就對其寄予厚望,要求微處理器要具備如下的要素:體積小重量輕、可靠性高、價格低廉、應用面廣泛的特點??梢哉f現(xiàn)在的 CPU 都符合這些要求,所以要想更貼切的把握 CPU 的發(fā)展趨勢,有必要對 CPU 的各個方面做一個比較全面的分析。
縱觀 CPU 的發(fā)展史,可以概括為如下:
(1) 位數(shù)越來越大
早期 CPU 和現(xiàn)在的 CPU 的一個重要的差別就是位數(shù)的巨大差異。CPU 位數(shù)的發(fā)展歷程如下:
4 位:Intel 4004;
8 位:Intel 8080/8085、Motorola6800/6802、ROCKWELL6502;
16 位:Intel 8086/8088、Motorola 68000;
32 位:Intel 80386/80486;
64 位:Intel Itanium 和 AMD K8。
有些古董級位數(shù)的 CPU,估計有些人是見所未見的,更不必說使用過了,比如想要見識 4004 的身影,恐怕只能去博物館或者翻翻地下室、閣樓的抽屜,也許拆開一些比較老的便攜式計算器,會有所收獲的。
從上面的數(shù)據(jù)來看,CPU 位數(shù)增高是一個必然趨勢,那么為什么要增高 CPU 的位數(shù)呢?增高位數(shù)到底有哪些好處呢?
首先回答第一個問題:CPU 要處理更多更復雜的數(shù)據(jù),這就需要提高 CPU 的數(shù)據(jù)帶寬。
解決這個問題,目前只有兩種行之有效的辦法:
其一、提高 CPU I/O 端口的頻率。
其二、加大 CPU 數(shù)據(jù)傳輸端口的寬度。
就第一種辦法而言,無疑是兩種做法中最簡單的。但是提高頻率便要對生產(chǎn)技術提高多個數(shù)量等級,而這無疑又增加生產(chǎn)成本和延長了生產(chǎn)周期。那么如果采用第二種方法會如何呢?
采用后者看起來就好多了:CPU I/O 接口帶寬增加處理的數(shù)據(jù)隨之增多,多個周期內可完成的任務在一個周期就可以完成了!
這個答案是顯而易見的,如果二者兼顧,那么則更加完美了!
?
(2) 封裝越來越小
對于用戶而言,對 CPU 使用什么封裝技術并不在意,因為關注的重點在于新品 CPU 的接口形式,比如大家都很喜歡小巧的、使用靈活的接口,這是常識:畢竟體積小,所占空間就??;用手指可以直接完成的安裝,比借助工具來完成的更加方便。
在過去,大多數(shù)人已經(jīng)對頻繁變更 CPU 的接口形式所帶來的額外投入感到厭煩。其實封裝正是在促使 CPU 接口轉型的重要原因之一。最為典型的例子就是賽楊從 SOLT1 到 SOCKET370 的轉型了。在轉型 PPGA 封裝的賽楊后去除了沒有多大必要的 PCB 板,有效的減少了成本。還有一個更重要的原因就是采用 PPGA 封裝制造,賽楊可以使制造難度下降一個等級。
所以說封裝小型化,將是未來 CPU 封裝的主導思想!當然小型化的實現(xiàn),離不開高度集成,高度集成是工藝改進的必然結果。
(3) 速度越來越快
一直以來,大家最關心的恐怕就要數(shù) CPU 的速度了。速度的大小標志著 CPU 運算能力的高低。
自從 1971 年 Intel4004,頻率只有 1MHz,而 2001 年的 P4 頻率高達 2.0G,2008 年的 Core i7 最低主頻是 2.8GHz,2016 年的最新 CPU,主頻高達 3.0G,的在 45 年間,頻率居然增長了 3000 倍。
速度提升了,運算能力自然大大提升,帶給人們的感受也是有目共睹的。不過雖然速度是提高 CPU 性能的法寶之一,但是單憑無止境的提速是很難使 CPU 有一個質的飛躍的。不過工藝的發(fā)展證明:對 CPU 而言速度是重要的,但它并不是萬能的!
(4) CACHE 越來越小
CACHE 一直是 CPU 中不可低估的元素。那么 CACHE 究竟是怎樣工作的呢?首先主存當中保存著所有要用的數(shù)據(jù),而 CACHE 中保存著的部分數(shù)據(jù)是主存中數(shù)據(jù)的副本。
當 CPU 訪問主存時,首先檢查 CACHE。
如果要存取的數(shù)據(jù)已經(jīng)在 CACHE 中,CPU 就可以很快的完成訪問,稱作“命中”。反之,如果數(shù)據(jù)不在 CACHE 中 CPU 就必須從主存中提取。
看來 CACHE 可以有效的增加 CPU 讀取數(shù)據(jù)的速度,那么為何不把主存當中的所有數(shù)據(jù)都放入如 CACHE 中呢?換句話說,就是為什么不增大 CACHE 的容量來多容納一些數(shù)據(jù)呢?
其實答案很簡單,這就關系到上面所說的命中的問題。CACHE 中存儲的數(shù)據(jù)不但是主存中的副本而且是隨機性的數(shù)據(jù)。這就是說即便 CACHE 里面有數(shù)據(jù)也不一定是 CPU 要訪問的。如果 CACHE 很大 CPU 在里面又尋找不到所需要的數(shù)據(jù),就造成了未命中的情況。可以說這一段時間就白白浪費了。
既然如此,如果使用小容量 CACHE 會如何呢?結果是這樣的:
即便是沒有找到所需要的數(shù)據(jù),尋找數(shù)據(jù)浪費的時間也要比大 CACHE 少得多。但是可能大家也注意到了,使用小 CACHE 的話 CPU 的命中率會大大降低。因此可以得出如下的結論:CACHE 不是越大越好。所以說大 CACHE 并不是未來 CPU 緩存的發(fā)展方向。
補充一點:實際上 CPU 的性能和 CACHE 的大小是呈負指數(shù)二項式增長。這就是說當 CPU 的 CACHE 的大小到達一定的水平后,如果不及時更新 CACHE 搜索算法和 CACHE 的輪換算法,CPU 性能將沒有本質上的提高!
?
(5) 制作工藝尺寸越來越小
CPU 的“制作工藝”指的是在生產(chǎn) CPU 過程中,要進行加工各種電路和電子元件,精度越高,生產(chǎn)工藝越先進。在同樣的材料中可以制造更多的電子元件,連接線也越細,提高 CPU 的集成度,CPU 的功耗也越小。
制造工藝的“微米”和“納米”是指 IC 內電路與電路之間的距離。制造工藝的趨勢是向密集度愈高的方向發(fā)展。密度愈高的 IC 電路設計,意味著在同樣大小面積的 IC 中,可以擁有密度更高、功能更復雜的電路設計。微電子技術的發(fā)展與進步,主要是靠工藝技術的不斷改進,使得器件的特征尺寸不斷縮小,從而集成度不斷提高,功耗降低,器件性能得到提高。
芯片制造工藝在 1995 年以后,從 0.5μm、0.35μm、0.25μm、0.18μm、0.15μm、0.13μm、90nm、65nm、45nm、32nm,22nm,一直發(fā)展到目前最新的 14nm。
可以說,現(xiàn)在 CPU 的制作工藝,已經(jīng)從無“微”不至,到了“無納諸侯”的境界了!
(6) 電壓和功耗越來越低
從 CPU 發(fā)展歷史來看,這個結論是顯而易見的,而且是將來的發(fā)展方向。
當然電壓、功耗是和生產(chǎn)工藝及集成度密切相關的?;叵氲谝慌_計算機問世時的情形:體積龐大,數(shù)以萬計的管件堆置在一起;有一個專門發(fā)電單元為之發(fā)電;散發(fā)出的熱量使它所在的房屋,變成了一個大烤爐。即便是這樣其運算能力也沒有現(xiàn)今手頭上的便攜式的計算器強。
低頭看一下現(xiàn)在手里的筆記本電腦或臺式機,即便是 10 幾年前的“老爺機”:1GHz 的功耗也只有 54W,這點兒熱量,“取暖”都是問題,更不必說“烤爐”了。能源短缺是人類面臨的重要問題,新一代 CPU 在這方面已經(jīng)為人類起了典范的作用!功耗下降了,自然就不需要很大的電壓了。在計算機 CPU 芯片小型化以后,使用過的最高電壓是 5V。
然后,這種降壓的趨勢一直延續(xù)了下來:5V?1.65V(賽楊 2)? 1.3V (C3)。
雖然下降的幅度不算是很大,但是要知道 1.X 伏特的電壓已經(jīng)是很小了。即便是再有下降的空間,這樣的空間也不算是很大了。所以說就是只下降了 0.05V 也是一個重大的進步!
對于臺式機和便攜式機而言,省電、低耗、超低電壓的 CPU 必將成為它們的首選!
(7) RISC 指令結構當?shù)?br />
關于這一點,先從 RISC 指令結構和 X86 指令集說起。
在 1978 年 Intel 公司推出了代號為 8086 的 16 位處理器,與此同時還推出了一款代號為 8087 的數(shù)學協(xié)處理器。因為當時這兩種芯片在指令集上相互兼容,所以人們將其統(tǒng)稱為 X86 指令集。
隨著時代的發(fā)展 Intel 陸續(xù)推出了更新型號的 CPU,但它們都有一個共同的特點就是仍然兼容原來的 X86 指令集。所以在 Intel 的后續(xù)產(chǎn)品上,就看到了諸如以 286、386、486、586 等以 X86 形式命名的 CPU 產(chǎn)品。但是當 AMD 的 K8 出現(xiàn)時,則表明 X86 已經(jīng)是夕陽西下了,RISC 處理器隆重登場。
RISC 優(yōu)越的性能完全得益于短指令:因為 RISC 處理器所處理的都是等長的短指令,這樣一來就大大簡化了解碼器的設計,省去了許多微碼結構。同時 RISC 極大的簡化了每一個時鐘周期的任務,這樣一來由于每一個時鐘周期所要完成的任務相對較少,它就可以盡量縮短時鐘的脈沖間隔,從而提高 CPU 工作頻率。
所以在同等的制造技術下,它的時鐘頻率就高于 CISC 處理器。RISC 處理器的性能之所以高人一籌就是基于以上的原因。
摩爾定律,讓科學家和工程師們可以預料到未來 CPU 發(fā)展的大致情況。毫無疑問,高性能、低能耗、高速度和低成本是未來的發(fā)展方向。
3. 摩爾定律失效后,硅芯片將何去何從?
摩爾定律自從 1965 年提出以來,該定律一直生效。不過近年來業(yè)界一直預測該定律即將失效。早在 2000 年,《麻省理工科技評論》就硅技術在大小和速度上的極限提出了警告。
目前,全球半導體行業(yè),不再基于每兩年實現(xiàn)性能翻倍的概念來制定硅芯片研發(fā)計劃,原因是成本問題:無力承擔跟上性能提升步伐所需購買的超復雜制造工具和工藝成本。此外,當前的制造技術,可能無法再像原來那樣大幅度縮小硅晶體管。事實上,晶體管都已經(jīng)變得非常微小了,以至于可能無法遵循通常的物理定律,那么,是否意味著科技驅動的指數(shù)級變化時代即將走到盡頭了嗎?
回答是:不。
即便硅芯片正在接近物理和經(jīng)濟成本上的極限,也還有其它的方法繼續(xù)驅動計算性能的指數(shù)級增長,比如:采用新材料來打造芯片和以新方式定義計算本身。目前,已經(jīng)出現(xiàn)了與晶體管速度無關的技術進步,如:深度學習驅動的更加聰明的軟件,以及通過利用云資源實現(xiàn)更強計算能力的技術。而這只是未來計算創(chuàng)新的冰山一角。
因此,2016 年福布斯發(fā)布文章稱:即便摩爾定律失效,硅芯片逼近物理和經(jīng)濟成本上的極限,也還有其它的創(chuàng)新方法和技術繼續(xù)驅動計算性能的指數(shù)級增長,比如:內存中運算、量子計算、分子電子學、神經(jīng)形態(tài)計算等等。
以下便是有望驅動計算性能繼續(xù)飛速增長的幾項新興技術:
(1) 內存中計算
縱觀在整個計算史,處理最緩慢的一部分就是從硬盤獲取數(shù)據(jù)。很多的處理性能都浪費在了等待數(shù)據(jù)到達上。相比之下,內存中計算則將大量的數(shù)據(jù)放在 RAM,使得數(shù)據(jù)可以馬上在 RAM 中進行處理。結合新型的數(shù)據(jù)庫、分析技術和系統(tǒng)設計,它能夠大大提升性能和整體成本。
所以“吃掉”RAM,也許是 CPU 的趨勢之一。
(2) 基于石墨烯的微芯片
石墨烯為一個分子那么厚,導電性能比任何其它人類已知的材料都要強。它能夠卷入到微小的管子中,也能夠結合其它材料使用,能夠在更小的空間里驅動電子以更快的速度運動。它在這方面甚至要勝過最下的硅晶體管。這將會將針對微處理器的摩爾定律的適用時間再延長幾年。
石墨烯的分子結構圖
(3) 量子計算
普通計算機中的 2 位寄存器在某一時間僅能存儲 4 個二進制數(shù)(00、01、10、11)中的一個,而量子計算機中的 2 位量子位(qubit)寄存器可同時存儲這四個數(shù),因為每一個量子比特可表示兩個值。
理論上,量子計算機將能夠以數(shù)百萬倍于當前技術的速度解決各類非常復雜的問題,如分析基因數(shù)據(jù)或者測試飛機系統(tǒng)。谷歌研究人員去年宣布,他們已經(jīng)開發(fā)了一種新的量子比特方式來檢測和防范錯誤。
?
(4) 分子電子學
瑞典隆德大學研究人員利用納米技術打造了“生物計算機”,通過沿著納米觀人工路徑同時移動多個蛋白絲,該款計算機能夠進行平行計算。
這種生物計算機比循序運行的傳統(tǒng)電子計算機更加快速,且節(jié)能 99%,制造和使用成本也低于傳統(tǒng)計算機和量子計算機。它進行商用的時間可能也將早于量子計算機。
(5) DNA 數(shù)據(jù)存儲
將數(shù)據(jù)轉換成 base 4,你就可以將它編碼到合成 DNA 上。
為什么要那么做呢?
DNA 存儲數(shù)據(jù)模型圖
很簡單:一點點 DNA 就可以存儲一大堆數(shù)據(jù)。事實上,有瑞士研究團隊估計,一個茶匙的 DNA 可以容納人類迄今為止所產(chǎn)生的所有數(shù)據(jù),從最早期的洞穴壁畫,再到昨天的 Facebook 動態(tài)更新。
這種技術目前需要耗費大量的時間和資金,不過基因編輯或許是大數(shù)據(jù)的未來:Futurism 最近報道稱,微軟正在研究利用合成 DNA 來進行安全的長期數(shù)據(jù)存儲,已經(jīng)能夠編碼和恢復 100%的初始測試數(shù)據(jù)。
(6) 神經(jīng)形態(tài)計算
神經(jīng)形態(tài)計算技術的目標是,打造一款像人腦那樣的計算機——處理和學習數(shù)據(jù)的速度能夠跟生成數(shù)據(jù)一樣快速。
到目前為止,業(yè)界已經(jīng)開發(fā)出能夠通過訓練和執(zhí)行神經(jīng)網(wǎng)絡來進行深度學習的芯片,那是往正確方向邁出的一步。例如:General Vision 的神經(jīng)形態(tài)芯片包含 1024 個神經(jīng)元,每一個都是基于 SRAM(靜態(tài)隨機存儲器)的 256 字節(jié)存儲器,且有 3000 個邏輯閘,所有的神經(jīng)元都互相連接,平行運行。
(7) 無源 Wi-Fi(Passive Wi-fi)
華盛頓大學的一個計算機科學家和電氣工程師團隊,開發(fā)了一種耗能比目前的電耗標準少 1 萬倍的 Wi-Fi 傳輸生成方式。雖然這嚴格來說不算是計算性能的提升,但它是網(wǎng)絡連接性的指數(shù)級增長,將會使能其它技術的進步。
無源 Wi-Fi 被《麻省理工科技評論》列入 2016 年的十大突破性技術,它將不僅僅可以節(jié)省電耗,還能夠使能最低耗能的物聯(lián)網(wǎng),讓更多之前非常耗電的設備第一次能夠通過 Wi-Fi 連接網(wǎng)絡,還有可能會催生新型的通訊方式。
……
一路走來,雖然我們可能在接近硅芯片的性能極限,但技術本身同時正在加速發(fā)展,要阻止它成為現(xiàn)代生活的驅動力是不大可能的。隨著新計算技術推動機器人、人工智能、虛擬現(xiàn)實、納米技術以及其它震驚世界的進步超越當前被公認的極限,它的影響力將只會有增無減。
簡單來說,計算的指數(shù)級增長,或許無法永遠持續(xù)下去,但它的盡頭仍比我們想象的要遙遠得多。
到這里,不妨思考一下:在不久的將來,如果上述的技術被成功用于硅芯片的設計,那么將來的處理器將會是什么樣子?
請讀者腦補一下吧!
與非網(wǎng)原創(chuàng)內容,不經(jīng)允許,謝絕轉載!
本系列更多內容,請參照:處理器史話匯總。