一直以來,芯片都是不少科技公司研發(fā)的重點(diǎn),尤其在芯片市場(chǎng)競(jìng)爭異?;馃岬慕裉?。
芯片研發(fā)周期長、成本高,重度依賴設(shè)計(jì),優(yōu)秀的芯片設(shè)計(jì)師非常稀缺,基本都被幾家老牌芯片大廠壟斷,后起之秀很難在短期內(nèi)挖到足夠的資深設(shè)計(jì)師。
隨著技術(shù)的不斷升級(jí),AI 的作用也越來越重要,很多科技企業(yè)都在對(duì) AI 進(jìn)行不斷的投入研發(fā)。近日,Google AI 負(fù)責(zé)人 Jeff Dean 和谷歌研究部門、谷歌芯片實(shí)現(xiàn)和基礎(chǔ)設(shè)施團(tuán)隊(duì)共同撰寫了一篇論文,論文中描述了一種基于學(xué)習(xí)的芯片設(shè)計(jì)方法,并聲稱可以平均在 6 個(gè)小時(shí)內(nèi)完成芯片的設(shè)計(jì)。?? ?
該論文的發(fā)布,意味著片上晶體管的放置可以在很大程度上實(shí)現(xiàn)自動(dòng)化。如果技術(shù)成果可以公開發(fā)表,那么這項(xiàng)技術(shù)可以讓資金緊張的初創(chuàng)公司開發(fā)出自己的芯片,用來進(jìn)行人工智能或其他行業(yè)的研究應(yīng)用。此外,該技術(shù)還可以幫助縮短芯片的設(shè)計(jì)周期,使硬件能夠更好地適應(yīng)理論研究的快速發(fā)展。
Jeff Dean 在去年年底的一次采訪中曾透露過這一項(xiàng)技術(shù),并介紹到"從你想要的設(shè)計(jì),到實(shí)際將其鋪設(shè)在芯片上,并在面積、功率和線長等方面有適當(dāng)?shù)南拗?,滿足所有的設(shè)計(jì)或制造過程,這是一個(gè)持續(xù)很長時(shí)間的過程,而我們基本上設(shè)計(jì)出了一款機(jī)器學(xué)習(xí)模型,它可以學(xué)習(xí)如何為一個(gè)特定的芯片進(jìn)行元件布局。"
該 AI 模型的方法旨在將邏輯門、存儲(chǔ)器和更多的網(wǎng)格圖放置到芯片畫布上,從而使設(shè)計(jì)在遵守放置密度和路由擁塞限制的同時(shí),優(yōu)化功耗、性能和面積(PPA)。圖譜的大小從幾百萬到幾十億個(gè)節(jié)點(diǎn)組成的集群不等,通常情況下,評(píng)估目標(biāo)指標(biāo)需要數(shù)小時(shí)到一天以上的時(shí)間。
Jeff Dean 提到,數(shù)十年來,推動(dòng)計(jì)算技術(shù)發(fā)展的基本思想是:給要解決的問題匹配足夠的算力。問題越大,算力越大。但當(dāng)我們進(jìn)入 AI 時(shí)代后突然發(fā)現(xiàn),算力并沒有那么重要了。
事實(shí)證明,AI/ML 不需要典型的 CPU/GPU 的復(fù)雜功能,所需的數(shù)學(xué)運(yùn)算也更簡單,而且要求的精度也低很多。
事實(shí)證明,AI 在設(shè)計(jì)芯片方面天賦異稟。AI 設(shè)計(jì)芯片的水平越來越高,完全自動(dòng)化地布置芯片上晶體管也毫無壓力。現(xiàn)在,AI 設(shè)計(jì)芯片平均只需要 6 個(gè)小時(shí)。而同樣的活兒,人工做要花費(fèi)幾周時(shí)間。
研究人員將邏輯門和存儲(chǔ)器組成的芯片網(wǎng)表放在一個(gè)芯片畫布上,這樣就可以一目了然地優(yōu)化設(shè)計(jì)中的功耗、性能和面積(PPA),同時(shí)遵守對(duì)布置密度和走線阻塞的限制。這些網(wǎng)表大小不等,由成千上萬個(gè)集群中的數(shù)百萬到數(shù)十億個(gè)節(jié)點(diǎn)組成,通常,評(píng)估達(dá)成目標(biāo)需要花費(fèi)幾個(gè)小時(shí)到一天以上的時(shí)間。
研究人員設(shè)計(jì)了一個(gè)框架,指導(dǎo) AI 智能體進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練,來優(yōu)化芯片的布置位置。(強(qiáng)化學(xué)習(xí)通過獎(jiǎng)勵(lì)政策來刺激 AI 智能體完成目標(biāo),在這種情況下,AI 智能體會(huì)根據(jù)獎(jiǎng)勵(lì)最大化的情況進(jìn)行布置。)
根據(jù)芯片網(wǎng)表,當(dāng)前節(jié)點(diǎn)的 ID,以及網(wǎng)表和半導(dǎo)體技術(shù)的元數(shù)據(jù),一個(gè)政策 AI 模型會(huì)在可用的布置位置上輸出一個(gè)概率分布,而價(jià)值模型則對(duì)當(dāng)前布置的預(yù)期報(bào)酬做出估計(jì)。
就這樣,從一個(gè)空芯片開始,AI 智能體完成網(wǎng)絡(luò)列表,然后按順序布置組件。最終 AI 智能體會(huì)收到系統(tǒng)的獎(jiǎng)勵(lì)。為了引導(dǎo) AI 智能體先選擇布置哪些組件,組件按降序大小排列; 先布置較大的組件,會(huì)減少以后無法布置組件的可能性。
培訓(xùn) AI 智能體,需要?jiǎng)?chuàng)建一個(gè)包含 10,000 個(gè)芯片布置情況的數(shù)據(jù)集,其中輸入與給定布置相關(guān)的狀態(tài),標(biāo)簽是布置相對(duì)應(yīng)的獎(jiǎng)勵(lì)(即,線路長度和阻塞)。研究人員首先挑選了 5 個(gè)不同的芯片網(wǎng)表,然后應(yīng)用 AI 算法為每個(gè)網(wǎng)絡(luò)列表創(chuàng)建 2000 個(gè)不同的布置位置。
在實(shí)驗(yàn)中,研究人員報(bào)告說,在越多的芯片上訓(xùn)練框架,就能夠越快地進(jìn)行訓(xùn)練,產(chǎn)生更高質(zhì)量的結(jié)果。他們聲稱,與主流芯片相比,谷歌 TPU (人工智能加速器芯片)的產(chǎn)品實(shí)現(xiàn)了更好的 PPA。
研究人員得出結(jié)論,現(xiàn)有的方法總是從零開始優(yōu)化每個(gè)新芯片布置位置,我們的工作利用了先前布置芯片所積累的知識(shí),隨著時(shí)間的推移訓(xùn)練效果變得越來越好。