編者按:指令系統(tǒng)是CPU和操作系統(tǒng)的共同基礎(chǔ),是信息產(chǎn)業(yè)的“根技術(shù)”。龍芯中科經(jīng)過二十多年的努力,推出了自研的指令系統(tǒng)——LoongArch(以下簡稱“LA架構(gòu)或龍架構(gòu)”),并基于該指令系統(tǒng),打造出性能達(dá)到市場主流產(chǎn)品的CPU。龍芯中科如何繼續(xù)縮小技術(shù)差距,豐富產(chǎn)業(yè)生態(tài),走向更加開放的競爭市場。
近日,中國電子報(bào)總編輯胡春民與龍芯中科技術(shù)股份有限公司董事長胡偉武進(jìn)行了深度對話。
對話人:龍芯中科技術(shù)股份有限公司董事長 胡偉武,《中國電子報(bào)》總編輯?胡春民
時(shí)? ?間:2024年7月3日
地? ?點(diǎn):龍芯中科技術(shù)股份有限公司
加快構(gòu)建自主可靠的信息技術(shù)體系
胡春民:當(dāng)前各個(gè)領(lǐng)域都在加快培育新質(zhì)生產(chǎn)力,我國電子信息產(chǎn)業(yè)如何發(fā)展新質(zhì)生產(chǎn)力?作為電子信息產(chǎn)業(yè)的從業(yè)者,你如何理解這一話題?
胡偉武:我國信息產(chǎn)業(yè)發(fā)展新質(zhì)生產(chǎn)力最重要的內(nèi)容是構(gòu)建自主的信息技術(shù)體系,其中包括指令集架構(gòu)、CPU芯片、操作系統(tǒng)等。當(dāng)前全球信息產(chǎn)業(yè)構(gòu)建在西方主導(dǎo)的x86(Wintel)體系和ARM(AA)體系之上。2023年我國規(guī)上工業(yè)企業(yè)利潤率為5.8%,而電子工業(yè)利潤率為4.2%;2023年我國電子工業(yè)利潤總額為6411億元,而美國蘋果公司這一家公司的利潤總額就達(dá)到970億美元。我國信息產(chǎn)業(yè)發(fā)展新質(zhì)生產(chǎn)力的根本出路在于構(gòu)建獨(dú)立于x86體系和ARM體系的第三套信息技術(shù)體系和產(chǎn)業(yè)生態(tài)。龍芯團(tuán)隊(duì)經(jīng)過二十多年的努力,已經(jīng)打牢了第三套信息技術(shù)體系的技術(shù)底座。我們推出了自己的指令系統(tǒng)——LoongArch?;谠撝噶钕到y(tǒng),我們具備了自研性能達(dá)到市場主流產(chǎn)品的CPU和足夠成熟穩(wěn)定的操作系統(tǒng)。首先看硬件層面,龍芯于2023年推出的桌面端CPU龍芯3A6000,實(shí)測性能相當(dāng)于英特爾公司2020年上市的第十代酷睿四核處理器;龍芯今年研制成功的16核及32核版龍芯3C6000服務(wù)器CPU,性能相當(dāng)于英特爾公司Xeon 4314和6338;龍芯當(dāng)前正在研制的3B6600八核桌面CPU使用成熟工藝預(yù)計(jì)單核/多核性能可以達(dá)到使用先進(jìn)工藝的中高端酷睿12~13代水平。以上產(chǎn)品數(shù)據(jù)說明,經(jīng)過二十多年的積累,當(dāng)前龍芯CPU性能已經(jīng)能夠達(dá)到主流市場產(chǎn)品的水平。從軟件生態(tài)來看,龍芯基于龍架構(gòu)建成了與x86、ARM并列的Linux基礎(chǔ)軟件體系。這一成果可以分三個(gè)層次來談。
第一層是,龍芯在上游開源社區(qū)的支持程度上實(shí)現(xiàn)了質(zhì)的突破。任何操作系統(tǒng)都離不開上游開源社區(qū)的支持,一個(gè)桌面/服務(wù)器操作系統(tǒng)需要數(shù)以萬計(jì)代碼包的支持,這些代碼包絕大多數(shù)來自國際開源社區(qū),如瀏覽器、GCC編譯器等。在數(shù)以萬計(jì)的上游開源社區(qū)中,與指令系統(tǒng)相關(guān)的上游社區(qū)有上百個(gè),全面接納了龍架構(gòu)。隨著開源社區(qū)演進(jìn),這些代碼包除了有x86、ARM版本之外,也有龍架構(gòu)的版本。基礎(chǔ)軟件工程師可以在沒有龍芯公司支持的情況下,能夠完全基于國際開源社區(qū)構(gòu)建完整的龍架構(gòu)操作系統(tǒng)。這是中國人自主設(shè)計(jì)的指令系統(tǒng)第一次在國際上被全面認(rèn)可。第二層是,國內(nèi)外諸多操作系統(tǒng)社區(qū)都具備了龍芯的版本。其中包括統(tǒng)信、麒麟、歐拉、龍蜥、開源鴻蒙、Debian等。第三層是,許多基礎(chǔ)應(yīng)用都具備了龍架構(gòu)的版本。包括WPS、微信、QQ、釘釘、騰訊會議、美圖秀秀、搜狗輸入法等。
胡春民:當(dāng)前中國CPU與國際領(lǐng)先水平差距很大,主要體現(xiàn)在哪里?龍芯最迫切解決的問題是什么?
胡偉武:在完成通用CPU和操作系統(tǒng)基礎(chǔ)軟硬件“補(bǔ)課”后,龍芯面臨的最大問題在應(yīng)用軟件層面。就像Windows的應(yīng)用不能直接在Android上運(yùn)行一樣,Windows和Android的應(yīng)用也不能在龍架構(gòu)的CPU和操作系統(tǒng)平臺上運(yùn)行。這個(gè)問題的解決,我們有兩條道路。一是在政策性市場的帶動下,大量的應(yīng)用軟件開展了與龍架構(gòu)的適配。另一條道路是“主動兼容”國際主流,采用二進(jìn)制翻譯的技術(shù),將原生于x86和ARM的應(yīng)用軟件在龍芯CPU上運(yùn)行起來。包括在龍芯的Linux平臺上兼容x86/Linux應(yīng)用、x86/Windows應(yīng)用以及ARM/Android應(yīng)用。目前,在龍芯的Linux平臺上運(yùn)行x86/Linux應(yīng)用已經(jīng)比較成熟,包括EDA工具、Oracle等大型x86/Linux軟件都可以在龍芯的Linux平臺上運(yùn)行。當(dāng)然,采用二進(jìn)制翻譯的方式運(yùn)行軟件會存在一定的效率損失。為彌補(bǔ)效率的損失,龍芯基于自研指令集架構(gòu)的優(yōu)勢,采用了增加指令的方式,可以將翻譯軟件的效率提升至原軟件運(yùn)行效率的80%以上,甚至更高。對于應(yīng)用軟件的庫函數(shù)調(diào)用,則直接通過庫直通技術(shù)達(dá)到100%的翻譯效率,如大量游戲軟件會調(diào)用OpenGL圖形庫,這部分不用翻譯,直接調(diào)用龍架構(gòu)的OpenGL即可。
胡偉武和技術(shù)人員一起查看測試情況在兼容x86/WIndows方面,龍芯主要實(shí)現(xiàn)了兩重突破。一是與外接設(shè)備的適配,比如許多打印機(jī)沒有適配Linux的驅(qū)動,只支持Windows系統(tǒng),龍芯通過在Linux操作系統(tǒng)上實(shí)現(xiàn)Windows打印機(jī)框架,實(shí)現(xiàn)了龍芯與95%以上的打印機(jī)設(shè)備適配。二是龍芯的Linux瀏覽器實(shí)現(xiàn)了對Windows瀏覽器的兼容。由于Windows是一個(gè)相當(dāng)復(fù)雜的系統(tǒng),在不運(yùn)行Windows的情況下直接運(yùn)行Windows應(yīng)用需要模擬整個(gè)Windows接口環(huán)境,所以將所有應(yīng)用向龍芯遷移很難,我們現(xiàn)在能在不啟動Windows的情況下,運(yùn)行Windows的常見應(yīng)用。兼容x86/Windows應(yīng)用的另外一個(gè)思路是直接在龍芯的Linux平臺上運(yùn)行Windows操作系統(tǒng),這件事容易得多。預(yù)計(jì)到2024年年底,在龍芯的Linux平臺上可以較流暢地運(yùn)行Windows操作系統(tǒng)及其應(yīng)用。從實(shí)現(xiàn)難度來看,在龍芯上運(yùn)行安卓應(yīng)用比較容易,且運(yùn)行效率也很高,以后將根據(jù)需要展開。
二十余年從科研項(xiàng)目到企業(yè)成功上市胡春民:在龍芯發(fā)展的二十余年歷程中,有哪些標(biāo)志性的成績?
胡偉武:我覺得龍芯的發(fā)展歷程可以按照每五年一個(gè)節(jié)點(diǎn),分成四個(gè)階段。第一個(gè)階段是2001年到2005年。當(dāng)時(shí)我國對于是否要自研CPU還沒有形成共識。2001年,時(shí)任中國科學(xué)院計(jì)算技術(shù)研究所所長的李國杰院士支持我們成立龍芯課題組,研制了“龍芯1號”CPU的FPGA原型系統(tǒng),把操作系統(tǒng)跑起來。2002年,龍芯得到中國科學(xué)院知識創(chuàng)新工程的支持,研制成功“龍芯1號”CPU。在此基礎(chǔ)上,推動國家“863”項(xiàng)目支持自主CPU的研制,并研制成功“龍芯2B”“龍芯2C”“龍芯2E”系列CPU,每一款CPU性能都是上一款的3倍左右,實(shí)現(xiàn)了“三級跳”的跨越。2006年年初研制成功的“龍芯2E”性能達(dá)到高端Pentium III或低端Pentium IV的水平。第一個(gè)五年,我們在工程實(shí)踐中得到了第一個(gè)答案:中國能做自己的CPU。
胡偉武在進(jìn)行CPU主板信號測試第二個(gè)階段是2006年到2010年。從2006年起,我們試圖將研究成果推廣到產(chǎn)業(yè)界應(yīng)用,但四處碰壁,得到的反饋是:“我們連反向設(shè)計(jì)的都不敢用,更別說正向設(shè)計(jì)的了。”所謂反向設(shè)計(jì),就是將別人設(shè)計(jì)的芯片剖開,對照版圖做一版相同的。但我們堅(jiān)持自研,并持續(xù)在一些小型設(shè)備中嘗試應(yīng)用。2008年開始,個(gè)別國家在戰(zhàn)略裝備和設(shè)備上開始選用我們的產(chǎn)品。2010年,在特定領(lǐng)域開始龍芯CPU的應(yīng)用推廣。
第二個(gè)五年,我們在工程實(shí)踐中得到了第二個(gè)答案:中國能用自己的CPU。第三個(gè)階段是2011年到2015年。2010年左右,我們意識到當(dāng)前的組織形式已經(jīng)不足以支撐龍芯的發(fā)展,于是決定進(jìn)行市場化運(yùn)作。但這個(gè)階段,我們走了很多彎路,甚至對CPU性能的認(rèn)識都走了彎路。最初,我們認(rèn)為決定性能高低的是CPU核心數(shù)量,于是我們在英特爾生產(chǎn)的主流產(chǎn)品為4核的情況下生產(chǎn)了一款8核CPU。但使用時(shí)發(fā)現(xiàn)性能不佳。打個(gè)比方,如果將英特爾的處理器比作4個(gè)大學(xué)本科生的話,那么我們當(dāng)時(shí)做的產(chǎn)品就相當(dāng)于8個(gè)小學(xué)生。此后我們將關(guān)注點(diǎn)放在了單核性能上。
第三個(gè)五年,我們推動研制并使用自主CPU成為國家戰(zhàn)略,引進(jìn)國外x86和ARM技術(shù)的國產(chǎn)桌面/服務(wù)器CPU也開始發(fā)展起來。第四個(gè)階段是2016年至2020年,龍芯實(shí)現(xiàn)性能和營收的“雙十倍”跨越。在研發(fā)關(guān)注點(diǎn)調(diào)整為單核性能后,五年時(shí)間里,我們的處理器單核性能提高了10倍,大致相當(dāng)于達(dá)到了英特爾第三、第四代酷睿水平,達(dá)到了基本可用,甚至可用的水平。同時(shí),企業(yè)營收增加了10倍,2020年實(shí)現(xiàn)營收達(dá)10億元,且實(shí)現(xiàn)了數(shù)以億計(jì)的凈利潤。
胡春民:龍芯2022年在科創(chuàng)板上市。從科研院所到自創(chuàng)企業(yè)再到成功上市,這一過程中有哪些力量發(fā)揮了關(guān)鍵作用?
胡偉武:我認(rèn)為龍芯就是我國市場經(jīng)濟(jì)條件下新型舉國體制的產(chǎn)物。龍芯的發(fā)展過程可以用一句話來概括:研發(fā)支持扶上馬,市場帶動送三程,各類資本全程保駕護(hù)航。從2001年開始做龍芯CPU到2010年,我們課題組一共花掉了各類科研項(xiàng)目經(jīng)費(fèi)達(dá)4億多元,這就是“研發(fā)支持扶上馬”。在我們的產(chǎn)品基本成形后,又獲得了市場應(yīng)用方面的扶持,這就是“市場帶動送三程”。
其中,第一程是“十二五”期間,在特定領(lǐng)域的嵌入式系統(tǒng)中應(yīng)用,這一階段我們的產(chǎn)品只要支持比較單一的應(yīng)用即可,例如控制類系統(tǒng)、通信類系統(tǒng),這類場景的可靠性、安全性要求較高,但應(yīng)用場景相對單一,甚至一個(gè)設(shè)備能支持單一軟件就可以了。這一程給了我們軟硬件相磨合的機(jī)會。第二程是“十三五”期間,在以電子政務(wù)為代表的信息化系統(tǒng)中應(yīng)用。Office、瀏覽器、微信、視頻會議等應(yīng)用都需要在龍芯上運(yùn)行。這一程支持龍芯桌面、服務(wù)器產(chǎn)業(yè)鏈的初步集聚。
第三程是“十四五”期間,從電子政務(wù)向金融、教育、能源、交通等其他應(yīng)用場景中拓展。但這些場景的特點(diǎn)是,雖然其需要支撐的應(yīng)用更加復(fù)雜,但是有邊界的。我相信,經(jīng)過三程的市場帶動,龍芯CPU的性價(jià)比和軟件生態(tài)得到不斷迭代發(fā)展,到“十五五”期間,龍芯CPU可以走向開放的市場競爭。龍芯在發(fā)展過程中得到了包括國家科研經(jīng)費(fèi)、地方政府資本、社會資本以及公眾資本的全程“保駕護(hù)航”。
其中,從2001年至2010年,有各類國家科研經(jīng)費(fèi)的支持,相當(dāng)于我們的天使投資;在我們創(chuàng)辦企業(yè)后,A輪融資得到了北京市政府協(xié)調(diào)北京工業(yè)投資公司的1億元投資,帶動了一家民營企業(yè)跟投了1億元;2015年,B輪融資中,私募基金鼎輝資本進(jìn)入;后來還有國新資本、國家集成電路基金、互聯(lián)網(wǎng)基金等其他資本投資龍芯;2022年,龍芯上市,得到了公眾資本的支持。所以我們是在諸多類資本的幫助下,一路走到今天,這也體現(xiàn)了我國體制的優(yōu)勢。
2025年基本建成基于龍架構(gòu)的自主生態(tài)胡春民:這個(gè)五年發(fā)展期,龍芯有哪些預(yù)期完成的目標(biāo)?
胡偉武:在“十四五”(2021年至2025年)期間,我們要完成三個(gè)轉(zhuǎn)變:第一,從技術(shù)“補(bǔ)課”到生態(tài)建設(shè)的轉(zhuǎn)變。龍芯過去20年算是完成了技術(shù)“補(bǔ)課”,這個(gè)五年,我們的重點(diǎn)放在完善生態(tài)建設(shè)上。第二,從政策性市場向開放市場的轉(zhuǎn)變。過去我們主要圍繞政策性市場,而現(xiàn)在我們更多地面向開放市場。第三,從跟隨性發(fā)展的必然王國到自主發(fā)展的自由王國的轉(zhuǎn)變。我們力圖構(gòu)建x86和ARM架構(gòu)之外的第三套信息技術(shù)體系,走到今天,很多方面已經(jīng)沒有了參照物,需要走出自己的道路。我們希望在2025年,基于龍架構(gòu)的自主生態(tài)基本建成。在2030年,基于龍架構(gòu)的自主生態(tài)更加完善。到2035年,形成與x86和ARM三足鼎立的態(tài)勢。
所謂的三足鼎立,是不能有數(shù)量級的差異。就像如果競爭對手占據(jù)整個(gè)市場份額的99%,而我們只占1%,這不算形成三足鼎立;但如果對手的份額占據(jù)90%,而我們能夠占到10%,那么三足鼎立的局面就算實(shí)現(xiàn)了。
龍芯的生態(tài)建設(shè)分為四個(gè)部分。第一是硬件生態(tài),我們要為CPU配置相應(yīng)的接口橋片、GPGPU芯片、服務(wù)器的BMC芯片及RAID控制芯片等配套芯片,從而實(shí)現(xiàn)整機(jī)的成本最低。第二是軟件生態(tài),分夯實(shí)基礎(chǔ)、廣泛兼容和自主應(yīng)用“三步走”來建設(shè)。所謂“夯實(shí)基礎(chǔ)”,就是龍架構(gòu)Linux平臺的成熟穩(wěn)定。所謂“廣泛兼容”,就是在龍架構(gòu)的Linux類操作系統(tǒng)上兼容x86/Linux應(yīng)用、x86/Windows應(yīng)用以及ARM/Android應(yīng)用。所謂“自主應(yīng)用”就是形成自主應(yīng)用生態(tài),就像手機(jī)的APP有iOS版和安卓版,希望未來電腦的APP有Windows版和龍芯版。
目前,我們已經(jīng)完成了“夯實(shí)基礎(chǔ)”的第一個(gè)步驟,建成了與x86、ARM并列的Linux基礎(chǔ)軟件體系,正處在“廣泛兼容”的第二個(gè)步驟,同時(shí)通過大量應(yīng)用適配開始了第三個(gè)步驟的工作。第三是人才生態(tài),我們要推動大學(xué)課程采用龍架構(gòu)作為教學(xué)用的指令系統(tǒng),推動中小學(xué)信息化教育擺脫“微軟培訓(xùn)班”的狀況,教授自主計(jì)算機(jī)平臺的使用。第四是產(chǎn)業(yè)生態(tài),通過政策性市場應(yīng)用帶動更多整機(jī)及系統(tǒng)企業(yè)采用龍芯芯片,通過不斷提高龍芯CPU的性價(jià)比并完善軟件生態(tài)吸引廣大產(chǎn)業(yè)鏈伙伴主動選用龍芯芯片。龍芯還設(shè)立了龍芯基金投資龍芯產(chǎn)業(yè)鏈“上下游、左右岸、干支流”生態(tài)伙伴。
未來以“性價(jià)比創(chuàng)新”挖掘紅海市場胡春民:當(dāng)前的半導(dǎo)體行業(yè)競爭十分激烈,幾乎都是紅海市場,龍芯走向開放市場的機(jī)會何在?
胡偉武:2022年到2024年,龍芯開展了以面向開放市場為主要目的,以提高龍芯CPU性價(jià)比為主要手段的三年研發(fā)轉(zhuǎn)型,轉(zhuǎn)型的主要內(nèi)容總結(jié)下來是四個(gè)字——“兩點(diǎn)一面”?!耙幻妗笔侵冈谡咝允袌鰩酉?,不斷提高龍芯CPU的系統(tǒng)性價(jià)比并完善軟件生態(tài)?,F(xiàn)在我國自主CPU主要包括x86、ARM、龍架構(gòu)三條技術(shù)路線。一般認(rèn)為,龍芯CPU最自主,但性能和軟件生態(tài)不如引進(jìn)x86和ARM技術(shù)的其他CPU。
我們要把自主優(yōu)勢轉(zhuǎn)化為性價(jià)比和軟件生態(tài)的優(yōu)勢,做到“因?yàn)辇埿咀钭灾?,所以性能最高而且軟件生態(tài)最好”。例如,已經(jīng)量產(chǎn)的龍芯3A6000桌面CPU,不論其性能和整機(jī)成本都比引進(jìn)國外技術(shù)的國產(chǎn)CPU展現(xiàn)出優(yōu)勢;已經(jīng)研制成功的龍芯3C6000系列16核、32核、60/64核服務(wù)器CPU性價(jià)比優(yōu)勢很大。相信隨著時(shí)間的推移,龍芯自主研發(fā)所展現(xiàn)出來的技術(shù)優(yōu)勢會更加明顯。
“兩點(diǎn)”的第一個(gè)點(diǎn),就是基于通用CPU做專用解決方案。例如存儲服務(wù)器只需要運(yùn)行一個(gè)軟件,可以避免生態(tài)壁壘的問題,只要能把該存儲服務(wù)器軟件遷移過來就可以了,龍芯CPU性價(jià)比高的優(yōu)勢就可以發(fā)揮出來。
“兩點(diǎn)”的第二個(gè)點(diǎn)是專用芯片。這類芯片應(yīng)用比較固定,如嵌入式芯片、打印機(jī)專用芯片等,此類芯片需要運(yùn)行的功能同樣相對簡單,龍芯可以通過自主研發(fā)做到成本最低。而不論做哪類產(chǎn)品,我們的市場策略是一致的——性價(jià)比創(chuàng)新。
龍芯要想在當(dāng)前的半導(dǎo)體行業(yè)中找到自己的市場空間,其發(fā)展思路與上世紀(jì)90年代以服裝、鞋帽制造為主營業(yè)務(wù)的鄉(xiāng)鎮(zhèn)企業(yè)是一樣的,都要靠降低成本。當(dāng)前龍芯的成本控制得非常好,這就使得在售價(jià)很低的情況下,我們還能做到比較高的毛利率。我們之所以能夠?qū)⒊杀緣嚎s到最低,離不開龍芯長期堅(jiān)持自主研發(fā)芯片中用到的各種IP,包括系列化的CPU核、系列化的GPGPU核、高速內(nèi)存接口、高速片間互連接口、高速IO接口、各類工業(yè)總線接口等上百種IP。
自研指令系統(tǒng)和IP核不僅可以節(jié)省數(shù)以億計(jì)的授權(quán)費(fèi)和版稅,而且具備了針對不同應(yīng)用場景靈活調(diào)整芯片架構(gòu)、調(diào)整硅面積的能力。龍芯現(xiàn)在選擇市場目標(biāo)的標(biāo)準(zhǔn)很簡單,我們就對標(biāo)芯片的硅面積:在相同工藝下,如果能實(shí)現(xiàn)硅面積縮小20%以上,就開發(fā)這款芯片,否則不做。
龍芯3C6000例如,龍芯3A6000桌面四核CPU的單核和多核性能分別比上一代產(chǎn)品3A5000提高60%和100%,但硅面積降低了20%。龍芯3C6000 16核服務(wù)器CPU的多核性能比上一代產(chǎn)品3C5000提高100%,硅面積降低了20%。3A6000和3C6000的性價(jià)比是上一代產(chǎn)品3A5000和3C5000的3倍。又如,近期龍芯在做一款激光打印機(jī)主控芯片。對標(biāo)芯片的硅面積約有二十幾平方毫米。如果我們沒有自研IP,那么就只能購買第三方設(shè)計(jì)的IP,其大小尺寸都固定了。但是我們自研IP,就可以按需改造和配置不同的接口、模塊等。例如,為了降低成本,我們把該芯片的內(nèi)存控制器硅面積從5平方毫米壓縮到1平方毫米左右,整個(gè)芯片的硅面積不超過10平方毫米。比亞迪的新能源汽車為什么能與特斯拉競爭,也是靠性價(jià)比優(yōu)勢。龍芯也得這么做。
胡春民:現(xiàn)在許多芯片公司都在瞄準(zhǔn)AI設(shè)計(jì)芯片,龍芯如何應(yīng)對AI帶來的市場需求?
胡偉武:在去年公司內(nèi)部的年終總結(jié)報(bào)告會上,我在2024年規(guī)劃部分提了一句口號:向AI進(jìn)軍。我們正在培育、發(fā)展適合AI市場需求的技術(shù)。如果把信息產(chǎn)業(yè)比作蓋樓,那么到現(xiàn)在為止的信息產(chǎn)業(yè)共蓋了“三層樓”,每層樓有兩大核心技術(shù)。第一層樓的兩大核心技術(shù)是CPU技術(shù)和操作系統(tǒng)技術(shù),第二層樓的兩大核心技術(shù)是網(wǎng)絡(luò)技術(shù)和圖形(含多媒體)技術(shù),第三層樓的兩大核心技術(shù)是虛擬化技術(shù)(云平臺的核心技術(shù))和智能化技術(shù)。龍芯耐著性子一層層地蓋,掌握了上述“三層樓”的六大關(guān)鍵核心技術(shù),現(xiàn)在蓋到第三層了。
龍芯自研的圖形處理器(GPU)已經(jīng)量產(chǎn),自研的包括圖形加速和AI加速功能的GPGPU已經(jīng)嵌入在龍芯2K3000 SOC中交付流片,并正在自研GPGPU專門芯片龍芯9A1000,它既是顯卡芯片又是AI加速卡芯片。龍芯自研了一種叫龍鏈(Loongson Coherent Link)的算力芯片間互連的技術(shù)。相較于PCIE,采用該技術(shù)可減少約一半的訪問延遲。隨著技術(shù)精進(jìn),我們還可以將延遲降得更低,大約降至PCIE的1/3左右。由于龍鏈具有后發(fā)優(yōu)勢,我們的協(xié)議比英偉達(dá)的NVLink更加簡潔高效。智能不是算出來的,而是連出來的。就像大腦中的單個(gè)神經(jīng)元不具有智能性,連接之后才產(chǎn)生了智能。
2024年起,龍芯中科開始結(jié)合龍架構(gòu)及自研的GPGPU芯片,發(fā)布支持OpenCL、SYCL等編程模型的算力基礎(chǔ)軟件,圍繞TensorFlow、PyTorch、PaddlePaddle等訓(xùn)練框架,ONNX Runtime、OpenVINO、NCNN等推理框架開展算力芯片和AI框架的生態(tài)建設(shè)工作。龍芯目前的AI生態(tài)建設(shè)主要面向具有推理功能的“具身智能”,主要應(yīng)用在各類無人終端上。在條件具備后再發(fā)展訓(xùn)練類AI生態(tài)。
胡春民:龍芯對市場前景持怎樣的發(fā)展預(yù)期?
胡偉武:我自己還是非常樂觀的。因?yàn)?,我國的信息產(chǎn)業(yè)不可能依靠x86和ARM,而龍芯是目前基于自主指令系統(tǒng)構(gòu)建自主信息技術(shù)體系和產(chǎn)業(yè)生態(tài)的唯一選手。當(dāng)前我國半導(dǎo)體產(chǎn)業(yè)正在脫虛向?qū)?。單純依靠資本支撐的創(chuàng)業(yè)企業(yè),將面臨經(jīng)營挑戰(zhàn)。而像龍芯這樣的企業(yè)在立穩(wěn)腳跟之后,會進(jìn)入良性增長期。
通過2001年以來的二十多年積累,龍芯已經(jīng)系統(tǒng)掌握了指令系統(tǒng)、CPU、操作系統(tǒng)的關(guān)鍵核心技術(shù),龍芯CPU的性能已經(jīng)達(dá)到世界先進(jìn)水平,并開始顯現(xiàn)出性價(jià)比的優(yōu)勢,龍架構(gòu)的軟件生態(tài)建設(shè)正在穩(wěn)步前進(jìn)。目標(biāo)已經(jīng)明確,道路已經(jīng)找到,我們只要保持定力,咬緊牙關(guān),長期堅(jiān)持,一定能建成獨(dú)立于x86和ARM的新型信息技術(shù)體系和產(chǎn)業(yè)生態(tài)。
作者丨許子皓編輯丨張心怡美編丨馬利亞監(jiān)制丨趙晨