過去的一年,國內(nèi)AI產(chǎn)業(yè)面臨巨大挑戰(zhàn),大算力AI芯片和板卡被“卡”,AI芯片軟件生態(tài)也面臨巨大困難。業(yè)界普遍認(rèn)為,除了美國英偉達(dá)等產(chǎn)品外,使用其他產(chǎn)品進(jìn)行大模型開發(fā)難度極大。
這種形勢其實(shí)也反映了市場需求的大幅增長和技術(shù)進(jìn)步的迫切需求。大模型尤其是多模態(tài)大模型的出現(xiàn),正在將AI帶到更多領(lǐng)域,對AI技術(shù)發(fā)展起到巨大的推動作用。
近期,英偉達(dá)“中國特供版”芯片遇冷的局面,也給國產(chǎn)AI芯片帶來更大的想象空間。國產(chǎn)AI芯片是否有望開啟新格局、并深遠(yuǎn)影響AI技術(shù)的發(fā)展?<與非網(wǎng)>對話AI明星企業(yè),探尋產(chǎn)業(yè)的關(guān)鍵動力和發(fā)展趨勢。
Imagination:AI SoC設(shè)計(jì)靈活性是關(guān)鍵
過去幾年,Transformer已經(jīng)取代傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)成為AI的首選,這在硬件方面產(chǎn)生了重大影響,尤其是對那些通常只針對少數(shù)算法優(yōu)化進(jìn)行定制的AI加速器。
這給硬件設(shè)計(jì)師帶來了挑戰(zhàn),他們往往希望能夠面向未來工作負(fù)載繼續(xù)進(jìn)行優(yōu)化。這在產(chǎn)品生命周期較長的市場中尤其明顯,例如在汽車行業(yè),隨著車輛連接性的增強(qiáng),汽車甚至可以在車載SoC設(shè)計(jì)后十年內(nèi)接收軟件更新。
Imagination副總裁、中國區(qū)總經(jīng)理劉國軍認(rèn)為,“鑒于AI軟件的持續(xù)進(jìn)化,將設(shè)計(jì)靈活性整合到SoC中可能比僅專注于固定功能性能更為理想?!?/p>
Imagination副總裁、中國區(qū)總經(jīng)理 劉國軍
行業(yè)呼喚芯片架構(gòu)突破“三角束縛”
后摩智能聯(lián)合創(chuàng)始人項(xiàng)之初談到,如何讓大模型更廣泛落地,形成商業(yè)閉環(huán),為大眾帶來經(jīng)濟(jì)價(jià)值和福祉,是需要進(jìn)一步探索的。從支撐大模型底層的算力芯片角度看,目前并沒有找到特別好的方案,能夠在性能、功耗、成本等方面都能滿足大模型在更廣泛場景的落地需求。
“顯然不能到處去部署大幾百瓦、幾萬美元一顆的GPU。所以我們需要更創(chuàng)新的芯片架構(gòu),去突破馮諾依曼架構(gòu)對算力、功耗、成本這個不可能三角的束縛”,項(xiàng)之初表示。
后摩智能聯(lián)合創(chuàng)始人 項(xiàng)之初
大模型不是“萬金油”,算力是關(guān)鍵
鯤云科技合伙人、COO王少軍博士認(rèn)為,2023年,國產(chǎn)大模型爆發(fā)式增長,但真正實(shí)現(xiàn)產(chǎn)業(yè)落地還需要時(shí)間。目前,許多行業(yè)仍然主要使用傳統(tǒng)的深度學(xué)習(xí)方法,如CV和NLP類算法。而新應(yīng)用場景更加具體化,AI技術(shù)需要與具體業(yè)務(wù)需求結(jié)合得更緊密。
他指出,AI企業(yè)不僅需要具備技術(shù)能力,還要與各行業(yè)合作,深入了解業(yè)務(wù)場景,才能真正發(fā)揮AI技術(shù)的實(shí)際作用。
在AI的發(fā)展過程中,如何將產(chǎn)品落地到實(shí)際場景一直是一個挑戰(zhàn),大模型能否改變這一現(xiàn)狀?王少軍表示,對于常規(guī)場景,大模型有望解決這一問題,但對于一些長尾、稀缺場景,大模型仍存在局限性。在他看來,算力才是大模型時(shí)代最基礎(chǔ)、優(yōu)先級最高的問題,如果沒有足夠的算力,其他技術(shù)得以有效應(yīng)用的基礎(chǔ)也不存在。
鯤云科技合伙人、COO 王少軍博士
全面突圍:多元芯片架構(gòu)+軟硬件生態(tài)
AI芯片競爭日趨激烈,而沿用原有技術(shù)路線、依靠先進(jìn)工藝來提升芯片性能,不論是從技術(shù)發(fā)展角度、還是在當(dāng)前的國際背景下,都變得越來越難。
“單純依賴芯片工藝并不能確保產(chǎn)業(yè)的持久發(fā)展,在國內(nèi)可控工藝條件下,通過架構(gòu)創(chuàng)新來實(shí)現(xiàn)性能更優(yōu)、性價(jià)比更高的芯片,應(yīng)該是國內(nèi)大多數(shù)芯片公司努力的方向”,王少軍談到,“只有當(dāng)產(chǎn)品性價(jià)比足夠高,滿足市場競爭需求時(shí),行業(yè)才算真正做好,從業(yè)者的能力才算真正提升。當(dāng)前,產(chǎn)業(yè)界應(yīng)該積極探索底層技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展的新路徑。數(shù)據(jù)流架構(gòu)就是一個備受關(guān)注的方向,國內(nèi)外一些大型公司也在致力于可重構(gòu)數(shù)據(jù)流的研究。這個方向具有廣泛的應(yīng)用場景,適用于云、邊、端各種場景?!?/p>
除了數(shù)據(jù)流架構(gòu),存算一體AI芯片架構(gòu)也被認(rèn)為有潛力承擔(dān)大模型時(shí)代的底層算力支撐。項(xiàng)之初表示,“存算一體作為一種新的芯片架構(gòu),需要資本、人才和社會資源的共同投入,促進(jìn)研發(fā)和落地,同時(shí)也需要更多的應(yīng)用機(jī)會進(jìn)行迭代?!?/p>
劉國軍認(rèn)為,隨著邊緣AI無處不在,對于那些要求快速響應(yīng)、高度安全或在網(wǎng)絡(luò)連接不穩(wěn)定的情況下運(yùn)行的應(yīng)用,直接在設(shè)備上處理AI工作負(fù)載的能力變得至關(guān)重要。并且,賦予AI芯片設(shè)計(jì)靈活性至關(guān)重要,特別是在邊緣設(shè)備有限的面積、內(nèi)存和功耗條件下。他介紹,Imagination GPU IP能以高性能和高效率處理計(jì)算工作負(fù)載,而且支持包括OpenCL在內(nèi)的常用API,具備高度可編程性。通過持續(xù)投資軟件領(lǐng)域,包括工具、庫、模型和驅(qū)動程序等,希望提供最優(yōu)的計(jì)算編程環(huán)境?!?a class="article-link" target="_blank" href="/e/1592241.html">人工智能的普及預(yù)計(jì)將主導(dǎo)半導(dǎo)體行業(yè)及Imagination未來的業(yè)務(wù)發(fā)展”,他補(bǔ)充道。
行業(yè)或?qū)⑾磁?,大模型持續(xù)進(jìn)化
千芯科技董事長陳巍認(rèn)為,大模型主要有以下四大趨勢:首先,大模型還會進(jìn)一步進(jìn)化。從目前看來,Transformer結(jié)構(gòu)雖好,但對于超長token生成時(shí),算力資源呈幾何級數(shù)增長,對于編程等長文的自動生成并不友好。有較大概率會有新的結(jié)構(gòu)替代,或者Transformer自己進(jìn)化,形成新一代的大模型基礎(chǔ)結(jié)構(gòu)。
千芯科技董事長 陳巍
第二,多模態(tài)大模型和混合專家(MoE)模型會逐漸成為新的主流模型。目前文本模態(tài)的大模型是主流,但隨著技術(shù)的進(jìn)步,多模態(tài)大模型會提供更多的功能、落地應(yīng)用。另外大模型的主體會逐漸演變到MoE模式,而這兩者都會對算力有更高要求。
第三,大模型逐漸具備自學(xué)習(xí)能力。目前的大模型訓(xùn)練還是離線的,這使得模型訓(xùn)練后就固化,難以隨著應(yīng)用場景自動適應(yīng)。預(yù)估1-2年,自適應(yīng)學(xué)習(xí)的大模型會逐漸進(jìn)入應(yīng)用領(lǐng)域,更好地服務(wù)人類社會。
第四,CUDA生態(tài)有一定概率被其他開源生態(tài)取代。目前來看,CUDA生態(tài)是主流,但由于CUDA編程模型本身是以緩存為中心的,與目前大模型的分層結(jié)構(gòu)有一定的調(diào)度矛盾。從這個角度看,現(xiàn)有的CUDA生態(tài)也是大模型算力發(fā)展的障礙。隨著微軟、Google、特斯拉等巨頭自研大模型芯片的進(jìn)度加快,預(yù)計(jì)這些巨頭也會協(xié)力推動新的并行硬件編程生態(tài)。
王少軍則從算力和大模型角度提出兩大值得關(guān)注的方向:一是推理的重要性,隨著大模型應(yīng)用在更多場景,推理將成為關(guān)鍵,需要關(guān)注推理芯片的計(jì)算訴求和系統(tǒng)要求,以降低成本并提高易用性,從而推動大模型在行業(yè)中的快速落地。二是大模型輕量化的趨勢,大模型走向輕量化、并且在邊緣和終端進(jìn)行部署,將成為值得關(guān)注的領(lǐng)域。
2023年10月,工業(yè)和信息化部等六部門印發(fā)了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計(jì)劃》,要求到2025年國內(nèi)算力達(dá)到300EFLOPS。其中,不僅包括云端算力,也強(qiáng)調(diào)了邊緣算力的協(xié)同發(fā)展?!斑@對于國產(chǎn)AI芯片企業(yè)來說是一個積極的信號,意味著存在巨大的市場和豐富的應(yīng)用場景。對于從業(yè)者來說,每個人都有機(jī)會在這個市場中分得一杯羹,為整個行業(yè)帶來利好”, 王少軍表示。
項(xiàng)之初認(rèn)為,雖然國內(nèi)AI產(chǎn)業(yè)目前是被客觀因素限制的狀態(tài),并沒有完全展示出應(yīng)有的潛力。但總體上看,因?yàn)辇嫶蟮膽?yīng)用場景和數(shù)據(jù)量,還是會讓中國成為全球唯二的AI產(chǎn)業(yè)市場,這個預(yù)期將會長期存在??傮w上,大模型的下沉、在更多垂直領(lǐng)域的落地,將會給行業(yè)帶來新的增長契機(jī),比如Transformer上車對自動駕駛的意義等趨勢都值得關(guān)注。
當(dāng)然,AI芯片未來一兩年還是會有很多挑戰(zhàn),比如資本市場過山車般的態(tài)度轉(zhuǎn)變,會讓很多暫時(shí)沒實(shí)現(xiàn)融資、前期擴(kuò)張又過于激進(jìn)的公司陷入困境。
“但硬幣總有另外一面,市場態(tài)度的轉(zhuǎn)冷,能夠讓芯片人才安靜下來,而不是頻繁跳槽抬高短期收入,這對行業(yè)的健康發(fā)展,對有長期價(jià)值的公司反而是好事”,項(xiàng)之初補(bǔ)充。
寫在最后
自去年10月,美國發(fā)布新規(guī)阻止英偉達(dá)向中國出售尖端AI芯片以來,英偉達(dá)陸續(xù)推出幾款“特供”芯片,以便在合規(guī)情況下繼續(xù)在中國的生意。
不過,幾家頭部云廠商近期表明,訂購的芯片數(shù)量遠(yuǎn)遠(yuǎn)少于原計(jì)劃購買的已被禁的高性能芯片。知情人士稱,一方面,這些云廠商將先進(jìn)半導(dǎo)體訂單轉(zhuǎn)移給了本土芯片公司;另一方面,他們也在更多依賴公司內(nèi)部開發(fā)的芯片。
短期來看,國產(chǎn)AI芯片與英偉達(dá)降級版芯片的性能差距在縮小,但論及中美芯片局勢實(shí)現(xiàn)逆轉(zhuǎn)還為時(shí)過早。正如幾位受訪人所指出,AI當(dāng)前面臨的形勢是極其復(fù)雜的,既需要底層技術(shù)的根本變革,也需要軟硬件生態(tài)、上下游供應(yīng)鏈的合力發(fā)展,同時(shí),也要充分看到AI大模型的發(fā)展方向,下沉到邊緣、端側(cè)是必然方向,也將給多元算力發(fā)展帶來全新機(jī)遇。