作者 |??ZeR0,編輯?|??漠影
業(yè)界等待“英偉達(dá)替代者”。
一邊手握OpenAI CEO的逾百萬美元投資,一邊被OpenAI四年前就預(yù)訂了5100萬美元(折合超3.6億人民幣)訂單,還被美國政府以“國家安全”為由干涉融資交易,最近全球熱度最高的AI芯片創(chuàng)企可能非Rain AI莫屬了。
這家距離OpenAI舊金山總部不到1英里的芯片創(chuàng)企,根據(jù)投資者文件,預(yù)計最快本月流片新測試芯片,最早或于明年10月向客戶提供第一批硬件。在聯(lián)合創(chuàng)始人的描述中,Rain AI可能是“世界上最雄心勃勃的AI芯片公司”,其前沿技術(shù)非常“深奧優(yōu)雅”,能真正在基礎(chǔ)層面上解開人們對智能的理解。另據(jù)其官網(wǎng)介紹,Rain AI正在開發(fā)基于SRAM的數(shù)字存內(nèi)計算芯片。其投資陣容除了有熱度空前的OpenAI CEO外,還有百度風(fēng)投及多位聲名赫赫的業(yè)界大牛。前聯(lián)電董事長兼CEO胡國強、存內(nèi)計算領(lǐng)域?qū)<褹rijit Raychowdhury博士、OpenAI AI硬件專家斯科特·格雷,都是Rain AI的顧問。
存算一體專家、千芯科技董事長陳巍博士告訴芯東西,Rain AI的芯片設(shè)計有3大亮點值得關(guān)注:1)數(shù)字存內(nèi)邏輯架構(gòu),支持FP32精度;2)Block BF16格式,比標(biāo)準(zhǔn)BF16格式更高效、面積更?。?)(設(shè)計中)支持片上精調(diào)(Fine-tuning、LoRA),方便片上進(jìn)行實時訓(xùn)練。
另據(jù)美國科技雜志《連線》報道,Rain AI的首款芯片基于RISC-V開源指令集架構(gòu),面向包括手機、無人機/機器人、汽車在內(nèi)的邊緣計算設(shè)備,既能訓(xùn)練算法,又能在部署時運行。OpenAI計劃如何采用其芯片尚未可知。支持AI模型按需實時定制或“微調(diào)”的能力,可能是OpenAI對這款芯片感興趣的關(guān)鍵原因之一。The Information援引知情人士消息稱,OpenAI 對于使用這些功能來降低數(shù)據(jù)中心成本并將其模型部署在手機和手表等設(shè)備中感到非常興奮。在自身尚需大量輸血來維系模型訓(xùn)練和日常服務(wù)運營的情況下,OpenAI為何還愿意花費大量資金來支持創(chuàng)新AI芯片的供應(yīng)?這家創(chuàng)企到底什么來頭?它加緊研發(fā)的AI芯片又將憑借哪些核心技術(shù)來在日趨激烈的市場中競逐一席之地?
01.OpenAI CEO、百度風(fēng)投參投,要大降A(chǔ)I模型構(gòu)建成本
Rain AI成立于2017年,AI芯片設(shè)計理念受大腦啟發(fā),其2022年11月發(fā)表在國際頂級學(xué)術(shù)期刊Nature子刊Nature Electronics的論文顯示,與GPU上的反向傳播相比,通過與憶阻器硬件結(jié)合的類腦新算法,其研究成果可將訓(xùn)練神經(jīng)網(wǎng)絡(luò)的能效提高至超過10000倍。
論文地址:https://www.nature.com/articles/s41928-022-00869-w
值得一提的是,這項研究成果是與斯坦利·威廉合作完成的,而世界上第一個憶阻器正是由威廉團(tuán)隊于2008年在惠普制造出。早在2018年,OpenAI聯(lián)合創(chuàng)始人兼CEO阿爾特曼就看好Rain走得模仿人腦研發(fā)芯片路線,以個人名義向Rain AI領(lǐng)投了一筆種子輪融資,注資超過100萬美元。第二年,OpenAI簽署一項不具有約束力的協(xié)議,計劃等Rain AI的芯片上市后斥資5100萬美元采購這些芯片,不過至今尚未采取后續(xù)措施。
2021年,Rain AI推出可訓(xùn)練的端到端模擬AI芯片的工作原型芯片。阿爾特曼評價其神經(jīng)擬態(tài)方法“可以大大降低構(gòu)建強大AI模型的成本,并希望有一天能夠幫助實現(xiàn)真正的通用人工智能”。當(dāng)時Rain AI提出的長期使命是為AI提供真正的類腦芯片。除了阿爾特曼外,Rain AI還獲得了Facebook創(chuàng)始工程師杰夫·羅斯柴爾德、Cruise產(chǎn)品副總裁奧利弗·卡梅倫、Wayve AI創(chuàng)始人阿馬爾·沙阿、OpenAI研究工程師斯科特·格雷、Pioneer基金創(chuàng)始人丹尼爾·格羅斯等業(yè)界大牛的投資。據(jù)《連線》報道,百度風(fēng)投也參與其小額種子輪投資。
截至2022年2月,在獲得由沙特阿美旗下風(fēng)投基金Prosperity7 Ventures領(lǐng)投的2500萬美元A輪融資后,Rain AI估值為9000萬美元,融資總額達(dá)3300萬美元。投資者透露說這足以維持其到2025年的運營。不過在上周四,據(jù)外媒援引知情人士消息,美國海外投資委員會審查后,要求Prosperity7 Ventures出售Rain AI的股份,以避免中東悄悄獲取關(guān)鍵技術(shù)的更多信息。此前阿爾特曼被曝出為一家新的AI芯片企業(yè)奔走中東,擬籌資數(shù)十億美元,尚不清楚Rain AI是否參與其中。
02.兩位90后創(chuàng)始人,前聯(lián)電CEO當(dāng)顧問
目前Rain AI擁有近40名員工,今年悄然更換了CEO,其網(wǎng)站已經(jīng)將創(chuàng)始CEO戈登·威爾遜列為執(zhí)行顧問,曾是前頂級律師事務(wù)所Freshfields Bruckhaus Deringer律師的威廉·帕索則從首席運營官晉升為首席執(zhí)行官。
威爾遜上周四在領(lǐng)英發(fā)文證實了自己的退出。他分享了一些Rain AI創(chuàng)立的細(xì)節(jié)。
▲威爾遜在領(lǐng)英發(fā)文證實不再擔(dān)任Rain AI的CEO(圖源:領(lǐng)英網(wǎng))
Rain AI始于佛羅里達(dá)大學(xué),在那里,威爾遜遇到了另外兩位聯(lián)合創(chuàng)始人杰克·肯德爾(擔(dān)任CTO)和身為佛羅里達(dá)大學(xué)材料科學(xué)與工程教授的胡安·克勞迪奧·尼諾(擔(dān)任董事會成員)。
當(dāng)時肯德爾和威爾遜都只有25歲,沒有創(chuàng)辦公司的經(jīng)驗。在將新型芯片推向市場的路上,他們受到了來自行業(yè)人士的質(zhì)疑,最終在重重困難中堅持下來。其愿景是構(gòu)建一個在結(jié)構(gòu)和功能上都類似于大腦的芯片架構(gòu),為AI帶來新的可能,使數(shù)據(jù)中心具有可持續(xù)性,并使所有機器能獨立學(xué)習(xí)與適應(yīng)。根據(jù)威爾遜的描述,Rain AI的近期產(chǎn)品采用數(shù)字存內(nèi)計算技術(shù),將定義新的AI芯片市場,并擁有大規(guī)模顛覆現(xiàn)有市場的野心。Rain AI的員工們紛紛在威爾遜這篇領(lǐng)英文章下留言,表達(dá)對威爾遜的欣賞和祝愿。
▲部分Rain AI員工在威爾遜宣布卸任CEO的文章下評論(圖源:領(lǐng)英網(wǎng))
威爾遜雖然退出了,但會繼續(xù)以執(zhí)行顧問的身份盡可能幫助Rain AI,同時也將開展自己的新項目和冒險。
03.即將推出AI硬件,四大技術(shù)亮點拆解
從官網(wǎng)最新介紹來看,Rain AI的AI芯片旨在重新定義AI計算極限,“在速度、功率、面積、精度和成本之間提供了創(chuàng)紀(jì)錄的平衡”。目前Rain AI可提供用于定制SoC的數(shù)字存儲計算tile和軟件棧的IP授權(quán),即將推出硬件。其芯片設(shè)計方法有4個技術(shù)亮點:
1、數(shù)字存內(nèi)計算架構(gòu),支持FP32精度
與傳統(tǒng)存內(nèi)計算設(shè)計不同,Rain AI專有的D-IMC(數(shù)字存內(nèi)計算)核心可擴(kuò)展到大批量生產(chǎn),并支持訓(xùn)練和推理。當(dāng)與Rain AI的適當(dāng)量化算法相結(jié)合時,其AI芯片可支持FP32精度。陳巍告訴芯東西,目前僅Rain AI、D-Matrix、千芯科技等少數(shù)存算一體芯片企業(yè)能做到這一點,多數(shù)存內(nèi)計算架構(gòu)僅能支持到INT8。
2、Block BF16格式,無精度損失
在硬件中獲得高精度、以AI為中心的數(shù)據(jù)是AI訓(xùn)練和推理的核心挑戰(zhàn)。Rain AI的block brain浮點方案確保與FP32相比沒有精度損失,且比標(biāo)準(zhǔn)BF16格式更高效、面積更小。這在業(yè)界也很少見,千芯科技同樣在研相關(guān)技術(shù)。數(shù)字格式在電路級與其D-IMC核心共同設(shè)計,利用優(yōu)化的4位和8位矩陣乘法的巨大性能增益。其靈活的方法可確保在不同網(wǎng)絡(luò)上的廣泛適用性,為AI效率設(shè)定了新的標(biāo)準(zhǔn)。
3、開發(fā)RISC-V與D-IMC間專有互連
由于缺乏硬件支持,AI芯片經(jīng)常無法編譯工作負(fù)載。Rain AI利用RISC-V指令集架構(gòu)的功能,支持AI開發(fā)人員實現(xiàn)任何操作和編譯任何模型的靈活性。Rain AI開發(fā)了RISC-V和D-IMC核心之間的專有互連,通過平衡的流水線提供出色性能。
4、設(shè)計微調(diào)算法,實現(xiàn)片上實時訓(xùn)練
由于訓(xùn)練環(huán)境和部署環(huán)境不可避免的不匹配,AI模型經(jīng)常在部署時失敗。微調(diào)解決了這個問題,但需要設(shè)備支持高性能訓(xùn)練。Rain AI正在與硬件共同設(shè)計微調(diào)算法(例如LORA),以促進(jìn)在芯片上進(jìn)行高效的實時訓(xùn)練。據(jù)陳巍解讀,這一方法可能是Rain AI獨有的。
04.去年還在主打類腦計算,今年已轉(zhuǎn)向AI+存內(nèi)計算 ????
有意思的是,往前回溯到2022年2月,Rain AI的名字簡稱還是Rain Neuromorphics,旨在設(shè)計模仿大腦工作方式的芯片,并在其新聞稿中將神經(jīng)擬態(tài)(Neuromorphics)作為傳播重點。早在2021年,Rain就在臺積電180nm節(jié)點上流片了名為Cumulus的MN3測試芯片。該芯片采用CMOS架構(gòu),擁有10000個神經(jīng)元,以ReRAM作為憶阻元件并結(jié)合借鑒NAND閃存工藝的3D制造技術(shù),使ReRAM能擴(kuò)展到多層存儲器結(jié)構(gòu)。當(dāng)時Rain計劃其首批芯片將為視覺、語音、自然語言處理、推薦工作負(fù)載提供1.25億個INT8參數(shù),功耗低于50W,預(yù)計將于2024年提供樣品,2025年將芯片投入商業(yè)發(fā)貨。
在2022年A輪融資新聞稿中,Rain將其神經(jīng)擬態(tài)處理單元(NPU)稱作是世界上第一個端到端模擬、可訓(xùn)練的AI電路,是唯一結(jié)合了算法和硬件技術(shù)的根本性創(chuàng)新的AI模擬方法,在加快處理速度的同時能夠降低功耗。根據(jù)該新聞稿,模擬算法的實施使NPU的能效相較當(dāng)時最好的處理器高1000倍。NPU硬件架構(gòu)利用憶阻器將內(nèi)存和計算結(jié)合起來作為人工突觸,以稀疏模式覆蓋在神經(jīng)元電路的頂部,復(fù)制大腦的稀疏連接性,允許數(shù)千萬個人工神經(jīng)元在單個芯片上互連。另據(jù)Y Combinator官網(wǎng)對投資創(chuàng)企的介紹,Rain研發(fā)了一種新型AI芯片憶阻納米線神經(jīng)網(wǎng)絡(luò)(MN3,Memristive Nanowire Neural Network),該芯片每cm2可擁有超過1000萬個脈沖神經(jīng)元,功耗遠(yuǎn)低于傳統(tǒng)GPU和CPU。
MN3是由Rain AI聯(lián)合創(chuàng)始人尼諾于2014年在佛羅里達(dá)大學(xué)發(fā)明的,旨在實現(xiàn)模擬計算硬件的擴(kuò)展。不過,如今的Ran AI官網(wǎng),已經(jīng)是“All in AI”。從公司簡稱到產(chǎn)品、設(shè)計方法、團(tuán)隊的介紹,都只見“AI”、“存內(nèi)計算”、“RISC-V”這些關(guān)鍵詞,除了官網(wǎng)最底部的小字外幾乎對“神經(jīng)擬態(tài)”只字不提了。
05.結(jié)語:業(yè)界等待“英偉達(dá)替代者”
隨著生成式AI日趨火熱,稀缺的算力使得幾經(jīng)熱潮與降溫的AI芯片賽道再度成為AI產(chǎn)業(yè)的焦點。而無論是科技大廠還是AI創(chuàng)業(yè)公司,雖然在訓(xùn)練模型上都暫時離不開英偉達(dá)的芯片,但都在尋求與期待實現(xiàn)AI芯片多元化。
除了向Rain AI砸錢外,OpenAI CEO阿爾特曼還參與投資了赫赫有名的晶圓級芯片創(chuàng)企Cerebras和去年10月剛成立的芯片公司Atomic Semi。而Atomic Semi的聯(lián)合創(chuàng)始人之一正是叱咤半導(dǎo)體界的硅谷風(fēng)云人物“金坷垃”Jim Keller。???阿爾特曼參投的AI芯片創(chuàng)企Rain提供了一個有趣的案例,宣傳重心從基于ReRAM的類腦芯片悄然轉(zhuǎn)向基于SRAM的數(shù)字存內(nèi)計算芯片,原CEO變顧問、律師成芯片企業(yè)掌門人,產(chǎn)品尚未問世卻因為“國家安全”的原因被美國政府要求讓中東股東撤資……
一系列波折既給這家成立6年的AI芯片公司帶來了大量的關(guān)注度,也再度力證存算一體AI芯片的落地前景正被看好。從圖形芯片演化而出的GPGPU,是當(dāng)前AI訓(xùn)練芯片市場的寵兒,但并非唯一解。在降低模型訓(xùn)練與推理成本的道路上,業(yè)界還在持續(xù)探索實現(xiàn)高能效和高性能的芯片架構(gòu)的更多可能。
參考信源:Rain AI官網(wǎng)、《連線》、EE Times