加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專(zhuān)業(yè)用戶(hù)
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

12家AI芯片創(chuàng)企,盯上大模型生意

01/11 09:50
2467
閱讀需 13 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者 |??ZeR0,編輯?|??漠影

瞄準(zhǔn)AI大模型芯片,這12家創(chuàng)企憑什么?

芯東西1月10日?qǐng)?bào)道,談起生成式AI熱潮的受益者,沒(méi)有人能忽略英偉達(dá)。據(jù)The Information統(tǒng)計(jì),目前北美地區(qū)至少有12家AI芯片創(chuàng)企想從英偉達(dá)獨(dú)享的生成式AI算力紅利中分一杯羹。

▲12家AI芯片瞄準(zhǔn)大模型(芯東西根據(jù)The Information表格編譯整理)

這些創(chuàng)企創(chuàng)辦時(shí)間不超過(guò)8年,其中有5家都是2022年創(chuàng)辦的,有4家創(chuàng)始成員有谷歌背景。累計(jì)融資金額最高的Cerebras,早已憑晶圓級(jí)芯片聲名鵲起;成立相對(duì)較晚的5家創(chuàng)企,創(chuàng)始成員背景也各有千秋。

總的來(lái)看,這12家盯上生成式AI算力蛋糕的北美AI芯片創(chuàng)企,有的定位做訓(xùn)練,有的主攻推理,有些則更進(jìn)一步,將其產(chǎn)品定位瞄準(zhǔn)特定類(lèi)型的AI模型,如多數(shù)大模型的基礎(chǔ)Transformer。

這是一個(gè)高風(fēng)險(xiǎn)的游戲:這些關(guān)鍵選擇將決定初創(chuàng)公司是生存還是失敗。

推理一直是更受歡迎的選擇。因?yàn)楹芏嗫蛻?hù)使用或微調(diào)已經(jīng)被訓(xùn)練過(guò)的模型,而不是從頭開(kāi)始構(gòu)建一個(gè)新模型。而高推理成本正對(duì)包括OpenAI在內(nèi)的大模型及生成式AI公司們產(chǎn)生壓力。

d-MatrixEtched.ai、Extropic、SiMa.ai、Groq正在構(gòu)建專(zhuān)門(mén)用于某些模型架構(gòu)的芯片,如為OpenAI和Anthropic的大語(yǔ)言模型提供動(dòng)力的Transformer。這些公司認(rèn)為,專(zhuān)用芯片比英偉達(dá)、Cerebras、Lightmatter、Rain AI、Tenstorrent等的通用芯片更快、效率更高。

但芯片研發(fā)充滿(mǎn)挑戰(zhàn)與未知。這些創(chuàng)企的多數(shù)產(chǎn)品最早要到今年年底才會(huì)上市銷(xiāo)售。到那時(shí),Transformer可能已經(jīng)是舊新聞了。一些開(kāi)發(fā)人員已經(jīng)在測(cè)試像Mamba這樣的新模型架構(gòu)。

1、Cerebras

Cerebras成立于2016年。其核心產(chǎn)品是第二代晶圓級(jí)引擎WSE-2,將85萬(wàn)個(gè)核心打包到一個(gè)處理器上,并采用40GB超快片上SRAM和比傳統(tǒng)集群快幾個(gè)數(shù)量級(jí)的互聯(lián)技術(shù)。Cerebras官網(wǎng)將WSE-2稱(chēng)作是“地球上最快的AI芯片”。

Cerebras的創(chuàng)始成員中,CEO Andrew Feldman與CTO Gary Lauterbach曾分別是高帶寬微服務(wù)器先驅(qū)SeaMicro的CEO和CTO,首席架構(gòu)師Michael James曾任SeaMicro首席軟件架構(gòu)師。SeaMicro在2012年被AMD收購(gòu)。

多位OpenAI聯(lián)合創(chuàng)始人、Stripe前CTO、AMD前CTO兼總裁、Cadence前CEO等業(yè)界大佬都在其投資方陣容中。

2、Lightmatter

Lightmatter成立于2017年,創(chuàng)始團(tuán)隊(duì)來(lái)自麻省理工學(xué)院。其研發(fā)的Envise光電混合計(jì)算芯片能夠滿(mǎn)足訓(xùn)練大語(yǔ)言模型等任務(wù)的計(jì)算要求,并減少數(shù)據(jù)中心功耗與成本。

2023年11月,Lightmatter宣布獲得1.55億美元融資,投資方包括谷歌風(fēng)投等,這筆融資是其5月份C輪融資的延續(xù)。至此,Lightmatter累計(jì)融資額超過(guò)4.2億美元,估值達(dá)12億美元。

3、Tenstorrent

Tenstorrent成立于2016年,由AMD前嵌入式工程師Ivan Hamer、AMD前集成電路設(shè)計(jì)總監(jiān)Ljubisa Bajic和AMD前固件設(shè)計(jì)工程師Milos Trajkovic創(chuàng)辦。硅谷頂級(jí)芯片架構(gòu)師Jim Keller擔(dān)任Tenstorrent CEO。該公司累計(jì)融資額達(dá)3.85億美元,投資者包括三星、現(xiàn)代等,估值大約達(dá)到10億美元,躋身獨(dú)角獸企業(yè)之列。

這家AI芯片創(chuàng)企利用RISC-V和Chiplet技術(shù)打造可擴(kuò)展、高能效的AI芯片,目前有兩款機(jī)器學(xué)習(xí)處理器Grayskull和Black Hole,其更先進(jìn)的3nm AI芯片Grendel預(yù)計(jì)今年推出。4、GroqGroq成立于2016年年底,由多位前谷歌TPU開(kāi)發(fā)團(tuán)隊(duì)成員創(chuàng)辦。他們基于軟件定義硬件的思路,設(shè)計(jì)了一個(gè)張量流處理器TSP架構(gòu),旨在實(shí)現(xiàn)高性能、低延遲的AI加速。

這家創(chuàng)企主要研發(fā)云端AI推理芯片,累計(jì)融資額達(dá)到3.67億美元。去年Groq LPU加速器在Meta Llama 2 70B大語(yǔ)言模型上實(shí)現(xiàn)了每秒生成超過(guò)280個(gè)token的推理性能。

5、SiMa.ai

SiMa.ai成立于2018年。創(chuàng)始人兼CEO Krishna Rangasayee曾在全球最大FPGA芯片供應(yīng)商賽靈思工作了近20年。這家創(chuàng)企在2019年推出首款A(yù)I芯片組MLSoC,主要面向計(jì)算機(jī)視覺(jué)領(lǐng)域的推理計(jì)算。2023年6月,SiMa.ai稱(chēng)其第一代邊緣AI芯片已開(kāi)始量產(chǎn),正與制造、汽車(chē)、航空等行業(yè)的50多家客戶(hù)合作。

6、d-Matrix

d-Matrix成立于2019年,主要研發(fā)存內(nèi)計(jì)算AI芯片。官網(wǎng)宣稱(chēng)構(gòu)建了“世界上最高效的大規(guī)模AI推理平臺(tái)”,跑Llama 2 13B大語(yǔ)言模型的大規(guī)模推理速度“倍殺”H100和A100。

其最新數(shù)字存內(nèi)計(jì)算芯片Jayhawk II采用臺(tái)積電6nm制程和Chiplet D2D互連方案,可為生成式AI應(yīng)用推理任務(wù)提供支撐。該創(chuàng)企融資金額超過(guò)1.6億美元,投資方包括微軟、SK海力士等。微軟承諾今年將對(duì)其芯片進(jìn)行自用評(píng)估。d-Matrix預(yù)計(jì)兩年內(nèi)收入將達(dá)到7000萬(wàn)~7500萬(wàn)美元區(qū)間,并實(shí)現(xiàn)收支平衡。

7、Modular AI

Modular AI是這12家創(chuàng)企中唯一一家專(zhuān)注于軟件的公司,成立于2022年,致力于構(gòu)建出模塊化、可組合和分層架構(gòu)的AI基礎(chǔ)設(shè)施,包括打造編譯器、運(yùn)行時(shí)環(huán)境等,開(kāi)發(fā)出CUDA替代品。

這家創(chuàng)企在2023年8月獲得1億美元融資,投資方包括谷歌風(fēng)投。其CEO是LLVM之父Chris Lattner,曾在蘋(píng)果公司領(lǐng)導(dǎo)Swift編程語(yǔ)言的開(kāi)發(fā),后來(lái)與Modular首席產(chǎn)品官Tim Davis一起在谷歌工作,負(fù)責(zé)監(jiān)督AI產(chǎn)品開(kāi)發(fā)。

2023年5月,Modular AI首次舉辦發(fā)布會(huì),推出高效推理引擎和Mojo編程語(yǔ)言。其高效推理引擎可輕松將主流深度學(xué)習(xí)框架上的模型快速部署到服務(wù)器或邊緣設(shè)備上。Mojo編程語(yǔ)言無(wú)需C++和CUDA運(yùn)行環(huán)境,即可直接將類(lèi)似Python語(yǔ)言的代碼高效部署到芯片上運(yùn)行。

8、Rain AI

Rain AI成立于2017年,旨在解決使用傳統(tǒng)GPU訓(xùn)練和運(yùn)行機(jī)器學(xué)習(xí)的高成本問(wèn)題。OpenAI CEO Sam Altman、百度風(fēng)投都投資了這家公司。

其AI芯片設(shè)計(jì)理念受大腦啟發(fā)。早在2018年,Altman就看好Rain走得類(lèi)腦芯片路線(xiàn),以個(gè)人名義向Rain AI領(lǐng)投了一筆種子輪融資。第二年,OpenAI簽署一項(xiàng)不具有約束力的協(xié)議,計(jì)劃等Rain AI的芯片上市后斥資5100萬(wàn)美元采購(gòu)這些芯片,不過(guò)至今尚未采取后續(xù)措施。

Rain AI在2021年推出可訓(xùn)練的端到端模擬AI芯片的工作原型芯片,近期的AI芯片產(chǎn)品則采用數(shù)字存內(nèi)計(jì)算技術(shù)。截至目前,其累計(jì)融資金額約為4000萬(wàn)美元。

9、MatX

MatX成立于2022年,專(zhuān)注于面向大語(yǔ)言模型開(kāi)發(fā)更快的專(zhuān)用芯片,旨在設(shè)計(jì)出通用人工智能(AGI)的計(jì)算平臺(tái),比英偉達(dá)GPU等硬件更快、更省錢(qián)的芯片。其CEO Reiner Pope參與構(gòu)建谷歌PaLM模型,曾寫(xiě)出谷歌最快的推理軟件;CTO Mike Gunter曾參與谷歌TPU工作。

根據(jù)官網(wǎng)信息,MatX已獲得一些風(fēng)投機(jī)構(gòu)以及領(lǐng)先的大語(yǔ)言模型和AI研究人員的支持,但并未公布產(chǎn)品或融資額。

10、Etched.ai

Etched.ai成立于2022年10月,兩位創(chuàng)始人CEO Gavin Uberti和CTO Chris Zhu均在本科期間從哈佛休學(xué),想要研發(fā)一款能加速大語(yǔ)言模型的AI芯片“Sohu”。

通過(guò)在硬件層面集成Transformer架構(gòu)、配備144GB HBM3e顯存,Sohu芯片的推理性能將達(dá)到英偉達(dá)H100的10倍,單位價(jià)格將獲得140倍于H100的吞吐量性能。該芯片預(yù)計(jì)今年交付。

2023年6月,Etched.ai宣布獲得536萬(wàn)美元種子輪融資,投資方包括包括Ebay前CEO Devin Wenig。融資后其估值達(dá)到3400萬(wàn)美元。

11、Extropic

2023年的最后一個(gè)月,AI芯片創(chuàng)企Extropic宣布獲得1410萬(wàn)美元天使輪融資。這家創(chuàng)企成立于2022年,創(chuàng)始成員CEO Guillaume Verdon和CTO Trevor McCourt來(lái)自谷歌量子AI團(tuán)隊(duì)。Guillaume 被認(rèn)為是量子深度學(xué)習(xí)領(lǐng)域的先驅(qū)。

Extropic自稱(chēng)正在為物理世界中的生成式AI構(gòu)建終極基礎(chǔ),利用熱力學(xué)和信息的第一原理構(gòu)建人工智能超級(jí)計(jì)算機(jī)。目前,Extropic正在研發(fā)一款能運(yùn)行大語(yǔ)言模型的AI芯片。其芯片的核心部件是一種叫做熱力學(xué)邏輯門(mén)的微型裝置,利用了熱力學(xué)系統(tǒng)的能量轉(zhuǎn)換和信息處理功能把熱能等能量轉(zhuǎn)化為算力。

12、Tiny Corp

Tiny Corp成立于2022年5月,其創(chuàng)始人兼CEO是業(yè)界知名黑客“神奇小子”George Hotz,他也是自動(dòng)駕駛創(chuàng)企Comma AI的創(chuàng)始人。2023年5月,Tiny Corp獲得510萬(wàn)美元融資。

George Hotz認(rèn)為,創(chuàng)辦AI芯片公司的唯一途徑就是從軟件開(kāi)始,這家創(chuàng)業(yè)公司想要幫助開(kāi)發(fā)人員加快訓(xùn)練和運(yùn)行機(jī)器學(xué)習(xí)模型的過(guò)程。其首個(gè)項(xiàng)目是為AMD芯片構(gòu)建框架、運(yùn)行時(shí)和驅(qū)動(dòng)程序,短期目標(biāo)是使用tinygrad框架讓AMD支持MLPerf。

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
STM32F407ZGT6 1 STMicroelectronics High-performance foundation line, Arm Cortex-M4 core with DSP and FPU, 1 Mbyte of Flash memory, 168 MHz CPU, ART Accelerator, Ethernet, FSMC

ECAD模型

下載ECAD模型
$22.83 查看
STM32H743ZIT6 1 STMicroelectronics High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals

ECAD模型

下載ECAD模型
$22.21 查看
MK70FX512VMJ15 1 Freescale Semiconductor Kinetis K 32-bit MCU, ARM Cortex-M4 core, 512KB Flash, 150MHz, Graphics LCD, MAPBGA 256

ECAD模型

下載ECAD模型
$17.99 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜