419电影网,真实国产乱子伦对白在线

作者 |??ZeR0，編輯?|??漠影

瞄準(zhǔn)AI大模型芯片，這12家創(chuàng)企憑什么？

芯東西1月10日?qǐng)?bào)道，談起生成式AI熱潮的受益者，沒(méi)有人能忽略英偉達(dá)。據(jù)The Information統(tǒng)計(jì)，目前北美地區(qū)至少有12家AI芯片創(chuàng)企想從英偉達(dá)獨(dú)享的生成式AI算力紅利中分一杯羹。

▲12家AI芯片瞄準(zhǔn)大模型（芯東西根據(jù)The Information表格編譯整理）

這些創(chuàng)企創(chuàng)辦時(shí)間不超過(guò)8年，其中有5家都是2022年創(chuàng)辦的，有4家創(chuàng)始成員有谷歌背景。累計(jì)融資金額最高的Cerebras，早已憑晶圓級(jí)芯片聲名鵲起；成立相對(duì)較晚的5家創(chuàng)企，創(chuàng)始成員背景也各有千秋。

總的來(lái)看，這12家盯上生成式AI算力蛋糕的北美AI芯片創(chuàng)企，有的定位做訓(xùn)練，有的主攻推理，有些則更進(jìn)一步，將其產(chǎn)品定位瞄準(zhǔn)特定類(lèi)型的AI模型，如多數(shù)大模型的基礎(chǔ)Transformer。

這是一個(gè)高風(fēng)險(xiǎn)的游戲：這些關(guān)鍵選擇將決定初創(chuàng)公司是生存還是失敗。

推理一直是更受歡迎的選擇。因?yàn)楹芏嗫蛻?hù)使用或微調(diào)已經(jīng)被訓(xùn)練過(guò)的模型，而不是從頭開(kāi)始構(gòu)建一個(gè)新模型。而高推理成本正對(duì)包括OpenAI在內(nèi)的大模型及生成式AI公司們產(chǎn)生壓力。

d-Matrix、Etched.ai、Extropic、SiMa.ai、Groq正在構(gòu)建專(zhuān)門(mén)用于某些模型架構(gòu)的芯片，如為OpenAI和Anthropic的大語(yǔ)言模型提供動(dòng)力的Transformer。這些公司認(rèn)為，專(zhuān)用芯片比英偉達(dá)、Cerebras、Lightmatter、Rain AI、Tenstorrent等的通用芯片更快、效率更高。

但芯片研發(fā)充滿(mǎn)挑戰(zhàn)與未知。這些創(chuàng)企的多數(shù)產(chǎn)品最早要到今年年底才會(huì)上市銷(xiāo)售。到那時(shí)，Transformer可能已經(jīng)是舊新聞了。一些開(kāi)發(fā)人員已經(jīng)在測(cè)試像Mamba這樣的新模型架構(gòu)。

1、Cerebras

Cerebras成立于2016年。其核心產(chǎn)品是第二代晶圓級(jí)引擎WSE-2，將85萬(wàn)個(gè)核心打包到一個(gè)處理器上，并采用40GB超快片上SRAM和比傳統(tǒng)集群快幾個(gè)數(shù)量級(jí)的互聯(lián)技術(shù)。Cerebras官網(wǎng)將WSE-2稱(chēng)作是“地球上最快的AI芯片”。

Cerebras的創(chuàng)始成員中，CEO Andrew Feldman與CTO Gary Lauterbach曾分別是高帶寬微服務(wù)器先驅(qū)SeaMicro的CEO和CTO，首席架構(gòu)師Michael James曾任SeaMicro首席軟件架構(gòu)師。SeaMicro在2012年被AMD收購(gòu)。

多位OpenAI聯(lián)合創(chuàng)始人、Stripe前CTO、AMD前CTO兼總裁、Cadence前CEO等業(yè)界大佬都在其投資方陣容中。

2、Lightmatter

Lightmatter成立于2017年，創(chuàng)始團(tuán)隊(duì)來(lái)自麻省理工學(xué)院。其研發(fā)的Envise光電混合計(jì)算芯片能夠滿(mǎn)足訓(xùn)練大語(yǔ)言模型等任務(wù)的計(jì)算要求，并減少數(shù)據(jù)中心功耗與成本。

2023年11月，Lightmatter宣布獲得1.55億美元融資，投資方包括谷歌風(fēng)投等，這筆融資是其5月份C輪融資的延續(xù)。至此，Lightmatter累計(jì)融資額超過(guò)4.2億美元，估值達(dá)12億美元。

3、Tenstorrent

Tenstorrent成立于2016年，由AMD前嵌入式工程師Ivan Hamer、AMD前集成電路設(shè)計(jì)總監(jiān)Ljubisa Bajic和AMD前固件設(shè)計(jì)工程師Milos Trajkovic創(chuàng)辦。硅谷頂級(jí)芯片架構(gòu)師Jim Keller擔(dān)任Tenstorrent CEO。該公司累計(jì)融資額達(dá)3.85億美元，投資者包括三星、現(xiàn)代等，估值大約達(dá)到10億美元，躋身獨(dú)角獸企業(yè)之列。

這家AI芯片創(chuàng)企利用RISC-V和Chiplet技術(shù)打造可擴(kuò)展、高能效的AI芯片，目前有兩款機(jī)器學(xué)習(xí)處理器Grayskull和Black Hole，其更先進(jìn)的3nm AI芯片Grendel預(yù)計(jì)今年推出。4、GroqGroq成立于2016年年底，由多位前谷歌TPU開(kāi)發(fā)團(tuán)隊(duì)成員創(chuàng)辦。他們基于軟件定義硬件的思路，設(shè)計(jì)了一個(gè)張量流處理器TSP架構(gòu)，旨在實(shí)現(xiàn)高性能、低延遲的AI加速。

這家創(chuàng)企主要研發(fā)云端AI推理芯片，累計(jì)融資額達(dá)到3.67億美元。去年Groq LPU加速器在Meta Llama 2 70B大語(yǔ)言模型上實(shí)現(xiàn)了每秒生成超過(guò)280個(gè)token的推理性能。

5、SiMa.ai

SiMa.ai成立于2018年。創(chuàng)始人兼CEO Krishna Rangasayee曾在全球最大FPGA芯片供應(yīng)商賽靈思工作了近20年。這家創(chuàng)企在2019年推出首款A(yù)I芯片組MLSoC，主要面向計(jì)算機(jī)視覺(jué)領(lǐng)域的推理計(jì)算。2023年6月，SiMa.ai稱(chēng)其第一代邊緣AI芯片已開(kāi)始量產(chǎn)，正與制造、汽車(chē)、航空等行業(yè)的50多家客戶(hù)合作。

6、d-Matrix

d-Matrix成立于2019年，主要研發(fā)存內(nèi)計(jì)算AI芯片。官網(wǎng)宣稱(chēng)構(gòu)建了“世界上最高效的大規(guī)模AI推理平臺(tái)”，跑Llama 2 13B大語(yǔ)言模型的大規(guī)模推理速度“倍殺”H100和A100。

其最新數(shù)字存內(nèi)計(jì)算芯片Jayhawk II采用臺(tái)積電6nm制程和Chiplet D2D互連方案，可為生成式AI應(yīng)用推理任務(wù)提供支撐。該創(chuàng)企融資金額超過(guò)1.6億美元，投資方包括微軟、SK海力士等。微軟承諾今年將對(duì)其芯片進(jìn)行自用評(píng)估。d-Matrix預(yù)計(jì)兩年內(nèi)收入將達(dá)到7000萬(wàn)~7500萬(wàn)美元區(qū)間，并實(shí)現(xiàn)收支平衡。

7、Modular AI

Modular AI是這12家創(chuàng)企中唯一一家專(zhuān)注于軟件的公司，成立于2022年，致力于構(gòu)建出模塊化、可組合和分層架構(gòu)的AI基礎(chǔ)設(shè)施，包括打造編譯器、運(yùn)行時(shí)環(huán)境等，開(kāi)發(fā)出CUDA替代品。

這家創(chuàng)企在2023年8月獲得1億美元融資，投資方包括谷歌風(fēng)投。其CEO是LLVM之父Chris Lattner，曾在蘋(píng)果公司領(lǐng)導(dǎo)Swift編程語(yǔ)言的開(kāi)發(fā)，后來(lái)與Modular首席產(chǎn)品官Tim Davis一起在谷歌工作，負(fù)責(zé)監(jiān)督AI產(chǎn)品開(kāi)發(fā)。

2023年5月，Modular AI首次舉辦發(fā)布會(huì)，推出高效推理引擎和Mojo編程語(yǔ)言。其高效推理引擎可輕松將主流深度學(xué)習(xí)框架上的模型快速部署到服務(wù)器或邊緣設(shè)備上。Mojo編程語(yǔ)言無(wú)需C++和CUDA運(yùn)行環(huán)境，即可直接將類(lèi)似Python語(yǔ)言的代碼高效部署到芯片上運(yùn)行。

8、Rain AI

Rain AI成立于2017年，旨在解決使用傳統(tǒng)GPU訓(xùn)練和運(yùn)行機(jī)器學(xué)習(xí)的高成本問(wèn)題。OpenAI CEO Sam Altman、百度風(fēng)投都投資了這家公司。

其AI芯片設(shè)計(jì)理念受大腦啟發(fā)。早在2018年，Altman就看好Rain走得類(lèi)腦芯片路線(xiàn)，以個(gè)人名義向Rain AI領(lǐng)投了一筆種子輪融資。第二年，OpenAI簽署一項(xiàng)不具有約束力的協(xié)議，計(jì)劃等Rain AI的芯片上市后斥資5100萬(wàn)美元采購(gòu)這些芯片，不過(guò)至今尚未采取后續(xù)措施。

Rain AI在2021年推出可訓(xùn)練的端到端模擬AI芯片的工作原型芯片，近期的AI芯片產(chǎn)品則采用數(shù)字存內(nèi)計(jì)算技術(shù)。截至目前，其累計(jì)融資金額約為4000萬(wàn)美元。

9、MatX

MatX成立于2022年，專(zhuān)注于面向大語(yǔ)言模型開(kāi)發(fā)更快的專(zhuān)用芯片，旨在設(shè)計(jì)出通用人工智能（AGI）的計(jì)算平臺(tái)，比英偉達(dá)GPU等硬件更快、更省錢(qián)的芯片。其CEO Reiner Pope參與構(gòu)建谷歌PaLM模型，曾寫(xiě)出谷歌最快的推理軟件；CTO Mike Gunter曾參與谷歌TPU工作。

根據(jù)官網(wǎng)信息，MatX已獲得一些風(fēng)投機(jī)構(gòu)以及領(lǐng)先的大語(yǔ)言模型和AI研究人員的支持，但并未公布產(chǎn)品或融資額。

10、Etched.ai

Etched.ai成立于2022年10月，兩位創(chuàng)始人CEO Gavin Uberti和CTO Chris Zhu均在本科期間從哈佛休學(xué)，想要研發(fā)一款能加速大語(yǔ)言模型的AI芯片“Sohu”。

通過(guò)在硬件層面集成Transformer架構(gòu)、配備144GB HBM3e顯存，Sohu芯片的推理性能將達(dá)到英偉達(dá)H100的10倍，單位價(jià)格將獲得140倍于H100的吞吐量性能。該芯片預(yù)計(jì)今年交付。

2023年6月，Etched.ai宣布獲得536萬(wàn)美元種子輪融資，投資方包括包括Ebay前CEO Devin Wenig。融資后其估值達(dá)到3400萬(wàn)美元。

11、Extropic

2023年的最后一個(gè)月，AI芯片創(chuàng)企Extropic宣布獲得1410萬(wàn)美元天使輪融資。這家創(chuàng)企成立于2022年，創(chuàng)始成員CEO Guillaume Verdon和CTO Trevor McCourt來(lái)自谷歌量子AI團(tuán)隊(duì)。Guillaume 被認(rèn)為是量子深度學(xué)習(xí)領(lǐng)域的先驅(qū)。

Extropic自稱(chēng)正在為物理世界中的生成式AI構(gòu)建終極基礎(chǔ)，利用熱力學(xué)和信息的第一原理構(gòu)建人工智能超級(jí)計(jì)算機(jī)。目前，Extropic正在研發(fā)一款能運(yùn)行大語(yǔ)言模型的AI芯片。其芯片的核心部件是一種叫做熱力學(xué)邏輯門(mén)的微型裝置，利用了熱力學(xué)系統(tǒng)的能量轉(zhuǎn)換和信息處理功能把熱能等能量轉(zhuǎn)化為算力。

12、Tiny Corp

Tiny Corp成立于2022年5月，其創(chuàng)始人兼CEO是業(yè)界知名黑客“神奇小子”George Hotz，他也是自動(dòng)駕駛創(chuàng)企Comma AI的創(chuàng)始人。2023年5月，Tiny Corp獲得510萬(wàn)美元融資。

George Hotz認(rèn)為，創(chuàng)辦AI芯片公司的唯一途徑就是從軟件開(kāi)始，這家創(chuàng)業(yè)公司想要幫助開(kāi)發(fā)人員加快訓(xùn)練和運(yùn)行機(jī)器學(xué)習(xí)模型的過(guò)程。其首個(gè)項(xiàng)目是為AMD芯片構(gòu)建框架、運(yùn)行時(shí)和驅(qū)動(dòng)程序，短期目標(biāo)是使用tinygrad框架讓AMD支持MLPerf。

器件型號(hào)	數(shù)量	器件廠商	器件描述	ECAD模型	參考價(jià)格	更多信息
STM32F407ZGT6	1	STMicroelectronics	High-performance foundation line, Arm Cortex-M4 core with DSP and FPU, 1 Mbyte of Flash memory, 168 MHz CPU, ART Accelerator, Ethernet, FSMC	ECAD模型下載ECAD模型	$22.83	查看
STM32H743ZIT6	1	STMicroelectronics	High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals	ECAD模型下載ECAD模型	$22.21	查看
MK70FX512VMJ15	1	Freescale Semiconductor	Kinetis K 32-bit MCU, ARM Cortex-M4 core, 512KB Flash, 150MHz, Graphics LCD, MAPBGA 256	ECAD模型下載ECAD模型	$17.99	查看

器件型號(hào)

數(shù)量

器件廠商

器件描述

數(shù)據(jù)手冊(cè)

ECAD模型

風(fēng)險(xiǎn)等級(jí)

參考價(jià)格

更多信息

STM32F407ZGT6

STMicroelectronics

High-performance foundation line, Arm Cortex-M4 core with DSP and FPU, 1 Mbyte of Flash memory, 168 MHz CPU, ART Accelerator, Ethernet, FSMC

$22.83

查看

STM32H743ZIT6

STMicroelectronics

High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals