加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

突發(fā):馬斯克Grok開源!

2024/03/18
2053
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者 |??云鵬,編輯?|??心緣

全球最大開源大模型!馬斯克Grok-1參數(shù)量3410億,正式開源。

6個(gè)月掏出3410億參數(shù)自研大模型,馬斯克說到做到!智東西3月18日消息,就在剛剛,馬斯克的AI創(chuàng)企xAI正式發(fā)布了此前備受期待大模型Grok-1,其參數(shù)量達(dá)到了3140億,遠(yuǎn)超OpenAI GPT-3.5的1750億。這是迄今參數(shù)量最大的開源大語言模型,遵照Apache 2.0協(xié)議開放模型權(quán)重和架構(gòu)。

Grok-1是一個(gè)混合專家(Mixture-of-Experts,MOE)大模型,這種MOE架構(gòu)重點(diǎn)在于提高大模型的訓(xùn)練和推理效率,形象地理解,MOE就像把各個(gè)領(lǐng)域的“專家”集合到了一起,遇到任務(wù)派發(fā)給不同領(lǐng)域的專家,最后匯總結(jié)論,提升效率。決定每個(gè)專家做什么的是被稱為“門控網(wǎng)絡(luò)”的機(jī)制。xAI已經(jīng)將Grok-1的權(quán)重和架構(gòu)在GitHub上開源。

GitHub地址:https://github.com/xai-org/grok-1?tab=readme-ov-file目前Grok-1的源權(quán)重?cái)?shù)據(jù)大小大約為300GB。截至北京時(shí)間3月18日上午7時(shí)許,Grok-1項(xiàng)目收獲了3400顆星。

Grok-1是馬斯克xAI自2023年7月12日成立以來發(fā)布的首個(gè)自研大模型。xAI特別強(qiáng)調(diào)說這是他們自己從頭訓(xùn)練的大模型。Grok-1沒有針對特定應(yīng)用進(jìn)行微調(diào)。

xAI是馬斯克去年剛剛成立的明星AI創(chuàng)企,其目的之一就是與OpenAI、谷歌、微軟等對手在大模型領(lǐng)域進(jìn)行競爭,其團(tuán)隊(duì)來自O(shè)penAI、谷歌DeepMind、谷歌研究院、微軟研究院等諸多知名企業(yè)和研究機(jī)構(gòu)。

此前馬斯克剛剛“怒噴”O(jiān)penAI不夠“Open”,后腳這就開源了自家的頂級3410億參數(shù)自研大模型Grok-1。雖然馬斯克在預(yù)熱到發(fā)布的過程中也“放了幾次鴿子”,但最終他并沒有食言。

今天,xAI還公布了Grok-1的更多細(xì)節(jié):基礎(chǔ)模型基于大量文本數(shù)據(jù)訓(xùn)練,未針對特定任務(wù)進(jìn)行微調(diào)。3140億參數(shù)的Mixture-of-Experts模型,其對于每個(gè)token,活躍權(quán)重比例為25%。xAI從2023年10月開始使用自定義訓(xùn)練堆棧在JAX和Rust之上從頭開始訓(xùn)練。

但此次xAI并沒有放出Grok-1的具體測試成績,其與OpenAI即將發(fā)布的GPT-5的大模型王者之戰(zhàn),必將成為業(yè)內(nèi)關(guān)注的焦點(diǎn)。當(dāng)然,馬斯克發(fā)大模型,怎么會少的了大佬隔空對線“互懟”?xAI官方消息剛剛發(fā)布,ChatGPT的官方賬號馬上就跟馬斯克在X平臺上進(jìn)行了互動,在Grok官方賬號評論下回復(fù)道:“偷了我的笑話?!?/p>

馬斯克自然不會示弱,馬上說請告訴我OpenAI“Open”之處在哪里。馬斯克高仿號也馬上跑過來添油加醋,說我們都知道是Sam在運(yùn)營ChatGPT的賬號。值得一提的是,此次xAI發(fā)布Grok-1消息的封面圖片,是由Midjourney生成,Grok給出了提示文本:一個(gè)神經(jīng)網(wǎng)絡(luò)的3D插圖,具有透明節(jié)點(diǎn)和發(fā)光連接,展示不同粗細(xì)和顏色的連接線的不同權(quán)重(A 3D illustration of a neural network, with transparent nodes and glowing connections, showcasing the varying weights as different thicknesses and colors of the connecting lines)。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險(xiǎn)等級 參考價(jià)格 更多信息
MK70FN1M0VMJ12R 1 Freescale Semiconductor 32-BIT, FLASH, 120MHz, RISC MICROCONTROLLER, PBGA256, 17 X 17 MM, MAPBGA-256
暫無數(shù)據(jù) 查看
ATXMEGA256A3BU-AU 1 Microchip Technology Inc IC MCU 8BIT 256KB FLASH 64TQFP

ECAD模型

下載ECAD模型
$8.44 查看
STM32F429NIH6 1 STMicroelectronics High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 2 Mbytes of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ART Accelerator, FMC with SDRAM, TFT

ECAD模型

下載ECAD模型
$15.65 查看

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄