NVIDIA 于今日發(fā)布兩項全新大型語言模型(LLM)云 AI 服務——NVIDIA NeMo 大型語言模型服務和 NVIDIA BioNeMo LLM 服務,使開發(fā)者能夠輕松調(diào)整 LLM 并部署定制的 AI 應用程序,其可用于內(nèi)容生成、文本摘要、聊天機器人、代碼開發(fā),以及蛋白質(zhì)結構和生物分子特性預測等。
通過 NeMo LLM 服務,開發(fā)者能夠在 NVIDIA 管理的基礎設施上使用被稱為提示學習的訓練方法快速定制多個預訓練基礎模型。NVIDIA BioNeMo 服務是云應用程序編程接口(API),它可以將 LLM 用例擴展到語言以外的科學應用中,加快制藥和生物技術公司的藥物研發(fā)速度。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示: “大型語言模型具有改變每個行業(yè)的潛力。通過對基礎模型進行調(diào)整,可將 LLM 的力量帶給數(shù)百萬的開發(fā)者,讓他們無需重新構建龐大的模型,即可創(chuàng)建各種語言服務并推動科學發(fā)現(xiàn)?!?/p>
NeMo LLM 服務通過提示學習提高準確性,加快部署速度
借助 NeMo LLM 服務,開發(fā)者可以使用自己的訓練數(shù)據(jù)定制基礎模型——從 30 億個參數(shù)到世界上最大的 LLM 之一 Megatron 530B。與從頭開始訓練模型所需的數(shù)周或數(shù)月相比,該過程只需幾分鐘到幾小時。
提示學習是使用一種名為 P-tuning 的技術來定制模型,使開發(fā)者只需使用幾百個示例就能快速定制最初需要使用數(shù)十億個數(shù)據(jù)點訓練的基礎模型。定制流程生成任務專屬的提示標記,這些標記會與基礎模型相結合,為特定用例提供更高的準確性和更相關的響應。
開發(fā)者可以使用同一模型定制多個用例并生成許多不同的 Prompt Token。游樂場功能提供可以輕松實驗并與模型互動的無代碼選項,進一步提高了 LLM 對行業(yè)特定用例的有效性和可及性。
一旦準備好部署,經(jīng)過調(diào)整的模型即可在云實例、本地系統(tǒng)上或通過 API 運行。
BioNeMo LLM 服務使研究人員能夠充分利用大規(guī)模模型的力量
BioNeMo LLM 服務包括兩個用于化學和生物學應用的新 BioNeMo 語言模型。該服務提供蛋白質(zhì)、DNA 和生物化學數(shù)據(jù)方面的支持,幫助研究人員發(fā)現(xiàn)生物序列中的模式和洞察。
BioNeMo 使研究人員能夠利用包含數(shù)十億個參數(shù)的模型來擴大研究范圍。這些大型模型可以儲存更多關于蛋白質(zhì)結構、基因間進化關系的信息,甚至可以生成用于治療的新型生物分子。
? ? ?
云 API 提供對 Megatron 530B 和其他現(xiàn)成模型的訪問
除了調(diào)整基礎模型之外,LLM 服務還提供通過云 API 使用現(xiàn)成和定制模型的選項。
? ? ?
這讓開發(fā)者可以訪問包括 Megatron 530B 在內(nèi)的各種預訓練 LLM,以及使用 NVIDIA NeMo Megatron 框架創(chuàng)建的 T5 和 GPT-3 模型。NVIDIA NeMo Megatron 框架現(xiàn)已進入公測階段,可支持各種應用和多語言服務需求。 ? ??
汽車、計算、教育、醫(yī)療、電信等行業(yè)的領導者正在使用 NeMo Megatron 為客戶提供中文、英語、韓語、瑞典語等語言的領先服務。
供貨情況
NeMo LLM 和 BioNeMo 服務以及云 API 預計將在下個月開放搶先體驗,開發(fā)者現(xiàn)在就可以申請并了解詳情。
現(xiàn)在可以從 NVIDIA NGC? 獲得 NeMo Megatron 框架的公測版,并且該框架在優(yōu)化后,可在 NVIDIA DGX? Foundry 和 NVIDIA DGX SuperPOD? 以及 Amazon Web Services、Microsoft Azure 和 Oracle Cloud Infrastructure 的加速云實例上運行。
想要體驗 NeMo Megatron 框架的開發(fā)者可以免費試用 NVIDIA LaunchPad 實驗室。
關注黃仁勛在 GTC 2022 上的主題演講,進一步了解 NVIDIA AI 驅(qū)動的大型語言模型。