加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專(zhuān)業(yè)用戶(hù)
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

百萬(wàn)倍加速:加速計(jì)算助力基因測(cè)序突破極限

2023/01/17
2005
閱讀需 11 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

自從生命的“密碼”—基因組被科學(xué)家破解以來(lái),人類(lèi)追求速度更快、成本更低的基因測(cè)序技術(shù)的腳步一直都在繼續(xù)。

在1月13日剛剛結(jié)束的摩根大通醫(yī)療健康大會(huì)上,NVIDIA發(fā)布了與初創(chuàng)公司 InstaDeep、慕尼黑工業(yè)大學(xué)(TUM)在基因組學(xué)大型語(yǔ)言模型方面的聯(lián)合研究成果。研究團(tuán)隊(duì)使用NVIDIA超級(jí)計(jì)算機(jī) Cambridge-1,在各種基因組數(shù)據(jù)集上,訓(xùn)練了參數(shù)規(guī)模從500M到2.5B不等的各種大型語(yǔ)言模型(LLM),經(jīng)過(guò)基因組學(xué)訓(xùn)練的大型語(yǔ)言模型可將應(yīng)用擴(kuò)展到大量基因組學(xué)任務(wù), 這些任務(wù)有助于了解DNA如何轉(zhuǎn)錄生成RNA和蛋白質(zhì),從而開(kāi)啟新的臨床應(yīng)用。

基因測(cè)序 夢(mèng)想照進(jìn)現(xiàn)實(shí)

作為人類(lèi)醫(yī)療技術(shù)發(fā)展的重要一步,基因測(cè)序可通過(guò)提取人體血液或唾液,對(duì)人類(lèi)的DNA、RNA、蛋白質(zhì)及代謝物進(jìn)行分析,從而鎖定個(gè)人病變基因,以診斷、預(yù)測(cè)或預(yù)防遺傳性疾病的發(fā)生?;蛱N(yùn)含了人類(lèi)諸多病癥的秘密,使人類(lèi)有機(jī)會(huì)盡早預(yù)防疾病,并多元化治療疾病。

2001年,被譽(yù)為生命科學(xué)“登月計(jì)劃”的“人類(lèi)基因組計(jì)劃”(HGP)歷時(shí)13年,耗資近30億美元,發(fā)布了首張人類(lèi)基因組草圖。此后二十年中,以數(shù)字生物學(xué)為基礎(chǔ)的基因組測(cè)序技術(shù)取得巨大進(jìn)步,將全基因組測(cè)序的成本逐步降低至不到1000美元。一時(shí)間,全球?qū)驕y(cè)序與分析的需求量出現(xiàn)暴漲。

加速計(jì)算突破基因分析算力瓶頸

隨著基因組測(cè)序和分析需求的激增,由此產(chǎn)生的數(shù)據(jù)也迎來(lái)爆發(fā)式增長(zhǎng)。過(guò)去十年間,基因測(cè)序的數(shù)據(jù)量平均每七個(gè)月就會(huì)翻一倍, 2025年全球測(cè)序能力預(yù)計(jì)將達(dá)到Zb級(jí)別,其中,僅人類(lèi)全基因組存儲(chǔ)的數(shù)據(jù)量就將達(dá)到每年2-40Eb。

要實(shí)現(xiàn)精準(zhǔn)醫(yī)療,就需要對(duì)大量基因數(shù)據(jù)做出精確的計(jì)算和分析,這意味著巨大的計(jì)算成本和時(shí)間。因此,必須有創(chuàng)新的技術(shù),打破全基因組測(cè)序數(shù)據(jù)醫(yī)療應(yīng)用的主要瓶頸,推動(dòng)行業(yè)進(jìn)一步向前發(fā)展。

基因組測(cè)序與分析屬于標(biāo)準(zhǔn)的計(jì)算密集型任務(wù),而GPU擅長(zhǎng)并行計(jì)算,可以將復(fù)雜計(jì)算問(wèn)題分解為很多小任務(wù),在多個(gè)CUDA內(nèi)核上同時(shí)運(yùn)行,從而大幅減少處理計(jì)算任務(wù)的時(shí)間,讓基因組測(cè)序分析的速度獲得大幅提升。NVIDIA以GPU為核心構(gòu)建出“全棧加速計(jì)算平臺(tái)”,與人工智能相結(jié)合,在全球包括基因測(cè)序在內(nèi)的多個(gè)領(lǐng)域掀起一場(chǎng)加速革命。

除了具有全球領(lǐng)先的硬件加速計(jì)算平臺(tái),NVIDIA還推出了基于GPU的基因測(cè)序分析加速軟件—— NVIDIA Clara Parabricks。Clara Parabricks是一款GPU加速的計(jì)算基因組學(xué)工具包,可提供多種生物信息學(xué)工具和功能,如序列比對(duì)、預(yù)處理和質(zhì)量指標(biāo)、變異檢測(cè)、UMI以及用于胚系、體細(xì)胞和RNA分析的端到端工作流程。與僅使用CPU的解決方案相比,Parabricks速度提升高達(dá)80倍,計(jì)算成本降低高達(dá)50%。借助Clara Parabricks和GPU,將深度學(xué)習(xí)的強(qiáng)大功能應(yīng)用到基因組分析,可為測(cè)序中心、臨床團(tuán)隊(duì)、基因組學(xué)研究人員以及新一代測(cè)序儀器開(kāi)發(fā)者提供快速準(zhǔn)確的分析,進(jìn)而助力更快速、更準(zhǔn)確的基因組學(xué)分析。

此外,為了更好地幫助科學(xué)家了解疾病,為患者找到治療方法,NVIDIA還推出了BioNeMo框架,用于訓(xùn)練和部署超算規(guī)模的大型生物分子語(yǔ)言模型。該大型語(yǔ)言模型框架可支持化學(xué)、蛋白質(zhì)、DNA和RNA數(shù)據(jù)格式,還可提供云API服務(wù),用于未來(lái)支持越來(lái)越多的預(yù)訓(xùn)練AI模型。

基因測(cè)序領(lǐng)域降本增效創(chuàng)造新記錄

在NVIDIA加速計(jì)算平臺(tái)、人工智能與基因測(cè)序?qū)I(yè)軟件的賦能下,來(lái)自全球的學(xué)研機(jī)構(gòu)、政府組織以及相關(guān)企業(yè),正在不斷突破基因測(cè)序與分析領(lǐng)域的速度與成本極限,創(chuàng)造出一項(xiàng)項(xiàng)新的記錄:

  • 斯坦福大學(xué)、NVIDIA、牛津納米孔科技公司、谷歌、貝勒醫(yī)學(xué)院和加州大學(xué)圣克魯茲分校的研究人員共同合作推出DNA測(cè)序技術(shù),實(shí)現(xiàn)了創(chuàng)紀(jì)錄的測(cè)序速度。該方案使用NVIDIA Clara Parabricks計(jì)算基因組學(xué)應(yīng)用框架,以及GPU加速版本的PEPPER-Margin-DeepVariant流程,在谷歌云上使用NVIDIA GPU加速堿基判定和變體識(shí)別,將基因診斷時(shí)間從數(shù)周縮短到5.2小時(shí),使醫(yī)生能夠快速判斷如何治療危重病人。
  • 麻省理工學(xué)院與哈佛大學(xué)旗下的博德研究所與NVIDIA合作,為擁有超過(guò)2.5萬(wàn)用戶(hù)的Terra云平臺(tái)提供快速分析海量醫(yī)療數(shù)據(jù)所需的AI能力和加速工具。通過(guò)GPU加速的NVIDIA Clara Parabricks工作流,可助力從事各種基因組數(shù)據(jù)分析的研究人員降本增效。在博德研究所的GATK最佳實(shí)踐——生殖細(xì)胞突變檢測(cè)分析流中,Parabricks在GPU上進(jìn)行分析的速度提高了24倍,而成本減半。
  • 阿里云與NVIDIA達(dá)成合作,成為國(guó)內(nèi)首家在基因分析平臺(tái)集成和部署NVIDIA Clara Parabricks的公有云廠商。Clara Parabricks為阿里云基因分析平臺(tái)的行業(yè)標(biāo)準(zhǔn)基因組分析工具包以及基因調(diào)用器等工具帶來(lái)了GPU加速,據(jù)測(cè)算用戶(hù)可以在30分鐘內(nèi)完成一個(gè)30x測(cè)序深度的全基因組分析,且與GATK的最佳實(shí)踐結(jié)果 99.99% 一致,而在過(guò)去基于 CPU環(huán)境中這項(xiàng)工作需要20多個(gè)小時(shí)才能完成,并且計(jì)算成本可降低40%-80%。
  • 普渡大學(xué)首席研究員Carpi博士和團(tuán)隊(duì)將Clara Parabricks的表現(xiàn)和瘧疾學(xué)界使用的鑒定變體和跟蹤瘧疾傳播的現(xiàn)有方法進(jìn)行了對(duì)比,并使用1000個(gè)瘧疾基因組監(jiān)測(cè)抗瘧藥物的耐藥性。與只使用CPU的傳統(tǒng)方式相比,基于GPU加速的Clara Parabricks分析速度提高了27倍,成本降低了5倍,同時(shí)準(zhǔn)確率達(dá)到 99.9%。
  • 圣路易斯華盛頓大學(xué)的Tychele Turner博士與團(tuán)隊(duì)使用基于GPU加速的Clara Parabricks開(kāi)發(fā)出一種快速基因組學(xué)工作流,用于在自閉癥患者中發(fā)現(xiàn)de novo 變異(DNVs)。通過(guò)將三重分析整合到 NVIDIA Clara Parabricks中,Turner博士將生成DNV初始分析的時(shí)間從原來(lái)的800 小時(shí)(在CPU上進(jìn)行)縮短至8.5小時(shí)(在GPU 上使用只有4個(gè)GPU的服務(wù)器),加快了100 倍。
  • 為推廣基因組醫(yī)學(xué)計(jì)劃,泰國(guó)國(guó)家生物庫(kù)采用NVIDIA DGX A100系統(tǒng)和NVIDIA Clara Parabricks來(lái)打造IT基礎(chǔ)設(shè)施,以加速基因組測(cè)序。加速方案將全基因組測(cè)序的數(shù)據(jù)處理時(shí)間縮短了4個(gè)月,每位用戶(hù)的處理時(shí)間也從30多個(gè)小時(shí)縮短到1到2小時(shí)。
  • 生物技術(shù)領(lǐng)軍企業(yè)Regeneron高通量測(cè)序中心與大規(guī)模的生物醫(yī)學(xué)數(shù)據(jù)庫(kù)和研究資源平臺(tái)英國(guó)生物樣本庫(kù)合作,在DNAnexus平臺(tái)上使用NVIDIA Clara Parabricks運(yùn)行分析對(duì)超過(guò)50萬(wàn)名生物庫(kù)參與者的外顯子組進(jìn)行了測(cè)序和分析,5分鐘內(nèi)完成了在32-vCPU機(jī)器上需要花費(fèi)一小時(shí)計(jì)算的全外顯子組分析,同時(shí)成本降低約40%。

憑借加速計(jì)算領(lǐng)域的全棧能力以及深耕行業(yè)所積累的專(zhuān)業(yè)知識(shí),NVIDIA現(xiàn)在已經(jīng)推出了智能計(jì)算平臺(tái)NVIDIA Clara,全面布局醫(yī)療健康行業(yè)。該平臺(tái)涵蓋了用于醫(yī)學(xué)影像的Clara Holoscan、基因組學(xué)的Clara Parabricks、患者監(jiān)控的Clara Guardian以及藥物研發(fā)的Clara Discovery,并可端到端部署至本地、嵌入式系統(tǒng)、邊緣以及云端等任何地方,助力行業(yè)實(shí)現(xiàn)無(wú)縫創(chuàng)新,加快實(shí)現(xiàn)精準(zhǔn)醫(yī)療的目標(biāo)。

無(wú)論是尖端醫(yī)學(xué)研究、大規(guī)?;蚪M分析還是日常應(yīng)用檢測(cè),NVIDIA Million-X百萬(wàn)倍計(jì)算性能飛躍的愿景已經(jīng)在基因測(cè)序的各個(gè)領(lǐng)域結(jié)出累累碩果,并將持續(xù)為人類(lèi)消除疾病、促進(jìn)健康做出貢獻(xiàn)。

英偉達(dá)

英偉達(dá)

NVIDIA(中國(guó)大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國(guó)跨國(guó)科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專(zhuān)注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司,致力于開(kāi)發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車(chē)等領(lǐng)域的計(jì)算解決方案提供支持。

NVIDIA(中國(guó)大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國(guó)跨國(guó)科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專(zhuān)注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司,致力于開(kāi)發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車(chē)等領(lǐng)域的計(jì)算解決方案提供支持。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜