全球市場(chǎng)環(huán)境的不確定性讓科技巨頭紛紛坐上“過山車”。
過去一年,NVIDIA市值一度沖頂8600億美元。而今年以來,它卻一路面臨股價(jià)大跌、市值縮水,二季度財(cái)報(bào)顯示營(yíng)收環(huán)比下滑19%。雪上加霜的是,剛一進(jìn)入9月,兩款數(shù)據(jù)中心GPU遭遇“許可限制”。 NVIDIA在第三財(cái)季的展望中預(yù)計(jì),最新的許可要求可能會(huì)影響它在中國(guó)市場(chǎng)約4億美元的潛在收入……
外部環(huán)境方面也不容樂觀,全球半導(dǎo)體供應(yīng)鏈正面臨著極限拉扯、大國(guó)競(jìng)爭(zhēng)加劇的挑戰(zhàn)。并且,對(duì)NVIDIA發(fā)展極為重要的中國(guó)市場(chǎng),本土創(chuàng)業(yè)公司也正以洶洶來勢(shì)持續(xù)發(fā)起挑戰(zhàn)……
這一切都讓人更為關(guān)注,多重承壓的NVIDIA,如何繼續(xù)捍衛(wèi)算力王座?又將如何布局未來市場(chǎng)?
剛剛結(jié)束不久的GTC,顯現(xiàn)出了NVIDIA的清晰戰(zhàn)略。昔日的“游戲公司”,今日的“AI算力之王”、“元宇宙算力之王”……剝離一個(gè)個(gè)標(biāo)簽后,其實(shí)會(huì)發(fā)現(xiàn)這么多年來,長(zhǎng)期主義者NVIDIA一直在堅(jiān)持一件事——就是圍繞GPU的全棧布局,所不同的只是面向游戲、數(shù)據(jù)中心、元宇宙、汽車等場(chǎng)景變革需求的因時(shí)而動(dòng)。
云端算力“新標(biāo)桿”
今年二季度財(cái)報(bào)中,NVIDIA的數(shù)據(jù)中心業(yè)務(wù)營(yíng)收同比增長(zhǎng)61%至38.1億美元,高于游戲業(yè)務(wù)營(yíng)收的20.4億美元,數(shù)據(jù)中心終于取代游戲業(yè)務(wù)成為了英偉達(dá)最大的營(yíng)收來源。而隨著英偉達(dá)在數(shù)據(jù)中心領(lǐng)域的持續(xù)擴(kuò)張,該業(yè)務(wù)營(yíng)收有望持續(xù)迎來強(qiáng)勁增長(zhǎng)。
值得關(guān)注的是,NVIDIA在GTC上宣布H100 Tensor Core GPU 全面投產(chǎn),且NVIDIA 全球技術(shù)合作伙伴計(jì)劃于10月推出首批基于Hopper架構(gòu)的產(chǎn)品和服務(wù)。
基于Hopper架構(gòu)和 Transformer 引擎,以及包括第二代多實(shí)例 GPU、機(jī)密計(jì)算、第四代 NVIDIA NVLink 和 DPX 指令等若干關(guān)鍵性創(chuàng)新,都讓NVIDIA最新的GPU產(chǎn)品如虎添翼,實(shí)現(xiàn)了 NVIDIA 加速計(jì)算數(shù)據(jù)中心平臺(tái)的又一次飛躍。相較于上一代,在提供相同 AI 性能的情況下,H100可將能效提高 3.5 倍,總體擁有成本減少至 1/3,所使用的服務(wù)器節(jié)點(diǎn)數(shù)也減少至 1/5,使企業(yè)大大削減 AI 的部署成本。
據(jù)了解,到今年年底將有超過50款搭載H100的服務(wù)器型號(hào)面市,2023 年上半年還將有數(shù)十款型號(hào)面市。此外,數(shù)家全球領(lǐng)先的高等教育和研究機(jī)構(gòu)的新一代超級(jí)計(jì)算機(jī)也將采用 H100。在云端市場(chǎng),AWS、谷歌云、Microsoft Azure、Oracle Cloud Infrastructure 將從明年開始率先在云端部署基于 H100 的實(shí)例。
從這些市場(chǎng)跟進(jìn)中不難發(fā)現(xiàn),Hopper 作為AI 工廠的全新引擎,正在掀起新的應(yīng)用熱潮,這對(duì)于正在大規(guī)模落地的AI應(yīng)用來說,具有積極的推動(dòng)作用。在大數(shù)據(jù)與云計(jì)算重要性日益突顯的情況下,H100沒有道理不受市場(chǎng)熱捧,有望進(jìn)一步帶動(dòng)數(shù)據(jù)中心業(yè)務(wù)的長(zhǎng)線增長(zhǎng)。
汽車業(yè)務(wù)迎來“拐點(diǎn)”
NVIDIA一直非??春?a class="article-link" target="_blank" href="/tag/%E8%87%AA%E5%8A%A8%E9%A9%BE%E9%A9%B6/">自動(dòng)駕駛業(yè)務(wù),今年3月份,它預(yù)計(jì)未來六年汽車業(yè)務(wù)的營(yíng)收將高達(dá)110億美元以上。從GTC最新的產(chǎn)品進(jìn)展和市場(chǎng)布局來看,汽車業(yè)務(wù)確實(shí)很有可能成為NVIDIA的下一個(gè)主要增長(zhǎng)引擎。
最新推出的新一代集中式車載計(jì)算平臺(tái) NVIDIA DRIVE Thor,可實(shí)現(xiàn)最高2000 TOPS AI算力以及2000 TFLOPS 浮點(diǎn)算力,可以將包括自動(dòng)駕駛和輔助駕駛、泊車、駕乘人員監(jiān)控、數(shù)字儀表板、車載信息娛樂(IVI)、后座娛樂功能等智能功能,統(tǒng)一整合到單個(gè)架構(gòu)中,從而提高效率并降低整體系統(tǒng)的運(yùn)行能耗。“DRIVE Thor 是集中式計(jì)算領(lǐng)域的超級(jí)英雄,能夠?yàn)?a class="article-link" target="_blank" href="/tag/%E8%87%AA%E5%8A%A8%E9%A9%BE%E9%A9%B6%E6%B1%BD%E8%BD%A6/">自動(dòng)駕駛汽車帶來可持續(xù)升級(jí)且安全的軟件定義超級(jí)計(jì)算機(jī)”,黃仁勛表示。
據(jù)了解,DRIVE Thor 是首個(gè)集成推理Transformer引擎的自動(dòng)駕駛汽車平臺(tái),該引擎是 NVIDIA GPU 中 Tensor Core 的新組件。借助該引擎,DRIVE Thor 可將 Transformer 深度神經(jīng)網(wǎng)絡(luò)的推理性能提升高達(dá) 9 倍,這對(duì)于支持與自動(dòng)駕駛相關(guān)的、龐大且復(fù)雜的 AI 工作負(fù)載至關(guān)重要。
從NVIDIA內(nèi)部產(chǎn)品的更迭來看,DRIVE Thor其實(shí)是取代了 NVIDIA DRIVE Atlan,并將逐漸接替DRIVE Orin(現(xiàn)已量產(chǎn),性能為254TOPS)。這一超級(jí)芯片將于 2025 年量產(chǎn)上車,屆時(shí),行業(yè)將加速轉(zhuǎn)向具有集中式電子架構(gòu)的軟件定義車輛,有望為汽車用戶帶來更好的體驗(yàn),也為NVIDIA帶來可觀的新收入來源。
云端Omniverse連接全球元宇宙
AI 和元宇宙技術(shù)正在重塑經(jīng)濟(jì)基礎(chǔ),顯然也是NVIDIA這兩年布局的重點(diǎn)。元宇宙方面,繼推出專注于實(shí)時(shí)仿真、數(shù)字協(xié)作的云平臺(tái)Omniverse之后,NVIDIA除了繼續(xù)優(yōu)化其擁有高度逼真的物理模擬引擎以及高性能渲染能力,同時(shí)也在不斷將NVIDIA AI和Omniverse服務(wù)的擴(kuò)展組合推到云中運(yùn)行,以提供方便的訪問和擴(kuò)展性。
GTC上,NVIDIA宣布了它的首款軟件加基礎(chǔ)設(shè)施即服務(wù)產(chǎn)品——NVIDIA Omniverse Cloud,便于用戶在任何地點(diǎn)使用這套綜合、全面的云服務(wù),來設(shè)計(jì)、發(fā)布、運(yùn)行和體驗(yàn)元宇宙應(yīng)用。在無需任何本地算力的情況下,個(gè)人和團(tuán)隊(duì)可借助 Omniverse Cloud,一鍵體驗(yàn) 3D 工作流的設(shè)計(jì)與協(xié)作能力,并可連接世界各地的團(tuán)隊(duì),共同設(shè)計(jì)、構(gòu)建和運(yùn)行虛擬世界和數(shù)字孿生。
此外,為了給大規(guī)模數(shù)字孿生提供計(jì)算系統(tǒng)支持,NVIDIA于今年 3 月推出了 NVIDIA OVX。而GTC推出的第二代 NVIDIA OVX,則采用NVIDIA Ada Lovelace GPU 架構(gòu)和新升級(jí)的網(wǎng)絡(luò)技術(shù),具有開創(chuàng)性的實(shí)時(shí)圖形、AI 和數(shù)字孿生性能,旨在助力運(yùn)用領(lǐng)先的3D軟件來構(gòu)建 3D 虛擬世界,并且支持在 NVIDIA Omniverse Enterprise(一個(gè)能支持企業(yè)構(gòu)建并運(yùn)行元宇宙應(yīng)用的可擴(kuò)展端到端平臺(tái))中運(yùn)行沉浸式數(shù)字孿生。
對(duì)于行業(yè)應(yīng)用來說,元宇宙的必經(jīng)之路就是實(shí)現(xiàn)大規(guī)模的數(shù)字孿生,它甚至重新定義了這些行業(yè)在物理世界中的規(guī)劃、設(shè)計(jì)和構(gòu)建方式。
在這一過程中,堅(jiān)實(shí)的算力支持必不可少,特別是對(duì)于工廠、建筑乃至整座城市等復(fù)雜數(shù)字孿生來說,NVIDIA OVX進(jìn)一步為元宇宙中的圖形處理和模擬打下了堅(jiān)實(shí)基礎(chǔ)。據(jù)了解,技嘉科技、新華三、浪潮、聯(lián)想、廣達(dá)和超微將提供 OVX 系統(tǒng),寶馬集團(tuán)和捷豹路虎將成為 OVX 系統(tǒng)的首批客戶。
大型語(yǔ)言模型持續(xù)釋放“魔力”
深耕AI數(shù)年,NVIDIA已經(jīng)參透了大型語(yǔ)言模型的“魔力”,認(rèn)為它具有改變每個(gè)行業(yè)的潛力,通過對(duì)基礎(chǔ)模型進(jìn)行調(diào)整,可將大型語(yǔ)言模型的力量帶給數(shù)百萬(wàn)的開發(fā)者,讓他們無需重新構(gòu)建龐大的模型,即可創(chuàng)建各種語(yǔ)言服務(wù)并推動(dòng)科學(xué)發(fā)現(xiàn)。
GTC上最新發(fā)布的兩項(xiàng)大型語(yǔ)言模型(LLM)云AI 服務(wù)——NVIDIA NeMo 大型語(yǔ)言模型服務(wù)和 NVIDIA BioNeMo LLM 服務(wù),使開發(fā)者能夠輕松調(diào)整LLM并部署定制的AI應(yīng)用程序,可用于內(nèi)容生成、文本摘要、聊天機(jī)器人、代碼開發(fā),以及蛋白質(zhì)結(jié)構(gòu)和生物分子特性預(yù)測(cè)等。
借助 NeMo LLM 服務(wù),開發(fā)者可以使用自己的訓(xùn)練數(shù)據(jù)定制基礎(chǔ)模型——從 30 億個(gè)參數(shù)到世界上最大的LLM之一Megatron 530B。與從頭開始訓(xùn)練模型所需的數(shù)周或數(shù)月相比,該過程只需幾分鐘到幾小時(shí)。
NVIDIA BioNeMo 服務(wù)則是云應(yīng)用程序編程接口(API),它可以將LLM用例擴(kuò)展到語(yǔ)言以外的科學(xué)應(yīng)用中,加快制藥和生物技術(shù)公司的藥物研發(fā)速度。BioNeMo LLM 服務(wù)包括兩個(gè)用于化學(xué)和生物學(xué)應(yīng)用的新BioNeMo語(yǔ)言模型,該服務(wù)提供蛋白質(zhì)、DNA 和化學(xué)數(shù)據(jù)方面的支持,幫助研究人員發(fā)現(xiàn)生物序列中的模式和洞察。這些大型模型可以儲(chǔ)存更多關(guān)于蛋白質(zhì)結(jié)構(gòu)、基因間進(jìn)化關(guān)系的信息,甚至可以生成用于治療的新型生物分子。
以上應(yīng)用不僅是NVIDIA在大型語(yǔ)言模型領(lǐng)域的重大突破,同時(shí)也將為AI和數(shù)字生物學(xué)的發(fā)展帶來巨大動(dòng)力。
讓邊緣AI更易獲取、更安全合規(guī)
邊緣AI方面,全新的Jetson Orin Nano系統(tǒng)級(jí)模組進(jìn)一步擴(kuò)充了NVIDIA Jetson產(chǎn)品陣容。其中包括在最小的Jetson外形尺寸下提供每秒40萬(wàn)億次(TOPS)AI性能的Orin Nano,以及為高級(jí)自主機(jī)器提供每秒275萬(wàn)億次(TOPS)AI性能的AGX Orin。與上一代產(chǎn)品相比,Jetson Orin Nano的性能提高了80倍,成為入門級(jí)邊緣AI和機(jī)器人技術(shù)的新基準(zhǔn)。
Jetson Orin包括了基于NVIDIA Ampere架構(gòu)的GPU、基于Arm架構(gòu)的CPU、新一代深度學(xué)習(xí)和視覺加速器、高速接口、快速內(nèi)存帶寬,并支持多模式傳感器。無論是部署邊緣AI應(yīng)用的工程師還是構(gòu)建新一代智能機(jī)器的機(jī)器人操作系統(tǒng)(ROS)的開發(fā)者,這種前所未有的性能與多功能性,將有望使更多客戶創(chuàng)造出曾經(jīng)看似不可能實(shí)現(xiàn)的產(chǎn)品,并使其商業(yè)化。
此外,面向制造、物流和醫(yī)療等行業(yè)的高精度邊緣AI需求,幫助他們擺脫特定用例昂貴的定制解決方案支出,最新推出的NVIDIA IGX平臺(tái)憑借易于編程和可配置性,可以滿足不同的行業(yè)需求。
對(duì)于制造業(yè)和物流業(yè),IGX為高度監(jiān)管的實(shí)體工廠和倉(cāng)庫(kù)提供了額外的安全層;對(duì)于醫(yī)療行業(yè)的邊緣AI用例,IGX提供安全、低延遲的AI推理,以滿足臨床對(duì)醫(yī)療程序中的一系列儀器和傳感器獲得即時(shí)洞察的需求,例如機(jī)器人輔助手術(shù)、患者監(jiān)測(cè)系統(tǒng)等。
通過這一系列最新升級(jí),NVIDIA的邊緣AI能力進(jìn)一步得到增強(qiáng)。Jetson Orin Nano有望大幅擴(kuò)展使用者數(shù)量,幫助數(shù)百萬(wàn)邊緣AI和ROS開發(fā)者大幅提高性能;NVIDIA IGX將幫助企業(yè)建立下一代軟件定義的工業(yè)和醫(yī)療設(shè)備,確保邊緣AI的合規(guī)性。
押注長(zhǎng)期布局
長(zhǎng)期主義者不僅要堅(jiān)持想做的事情,還不能中斷正在做的事,并且要持續(xù)地排除阻力,保持前進(jìn)。
NVIDIA押注的顯然是長(zhǎng)期布局,在鞏固游戲、數(shù)據(jù)中心等業(yè)務(wù)領(lǐng)先地位的同時(shí),自動(dòng)駕駛、元宇宙、邊緣AI等都在持續(xù)壯大中。
對(duì)于短期的困局, NVIDIA或許不會(huì)過度關(guān)注,而是把注意力聚焦在長(zhǎng)期目標(biāo)上。因?yàn)殚L(zhǎng)遠(yuǎn)看來,以上所有業(yè)務(wù)都趨于穩(wěn)健增長(zhǎng)。正如黃仁勛在GTC上所強(qiáng)調(diào)的,“我們要認(rèn)識(shí)到這是一個(gè)應(yīng)用AI的時(shí)代,未來10年、15年,需要幫助企業(yè)應(yīng)用人工智能。”這才是發(fā)展的底層,為此,NVIDIA需要打造更強(qiáng)的算力平臺(tái)、創(chuàng)建新的工具和應(yīng)用框架,并發(fā)展新的合作伙伴關(guān)系。
從技術(shù)路線圖來看,英偉達(dá)在傳達(dá)出一個(gè)更為清晰的信息:它并不寄望于一勞永逸,而是通過持續(xù)創(chuàng)新來實(shí)現(xiàn)關(guān)鍵技術(shù)的代代更迭。因此,行業(yè)周期性的低迷也好,外部因素造成的動(dòng)蕩也罷,這些終會(huì)過去。只要保持創(chuàng)新力、持續(xù)不斷地壯大生態(tài),最終仍將站在行業(yè)前沿。