加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 01.每月投18億做研發(fā),迎戰(zhàn)全球AIGC競(jìng)賽
    • 02.十年AI理想與研發(fā)長(zhǎng)跑,在中文搜索土壤上開花
    • 03.熱戰(zhàn)微軟、谷歌,百度文心一言,打造四大護(hù)城河
    • 04.結(jié)語:巨頭AIGC競(jìng)賽號(hào)角拉響中國(guó)AI產(chǎn)業(yè)迎來“小陽春”
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

文心一言上線倒計(jì)時(shí):百度十年AI理想和研發(fā)長(zhǎng)跑,進(jìn)入爆發(fā)前夜

2023/02/23
653
閱讀需 14 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者?|??三北

編輯?|??漠影

李彥宏:“AI技術(shù)已經(jīng)發(fā)展到一個(gè)臨界點(diǎn),各行各業(yè)都不可避免地被改變。”

隨著AIGC(生成式AI)引爆新一輪全球科技競(jìng)賽,百度對(duì)話機(jī)器人“文心一言”上線也進(jìn)入倒計(jì)時(shí),3月“交卷”籌備如何備受各界關(guān)注。適逢百度財(cái)報(bào)今日發(fā)布,百度2022年?duì)I收約1237億元,凈利潤(rùn)約207億元,研發(fā)投入達(dá)214億元,約等于把一年賺的錢全用來做研發(fā)了;同時(shí),AI產(chǎn)業(yè)化成果初顯,百度智能云已連續(xù)四年居AI公有云市場(chǎng)第一,關(guān)于百度文心一言的多個(gè)動(dòng)向也隨之曝出:已有超400家企業(yè)宣布加入文心一言生態(tài)圈,同時(shí)百度多項(xiàng)主流業(yè)務(wù)將接入文心一言,包括百度搜索,以及基于百度智能云的智能語音助手小度、智能駕駛阿波羅(Apollo)等。

▲百度2022年的研發(fā)投入及AI新進(jìn)展

作為中國(guó)AI市場(chǎng)長(zhǎng)期增長(zhǎng)的代表,百度正站在浪潮之巔。百度創(chuàng)始人兼董事長(zhǎng)李彥宏在財(cái)報(bào)發(fā)布后的內(nèi)部信中說:“AI技術(shù)已經(jīng)發(fā)展到一個(gè)臨界點(diǎn),各行各業(yè)都不可避免地被改變,中國(guó)AI市場(chǎng)即將迎來爆發(fā)性的需求增長(zhǎng)?!?/strong>實(shí)際上,這一新機(jī)會(huì)引起了全球產(chǎn)業(yè)的沸騰,基于大模型的AIGC成為一片掘金熱土。

美國(guó)硅谷的微軟、谷歌等科技巨頭為此打得不可開交;國(guó)內(nèi),百度、科大訊飛、復(fù)旦大學(xué)等大廠和知名學(xué)府紛紛出手,原美團(tuán)“二號(hào)人物”王慧文、出門問問創(chuàng)始人李志飛等科技大佬也一頭扎入AIGC創(chuàng)業(yè)大潮……而作為國(guó)內(nèi)在“AI+搜索”首屈一指的互聯(lián)網(wǎng)大廠,百度十年AI理想和窮盡實(shí)驗(yàn),或許正進(jìn)入爆發(fā)前夜。

01.每月投18億做研發(fā),迎戰(zhàn)全球AIGC競(jìng)賽

AI研發(fā)向來是一項(xiàng)費(fèi)錢的事業(yè)。盡管2022年業(yè)務(wù)深受疫情影響,百度依然保持了“月投18億做研發(fā)”的記錄。從經(jīng)營(yíng)基本面來看,根據(jù)財(cái)報(bào),百度本季度營(yíng)收約331億元,高于市場(chǎng)預(yù)期的320億元;歸屬百度的凈利潤(rùn)約54億元,同比增長(zhǎng)32%。

▲百度近年?duì)I收及增長(zhǎng)情況

在研發(fā)投入方面,百度保持了多年以來的高研發(fā)投入,2022年約達(dá)到214億元,相當(dāng)于每月投18億做研發(fā),占百度核心收入22.4%,在全國(guó)科技公司里位于前列。

▲百度近年研發(fā)投入情況

持續(xù)的研發(fā)投入,正在轉(zhuǎn)化為產(chǎn)業(yè)化成果。比如承載AI產(chǎn)業(yè)化的百度智能云部門,2022年強(qiáng)化了“云智一體”戰(zhàn)略,已連續(xù)四年居于中國(guó)AI公有云市場(chǎng)第一。而在前沿技術(shù)研發(fā)方面,百度TPG部門最新的文心(ERNIE)大模型成果,正成為百度應(yīng)對(duì)全球AIGC產(chǎn)業(yè)化浪潮的錨點(diǎn)支撐。在剛剛過去的2022年Q4,百度在11月的深度學(xué)習(xí)開發(fā)者峰會(huì)上全新發(fā)布11個(gè)大模型,包括5個(gè)基礎(chǔ)大模型、1個(gè)任務(wù)大模型、5個(gè)行業(yè)大模型。同時(shí),百度新發(fā)布和升級(jí)基于文心大模型的兩大產(chǎn)品——AI 作畫產(chǎn)品“文心一格”和產(chǎn)業(yè)級(jí)搜索系統(tǒng)“文心百中”。文心是百度自主研發(fā)的產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型,與當(dāng)下流行的大模型GPT-3.5相似。截至目前,文心已累計(jì)發(fā)布11個(gè)行業(yè)大模型,涵蓋電力、燃?xì)?、金融、航天、傳媒、城市、影視、制造、社科等領(lǐng)域。

▲百度文心產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型框架圖

隨著2023年新季度的開啟,百度將于3月推出又一個(gè)生成式AI產(chǎn)品“文心一言”,以此續(xù)寫迎戰(zhàn)全球AIGC競(jìng)賽的篇章。

02.十年AI理想與研發(fā)長(zhǎng)跑,在中文搜索土壤上開花

要問當(dāng)下什么是AIGC的最佳商業(yè)化應(yīng)用?搜索引擎一定榜上有名。接入了ChatGPT的微軟新版Bing秒變私人智能助理,谷歌對(duì)標(biāo)產(chǎn)品Bard也進(jìn)入了全公司萬人內(nèi)測(cè)階段……憑借“百度一下”被全國(guó)人認(rèn)識(shí)的百度也出手了——在今年1月Create AI開發(fā)者大會(huì)前夕,百度宣布將搜索升級(jí)為“生成式搜索”,這意味著百度搜索將提供更好的答案、交互聊天和生成內(nèi)容。躋身全球AIGC產(chǎn)業(yè)化競(jìng)賽舞臺(tái),百度正試圖引領(lǐng)中文搜索體驗(yàn)的代際變革。根據(jù)財(cái)報(bào)可知,作為基本盤,搜索業(yè)務(wù)為百度文心一言的誕生提供了厚實(shí)土壤。2022年Q4,百度搜索規(guī)模同比增長(zhǎng)17%,領(lǐng)跑優(yōu)勢(shì)持續(xù)擴(kuò)大。12月,百度App月活躍用戶達(dá)到6.48億,同比增長(zhǎng)4%。此外,隨著國(guó)內(nèi)市場(chǎng)消費(fèi)需求釋放,百度在線廣告營(yíng)銷業(yè)務(wù)預(yù)計(jì)將迎來復(fù)蘇。這些增長(zhǎng)都與百度基本盤搜索業(yè)務(wù)緊密相關(guān),從而為文心一言的落地提供了底盤基座。

▲百度移動(dòng)生態(tài)流量池保持增長(zhǎng)

知名分析機(jī)構(gòu)麥格理預(yù)計(jì),百度2023年廣告及云服務(wù)收入增長(zhǎng)將會(huì)有所回升,受惠于有效的成本控制措施,整體利潤(rùn)率提高,而可見的上行驚喜將會(huì)是公司有機(jī)會(huì)在中國(guó)推出類似ChatGPT的人工智能(AI)聊天機(jī)器人。可以預(yù)測(cè),隨著接入文心一言,百度搜索將擴(kuò)大服務(wù)場(chǎng)景和市場(chǎng)規(guī)模。AIGC有望助百度搶占內(nèi)容生態(tài)高地,比如增加百度平臺(tái)上的高質(zhì)量短視頻供應(yīng),助百家號(hào)發(fā)布者提高轉(zhuǎn)換效率等。

實(shí)際上,除了搜索,百度文心一言將通過智能云提供服務(wù),應(yīng)用于智能駕駛阿波羅(Apollo)、智能語音助手小度等多塊業(yè)務(wù),使得用戶體驗(yàn)實(shí)現(xiàn)跨代進(jìn)化。當(dāng)然,AIGC相關(guān)技術(shù)研發(fā)難度大,即便是微軟新版Bing在近期的測(cè)試中也是“翻車”不斷,百度文心一言做的怎么樣依然是一個(gè)未知答案。攻克技術(shù)缺陷需要時(shí)間,這對(duì)百度來說挑戰(zhàn)和壓力不小。不過,百度文心一言的誕生并非一日之功,超10年在NLP(自然語言處理)領(lǐng)域的積累或許能為其提供堅(jiān)實(shí)支持。

早在2010年,百度就創(chuàng)立了自然語言處理部,在語音、圖片等技術(shù)上布局;2019年3月,百度提出知識(shí)增強(qiáng)的語義理解框架文心(ERNIE),在深度學(xué)習(xí)的基礎(chǔ)上融入知識(shí)和持續(xù)學(xué)習(xí),當(dāng)時(shí)一舉登頂全球權(quán)威數(shù)據(jù)集GLUE榜單。2021年9月,百度發(fā)布了全球首個(gè)百億參數(shù)的對(duì)話大模型PLATO-XL,再次刷新了開放域?qū)υ捫Ч?022年12月,文心大模型迭代出ERNIE 1.0、ERNIE 2.0、ERNIE-Tiny多個(gè)版本,開始加速落地到各個(gè)行業(yè)。十年AI理想與研發(fā)長(zhǎng)跑,在百度中文搜索土壤上開花,并開始走向千行百業(yè)實(shí)體經(jīng)濟(jì)的結(jié)出果實(shí)。

03.熱戰(zhàn)微軟、谷歌,百度文心一言,打造四大護(hù)城河

熱戰(zhàn)微軟、谷歌,國(guó)產(chǎn)大模型將與硅谷科技巨頭進(jìn)行在不同的舞臺(tái)隔空PK。百度創(chuàng)始人兼董事長(zhǎng)李彥宏在近期公開發(fā)言中說:“怎么把這么酷的技術(shù),變成人人需要的好產(chǎn)品,賦能千行百業(yè),讓他們的生產(chǎn)效率大幅度地提升?這一步才是最難的,也是最偉大、最能夠產(chǎn)生影響力的?!备鶕?jù)官方數(shù)據(jù)可知,目前已有包括互聯(lián)網(wǎng)、媒體、金融、保險(xiǎn)、汽車、企業(yè)軟件等行業(yè)的超400家頭部企業(yè)宣布加入百度文心一言生態(tài)。而文心一言能否為這些行業(yè)伙伴帶來驚艷的效果?成為當(dāng)下階段百度團(tuán)隊(duì)的主要攻堅(jiān)戰(zhàn)。面向這一攻堅(jiān)戰(zhàn),百度從至少算法、算力、數(shù)據(jù)、應(yīng)用四大方面建立了技術(shù)護(hù)城河。

1、四年大模型飛速迭代,飛槳底座匯聚535萬開發(fā)者

無論是大模型算法還是AI開發(fā)框架,百度都走在國(guó)內(nèi)科技大廠的前列。文心一言背后,文心大模型迭代四年至今,已從單一的自然語言理解延伸至多模態(tài),實(shí)現(xiàn)視覺、文檔、文圖、語音“全能”,具備較強(qiáng)泛化能力和性能。以最新發(fā)布的ERNIE 3.0 Zeus為例,已擁有千億級(jí)參數(shù),據(jù)稱公開數(shù)據(jù)集上小樣本學(xué)習(xí)、理解和生成任務(wù)效果皆好于業(yè)界其他模型。支撐文心模型訓(xùn)練的框架是百度飛槳PaddlePaddle),中國(guó)首個(gè)自主研發(fā)的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)開源開放平臺(tái)。一方面飛槳技術(shù)不斷迭代,2022年11月剛在MLPerf Training v2.1測(cè)試中奪魁;另一方面生態(tài)不斷壯大,截至2022年11月底,飛槳平臺(tái)上已凝聚535萬開發(fā)者、創(chuàng)建67萬個(gè)AI模型,服務(wù)20萬家企事業(yè)單位,位列中國(guó)深度學(xué)習(xí)平臺(tái)市場(chǎng)綜合份額第一。

▲飛槳平臺(tái)全景圖

2、三大云中心穩(wěn)定供算力,幾萬片自研芯澎湃加速

大模型戰(zhàn)場(chǎng)正變得越來越熱鬧,算力成本隨著飆升。比如GPT-3大模型的單次訓(xùn)練成本上百萬美元、總訓(xùn)練成本上千萬美元。在算力方面,百度在陽泉、徐水、定興三地建立了自用云計(jì)算中心,龐大的超算集群為文心大模型的訓(xùn)練奠定了基礎(chǔ)設(shè)施。百度智能云在成為百度第二增長(zhǎng)曲線的同時(shí),也能為文心大模型應(yīng)用提供高并發(fā)、高彈性、高精度等不同計(jì)算需求。同時(shí),百度自研AI芯片“昆侖”已在多場(chǎng)景實(shí)際部署幾萬片,在公司搜索業(yè)務(wù)中也已形成較強(qiáng)工程化實(shí)踐,為文心大模型底層算力鋪上了加速路。

▲百度“芯片-框架-大模型-行業(yè)應(yīng)用”的智能化閉環(huán)路徑

3、自有業(yè)務(wù)海量真實(shí)文本,具備先天數(shù)據(jù)優(yōu)勢(shì)

眾所周知,擁有千億參數(shù)的大模型是用海量數(shù)據(jù)“喂出來的”。在數(shù)據(jù)層面,百度以移動(dòng)APP、搜索等業(yè)務(wù)為依托,積累了海量真實(shí)文本和用戶需求數(shù)據(jù)。這些大規(guī)模結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)有望支撐文心一言充分預(yù)訓(xùn)練,形成自身優(yōu)勢(shì)。此外,在安全領(lǐng)域多年的深耕也將為文心一言保駕護(hù)航。

4、多款應(yīng)用提供創(chuàng)新土壤,用戶開放帶起迭代飛輪

正如前文提到的,文心一言能夠落地到百度搜索、小度、阿波羅等多塊自有業(yè)務(wù),這些產(chǎn)品不少已在市場(chǎng)占據(jù)領(lǐng)導(dǎo)地位。隨著文心一言的嵌入,這些產(chǎn)品有望實(shí)現(xiàn)代際變革;產(chǎn)品的迭代也將反推文心一言繼續(xù)進(jìn)化。另外,隨著文心一言的公眾開放,真實(shí)的用戶調(diào)用和模型迭代之間的良性循環(huán)建立起來,文心一言大模型的智力有望不斷升級(jí)。此外值得一提的是,文心一言在迎戰(zhàn)國(guó)外AIGC產(chǎn)品的同時(shí),更需要適應(yīng)中國(guó)市場(chǎng)的實(shí)體經(jīng)濟(jì)數(shù)字化轉(zhuǎn)型需求。根據(jù)百度方發(fā)言,文心大模型是本土化的AI模型,具備對(duì)中文、中國(guó)文化的更深理解,這意味著文心一言可能會(huì)更適合中文和中國(guó)市場(chǎng)。

04.結(jié)語:巨頭AIGC競(jìng)賽號(hào)角拉響中國(guó)AI產(chǎn)業(yè)迎來“小陽春”

全球AIGC的巨頭戰(zhàn)已經(jīng)打響,在AI和搜索領(lǐng)域深耕多年的百度站在了新的歷史舞臺(tái)上。2019年推出文心大模型,其將于3月推出的文心一言可以說是中國(guó)科技力量參戰(zhàn)全球AIGC競(jìng)賽的一大代表。適逢文心一言上線進(jìn)入倒計(jì)時(shí),百度發(fā)布了2022年的財(cái)報(bào)及Q4的業(yè)務(wù)進(jìn)展情況,成為提前了解其“答卷”的參考。百度搜索、智能云、阿波羅、小度等業(yè)務(wù)快速發(fā)展,成為文心一言大模型在實(shí)際落地中不斷迭代的試驗(yàn)田。不久之前,人們似乎還在AI產(chǎn)業(yè)的低谷仰望光明,不知道通用人工智能的曙光何時(shí)出現(xiàn)?,F(xiàn)在,隨著全球AIGC巨頭戰(zhàn)號(hào)角吹響,AI市場(chǎng)又熱了起來,中國(guó)方興未艾的AI產(chǎn)業(yè)有望迎來一個(gè)“小陽春”。

百度

百度

百度是擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球?yàn)閿?shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國(guó)際機(jī)構(gòu)評(píng)為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡(jiǎn)單”為使命,堅(jiān)持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長(zhǎng)的全球頂級(jí)高科技公司”。

百度是擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球?yàn)閿?shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國(guó)際機(jī)構(gòu)評(píng)為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡(jiǎn)單”為使命,堅(jiān)持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長(zhǎng)的全球頂級(jí)高科技公司”。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜