禾下乘涼夢,是一個今天國人無比熟悉的詞。它來自袁隆平院士對雜交水稻高產(chǎn)的理想追求,是袁隆平的中國夢。他生前多次提到,夢想到禾下乘涼,夢里水稻長得有高粱那么高,籽粒有花生米那么大。
或許,千行百業(yè)都有這樣一個“禾下乘涼夢”??萍继剿鲿樯a(chǎn)與創(chuàng)造帶來難以估量的價值,極大改變?nèi)藗兊纳?。?a class="article-link" target="_blank" href="/tag/AI/">AI領(lǐng)域,有一項(xiàng)技術(shù)經(jīng)常讓我聯(lián)想到“禾下乘涼夢”,那就是預(yù)訓(xùn)練大模型。在袁隆平院士的夢中,雜交水稻會長得非常高大,帶來極高的畝產(chǎn)量;大模型也是在訓(xùn)練數(shù)據(jù)與模型規(guī)模上非常大,在模型能力上形成巨大優(yōu)勢。
從2018年開始,大模型開始作為AI領(lǐng)域重要的技術(shù)方向被廣泛關(guān)注。多年過去,我們對于大模型最大的期待,或許就在于它能不能從實(shí)驗(yàn)室和數(shù)據(jù)集中的“種子”,真正變成一片片賦能行業(yè),普惠經(jīng)濟(jì)的稻田。
雜交水稻的發(fā)展,離不開精心耕耘的試驗(yàn)田。實(shí)現(xiàn)大模型的“禾下乘涼夢”,或許也需要這樣的“試驗(yàn)田”挺身而出,為時代探明大模型的前進(jìn)方向——這個關(guān)頭,百度站了出來。
9月23日,2022萬象·百度移動生態(tài)大會在廣東珠海召開。會上,百度集團(tuán)資深副總裁、百度移動生態(tài)事業(yè)群組(MEG)總經(jīng)理何俊杰首次對外全面解讀百度移動生態(tài)戰(zhàn)略。其中非常值得注意的一點(diǎn),是會上詳細(xì)展示了我們熟悉的百度移動生態(tài),是如何與百度打造的文心系列大模型深度結(jié)合,帶來搜索、信息流、AIGC等領(lǐng)域的禾木生長。在百度移動生態(tài)中,文心大模型的能力可謂能用盡用,應(yīng)出盡出。
換個角度想,如果我們想知道未來千行百業(yè)如何在大模型的禾下乘涼,那么今天百度移動生態(tài)的場景坐標(biāo),或許正指向著明天智能中國的大模型之路。
大模型3.0階段,產(chǎn)業(yè)轉(zhuǎn)化成為核心
在討論百度移動生態(tài)融合文心大模型能力的重要性之前,我們必須先來了解這背后的技術(shù)與產(chǎn)業(yè)背景。百度移動生態(tài)與大模型融合之所以重要,是因?yàn)榇竽P瓦@項(xiàng)技術(shù)本身正處在非常重要的發(fā)展節(jié)點(diǎn)。
從發(fā)展歷程上看,從2018年預(yù)訓(xùn)練大模型開始受到行業(yè)重視算起,大模型的發(fā)展可以歸納為三個階段。第一階段就是所謂的“大煉模型”。傳統(tǒng)的深度模型已經(jīng)是行業(yè)主旋律,而預(yù)訓(xùn)練大模型作為一種新興的技術(shù)思路,開始進(jìn)入萌芽階段。接下來在第二階段,大模型的價值得到了產(chǎn)學(xué)各界的普遍認(rèn)同。伴隨著資本與社會關(guān)注度的廣泛注入,談AI必談大模型成為風(fēng)尚,各界也就進(jìn)入從“大煉模型”到“煉大模型”的轉(zhuǎn)變。在這個階段中,各種大模型層出不窮,在訓(xùn)練數(shù)據(jù)參數(shù)上的擴(kuò)張,技術(shù)思路的發(fā)展帶來了大模型技術(shù)的繁榮。
當(dāng)大模型的技術(shù)研發(fā)儲備到一定階段,新的挑戰(zhàn)也隨之而來:這么多大模型,到底應(yīng)該如何與產(chǎn)業(yè)應(yīng)用結(jié)合?這個問題如果不能妥善解決,那么大模型的繁榮發(fā)展終究是空中樓閣。所以,大模型的3.0階段,就是從“煉大模型”到“用大模型”的轉(zhuǎn)變。如何實(shí)現(xiàn)有效的產(chǎn)業(yè)轉(zhuǎn)化,已經(jīng)變成了目前階段大模型領(lǐng)域的最核心任務(wù)。
想要用好大模型,從技術(shù)向產(chǎn)業(yè)的轉(zhuǎn)化邏輯上看,需要具備三個前提條件:技術(shù)過硬,平臺與工具齊備,有清晰明確的場景價值作為示范。而一路深耕文心系列大模型的百度,顯然在前兩項(xiàng)能力中具備先發(fā)優(yōu)勢。
百度自2019年開始深耕預(yù)訓(xùn)練模型研發(fā),發(fā)布了知識增強(qiáng)文心ERNIE系列模型。2021年12月,百度與鵬城實(shí)驗(yàn)室聯(lián)合發(fā)布全球首個知識增強(qiáng)千億大模型“鵬城-百度·文心”,參數(shù)規(guī)模達(dá)到2600億,在60多項(xiàng)NLP任務(wù)中取得最好效果。2022年5月的Wave Summit深度學(xué)習(xí)開發(fā)者峰會上,百度發(fā)布10個大模型,包括融合學(xué)習(xí)任務(wù)知識的知識增強(qiáng)千億大模型、多任務(wù)統(tǒng)一學(xué)習(xí)的視覺大模型、跨模態(tài)大模型、生物計算大模型、行業(yè)大模型等,并提出支撐大模型產(chǎn)業(yè)落地的3個關(guān)鍵路徑:建設(shè)更適配場景需求的大模型體系,提供全流程支持應(yīng)用落地的工具、平臺和方法,建設(shè)激發(fā)創(chuàng)新的開放生態(tài)等。
至此,文心大模型已經(jīng)既包含基礎(chǔ)的通用大模型,也包含面向重點(diǎn)任務(wù)領(lǐng)域的行業(yè)大模型,同時還具備豐富的工具平臺。從技術(shù)過硬角度看,文心大模型具有知識增強(qiáng)的差異化優(yōu)勢,可以從大規(guī)模知識圖譜和海量無結(jié)構(gòu)數(shù)據(jù)中完成學(xué)習(xí),從而實(shí)現(xiàn)模型效率更高、效果更好,具有良好的可解釋性。從平臺建設(shè)與產(chǎn)業(yè)轉(zhuǎn)化上看,文心大模型具有產(chǎn)業(yè)級特性,提供全流程支持應(yīng)用落地的工具和方法,營造激發(fā)創(chuàng)新的開放生態(tài)。
換言之,清晰的場景化示范價值,是文心大模型推動大模型走向3.0階段的“最后一公里”。這個時候,百度豐富的產(chǎn)業(yè)生態(tài)布局,就體現(xiàn)出了關(guān)鍵價值。
百度移動生態(tài),做大模型時代的“試驗(yàn)田”
在科技領(lǐng)域有句話,叫“自己的降落傘自己先跳”。對于希望率先探索大模型應(yīng)用與產(chǎn)業(yè)轉(zhuǎn)化的百度來說,也必須“自己的大模型自己先用”。
好在百度豐富的移動生態(tài)布局,不僅是大模型應(yīng)用的價值沃土,更能以其苛刻的技術(shù)要求、清晰的能力展現(xiàn)、具有代表性的應(yīng)用場景,成為更多開發(fā)者與企業(yè)的大模型“試驗(yàn)田”。
2022萬象·百度移動生態(tài)大會中,我們看到了百度移動生態(tài)與文心大模型基礎(chǔ)能力豐富多元的融合。百度移動生態(tài),向來是百度AI技術(shù)落地的“首站”,長期秉持著AI技術(shù)能用盡用、能出盡出的原則。
而在與大模型的結(jié)合上,我們首先可以看到百度最新發(fā)布了面向搜索場景的跨模態(tài)大模型“知一”。它可以理解全網(wǎng)文本、圖片、視頻、結(jié)構(gòu)化信息等形態(tài)各異的資源,從而打破資源形態(tài)的界限,將最滿足用戶需求的結(jié)果呈現(xiàn)給用戶,真正實(shí)現(xiàn)大模型技術(shù)與搜索、信息流等百度核心業(yè)務(wù)的深度融合。
而對于更多百度移動生態(tài)中的開發(fā)者、創(chuàng)作者而言,基于文心大模型打造的“創(chuàng)作者AI助理團(tuán)”可以帶來劃時代的AIGC體驗(yàn)。這個AI團(tuán)隊里,有文案、有插畫師、有視頻制作人,在這些“助理”們的齊心努力下,可以讓創(chuàng)作者實(shí)現(xiàn)“一個人成為一支隊伍”。
基于百度文心大模型,“AI文案助理”可以根據(jù)創(chuàng)作者的需求快速產(chǎn)出不同風(fēng)格的文章標(biāo)題、內(nèi)容段落,“AI插畫助理”可以根據(jù)關(guān)鍵詞,自動“畫”出十余種不同風(fēng)格的畫作,讓創(chuàng)作者實(shí)現(xiàn)“配圖自由”。相關(guān)能力,目前已經(jīng)可以在百度APP中體驗(yàn),效果十分突出。
“AI視頻制作助理”基于文心大模型的自然語言處理和跨模態(tài)AI技術(shù),讓創(chuàng)作者的圖文自動生成視頻,速度可達(dá)“分鐘級”。這項(xiàng)技術(shù)讓創(chuàng)作者從圖文到視頻的創(chuàng)作周期縮短了3倍以上,而且也為創(chuàng)作者帶來“一篇內(nèi)容,兩種收益”的效果。
“創(chuàng)作者AI助理團(tuán)”,可說是全景式展現(xiàn)了大模型的一個應(yīng)用價值——AIGC(AI Generated Content,人工智能自動生成內(nèi)容)。基于大模型打造的AIGC能力,可以實(shí)現(xiàn)多種多樣的AI自主創(chuàng)作,以及形態(tài)豐富的創(chuàng)作輔助功能,實(shí)現(xiàn)自動生產(chǎn)文案、自動生產(chǎn)圖片、圖文轉(zhuǎn)視頻等一系列技術(shù)飛躍。目前,“創(chuàng)作者AI助理團(tuán)”已經(jīng)開始邀請內(nèi)測,將從今年第四季度起陸續(xù)向更多創(chuàng)作者開放。
由此我們不難看出,文心大模型帶給百度移動生態(tài)的能力并不是“錦上添花”的簡單能力升級,而是實(shí)打?qū)嵉目缭绞絼?chuàng)新,甚至可以說解決了移動開發(fā)者、創(chuàng)作者長期以來最核心的創(chuàng)作門檻困擾,讓創(chuàng)作者聚焦于創(chuàng)作的最核心部分。
這樣的能力升級,當(dāng)然對于百度移動生態(tài)的未來發(fā)展至關(guān)重要。但更重要的,可能是這種結(jié)合展示了一種可能,一種大模型走向深度產(chǎn)業(yè)應(yīng)用的可能。
AIGC豐收時,行業(yè)轉(zhuǎn)化深耕中:文心大模型的禾下乘涼夢
不久之前,科技部發(fā)布了《關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場景的通知》(以下簡稱《通知》),指出要充分發(fā)揮人工智能賦能經(jīng)濟(jì)社會發(fā)展的作用,打造形成一批可復(fù)制、可推廣的標(biāo)桿型示范應(yīng)用場景。
不難看出,以場景作為先導(dǎo),快速實(shí)現(xiàn)AI技術(shù)的行業(yè)落地與規(guī)模化輔助正在成為目前AI產(chǎn)業(yè)發(fā)展的主要任務(wù)。對于大模型來說也是如此,各行業(yè)想要真正理解大模型的價值,應(yīng)用大模型的能力,首先需要以場景為先導(dǎo),以示范為坐標(biāo)。
百度移動生態(tài)對于大模型的深入應(yīng)用,正好可以構(gòu)成這種迫切為時代所需要的場景示范。從大模型走向產(chǎn)業(yè)轉(zhuǎn)化的路徑上看,百度移動首先證明了AIGC的可用性。AIGC作為大模型走向產(chǎn)業(yè)的重要一站,更多行業(yè)可以從百度的經(jīng)驗(yàn)中消化并吸納AIGC的價值,從而實(shí)現(xiàn)自身的大模型落地。其次,百度移動生態(tài)與大模型融合,還證明了大模型與產(chǎn)業(yè)需求、產(chǎn)業(yè)真實(shí)情況的融合價值。百度移動生態(tài)擁有著巨大的流量以及多樣化的業(yè)務(wù),這些條件都是對大模型可用性的考驗(yàn)。
知名經(jīng)濟(jì)學(xué)家任澤平也在萬象大會期間表示:“在AIGC的時代,百度APP作為‘前哨’和‘根據(jù)地’,是AIGC應(yīng)用最廣闊的天地,也將成為人人皆可用的AI新基建。這種‘百度搭臺,人人唱戲’的模式,將會激發(fā)全民更大的創(chuàng)造力,很多新模式、新應(yīng)用都會破土而出。”
從文心大模型與百度移動生態(tài)的結(jié)合,到AIGC產(chǎn)業(yè)實(shí)踐的探索,再到更多行業(yè)應(yīng)用大模型的可能,我們可以看到這個路徑為大模型的3.0階段帶來了三重價值。
1.自種自證:大模型的技術(shù)能力已經(jīng)趨向飽滿
百度移動生態(tài)對文心大模型的應(yīng)用,首先讓各行業(yè)的開發(fā)者看到了大模型能做什么,有著怎樣的想象力,而這歸其根本來自文心大模型的技術(shù)能力。大模型的種子,需要在土壤中證明自己的價值,而AIGC與百度移動生態(tài)就提供了這樣的土壤。以AI智能寫作為例, ERNIE 3.0 Zeus是文心大模型最新發(fā)布的融合任務(wù)相關(guān)知識的千億大模型,其在學(xué)習(xí)海量數(shù)據(jù)和知識的基礎(chǔ)上,進(jìn)一步學(xué)習(xí)百余種不同形式的任務(wù)知識,在各類任務(wù)表現(xiàn)出了更強(qiáng)的創(chuàng)作能力。從財經(jīng)、體育類新聞快訊,再到詩歌、小說等文學(xué)創(chuàng)作,AI寫作覆蓋的領(lǐng)域越來越廣,創(chuàng)作形式和內(nèi)容也變得更加豐富多彩。
今年高考期間,ERNIE 3.0 Zeus 加持的AI數(shù)字人度曉曉挑戰(zhàn)寫高考作文,以40秒40篇的速度,獲得了位列總考生前25%的成績。ERNIE 3.0 Zeus的智能創(chuàng)作能力目前已經(jīng)對外開放,各行各業(yè)的廣大開發(fā)者可以在線體驗(yàn)與定制ERNIE 3.0 Zeus的文本創(chuàng)作能力。再說說AI作畫,AI作畫這樣的AIGC應(yīng)用想要得到保障,背后是文心跨模態(tài)大模型的有力支撐,作為全球最大中文跨模態(tài)生成模型,文心ERNIE-ViLG參數(shù)規(guī)模已達(dá)100億,它將「文生成圖」和「圖生成文」任務(wù)融合到同一個模型進(jìn)行端到端學(xué)習(xí),從而增強(qiáng)文本和圖像的跨模態(tài)語義對齊。而近期文心ERNIE-ViLG文圖生成算法迎來升級,通過漸進(jìn)式擴(kuò)散模型,生成空間由小及大、生成輪廓由粗到細(xì),同時根據(jù)生成階段自動選擇最優(yōu)生成網(wǎng)絡(luò),文本生成圖像的效果取得進(jìn)一步提升??梢哉f,每一幅AI畫作的背后,都有文心大模型技術(shù)能力飽滿的證明。
2.沃土通衢:產(chǎn)業(yè)工具與開發(fā)平臺逐漸完備
各行業(yè)、各領(lǐng)域中的開發(fā)者,想要真正用到大模型,就需要針對性的平臺與工具,從而降低技術(shù)獲取門檻,提升產(chǎn)業(yè)開發(fā)效率。為此,文心大模型在工具化、平臺化中進(jìn)行了豐富的探索。以AI作畫為例,文心一格是百度推出的AI藝術(shù)和創(chuàng)意輔助平臺,是百度依托于飛槳、文心大模型持續(xù)的技術(shù)創(chuàng)新,在“AI作圖”方面發(fā)布的產(chǎn)品。面向有設(shè)計需求和創(chuàng)意的人群,文心一格可以基于文心大模型智能生成多樣化AI創(chuàng)意圖片,輔助創(chuàng)意設(shè)計,打破創(chuàng)意瓶頸。對便捷性需求更高的開發(fā)者,還可以使用文心文圖生成大模型ERNIE-ViLG 服務(wù),極速獲得沉浸式文圖生成大模型的技術(shù)體驗(yàn),更可靈活方便、高效地實(shí)現(xiàn)產(chǎn)品集成。這樣我們可以看到,對AI作畫有不同需求、不同考量的開發(fā)者,都有平臺和工具來獲取自己想要的AIGC能力。這就是大模型走向行業(yè),走向應(yīng)用的沃土通衢。
3.禾下乘涼:大模型規(guī)?;瘧?yīng)用的開始
面向更廣闊的行業(yè)應(yīng)用前景與產(chǎn)業(yè)想象力,文心大模型不僅僅推動與百度業(yè)務(wù)的結(jié)合,更積極探索對外賦能的形式與方法。文心大模型具備的知識增強(qiáng)特性,本身就可以實(shí)現(xiàn)在實(shí)體問答、知識預(yù)測等領(lǐng)域獲得更好效果,提升大模型在行業(yè)場景中的可用性。同時,文心·行業(yè)大模型采用行業(yè)知識增強(qiáng)技術(shù)對行業(yè)特色數(shù)據(jù)與行業(yè)特色知識學(xué)習(xí),進(jìn)而提升大模型對行業(yè)應(yīng)用的適配性。目前文心已經(jīng)聯(lián)合國家電網(wǎng)、浦發(fā)銀行發(fā)布知識增強(qiáng)的電力行業(yè)NLP大模型“國網(wǎng)-百度·文心”、金融行業(yè)NLP大模型“浦發(fā)-百度·文心”,已在電力、金融相關(guān)任務(wù)完成落地應(yīng)用。在航天領(lǐng)域,文心大模型攜手中國航天發(fā)布世界上首個航天大模型——“航天-百度·文心大模型”,推進(jìn)航天領(lǐng)域AI技術(shù)應(yīng)用。
文心大模型早已推出了開發(fā)套件、API和內(nèi)置文心大模型能力的開發(fā)平臺,可以讓不同領(lǐng)域、不同需求的產(chǎn)業(yè)開發(fā)者以更低成本、更低門檻精準(zhǔn)獲得大模型賦能,促進(jìn)人工智能的進(jìn)一步廣泛應(yīng)用。
文心大模型在產(chǎn)業(yè)中加速落地,正在成為推動AIGC發(fā)展的新引擎,同時也在成為推動產(chǎn)業(yè)智能化的新基座。大模型的規(guī)?;瘧?yīng)用和落地千行百業(yè),或許就是我們期待的那個智能中國的禾下乘涼夢。