Twitter上有人對(duì)比了ChatGPT、instagram、spotify、Facebook、netflix、twitter,收獲百萬(wàn)、1億用戶所花的時(shí)間,其中,ChatGPT以火箭躥升之姿光速登頂,業(yè)內(nèi)人士評(píng)論“Something different is happening”、“它不是一個(gè)新產(chǎn)品、而是一個(gè)新物種”。
科技界這種盛況并不多見(jiàn),上一次還是iPhone問(wèn)世?ChatGPT霸屏的這段時(shí)間,相關(guān)概念股群魔亂舞,創(chuàng)業(yè)公司爭(zhēng)做“中國(guó)版的Open AI”……一個(gè)核心的問(wèn)題浮出水面:ChatGPT會(huì)不會(huì)固化AI產(chǎn)業(yè)格局,強(qiáng)者恒強(qiáng)?如果這是一場(chǎng)巨頭的游戲,國(guó)內(nèi)的中小企業(yè)該怎么玩?
會(huì)否加劇“強(qiáng)者恒強(qiáng)”的兩極局面?
從硅谷到中國(guó),ChatGPT的熱度有增無(wú)減,但主要玩家都是巨頭。目前國(guó)內(nèi)有能力競(jìng)逐的也都是行業(yè)翹楚:百度文心一言、騰訊HunYuan-NLP 1T大模型、阿里“通義”大模型、華為盤古大模型、中科院自動(dòng)化研究所“紫東·太初”等。當(dāng)AI闊步進(jìn)入大模型時(shí)代,走在前列的巨頭會(huì)不會(huì)把追逐者遠(yuǎn)遠(yuǎn)甩開(kāi)?
曾任華為系NLP企業(yè)首席科學(xué)家、現(xiàn)任千芯科技董事長(zhǎng)陳巍認(rèn)為,可以從企業(yè)和國(guó)家整體產(chǎn)業(yè)兩個(gè)層面來(lái)看。
目前ChatGPT這類大模型領(lǐng)域確實(shí)有一定的馬太效應(yīng),跑在前面的企業(yè)玩家具備完整的算法、數(shù)據(jù)和算力優(yōu)勢(shì),后發(fā)者想要追趕確實(shí)有較大難度。但是對(duì)企業(yè)來(lái)說(shuō),未必就是強(qiáng)者恒強(qiáng)。例如OpenAI在ChatGPT這類問(wèn)答型NLP算法曾一度落后于Google BERT,但現(xiàn)在又開(kāi)始重新領(lǐng)跑。這其中少數(shù)研發(fā)人員的智慧、天賦,以及破釜沉舟般的專注,實(shí)際上是決定勝負(fù)的關(guān)鍵。
“而資金或者攢局恐怕無(wú)法代替技術(shù),比如微軟自己做小冰,最后也要讓位于ChatGPT”, 陳巍談到,“如果國(guó)內(nèi)的技術(shù)偏執(zhí)狂人能夠領(lǐng)悟或訓(xùn)練出更高水平的模型,在算法或訓(xùn)練方法上形成降維打擊,超越OpenAI也不是不可能?!?/p>
再?gòu)母鲊?guó)產(chǎn)業(yè)發(fā)展而言,由于AI領(lǐng)先的國(guó)家確實(shí)具備了系統(tǒng)化且領(lǐng)先的AI技術(shù)人群和豐富的算力基礎(chǔ)(大算力芯片),已經(jīng)在教育-研究-產(chǎn)品-需求上形成完整閉環(huán),一旦在ChatGPT這類大模型上拉開(kāi)差距,很可能形成兩極分化的國(guó)力競(jìng)爭(zhēng)格局,甚至形成“強(qiáng)者恒強(qiáng)”的局面。
面對(duì)ChatGPT沖擊波,中小企業(yè)的機(jī)會(huì)在哪里?
近期不少人給ChatGPT算經(jīng)濟(jì)賬,國(guó)盛證券以英偉達(dá)A100芯片、DGXA100服務(wù)器、現(xiàn)階段每日2500萬(wàn)訪問(wèn)量等假設(shè)為基礎(chǔ),估算得出:在初始算力投入上,為滿足ChatGPT當(dāng)前千萬(wàn)級(jí)用戶的咨詢量,投入成本約為8億美元,對(duì)應(yīng)約4000臺(tái)服務(wù)器。
反觀國(guó)內(nèi)AI中小企業(yè),他們既撐不起全棧式的AI研發(fā),也無(wú)力為高昂的算力買單。那么在大模型快速發(fā)展、走向商用的過(guò)程中,他們的發(fā)展機(jī)會(huì)主要有哪些?如果只能接入巨頭的生態(tài)求生存,會(huì)不會(huì)產(chǎn)生同質(zhì)化競(jìng)爭(zhēng)?
陳巍表示,對(duì)于做NLP算法的中小創(chuàng)業(yè)企業(yè)來(lái)說(shuō),初期確實(shí)可能會(huì)遇到比較大的打擊。因?yàn)镃hatGPT這類應(yīng)用,把這些公司之前的積累基本拉平到同一檔位上,甚至可能早期的一些投入基本打水漂了。
不過(guò),中小企業(yè)有自身的靈活優(yōu)勢(shì),船小好掉頭,可以基于ChatGPT這類應(yīng)用,針對(duì)細(xì)分垂域做專用的領(lǐng)域模型(例如做ChatGPT+領(lǐng)域模型的混合模型)。而對(duì)于巨頭來(lái)說(shuō),由于細(xì)分領(lǐng)域眾多,即便分散兵力、撒胡椒面也未必劃算。他強(qiáng)調(diào),ChatGPT是通識(shí)智能、千人一面,目前并不具有個(gè)性特征、情感和某些特定領(lǐng)域?qū)<抑R(shí),國(guó)內(nèi)的中小NLP企業(yè)反而可以充分借助ChatGPT帶來(lái)的通識(shí)和多輪對(duì)話能力提升來(lái)拓展更多客戶。
“國(guó)內(nèi)中小企業(yè)說(shuō)不定能誕生有高超天賦的NLP人才,未必不能打造出類似當(dāng)年TMD(今日頭條、美團(tuán)、滴滴)在BAT(百度、阿里、騰訊)之后成為新巨頭的故事。因?yàn)榫揞^內(nèi)部有嚴(yán)格的季度ROI考核,對(duì)于ChatGPT這類需要多年冷板凳的研發(fā)項(xiàng)目不是太友好,頂尖項(xiàng)目在巨頭內(nèi)部發(fā)展未必好”,陳巍從研發(fā)方面指出了中小企業(yè)的可能性。
其次,對(duì)于做NLP應(yīng)用的中小創(chuàng)業(yè)企業(yè)來(lái)說(shuō),他們往往側(cè)重于場(chǎng)景、模型研發(fā)少,ChatGPT這類產(chǎn)品會(huì)在一定程度上加劇同質(zhì)化競(jìng)爭(zhēng)。但接入ChatGPT,也會(huì)讓這些企業(yè)更好地提升服務(wù)獲得更多客戶。特別是那些有深厚行業(yè)積累、充分理解行業(yè)的NLP應(yīng)用企業(yè),反而會(huì)進(jìn)一步受益。就好比淘寶最初把中小商家和大商家放到同一個(gè)平臺(tái)上,開(kāi)始的時(shí)候競(jìng)價(jià)激烈,但后來(lái)大家發(fā)現(xiàn)平臺(tái)大了,客戶圈也大了,反而擴(kuò)展到省外甚至國(guó)外。
2年后有望追上ChatGPT現(xiàn)有水平?
以ChatGPT為代表的AIGC應(yīng)用,離不開(kāi)大數(shù)據(jù)、大算力、大模型的訓(xùn)練結(jié)果。當(dāng)我們面對(duì)這股龍卷風(fēng)般的潮流席卷時(shí),首先要看清自身的水平和現(xiàn)實(shí)差距。
陳巍指出,首先數(shù)據(jù)方面,國(guó)內(nèi)的高質(zhì)量語(yǔ)料較少,大部分能用的語(yǔ)料標(biāo)記質(zhì)量恐怕達(dá)不到ChatGPT的訓(xùn)練要求。就拿OpenAI來(lái)說(shuō),是雇用了約40多個(gè)全職的標(biāo)記員,按照特定的要求來(lái)標(biāo)記語(yǔ)料,而不是直接找數(shù)據(jù)公司買通用的標(biāo)記數(shù)據(jù)。推測(cè)這個(gè)標(biāo)記方法應(yīng)該與其訓(xùn)練策略密切相關(guān),可能有一定的保密要求,是完全私有的數(shù)據(jù)集。因此,國(guó)內(nèi)企業(yè)首先要補(bǔ)上私有數(shù)據(jù)集這個(gè)短板、以及數(shù)據(jù)集的標(biāo)記策略,而這可能都是大量燒錢訓(xùn)練之后學(xué)到的經(jīng)驗(yàn)。
再說(shuō)模型本身。以ChatGPT為例,基本上國(guó)內(nèi)大部分開(kāi)發(fā)者都是從開(kāi)源的GPT-2開(kāi)始起步,大部分企業(yè)恐怕要經(jīng)過(guò)大量的盲人摸象般的訓(xùn)練才能進(jìn)階到GPT-3的水平,然后再繼續(xù)訓(xùn)練到GPT-3.5和ChatGPT。假如按理想的情況:準(zhǔn)備數(shù)據(jù)和摸索訓(xùn)練方法用半年,GPT-2到GPT-3用半年,依此類推,大概也需要2年時(shí)間才能追上ChatGPT現(xiàn)有的速度。而這還是項(xiàng)目進(jìn)展順利、沒(méi)有被公司砍掉的情況下。而2年后,國(guó)外可能已經(jīng)進(jìn)階到GPT-5或者GPT-6的水平了。
最后是大算力芯片,這才是對(duì)國(guó)內(nèi)開(kāi)發(fā)者最頭大的事情。大模型訓(xùn)練規(guī)模的現(xiàn)實(shí)擺在那里,即便使用GPU,也要消耗巨大的成本。“現(xiàn)在看GPU訓(xùn)練大模型,有點(diǎn)像早期的深度學(xué)習(xí)研發(fā)人員看CPU訓(xùn)練AlexNet這些早期的深度學(xué)習(xí)模型,訓(xùn)練成本很高,速度又慢,這是大模型訓(xùn)練未來(lái)需要努力改進(jìn)的方向”,陳巍表示。
綜合來(lái)看當(dāng)前的三方面短板,數(shù)據(jù)和模型方面,可以通過(guò)大量資金投入和研發(fā)人員的努力來(lái)補(bǔ)上;但大算力芯片方面,則需要半導(dǎo)體和相關(guān)產(chǎn)業(yè)鏈的整體提升,這點(diǎn)并不容易且是一個(gè)長(zhǎng)期的過(guò)程,可能會(huì)成為國(guó)內(nèi)趕超的重中之重。
寫在最后
一個(gè)朋友感慨:“我對(duì)AI的印象還停留在人工智障階段,怎么突然就成了再進(jìn)宮的甄嬛——不可同日而語(yǔ)了?”
ChatGPT的橫空出世,讓AI再度引發(fā)轟動(dòng)。隨著國(guó)內(nèi)AI大模型的發(fā)展,使用成本的降低,AI將通過(guò)各種NLP或AIGC應(yīng)用進(jìn)入每個(gè)人的生活,甚至成為普通人的伙伴、助手或老師。ChatGPT這類大模型技術(shù),還可以與機(jī)器人或傳統(tǒng)的制藥、材料、航空、汽車等領(lǐng)域結(jié)合,促進(jìn)行業(yè)技術(shù)的快速發(fā)展。
因此,ChatGPT絕不僅僅是一個(gè)聊天機(jī)器人,也不會(huì)止步于顛覆現(xiàn)有的搜索引擎,它可能只是通用人工智能的一道開(kāi)胃菜。