一張名為《大模型的深淵》的圖,在去年廣為流行。吃瓜群眾驚詫地發(fā)現(xiàn),原來絕大多數(shù)大模型,都擠在深不見底的層級,“宣稱自己快要落地的”“再等等決定啥時候落地的”“什么落地不落地的”“怎么還有這么多沒聽說過的大模型啊”……
時至今日,國產(chǎn)大模型數(shù)量已經(jīng)達(dá)到200多個,“深淵”更深。
其中,很多低水平重復(fù)造輪子的大模型,無法滿足個人和產(chǎn)業(yè)的使用需求,發(fā)布之后無人問津,已經(jīng)不可能在業(yè)內(nèi)翻起什么波瀾了。而那些真正具備技術(shù)價值和商業(yè)價值的大模型,也如同“潛龍?jiān)跍Y”,逐漸顯露出“一飛沖天”的苗頭。
上一波2015年左右開始的AI創(chuàng)業(yè)浪潮,以CV計(jì)算機(jī)視覺技術(shù)為主導(dǎo)的初創(chuàng)企業(yè)中,號稱“CV四小天鵝”的商湯科技、曠視科技、云從科技、依圖科技,也被譽(yù)為中國的“AI四小龍”,成為那一個AI繁榮周期中的標(biāo)志性創(chuàng)新企業(yè)。
那么,由大模型開啟的新一輪繁榮周期中,自然也會有“潛龍?jiān)跍Y”。誰會成為類似“AI四小龍”這樣的潛力股呢?答案基本藏在這三個梯隊(duì)里。
大模型“四小龍”的一鱗半爪
業(yè)內(nèi)流傳一句話:小創(chuàng)新靠大廠,大創(chuàng)新靠小廠。從昔日的DeepMind到去年的OpenAI,這些年輕、新銳的技術(shù)團(tuán)隊(duì),回歸創(chuàng)新本源,一次又一次給業(yè)界帶來顛覆性的變化,成為從業(yè)者和投資人眼中的“潛力股”。
所謂大模型的“潛龍”,有兩個基本條件:
一是“潛”,相比谷歌、微軟、英偉達(dá)、百度、騰訊、阿里等科技巨頭,成立時間更短、隊(duì)伍更加年輕化,組織效率和靈活度更高。
二是“龍”,有著不輸給大廠,甚至超越大廠的技術(shù)創(chuàng)新性,基礎(chǔ)模型是自研的,并且是L0級的通用大模型,可以為行業(yè)大模型、垂類大模型提供底座,具備向多個產(chǎn)業(yè)轉(zhuǎn)化的潛力,有望帶來高增長和高投資回報率。
雖然機(jī)器視覺公司也都推出了大模型,技術(shù)實(shí)力不俗,但并不算是AI新面孔。而使用開源LLaMA 架構(gòu)的零一萬物,以及被大廠收購不再獨(dú)立競爭的光年之外,雖然夠“新”,但發(fā)展遇到較大的轉(zhuǎn)折點(diǎn)。所以這些企業(yè)及其大模型,我們就不放在此次討論。
總體來說,有三類大模型企業(yè),目前都得到了國內(nèi)外知名投資機(jī)構(gòu)或行業(yè)客戶的支持,擁有較高的技術(shù)認(rèn)可度與商業(yè)轉(zhuǎn)化潛力,可以被看作是“大模型四小龍”的預(yù)備役。
1.明星派
明星創(chuàng)始團(tuán)隊(duì),具備在工業(yè)界或?qū)W術(shù)界的知名度和影響力,打造的大模型一出世,便憑借“明星效應(yīng)”,備受業(yè)界關(guān)注。
包括,由前搜狗公司CEO王小川創(chuàng)立的百川智能(2023年3月,擁有多種參數(shù)的Baichuan系列大模型);由前商湯研究院副院長閆俊杰創(chuàng)立的Minimax(2021年12月,擁有ABAB 大模型);由中國最早從事中英機(jī)器翻譯領(lǐng)域的研究者之一、2023年ACL Fellow周明博士創(chuàng)辦的Langboat瀾舟科技(2021年6月,擁有通用大模型孟子)。
2.技術(shù)流
相比“明星效應(yīng)”,技術(shù)流更強(qiáng)調(diào)技術(shù)實(shí)力,其中典型代表是智譜AI。作為一家清華系初創(chuàng)公司,智譜AI在2019年成立時就把OpenAI當(dāng)作對標(biāo),將實(shí)現(xiàn)AGI通用智能作為目標(biāo),是中國最早啟動預(yù)訓(xùn)練模型研發(fā)的科技公司之一。智譜AI最新發(fā)布的基座大模型GLM-4,在一系列評測中的表現(xiàn)也被認(rèn)為逼近了OpenAI的GPT-4。
3.務(wù)實(shí)派
被寄予厚望的明星派、技術(shù)流,都是“高高在上”的,從業(yè)務(wù)/商業(yè)土壤上生長出來的務(wù)實(shí)派大模型,也可能憑借落地應(yīng)用而闖出一條路。比如2023年問世的“天工”大模型,由昆侖萬維自主研發(fā),大模型AIGC與昆侖萬維的搜索、游戲、社交、娛樂等業(yè)務(wù)的結(jié)合,快速進(jìn)入應(yīng)用周期,也讓昆侖萬維成為闖入大模型領(lǐng)域的一匹黑馬。
需要說明一下,三個類別是看“最長板”,并不意味著其他賽道的能力不高。
擁有明星創(chuàng)始團(tuán)隊(duì)的大模型,性能也可能并不遜色于技術(shù)流;擁有強(qiáng)大基座模型的技術(shù)流,也可能牽起強(qiáng)悍的運(yùn)營隊(duì)伍,帶動產(chǎn)品落地;而務(wù)實(shí)派是“根據(jù)釘子造錘子”,但錘子要是不夠硬,啥也砸不下去,所以技術(shù)能力也得過硬。
凝視大模型的“商業(yè)化”深淵
對標(biāo)“AI四小龍”,可能并不讓大模型企業(yè)很高興,反而是憂慮更多。
以計(jì)算機(jī)視覺為核心的“AI四小龍”前期融資能力很強(qiáng),但普遍遭遇了商業(yè)化的艱難探索,面臨盈利難、市值下降等困擾。而大模型的落地“深淵”,背后是更加漫長的商業(yè)化之路。
但是,逃避、諱莫如深,是無法打消投資人、市場和用戶的顧慮的。無論大模型企業(yè)是否愿意凝視深淵,深淵一直都在凝視著大模型。
直面大模型的“商業(yè)化”深淵,相比上一輪AI,有三新一舊:
三新:新環(huán)境、新規(guī)模、新要求。
簡單來說,大模型企業(yè)面臨著更加嚴(yán)苛的融資環(huán)境,隨著全球流動性衰減,科技企業(yè)的高估值都很難保持,龐大如谷歌都在裁員“降本增效”,融資難度更大了,比如智譜AI的融資水平就明顯不及當(dāng)年的商湯科技。
同時,大模型又是一個重投入的行業(yè),基座模型的技術(shù)競賽,還遠(yuǎn)遠(yuǎn)沒到終結(jié)的時候,持續(xù)向上探索意味著長期燒錢,需要的資金規(guī)模更大。而吸取了上一輪AI投融資經(jīng)驗(yàn)的投資人,面對大模型也格外冷靜,對初創(chuàng)企業(yè)的自身造血盈利能力提出了更高的要求。
一舊:AI標(biāo)品化依舊很難。
南橘北枳,在中國做AI,照搬OpenAI是絕對不行的,要看到鐵一般的事實(shí):中國toC市場對AI等軟件產(chǎn)品的付費(fèi)意愿不高,監(jiān)管嚴(yán)格,很難做,真要做也要配備龐大的團(tuán)隊(duì)去確保安全合規(guī),投入并不小。
toB市場也有很大的差異,國內(nèi)企業(yè)大多不信任SaaS模式,更傾向于私有化部署,行業(yè)市場分散,中小客戶眾多,需求紛繁復(fù)雜,高薪的算法工程師到一線做一個幾十萬的項(xiàng)目很常見。
至于toG市場,智能化項(xiàng)目競爭激烈,而且事多錢少利潤薄,上一輪機(jī)器視覺公司基本在做自動駕駛、智慧城市、安防等業(yè)務(wù),都掙的是辛苦錢。一般來說,CV計(jì)算機(jī)視覺類項(xiàng)目費(fèi)用,是比NLP自然語言處理類高的,所以大語言模型想要靠項(xiàng)目制獲得高客單價,也是很困難的。
究其原因,ToB/ToG市場的AI項(xiàng)目,大多以解決方案式落地,政企機(jī)構(gòu)更希望打包式引入AI、云、IoT等軟硬件,針對自身打造定制化方案,AI產(chǎn)品無法以標(biāo)準(zhǔn)化、模塊化的形式快速交付,前期要投入很高的成本。
從這個角度看,整體投入更大、單個項(xiàng)目收益更小,大模型的商業(yè)化挑戰(zhàn),比上一波機(jī)器視覺公司更嚴(yán)峻。
那么,“大模型四小龍”,會重蹈覆轍嗎?
龍躍于淵大模型盈利出路在哪里?
悟已往之不諫,知來者之可追。面對AI商業(yè)化難題,也不必悲觀,事實(shí)上,我們看到大模型“四小龍”預(yù)備役們,大多能開始吸取經(jīng)驗(yàn)開新局。我們也發(fā)現(xiàn)了一些共同點(diǎn):
共同點(diǎn)一:降本,但不“增笑”。
對內(nèi)“節(jié)流”,提高人效。相比上一輪AI創(chuàng)業(yè)熱潮中“高薪挖算法/科學(xué)家”,這些大模型“潛龍”從一開始就會注重“人效比”。
此前科技行業(yè)的高流動性、高估值,也催生了“獨(dú)角獸”們隨意擴(kuò)張,反而造成了大量的低效現(xiàn)象,比如硅谷“神員工”精通各種編程語言,原來是把工作外包給多個中國工程師,幾年都沒被發(fā)現(xiàn)。這種環(huán)境也導(dǎo)致創(chuàng)新大幅度收縮,初創(chuàng)企業(yè)招人成本奇高。
而這波大模型創(chuàng)業(yè)熱潮中,企業(yè)對于人員擴(kuò)張都是比較謹(jǐn)慎的。周明曾對媒體說過,開始創(chuàng)業(yè)時團(tuán)隊(duì)只有他自己,后來擴(kuò)展到5個人,慢慢開始訓(xùn)練模型,以一個“輕量化”的團(tuán)隊(duì)做出的孟子模型,未來應(yīng)該長期穩(wěn)定在百人的規(guī)模。百川智能、智譜AI也是類似的思路。
對外降本,提升大模型企業(yè)的盈利潛力。幫助企業(yè)和用戶“節(jié)流”,降低應(yīng)用大模型的成本。很多客戶的痛點(diǎn)是,用大模型的成本壓力很大,希望大小模型結(jié)合,來提高投入產(chǎn)出比。比如百川、智譜AI都推出了多種參數(shù)的大模型,來綜合不同需求。
共同點(diǎn)二:聚焦toB,重視現(xiàn)金流。
這些大模型企業(yè)從一開始就聚焦在toB市場,智譜AI的CEO張鵬、瀾舟科技創(chuàng)始人周明都曾明確表示過,優(yōu)先發(fā)展toB企業(yè)服務(wù)業(yè)務(wù)。
從數(shù)字化到智能化,傳統(tǒng)AI廠商需要從零開始做用戶教育,去講述AI技術(shù)降本增效的價值。與之相比,大模型的認(rèn)知度和接納度,都是非常高的。各行各業(yè)對生產(chǎn)力的渴求、對應(yīng)用AI的共識,都非常充沛。這給大模型企業(yè)帶來了非常好的增長基礎(chǔ)。
百煉智能發(fā)布的《大模型招標(biāo)需求分析簡報(2023年1月-11月)》顯示,7月起,隨著國內(nèi)130個大模型相繼問世,大模型招標(biāo)需求量開始呈現(xiàn)明顯上升趨勢。11月迎來增長高峰,需求量較前月翻至近3倍。其中選擇投入10萬-50萬預(yù)算進(jìn)行小規(guī)模嘗試的企業(yè)最多,同時也有不少以國央企為代表的企業(yè)開始釋放百萬級項(xiàng)目預(yù)算。
如前所說,toB的錢也未必好賺。企業(yè)客戶雖然付費(fèi)意愿比C端用戶高,但toC應(yīng)用可以標(biāo)品化、大規(guī)模地吸引用戶付費(fèi),而toB智能化項(xiàng)目卻需要定制化,投入更大。此前機(jī)器視覺公司也曾想將AI模型跨場景、泛化應(yīng)用,但發(fā)現(xiàn)現(xiàn)實(shí)世界的商業(yè)模式依然是強(qiáng)定制,成本居高不下。
這個問題,在大模型創(chuàng)業(yè)者中有比較廣泛的共識,也都在積極探索解法。百川智能CEO王小川曾對媒體透露,要突破toB定制化問題,通過可配置、可調(diào)整的搜索增強(qiáng)知識庫,以產(chǎn)品化的方式,通過不同的產(chǎn)品組合,來解決客戶的定制化需求。
共同點(diǎn)三:廣交朋友,積極開源。
“定制化”之所以成為企業(yè)的天然需求,一個主要原因是AI落地業(yè)務(wù)場景,是從零開始的,AI要和業(yè)務(wù)一起磨合才能發(fā)揮作用,很多場景是無法用一個通用產(chǎn)品來解決的。智能化是一門長期的慢生意,是離不開生態(tài)合作伙伴,去深入行業(yè),做大量定制化工作的。
這些年,我們團(tuán)隊(duì)實(shí)地走訪了不少AI+工廠、AI+養(yǎng)豬、AI+巡檢、AI+煤礦、AI+碼頭等智能化項(xiàng)目,最常見的一個場景就是:AI企業(yè)的科學(xué)家、算法工程師、產(chǎn)品運(yùn)營人員、項(xiàng)目經(jīng)理等各色人等,有的在田間地頭碼頭倉庫,一待就是幾個月,去了解基層人員的工作需求,去從頭設(shè)計(jì)作業(yè)流程。
而智能化往往也伴隨著“去人化”,有的時候一線工作人員也會不理解、不配合,大大延緩項(xiàng)目進(jìn)度。有一年冬天,某煤礦智能化團(tuán)隊(duì)在陜北某場站調(diào)研時,工作人員不想搭理他們,就故意不開暖氣爐,想讓他們大冷天的自己知難而退。還有一次,在一家養(yǎng)豬場,管理方希望用智能攝像頭來實(shí)時感知豬的體溫,防范豬瘟等傳染病,但算法性能一直提不上去,最后技術(shù)人員在現(xiàn)場反復(fù)調(diào)研,發(fā)現(xiàn)是因?yàn)樨i皮太厚了,導(dǎo)致體溫識別準(zhǔn)確率下降……
不難看到,這些十萬、幾十萬的中小微企業(yè)的小項(xiàng)目,可能客單價比不了大B/政府類客戶,但數(shù)量多、規(guī)模大,以基礎(chǔ)大模型作為底座,進(jìn)行定制化開發(fā),可以極大地提高基座模型廠商的使用率,吸引更多伙伴/ISV服務(wù)商去打造商業(yè)版。
吸引行業(yè)伙伴,百川智能、智譜AI、昆侖萬維、瀾舟科技都相繼開源了數(shù)個模型。
但我們都知道,開源容易,做生態(tài)難。一個大模型開源之后,生態(tài)繁榮不起來,沒有開發(fā)者來持續(xù)貢獻(xiàn)、打造商業(yè)版,無法形成正循環(huán)。
要吸引開發(fā)者,一是基座模型的能力還是要過硬,理解分析邏輯不能有硬傷。奧特曼就曾經(jīng)說過,GPT-4的很多問題會在GPT-5得到解決,希望開發(fā)者基于AGI通用人工智能去設(shè)計(jì)業(yè)務(wù)。換句話說,更強(qiáng)大的新模型,可能會將舊模型的商業(yè)價值一筆勾銷,讓開發(fā)者徹底白干。所以,開發(fā)者一定會選擇將時間精力放在那些最先進(jìn)的基座模型上,避免被卷得太快。
此外,需要良好完備的工具棧。大模型要用好,軟件也要做一定的適配和改造,則考驗(yàn)的是大模型廠商的工程化能力,軟件是否對開發(fā)者友好。而“四小龍”中比較多初創(chuàng)公司,工程團(tuán)隊(duì)在規(guī)模、人才、經(jīng)驗(yàn)、積累等方面可能與BAT這類成熟企業(yè)有差距。比如任務(wù)調(diào)度、代碼可讀性、技術(shù)文檔、標(biāo)準(zhǔn)數(shù)據(jù)集等,減輕開發(fā)者和伙伴們的負(fù)擔(dān),共同把大模型用好。
無論是曾經(jīng)輝煌的“AI四小龍”,還是正在崛起的“大模型四小龍”,這些企業(yè)用銳利的技術(shù)和昂揚(yáng)的理想,一次又一次地推高創(chuàng)新的“天花板”,是中國科技不可或缺的一支力量。
智能中國正打開更寬廣的天地,這些大模型“潛力股”,一定會有龍躍于淵,遨游九天。