亚洲国产高清不卡在线播放,成年免费a级毛片

白交發(fā)自凹非寺

國內(nèi)玩家如火如荼入局ChatGPT，其在各行業(yè)出圈也有目共睹。

但具體什么時候能上崗尚且還不明晰，尤其像一些艱深、壁壘性高的行業(yè)，比如醫(yī)療。

現(xiàn)在，一位哈佛醫(yī)學院教授，就親自下場測試ChatGPT的表現(xiàn)。

結果顯示，它在45個案例中的39個診斷正確，正確率87%（超過了現(xiàn)有機器診斷率的51%）；并為30個案例提供了適當?shù)姆衷\建議。

他表示，ChatGPT輔助診斷的表現(xiàn)，已經(jīng)接近醫(yī)生。既然如此，那什么時候可以上崗？

事實上，這也是目前國內(nèi)大多數(shù)玩家所面臨的問題：紅利在此，如何率先吃掉？

此前我們也系統(tǒng)性地梳理過復刻中國版ChatGPT背后的技術與生態(tài)難度，顯然不是短期就可以實現(xiàn)的。

現(xiàn)在已經(jīng)衍生出來一種新思路：直接打造行業(yè)垂直版ChatGPT。

這種方式是否可行？

打造行業(yè)版ChatGPT可行嗎？

ChatGPT的打造，技術核心繞不開算力、數(shù)據(jù)和算法三要素。

算力方面，OpenAI背靠微軟這頭奶?！獡碛?8.5萬個CPU核心、1萬個英偉達V100 GPU，光是訓練一個GPT-3，費用就高達460萬美元；數(shù)據(jù)上，GPT系列幾經(jīng)迭代優(yōu)化，一度驚艷眾人的GPT-3就有1750億參數(shù)，而上一版本GPT-2只有15億參數(shù)；算法自然也有多年深厚的積累，否則也不能出現(xiàn)“類人”自主學習特征，而且進一步展現(xiàn)出快速適應多領域、多場景的能力。

再加上生態(tài)反哺技術，形成迭代閉環(huán)。OpenAI自GPT-3開始就以開放接口的形式，構建起了專屬“GPT生態(tài)”。據(jù)gpt3demo網(wǎng)站統(tǒng)計，目前已有656個調(diào)用GPT-3系列模型開發(fā)的應用程序。

這樣的技術與生態(tài)壁壘，決定了復刻ChatGPT并非那么容易。既然如此，垂直版ChatGPT的解決思路也開始在行業(yè)中探討。

首先從技術上來看，他們的核心挑戰(zhàn)主要在于以更少的參數(shù)，比如以百億規(guī)模參數(shù)量，在垂直領域的任務達到或超過ChatGPT的效果。

這可能比復現(xiàn)ChatGPT更難，因為參數(shù)數(shù)量要小很多，不能僅僅依賴“暴力美學”，還要有高超的模型設計和壓縮技巧。

另外一個挑戰(zhàn)是數(shù)據(jù)來源的不同。

像谷歌、微軟他們其實有天然的通用數(shù)據(jù)來源，但專用數(shù)據(jù)積累不能跟垂直玩家相比。

尤其像醫(yī)療等民生行業(yè)，專業(yè)性強覆蓋面廣，所需的高質量數(shù)據(jù)可能并不比ChatGPT小，且大部分數(shù)據(jù)不是網(wǎng)上可以抓取的。

但對多年深根于此的垂直玩家來說，他們早已構筑起自己的產(chǎn)業(yè)生態(tài)，有豐富的行業(yè)數(shù)據(jù)和知識積累，為復現(xiàn)ChatGPT奠定了必要的基礎。

而且從價值需求來看，垂直行業(yè)所代表的價值是實實在在的。像醫(yī)療本身需求就不小，一旦ChatGPT落地醫(yī)療，所代表的社會價值很大。

以往用戶們會習慣性使用的用搜索、APP來幫助診斷自己的疾病，但往往可能收效甚微。

哈佛醫(yī)學院教授Ateev Mehrotra曾測試，現(xiàn)有的在線診斷器平均正確率僅在51%，而ChatGPT則有87%，因此他認為ChatGPT有可能成為醫(yī)療診斷的游戲規(guī)則改變者。

為了加速ChatGPT應用落地，從技術難度、價值需求等維度看，打造垂直版ChatGPT是可行的。

而現(xiàn)在國內(nèi)有AI玩家，已經(jīng)在這樣做了。

云知聲ChatGPT行業(yè)版

最新曝光的進展，智能語音賽道獨角獸云知聲正在推進ChatGPT行業(yè)版的建設——

以醫(yī)療作為切入口，構建ChatGPT醫(yī)療行業(yè)版，同時基于ChatGPT行業(yè)版構建平臺，快速擴展到其他領域，再利用領域模型集成MoE（Mixture of Experts）技術，訓練得到通用ChatGPT模型。

而這種從專用到通用的思路。其實是云知聲一貫的“U+X“做法。在這里，“U”指的通用大模型算法研發(fā)及高效訓練底座平臺；“X”則是應用于多個行業(yè)領域的專用大模型版本。

事實上這也正在成為不少企業(yè)入局ChatGPT的思路，這樣一來，可以利用已有的專用數(shù)據(jù)優(yōu)勢。

不過也不是那么容易走的，更何況云知聲選擇的，還是對生成內(nèi)容質量要求更高的醫(yī)療行業(yè)作為切入口。

最首要的難題，是要提高醫(yī)療知識的可靠程度。ChatGPT最擅長的，就是一本正經(jīng)地胡說八道。放在現(xiàn)在Bing上聊天搜索、內(nèi)容生產(chǎn)其實問題不大，用戶們也樂在其中。

但應用在行業(yè)中，往往讓非專業(yè)人士難以察覺，這會引發(fā)各種風險。因此行業(yè)版ChatGPT要杜絕一切胡說八道，尤其像醫(yī)療、教育、工業(yè)等行業(yè)，內(nèi)容生成要求極高容錯率很低，也對數(shù)據(jù)的質量要求也就更高了。

其次，就是實現(xiàn)行業(yè)中的“性價比”。任何一項技術能夠大規(guī)模落地，都必須要解決「如何以有限的資源，實現(xiàn)效果的最大化」問題。

這也是ChatGPT行業(yè)落地的必經(jīng)之路——模型能以更小的參數(shù)規(guī)模，達到與ChatGPT同樣的效果。這也就給這些企業(yè)帶來了不小難題。

事實上，云知聲也坦言，ChatGPT行業(yè)版的參數(shù)可能也需要達到百億量級規(guī)模，要做出效果并實現(xiàn)規(guī)模化應用挑戰(zhàn)也不小。

從某種程度上說，打造行業(yè)版的ChatGPT比現(xiàn)在通用的ChatGPT還要更難，但到真正ChatGPT行業(yè)落地時，這些問題又都必須得解決。概括來說，就是實現(xiàn)ChatGPT工程化能力。

這是每個躬身入局者，繞不開但必須得過的路。

在此基礎上，毫無疑問的是，云知聲的選擇更難——醫(yī)療作為切入口。這是始終被認為是行業(yè)壁壘高、專業(yè)性強、技術難度制高點的領域，也是為什么相較于其他行業(yè)的盛況，醫(yī)療AI玩家就顯得少之又少的原因。

但一旦將醫(yī)療版ChatGPT打通，那么其他領域的實現(xiàn)，包括最后的通用大模型也就事半功倍了。

作為成立于2012年的AI公司，他們一直密切關注AI前沿技術，并積極推動技術產(chǎn)業(yè)化應用，包括2012年的深度學習算法升級和產(chǎn)業(yè)化應用，到2016年Atlas超算平臺、知識圖譜和全棧AI技術應用，到現(xiàn)在基于ChatGPT框架的AGI認知技術升級。

同時，在醫(yī)療行業(yè)有近10年深耕，積累的行業(yè)知識、數(shù)據(jù)和應用，還獲得了2019年北京市科技進步一等獎。

在回應是否有信心打造ChatGPT行業(yè)版時，云知聲方面表示：完全有信心。

前面總結，打造ChatGPT離不開高質量的數(shù)據(jù)，領先的算法和充分的算力。而對于垂直版ChatGPT還需要更深厚的工程化能力。

從這幾方面來看，云知聲的確具有行業(yè)參考性。

數(shù)據(jù)方面，近10年來云知聲積累了全方位的行業(yè)數(shù)據(jù)，包括面向患者的導診、預問診、患者教育和隨訪系統(tǒng)，也有面向臨床的語音病歷，病歷質控，單病種質控和醫(yī)療風險管理系統(tǒng)，已有近400家醫(yī)院落地使用。據(jù)稱數(shù)據(jù)規(guī)模已達到了5T，為醫(yī)療行業(yè)語言大模型提供數(shù)據(jù)基礎。

算法方面，而ChatGPT所代表的認知智能，本身就是云知聲核心技術優(yōu)勢。他們構建了國內(nèi)最大的醫(yī)療知識圖譜之一。從2019年至2022年，云知聲的認知智能技術在國內(nèi)外相關評測中榮獲7冠5亞。其自主研發(fā)的醫(yī)療預訓練語言模型CirBERTa一度登頂中文醫(yī)療信息處理挑戰(zhàn)榜榜首。

在算力上，云知聲超算平臺浮點計算能力可達8億億次/秒,可為千億級參數(shù)規(guī)模模型提供算力保障。

而在大模型工程化方面，云知聲已經(jīng)研發(fā)了CirBERTa模型，復現(xiàn)了GPT-2模型，并利用模型壓縮和知識蒸餾機制，實現(xiàn)了線上推理效率的近百倍加速，為大模型的廣泛應用奠定了基礎。

此外作為行業(yè)版ChatGPT，內(nèi)容質量保障也是關鍵一環(huán)。

云知聲給出的解決方案是，利用應用在CirBERTa的持續(xù)學習和知識嵌入技術，基于已有知識圖譜積累，優(yōu)化ChatGPT模型的知識獲取和更新機制。

據(jù)介紹，這樣一來可以保證ChatGPT回答中的知識正確性，與此同時還可以給出知識溯源信息。

另外，利用云知聲業(yè)內(nèi)領先的病歷質控技術，可以自動發(fā)現(xiàn)生成的病歷中的問題，進而自動生成作為ChatGPT核心技術的基于人類反饋的強化學習（RLHF，Reinforcement Learning from Human Feedback）所需的用戶反饋數(shù)據(jù)，加速模型的優(yōu)化。

誰最先吃掉ChatGPT紅利？

最后回到事件本身，此前論及ChatGPT對行業(yè)的價值，都是從宏觀上的產(chǎn)業(yè)生態(tài)和模式創(chuàng)新上談，比如對人機交互、信息分發(fā)、內(nèi)容生產(chǎn)等方面。

如今隨著越來越多的垂直企業(yè)入局，ChatGPT對企業(yè)的意義也呼之欲出——一種全新AGI的技術范式選擇：基于“大規(guī)模通用基礎模型+輕量級行業(yè)應用優(yōu)化”的行業(yè)知識整合和問題解決方法。

以往這些場景玩家，對于AI的探索可能處于“看山是山、看山不是山”的懵懂狀態(tài)，現(xiàn)在出現(xiàn)了一座“更小，而且明知會有路的山”。

ChatGPT所表現(xiàn)出來的“智能”，給他們帶來了一種明確的技術方向。

云知聲CEO黃偉也深有體會，甚至于相較于AlphaGo，他認為ChatGPT所帶來的影響要深厚得多，相當于一場新的“工業(yè)革命”。

這場革命最大的優(yōu)勢是，通過自監(jiān)督注意力機制，能夠充分利用海量無監(jiān)督數(shù)據(jù)訓練通用基礎模型，并將感知、認知與生成，用統(tǒng)一框架實現(xiàn)“端到端”的整合，直接從高質量生成結果上去呈現(xiàn)機器智能。機器采取的人工引導的數(shù)據(jù)驅動學習方法，與人類的邏輯思維方式是完全不一樣的，類似飛機所采用的噴氣式“空氣動力學”機制，與鳥類采取的“扇動翅膀”方式完全不同。

不管是對整個產(chǎn)業(yè)，還是單個企業(yè)而言，ChatGPT所帶來的價值確實讓他們不跟不行。

尤其對于一些場景玩家來說，他們還是最有可能吃掉ChatGPT紅利的一撥人。

他們有場景有數(shù)據(jù)、有深厚的行業(yè)壁壘，一旦具備ChatGPT能力，就可以率先在行業(yè)落地。這是其他玩家所不能及的先發(fā)優(yōu)勢。

上一次AI浪潮來襲時，最終也是場景玩家率先吃掉AI紅利。只不過現(xiàn)在ChatGPT是直接以技術路徑出現(xiàn)，落地速度自然要比以往快得多。

云知聲CEO黃偉也給出了個明確的時間點：