加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 說“安防+AI”過時(shí),言之尚早
    • 大模型時(shí)代,安防行業(yè)做好準(zhǔn)備了嗎?
    • “新安防、真智能”,安防的下一個(gè)十年屬于智能
    • 結(jié)語
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

安防進(jìn)入大模型時(shí)代,依圖「求索」新十年

2023/12/21
3519
閱讀需 19 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者 | 劉路遙 ,編輯?| 余快

自2016年始,中國的AI視覺創(chuàng)業(yè)俯拾皆是。

他們因AI而齊聚,從最頂尖的學(xué)術(shù)象牙塔中走出,希望用AI之鑰,革新傳統(tǒng)產(chǎn)業(yè)塵封已久的商業(yè)模式。

然而,回看這場探夢之旅,絕大部分高調(diào)入場者,最終都黯然收場,只有寥寥數(shù)家企業(yè)沖破封鎖,其中佼佼者成為人們口中的“AI四小龍”。

最初的高光過后,外界對AI公司高融資、高研發(fā)、高虧損的質(zhì)疑不斷升溫。

在有關(guān)四小龍失速的討論中,技術(shù)光環(huán)褪去,資本熱情消散,政策風(fēng)險(xiǎn)提高,是最人盡皆知的原因。

從同一CV戰(zhàn)線,到分頭走向不同道路,事到如今又面對同樣一個(gè)問題——哪里才有新的生機(jī)?

市場的轉(zhuǎn)機(jī),往往發(fā)生在技術(shù)演進(jìn)的剎那。

在被定義為中國“大模型元年”的2023年,命運(yùn)的齒輪又開始重新轉(zhuǎn)動(dòng)。

藉由AIGC的風(fēng)口,AI賽道一改頹勢,重新占據(jù)各類熱門話題的榜首。

在重新拉開的新賽事中,AI的老玩家們必然不會(huì)缺席。

說“安防+AI”過時(shí),言之尚早

2016年,當(dāng)阿爾法狗在棋盤游戲上奪走人類最后的榮光,AI賽道的投融資開始熱得發(fā)燙。

起初幾年,初創(chuàng)公司們備受風(fēng)險(xiǎn)投資的寵愛,資本爭搶著上前買單,企業(yè)只需醉心實(shí)驗(yàn)室研發(fā),便能坐看估值升高。

然而幾年過去,眼看著企業(yè)在融資、研發(fā)、虧損的泥沼中沒完沒了,商業(yè)化落地又遲遲難以大規(guī)模鋪開,資本逐漸板起面孔,不再愿意聽著故事為虧損買單。

理想中,技術(shù)帶來的饋贈(zèng)之下,這是一場“眾人拾柴火焰高”的合作共贏,但事實(shí)上,大家合力助推的不僅僅是浪涌,同時(shí)還有盛大的泡沫。

隨之而來的,是市場關(guān)于AI商業(yè)模式的探討,能否驗(yàn)證自身商業(yè)化能力,成為評判一家AI企業(yè)新的考核標(biāo)準(zhǔn)。

短短幾年,風(fēng)向急速扭轉(zhuǎn),原因在于AI這一極具顛覆性技術(shù)帶來的暢想,掩蓋了新技術(shù)在價(jià)值轉(zhuǎn)化過程中會(huì)遇到的困難。

安防是AI最早落地的場景之一,通過人臉識別、行為分析等技術(shù),監(jiān)控系統(tǒng)得以提高效能。但同時(shí),安防行業(yè)的碎片化特點(diǎn),讓標(biāo)準(zhǔn)化、通用化難以實(shí)現(xiàn),導(dǎo)致AI企業(yè)在追求算法和精度的過程中,陷入高度定制化的盈利困局。

尤其隨著雪亮工程建設(shè)尾期結(jié)束,安防行業(yè)也遇到發(fā)展瓶頸,于是有人問,問題是不是出在安防行業(yè),換一個(gè)行業(yè),問題是不是會(huì)迎刃而解?

一個(gè)事實(shí)是:AI確實(shí)遇到了商業(yè)化落地難題,但安防是AI應(yīng)用落地的起點(diǎn),大模型時(shí)代的開啟,安防仍然是一個(gè)不錯(cuò)的起點(diǎn)。

智能化的視角下,智能本質(zhì)上解決機(jī)器學(xué)習(xí)人類的認(rèn)知、視覺、運(yùn)動(dòng)、意識、記憶五個(gè)方面。人工智能的核心技術(shù)包括語言智能、視覺智能、運(yùn)動(dòng)智能。

而視覺智能最大的應(yīng)用場景就在公安,也即狹義的安防市場。

一直以來,AI視覺的落地都在經(jīng)歷同一個(gè)過程,從公安起步,到政府,再到企業(yè),大模型的落地也不會(huì)例外。

在依圖科技副總裁許焰看來,智能化的每一次進(jìn)展,都脫離不了以安防為起點(diǎn),“在政府各部門中,公安部門的信息化一直做得非常超前,對視頻數(shù)據(jù)的利用在業(yè)務(wù)上存在剛需,對技術(shù)理解最深刻,最愿意用新技術(shù)解決面臨的問題?!?/p>

以往問題的癥結(jié)在于,AI原有技術(shù)路線始終難以突破成本瓶頸;如今以大模型為代表的新一輪AI風(fēng)口的出現(xiàn),相當(dāng)于為價(jià)值和成本的兼顧難題提供一個(gè)極佳的解法。

大模型的到來,也為處在轉(zhuǎn)型迷茫期,重新思考自身價(jià)值和出路的AI企業(yè),帶來了新的生機(jī)。

早期成立的AI公司有客戶基礎(chǔ),拿依圖來說,公安行業(yè)大部分都是其老客戶,一旦依圖有新技術(shù),落地轉(zhuǎn)化將非??臁?/p>

更重要的,上一波AI公司在商業(yè)化上吃過苦,早已不再只談技術(shù)領(lǐng)先,他們明白,只有將領(lǐng)先的技術(shù)與業(yè)務(wù)場景相結(jié)合,并做到低成本,才是真正解決用戶痛點(diǎn)。

大模型時(shí)代,安防行業(yè)做好準(zhǔn)備了嗎?

大模型時(shí)代到來,安防行業(yè)做好準(zhǔn)備了嗎?

如果用一句話總結(jié),可以說是:安防市場的需求與技術(shù)浪潮撞了個(gè)滿懷。

在這一輪新的AI風(fēng)口上,四小龍都紛紛趕考多模態(tài)大模型:商湯發(fā)布了“日日新大模型”,云從發(fā)布了“從容大模型”,曠視也發(fā)布了輕量級LLM模型推理框架...今天,依圖的“天問”多模態(tài)大模型雖正式發(fā)布較晚,但事實(shí)上已經(jīng)得到了客戶的積極認(rèn)可,目前在已在30多個(gè)項(xiàng)目中部署應(yīng)用,落地進(jìn)程更進(jìn)一步。

這些AI的老玩家們,從上一輪廝殺中,頑強(qiáng)活了下來,如今藉由此前積累的數(shù)據(jù)和行業(yè)認(rèn)知,從視覺切入多模態(tài)大模型,是一次水到渠成的向外拓展。

近兩年,安防行業(yè)發(fā)展進(jìn)入瓶頸期,增長乏力,放眼安防行業(yè)的主要參與者們,無人不渴望變化,紛紛在廣度、深度兩個(gè)方向?qū)で笃凭种馈?/strong>

廣度上,狹義上的安防市場,從以抓逃布控為主體的公共安全業(yè)務(wù),走向更綜合的城市治理類業(yè)務(wù);與此同時(shí),泛安防市場借助視覺智能化技術(shù),向前進(jìn)入更大的ToB企業(yè)市場,同時(shí)增加非視頻投入,通過擴(kuò)充產(chǎn)品線,尋求更大的增長空間。

深度上,企業(yè)仍以視頻為核心,在智能技術(shù)上進(jìn)一步投入感知智能、認(rèn)知智能,部屬大模型能力。

這兩個(gè)方向的開掘,都與視頻的智能化緊密結(jié)合。

從早期“看得見",到“看得清",再到今天大模型賦能下的“看得懂",視頻智能化經(jīng)歷了L1-L5五個(gè)階段的進(jìn)化:

從圖片的結(jié)構(gòu)化標(biāo)簽到視頻的語義理解;

從眾多的判別式任務(wù)模型到視覺為基礎(chǔ)的多模態(tài)大模型;

從端側(cè)攝像頭AI算力到云邊側(cè)集中式服務(wù)器AI算力;

從人、車的識別到長尾物體的識別;

從標(biāo)簽式篩選交互到基于語義的人機(jī)多模態(tài)交互。

在L5階段,大家基本達(dá)成一個(gè)重要共識:以Transformer為基礎(chǔ)的大模型統(tǒng)一了視頻和大數(shù)據(jù)的底層框架,也開啟了視頻智能化情境理解的新時(shí)代。

意味著面對同一個(gè)指令,整個(gè)流程將從割裂的兩個(gè)步驟簡化成一個(gè)步驟,并且由于省略了中間過程,預(yù)測準(zhǔn)確性將極大提升。

以統(tǒng)計(jì)A路口過去十天的擁堵狀況為例,以往的做法是,先通過攝像頭做解析產(chǎn)生大量結(jié)構(gòu)化數(shù)據(jù),再到數(shù)據(jù)庫環(huán)節(jié)匹配結(jié)果;而視覺和大數(shù)據(jù)的融合,將非結(jié)構(gòu)化的視頻和結(jié)構(gòu)化的數(shù)據(jù)庫做了融合,變成用一個(gè)模型統(tǒng)一解決,具體到操作,只需語音指揮即可,“過去10天A路口特別擁堵,請將該路口的攝像頭調(diào)取出來”。

換言之,大模型時(shí)代,當(dāng)數(shù)據(jù)從一端流入,結(jié)果就會(huì)從另一端直接流出。

于公安行業(yè),將是一場警務(wù)信息化系統(tǒng)的大改造。

首先,大模型將帶來視頻智能化建設(shè)的重大轉(zhuǎn)變。

視頻智能化建設(shè)分兩種模式:一是圖片流,前端相機(jī)直接做智能化,然后把圖片回傳后端做進(jìn)一步分析,缺點(diǎn)是大量信息被丟失;一是視頻流,前端攝像頭負(fù)責(zé)捕捉,后端進(jìn)行視頻分析,雖然保留了視頻中的所有語義,行為能被完整刻畫,但由于沒有大模型的加持,視頻完整語義的價(jià)值并沒有被完全挖掘和使用。

走視頻流的智能化路線,是對客戶更加負(fù)責(zé)的選擇,“圖片流只能做人臉識別,隨著業(yè)務(wù)需求增長,圖片流建設(shè)模式就會(huì)變成斷頭路,只能換新相機(jī);而視頻流對前端建設(shè)有利舊保護(hù),只需后端升級算法即可?!?/p>

考慮到大模型只能部署在后端,未來視頻流智能化或?qū)⒊蔀橹髁鳌?/p>

其次,是IT基礎(chǔ)設(shè)施的重大變化。

前面已經(jīng)提到,傳統(tǒng)的信息化技術(shù),通過前端攝像機(jī)會(huì)產(chǎn)生大量結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)存在數(shù)據(jù)庫里,數(shù)據(jù)庫則存在硬盤里。

大模型時(shí)代,所有數(shù)據(jù)經(jīng)過模型處理,會(huì)生成蘊(yùn)含對視頻語義完整理解的特征向量,特征向量存在向量數(shù)據(jù)庫里,向量數(shù)據(jù)庫存在顯存里。

在從傳統(tǒng)數(shù)據(jù)庫變到向量數(shù)據(jù)庫的過程中,基礎(chǔ)設(shè)施層面,也將從過去建CPU為主的數(shù)據(jù)庫系統(tǒng),到建設(shè)GPU為主的向量搜索系統(tǒng)。

基于這一認(rèn)知,依圖在2022年發(fā)布了求實(shí)服務(wù)器。

對于這款服務(wù)器的誕生,許焰如此解釋:“進(jìn)入到向量時(shí)代,超融合架構(gòu)的服務(wù)器威力非常大,依圖求實(shí)服務(wù)器有一個(gè)最大的特點(diǎn),內(nèi)存即顯存,因?yàn)榧幢?a class="article-link" target="_blank" href="/manufacturer/1000151/">英偉達(dá)的A100也只有40G的顯存,但求實(shí)服務(wù)器內(nèi)存可以到512G,甚至1T?!痹S焰介紹。

再者,從生產(chǎn)過程講,有了預(yù)訓(xùn)練大模型,用戶需求端到端的時(shí)間以及成本會(huì)被極大壓縮。

一方面,用大模型技術(shù)替代過去小模型,可以極大壓縮生產(chǎn)過程周期,降低算法研發(fā)成本,讓客戶更快享受到技術(shù)的紅利。

比如,當(dāng)用戶要做一個(gè)“騎電瓶車不戴頭盔”的需求時(shí),AI公司需要先收集數(shù)據(jù)做訓(xùn)練,需求提出到滿足,至少一到兩個(gè)月。

有了預(yù)訓(xùn)練大模型后,只需輸入“騎電瓶車不帶頭盔”的指令,就能生成算法,一周時(shí)間即可達(dá)到之前一兩個(gè)月才有的效果,并且時(shí)間越長,模型精度越高。

另一方面,通過算法和算力的端到端的整合,也會(huì)帶來成本最小化。

許焰舉例,“過去做1萬路視頻智能化,得用16個(gè)機(jī)柜,現(xiàn)在算法和算力實(shí)現(xiàn)端到端整合后,只用一個(gè)機(jī)柜就可以解決所有問題,但整體成本下降了80%?!?/p>

最后,從業(yè)務(wù)層面講,傳統(tǒng)的指揮中心、移動(dòng)警務(wù)、偵查破案等都會(huì)發(fā)生重大變化。

比如指揮中心可以直接通過語音調(diào)取攝像頭,如“幫我調(diào)取所有公園的視頻”、“幫我調(diào)取所有現(xiàn)在擁堵路段的視頻”;移動(dòng)警務(wù)也將變成,民警在路上巡邏上時(shí),不再需要在執(zhí)法儀上打字,而可以高效率地通過語音輸入指令,如“請查詢前方戴黑色帽子的人的身份?!?/p>

“新安防、真智能”,安防的下一個(gè)十年屬于智能

“依圖一直堅(jiān)信安防市場會(huì)從監(jiān)控走向智能?!?/p>

如果說依圖有什么明顯區(qū)別于其他公司的地方,就在于其始終認(rèn)可安防市場的價(jià)值,并用十年時(shí)間堅(jiān)守安防市場。

談到依圖對安防市場的貢獻(xiàn),許焰滿是自豪:

“自2012年成立至今,在安防智能化發(fā)展的各個(gè)階段,依圖都代表業(yè)界最前沿水平。依圖之所以堅(jiān)信安防是個(gè)好市場,一個(gè)原因也在于依圖在安防市場做到了盈利,持續(xù)為客戶創(chuàng)造價(jià)值?!?/p>

這種價(jià)值具體表現(xiàn)為,時(shí)至今日,依圖是安防行業(yè)第一個(gè)推出可實(shí)戰(zhàn)可商用的多模態(tài)大模型的公司。

“第一個(gè)”寫起來雖然簡單,但對于依圖而言,背后是沉甸甸的付出。

2018年,依圖提出“新安防,真智能”的口號,至今未變。

彼時(shí),視覺智能化快速發(fā)展,人臉識別開始進(jìn)入規(guī)?;涞仉A段。依圖的“新安防”口號,為公安業(yè)務(wù)流程的變革而發(fā);“真智能”口號的提出,則強(qiáng)調(diào)了“真正的智能”給安防行業(yè)帶來的差異化的用戶價(jià)值。

進(jìn)入大模型時(shí)代,公安的業(yè)務(wù)流程、智能化程度躍遷到了新的階段,但依圖這句口號的內(nèi)核依然沒有變化。

真正讓人動(dòng)容之處在于,依圖并沒有淪為“口號專家”,而是將口號掛在了實(shí)際行動(dòng)上。

一直以來,客戶看似不合理的追求六個(gè)字:高價(jià)值、低成本。

滿足這個(gè)需求并不容易,尤其在AI這一有著極高技術(shù)和渠道門檻的賽道。

但依圖對這句話的信奉和踐行,是AI公司中難得一見的扎實(shí)。

支撐依圖“安防是好市場”背后的商業(yè)邏輯正是,追求價(jià)值最大化、成本最小化。

依圖2017年開始布局芯片板塊,2019年5月9日發(fā)布首款云端AI芯片“求索”,用于視覺推理領(lǐng)域。

當(dāng)時(shí)的發(fā)布會(huì)現(xiàn)場,依圖通過四塊“求索”芯片,實(shí)時(shí)比對現(xiàn)場觀眾,演示十分鐘內(nèi),無一起誤報(bào)。

依圖之所以向上做芯片,在于看到了算法性能高速發(fā)展和機(jī)器算力提升緩慢的矛盾,這一矛盾導(dǎo)致AI公司們要么犧牲算法性能,削足適履;要么沒有先進(jìn)算法,空耗資源。

而隨著中美科技競爭的加劇,美國對中國芯片的封鎖制裁力度持續(xù)升級,國產(chǎn)化具有高性價(jià)比的芯片產(chǎn)品在此刻顯得尤為重要,依圖的選擇似乎又更具有前瞻性:做硬件和算法的端到端的整合,可以給用戶最高性價(jià)比的后端智能化產(chǎn)品。

如果說,以前因?yàn)槿狈y(tǒng)一的模型結(jié)構(gòu)導(dǎo)致芯片和算法公司難以匹配,在一定程度上說明人工智能芯片還不太成立,那么到今天,這個(gè)阻礙已經(jīng)消失了。

2019年,依圖開始投入以Transformer為基礎(chǔ)的大模型技術(shù),如今回看這一決定,其意義在于,選對了公司未來幾年的發(fā)展路徑。

當(dāng)企業(yè)選擇的方向更準(zhǔn)確,研發(fā)的效率就會(huì)更高效,成本更低,對客戶而言就是更高的性價(jià)比,最終實(shí)現(xiàn)雙贏。

“到今天,依圖的多模態(tài)大模型已經(jīng)在全國30多個(gè)項(xiàng)目中部署應(yīng)用?!睋?jù)許焰介紹,依圖“天問”多模態(tài)大模型,有以下三大特點(diǎn):

其一,視頻語義搜索能力,支持用自然語言搜索各類視頻。

類似“堵塞消防通道的車”、”積水的路面“、”無人看管的紅色行李箱“等表達(dá)都可以快速找出對應(yīng)的視頻。

其二,零樣本、冷啟動(dòng)。

比如要?jiǎng)?chuàng)建一個(gè)騎車不戴頭盔的算法,只需輸入“騎車不戴頭盔”,就能生成算法,并且算法一旦上線,便能在線上做分鐘級的訓(xùn)練,越用精度越高。

其三,內(nèi)置了大量凝結(jié)依圖對行業(yè)認(rèn)知的算法。

通過針對性的將特定數(shù)據(jù)放入訓(xùn)練模型中,如大客流、重點(diǎn)區(qū)域防控等典型算法,來提高模型性能。

今年以來,依圖的天問大模型收到不少令許焰印象深刻的反饋。

某城市交通事故頻發(fā),該市客戶找到依圖做城市路口的常規(guī)違章和不文明行為判定,要求用天問大模型賦能利舊的前端攝像頭。

依圖做了闖紅燈、超速、不禮讓行人、騎車不戴安全帽、違法掉頭、壓實(shí)線等各種各樣的算法,系統(tǒng)上線第一天,準(zhǔn)確度只有60%-70%,一周結(jié)束后精度基本達(dá)到100%,并且成本比以往的建設(shè)成本下降了 60% - 70%。

在許焰的回憶中,“當(dāng)時(shí)這個(gè)客戶特別興奮,因?yàn)橐缊D用一周時(shí)間,解決了該城市交通治理極大的痛點(diǎn)?!?/strong>

除了大型項(xiàng)目,多模態(tài)大模型的意義還在于解鎖長尾算法。

以往,大量中小型客戶,由于支付能力不強(qiáng),此前對AI沒有剛需,未來借助大模型的遷移和通用能力,可以降低成本門檻,這些用戶也能用上用好大模型。

結(jié)語

路漫漫其修遠(yuǎn)兮,吾將上下而求索。

2019年,依圖發(fā)布第一款A(yù)I芯片,從屈原的《楚辭》中找到“求索”一名,表達(dá)了對人工智能技術(shù)、人工智能產(chǎn)業(yè)落地探索的熱情。

與此同時(shí),依圖也開啟了將Transformer技術(shù)用于視覺領(lǐng)域的研究,并同樣從《楚辭》中找到“天問”一名,賦予彼時(shí)還尚出世的視覺多模態(tài)大模型。

時(shí)至今日,依圖在國產(chǎn)化算力上有了“求索”和“求實(shí)”,在大模型算法上有了“天問”。十年AI路,依圖所打造的“全棧AI技術(shù)”和"一站式AI解決方案提供商“的形象也越發(fā)清晰,完整。

在大模型時(shí)代,依圖對安防智能化依然信心滿滿,秉持著為”價(jià)值最大化,成本最低化“的運(yùn)營理念,投入堅(jiān)決。隨著視覺多模態(tài)大模型產(chǎn)品的商用推出和規(guī)模化部署,依圖又一次站在了AI新時(shí)代的浪尖。

大模型時(shí)代必然會(huì)產(chǎn)生新的商業(yè)模式和應(yīng)用場景,在依圖的第二個(gè)十年,我們期待它能再一次引領(lǐng)行業(yè),再一次把“新安防,真智能”的口號變成現(xiàn)實(shí)。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險(xiǎn)等級 參考價(jià)格 更多信息
FT232RQ-TRAY 1 FTDI Chip USB Bus Controller, CMOS, 5 X 5 MM, GREEN, QFN-32

ECAD模型

下載ECAD模型
$4.5 查看
STM32H743XIH6TR 1 STMicroelectronics High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals

ECAD模型

下載ECAD模型
暫無數(shù)據(jù) 查看
MCF52259CAG80 1 Freescale Semiconductor 32-BIT, FLASH, 80MHz, RISC MICROCONTROLLER, PQFP144, 20 X 20 MM, ROHS COMPLIANT, LQFP-144

ECAD模型

下載ECAD模型
$17.28 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜