講真,再熟悉不過的搜索引擎,正影響著我們的思考方式。
正如TCP/IP協(xié)議之父、圖靈獎(jiǎng)獲得者溫頓·瑟夫(Vinton Cerf)認(rèn)為:
搜索引擎,已傾向于成為人類基本記憶的替代品。
怎么理解?
簡(jiǎn)單來說,就是很多情況下,我們不再記憶所需的信息本身,而是記住能把它們搜索出來的方法和關(guān)鍵詞。
而隨著我們對(duì)搜索引擎的越發(fā)依賴,對(duì)其性能也提出了更多要求。
那么站在當(dāng)下,未來的搜索,應(yīng)該是怎樣的呢?
未來的搜索方式:腦機(jī)接口
提到腦機(jī)接口,或許你會(huì)想到馬斯克,想到猴子用“意念”打游戲。
但它也能還跟我們常用的“搜索”聯(lián)系起來?
是的,而且二者的結(jié)合,還是可能“加強(qiáng)人類自身思考能力”的那種。
△ 清華大學(xué)計(jì)算機(jī)系黨委書記,劉奕群
這就是由清華大學(xué)計(jì)算機(jī)系黨委書記劉奕群教授所做的極具未來感的研究。
先來簡(jiǎn)單了解一下腦機(jī)接口的原理:
腦機(jī)接口通過設(shè)備采集大腦中的信號(hào),而后對(duì)信號(hào)進(jìn)行特征提取、轉(zhuǎn)譯,變成計(jì)算機(jī)可以理解的“人腦命令”,最后通過腦機(jī)接口的一些應(yīng)用,實(shí)現(xiàn)對(duì)外部世界的操控。
那它與搜索的結(jié)合點(diǎn),又是什么呢?當(dāng)前的搜索過程大致是這樣的:
用戶產(chǎn)生了“搜索信息”的需求,然后通常會(huì)用“關(guān)鍵詞”的形式在引擎中進(jìn)行搜索;而后搜索引擎會(huì)反饋給用戶結(jié)果,用戶看到之后便會(huì)產(chǎn)生相應(yīng)的感受,也就是“是否滿足了自己想要的答案”。
這是傳統(tǒng)搜索的一個(gè)流程,但卻存在三個(gè)問題。
首先,是查詢。
簡(jiǎn)單來講,用戶搜索需求是非常豐富的,但查詢本身是受到表現(xiàn)形式的影響,換言之,絕大部分人還是依賴關(guān)鍵詞形式的查詢。
其次,是搜索結(jié)果的滿意度。
雖然在查詢過后,搜索引擎會(huì)呈現(xiàn)很多結(jié)果,但這種形式是非常間接的。
具體而言,用戶可能會(huì)去點(diǎn)擊結(jié)果,或者在結(jié)果頁(yè)面上停留一段時(shí)間,但這種反饋毫無疑問,是帶有非常強(qiáng)的歧義性。
最后,是上下文環(huán)境。
用戶在搜索過程中,是具備完整的上下文環(huán)境,包括用戶自身的信息、時(shí)空位置,而對(duì)于這些信息,搜索引擎在很多情況下是沒有利用起來的。
而通過腦機(jī)接口的能力,能做到的事情要比傳統(tǒng)搜索更多。
例如在需求方面,腦機(jī)接口能夠給搜索引擎,除了關(guān)鍵詞之外的更多信息。劉奕群教授表示:
我們想到什么,就能提供給搜索引擎,如此一來,所提供的信息是非常精準(zhǔn)的。
而且不僅僅是查詢的需求內(nèi)容,還有可能是用戶當(dāng)時(shí)的情感信息、周圍環(huán)境對(duì)用戶產(chǎn)生影響的信息等等。
更重要的是,這種提供查詢需求的方式還是近乎實(shí)時(shí)的,因此也更具真實(shí)性。
簡(jiǎn)單來講,腦機(jī)接口+搜索引擎,要做的工作就是:
通過腦機(jī),擁有用戶的情感,感知用戶的情緒,便可以建立良好的心智模型,提供用戶在搜索關(guān)鍵詞之外更加精準(zhǔn)的用戶信息需求描述,更好的提升搜索的體驗(yàn)。
當(dāng)然,這是一件具備未來感的事情,那是否有點(diǎn)“天方夜譚”、可否實(shí)現(xiàn)?
劉奕群教授認(rèn)為,應(yīng)當(dāng)先來思考一下當(dāng)前通過腦機(jī)接口可以實(shí)現(xiàn)的功能。
例如現(xiàn)在可以腦機(jī)接口以高精準(zhǔn)度控制鼠標(biāo)的移動(dòng)、可以把人要說的話“解譯”出來、高端的思考和認(rèn)識(shí)轉(zhuǎn)變成文字,以及通過功能性核磁共振等輔助工具,來研究信息需求產(chǎn)生的過程。
基于此,劉奕群教授提出了對(duì)“腦機(jī)接口搜索”所面臨的三大挑戰(zhàn)。
第一個(gè)難點(diǎn),是需要對(duì)搜索的交互范式進(jìn)行重新定義。
人腦思考方式非常復(fù)雜,很難做到聚精會(huì)神地思考一個(gè)問題,如何提煉相關(guān)性的上下文,還能過濾掉無關(guān)的信息,是另外一個(gè)難點(diǎn)。
第三點(diǎn),就是在提升用戶個(gè)性化體驗(yàn)的同時(shí),如何做到保護(hù)用戶的隱私。
未來的搜索算法:深度語義學(xué)習(xí)
而除了“搜索方式”之外,未來的“搜索算法”,又該是怎樣的?
舉一個(gè)例子,“Future and Options”在普通語境下是“未來與選擇”的意思,在金融語境下卻是“期貨與期權(quán)”。
搜索引擎如何處理這種問題?
搜狗CEO王小川認(rèn)為,未來的搜索將從關(guān)鍵詞搜索走向深度語義搜索。
△ CCF企工委副主任、CCF CTO Club主席、搜狗CEO,王小川
使用稠密向量表示的檢索模型,深度語義特征匹配排序以及自動(dòng)提取搜索答案,實(shí)現(xiàn)深度檢索、深度排序和深度展現(xiàn)。
深度語義搜索雖好,但對(duì)于互聯(lián)網(wǎng)海量的數(shù)據(jù)和紛繁復(fù)雜的用戶意圖,在應(yīng)用中還面臨著三大技術(shù)挑戰(zhàn)。
檢索挑戰(zhàn):語義漂移
人的語言表達(dá)是很隨意的,如果搜索“炒股的炒字是怎么來的”,既可能匹配到與炒股一詞的由來相關(guān)的結(jié)果,但還可能匹配到股票是怎么被炒起來的。
這就是深度語義學(xué)習(xí)在檢索層面的一大挑戰(zhàn)“語義漂移”,使得檢索出的結(jié)果與用戶實(shí)際查詢意圖不完全相符。
排序挑戰(zhàn):結(jié)構(gòu)丟失
傳統(tǒng)倒排索引方式搜索結(jié)果的排序有人工參與,可以對(duì)整篇文檔的結(jié)構(gòu)清晰度、所屬站點(diǎn)的權(quán)威性等特征進(jìn)行提取和打分。
而使用深度語言模型對(duì)檢索結(jié)果提取特征有一定的字?jǐn)?shù)限制,難以覆蓋到整篇文檔。這會(huì)造成排序依據(jù)的“結(jié)構(gòu)丟失”。
展現(xiàn)挑戰(zhàn):價(jià)值稀疏
現(xiàn)在的搜索引擎給出一些結(jié)果條目,需要用戶主動(dòng)在其中瀏覽挑選。而據(jù)統(tǒng)計(jì)有1/4的搜索請(qǐng)求都是問題式,搜索結(jié)果不能直接給出答案是結(jié)果展現(xiàn)的“價(jià)值稀疏”。
搜狗針對(duì)這些問題,采用將傳統(tǒng)倒排索引的結(jié)果和深度語義稠密向量搜索的結(jié)果結(jié)合起來的辦法。
進(jìn)一步的,將兩路結(jié)果的特征相互交叉融合。對(duì)稠密向量檢索結(jié)果計(jì)算內(nèi)容匹配特征,對(duì)倒排檢索結(jié)果計(jì)算語義特征。
最終達(dá)到超過BERT的效果。
除了技術(shù)挑戰(zhàn)之外,深度語義搜索還面臨三個(gè)工程問題。
兩種搜索結(jié)果結(jié)合的辦法增大了運(yùn)行成本,如何做到低系統(tǒng)開銷、可復(fù)用。
如何做到高性能、在高并發(fā)計(jì)算時(shí)如何保障低延遲。
面對(duì)峰值壓力如何做到高可靠性。
如何解決這些問題就是搜狗今后要探索的道路。
CCF C³:連接學(xué)界與產(chǎn)業(yè)界
以上精彩內(nèi)容,全部出自CCF C³的第三期活動(dòng),主題為“深度語義學(xué)習(xí)在搜索的應(yīng)用”,由搜狗承辦。
C³活動(dòng)是由中國(guó)計(jì)算機(jī)學(xué)會(huì)CCF CTO Club發(fā)起的,旨在聯(lián)結(jié)企業(yè)CTO及高級(jí)技術(shù)人才和資深學(xué)者,每次以一個(gè)技術(shù)話題為核心,走進(jìn)一家技術(shù)領(lǐng)先企業(yè)。
第一站走進(jìn)京東,主題為“智能客服”,清華大學(xué)的黃民烈、劉知遠(yuǎn)教授與京東技術(shù)副總裁何曉冬共同探討了下一代智能對(duì)話系統(tǒng)。
第二站走進(jìn)小米,主題為“智能家居”,小米副總裁崔寶秋、小米AI實(shí)驗(yàn)室主任王斌與清華大學(xué)徐迎慶教授分享了AIoT的歷史與智能家居的發(fā)展方向。
本次第三站走進(jìn)搜狗報(bào)告結(jié)束后舉辦了承辦單位旗幟交接儀式,揭曉了下一次活動(dòng)承辦單位是百度,具體時(shí)間是5月14日晚上6:30-9:30。
參考鏈接:
[1]https://dl.acm.org/doi/fullHtml/10.1145/2563407
[2]https://mp.weixin.qq.com/s/zrOR42Gm4xRZASAWik1DOQ