国产成人精品手机在线观看,91精品视频在线

IBM 的辯論家項目（Project Debater）打造了一個對話類 AI，旨在和一個人類辯手進行正式辯論。盡管 Project Debater 在最后一場辯論中落敗于人類辯手，但是在這次失敗之前，它一直霸占著最佳辯手的位置。它的亮點很多，而且確鑿無疑地進入了自然語言處理（NLP）系統(tǒng)的“恐怖谷”，它的表現(xiàn)非常接近人類，它的失誤水準令人尷尬。

IBM 這個項目的亮點在于，它是在一系列舊硬件上訓(xùn)練并交付“辯論家”的，并沒有使用 GPU 等硬件加速器。鑒于現(xiàn)在市場上已經(jīng)存在很多可用的深度學(xué)習(xí)硬件加速器，所以“辯論家”的會話 AI 功能肯定會在未來的幾年內(nèi)具有很大的提升空間。當然，這也可能會加劇社會不滿，因為人們越來越搞不清楚他們是在和人類交談還是和人工智能對話。

“辯論家”項目的初始提案脫胎于 2011 年出現(xiàn)的單個 PPT 幻燈片。由于提交內(nèi)容有限，而且挑戰(zhàn)項目的難度比較大，IBM 管理層經(jīng)過了大約一年的仔細考慮時間才最終批準了該項目。2012 年，IBM 研究院建立了一個項目團隊，正式啟動“辯論家”項目開發(fā)。實際上，該項目的實質(zhì)性工作時在 2014 年展開的。

怎么訓(xùn)練一組深度學(xué)習(xí)模型，使它可以進行辯論呢？要知道，展開一場辯論要比進行一次簡單的采訪復(fù)雜多了。IBM 研究院將這項訓(xùn)練任務(wù)劃分成了三個子任務(wù)：聽力理解、建模人類的爭論、由數(shù)據(jù)驅(qū)動的演講稿生成和表達。

聽力理解
IBM 將聽力理解定義為“從一長串連續(xù)的口語中提取隱藏在其中的關(guān)鍵概念和聲明的能力”。IBM 教“辯論家”針對隨機選擇的主題進行辯論，但是它的前提是，所選主題必須涵蓋在在系統(tǒng)里面多達 4 億篇文章（100 億句話）中得到過充分報道的話題中，其中大部分文章來自于知名報紙和雜志。

“辯論家”實現(xiàn)高水平聽力理解能力的一個關(guān)鍵要素是它的聲明檢測引擎。該聲明檢測引擎能夠在一個句子中找到個別聲明的確切邊界（如果給定的句子里確實給出過聲明的話。IBM 的聲明檢測引擎中有三個級聯(lián)的深度學(xué)習(xí)模型：

1、查找?guī)в新暶鞯木渥樱?br /> 2、在該句子中找到聲明的邊界；
3、確定存在聲明和已經(jīng)找到合適的聲明邊界的可信度。

建模人類的爭論
IBM 創(chuàng)建了所謂的“獨特知識圖表”，以幫助“辯論家”模擬人類爭論和面臨困境的世界。一旦給“辯論家”提供了一個辯論主題，它就會在其知識圖表中展開搜索，尋找最為相關(guān)的原則論據(jù)來支持或者反對這項主題。知識圖表模型使得“辯論家”可以建模出許多不同辯論之間的共性。

數(shù)據(jù)驅(qū)動的演講稿生成和表達
“辯論家”從知識圖表中找出相關(guān)論據(jù)后，將所選擇的這些論點組合成一個帶有說服性的完整敘述，這些論述的長短符合為其分配的發(fā)言時間。然后，它會寫出一個演講稿，并在適當?shù)臅r候清晰地、針對性地（也可以加入一些幽默成分）表達出來。

IBM 強調(diào)，自然語言處理中的演講稿生成和表達是“辯論家”的顯著特征。不過，我們相信，理解人類的言語才將是將 AI 限制在不可思議的“恐怖谷”中或者超越它的關(guān)鍵技術(shù)。

請注意，OpenAI 的文本預(yù)測模型在某一個方面和 IBM 的“辯論家”執(zhí)行了相似的角色，它們都寫了文稿，不過它們也有一定的區(qū)別。OpenAI 的所有新聞報道都是以完成為目的，“辯論家”則是支持或反駁某個觀點，此外，OpenAI 沒有正式辯論賽的時間限制。

復(fù)雜的模型集合
IBM 研究院表示，“辯論家”由數(shù)十種深度學(xué)習(xí)和機器學(xué)習(xí)模型組成，具體數(shù)量取決于對模型的分類和計算方式。他們表示，在辯論期間使用的模型總數(shù)遠遠低于 100 個。

“辯論家”的開發(fā)遇到了機器學(xué)習(xí)領(lǐng)域的經(jīng)典挑戰(zhàn)。由于需要把那么多基礎(chǔ)底層的 AI 模型編排組合在一起，集合的復(fù)雜性增加了。每個 AI 模型都要經(jīng)過經(jīng)過自己的訓(xùn)練過程，許多模型使用的配置和設(shè)置方法都各自不同。一些模型使用監(jiān)督式學(xué)習(xí)技術(shù)，其它模型使用無監(jiān)督學(xué)習(xí)技術(shù)。IBM 研究院沒有談到訓(xùn)練所有這些模型累計花費了多少時間。

“辯論家”項目的大部分研究和開發(fā)工作都是在 IBM 研究院位于以色列海法的實驗室中完成的。IBM 表示，為了訓(xùn)練“辯論家”，IBM 通過其平臺負載共享設(shè)施（LSF）軟件協(xié)調(diào)調(diào)用了 10 臺聯(lián)想系統(tǒng) x3650 M5 服務(wù)器。在研究的過程中，IBM 研究院還在海法使用了一個 GPFS 集群進行數(shù)據(jù)存儲。該本地存儲運行在一個雙節(jié)點的 IBM 頻譜可視化（SVC）集群上，使用了 IBM 的 SAN64B-6 存儲網(wǎng)絡(luò)。

IBM 還沒有公開討論他們在訓(xùn)練“辯論家”模型時使用的機器學(xué)習(xí)和深度學(xué)習(xí)框架。IBM 曾經(jīng)表示，一旦可以把這項技術(shù)商業(yè)化到可以供客戶使用的程度，他們將發(fā)布更多的軟件和硬件細節(jié)信息。

需要注意的是，訓(xùn)練“辯論家”的復(fù)雜模型集合的工作時是在四分之一個未加速的 x86 服務(wù)器機架上進行的，該服務(wù)器機架包含了大約 200 個處理器內(nèi)核。這也表明，人工智能研究通常并不需要使用最新最好的硬件，技術(shù)上的創(chuàng)新和研發(fā)時間可以抵消大部分巨額預(yù)算。
?

“辯論家”的復(fù)雜性 - 對辯論的重新審視
“辯論家”的反駁論據(jù)是由獨立的深度學(xué)習(xí)模型創(chuàng)建出來的，而不是在辯論中創(chuàng)建出這種開放性的論點。在這個完整的反駁論據(jù)集合中會用到幾種模型。反駁論證系統(tǒng)通常是一個比創(chuàng)建開放性論據(jù)使用的模型集合更長的級聯(lián)模型。

“辯論家”會為辯論雙方都實施聲明檢測。這使得系統(tǒng)能夠自動構(gòu)建出兩組論據(jù)，并確定辯論對手可能會使用那些論據(jù)聲明。然后，系統(tǒng)會在辯論期間交叉性地檢查對手可能使用的聲明和實際使用的聲明。下面是該流程的一部分說明：

·確定每個聲明是否反對或者支持“辯論家”當前的觀點；
·確定對手是否在最近的反駁中使用了任何自動檢測到的聲明；
·尋找論據(jù)來反駁對手已經(jīng)表達過的聲明主張；
·找到支持自己當前論點的證據(jù)；
·將這些證據(jù)進一步整合成表達正確且有說服力的陳述中；
·確定是否已經(jīng)在辯論的早期階段聲明了某個論據(jù)。

部署辯論家項目的基礎(chǔ)設(shè)施
為了保證項目進展的彈性，“辯論家”有兩個同時運行的完整運行時基礎(chǔ)設(shè)施。

·現(xiàn)場辯論系統(tǒng)使用了 IBM 云和以色列海法實驗室中運行的基礎(chǔ)設(shè)施的混合體；
·備份實例完全部署在 IBM 云中。

IBM 研究院的運行時“辯論家”系統(tǒng)由以下部分組成：

·主服務(wù)器是一個雙插槽的 IBM/ 聯(lián)想系統(tǒng) System x3650 M5 服務(wù)器。該服務(wù)器內(nèi)置兩個 14 核英特爾 Xeon E5-2600 v4 處理器和 768 GB 系統(tǒng)內(nèi)存。一個實例部署在本地，一個實例部署在 IBM? Cloud 的達拉斯數(shù)據(jù)中心。
·一個 Elasticsearch 集群。該集群包含四臺裸機，每臺機器具有 64 GB 內(nèi)存、12 個內(nèi)核和兩個 960 GB 的 SSD 磁盤。該集群同樣部署了兩個實例，一個部署在達拉斯的 IBM Cloud 中，一個本地部署在以色列海法。
·一個 Cassandra 數(shù)據(jù)庫集群。該集群包含四個 Linux VM，每個 VM 具有 32 GB 內(nèi)存和 4 個內(nèi)核。該集群同樣部署了兩個實例：一個在達拉斯的 IBM Cloud 中，另一個本地部署在海法。

·這些服務(wù)器使用 IBM Cloud 網(wǎng)絡(luò)基礎(chǔ)架構(gòu)以 10 Gb/ 秒的速度聯(lián)網(wǎng)到一起。對于舊金山的現(xiàn)場辯論，IBM 僅使用了 10 Mb/ 秒的互聯(lián)網(wǎng)連接將其現(xiàn)場控制筆記本電腦連接到 IBM Cloud 和海法的 IBM 研究實驗室。
·IBM Watson 基于商業(yè)云的語音到文本服務(wù)和文本到語音服務(wù)。使用 IBM Cloud Kubernetes 群集上的女性語音運行文本到語音服務(wù)。

IBM Cloud 上的 Kubernetes 集群上運行了其他服務(wù)，用于處理投票、事件流管理和后臺屏幕呈現(xiàn)。

IBM 為“辯論家”項目的舞臺展示打造了一個自助服務(wù)終端，該中端只有兩個扁平的屏幕，用于顯示它的頭像。

IBM 沒有在“辯論家”系統(tǒng)中使用 GPU 或者 FPGA 這些計算加速器。

IBM 指出，“辯論家”項目的開發(fā)團隊優(yōu)化了其運行時模型，以滿足辯論對手開場演講和反駁發(fā)言時的一到兩分鐘的時間延遲。

令我們印象深刻的是，IBM 的“辯論家”運行時系統(tǒng)部署在舊的主流服務(wù)器上，卻依然表現(xiàn)良好。如果該系統(tǒng)使用當今最先進的服務(wù)器和存儲系統(tǒng)的話，它的尺寸可能會顯著降低，整個系統(tǒng)可能用 6U 機架高度就能部署完畢。

實時性挑戰(zhàn)
“辯論家”不是那種蹦出一句短句快速響應(yīng)的會話系統(tǒng)。它也沒有設(shè)計成那種開始時幾乎沒有任何背景信息、需要在對話運行時構(gòu)建上下文的對話系統(tǒng)，相反，每次辯論開始時，都已經(jīng)以“決議”的形式給出了背景。這種辯論性質(zhì)的會話由一系列短語和句子組成?！稗q論家”要想?yún)⑴c活躍且響應(yīng)迅速的對話，它的響應(yīng)延遲應(yīng)該控制在一到兩秒的量級。

“辯論家”現(xiàn)在只注意捕捉對手的麥克風(fēng)信息，它并不會傾聽和觀察觀眾的反饋。在現(xiàn)場辯論中，人類辯手會觀察觀眾以評估觀眾對自己的論述的實時反映。請注意，是這些觀眾給辯手打分，辯手需要給這些觀眾留下深刻印象，而不是主持人。原則上，我們相信“辯論家”的繼任者會增加一個全新的模型集合，以在視覺上評估觀眾（點頭、無聊、興奮等）的反應(yīng)，以及在聽覺上評估觀眾（拍手、喘氣、輕笑等）的反應(yīng)。但是，IBM 最初并沒有規(guī)劃這一些，因為辯論并不是 IBM 在商業(yè)上所關(guān)注的點。沒有人類觀眾參加的辯論賽寡淡無味，所以添加上這些反饋能力能夠使得“辯論家”在演講中改變論述的方向。此外，辯論家這一類的系統(tǒng)必須提前創(chuàng)建幾種論述備選，以根據(jù)觀眾的反應(yīng)動態(tài)地選擇。

對于通過智能手機、網(wǎng)絡(luò)攝像頭等進行的群組發(fā)言和一對一聊天來說，解決掉觀察觀眾反應(yīng)問題將使得會話系統(tǒng)看起來更加人性化。21 世紀 AI 的圖靈測試應(yīng)該更多地考慮人性化的影響。

拓展人類的知識
IBM 的“辯論家”團隊開發(fā)了 20 個基準數(shù)據(jù)集，所有的數(shù)據(jù)集都根據(jù) Creative Commons License（CC BY-SA 3.0）或 GNU 免費文檔許可（GFDL）發(fā)布，包括：

19,276 對維基百科概念；
5000 個注釋了情感的習(xí)語；
帶注釋的 3,000 個句子；
有關(guān) 55 個主題的 2,394 個標簽聲明；
由專業(yè)辯手錄制的 60 篇關(guān)于爭議話題的演講。

IBM Research 發(fā)表了 32 篇論文，描述了其在設(shè)計和訓(xùn)練 Project Debater 方面的大部分工作，IBM 還在偏置檢測方面做了大量工作，包括檢測數(shù)據(jù)集中的偏差和檢測訓(xùn)練模型中的偏差。它還發(fā)布了一些描述性的文本片段，這些內(nèi)容可以回溯到它的研究論文里面。

不過，分享研究論文和數(shù)據(jù)集是一回事，分享訓(xùn)練模型就是另外一回事了。如上所述，IBM 研究院僅僅披露了其硬件的一些高層級的詳細信息，但是并沒有詳細介紹軟件框架、運行時模型集合中部署的特定訓(xùn)練模型。IBM 發(fā)布了訓(xùn)練數(shù)據(jù)集，但是并沒有公布特定模型的訓(xùn)練代碼，也沒有給出和其訓(xùn)練模型有關(guān)的任何權(quán)重數(shù)字。我們只能對其運行時軟件架構(gòu)有一個粗略的了解。當然，IBM 已經(jīng)明確表示過，當該技術(shù)商業(yè)化后將發(fā)布更多細節(jié)信息。

考慮到 IBM 正在通過其 Crowd 產(chǎn)品將“辯論家”技術(shù)商業(yè)化到其 Speech 服務(wù)中，所以它至今沒有給出關(guān)于模型訓(xùn)練的詳細信息也在情理之中。

這和 OpenAI 的套路實際上很相似。OpenAI 也發(fā)布了不少博客和有據(jù)可查的論文，描述了帶有 15 億個參數(shù)的 GPT-2“Transformer”模型背后的多任務(wù)學(xué)習(xí)算法，但是 OpenAI 也沒有發(fā)布數(shù)據(jù)集、訓(xùn)練代碼或者 GPT-2 模型的權(quán)重，只是發(fā)布了一些較小、功能較少的訓(xùn)練模型。

OpenAI 在決定不發(fā)布模型時表示了這些模型可能會被濫用的可能性。但是，在它宣布不發(fā)布模型一個月后，它就宣布將通過一家剝離出來的公司將這些模型商業(yè)變現(xiàn)。

看來，人工智能剛開始都是瞄準一些有趣的事情和游戲，然后再用它做一些真正有利可圖的事情。

監(jiān)管 AI
AI 取得了難以置信的快速進步，但是人們還沒有建立合適的文化反對人工智能的濫用。最近的 SXSW 互動會議上就有一個“智能未來”的議題，追蹤了許多會議上凸顯的對 AI 和道德的爭論。

我們于今年 3 月 11 日參加了由歐盟贊助的小組會議：“該上法學(xué)院的算法們：人工智能的倫理”。該會議討論的主題之一就是歐盟委員會即將出臺的“值得信賴的 AI 應(yīng)該遵守的道德準則”。該指南的最終版本將于 4 月 9 號或之前提交給歐盟委員會。

不過，在會議小組討論之后的問答環(huán)節(jié)中，有一位記者斷言人工智能將會成為一種過于危險的技術(shù)，并且聲稱“所有人工智能研究工作都應(yīng)該停止”。這種論調(diào)本身并不令人震驚，真正讓人震驚的是居然有大約三分之一的觀眾對此表示認同。

SXSW 上關(guān)注的技術(shù)驅(qū)動的社會性問題通常領(lǐng)先大眾一兩年。目前 SXSW 對人工智能的道德倫理的強烈興趣表明，未來幾年內(nèi)這一問題將進入社會大眾的視野。我們的行業(yè)需要變得更加透明，以贏得更多公民和消費者的信任。

結(jié)論
IBM 在 2 月 11 日舉行的 Think 活動中進行了“辯論家”最后一次演示，“辯論家”輸?shù)袅诉@場辯論。但是，在辯論進程的過程中，IBM 研究院通過“辯論家”向世人展示了一個可以可信地進行對上下文敏感、可達人類辯手水平的辯論系統(tǒng)。

IBM 設(shè)計的“辯論家”和人類辯手展開了有意義的辯論，但是人類辯手和觀眾都清楚地知道它就是一個人工智能。在這個系統(tǒng)設(shè)計中，IBM 研究院向論述中添加了一些笑話，并為之提供了根據(jù)紐約一位女演員構(gòu)建的聲音。不過，IBM 研究院做了一些處理，使之成為一個明顯的合成聲音，但是該聲音聽起來并不單調(diào)，表現(xiàn)力還不錯，這對于辯論來說很重要。

“辯論家”的開場比我們預(yù)期的要好得多，它挑戰(zhàn)了我們對于自然語言處理（NLP）當前能力的假設(shè)。不過，在反駁和總結(jié)性陳詞中，它沒有分辨出人類辯手論點中的幾個細微差別，也沒有表現(xiàn)出對人類觀眾的同情心。正是在理解能力和同理心上面的差距使得“辯論家”進入了不可思議的“恐怖谷”。

顯然，無論從哪個方面來看，創(chuàng)建一個可以參與這種開放性主題辯論的人工智能都是一個巨大的挑戰(zhàn)。

當然，有人可能會爭辯說，創(chuàng)建一個可以在隨機主題上與人類辯手展開辯論（無論是贏了還是輸了）的人工智能就等于通過了圖靈測試。圖靈測試是什么？“通過圖靈測試”意味著什么。21 世紀的 AI 的圖靈測試也需要現(xiàn)代化，簡單地說，我們對會話系統(tǒng)的人工智能測試需要更多地涵蓋人文環(huán)境。

雖然 IBM 的“辯論家”令人印象深刻，但是，它想在未來的幾年內(nèi)走過“恐怖谷”依然非常困難。不過，IBM 證明了此事可行，就已經(jīng)贏得了戰(zhàn)斗的一半。IBM 在舊硬件上拼湊實現(xiàn)了對“辯論家”的訓(xùn)練是一項驚人的研發(fā)壯舉?！稗q論家”能夠使用更新的硬件進行更快的訓(xùn)練和部署呢？現(xiàn)在還很難說，但是我們相信，其它人可能會在 IBM 的啟發(fā)下，針對人工智能會話系統(tǒng)投入更多資源，我們將看到這個領(lǐng)域的快速發(fā)展。

可以肯定的是，會話系統(tǒng)將變得更加出色，更加復(fù)雜，這將影響未來的工作機會和社會結(jié)構(gòu)，現(xiàn)在是時候?qū)ψ匀徽Z言處理的未來進行認真討論了。

與非網(wǎng)編譯內(nèi)容，未經(jīng)許可，不得轉(zhuǎn)載！