時(shí)隔 7 個月左右,搜狗新一代 AI 錄音筆 E2 也正式上市。
相較于上一代的 E1,E2 可以說是從內(nèi)到外發(fā)生了變化,而相較于 S1,兩者的差別進(jìn)一步被縮小,E2 更是帶來了創(chuàng)新性的功能。
最近一段時(shí)間,鎂客網(wǎng)也拿到了一部“E2”,并進(jìn)行了數(shù)天的深度測評:
?
體積縮小、屏幕變大……改頭換面的 E2
在拿到 E2 包裝盒的一瞬間,如果忽略外殼產(chǎn)品圖下面大大的“E2”兩字,我或許會認(rèn)為這是 S1 的升級版“S2”,之所以有這樣的感覺,實(shí)在是因?yàn)?E2 在外觀上與 S1 可以說是近乎一樣。
當(dāng)然,在打開包裝盒后,兩者之間的差別也是一眼就可看出,同時(shí),E2 與上一代 E1 的差別也可謂天差地別。
這一次,搜狗為 E2 配備的全面屏分辨率為 340*800,足有 3.46 英寸,比之原先的 1.54 英寸大了一倍多,比之 S1 3.5 英寸的大屏不遑多讓。需要注意的是,雖然屏幕大了,但是 E2 整體機(jī)身的大小比 E1 只小不大。
猶記得在 E1 的設(shè)計(jì)上,諸如錄音鍵、多功能 M 鍵和電源鍵是排布在機(jī)身正面,并排于屏幕下方,而這一次,E2 全面屏的設(shè)計(jì),也使得這些功能件被安排分散在了機(jī)身左右側(cè)。
圖 | 搜狗 AI 錄音筆 E2 機(jī)身右側(cè)
具體來看,機(jī)身左側(cè)為音量加減鍵以及電源鍵,右側(cè)排列的是錄音鍵、多功能 M 兼以及 SIM 卡槽,至于機(jī)身底部,則是充電口與 3.5mm 耳機(jī)孔。這其中,SIM 卡槽的存在,意味著 E2 可以獨(dú)立聯(lián)網(wǎng)使用。
E2 機(jī)身頂部與 E1 一樣,依舊是采用鏤空樣式,除了揚(yáng)聲器,還配備 2 顆 10mm 心型哈曼指向麥,機(jī)身正面左右兩側(cè)對稱分布了 6 個小細(xì)孔,內(nèi)置 6 顆全向數(shù)字麥,從而形成 8 麥陣列,實(shí)現(xiàn) 15m 超遠(yuǎn)拾音和 360°拾音。
就在屏幕的頂部中間,我們還能看到一個麥克風(fēng)指示燈,它能夠顯示三種顏色,綠色閃爍代表錄音正常,黃色亮起表示噪聲太大,紅色亮起則意味著講話聲太大。
值得說道的是,E2 的背面帶了點(diǎn)新花樣——一顆 800 萬像素?cái)z像頭,以及一個閃光燈,這也是 E2 此次在功能上最大的升級,具體如何,我們留到后面細(xì)說。
E2 整體包裝以白色為主,除了機(jī)身主體,另外還有 Type-C 接口充電(數(shù)據(jù))線、取卡針以及一份說明書。
圖 | 搜狗 AI 錄音筆 E2 配件展示
E2 機(jī)身則以黑色為主,配以紅色、金色細(xì)節(jié)設(shè)計(jì)。因?yàn)檎w材料以塑料為主,因此 E2 在重量上并沒有什么負(fù)擔(dān),小巧便攜到足以一手掌控,隨踹隨走、隨用隨拿。與此同時(shí),后殼大面積采用 TPU 材料,這也使得 E2 具備了減震和防滑的能力,于日常使用十分友好。
此外,E2 機(jī)身內(nèi)存為 32G,實(shí)際內(nèi)存為 29G 左右,電池容量為 2000mAh,能夠持續(xù)錄音 10 小時(shí)以上,對于學(xué)生、記者等用戶群體聞言,這一存儲空間和續(xù)航能力已經(jīng)是綽綽有余。當(dāng)然,若實(shí)在文件過多,用戶也可以選擇將部分文件上傳至云端,如此也可在手機(jī)端、PC 端和網(wǎng)頁端做到多屏共享,實(shí)現(xiàn)多人、異地的內(nèi)容同步。
?
依舊強(qiáng)悍的智能降噪能力,滿足多樣化場景需求
AI 錄音筆最為基礎(chǔ)的功能就是“錄音”,但是在某些時(shí)候,“錄音”這一簡單的事情卻不會那么簡單能夠做到,比如遭遇周邊環(huán)境音干擾,又或者對話者音量過低等等,這些都能夠成為致使錄音文件失效的因素。
在這一點(diǎn)上,E2 很好的延續(xù)了 E1、S1 的強(qiáng)大基因。首先在面向的特定場景方面,E2 與兩位前輩一樣,皆基于 clairVoice8 麥克風(fēng)陣列算法提供四種錄音模式,分別是會議、采訪、聽課和音樂:
會議和采訪模式中,用戶只需將 E2 平放在桌面,即可實(shí)現(xiàn) 360°拾音;
聽課模式中,將 E2 的頂端指向聲源,可做到定向拾音;
音樂模式中,同樣是將 E2 的頂端指向聲源,可做到高保真拾音,與此同時(shí),搜狗也貼心的為用戶提供了 MP3 等 5 種錄音格式選擇。
另外,利用 pureVoice AI 降噪算法,E2 也提供三種降噪模式(音樂模式不支持該功能),分別是真實(shí)音質(zhì)(保留真實(shí)人聲和環(huán)境音)、人聲增強(qiáng)(過濾環(huán)境音,顯著增強(qiáng)人聲)、純凈人聲(深度刪除環(huán)境音,僅保留人聲),讓用戶在使用過程中能夠依據(jù)自身需求進(jìn)行選擇。
圖 | 搜狗 AI 錄音筆 E2 錄音模式與降噪方式
選定錄音模式和降噪方式之后,用戶短按錄音鍵即可一鍵開始錄音,過程中可隨時(shí)更換語種,以及暫定或繼續(xù)錄音。當(dāng)錄音結(jié)束并保存本地之后,用戶可點(diǎn)擊機(jī)身屏幕主頁面的“錄音文件”查看錄音情況,若先前忘記選擇降噪方式,用戶也可點(diǎn)擊錄音詳情頁下方的“降噪方式”,打開“純凈人聲降噪”以聽取降噪處理之后的錄音。
針對這一功能,鎂客網(wǎng)也以一段會場采訪錄音做了實(shí)驗(yàn),在“純凈人聲降噪”功能關(guān)閉的情況下,錄音中周邊稀稀落落的交談聲和偶爾的碗碟碰撞聲能夠清晰聽到,但當(dāng)打開降噪功能后,我們能夠聽到的只剩下純凈的人聲,對于之后錄音轉(zhuǎn)換文字的整理還是能夠提供一些幫助的。
?
除了聽聲識字,E2 還學(xué)會了“看圖說話”
相比于傳統(tǒng)錄音筆,AI 錄音筆最大的特色在于語音識別與轉(zhuǎn)寫、中外文互譯。
實(shí)時(shí)轉(zhuǎn)寫方面,E2 當(dāng)前共支持包括中文在內(nèi)的 11 種語言和 11 種方言,覆蓋基礎(chǔ)的英文、韓語、日語、德語,以及粵語、四川話、南京話、貴州話等等。
過程中,用戶也可以根據(jù)實(shí)際情境任意切換語言或語種,從而保證錄音的完整性和準(zhǔn)確度。
值得一提的是,因?yàn)榍懊嫣岬降臄z像頭,實(shí)時(shí)轉(zhuǎn)寫也多了一個功能——圖片實(shí)時(shí)拍攝與插入?;谶@一功能,用戶將能夠同步記錄聲音與畫面。而在實(shí)時(shí)轉(zhuǎn)寫結(jié)束后,用戶也可以將該錄音文件中的圖片進(jìn)行“文字提取”處理,不過該功能的啟用需要一個前提,即錄音文件已經(jīng)作轉(zhuǎn)寫處理。
圖 | 圖文提取 gif
官方介紹稱,OCR 技術(shù)共可識別 13 種圖片語言。而在實(shí)時(shí)轉(zhuǎn)寫之外,用戶也可以打開 E2 的攝像機(jī)拍攝文檔、路標(biāo)等,做到“拍照秒變文字”?;谶@一功能,即使以后走出過門語言不通,只要 E2 在手,也不怕因?yàn)椴粫x、看不懂文字而抓耳撓腮了。
至于轉(zhuǎn)寫的速度,鎂客網(wǎng)以一段時(shí)長 39 分鐘的錄音進(jìn)行測試,原始錄音文件以中文為主,間雜少許英文詞匯,轉(zhuǎn)換過程總共不超過 3 分鐘。為了進(jìn)一步提高轉(zhuǎn)換文字的精準(zhǔn)度和可讀性,減少不必要的口語化詞匯等等,用戶也可以點(diǎn)擊左下角的“智能整理”,選擇區(qū)分講話人(機(jī)主可提前錄入自己的聲紋信息以加強(qiáng)區(qū)分精準(zhǔn)度)、智能輔助校正、隱藏空錄音等功能。
依據(jù) E2 的官方介紹,它一共可精準(zhǔn)識別 8 種專業(yè)領(lǐng)域數(shù)據(jù),覆蓋財(cái)經(jīng)貿(mào)易、醫(yī)療、IT 科技、政府、文化體育、工業(yè)制造、建筑、教育,在“轉(zhuǎn)寫確認(rèn)”界面,用戶可依據(jù)實(shí)際情境進(jìn)行選擇。
當(dāng)然,與 E1 和 S1 一樣,M 鍵在實(shí)時(shí)轉(zhuǎn)寫過程中也承擔(dān)著“劃重點(diǎn)”的作用,若是有遺漏,也可在錄音文件轉(zhuǎn)寫之后回聽錄音,并利用 M 鍵一鍵標(biāo)記重點(diǎn)。
圖 | 搜狗 AI 錄音筆 E2 重點(diǎn)標(biāo)志
除了用戶自行標(biāo)記重點(diǎn),系統(tǒng)在轉(zhuǎn)寫錄音的過程中也會智能提取重點(diǎn),并排列成摘要,供用戶后期查閱和快速定點(diǎn)回聽。只不過相較于用戶自己所標(biāo)注的,系統(tǒng)的重點(diǎn)提煉在精準(zhǔn)性上還存在那么一點(diǎn)欠缺。
整體來看,錄音文件轉(zhuǎn)寫在識別精準(zhǔn)度上較之實(shí)時(shí)轉(zhuǎn)寫有所提升,雖然還存在些許誤差,不過尚在接受范圍內(nèi)。當(dāng)然,如果強(qiáng)迫癥患者實(shí)在看不下去,也是可以邊回聽邊進(jìn)行編輯調(diào)整的。出于對觀感、編輯便利性以及效率的考慮,用戶在編輯的過程中也可以點(diǎn)擊“智能控制”調(diào)整字體大小以及錄音播放倍速。
此外,若用戶急需在眾多保存的錄音中找到某一段,也可長按 M 鍵喚醒智能語音助手,經(jīng)由語音交互找出自己想要的錄音記錄。
圖 | 搜狗 AI 錄音筆 E2 智能助手
翻譯方面,E2 提供四種模式,分別是對話翻譯、自由對話翻譯、同聲傳譯和拍照翻譯,前三者可以提供 63 種語言互譯服務(wù),最后一個涉及到 OCR 識別,因此只能提供 13 種語言的互譯,覆蓋全球 200 多個國家和地區(qū)。
離線狀態(tài)下,E2 支持 8 種語言的中外互譯,只需提前下載離線包即可。
圖 | 搜狗 AI 錄音筆 E2 離線翻譯包
對話翻譯模式中,錄音鍵和 M 鍵將各自承擔(dān)一種語言的錄入工作,在具體的應(yīng)用過程中,需要用戶長按按鍵以采集對應(yīng)語種,繼而由系統(tǒng)識別并翻譯成另一種語種。對于兩個語言不通的交流者而言,利用錄音筆進(jìn)行逐個轉(zhuǎn)寫或許會耗費(fèi)些時(shí)間,但能有效避免交談過程中因語音來回交叉而帶來的錯亂問題,保證內(nèi)容的準(zhǔn)確性。
在上一代,對話翻譯模式僅支持中文與其他語言的翻譯,升級到現(xiàn)在,63 種語言之間的互譯已經(jīng)不成問題。
圖 | 搜狗 AI 錄音筆 E2 可翻譯語種(部分)
自由對話翻譯模式中,將錄音筆兩段分別指向雙方講話人,系統(tǒng)即可自動識別雙方講話狀態(tài)并錄音、中英互譯,無須手動操作即可滿足跨語言采訪、交流等長時(shí)間交流的需要。當(dāng)然,保持更為嚴(yán)謹(jǐn)一點(diǎn)的態(tài)度,用戶也可以在對話界面右上角的設(shè)置中打開“手動打斷”按鈕,屆時(shí)哪方說話就點(diǎn)擊哪方的對話框,一段結(jié)束之后,再由另一方點(diǎn)擊自己這邊的錄入框以錄入語音。
或許會有人覺得,這樣一來的翻譯方式不就與對話翻譯模式類似嗎?其實(shí)不然,不管是錄入方式的便利程度,以及雙方對于交流內(nèi)容的理解程度都是不一樣的。換一種說法,前者更適合應(yīng)用于與陌生人的對話,譬如問路等場景,后者更適用于合作伙伴、朋友之間的交流互動。
視頻 | 自由對話翻譯
相比于對話翻譯,同聲傳譯不需要用戶在過程中長按某個鍵,點(diǎn)擊屏幕頂端即可調(diào)換翻譯方向。若中途需要暫停 / 繼續(xù),只需短按一下錄音鍵即可,適用于單方面的發(fā)言錄入,譬如演講、上課等等。
從測試結(jié)果來看,在發(fā)音正常的情況下,E2 的識別和翻譯準(zhǔn)確度接近完美,些微差錯也在可接受范圍內(nèi)。
至于拍照翻譯,正如字面意思,只需要打開攝像頭對著文檔拍一張照片,上傳成功之后即可實(shí)時(shí)翻譯成另外一種語言。如若需要的話,用戶也可以點(diǎn)擊界面的“純文本”按鈕,從而直接查看文本信息,而不是對著照片查看比螞蟻還小的譯文。
圖 | 拍照翻譯 gif
總結(jié)
眾所周知,錄音筆市場一直都是相對小眾的,主要受眾群體集中在新聞媒體、政府、事業(yè)單位等。
依據(jù)中國報(bào)告網(wǎng)數(shù)據(jù),國內(nèi)錄音筆市場呈現(xiàn)行業(yè)發(fā)展緩慢、替代風(fēng)險(xiǎn)大等特點(diǎn),一句話概括,因?yàn)槭謾C(jī)等數(shù)碼產(chǎn)品的沖擊等因素,國內(nèi)錄音筆市場長時(shí)間處于“供過于求”的境遇。
對于這一點(diǎn),搜狗 CEO 王小川也予以承認(rèn),他此前曾提到,以前錄音筆是專業(yè)小眾市場,記者用的多一些,注入 AI 后,重新煥發(fā)活力,會有更大的想象空間。
而從目前的情勢來看,顯然,在 AI 能力的加持下,錄音筆領(lǐng)域的競爭正在從剛性需求轉(zhuǎn)向消費(fèi)分級。此時(shí),搜狗創(chuàng)新性的為 AI 錄音筆增加一顆攝像頭,在顛覆過往錄音筆傳統(tǒng)形態(tài)的同時(shí),也為錄音筆未來的升級增添了更多的可能性。