加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    •  
    • 體積縮小、屏幕變大……改頭換面的 E2
    •  
    • 依舊強(qiáng)悍的智能降噪能力,滿足多樣化場景需求
    •  
    • 除了聽聲識字,E2 還學(xué)會了“看圖說話”
    • 總結(jié)
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

用一顆攝像頭打破AI錄音筆固有形態(tài),搜狗AI錄音筆E2創(chuàng)新出發(fā)

2020/12/08
159
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

論一顆攝像頭帶給 AI 錄音筆的變化。

時(shí)隔 7 個月左右,搜狗新一代 AI 錄音筆 E2 也正式上市。

相較于上一代的 E1,E2 可以說是從內(nèi)到外發(fā)生了變化,而相較于 S1,兩者的差別進(jìn)一步被縮小,E2 更是帶來了創(chuàng)新性的功能。

最近一段時(shí)間,鎂客網(wǎng)也拿到了一部“E2”,并進(jìn)行了數(shù)天的深度測評:

?

體積縮小、屏幕變大……改頭換面的 E2

在拿到 E2 包裝盒的一瞬間,如果忽略外殼產(chǎn)品圖下面大大的“E2”兩字,我或許會認(rèn)為這是 S1 的升級版“S2”,之所以有這樣的感覺,實(shí)在是因?yàn)?E2 在外觀上與 S1 可以說是近乎一樣。

當(dāng)然,在打開包裝盒后,兩者之間的差別也是一眼就可看出,同時(shí),E2 與上一代 E1 的差別也可謂天差地別。

這一次,搜狗為 E2 配備的全面屏分辨率為 340*800,足有 3.46 英寸,比之原先的 1.54 英寸大了一倍多,比之 S1 3.5 英寸的大屏不遑多讓。需要注意的是,雖然屏幕大了,但是 E2 整體機(jī)身的大小比 E1 只小不大。

猶記得在 E1 的設(shè)計(jì)上,諸如錄音鍵、多功能 M 鍵和電源鍵是排布在機(jī)身正面,并排于屏幕下方,而這一次,E2 全面屏的設(shè)計(jì),也使得這些功能件被安排分散在了機(jī)身左右側(cè)。

圖 | 搜狗 AI 錄音筆 E2 機(jī)身右側(cè)

具體來看,機(jī)身左側(cè)為音量加減鍵以及電源鍵,右側(cè)排列的是錄音鍵、多功能 M 兼以及 SIM 卡槽,至于機(jī)身底部,則是充電口與 3.5mm 耳機(jī)孔。這其中,SIM 卡槽的存在,意味著 E2 可以獨(dú)立聯(lián)網(wǎng)使用。

E2 機(jī)身頂部與 E1 一樣,依舊是采用鏤空樣式,除了揚(yáng)聲器,還配備 2 顆 10mm 心型哈曼指向麥,機(jī)身正面左右兩側(cè)對稱分布了 6 個小細(xì)孔,內(nèi)置 6 顆全向數(shù)字麥,從而形成 8 麥陣列,實(shí)現(xiàn) 15m 超遠(yuǎn)拾音和 360°拾音。

就在屏幕的頂部中間,我們還能看到一個麥克風(fēng)指示燈,它能夠顯示三種顏色,綠色閃爍代表錄音正常,黃色亮起表示噪聲太大,紅色亮起則意味著講話聲太大。

值得說道的是,E2 的背面帶了點(diǎn)新花樣——一顆 800 萬像素?cái)z像頭,以及一個閃光燈,這也是 E2 此次在功能上最大的升級,具體如何,我們留到后面細(xì)說。

E2 整體包裝以白色為主,除了機(jī)身主體,另外還有 Type-C 接口充電(數(shù)據(jù))線、取卡針以及一份說明書。

圖 | 搜狗 AI 錄音筆 E2 配件展示

E2 機(jī)身則以黑色為主,配以紅色、金色細(xì)節(jié)設(shè)計(jì)。因?yàn)檎w材料以塑料為主,因此 E2 在重量上并沒有什么負(fù)擔(dān),小巧便攜到足以一手掌控,隨踹隨走、隨用隨拿。與此同時(shí),后殼大面積采用 TPU 材料,這也使得 E2 具備了減震和防滑的能力,于日常使用十分友好。

此外,E2 機(jī)身內(nèi)存為 32G,實(shí)際內(nèi)存為 29G 左右,電池容量為 2000mAh,能夠持續(xù)錄音 10 小時(shí)以上,對于學(xué)生、記者等用戶群體聞言,這一存儲空間和續(xù)航能力已經(jīng)是綽綽有余。當(dāng)然,若實(shí)在文件過多,用戶也可以選擇將部分文件上傳至云端,如此也可在手機(jī)端、PC 端和網(wǎng)頁端做到多屏共享,實(shí)現(xiàn)多人、異地的內(nèi)容同步。

?

依舊強(qiáng)悍的智能降噪能力,滿足多樣化場景需求

AI 錄音筆最為基礎(chǔ)的功能就是“錄音”,但是在某些時(shí)候,“錄音”這一簡單的事情卻不會那么簡單能夠做到,比如遭遇周邊環(huán)境音干擾,又或者對話者音量過低等等,這些都能夠成為致使錄音文件失效的因素。

在這一點(diǎn)上,E2 很好的延續(xù)了 E1、S1 的強(qiáng)大基因。首先在面向的特定場景方面,E2 與兩位前輩一樣,皆基于 clairVoice8 麥克風(fēng)陣列算法提供四種錄音模式,分別是會議、采訪、聽課和音樂:

會議和采訪模式中,用戶只需將 E2 平放在桌面,即可實(shí)現(xiàn) 360°拾音;

聽課模式中,將 E2 的頂端指向聲源,可做到定向拾音;

音樂模式中,同樣是將 E2 的頂端指向聲源,可做到高保真拾音,與此同時(shí),搜狗也貼心的為用戶提供了 MP3 等 5 種錄音格式選擇。

另外,利用 pureVoice AI 降噪算法,E2 也提供三種降噪模式(音樂模式不支持該功能),分別是真實(shí)音質(zhì)(保留真實(shí)人聲和環(huán)境音)、人聲增強(qiáng)(過濾環(huán)境音,顯著增強(qiáng)人聲)、純凈人聲(深度刪除環(huán)境音,僅保留人聲),讓用戶在使用過程中能夠依據(jù)自身需求進(jìn)行選擇。

圖 | 搜狗 AI 錄音筆 E2 錄音模式與降噪方式

選定錄音模式和降噪方式之后,用戶短按錄音鍵即可一鍵開始錄音,過程中可隨時(shí)更換語種,以及暫定或繼續(xù)錄音。當(dāng)錄音結(jié)束并保存本地之后,用戶可點(diǎn)擊機(jī)身屏幕主頁面的“錄音文件”查看錄音情況,若先前忘記選擇降噪方式,用戶也可點(diǎn)擊錄音詳情頁下方的“降噪方式”,打開“純凈人聲降噪”以聽取降噪處理之后的錄音。

針對這一功能,鎂客網(wǎng)也以一段會場采訪錄音做了實(shí)驗(yàn),在“純凈人聲降噪”功能關(guān)閉的情況下,錄音中周邊稀稀落落的交談聲和偶爾的碗碟碰撞聲能夠清晰聽到,但當(dāng)打開降噪功能后,我們能夠聽到的只剩下純凈的人聲,對于之后錄音轉(zhuǎn)換文字的整理還是能夠提供一些幫助的。

?

除了聽聲識字,E2 還學(xué)會了“看圖說話”

相比于傳統(tǒng)錄音筆,AI 錄音筆最大的特色在于語音識別與轉(zhuǎn)寫、中外文互譯。

實(shí)時(shí)轉(zhuǎn)寫方面,E2 當(dāng)前共支持包括中文在內(nèi)的 11 種語言和 11 種方言,覆蓋基礎(chǔ)的英文、韓語、日語、德語,以及粵語、四川話、南京話、貴州話等等。

過程中,用戶也可以根據(jù)實(shí)際情境任意切換語言或語種,從而保證錄音的完整性和準(zhǔn)確度。

值得一提的是,因?yàn)榍懊嫣岬降臄z像頭,實(shí)時(shí)轉(zhuǎn)寫也多了一個功能——圖片實(shí)時(shí)拍攝與插入?;谶@一功能,用戶將能夠同步記錄聲音與畫面。而在實(shí)時(shí)轉(zhuǎn)寫結(jié)束后,用戶也可以將該錄音文件中的圖片進(jìn)行“文字提取”處理,不過該功能的啟用需要一個前提,即錄音文件已經(jīng)作轉(zhuǎn)寫處理。

圖 | 圖文提取 gif

官方介紹稱,OCR 技術(shù)共可識別 13 種圖片語言。而在實(shí)時(shí)轉(zhuǎn)寫之外,用戶也可以打開 E2 的攝像機(jī)拍攝文檔、路標(biāo)等,做到“拍照秒變文字”?;谶@一功能,即使以后走出過門語言不通,只要 E2 在手,也不怕因?yàn)椴粫x、看不懂文字而抓耳撓腮了。

至于轉(zhuǎn)寫的速度,鎂客網(wǎng)以一段時(shí)長 39 分鐘的錄音進(jìn)行測試,原始錄音文件以中文為主,間雜少許英文詞匯,轉(zhuǎn)換過程總共不超過 3 分鐘。為了進(jìn)一步提高轉(zhuǎn)換文字的精準(zhǔn)度和可讀性,減少不必要的口語化詞匯等等,用戶也可以點(diǎn)擊左下角的“智能整理”,選擇區(qū)分講話人(機(jī)主可提前錄入自己的聲紋信息以加強(qiáng)區(qū)分精準(zhǔn)度)、智能輔助校正、隱藏空錄音等功能。

依據(jù) E2 的官方介紹,它一共可精準(zhǔn)識別 8 種專業(yè)領(lǐng)域數(shù)據(jù),覆蓋財(cái)經(jīng)貿(mào)易、醫(yī)療、IT 科技、政府、文化體育、工業(yè)制造、建筑、教育,在“轉(zhuǎn)寫確認(rèn)”界面,用戶可依據(jù)實(shí)際情境進(jìn)行選擇。

當(dāng)然,與 E1 和 S1 一樣,M 鍵在實(shí)時(shí)轉(zhuǎn)寫過程中也承擔(dān)著“劃重點(diǎn)”的作用,若是有遺漏,也可在錄音文件轉(zhuǎn)寫之后回聽錄音,并利用 M 鍵一鍵標(biāo)記重點(diǎn)。

圖 | 搜狗 AI 錄音筆 E2 重點(diǎn)標(biāo)志

除了用戶自行標(biāo)記重點(diǎn),系統(tǒng)在轉(zhuǎn)寫錄音的過程中也會智能提取重點(diǎn),并排列成摘要,供用戶后期查閱和快速定點(diǎn)回聽。只不過相較于用戶自己所標(biāo)注的,系統(tǒng)的重點(diǎn)提煉在精準(zhǔn)性上還存在那么一點(diǎn)欠缺。

整體來看,錄音文件轉(zhuǎn)寫在識別精準(zhǔn)度上較之實(shí)時(shí)轉(zhuǎn)寫有所提升,雖然還存在些許誤差,不過尚在接受范圍內(nèi)。當(dāng)然,如果強(qiáng)迫癥患者實(shí)在看不下去,也是可以邊回聽邊進(jìn)行編輯調(diào)整的。出于對觀感、編輯便利性以及效率的考慮,用戶在編輯的過程中也可以點(diǎn)擊“智能控制”調(diào)整字體大小以及錄音播放倍速。

此外,若用戶急需在眾多保存的錄音中找到某一段,也可長按 M 鍵喚醒智能語音助手,經(jīng)由語音交互找出自己想要的錄音記錄。

圖 | 搜狗 AI 錄音筆 E2 智能助手

翻譯方面,E2 提供四種模式,分別是對話翻譯、自由對話翻譯、同聲傳譯和拍照翻譯,前三者可以提供 63 種語言互譯服務(wù),最后一個涉及到 OCR 識別,因此只能提供 13 種語言的互譯,覆蓋全球 200 多個國家和地區(qū)。

離線狀態(tài)下,E2 支持 8 種語言的中外互譯,只需提前下載離線包即可。

圖 | 搜狗 AI 錄音筆 E2 離線翻譯包

對話翻譯模式中,錄音鍵和 M 鍵將各自承擔(dān)一種語言的錄入工作,在具體的應(yīng)用過程中,需要用戶長按按鍵以采集對應(yīng)語種,繼而由系統(tǒng)識別并翻譯成另一種語種。對于兩個語言不通的交流者而言,利用錄音筆進(jìn)行逐個轉(zhuǎn)寫或許會耗費(fèi)些時(shí)間,但能有效避免交談過程中因語音來回交叉而帶來的錯亂問題,保證內(nèi)容的準(zhǔn)確性。

在上一代,對話翻譯模式僅支持中文與其他語言的翻譯,升級到現(xiàn)在,63 種語言之間的互譯已經(jīng)不成問題。

圖 | 搜狗 AI 錄音筆 E2 可翻譯語種(部分)

自由對話翻譯模式中,將錄音筆兩段分別指向雙方講話人,系統(tǒng)即可自動識別雙方講話狀態(tài)并錄音、中英互譯,無須手動操作即可滿足跨語言采訪、交流等長時(shí)間交流的需要。當(dāng)然,保持更為嚴(yán)謹(jǐn)一點(diǎn)的態(tài)度,用戶也可以在對話界面右上角的設(shè)置中打開“手動打斷”按鈕,屆時(shí)哪方說話就點(diǎn)擊哪方的對話框,一段結(jié)束之后,再由另一方點(diǎn)擊自己這邊的錄入框以錄入語音。

或許會有人覺得,這樣一來的翻譯方式不就與對話翻譯模式類似嗎?其實(shí)不然,不管是錄入方式的便利程度,以及雙方對于交流內(nèi)容的理解程度都是不一樣的。換一種說法,前者更適合應(yīng)用于與陌生人的對話,譬如問路等場景,后者更適用于合作伙伴、朋友之間的交流互動。

視頻 | 自由對話翻譯

相比于對話翻譯,同聲傳譯不需要用戶在過程中長按某個鍵,點(diǎn)擊屏幕頂端即可調(diào)換翻譯方向。若中途需要暫停 / 繼續(xù),只需短按一下錄音鍵即可,適用于單方面的發(fā)言錄入,譬如演講、上課等等。

從測試結(jié)果來看,在發(fā)音正常的情況下,E2 的識別和翻譯準(zhǔn)確度接近完美,些微差錯也在可接受范圍內(nèi)。

至于拍照翻譯,正如字面意思,只需要打開攝像頭對著文檔拍一張照片,上傳成功之后即可實(shí)時(shí)翻譯成另外一種語言。如若需要的話,用戶也可以點(diǎn)擊界面的“純文本”按鈕,從而直接查看文本信息,而不是對著照片查看比螞蟻還小的譯文。

圖 | 拍照翻譯 gif

總結(jié)

眾所周知,錄音筆市場一直都是相對小眾的,主要受眾群體集中在新聞媒體、政府、事業(yè)單位等。

依據(jù)中國報(bào)告網(wǎng)數(shù)據(jù),國內(nèi)錄音筆市場呈現(xiàn)行業(yè)發(fā)展緩慢、替代風(fēng)險(xiǎn)大等特點(diǎn),一句話概括,因?yàn)槭謾C(jī)等數(shù)碼產(chǎn)品的沖擊等因素,國內(nèi)錄音筆市場長時(shí)間處于“供過于求”的境遇。

對于這一點(diǎn),搜狗 CEO 王小川也予以承認(rèn),他此前曾提到,以前錄音筆是專業(yè)小眾市場,記者用的多一些,注入 AI 后,重新煥發(fā)活力,會有更大的想象空間。

而從目前的情勢來看,顯然,在 AI 能力的加持下,錄音筆領(lǐng)域的競爭正在從剛性需求轉(zhuǎn)向消費(fèi)分級。此時(shí),搜狗創(chuàng)新性的為 AI 錄音筆增加一顆攝像頭,在顛覆過往錄音筆傳統(tǒng)形態(tài)的同時(shí),也為錄音筆未來的升級增添了更多的可能性。

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

鎂客網(wǎng)隸屬于南京鎂一刻網(wǎng)絡(luò)科技有限公司旗下,關(guān)注人工智能、虛擬現(xiàn)實(shí)、半導(dǎo)體、新能源、新材料、航空航天等新興創(chuàng)新的硬科技領(lǐng)域,以科技媒體為核心,致力于打造硬科技領(lǐng)域的產(chǎn)業(yè)服務(wù)平臺,推動硬科技產(chǎn)業(yè)落地,助力傳統(tǒng)產(chǎn)業(yè)升級。目前已上線微信公眾號、今日頭條、搜狐號、百家號等多個內(nèi)容平臺。