VR/AR和元宇宙的“火”,燒的是人們在虛擬空間中放飛自我的曼妙想像。早在幾十年前的科幻電影中,全息通信就是未來科技的代表,是將虛擬與現(xiàn)實(shí)結(jié)合的一種科技。今年,曾經(jīng)的未來科技“平價(jià)”兌現(xiàn):通信雙方通過微軟3D攝像機(jī)、OPPO 5G智能手機(jī)、Nreal的AR眼鏡和愛立信提供的5G網(wǎng)絡(luò)環(huán)境,實(shí)現(xiàn)了與“真人”的全息通信。其中3D攝像機(jī)、5G智能手機(jī)、AR眼鏡的總價(jià)1萬元出頭。
如此“接地氣”的實(shí)現(xiàn)過程,讓全息通信再次成為行業(yè)關(guān)注的焦點(diǎn):在4G網(wǎng)絡(luò)中沒有的全息通信,能否成為5G網(wǎng)的爆款應(yīng)用?
全息通信現(xiàn)身5G是必然趨勢
全息通信需要實(shí)時(shí)捕獲、編碼、傳輸和渲染對方的3D圖像,然后在己方特定的空間中展現(xiàn)出來。
愛立信中國技術(shù)部副總經(jīng)理王浩博說,現(xiàn)在實(shí)現(xiàn)全息通信有三種方式,一種是非常簡單地提取人類的面部表情,通過動(dòng)畫形式在另一端再現(xiàn),這種效果并不是很好;第二種是經(jīng)常可以在一些重大的科技盛會上看到的,把人的3D圖像整體傳送到現(xiàn)場,這要通過非常精密復(fù)雜的儀器和專門的傳輸網(wǎng)絡(luò)以及非常專業(yè)的投影環(huán)境來實(shí)現(xiàn),效果非常好,但是離老百姓應(yīng)用還非常遙遠(yuǎn)。“我們采用的是第三種,就是用商用級別的設(shè)備和商用網(wǎng)絡(luò),實(shí)現(xiàn)讓老百姓用得上的全息通信。”王浩博表示。
全息通信需要呈現(xiàn)出全息的效果,首先是尺寸要大,接近于真人的尺寸;其次要有空間感,這也是全息圖像和視頻圖像的區(qū)別。Nreal副總裁呼顯龍告訴《中國電子報(bào)》記者:“AR眼鏡的呈像方式,使我們能夠看到一個(gè)接近于真人尺寸的全息圖像,而不必用一個(gè)很大的顯示屏,這種圖像和我們在手機(jī)上、電腦上看的視頻通信圖像,體驗(yàn)是完全不同的。”
OPPO研究院副院長、5G首席科學(xué)家唐海告訴《中國電子報(bào)》記者,目前不僅5G網(wǎng)絡(luò)能力更強(qiáng)大,終端的算力也已經(jīng)達(dá)到了一個(gè)非常高的水平。比如5nm的最新的終端芯片,它的處理能力已經(jīng)超過幾年前電腦CPU的處理能力。更強(qiáng)的網(wǎng)絡(luò)算力、傳輸能力和終端算力,再加上像Nreal眼鏡的呈現(xiàn)能力,綜合來看,全息通信在這個(gè)時(shí)候出現(xiàn)是某種必然。
5G可以解決全息通信痛點(diǎn)
全息通信未經(jīng)壓縮的信息量是非常大的。如果攝像頭傳感器輸出的是1080P圖像,再加上色彩、3D深度圖像,每幀圖的原始數(shù)據(jù)會在70MB左右。如果要進(jìn)一步提高分辨率和幀率,需要的帶寬會更大。有分析指出,對于70英寸顯示屏,全息通信需要約1Tbit/s的網(wǎng)絡(luò)帶寬。
在真正實(shí)現(xiàn)全息通信時(shí),整個(gè)過程首先是捕捉傳感器提供人臉和身體的實(shí)時(shí)“表情”,然后進(jìn)行編碼。在編碼前先做格式轉(zhuǎn)換和過濾,以降低對網(wǎng)絡(luò)傳輸速率的要求。經(jīng)過編碼壓縮的全息影像通過5G低時(shí)延網(wǎng)絡(luò)傳輸?shù)絏R設(shè)備。在XR設(shè)備上,首先需要對壓縮的影像信息做解碼和處理,然后通過渲染再現(xiàn)到用戶眼前。
5G可以非常好地解決在這一過程中全息通信的一些痛點(diǎn)。
與4G相比,5G的連接能力大幅提升,平均百兆速率,峰值可以達(dá)到2Gbps,網(wǎng)絡(luò)時(shí)延也可以控制在毫秒級,沒有明顯的滯后感。所以,從能力來看,用5G網(wǎng)絡(luò)承載全息通信是可行的。
全息通信是一個(gè)信息采集、壓縮、傳輸然后再復(fù)原、再渲染的過程。再復(fù)原和再渲染的過程如果是在終端上實(shí)現(xiàn),需要終端具備較高的算力。5G可以減輕對終端算力的需求。“5G有對算力的實(shí)時(shí)智能調(diào)配能力,5G還有邊緣計(jì)算能力,可以在離用戶很近的地方做算力支撐。”王浩博說。
此外,5G還可以為全息通信的應(yīng)用做體驗(yàn)保障,5G具備網(wǎng)絡(luò)切片的功能,可以針對全息通信做資源預(yù)留。
全息通信當(dāng)解決捕獲技術(shù)短板
“全息通信作為未來的一個(gè)殺手級應(yīng)用,需要的是整個(gè)產(chǎn)業(yè)鏈的充分配合。”唐海說,“整個(gè)產(chǎn)業(yè)鏈的發(fā)展水平都到了一定的階段,才有可能在像手機(jī)或者AR眼鏡這樣的小尺寸設(shè)備里面,提供足以滿足全息通信的傳輸、算力、呈現(xiàn),包括非常穩(wěn)定的空間感知、視角,以及非常好的人像建模,屆時(shí)才能帶來比較好的用戶體驗(yàn)、真正可使用的全息通信,我相信這一天會很快到來。”
談到全產(chǎn)業(yè)鏈的支撐,呼顯龍認(rèn)為,目前全息通信比較明顯的短板是信息采集。“在全息通信發(fā)展的第一階段,全息信息的采集是很重要的,我們希望有一個(gè)更加高效而低成本的全息模型的采集端。”呼顯龍說。
目前Intel、微軟、iPhone已經(jīng)有相關(guān)的采集功能,國內(nèi)企業(yè)在這方面還需要共同努力。唐海說,目前全息通信的信息采信用的是高精度的3D深度攝像頭,這種攝像頭對于算力處理能力要求非常高。
也有專家將采集功能稱為捕獲技術(shù),全息捕獲是創(chuàng)建物體、人或環(huán)境的可測量的3D顯示的過程,包括采集、深度估算、數(shù)據(jù)融合、后期處理四個(gè)步驟。采集是利用視覺傳感器捕獲各種有用信息。3D捕獲目前最常見的是使用ToF(飛行時(shí)間傳感器),通過計(jì)算光脈沖到達(dá)目的地并返回的時(shí)間測量距離。
在深度估算中,ToF可以直接提供深度信息,而立體攝像頭和多攝像頭是通過不同角度捕捉到的信息來估算深度。數(shù)據(jù)融合是將不同視角的深度信息融合為單個(gè)3D點(diǎn)數(shù)據(jù)流。后期處理要通過清除冗余點(diǎn)、噪聲和異常值來減少3D點(diǎn)數(shù)據(jù)流的數(shù)據(jù)量,3D可以生成點(diǎn)云或網(wǎng)格的視覺媒體格式。與虛擬形象相比,由深度攝像機(jī)捕獲的實(shí)時(shí)數(shù)據(jù)需要更多的算力才能渲染。
“4G是視頻時(shí)代,人人都可以拍短視頻,這在過去是很難想像的,因?yàn)镻C時(shí)代制作一個(gè)視頻,需要專業(yè)的攝像機(jī)以及編輯軟件等各種條件才能實(shí)現(xiàn)。”呼顯龍說,“未來,如果一個(gè)幾歲孩子能夠通過簡單的工具就能獲取全息的模型或者視頻,實(shí)現(xiàn)比現(xiàn)在更好的顯示效果,全息通信的爆發(fā)就會到來,我覺得這很快就能實(shí)現(xiàn)。”
作者丨劉晶
編輯丨諸玲珍
美編丨馬利亞
監(jiān)制丨趙晨