牛凱,戴金晟,張平,姚圣時(shí),王思賢
(1.北京郵電大學(xué)泛網(wǎng)無(wú)線通信教育部重點(diǎn)實(shí)驗(yàn)室,北京 100876;2.鵬城實(shí)驗(yàn)室,廣東 深圳 518000;3.北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100876)
2019年11月3日召開(kāi)的6G技術(shù)研發(fā)工作啟動(dòng)會(huì),標(biāo)志著我國(guó)6G研發(fā)正式提上日程。芬蘭奧盧大學(xué)的6G白皮書[1],列出了6G的主要性能指標(biāo):峰值傳輸速率達(dá)到100 Gbps~1 Tbps;通信時(shí)延50~100 μs;超高可靠性:中斷概率小于10-6;超高密度:連接設(shè)備密度達(dá)到每立方米大于100;超大容量:采用THz頻段,大幅度提高網(wǎng)絡(luò)容量。總體而言,6G系統(tǒng)的性能指標(biāo),相比5G將提升10到100倍。
在未來(lái)第六代(6G)移動(dòng)通信系統(tǒng)中,用戶的智能需求將被進(jìn)一步挖掘和實(shí)現(xiàn),并以此為基準(zhǔn)進(jìn)行技術(shù)規(guī)劃與演進(jìn)布局。6G不僅包含5G涉及的人、機(jī)、物這3類服務(wù)對(duì)象,還引入第四類服務(wù)對(duì)象—靈(Genie)[2]。作為人類用戶的智能代理,靈存在于虛擬世界,基于實(shí)時(shí)采集的大量數(shù)據(jù)和高效機(jī)器學(xué)習(xí)技術(shù),存儲(chǔ)和交互用戶的所說(shuō)、所見(jiàn)和所思,完成用戶意圖的獲取以及決策的制定。由此可見(jiàn),未來(lái)6G移動(dòng)通信需要服務(wù)人-機(jī)-物-靈四類對(duì)象,同時(shí)滿足低時(shí)延高可靠、高頻譜效率、高密度大連接的性能要求。
自從1948年香農(nóng)奠基信息論[3]以來(lái),現(xiàn)代通信技術(shù),特別是移動(dòng)通信技術(shù)的發(fā)展已經(jīng)逐步逼近通信理論極限,例如信源編碼技術(shù)已經(jīng)逼近了信源熵/率失真函數(shù),LDPC碼、極化碼等先進(jìn)信道編碼技術(shù)已經(jīng)逼近信道容量。建立在概率信息基礎(chǔ)上的通信系統(tǒng),迫切需要技術(shù)突破與變革,才能應(yīng)對(duì)未來(lái)6G移動(dòng)通信的發(fā)展需求。
近年來(lái),語(yǔ)義信息(Semantic Information)研究成為學(xué)術(shù)界的關(guān)注熱點(diǎn)?;谡Z(yǔ)義信息的數(shù)據(jù)傳輸將是非常有競(jìng)爭(zhēng)力的一種6G候選技術(shù)。本文旨在介紹面向6G傳輸需求的語(yǔ)義通信技術(shù),展望語(yǔ)義信息處理的應(yīng)用前景。
從認(rèn)識(shí)論觀點(diǎn)看,信息分為三個(gè)層次:語(yǔ)法、語(yǔ)義和語(yǔ)用。經(jīng)典信息論只研究語(yǔ)法信息,在研究范疇、研究層次與研究維度方面存在局限,從而限制了信息與通信系統(tǒng)性能的持續(xù)提升。擴(kuò)展信息研究的層次,從語(yǔ)法信息深入到語(yǔ)義信息,將為通信系統(tǒng)優(yōu)化提供新的研究角度,具有重要的變革意義。
在經(jīng)典信息論誕生后不久,人們就展開(kāi)了語(yǔ)義信息論的研究。1953年,Weaver[4]考慮了信息分析的三個(gè)層次,他指出“與發(fā)射機(jī)預(yù)期含義相比,語(yǔ)義問(wèn)題更關(guān)心接收機(jī)對(duì)收到信息含義的統(tǒng)一性解釋”。Weaver的先驅(qū)工作啟發(fā)了人們對(duì)語(yǔ)義信息的探索與研究。
Carnap與Bar-Hillel提出了語(yǔ)義信息論[5-6]的概念框架,試圖對(duì)傳統(tǒng)通信理論進(jìn)行補(bǔ)充。他們認(rèn)為語(yǔ)句中含有的語(yǔ)義信息,應(yīng)當(dāng)基于語(yǔ)句內(nèi)容的邏輯概率來(lái)定義。Barwise與Perry進(jìn)一步提出了場(chǎng)景邏輯原則定義語(yǔ)義信息[7]。Floridi提出強(qiáng)語(yǔ)義信息理論[8],指出Carnap語(yǔ)義信息理論中,語(yǔ)句矛盾將具有無(wú)窮大的信息。2011年,Alfonso進(jìn)一步引入了類真性概念[9],對(duì)語(yǔ)義信息進(jìn)行度量。鐘義信從信息的三位一體特征出發(fā),對(duì)語(yǔ)義信息理論進(jìn)行總結(jié),證明語(yǔ)義信息表征具有唯一性[10]。
盡管人們一直在進(jìn)行語(yǔ)義信息的研究探索,但與經(jīng)典信息論相比,語(yǔ)義信息的理論框架遠(yuǎn)未成熟,語(yǔ)義信息的定義與度量也尚未達(dá)成一致。最近二十年,腦科學(xué)與認(rèn)知科學(xué)取得了巨大進(jìn)展,特別是神經(jīng)認(rèn)知科學(xué)的發(fā)展,對(duì)神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)理論產(chǎn)生了深遠(yuǎn)影響。最近,華為公司提出的后香農(nóng)時(shí)代十大問(wèn)題[11],將語(yǔ)義信息論列為首要的基礎(chǔ)理論問(wèn)題。人們對(duì)語(yǔ)義信息的度量、提取與表征的關(guān)注越來(lái)越多,這一方向有望成為6G移動(dòng)通信的基礎(chǔ)理論之一。
正如Weaver所指出的,語(yǔ)義信息不僅與發(fā)送者有關(guān),更與接收者的理解有關(guān),因此具有概率性與模糊性的雙重不確定性。事實(shí)上,具有語(yǔ)法與語(yǔ)義特征的信源均為廣義信源,既具有隨機(jī)性,又具有模糊性,單純的隨機(jī)和模糊不能全面刻畫廣義信源特征。
經(jīng)典信息論建立在概率論基礎(chǔ)上,不考慮信息的內(nèi)容和含義,它主要對(duì)信息的隨機(jī)性進(jìn)行度量,稱為信息熵,確切地說(shuō),是概率信息熵。但現(xiàn)實(shí)生活中,最常用的便是自然語(yǔ)言信息,也即語(yǔ)義信息,其典型特征是模糊性。比如:高、矮、胖、瘦、大概、差不多等,這些語(yǔ)義描述是模糊變量而不是隨機(jī)變量,需要借助模糊集合論作定性和定量分析。
1972年,De Luca與Termini[12-13]首先研究了純模糊性引入的不確定性,把概率信息熵移植到了模糊集合上,給出了模糊熵的定義。他們將隨機(jī)與模糊這兩方面不確定性的聯(lián)合熵定義為總熵,但這個(gè)定義不便于推廣。1982年吳偉陵進(jìn)一步推廣了模糊熵概念,提出了廣義聯(lián)合熵、廣義條件熵與廣義互信息[14],建立了語(yǔ)義信息的基本度量方案。
原則上,已知概率分布,選擇合適的隸屬函數(shù),對(duì)于給定信源,就可以計(jì)算信源的概率熵與模糊熵,從而度量信源的語(yǔ)法與語(yǔ)義信息。但是由于語(yǔ)義信息蘊(yùn)含在語(yǔ)法信息中,隸屬函數(shù)通常都是復(fù)雜的非線性形式,并且可能動(dòng)態(tài)變化,因此式(2)的廣義熵形式只具有理論意義,難以對(duì)語(yǔ)義通信進(jìn)行實(shí)際指導(dǎo)。文獻(xiàn)[15]提出了語(yǔ)義基(Seb, Semantic Base)的思想,基于神經(jīng)網(wǎng)絡(luò)模型,提取語(yǔ)義特征,用于語(yǔ)義信息度量,避免了隸屬函數(shù)選擇的困難問(wèn)題,是值得深入研究的新思路。
基于概率與模糊二重不確定性的廣義熵以及廣義互信息,對(duì)于面向6G的語(yǔ)義通信系統(tǒng)優(yōu)化,具有重要的理論指導(dǎo)意義。但這些語(yǔ)義信息的定量指標(biāo)分析仍然是開(kāi)放問(wèn)題,還需要隨著語(yǔ)義信息論的發(fā)展,逐步明確并加以完善。
所謂語(yǔ)義通信(Semantic Communications),是指從信源中提取語(yǔ)義信息并編碼,在有噪信道中傳輸?shù)耐ㄐ欧绞?。傳統(tǒng)的語(yǔ)法通信,要求接收端譯碼信息與發(fā)送端編碼信息嚴(yán)格一致,即實(shí)現(xiàn)比特級(jí)的無(wú)差錯(cuò)傳輸。而語(yǔ)義通信與之相反,并不要求譯碼序列與編碼序列嚴(yán)格匹配,只要求接收端恢復(fù)的語(yǔ)義信息與發(fā)送語(yǔ)義信息匹配即可。由于放松了信息傳輸?shù)牟铄e(cuò)要求,語(yǔ)義通信有望突破經(jīng)典通信系統(tǒng)的傳輸瓶頸,為6G移動(dòng)通信提供新的解決思路[15]。
學(xué)術(shù)界對(duì)于語(yǔ)義通信已經(jīng)有一些初步研究。Xie等人[16]針對(duì)文本信息傳輸提出了基于深度學(xué)習(xí)的語(yǔ)義通信系統(tǒng)(DeepSC),初步考慮了信源-信道聯(lián)合編碼,使接收端從語(yǔ)義角度恢復(fù)文本。針對(duì)文本信源,F(xiàn)arsad等人[17]設(shè)計(jì)了基于雙向長(zhǎng)短期記憶模型(BiLSTM)的語(yǔ)義編解碼方案,本文作者提出了改進(jìn)方案[21],可以達(dá)到滿意的語(yǔ)義誤詞率(WER, Word Error Rate)性能。針對(duì)圖像信源,Gunduz與Kurka等人基于卷積神經(jīng)網(wǎng)絡(luò),設(shè)計(jì)了多種模擬式的語(yǔ)義編解碼方案[18-20],具有顯著的壓縮效率,并且能夠?qū)篃o(wú)線信道傳輸中的差錯(cuò)。
如前所述,在6G移動(dòng)通信的各種場(chǎng)景中,人-機(jī)-物-靈四類通信對(duì)象之間會(huì)產(chǎn)生大量不同形態(tài)的數(shù)據(jù),各種對(duì)象之間的通信不再僅僅是傳輸比特?cái)?shù)據(jù),而是借助其“智能”特性實(shí)現(xiàn)以“達(dá)意”為目標(biāo)的語(yǔ)義通信。智能任務(wù)復(fù)雜多變,語(yǔ)義通信對(duì)實(shí)現(xiàn)6G業(yè)務(wù)對(duì)象間的高效通信與準(zhǔn)確控制具有重要意義,有著廣闊的研究和應(yīng)用前景。
面向6G移動(dòng)通信的語(yǔ)義通信系統(tǒng)如圖1所示,在發(fā)送端,信源產(chǎn)生的信息首先送入語(yǔ)義提取模塊,產(chǎn)生語(yǔ)義表征序列,接著送入語(yǔ)義信源編碼器,對(duì)語(yǔ)義特征壓縮編碼,然后送入信道編碼器,產(chǎn)生信道編碼序列,送入傳輸信道。在接收端,信道輸出信號(hào)首先送入信道譯碼模塊,輸出的譯碼序列再送入語(yǔ)義信源譯碼器,得到的語(yǔ)義表征序列再送入語(yǔ)義恢復(fù)與重建模塊,最終得到信源數(shù)據(jù)送入信宿。
圖1 面向6G的語(yǔ)義通信系統(tǒng)結(jié)構(gòu)
在語(yǔ)義通信系統(tǒng)中,信道編譯碼器屬于經(jīng)典通信系統(tǒng),而語(yǔ)義提取與編碼模塊則屬于語(yǔ)義通信系統(tǒng),經(jīng)典通信信道通過(guò)統(tǒng)計(jì)轉(zhuǎn)移概率建模,而語(yǔ)義信道則通過(guò)語(yǔ)義標(biāo)簽之間的邏輯轉(zhuǎn)移概率來(lái)建模。
語(yǔ)義通信與經(jīng)典通信最重要的差異在于,語(yǔ)義編碼與譯碼模塊基于海量數(shù)據(jù)訓(xùn)練的知識(shí)庫(kù),通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò),提取與重建語(yǔ)義信息,該過(guò)程對(duì)經(jīng)典信號(hào)傳輸提供強(qiáng)先驗(yàn)知識(shí),有效提升傳輸有效性和可靠性。在發(fā)送端,語(yǔ)義提取模塊基于知識(shí)庫(kù)和深度學(xué)習(xí)網(wǎng)絡(luò),對(duì)信源消息提取語(yǔ)義特征。其中,語(yǔ)義提取模塊根據(jù)信源冗余特性,采用不同結(jié)構(gòu)的深度學(xué)習(xí)網(wǎng)絡(luò)模型。例如,時(shí)序以及文本信源采用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)網(wǎng)絡(luò)模型、圖像信源采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型、圖數(shù)據(jù)源采用圖卷積網(wǎng)絡(luò)(GCN)模型。在接收端,語(yǔ)義綜合模塊基于知識(shí)庫(kù)和深度學(xué)習(xí)網(wǎng)絡(luò),對(duì)接收的語(yǔ)義信息進(jìn)行重建。若信源具有多模態(tài)或異構(gòu)性,則語(yǔ)義提取編碼時(shí)還需要對(duì)多源數(shù)據(jù)進(jìn)行語(yǔ)義綜合。收發(fā)兩端共享云端知識(shí)庫(kù),通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方法賦予神經(jīng)網(wǎng)絡(luò)特定場(chǎng)景下的先驗(yàn)知識(shí)。
定義知識(shí)庫(kù)K,設(shè)信源消息集合為X,語(yǔ)義信息集合為S,語(yǔ)義消息碼序列構(gòu)成的集合為U,信宿接收碼序列集合為V,重建語(yǔ)義信息集合為S′,信宿譯碼消息集合為Y。
當(dāng)H(S) 與香農(nóng)信道容量類似,語(yǔ)義信道容量定義為可以實(shí)現(xiàn)任意小語(yǔ)義誤差的最大傳輸速率: 其中,I(S;S′)為S與S′之間的互信息,H(Y)為接收端語(yǔ)法信息Y的熵。 基于語(yǔ)義信道容量或語(yǔ)義率失真函數(shù)的通信系統(tǒng)優(yōu)化,為6G移動(dòng)通信高譜效、高可靠通信提供了新的技術(shù)思路。但是,如前所述,現(xiàn)有語(yǔ)義信息論研究在語(yǔ)義信息度量與優(yōu)化指標(biāo)方面還沒(méi)有明確結(jié)論。因此,語(yǔ)義信息熵、語(yǔ)義信道容量、語(yǔ)義率失真函數(shù)建模與評(píng)估還是開(kāi)放問(wèn)題,需要進(jìn)一步深入研究。 在語(yǔ)義通信系統(tǒng)結(jié)構(gòu)的基本框架下,本文針對(duì)典型文本和圖像信源,采用不同的語(yǔ)義編解碼器,根據(jù)語(yǔ)義評(píng)價(jià)指標(biāo),設(shè)計(jì)對(duì)應(yīng)的語(yǔ)義通信系統(tǒng)結(jié)構(gòu)。 對(duì)于文本信源,傳輸?shù)哪康氖莻鬟f文本表達(dá)的內(nèi)容及含義,而文本的組織方式,如助詞、連接詞、標(biāo)點(diǎn)符號(hào)的使用是實(shí)現(xiàn)通暢且符合語(yǔ)法規(guī)則表達(dá)文本內(nèi)容的手段。因此文本信源除具有統(tǒng)計(jì)冗余外,還含有額外的語(yǔ)義冗余。文本信源可采用雙向長(zhǎng)短期記憶(BiLSTM)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行語(yǔ)義提取與關(guān)聯(lián)建模[17,21],如圖2所示: 圖2 基于BiLSTM網(wǎng)絡(luò)的文本語(yǔ)義編碼傳輸示意 文本語(yǔ)義編碼傳輸?shù)脑u(píng)估指標(biāo)包括: (1)誤詞率(WER)。誤詞率可以用歸一化Levenshtein距離(編輯距離)評(píng)估。 (2)雙語(yǔ)評(píng)估替換分?jǐn)?shù)(BLEU, Bilingual Evaluation Understudy)可評(píng)估任意兩段文本之間的差異性。連續(xù)n個(gè)單詞(n-gram)準(zhǔn)確率越高,恢復(fù)語(yǔ)義越準(zhǔn)確。BLEU為n-gram準(zhǔn)確率的加權(quán)得分,定義如下: 其中Pn為n-gram的準(zhǔn)確率,wn為權(quán)重系數(shù)。 圖3給出了在占用相同帶寬條件下,傳統(tǒng)編碼與文本語(yǔ)義編碼在AWGN信道下的傳輸性能對(duì)比,其中文本信源采用BiLSTM模型進(jìn)行編碼,信道編碼采用LDPC碼,碼率R=0.75。子圖(a)為WER性能,子圖(b)為BLEU分?jǐn)?shù)。如圖3(a)所示,語(yǔ)義編碼傳輸方案的誤詞率遠(yuǎn)低于傳統(tǒng)信源信道編碼方案,如Huffman編碼,定長(zhǎng)5 bit編碼與RS編碼。圖3(b)給出了文本語(yǔ)義編碼在不同句長(zhǎng)條件下的平均BLEU分?jǐn)?shù)和長(zhǎng)句(30詞)的重建分?jǐn)?shù)。由圖可知,與傳統(tǒng)的Huffman+RS編碼相比,語(yǔ)義編碼傳輸?shù)腂LEU分?jǐn)?shù)有大幅度提升,特別是在低信噪比條件下,能顯著改善傳輸可靠性。 圖3 傳統(tǒng)編碼與文本語(yǔ)義編碼的性能對(duì)比 下面給出文本語(yǔ)義編碼在AWGN信道中傳輸?shù)囊粋€(gè)樣例: 原始文本:I hope that even more study courses will be set up which offer this as an integral part of the course. 5bit編碼+RS編碼重建文本:i t!pe dhat evmn moqe qtudy aourses will ba gt up which offer dfis as an integzal part of xgm cpurse. 語(yǔ)義編碼重建文本:I hope that even more study reading can be applied, which already this as an integral part of the course. 對(duì)比原始文本與5 bit編碼+RS編碼重建文本、語(yǔ)義編碼重建文本可知,由于傳統(tǒng)編碼存在差錯(cuò),因此重建文本存在語(yǔ)義錯(cuò)誤。而語(yǔ)義編碼能夠很好地對(duì)抗信道傳輸差錯(cuò),其重建文本與原始文本的含義一致。 圖4 圖像語(yǔ)義編碼傳輸框架 將語(yǔ)義提取與編碼網(wǎng)絡(luò)、語(yǔ)義分析與綜合網(wǎng)絡(luò)級(jí)聯(lián)信道編譯碼模塊在無(wú)線信道中進(jìn)行聯(lián)合訓(xùn)練,采用隨機(jī)梯度下降算法迭代更新網(wǎng)絡(luò)的參數(shù),網(wǎng)絡(luò)的損失函數(shù)L建模為: 其中α和β用于權(quán)衡兩種失真。 模型的訓(xùn)練集采集自真實(shí)工業(yè)場(chǎng)景的監(jiān)控?cái)z像頭,分辨率為256×256,訓(xùn)練500 000次迭代后使用1 080p分辨率進(jìn)行微調(diào)。訓(xùn)練過(guò)程固定學(xué)習(xí)率為0.000 2,當(dāng)loss穩(wěn)定時(shí)對(duì)學(xué)習(xí)率進(jìn)行一次0.1倍的衰減。在幀內(nèi)編碼模式(全I(xiàn)幀)下與H.264經(jīng)典編碼方案進(jìn)行比較,信道編碼為L(zhǎng)DPC碼。由于經(jīng)典的逐像素比較指標(biāo)如峰值信噪比(PSNR)、多尺度結(jié)構(gòu)相似度(MS-SSIM)[22]往往與用戶的真實(shí)感知相去甚遠(yuǎn),本文采用基于深度學(xué)習(xí)的圖像相似度指標(biāo)LPIPS[23]用于評(píng)估圖像的感知相似度,仿真參數(shù)配置如表1所示: 表1 仿真參數(shù)配置 由表可知,H.264編碼級(jí)聯(lián)LDPC信道碼方案雖然在PSNR評(píng)價(jià)指標(biāo)上占據(jù)優(yōu)勢(shì),但在用戶感知相似度(LPIPS)接近的情況下,語(yǔ)義編碼方案的編碼速率僅有H.264編碼方案的1/5,因此前者相比后者,能大幅度降低傳輸帶寬開(kāi)銷,從而顯著提升了頻譜效率。 圖5給出了AWGN信道下兩種編碼方案的重建樣本對(duì)比??梢钥闯鯤.264+LDPC重建圖像(子圖(c))產(chǎn)生了差錯(cuò)傳播現(xiàn)象,而語(yǔ)義編碼傳輸方案(子圖(b))對(duì)信道差錯(cuò)更魯棒,且重建質(zhì)量與在主觀感受上沒(méi)有差距。 圖5 H.264編碼與圖像語(yǔ)義編碼對(duì)比示例 本文簡(jiǎn)述了語(yǔ)義信息論以及語(yǔ)義編碼通信技術(shù)的基本原理。語(yǔ)義編碼通過(guò)對(duì)信源語(yǔ)義信息的深度挖掘與充分利用,有望突破經(jīng)典信息論的約束,為6G移動(dòng)通信的高頻譜效率與高可靠傳輸提供新型解決思路。 目前,語(yǔ)義通信技術(shù)仍然在快速發(fā)展中,語(yǔ)義信息論有眾多基本概念與基礎(chǔ)問(wèn)題亟待討論與完善,針對(duì)多種信源媒體特征的語(yǔ)義編譯碼方案層出不窮,但編碼方案的優(yōu)化設(shè)計(jì)與適用場(chǎng)景還需要深入探討??偠灾嫦?G的語(yǔ)義通信技術(shù),是一個(gè)新的研究領(lǐng)域,存在大量的理論與應(yīng)用問(wèn)題,需要學(xué)術(shù)界同仁共同推動(dòng)完成。3 語(yǔ)義通信初步結(jié)果
3.1 文本信源的語(yǔ)義編碼傳輸
3.2 圖像信源的語(yǔ)義編碼傳輸
4 結(jié)束語(yǔ)