徐逸群,張邦寧,張曉凱,郭道省
(陸軍工程大學(xué)通信工程學(xué)院,江蘇 南京 210007)
無(wú)線環(huán)境地圖(Radio Environment Map,REM)能夠?yàn)檎J(rèn)知無(wú)線電系統(tǒng)提供多域環(huán)境信息和先驗(yàn)知識(shí)[1-2],可以用于解決網(wǎng)絡(luò)規(guī)劃、干擾協(xié)調(diào)、功率控制和動(dòng)態(tài)頻譜接入等問(wèn)題。REM構(gòu)建的基本任務(wù)是從空間離散分布的頻譜感知設(shè)備獲取的無(wú)線電監(jiān)測(cè)數(shù)據(jù),推理沒(méi)有感知節(jié)點(diǎn)位置的信號(hào)強(qiáng)度。
現(xiàn)有研究中REM構(gòu)建的算法主要有近鄰(Nearest Neighbor,NN)插值法、逆距離加權(quán)近鄰(Inverse Distance Weighted Nearest Neighbor,IDW-NN)插值法[3-5]和基于空間統(tǒng)計(jì)學(xué)的克里金(Kriging)插值法[3,5-10]。其中,NN和IDW-NN沒(méi)有嚴(yán)密的數(shù)學(xué)理論支持,但是算法的實(shí)現(xiàn)較為簡(jiǎn)單,易于理解且計(jì)算量較??;克里金算法有嚴(yán)密的數(shù)學(xué)推導(dǎo),保證了其最佳線性無(wú)偏性,但該算法基于平穩(wěn)性假設(shè),即感知數(shù)據(jù)之間的相關(guān)性僅僅與2點(diǎn)之間的距離相關(guān),該假設(shè)是對(duì)現(xiàn)實(shí)世界的極大簡(jiǎn)化。這些構(gòu)建算法都沒(méi)有考慮復(fù)雜環(huán)境對(duì)電波傳播的影響。
近年來(lái),群智頻譜感知(Crowd-sourced Spectrum Sensing,CSS)技術(shù)受到廣范關(guān)注[11-12],該技術(shù)利用現(xiàn)有移動(dòng)通信網(wǎng)絡(luò)中的移動(dòng)通信終端來(lái)執(zhí)行頻譜感知任務(wù)。NN能夠提供海量數(shù)據(jù),如何從這些數(shù)據(jù)中提取有用信息,提升REM構(gòu)建的準(zhǔn)確性,值得深入研究。
REM構(gòu)建的準(zhǔn)確性,受到2個(gè)重要因素的制約:一是所研究的環(huán)境的復(fù)雜性,復(fù)雜的地形地物對(duì)電波傳播的影響較大,待估計(jì)位置的信號(hào)與已測(cè)量位置的信號(hào)之間的相關(guān)性受到不同環(huán)境的影響呈現(xiàn)出空間異構(gòu)的相互關(guān)系;二是采集數(shù)據(jù)的位置和數(shù)據(jù)量,一方面需要更多的數(shù)據(jù)以提升準(zhǔn)確性,另一方面在實(shí)際監(jiān)測(cè)系統(tǒng)中,采集更多數(shù)據(jù)帶來(lái)額外的系統(tǒng)開(kāi)銷,提升了數(shù)據(jù)處理分析難度。因此,需對(duì)數(shù)據(jù)采集的位置進(jìn)行優(yōu)化,在提升準(zhǔn)確率的同時(shí)盡可能減少冗余數(shù)據(jù)。
本文提出一種新穎的基于變換核高斯回歸模型的REM構(gòu)建算法,該算法以高斯過(guò)程(Gaussian Processes,GP)為基本框架,考慮了環(huán)境異構(gòu)性對(duì)REM構(gòu)建的影響,能夠從群智感知數(shù)據(jù)中學(xué)習(xí)環(huán)境異構(gòu)性信息。此環(huán)境異構(gòu)性信息是進(jìn)行空間數(shù)據(jù)選擇的重要前提,因此在所提模型基礎(chǔ)上,利用獲取的空間異構(gòu)性信息,提出了2種無(wú)線電頻譜監(jiān)測(cè)空間選點(diǎn)方案,進(jìn)一步提升REM構(gòu)建的準(zhǔn)確性,并通過(guò)數(shù)據(jù)選擇降低系統(tǒng)開(kāi)銷和數(shù)據(jù)冗余。
對(duì)某二維平面空間內(nèi)群智感知設(shè)備的數(shù)據(jù)進(jìn)行研究,不失一般性,假設(shè)此二維平面區(qū)域?yàn)? km×1 km的范圍。區(qū)域內(nèi)的感知設(shè)備將其位置和測(cè)量的接收信號(hào)強(qiáng)度上報(bào)給融合中心。
REM構(gòu)建的主要任務(wù)是推理沒(méi)有感知設(shè)備位置的信號(hào)強(qiáng)度,進(jìn)而繪制該區(qū)域的功率譜密度圖。在實(shí)際信號(hào)強(qiáng)度測(cè)量過(guò)程中,采用長(zhǎng)期測(cè)量的方法以消除小尺度衰落和噪聲的影響,得到的平均接收信號(hào)強(qiáng)度可分解為3個(gè)部分,分別為自由空間傳播路徑損耗、陰影效應(yīng)和測(cè)量設(shè)備導(dǎo)致的誤差,如式(1)所示:
(1)
式中,Pt為發(fā)送功率;d0為參考單位距離;λ為波長(zhǎng);η為自由空間傳播損耗因子;Lt為信號(hào)源位置;lj為第j個(gè)感知設(shè)備的位置;Sj為信號(hào)源至第j個(gè)感知設(shè)備的陰影衰落分量;Nj為第j個(gè)感知設(shè)備的測(cè)量誤差。
自由空間傳播損耗可以通過(guò)鏈路計(jì)算得到,因此REM構(gòu)建的困難在于陰影效應(yīng)引起的電波傳播變化。在無(wú)線通信系統(tǒng)中,考察單個(gè)接收點(diǎn)的陰影效應(yīng)時(shí),通常將其建模為一個(gè)服從對(duì)數(shù)正態(tài)分布的變量。文獻(xiàn)[13]針對(duì)空間陰影效應(yīng)的空間相關(guān)性進(jìn)行了詳細(xì)的研究,通過(guò)將構(gòu)建的空間損耗場(chǎng)模型與實(shí)測(cè)數(shù)據(jù)對(duì)比,證明了發(fā)射源相同而接收點(diǎn)接近時(shí),空間陰影效應(yīng)有較強(qiáng)的相關(guān)性。有學(xué)者將這種相關(guān)性運(yùn)用于REM的構(gòu)建中[8-9],以提升REM構(gòu)建的準(zhǔn)確性。
以前的研究中,空間相關(guān)陰影效應(yīng)被建模為一個(gè)各向同性且平穩(wěn)的過(guò)程,此假設(shè)可以等同為假設(shè)電波在空間中傳播受到的影響是相同的,即傳播環(huán)境是勻質(zhì)性的。而實(shí)際上,電波傳播環(huán)境十分復(fù)雜,特別是在城市區(qū)域,由于信號(hào)傳播的陰影效應(yīng)影響,不同位置數(shù)據(jù)之間的相關(guān)性不僅僅取決于二者之間的距離。復(fù)雜的環(huán)境提升了空間推理的難度,由于環(huán)境的異構(gòu)性,要提升REM構(gòu)建的準(zhǔn)確性,應(yīng)將空間內(nèi)陰影效應(yīng)分量建模為各向異性和非平穩(wěn)的過(guò)程。本文研究的算法旨在表征環(huán)境的異構(gòu)性,以進(jìn)一步提升空間頻譜推理的準(zhǔn)確性。
此外,由于數(shù)據(jù)的空間相關(guān)性,某一點(diǎn)的數(shù)據(jù)可以提供其臨近點(diǎn)的信息。從信息熵的角度考慮,在空間內(nèi)每增加一個(gè)感知節(jié)點(diǎn),即可降低該區(qū)域的不確定性。然而,當(dāng)區(qū)域內(nèi)感知節(jié)點(diǎn)密集到一定程度時(shí),新增節(jié)點(diǎn)提供的信息熵越來(lái)越小,增加感知節(jié)點(diǎn)的性價(jià)比逐漸降低。同時(shí),由于環(huán)境的非勻質(zhì)性,在某些地形、地物環(huán)境不太復(fù)雜的區(qū)域內(nèi),只需要少量的感知設(shè)備即可表征該區(qū)域內(nèi)的信息;而在地形、地物環(huán)境較為復(fù)雜的區(qū)域內(nèi),則需要布置更多的感知設(shè)備。由于空間環(huán)境的復(fù)雜性,實(shí)際應(yīng)用中,監(jiān)測(cè)數(shù)據(jù)的空間位置也會(huì)對(duì)REM構(gòu)建結(jié)果產(chǎn)生影響。因此,應(yīng)根據(jù)環(huán)境異構(gòu)性信息設(shè)計(jì)相應(yīng)的頻譜監(jiān)測(cè)設(shè)備的選點(diǎn)方案。
REM構(gòu)建的本質(zhì)是一個(gè)復(fù)雜的回歸任務(wù),而GP由于其靈活性,特別適用于此類任務(wù)。作為機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)重要工具,GP近來(lái)年得到了廣泛的研究[14-18]。
GP回歸參數(shù)的訓(xùn)練通過(guò)最大化邊際似然函數(shù)來(lái)完成。邊際似然函數(shù)表示為:
N(y|0,Σθ),
(2)
則負(fù)邊緣對(duì)數(shù)似然函數(shù)(Negative Log Marginal Likelihood,NLML)表示為:
L(θ)=-lnp(y|X,θ)=
(3)
式中,det(·)表示矩陣的行列式。
GP訓(xùn)練過(guò)程被構(gòu)建為下列非凸優(yōu)化問(wèn)題:
(4)
通常,使用基于梯度下降的優(yōu)化算法,尋找NLML的最優(yōu)解。
GP的核函數(shù)隱含了關(guān)于建模的函數(shù)f所屬類別的假設(shè)[17],等同于學(xué)習(xí)算法中的“歸納偏好”。在此意義上,關(guān)于模型的先驗(yàn)知識(shí),可以通過(guò)GP的核函數(shù)嵌入到GP回歸模型中。有一些常用的基礎(chǔ)核函數(shù),如線性核函數(shù)、徑向基函數(shù)核函數(shù)、周期核函數(shù)、Matern核函數(shù)和譜混合核函數(shù)等[18]。核函數(shù)的設(shè)計(jì)和選擇對(duì)GP回歸模型的性能有很大的影響。例如,線性核函數(shù)推斷出的模型函數(shù)f為線性函數(shù),周期核函數(shù)推斷出的模型函數(shù)f具有周期化的結(jié)構(gòu)。
Wilson提出的深度核學(xué)習(xí)(Deep Kernel Learning,DKL)將深度架構(gòu)的表示能力封裝到GP中,具有利用數(shù)據(jù)學(xué)習(xí)核函數(shù)的能力。DKL從一個(gè)參數(shù)為θ的基本核函數(shù)k(xi,xj|θ)開(kāi)始,利用權(quán)重參數(shù)為w的深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)對(duì)原輸入進(jìn)行非線性變換,將基礎(chǔ)核函數(shù)轉(zhuǎn)化為:
k(xi,xj|θ)→k(h(xi,w),h(xj,w)|θ,w),
(5)
式中,h(·)為DNN的非線性變換。DKL大幅度提升了GP的表示能力,并通過(guò)優(yōu)化GP的邊際似然函數(shù)為核函數(shù)提供自動(dòng)學(xué)習(xí)功能。但是,在某些情況下,DKL算法的穩(wěn)定性較差,GP會(huì)嘗試?yán)肈NN的靈活性在所有的輸入數(shù)據(jù)之間建立相關(guān)性,同時(shí)DKL中的DNN容易產(chǎn)生過(guò)擬合[19]。
在GP中引入非平穩(wěn)性的一種方法是引入一個(gè)非線性變換h(x),將空間D中的輸入x變換到一個(gè)新的空間D′中[14]。在DKL中,DNN是用于變換輸入空間的非線性變換,且該線性變換由DNN的權(quán)重參數(shù)表征。然而,在空間頻譜推理問(wèn)題中,模型的輸入是感知設(shè)備的位置信息,所表示的空間是實(shí)際的物理空間。用DNN對(duì)該空間進(jìn)行非線性變換易引起空間折疊效應(yīng),不適用于本節(jié)研究問(wèn)題中的物理量。因此,DKL雖然有強(qiáng)大的表示力和從數(shù)據(jù)中學(xué)習(xí)核函數(shù)的能力,但不適用于REM構(gòu)建問(wèn)題。
受到DKL的優(yōu)缺點(diǎn)的啟發(fā),解決REM構(gòu)建問(wèn)題應(yīng)設(shè)計(jì)一個(gè)具有以下特性的非線性變換:
① 非線性變換能夠通過(guò)一些參數(shù)來(lái)表征,通過(guò)變化參數(shù)值可以改變非線性變化的形態(tài),以使其具有一定的表示能力,可以靈活地表示各向異性和非平穩(wěn)性;
② 非線性變換應(yīng)是單射,具有拓?fù)渫咝裕瑥亩粫?huì)引起空間折疊效應(yīng)。
通過(guò)設(shè)計(jì)3種簡(jiǎn)單的具有上述特性的非線性變換,并將這3種簡(jiǎn)單的非線性變換組合起來(lái),可以構(gòu)造一個(gè)靈活的非線性變換來(lái)表征空間異質(zhì)性。下文將詳細(xì)說(shuō)明這3種變換。
為了清楚表述,某一點(diǎn)在二維空間的位置表示為s=(s1,s2);α,β和γ表示非線性變換的超參數(shù),超參數(shù)的值在模型設(shè)計(jì)時(shí)根據(jù)具體研究問(wèn)題的范圍和復(fù)雜度選擇確定;用w和w,或二者加下標(biāo)表示的權(quán)重參數(shù)決定非線性變換的具體形態(tài),權(quán)重參數(shù)的取值在模型訓(xùn)練過(guò)程從感知數(shù)據(jù)中學(xué)習(xí)獲得。
坐標(biāo)軸變換單元(Axial Transformation Unit,ATU)是指對(duì)多維數(shù)據(jù)的其中一個(gè)維度(即其中一個(gè)坐標(biāo)軸)進(jìn)行獨(dú)立的非線性變換,通過(guò)一下步驟實(shí)現(xiàn):
① 以二維空間為例,將輸入數(shù)據(jù)的位置坐標(biāo)信息歸一化至[0,1]或[-1,0],為方便區(qū)分,可以將橫軸歸一化至[0,1],縱軸歸一化至[-1,0]。
② 對(duì)某個(gè)維度的ATU通過(guò)一系列基函數(shù)φ(sk)的加權(quán)和來(lái)實(shí)現(xiàn),ATU的基函數(shù)如圖1(a)所示,分別對(duì)2個(gè)維度進(jìn)行坐標(biāo)軸變換的示例如圖1(b)和圖1(c)所示。其中,第一個(gè)基函數(shù)斜率為1的線性變換函數(shù)φ1(sk)=sk,其余基函數(shù)為平移的Sigmoid函數(shù):
(a)ATU的基函數(shù)
(6)
式中,參數(shù)αi1決定了Sigmoid函數(shù)的梯度;αi2決定了Sigmoid函數(shù)的偏移位置;r為Sigmoid函數(shù)的數(shù)量,決定了在[0,1]內(nèi)非線性變換的分辨率,該分辨率也決定了非線性變換的表示能力,當(dāng)環(huán)境較為復(fù)雜、局部特征較多時(shí),可以增大該分辨率,用更多的Sigmoid函數(shù)構(gòu)成非線性變換。
③ 將變換后的值歸一化至[0,1]或[-1,0]。
由于Sigmoid函數(shù)的單調(diào)性,如果將所有權(quán)重參數(shù)限制為正值,則可以保證ATU是由[0,1]→[0,1]或[-1,0]→[-1,0]的單射非線性變換,且該變化具有一定的靈活性,可以通過(guò)權(quán)重參數(shù)控制變換的具體形態(tài)。維度1的ATU計(jì)算結(jié)構(gòu)如圖2所示,其中表示歸一化。
圖2 維度1的ATU計(jì)算結(jié)構(gòu)
綜上,將對(duì)輸入向量的第k維的ATU定義為:
(7)
(8)
式中,
(9)
徑向基函數(shù)變換單元(Radial Basis Function Transformation Unit,RBFTU)是對(duì)原空間局部擴(kuò)展或者壓縮,該變換定義為:
fr(s;wr,β,γ)=s+wr(s-γ)e-β‖s-γ‖,
(10)
式中,超參數(shù)γ=(γ1,γ2)是局部擴(kuò)張或者壓縮的中心點(diǎn);超參數(shù)β可以控制局部擴(kuò)展或者壓縮的邊界;權(quán)重參數(shù)wr決定擴(kuò)張或者壓縮的程度。若將權(quán)重參數(shù)wr限制在(-1,e3/2/2),則可確保該變換為單射[20]。RBFTU的計(jì)算結(jié)構(gòu)如圖3所示。
圖3 RBFTU的計(jì)算結(jié)構(gòu)
中心位置在(0.25,-0.125)的RBFTU示例如圖4(a)所示,通過(guò)選擇不同的超參數(shù)γ和β,并將不同的RBFTU級(jí)聯(lián)在一起,可以構(gòu)造整個(gè)空間范圍內(nèi)不同局部壓縮和擴(kuò)張的非線性變換,如圖 4(b)所示。研究環(huán)境較復(fù)雜時(shí),可以增加級(jí)聯(lián)的RBFTU的分布密度。
(a)單個(gè)徑向基函數(shù)變換的影響區(qū)域范圍
莫比烏斯變換是在復(fù)平面上的一對(duì)一的可以映射到自身的保角變換[21]。令z=s1+s2j,(j2=-1),莫比烏斯變換單元(Mobius Transformation Unit,MTU)可以定義為:
fm(s;wm)=(R[gm(z)],I[gm(z)]),
(11)
式中,
(12)
a,b,c,d是滿足ad-bc≠0的復(fù)數(shù)。MTU的權(quán)重參數(shù)為:
wm=[R(a),I(a),R(b),I(b),R(c),I(c),
R(d),I(d)]。
(13)
MTU的計(jì)算結(jié)構(gòu)如圖5所示。
圖5 MTU的計(jì)算結(jié)構(gòu)
MTU變換一個(gè)二維空間D2=[0,1]×[0,1]內(nèi)的一個(gè)正方形棋盤形狀的示例如圖6所示。從式(12)可以推導(dǎo)出gm(-d/c)=∞,因此,為了確保D2內(nèi)的點(diǎn)不會(huì)映射至∞,必須將-d/c限制在復(fù)平面上由點(diǎn)[0+0j,0+1j,1+1j,1+0j]包圍的區(qū)域內(nèi)。
圖6 MTU示例
上述3種基本變換單元都滿足本節(jié)提出的2種基本性質(zhì),可以作為構(gòu)建二維空間內(nèi)的復(fù)雜非線性單射同胚變換的基本模塊??梢愿鶕?jù)實(shí)際應(yīng)用場(chǎng)景的不同,設(shè)計(jì)并選擇這些變換的不同組合對(duì)原空間內(nèi)的核函數(shù)進(jìn)行變換。同時(shí),所有的權(quán)重參數(shù):
(14)
可以與GP的基礎(chǔ)核函數(shù)的參數(shù)一起,通過(guò)最小化GP的NLML,從數(shù)據(jù)中學(xué)習(xí)得到參數(shù)的具體取值。
變換核高斯回歸(Transformed Kernel Gaussian Process Regression,TKGPR)模型如圖7所示。構(gòu)建的TKGPR模型包含維度1的ATU、維度2的ATU、一系列的RBFTU的級(jí)聯(lián)和一個(gè)MTU,這些基礎(chǔ)變換一起構(gòu)建出對(duì)原始二維空間的單射非線性變換,最后,將變換后的結(jié)果輸入GP得到輸入點(diǎn)的信號(hào)強(qiáng)度的概率分布。
圖7 TKGPR模型
組合成的非線性變換可以用復(fù)合函數(shù)表示為:
(15)
從僅有參數(shù)σ2和l的基礎(chǔ)核函數(shù):
(16)
開(kāi)始,用非線性變換轉(zhuǎn)換原始核函數(shù):
k(si,sj;σ,l)→k(h(si;W),h(sj;W);σ,l,W),
(17)
式中,h(s;W)為由參數(shù)W決定的合成的非線性映射。
將此算法命名為變換核學(xué)習(xí)(Transformed Kernel Learning,TKL)。在實(shí)際應(yīng)用中,可以根據(jù)研究區(qū)域的情況選擇基本變換的組合方式以及每個(gè)基本變換單元的超參數(shù)的數(shù)量,使得模型的復(fù)雜度與待研究區(qū)域內(nèi)環(huán)境的復(fù)雜度相一致。
使用群智感知數(shù)據(jù)進(jìn)行REM構(gòu)建主要存在以下幾點(diǎn)問(wèn)題:① 群智感知終端是利用用戶移動(dòng)通信設(shè)備進(jìn)行數(shù)據(jù)采集,設(shè)備能力較弱、數(shù)據(jù)精確度不高;② 大量群智感知設(shè)備提供了大量的冗余數(shù)據(jù),在模型訓(xùn)練階段大量的數(shù)據(jù)可以更好地訓(xùn)練GP模型,而在REM預(yù)測(cè)階段冗余數(shù)據(jù)提供的信息量有限,帶來(lái)了數(shù)據(jù)處理的計(jì)算壓力;③ 由于用于終端運(yùn)行感知任務(wù)會(huì)帶來(lái)額外的電量消耗,用戶不愿意長(zhǎng)期運(yùn)行于數(shù)據(jù)感知狀態(tài),雖然有學(xué)者針對(duì)群智感知設(shè)備的運(yùn)行成本進(jìn)行優(yōu)化設(shè)計(jì),但利用大量用戶長(zhǎng)期進(jìn)行感知還是會(huì)產(chǎn)生額外的經(jīng)濟(jì)消耗。
針對(duì)上述問(wèn)題,本節(jié)研究的場(chǎng)景為:在模型訓(xùn)練階段,通過(guò)利用N個(gè)群智感知節(jié)點(diǎn)的數(shù)據(jù)結(jié)合TKGPR模型獲取當(dāng)前研究區(qū)域內(nèi)的環(huán)境異構(gòu)性信息,即該區(qū)域內(nèi)的變換核函數(shù)參數(shù)。由于區(qū)域內(nèi)的地形、地物短時(shí)間內(nèi)變化較小,可以近似為不變。因此,估計(jì)出的變換核函數(shù)參數(shù)可以繼續(xù)用于REM的構(gòu)建過(guò)程。在構(gòu)建階段,考慮采用2種方式:一種是設(shè)置專用的頻譜采集設(shè)備獲取更高精度的測(cè)量數(shù)據(jù),在此區(qū)域內(nèi)布置k(k?N)個(gè)專用的監(jiān)測(cè)節(jié)點(diǎn)以取代群智監(jiān)測(cè)的方法;另一種是在大量群智感知中選擇k(k?N)個(gè)點(diǎn)的數(shù)據(jù)用于空間推理,獲取實(shí)時(shí)的REM狀態(tài),以降低數(shù)據(jù)獲取成本和需處理的數(shù)據(jù)量。
本節(jié)提出2種基于TKGPR模型的頻譜監(jiān)測(cè)空間選點(diǎn)算法,分別為基于貪婪算法的互信息最大化(Greedy-based Mutual Information Maximum,GMIM)空間選點(diǎn)算法和基于變分推斷(Variational Inference,VI)的空間選點(diǎn)算法。
2種選點(diǎn)算法同樣基于GP,GMIM利用GP模型的核函數(shù)進(jìn)行選點(diǎn),將訓(xùn)練產(chǎn)生的核函數(shù)作為算法的輸入條件。GMIM算法流程如圖8所示。VI算法是通過(guò)改變GP回歸模型的優(yōu)化目標(biāo)進(jìn)行選點(diǎn),將TKGPR模型訓(xùn)練過(guò)程和空間選點(diǎn)過(guò)程結(jié)合起來(lái),以證據(jù)下界(Evidence Lower Bound,ELBO)作為算法優(yōu)化目標(biāo)以自動(dòng)完成空間選點(diǎn),基于VI的選點(diǎn)算法流程如圖9所示。下面詳細(xì)闡述2種空間選點(diǎn)算法。
圖8 GMIM算法流程
圖9 基于VI的選點(diǎn)算法流程
首先,將研究區(qū)域網(wǎng)格狀離散化,并將選點(diǎn)問(wèn)題定義為:在R2空間內(nèi)的有限大小的子集V內(nèi)選取k個(gè)最優(yōu)的位置,其中V為離散化得到的可能選擇的位置,假設(shè)選擇的最優(yōu)的k個(gè)點(diǎn)組成集合A,則沒(méi)有感知設(shè)備的點(diǎn)表示為VA。網(wǎng)格狀離散化點(diǎn)集示意如圖10所示,空間離散化的所有點(diǎn)構(gòu)成點(diǎn)集V,紅色點(diǎn)為點(diǎn)集A,藍(lán)色點(diǎn)為點(diǎn)集VA。
圖10 網(wǎng)格狀離散化點(diǎn)集示意
將空間選點(diǎn)的優(yōu)化目標(biāo)定義為選擇的k個(gè)點(diǎn)能夠盡可能預(yù)測(cè)沒(méi)有感知節(jié)點(diǎn)位置處的數(shù)據(jù),即尋找一個(gè)A*能夠最大程度降低沒(méi)有感知設(shè)備位置處數(shù)據(jù)的熵:
(18)
式中,H(·)為隨機(jī)變量的熵。式(18)等同于最大化點(diǎn)集A處的隨機(jī)變量和點(diǎn)集VA處隨機(jī)變量的互信息量I(yA;yVA),為簡(jiǎn)化表示,定義選擇點(diǎn)集A后的互信息量為:
MI(A)=I(yA;yVA)。
(19)
對(duì)互信息量進(jìn)行優(yōu)化是一個(gè)NP-完全問(wèn)題,無(wú)法在多項(xiàng)式時(shí)間內(nèi)找到最優(yōu)解,因此,考慮采用貪婪算法逐個(gè)增加監(jiān)測(cè)點(diǎn)以獲取此問(wèn)題的次優(yōu)解。假設(shè)下一個(gè)選取的點(diǎn)為z,最大化增加該點(diǎn)后提升的互信息量:
MI(A∪z)-MI(A)=H(yA∪z)-H(yA∪z|yV(A∪z))-
[H(yA)-H(yA|yVA)]=
H(yA∪z)-H(yV)+H(yV(A∪z))-
[H(yA)-H(yV)+H(yVA)]=
H(yz|yA)-H(yz|yV(A∪z))。
(20)
(21)
基于貪婪算法的互信息最大化監(jiān)測(cè)設(shè)備選點(diǎn)算法如算法1所示。
算法1:基于貪婪算法的互信息最大化監(jiān)測(cè)點(diǎn)選擇算法輸入:協(xié)方差矩陣ΣVV,監(jiān)測(cè)點(diǎn)數(shù)目k,可選位置集合V輸出:選擇的監(jiān)測(cè)點(diǎn)位置集合A1:將集合A設(shè)置為空集?2:for j=1→k do3: for z∈VA do 4: δz←σ2z-ΣzAΣAAAA-1ΣAzσ2z-ΣzA-ΣA-A--1ΣA-z5: end for6: z?←argmax7: A←A∪z?8:end for
在研究空間內(nèi)需要選擇M個(gè)點(diǎn),假設(shè)這些選擇的測(cè)量點(diǎn)組成的向量為:
Z=[z1,z2,…,zM],
(22)
這M個(gè)點(diǎn)的取值可以表示為:
u=f(Z)。
(23)
為了使從這M個(gè)點(diǎn)的數(shù)據(jù)得出的高斯過(guò)程f的后驗(yàn)分布盡可能接近利用所有的數(shù)據(jù)得到后驗(yàn)分布,假設(shè)qφ,θ(f)為通過(guò)數(shù)據(jù)(Z,u)得出的f的后驗(yàn)概率分布,φ為引入的變分參數(shù),該參數(shù)包括分布qφ,θ(f)的均值、方差,以及M個(gè)點(diǎn)的位置信息。為了使得qφ,θ(f)盡可能接近利用所有數(shù)據(jù)獲取的后驗(yàn)概率分布,使用KL散度表征其與所有數(shù)據(jù)的后驗(yàn)概率分布pθ(f|y,X)的距離:
KL(qφ,θ(f)‖pθ(f))-lnpθ(y|X)。
(24)
調(diào)整式(24)兩邊各項(xiàng)位置可得:
KL(qφ,θ(f)‖pθ(f)),
(25)
式(25)左邊第1項(xiàng)為GP的對(duì)數(shù)邊緣似然函數(shù)(Log Marginal Likelihood,LML),第2項(xiàng)為從m個(gè)數(shù)據(jù)得到的f的后驗(yàn)概率分布與所有數(shù)據(jù)得到的f的后驗(yàn)概率分布的KL散度;式右側(cè)定義為ELBO[14]。由于KL散度的取值為非負(fù)值,當(dāng):
qφ,θ(f)=pθ(f|y,X),
(26)
時(shí),左側(cè)的KL散度取值為0,ELBO的值等于對(duì)數(shù)邊緣似然分布,因此ELBO為L(zhǎng)ML的下界。在GP中,通常設(shè)置LML為優(yōu)化目標(biāo),將問(wèn)題轉(zhuǎn)化為優(yōu)化對(duì)數(shù)邊緣分布的下界,即:
(27)
(28)
式中,第I部分可以通過(guò)下列推導(dǎo)表示為:
(29)
因此,式(28)可表示為:
KL(qφ(u)‖pφ,θ(u))。
(30)
假設(shè)變分分布為多元高斯分布:
qφ(u)~N(μu,Suu),
(31)
則式(30)右側(cè)可以用閉式表達(dá)式表示。同時(shí),式(30)表明,可以使用批量梯度下降算法,完成模型的訓(xùn)練。在優(yōu)化ELBO的同時(shí),可以得到TKGPR模型各個(gè)參數(shù)的取值,以及變分參數(shù)的取值,其中包括各個(gè)點(diǎn)的位置信息。
4.1.1 模型構(gòu)建
選擇TKGPR模型的超參數(shù)如下:2個(gè)ATU的分辨率取值都為20,級(jí)聯(lián)的RBFTU以9×9的方式均勻分布在二維空間內(nèi),每個(gè)RBFTU的邊界與臨近RBFTU的中心點(diǎn)相交以確保變換對(duì)整個(gè)區(qū)域的覆蓋,選擇徑向基函數(shù)(Radial Basis Function,RBF)為GP的基礎(chǔ)核函數(shù)。按此方法構(gòu)建的TKGPR模型有133個(gè)控制參數(shù)。每個(gè)ATU有21個(gè)參數(shù),級(jí)聯(lián)的RBFTU共有81個(gè)參數(shù),MTU有8個(gè)參數(shù),RBF核函數(shù)有2個(gè)參數(shù)。在實(shí)際使用中,可以根據(jù)研究問(wèn)題的復(fù)雜度選擇構(gòu)建空間非線性變換的參數(shù)數(shù)量。
4.1.2 訓(xùn)練和推理過(guò)程
TKGPR模型的訓(xùn)練集為{X,y},X為群智感知設(shè)備的位置,y為接收信號(hào)強(qiáng)度。利用反向傳播算法進(jìn)行模型訓(xùn)練,并借助“PyTorch”用GPU加速訓(xùn)練模型訓(xùn)練過(guò)程。根據(jù)式(3)和式(17),將TKGPR的NLML作為損失函數(shù),可以表示為:
(32)
通過(guò)鏈?zhǔn)椒▌t得到參數(shù)的梯度:
(33)
最后,利用訓(xùn)練好的模型參數(shù),可以得到無(wú)感知終端位置處的接收信號(hào)強(qiáng)度的預(yù)測(cè)分布。該預(yù)測(cè)分布不僅僅得到預(yù)測(cè)的結(jié)果,同時(shí)還提供了結(jié)果的不確定性度量,這是GP優(yōu)勢(shì)之一。
4.1.3 性能分析對(duì)比
在仿真分析中,模擬了區(qū)域?yàn)? km×1 km范圍內(nèi)180×180個(gè)點(diǎn)的陰影效應(yīng)分量,并選擇該區(qū)域內(nèi)均勻隨機(jī)分布的若干點(diǎn)作為群智感知設(shè)備的感知數(shù)據(jù)。利用感知數(shù)據(jù),采用NN、IDWNN、普通克里金(Ordinary Kriging,OK)、GP和本節(jié)提出的TKL算法,恢復(fù)了該區(qū)域內(nèi)陰影效應(yīng)分量。實(shí)驗(yàn)表明,當(dāng)NN和IDWNN算法參與計(jì)算的鄰居節(jié)點(diǎn)數(shù)量大約為20時(shí),其估計(jì)性能較好,因此選擇鄰居節(jié)點(diǎn)數(shù)為20與其他算法進(jìn)行對(duì)比。OK算法的性能由選擇的變差函數(shù)形式?jīng)Q定,本文參考文獻(xiàn)[8]使用指數(shù)半變差函數(shù)。
使用500個(gè)群智感知設(shè)備,用不同算法恢復(fù)的區(qū)域內(nèi)的陰影效應(yīng)及真實(shí)陰影效應(yīng)的對(duì)比如圖 11所示,圖11(a)為群智感知設(shè)備的觀測(cè)值,圖11(b)為真實(shí)的陰影效應(yīng)分量,圖11(c)~圖11(g)分別為NN,IDWNN,OK,GP及本節(jié)提出的TKL算法的恢復(fù)結(jié)果,該圖提供了不同算法空間推理結(jié)果的直觀印象。
(a)測(cè)量點(diǎn)數(shù)據(jù)
進(jìn)一步,通過(guò)與實(shí)際陰影效應(yīng)分量進(jìn)行對(duì)比,用4個(gè)指標(biāo)衡量算法的性能,分別為均方根誤差(Root Mean Square Error,RMSE)、連續(xù)分級(jí)概率評(píng)分(Continuous Ranked Probability Score,CRPS)[22]、正確檢測(cè)區(qū)域比例(Correct Detection Zone Ratio,CDZR)和虛警區(qū)域比例(False Alarm Zone Ratio,F(xiàn)AZR)[1]。
RMSE用于評(píng)估點(diǎn)估計(jì)的結(jié)果,CRPS將平均絕對(duì)誤差推廣至概率預(yù)測(cè)場(chǎng)景下,是一種廣泛應(yīng)用于當(dāng)預(yù)測(cè)結(jié)果為概率分布而觀測(cè)結(jié)果為確定值時(shí)的評(píng)價(jià)指標(biāo),可以理解為預(yù)測(cè)分布與在真實(shí)確定值點(diǎn)處的退化分布之間(單位階躍函數(shù))的平方積分距離:
(34)
不同算法RMSE和CRPS隨群智感知設(shè)備數(shù)量變化的曲線如圖 12和圖 13所示。
圖12 不同算法RMSE隨群智感知設(shè)備數(shù)量變化的曲線
圖13 不同算法CRPS隨群智感知設(shè)備數(shù)量變化的曲線
可以看出,GP和OK算法的RMSE大致相同,而GP有更好的CRPS。由于GP和OK算法都基于環(huán)境同質(zhì)性的假設(shè),因此預(yù)測(cè)分布的平均值大致相同。當(dāng)群智傳感器的數(shù)量大于 400 時(shí),所提出的 TKL算法優(yōu)于所有其他算法。TKL 算法可以從感知數(shù)據(jù)中學(xué)習(xí)環(huán)境信息,并將此信息隱含在非線性變換的參數(shù)中,為其準(zhǔn)確性提供了性能增益。當(dāng)群智感知設(shè)備的數(shù)量較少時(shí),TKL算法性能較差,這是因?yàn)榫植繀^(qū)域內(nèi)的感知設(shè)備太少,導(dǎo)致算法無(wú)法捕捉到環(huán)境的異質(zhì)性。
CDZR和FAZR的對(duì)比分析如圖 14和圖 15所示,分別展示了不同算法的CDZR和FAZR隨研究區(qū)域內(nèi)群智感知數(shù)量變化的曲線。同樣,當(dāng)研究區(qū)內(nèi)的群智感知設(shè)備的數(shù)量超過(guò)400,算法可以捕捉到局部環(huán)境的異質(zhì)性時(shí),提出的TKL算法的CDZR高于其他算法。TKL算法的FAZR略低于OK和GP算法,但若將FAZR和CDZR聯(lián)合起來(lái)進(jìn)行評(píng)估,可以發(fā)現(xiàn),算法以較小的FAZR損失換取了較大的CDZR的提升。這也符合認(rèn)知通信系統(tǒng)的設(shè)計(jì)原則,即避免對(duì)主用戶的影響比頻譜利用機(jī)會(huì)的提升更加重要。
圖14 不同算法CDZR隨群智感知設(shè)備數(shù)量變化的曲線
圖15 不同算法FAZR隨群智感知設(shè)備數(shù)量變化的曲線
同時(shí),在模型訓(xùn)練過(guò)程中發(fā)現(xiàn)TKL算法不易過(guò)擬合,它保留了GP不易過(guò)擬合的固有特性[14]。另外,與DKL中的DNN不同,TKL算法中的非線性變換受限于幾種單射映射,增加了GPR模型的靈活性,而不會(huì)引起DKL中的病態(tài)效應(yīng)[19]。在這些算法中,TKL 的復(fù)雜度最高,但由于網(wǎng)絡(luò)和數(shù)據(jù)采集技術(shù)的發(fā)展,可以獲取的數(shù)據(jù)量呈爆炸式增長(zhǎng),且計(jì)算機(jī)的算力也在不斷得到提升。因此,此類算法的實(shí)現(xiàn)成為可能,具有很好的應(yīng)用前景。
4.2.1 仿真實(shí)驗(yàn)設(shè)置
在GMIM算法中,需要從有限的點(diǎn)集內(nèi)選擇頻譜監(jiān)測(cè)點(diǎn),因此將研究空間離散化為40×40的柵格狀點(diǎn)陣,作為待選擇的頻譜監(jiān)測(cè)點(diǎn)集V,從中選擇100個(gè)監(jiān)測(cè)點(diǎn)。在模型訓(xùn)練階段,使用2 000組群智感知數(shù)據(jù),訓(xùn)練TKGPR模型,以獲取研究區(qū)域內(nèi)的1 600個(gè)柵格點(diǎn)的協(xié)方差矩陣,作為GMIM算法的輸入條件。
在VI算法中,使用同樣的2 000組群智感知數(shù)據(jù),將待選點(diǎn)的初始位置設(shè)為10×10矩形柵格狀均勻分布的點(diǎn),通過(guò)優(yōu)化ELBO在訓(xùn)練TKGPR模型的同時(shí),優(yōu)化這100個(gè)點(diǎn)的位置變量。
區(qū)分2種應(yīng)用場(chǎng)景,將所提算法與均勻隨機(jī)選點(diǎn)進(jìn)行分析對(duì)比。2種應(yīng)用場(chǎng)景分別為:① 監(jiān)測(cè)點(diǎn)和待估計(jì)點(diǎn)為有限個(gè)離散點(diǎn)集時(shí);② 監(jiān)測(cè)點(diǎn)選擇的自由度較高,而需要使得整個(gè)區(qū)域內(nèi)推理的平均誤差較低時(shí)。
對(duì)5種情況進(jìn)行了仿真實(shí)驗(yàn),分別為:
① GMIM算法選擇點(diǎn)集A后,對(duì)點(diǎn)集VA處的數(shù)據(jù)進(jìn)行推理;
② 在點(diǎn)集V中均勻隨機(jī)選點(diǎn)選擇點(diǎn)集A后,對(duì)點(diǎn)集V/A處的數(shù)據(jù)進(jìn)行推理;
③ GMIM算法選點(diǎn)后,對(duì)整個(gè)區(qū)域進(jìn)行推理;
④ VI算法選點(diǎn)后,對(duì)整個(gè)區(qū)域進(jìn)行推理;
⑤ 在整個(gè)區(qū)域內(nèi)均勻隨機(jī)選點(diǎn)后,對(duì)整個(gè)區(qū)域進(jìn)行推理。
4.2.2 選點(diǎn)結(jié)果和性能對(duì)比
圖 16為真實(shí)陰影效應(yīng),可用于與不同算法的頻譜推理結(jié)果進(jìn)行對(duì)比。圖 17~圖 21為上述5種場(chǎng)景下的選點(diǎn)和空間頻譜推理結(jié)果。通過(guò)與區(qū)域內(nèi)真實(shí)的陰影效應(yīng)分量進(jìn)行對(duì)比,發(fā)現(xiàn):① 幾種選點(diǎn)方案的預(yù)測(cè)均值與真實(shí)值相比都損失了部分細(xì)節(jié)成分,但都能大體恢復(fù)出區(qū)域內(nèi)的陰影效應(yīng)分量的真實(shí)值;② 當(dāng)需推理點(diǎn)附近有監(jiān)測(cè)數(shù)據(jù)時(shí),則該位置的預(yù)測(cè)方差較小;反之,當(dāng)距離最近的監(jiān)測(cè)點(diǎn)較遠(yuǎn)時(shí),預(yù)測(cè)方差較大;③ VI選點(diǎn)算法得到預(yù)測(cè)均值最接近真實(shí)值,且區(qū)域內(nèi)方差整體較小。
圖16 真實(shí)陰影效應(yīng)
(a)GMIM選點(diǎn)及預(yù)測(cè)均值
(a)均勻隨機(jī)選點(diǎn)及預(yù)測(cè)均值
(a)GMIM選點(diǎn)及預(yù)測(cè)均值
(a)VI選點(diǎn)及預(yù)測(cè)均值
(a)均勻隨機(jī)選點(diǎn)及預(yù)測(cè)均值
為了對(duì)比不同場(chǎng)景下的算法性能,在使用RMSE和CRPS兩種評(píng)價(jià)指標(biāo)對(duì)上述5種場(chǎng)景的空間頻譜推理性能進(jìn)行了量化對(duì)比分析,如圖22所示。仿真結(jié)果表明,在有限個(gè)可數(shù)點(diǎn)集范圍內(nèi)進(jìn)行選點(diǎn),GMIM空間選點(diǎn)算法與均勻隨機(jī)選點(diǎn)相比,REM構(gòu)建的RMSE可以降低1.23 dB,CRPS值降低0.64;對(duì)整個(gè)空間任意位置進(jìn)行選點(diǎn)時(shí),VI空間選點(diǎn)算法與均勻隨機(jī)選點(diǎn)相比,REM構(gòu)建的RMSE可以降低1.56 dB,CRPS值降低0.73。GMIM是針對(duì)有限個(gè)點(diǎn)的點(diǎn)集設(shè)計(jì)的優(yōu)化方案,當(dāng)待預(yù)測(cè)點(diǎn)不在GMIM算法研究的點(diǎn)集V內(nèi)時(shí),其性能不能得到明顯提升,而VI選點(diǎn)方案對(duì)整個(gè)區(qū)域進(jìn)行頻譜推理時(shí)性能提升明顯。
圖22 不同選點(diǎn)算法的REM構(gòu)建性能
綜上,GMIM選點(diǎn)算法適用于可選點(diǎn)集和待預(yù)測(cè)點(diǎn)集為已知的離散點(diǎn)。在實(shí)際REM系統(tǒng)建設(shè)中,某一區(qū)域內(nèi)設(shè)置頻譜感知終端往往受到其他因素的限制(如建筑物的位置、設(shè)備網(wǎng)絡(luò)接入等),僅能在有限個(gè)待選點(diǎn)中選擇,結(jié)合系統(tǒng)需關(guān)注的待預(yù)測(cè)點(diǎn),可以采用GMIM算法進(jìn)行感知設(shè)備的選點(diǎn)規(guī)劃。而VI選點(diǎn)算法能夠大幅度提升整個(gè)區(qū)域內(nèi)頻譜推理的平均性能,但在實(shí)際系統(tǒng)建設(shè)實(shí)踐中,VI算法得到選點(diǎn)位置可能會(huì)因?yàn)槠渌蛩囟鵁o(wú)法設(shè)置感知節(jié)點(diǎn)。
本文提出了一種考慮環(huán)境異質(zhì)性的TKL算法來(lái)處理空間頻譜推理問(wèn)題。主要思想是構(gòu)造由參數(shù)表征的非線性單射變換來(lái)表示空間各向異性和非平穩(wěn)性,結(jié)合GP建立TKGPR模型,利用梯度下降算法學(xué)習(xí)非線性映射和GP的參數(shù),然后將訓(xùn)練好的模型用于空間頻譜推理。受DKL啟發(fā)的 TKL算法具有以下優(yōu)點(diǎn):首先,不同于DKL中DNN的非線性變換,構(gòu)造的單射變換可以保持空間的拓?fù)浣Y(jié)構(gòu)。其次,在訓(xùn)練過(guò)程中不容易過(guò)擬合。結(jié)果表明,當(dāng)群智感知設(shè)備的數(shù)量較多,局部空間內(nèi)分布的采樣數(shù)據(jù)密度較高時(shí),空間頻譜推理的性能得到顯著提高。
在利用本文所提模型表征環(huán)境異構(gòu)性的基礎(chǔ)上,同樣基于GP,提出了2種感知設(shè)備選點(diǎn)算法:基于貪婪算法的互信息最大化選點(diǎn)算法和基于變分推斷的頻譜感知設(shè)備空間選點(diǎn)算法。仿真表明,采用這2種選點(diǎn)算法與均勻隨機(jī)設(shè)置監(jiān)測(cè)點(diǎn)相比得到的空間頻譜推理性能有所提高,其中VI算法推理的誤差最小。2種算法都基于合理的數(shù)學(xué)分析和理論推導(dǎo),有各自不同的應(yīng)用場(chǎng)景,為REM構(gòu)建中頻譜監(jiān)測(cè)設(shè)備空間選點(diǎn)問(wèn)題提供了新的研究思路。
本文研究表明,GP方法適用于解決REM構(gòu)建中的空間頻譜推理問(wèn)題。當(dāng)前,將GP與深度學(xué)習(xí)算法相結(jié)合成為新的研究熱點(diǎn),將二者結(jié)合用于REM構(gòu)建值得進(jìn)一步深入研究。此外,本文重點(diǎn)圍繞空間維度頻譜數(shù)據(jù)進(jìn)行分析,空時(shí)維度聯(lián)合的頻譜數(shù)據(jù)已經(jīng)受到廣泛關(guān)注,如何聯(lián)合多維度的信息進(jìn)行聯(lián)合推理將成為本領(lǐng)域相關(guān)課題研究的重點(diǎn)。