劉琳嵐,肖庭忠,舒 堅(jiān),牛明曉
(1.南昌航空大學(xué) 信息工程學(xué)院,江西 南昌 330063;2.南昌航空大學(xué) 軟件學(xué)院,江西 南昌 330063)
無(wú)線傳感器網(wǎng)絡(luò)(wireless sensor network,WSN)是一種由大量具有感知能力和通信能力的微型節(jié)點(diǎn)部署在感知區(qū)域形成的網(wǎng)絡(luò)[1],在環(huán)境監(jiān)測(cè)[2]、智能交通[3]、智能家具[4]等領(lǐng)域廣泛應(yīng)用。通過(guò)預(yù)測(cè)鏈路質(zhì)量,選擇高質(zhì)量鏈路進(jìn)行數(shù)據(jù)傳輸,可以減少數(shù)據(jù)丟失和數(shù)據(jù)重傳次數(shù),提高網(wǎng)絡(luò)的吞吐量[5–6],因此,鏈路質(zhì)量預(yù)測(cè)具有重要意義。
鏈路質(zhì)量預(yù)測(cè)的方法主要包括:基于鏈路特性的方法、基于概率估計(jì)的方法和基于機(jī)器學(xué)習(xí)的方法[7]?;阪溌诽匦缘姆椒ㄖ饕捎媒邮招盘?hào)強(qiáng)度指標(biāo)(received signal strength indication,RSSI)、鏈路質(zhì)量指標(biāo)(link quality indicator,LQI)或信噪比(signal noise ratio,SNR)等物理層參數(shù)預(yù)測(cè)鏈路質(zhì)量,這些參數(shù)可以直接獲取,不需額外的計(jì)算,能耗低,但這些參數(shù)均依賴于節(jié)點(diǎn),而硬件本身存在校準(zhǔn)誤差,且忽略了分組丟失,易產(chǎn)生高估鏈路質(zhì)量的問(wèn)題?;诟怕使烙?jì)的方法通過(guò)發(fā)送大量探測(cè)包,接收端計(jì)算包接收率(packet reception rate,PRR)等信息來(lái)預(yù)測(cè)鏈路質(zhì)量[8],但是該方法需要發(fā)送大量探測(cè)包,不僅增加了額外的通信開銷,且對(duì)鏈路狀況的反應(yīng)不夠靈敏。
基于機(jī)器學(xué)習(xí)的鏈路質(zhì)量預(yù)測(cè)方法主要通過(guò)將鏈路質(zhì)量預(yù)測(cè)問(wèn)題轉(zhuǎn)化為時(shí)序預(yù)測(cè)問(wèn)題,利用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的方法挖掘訓(xùn)練樣本的特征,深入學(xué)習(xí)模型輸入與輸出之間的潛在關(guān)系,利用得到的模型對(duì)下一時(shí)刻的鏈路質(zhì)量進(jìn)行預(yù)測(cè)。Liu等[9]提出4C (Foresee),將LQI和PRR輸入邏輯回歸模型,預(yù)測(cè)下一時(shí)刻的PRR,然而該方法的預(yù)測(cè)準(zhǔn)確率并不高;Liu等[10]提出一種預(yù)測(cè)大波動(dòng)鏈路質(zhì)量的方法,命名為WNN_LQP(wavelet neural network based link quality prediction),該方法利用過(guò)渡區(qū)鏈路質(zhì)量指標(biāo)的高分辨率以及小波神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力預(yù)測(cè)下一時(shí)刻的鏈路質(zhì)量,然而對(duì)于相對(duì)較小的波動(dòng),該模型無(wú)法進(jìn)行準(zhǔn)確預(yù)測(cè);Xue等[11]提出一種基于隨機(jī)向量函數(shù)鏈的鏈路質(zhì)量預(yù)測(cè)方法(link quality prediction based on random vector functional link,RVFL_LQP),選擇SNR為鏈路質(zhì)量參數(shù),利用隨機(jī)向量函數(shù)鏈建立時(shí)變序列和隨機(jī)序列方差,對(duì)SNR的概率保證區(qū)間邊界進(jìn)行預(yù)測(cè),但在真實(shí)應(yīng)用中該結(jié)果無(wú)法快速反映鏈路是否可用;Xu等[12]提出一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的鏈路質(zhì)量預(yù)測(cè)方法(recurrent neural network based link quality prediction,RNN_LQP),降低了預(yù)測(cè)誤差,但RNN內(nèi)部結(jié)構(gòu)復(fù)雜、訓(xùn)練周期長(zhǎng),且易出現(xiàn)梯度消失、梯度爆炸等問(wèn)題[13],導(dǎo)致RNN_LQP模型復(fù)雜度高,模型效果不穩(wěn)定。采用機(jī)器學(xué)習(xí)的方法能夠有效地挖掘出訓(xùn)練樣本的特征,相比基于鏈路特性的方法和基于概率估計(jì)的方法,具有更高的準(zhǔn)確性和穩(wěn)定性,是目前WSN鏈路質(zhì)量預(yù)測(cè)的主流方法,因此本文使用機(jī)器學(xué)習(xí)的方法進(jìn)行鏈路質(zhì)量預(yù)測(cè)研究。
GRU作為RNN的一種變體,在時(shí)序問(wèn)題建模方面比其他機(jī)器學(xué)習(xí)方法更有優(yōu)勢(shì)[14],且已被證明在時(shí)序預(yù)測(cè)問(wèn)題上具有更好的預(yù)測(cè)效果[15]?,F(xiàn)有研究中,Abdel–Nasser等[16]將GRU應(yīng)用于無(wú)線社交網(wǎng)絡(luò)中的鏈路質(zhì)量預(yù)測(cè)中,并取得不錯(cuò)的效果。
因此,本文提出一種基于門控循環(huán)單元(gate recurrent unit,GRU)的鏈路質(zhì)量預(yù)測(cè)方法,具體可分為3個(gè)步驟:首先,采用Gap Statistic算法優(yōu)化的K-means++聚類算法,自適應(yīng)地劃分鏈路質(zhì)量等級(jí),避免由于人為選定臨界點(diǎn)帶來(lái)的誤差干擾,獲得更加貼近真實(shí)的鏈路質(zhì)量樣本標(biāo)簽。其次,采用CatBoost構(gòu)建鏈路質(zhì)量評(píng)估模型,對(duì)當(dāng)前時(shí)刻的鏈路質(zhì)量進(jìn)行評(píng)估。最后,采用GRU構(gòu)建鏈路質(zhì)量預(yù)測(cè)模型,將評(píng)估模型的結(jié)果作為輸入,借助GRU在時(shí)序問(wèn)題上的優(yōu)勢(shì)提取鏈路質(zhì)量等級(jí)的時(shí)序信息,采用支持向量回歸機(jī)(support vector regression,SVR)預(yù)測(cè)得到下一時(shí)刻鏈路質(zhì)量等級(jí),提高鏈路質(zhì)量預(yù)測(cè)的準(zhǔn)確率。
本文采用Gap Statistic算法[17]優(yōu)化的K-means++算法[18]對(duì)PRR進(jìn)行聚類,劃分鏈路質(zhì)量等級(jí),獲得鏈路質(zhì)量樣本標(biāo)簽。
Gap Statistic算法以樣本集的統(tǒng)計(jì)規(guī)律為基礎(chǔ),通過(guò)間隙統(tǒng)計(jì)量刻畫樣本觀察值和參考分布下期望值之間的差異,得到最佳聚類數(shù)。本文采用Gap Statistic算法確定聚類數(shù)目,具體過(guò)程描述如下:
1)對(duì)于任意兩個(gè)PRR樣本pm和pm′,計(jì)算它們之間的距離dmm′:
式中:m=1,2,···,N;m′=1,2,···,N;m≠m′;N為PRR樣本數(shù)。
2)假設(shè)將PRR樣本集分為K類{C1,C2,···,Ck,···,CK} ,計(jì)算第k類中樣本距離總和Dk:
式中, |Ck|為 第k類樣本數(shù)目。
計(jì)算所有類的樣本距離的平均和WK:
3)對(duì)WK取對(duì)數(shù),并與使用蒙特卡洛模擬對(duì)數(shù)的期望進(jìn)行比較,如式(4)所示:
式中,E?(lb(WK)) 為 使用蒙特卡洛模擬得到的lb(WK)的期望。
4)取使式(5)成立的最小值K為PRR樣本集的最佳聚類數(shù)目。
式中,sK+1為修正后的標(biāo)準(zhǔn)差,其表達(dá)式為:
K-means算法實(shí)現(xiàn)簡(jiǎn)單,聚類效果好,非常容易部署實(shí)施,在機(jī)器視覺(jué)、地質(zhì)統(tǒng)計(jì)學(xué)等領(lǐng)域得到成功的應(yīng)用[19]。K-means算法需要提前給出聚類數(shù)目K,但在不同的數(shù)據(jù)集中K的取值很難確定[20],由于隨機(jī)選擇K個(gè)樣本點(diǎn)作為聚類中心,不同的初始聚類中心可能導(dǎo)致不同的聚類結(jié)果[21]。與K-means算法不同,K-means++算法在選取聚類中心時(shí),盡量使聚類中心互相離得遠(yuǎn),可減小聚類結(jié)果的波動(dòng)。
本文采用Gap Statistic算法確定聚類數(shù)目K,再采用K-means++算法劃分鏈路質(zhì)量等級(jí),具體過(guò)程如下:
1) 采用Gap Statistic算法確定K。
2) 從PRR樣本集中隨機(jī)選擇一個(gè)樣本點(diǎn)作為第一個(gè)初始化聚類中心。
3) 計(jì)算PRR樣本與它最近聚類中心的歐式距離D(pm):
式中,p為 距離pm最近的聚類中心。
4) 計(jì)算樣本被選為下一個(gè)聚類中心的概率Q(pm),如式(8)所示,并使用輪盤法選出下一個(gè)聚類中心。
5) 重復(fù)步驟3)和4),直到選出K個(gè)聚類中心。
6) 將每個(gè)樣本點(diǎn)歸類到離它最近聚類中心所屬的類。
7) 重新計(jì)算每個(gè)聚類內(nèi)PRR的均值,將其定為新的聚類中心。
8) 重復(fù)步驟6)和7),直至聚類中心不再變化。
9) 得到每個(gè)樣本xi的 鏈路質(zhì)量等級(jí)yi。
以鏈路質(zhì)量參數(shù)作為輸入,第1節(jié)得到的鏈路質(zhì)量等級(jí)作為輸出,采用CatBoost構(gòu)建鏈路質(zhì)量評(píng)估模型,主要包括評(píng)估樣本的構(gòu)建、樣本預(yù)處理及評(píng)估模型的構(gòu)建。
本文選取RSSI均值、LQI均值和SNR均值為鏈路質(zhì)量參數(shù),采用鏈路質(zhì)量等級(jí)評(píng)價(jià)鏈路質(zhì)量。鏈路質(zhì)量樣本集為:
式中:xi=(),其中,為樣本xi的RSSI均值,為樣本xi的LQI均值,為樣本xi的SNR均值;yi為樣本xi的鏈路質(zhì)量等級(jí);N為樣本數(shù)。
由于傳感器節(jié)點(diǎn)在收發(fā)信息時(shí)會(huì)受到多徑效應(yīng)、信道、溫濕度或障礙物等的干擾,收集到的數(shù)據(jù)存在缺失值,本文計(jì)算缺失值樣本在一個(gè)發(fā)送周期內(nèi)的均值,采用均值填充法對(duì)樣本進(jìn)行預(yù)處理。
CatBoost 是由Yandex的研究人員和工程師開發(fā)的基于梯度提升決策樹(gradient boosting decision tree,GBDT)的機(jī)器學(xué)習(xí)模型[22],采用排序提升算法替換GBDT中的梯度估計(jì)方法[23],能夠減少GBDT算法中因梯度偏差和預(yù)測(cè)偏移而導(dǎo)致的過(guò)擬合問(wèn)題,有著更好的泛化能力[24]。
本文提出基于CatBoost的鏈路質(zhì)量評(píng)估模型(link quality estimation based on CatBoost,CatBoost_LQE),其中,排序提升算法描述如下:
1)對(duì)訓(xùn)練集中 τ個(gè)樣本對(duì)進(jìn)行隨機(jī)排列,將序列標(biāo)記為 ψ。
2)對(duì)于每一個(gè)樣本對(duì) (xi,yi),初始化該樣本對(duì)的模型Mi。
3)對(duì)于每一輪迭代:
①計(jì)算樣本xi的無(wú)偏度梯度估計(jì):
②對(duì)于每一個(gè)樣本對(duì) (xi,yi),使用該樣本對(duì)在序列 ψ之前的訓(xùn)練集 (xj,gj):ψ(j)≤i訓(xùn)練下一個(gè)分類回歸樹 ?M,將其更新到模型中,如式(11)所示:
4)迭代完成,輸出Mτ即為最終模型。
設(shè)第e?1 輪迭代得到的學(xué)習(xí)器為Fe?1(·),計(jì)算Fe?1(·) 的梯度ge?1(xi,yi):
式中,E(yi,Fe?1(xi))為Fe?1(·)的損失。
將第e?1輪的負(fù)梯度作為殘差,傳遞到第e輪,找到一個(gè)新的弱學(xué)習(xí)器he(·), 使損失值最小,he(·)表達(dá)式如下:
得到最終的強(qiáng)學(xué)習(xí)器Fe(·):
根據(jù)鏈路質(zhì)量在短期內(nèi)表現(xiàn)出強(qiáng)時(shí)間相關(guān)性的特點(diǎn),本文采用CatBoost_LQE得到的鏈路質(zhì)量等級(jí)時(shí)間序列作為輸入,采用滑動(dòng)窗口法確定輸入序列的長(zhǎng)度,進(jìn)而構(gòu)建基于GRU的鏈路質(zhì)量預(yù)測(cè)模型。
采用CatBoost_LQE對(duì)歷史鏈路質(zhì)量樣本進(jìn)行評(píng)估,得到鏈路質(zhì)量等級(jí)值序列 {l1,l2,···,li,···,ln},其中,li為第i個(gè)時(shí)刻鏈路質(zhì)量等級(jí)值,n為樣本數(shù)。使用大小為w的時(shí)間窗口構(gòu)建時(shí)序樣本集:
式中:鏈路質(zhì)量等級(jí)時(shí)間序列Ii={li,li+1,···,li+w?1};?i=li+w,?i作為標(biāo)簽值。
展會(huì)注重與行業(yè)協(xié)會(huì)緊密合作,浙江省環(huán)保機(jī)械行業(yè)協(xié)會(huì)、宜興市環(huán)保產(chǎn)業(yè)協(xié)會(huì)等多家與主辦方長(zhǎng)期合作的行業(yè)協(xié)會(huì)將為展會(huì)帶來(lái)更多優(yōu)質(zhì)的污水處理設(shè)備廠商新面孔。浙江省大型環(huán)境工程公司、浙江海拓環(huán)境技術(shù)有限公司、浙江四通環(huán)境工程有限公司、浙江弘潤(rùn)機(jī)械制造有限公司、浙江愛迪曼水科技有限公司等早已確定集體出展,向?qū)I(yè)觀眾展示最新處理技術(shù)和解決方案。
滑動(dòng)時(shí)間窗口的大小影響模型的預(yù)測(cè)結(jié)果。如果時(shí)間序列過(guò)短,就會(huì)導(dǎo)致歷史信息學(xué)習(xí)的缺失;反之,如果時(shí)間序列太長(zhǎng),則會(huì)增加模型的復(fù)雜度,甚至使預(yù)測(cè)效果變差。本文通過(guò)實(shí)驗(yàn)確定時(shí)間窗口大小。
本文利用GRU能夠很好地處理和預(yù)測(cè)序列數(shù)據(jù)的優(yōu)點(diǎn),構(gòu)建鏈路質(zhì)量預(yù)測(cè)模型GRU_LQP(link quality prediction based on gate recurrent unit),如圖1所示。
圖1 GRU_LQP的結(jié)構(gòu)Fig.1 Structure of GRU_LQP
由圖1可知:GRU_LQP包括輸入層、GRU模塊層、全連接層和輸出層。輸入鏈路質(zhì)量等級(jí)時(shí)間序列{li,li+1,···,li+w?1},通過(guò)GRU模塊中的GRU單元學(xué)習(xí)輸入序列之間的時(shí)序關(guān)系,通過(guò)全連接層集成鏈路質(zhì)量等級(jí)時(shí)序特征。為了增強(qiáng)鏈路質(zhì)量預(yù)測(cè)模型的泛化性,在全連接層中加入Dropout操作,設(shè)置其縮放權(quán)重為0.5[25]。選用Softmax函數(shù)映射得到下一時(shí)刻各等級(jí)的概率,實(shí)現(xiàn)鏈路質(zhì)量預(yù)測(cè)。
GRU模塊使用多個(gè)GRU單元的堆疊實(shí)現(xiàn)對(duì)輸入鏈路質(zhì)量等級(jí)時(shí)間序列的學(xué)習(xí),GRU單元的結(jié)構(gòu)如圖2所示。圖2中,ht?1為 前個(gè)GRU的隱藏層輸出,lt為本輪GRU輸入的鏈路質(zhì)量等級(jí), σ為Sigmoid函數(shù),zt和rt分別為GRU的更新門和重置門,為經(jīng)過(guò)更新的中間狀態(tài),ht為本輪GRU的隱藏層輸出。
圖2 GRU的結(jié)構(gòu)Fig.2 Structure of GRU
GRU主要通過(guò)兩個(gè)門控對(duì)鏈路質(zhì)量等級(jí)信息進(jìn)行更新,更新門zt用于控制前一個(gè)狀態(tài)中鏈路質(zhì)量等級(jí)信息被代入到當(dāng)前狀態(tài)的程度,更新門的值越接近1,說(shuō)明代入了更多前一個(gè)狀態(tài)的鏈路質(zhì)量等級(jí)信息。重置門rt控制前一狀態(tài)有多少鏈路質(zhì)量等級(jí)信息被寫入到當(dāng)前的候選集上,重置門越小,前一狀態(tài)的鏈路質(zhì)量等級(jí)信息被寫入得越少。通過(guò)Sigmoid 函數(shù)將數(shù)據(jù)變換到0~1之間,并結(jié)合乘法操作可以實(shí)現(xiàn)對(duì)輸入鏈路質(zhì)量等級(jí)信息及歷史鏈路質(zhì)量等級(jí)信息的選擇性重置。
GRU的計(jì)算過(guò)程如式(16)~(19)所示:
式(16)~(19)中,wr為重置門的權(quán)重,wz為更新門的權(quán)重,whˉ為中間狀態(tài)的權(quán)重。
本文使用隨機(jī)梯度下降法優(yōu)化權(quán)重參數(shù)wr、wz、whˉ,學(xué)習(xí)率取經(jīng)驗(yàn)值0.01。
為了進(jìn)一步提高鏈路質(zhì)量預(yù)測(cè)的準(zhǔn)確率,本文采用SVR作為鏈路質(zhì)量等級(jí)預(yù)測(cè)器,優(yōu)化GRU_LQP,構(gòu)建了GRU_SVR(link quality prediction based on gate recurrent unit and support vector regression)鏈路質(zhì)量預(yù)測(cè)模型,如圖3所示。
圖3 GRU_SVR的結(jié)構(gòu)Fig.3 Structure of GRU_SVR
GRU_SVR的參數(shù)設(shè)置如表1所示。
表1 GRU_SVR參數(shù)Tab.1 Parameters of GRU_SVR
本文采用均方誤差(mean square error,MSE)評(píng)價(jià)預(yù)測(cè)結(jié)果,MSE的計(jì)算式為:
式中, ?i為樣本中輸入鏈路質(zhì)量等級(jí)時(shí)間序列的標(biāo)簽,為預(yù)測(cè)值。MSE值越小則表明預(yù)測(cè)模型預(yù)測(cè)誤差越小,性能越好。
在3個(gè)真實(shí)場(chǎng)景中進(jìn)行實(shí)驗(yàn),通過(guò)與同類模型對(duì)比驗(yàn)證本文模型的有效性。
分別在實(shí)驗(yàn)室、走廊及停車場(chǎng)布置傳感器節(jié)點(diǎn),如圖4所示。實(shí)驗(yàn)室場(chǎng)景中,無(wú)線設(shè)備及人員的走動(dòng)等對(duì)鏈路質(zhì)量造成影響;走廊場(chǎng)景中,節(jié)點(diǎn)產(chǎn)生的串?dāng)_及人員的走動(dòng)等對(duì)鏈路質(zhì)量造成影響;停車場(chǎng)場(chǎng)景中,車輛出入及車載設(shè)備等對(duì)鏈路質(zhì)量造成影響。
圖4 實(shí)驗(yàn)場(chǎng)景Fig.4 Experimental scenarios
實(shí)驗(yàn)在南昌航空大學(xué)物聯(lián)網(wǎng)實(shí)驗(yàn)室開發(fā)的WSN鏈路質(zhì)量測(cè)試平臺(tái)(wireless sensor networks link quality testbed,WSN–LQT)[25]上進(jìn)行,連續(xù)3天收集RSSI、LQI、SNR、PRR等鏈路質(zhì)量數(shù)據(jù),將預(yù)處理后的鏈路質(zhì)量樣本集以7∶3的比例劃分為評(píng)估模型的訓(xùn)練集和測(cè)試集,根據(jù)評(píng)估結(jié)果構(gòu)建鏈路質(zhì)量等級(jí)時(shí)序樣本集,并以7∶3的比例劃分為預(yù)測(cè)模型的訓(xùn)練集和測(cè)試集。WSN–LQT中參數(shù)設(shè)置如表2所示。
表2 WSN–LQT參數(shù)Tab.2 Parameters of WSN–LQT
1)聚類數(shù)目
采用Gap Statistic算法確定聚類數(shù)目K,采用Kmeans++聚類算法對(duì)PRR聚類,得到鏈路質(zhì)量等級(jí)。設(shè)Γ=Gap(K)?Gap(K+1)+sK+1,3個(gè)實(shí)驗(yàn)場(chǎng)景中不同K值對(duì)應(yīng)的Γ 值如圖5所示。
圖5 不同K值對(duì)應(yīng)的 Γ值Fig.5 Values of Γ corresponding to different K values
由圖5可知,3個(gè)實(shí)驗(yàn)場(chǎng)景中,使式(5)成立的K值均為3。因此,將實(shí)驗(yàn)室、走廊及停車場(chǎng)3個(gè)實(shí)驗(yàn)場(chǎng)景的PRR均劃分為3個(gè)鏈路質(zhì)量等級(jí),其中,第1等級(jí)的鏈路為鏈路質(zhì)量差的鏈路,第2等級(jí)的鏈路為鏈路質(zhì)量中等的鏈路,第3等級(jí)的鏈路為鏈路質(zhì)量好的鏈路。
2)評(píng)估模型的參數(shù)
CatBoost_LQE評(píng)估模型的參數(shù)主要有:學(xué)習(xí)率lr、L2正則參數(shù)l2_leaf_reg、樹的深度depth、決策樹最大的數(shù)量iterations。為了提高CatBoost_LQE的評(píng)估準(zhǔn)確率,本文采用網(wǎng)格搜索法對(duì)上述參數(shù)尋優(yōu),結(jié)果如表3所示。
表3 CatBoost_LQE的參數(shù)值Tab.3 Parameter values of CatBoost_LQE
3)滑動(dòng)時(shí)間窗口的大小
本文通過(guò)對(duì)比不同時(shí)間窗口下GRU_SVR的MSE,選擇合適的時(shí)間窗口大小。3個(gè)場(chǎng)景中,不同的時(shí)間窗口下GRU_SVR的MSE結(jié)果如圖6所示。
圖6 GRU_SVR的MSE Fig.6 MSE of GRU_SVR
由圖6可知,滑動(dòng)時(shí)間窗口大小影響預(yù)測(cè)模型的準(zhǔn)確率。在實(shí)驗(yàn)室場(chǎng)景中,滑動(dòng)時(shí)間窗口大小為10時(shí),MSE值最小。在停車場(chǎng)和走廊場(chǎng)景中,滑動(dòng)時(shí)間窗口大小為9時(shí),MSE值最小。因此,實(shí)驗(yàn)室、走廊及停車場(chǎng)場(chǎng)景中,滑動(dòng)時(shí)間窗口的大小分別設(shè)置為10、9、9。
為驗(yàn)證GRU_SVR預(yù)測(cè)模型的有效性,與GRU_LQP、4C[9]、WNN_LQP[10]、RFVL_LQP[11]及RNN_LQP[12]預(yù)測(cè)模型進(jìn)行對(duì)比,結(jié)果如圖7所示。
圖7 不同預(yù)測(cè)模型的MSE值Fig.7 MSE values of different prediction models
由圖7可知:實(shí)驗(yàn)室場(chǎng)景中,干擾較多,鏈路質(zhì)量整體較差,GRU_SVR的均方誤差最小。走廊實(shí)驗(yàn)場(chǎng)景中,鏈路的干擾較少,鏈路質(zhì)量整體較好,GRU_SVR的均方誤差也是最小的??梢姡cGRU_LQP、4C、WNN_LQP、RFVL_LQP及RNN_LQP預(yù)測(cè)模型相比,本文提出的GRU_SVR預(yù)測(cè)模型無(wú)論是在鏈路質(zhì)量較差還是較好的環(huán)境中,均有更好的預(yù)測(cè)準(zhǔn)確率。
本文提出一種基于GRU的鏈路質(zhì)量預(yù)測(cè)方法。首先,采用基于Gap Statistic算法優(yōu)化的K-means++算法劃分鏈路質(zhì)量等級(jí),獲得樣本標(biāo)簽;然后,選擇RSSI、LQI、SNR作為輸入,基于CatBoost構(gòu)建鏈路質(zhì)量評(píng)估模型,評(píng)估當(dāng)前時(shí)刻的鏈路質(zhì)量,在不同場(chǎng)景中使用網(wǎng)格搜索法優(yōu)化評(píng)估模型的參數(shù);最后,采用GRU學(xué)習(xí)鏈路質(zhì)量等級(jí)序列的時(shí)序信息,采用SVR預(yù)測(cè)下一時(shí)刻的鏈路質(zhì)量等級(jí)。在真實(shí)世界中,部署節(jié)點(diǎn)并收集數(shù)據(jù)進(jìn)行實(shí)驗(yàn),結(jié)果表明相比于其他模型,本文所提模型具有更低的預(yù)測(cè)誤差。下一步將致力于解決鏈路質(zhì)量數(shù)據(jù)不平衡給鏈路質(zhì)量預(yù)測(cè)帶來(lái)的影響,進(jìn)一步提高鏈路質(zhì)量預(yù)測(cè)的準(zhǔn)確率。