楊 波
(四川文理學院,四川 達州 635000)
隨著無線通信技術在各個行業(yè)的應用日趨成熟,并且通信技術對頻譜帶寬的需求也變得越來越高,這均使有限的頻譜資源變得越來越少[1-2]。因此,必須在有效利用無線通信技術的同時,提高寶貴頻譜資源的利用率。認知無線電是解決目前頻譜資源匱乏的有效措施之一,而認知通信網(wǎng)絡的核心是快速、準確地對網(wǎng)絡中主用戶信號頻譜進行檢測,為此,其主用戶信號的頻譜檢測成為了熱點研究問題[3-4]。
針對無線認知網(wǎng)絡中的主用戶頻譜檢測問題,研究人員提出了多種檢測方法。早期頻譜檢測算法主要是在能量域提取信號特征,并將其與預先設定的門限進行比較,當特征值超過門限即判定為主用戶正在使用該頻段[5]。但能量檢測算法對噪聲的適應性不強,難以適應當前低信噪比的無線認知網(wǎng)絡環(huán)境。隨著人工智能的發(fā)展,基于機器學習的認知網(wǎng)絡頻譜檢測成為主要研究方向[6-8]。文獻[9]直接將機器學習應用于頻譜檢測領域,取得了比傳統(tǒng)能量檢測算法好的檢測性能。文獻[10]基于壓縮感知和線性回歸模型預測無線網(wǎng)絡信號的稀疏參數(shù),然后對接收信號進行稀疏恢復,實現(xiàn)主用戶信號的頻譜檢測。文獻[11]提出了一種基于蜂窩認知定位的頻譜檢測算法,該算法利用歷史數(shù)據(jù)作為訓練數(shù)據(jù),基于支持向量機預測主用戶頻段預測。文獻[12]基于蜂群算法對神經(jīng)網(wǎng)絡進行優(yōu)化,有效解決了傳統(tǒng)神經(jīng)網(wǎng)絡易陷入局部最優(yōu)的問題,并同時在能量域和循環(huán)譜域提取參數(shù),實現(xiàn)頻譜檢測。
在已有研究基礎上,通過分析現(xiàn)在算法的優(yōu)勢和存在的不足,提出了一種基于循環(huán)譜和隨機森林的無線認知網(wǎng)絡主用戶頻譜檢測方法。該方法利用循環(huán)譜提取無線網(wǎng)絡信號的特征參數(shù),構成特征向量,然后采用隨機森林作為分類器實現(xiàn)主用戶信號頻譜檢測,仿真實驗結果驗證了該頻譜檢測算法良好的檢測性能和有效性。
通常情況下,無線認知網(wǎng)絡均是假設網(wǎng)絡環(huán)境中存在1 個主用戶和G 個次用戶,并且各個用戶之間的信號不存在相互干擾。針對主用戶頻譜檢測的特點,可以將主用戶頻譜檢測的問題轉化為一個二元假設檢驗模型,具體模型可以表示為:
式中:H0—認知網(wǎng)絡環(huán)境中不存在主用戶信號;H1—認知網(wǎng)絡環(huán)境中存在主用戶信號;sg(t)—均值為零的循環(huán)平穩(wěn)信號,即主用戶信號;n(t)—無線認知網(wǎng)絡中的零均值加性高斯白噪聲,方差為n,采樣時間為T(0≤t≤T)。
以上述特征向量作為隨機森林分類器的輸入,構建用于實現(xiàn)無線認知網(wǎng)絡的自適應頻譜檢測模型。隨機森林是由決策樹集合構成的,隨機森林中的任意一顆決策樹可以表示為:
式中:gk(yi)—隨機森林中決策樹的傳遞函數(shù)(決策函數(shù));K—隨機森林中的決策樹個數(shù)。隨機森林就是綜合各顆決策樹給出的決策結果,得出最終的無線認知網(wǎng)絡頻譜檢測結果。
假設信號s(t)為均值為零的循環(huán)平穩(wěn)信號,其循環(huán)周期為T0,則按照循環(huán)譜理論,信號的循環(huán)自相關函數(shù)可以表示為:
式中:α—循環(huán)頻率;R(t,τ)—信號s(t)的自相關函數(shù),則信號s(t)的循環(huán)譜可以表示為:
在實際無線認知網(wǎng)絡頻譜檢測的過程中,信號均為有限長信號。因此,信號s(t)的循環(huán)譜可以表示為如下估計形式:
式中:Y(tn,f)—各分段信號的離散傅里葉變換(DFT)。上述循環(huán)譜估計過程中,將信號劃分為采樣點數(shù)相等的N 段,每段采樣點數(shù)為T。
決策樹是一種十分典型的若分類器,隨機森林的基本思想就是將多個決策樹組合形成一個強分類器,本質上是一種融合分類方法。決策樹分類結果過于單一,不能很好體現(xiàn)數(shù)據(jù)多樣性。隨機森林融合多個決策樹的分類結果,能夠有效反映出數(shù)據(jù)的多樣性,顯著提升分類性能。并且,通過將多個決策樹融合還能有效消除異常特征值對分類結果的影響,具有很強的泛化能力,且不容易出現(xiàn)分類器過擬合現(xiàn)象。
隨機森林中決策樹的決策過程與常規(guī)決策樹具有十分顯著區(qū)別。隨機森林并不是像常規(guī)決策樹訓練一樣,選擇全局最優(yōu)的特征實現(xiàn)決策樹節(jié)點分裂,而是首先隨機確定樣本特征,然后基于局部特征最優(yōu)實現(xiàn)決策樹的節(jié)點分裂,因此其模型泛化能力優(yōu)于常規(guī)決策樹方法。
隨機森林分類器需要根據(jù)輸入特征構建決策樹集合。假設隨機森林中決策樹的數(shù)量為M,首先需要根據(jù)輸入特征生成M個獨立同分布的隨機向量θ1,θ2,L,θM。給定一個隨機向量θi,即可生成一顆對應的決策樹h(x,θi)。由此,可以構建出隨機森林的決策樹集合{h(x,θi)}表示構成隨機森林的決策樹集合。
決策樹集合構建完成后,隨機森林是基于屬性對樣本分類之后的基尼指數(shù)實現(xiàn)特征選擇的。在隨機森林分類過程中,經(jīng)過分類后集合X 的基尼指數(shù)定義為:
式中:pi、pj—樣本數(shù)據(jù)集中第i 類樣本和j 類樣本占總樣本的比例值。由式(8)可知,經(jīng)過隨機森林分類后,某一個類別的純度越高,該類別的基尼指數(shù)越小?;嶂笖?shù)能夠有效反應出樣本集中任意兩個成員不屬于同類別的概率。參照樣本基尼指數(shù),可以定義如下形式的特征基尼指數(shù):
式中:Xm—特征a 的第m 種取值時生成的樣本集合?;诨嶂笖?shù)作為隨機森林決策樹最優(yōu)特征劃分原則時,通過不斷選擇基尼指數(shù)小的特征作為決策樹節(jié)點分裂的依據(jù),能夠獲得集中性能好的樣本分類結果。
針對無線認知網(wǎng)絡的主用戶頻譜檢測問題,本節(jié)基于循環(huán)譜理論和隨機森林分類器設計了一個頻譜感知算法。該算法主要包括兩個過程,首先是利用循環(huán)譜實現(xiàn)無線認知網(wǎng)絡中信號特征參數(shù)的提取,然后基于隨機森林構建一個識別主用戶信號的分類器。
假設無線認知網(wǎng)絡中任意一個非主用戶的接收信號為y(t),信號的循環(huán)周期為T0,則y(t)的瞬時自相關函數(shù)估計值可以表示為:
信號y(t)的循環(huán)譜密度函數(shù)可以表示為:
采用頻域平滑法對接收信號y(t)的循環(huán)譜密度進行估計,估計過程可以表示為:
式中:k=1,2,L,K,L—頻域平滑估計循環(huán)譜密度的樣本點數(shù);Y(k)—信號y(t)的DFT。
無線認知網(wǎng)絡中,如果不存在主用戶信號,即H0假設下,接收信號循環(huán)譜的期望值為:
式中:N(k)—噪聲的DFT。H0假設下信號循環(huán)譜的方差可以表示為:
同理,可以推導得出,當無線認知網(wǎng)絡中存在主用戶時,即H1假設下,接收信號循環(huán)譜的期望和方差分別為:
分別構建正樣本和負樣本組成的訓練樣本號集Q,樣本個數(shù)為N,提取訓練樣本集Q 中的信號循環(huán)譜均值和方差,生成特征向量,特征向量維度為M,作為隨機森林的訓練特征集。具體隨機森林構建與訓練過程如下。
步驟1:Bagging。在訓練樣本集中隨機有放回地選擇n 個樣本信號,作為一個決策樹的訓練樣本。
步驟2:特征分裂選擇。在樣本集特征向量中選擇m 個特征作為決策樹節(jié)點的分類特征。基于決策樹訓練原則,選出分類效果最佳的特征作為決策樹節(jié)點的分裂特征。
步驟3:決策樹生長。為了確保每一棵決策樹的最大限度生長,基于基尼指數(shù)計算,當決策樹節(jié)點的分類純度滿足預先設置的比例要求時,決策樹停止生長。
步驟4:隨機森林生成。不斷重復步驟1 到步驟3,直到所有的決策樹均完成訓練,將這些決策樹組合生成一個分類能力強的隨機森林。
圖1 隨機森林頻譜檢測過程Fig.1 Spectrum Detection Based on Random Forest
提出的基于循環(huán)譜和隨機森林的無線認知網(wǎng)絡頻譜檢測算法訓練過程,如圖1 所示。首先,構建包含H0假設和H1假設的訓練樣本集,并采用隨機有放回抽樣選擇單次訓練樣本;然后基于循環(huán)譜提取訓練信號的特征參數(shù),生成特征向量;最后,將特征向量導入隨機森林模型,經(jīng)過訓練后得出分類模型。
為了驗證文中提出的基于循環(huán)譜和隨機森林的無線認知網(wǎng)絡頻譜檢測算法性能,本節(jié)以目前常用的BPSK 信號和OFDM 信號為例,測試算法對主用戶信號頻譜的檢測性能。信號仿真參數(shù)設置如下:信號采樣頻率為400MHz,采樣點數(shù)為8000 點,信號載波頻率(3.1~4.8)GHz 范圍內呈均勻分布,其中BPSK 信號數(shù)據(jù)率為1.2Mbit/s,信號帶寬為5MHz,OFDM 信號數(shù)據(jù)率為5Mbit/s,信號帶寬為7.5MHz。為了測試文中提出的檢測算法性能,在相同的仿真條件下,將其與文獻[12]提出的蜂群優(yōu)化神經(jīng)網(wǎng)絡檢測算法和文獻[13]提出的對數(shù)預處理支持向量機檢測算法進行對比分析,信噪比范圍為(-24)dB 到0dB,信噪比步進3dB,每個信噪比下進行500 次蒙特卡洛仿真實驗,三種頻譜檢測算法的檢測性能,如圖2、圖3 所示。
圖2 BPSK 信號頻譜檢測性能對比結果Fig.2 Spectrum Detection Performance Comparison of BPSK Signal
圖3 OFDM 信號頻譜檢測性能對比結果Fig.3 OFDM Signal Spectrum Detection Performance Comparison Results
三種頻譜檢測算法對BPSK 信號和OFDM 信號在不同信噪比下的檢測性能,如圖2、圖3 所示。仿真實驗結果表明,隨著信噪比的增加,各種頻譜檢測算法在BPSK 信號和OFDM 信號上的檢測性能均呈現(xiàn)出上升的態(tài)勢。對比三種頻譜檢測算法的仿真實驗結果可知,文中提出基于循環(huán)譜和隨機森林的頻譜檢測算法的檢測性能優(yōu)于文獻[12]算法和文獻[13]算法。例如,當信噪比為(-12)dB時,文獻[12]算法和文獻[13]算法對BPSK 信號的檢測正確率分別為69%和81%,而文中算法對BPSK 信號的檢測正確率為92%,檢測性能上分別提升了23%和11%;而對于OFDM 信號,文獻[12]算法和文獻[13]算法對OFDM 信號的檢測正確率分別為73%和76%,而文中算法對BPSK 信號的檢測正確率為86%,檢測性能上分別提升了13%和10%。
研究了無線認知網(wǎng)絡主用戶頻譜檢測問題,首先在循環(huán)譜域提取信號特征,然后利用隨機森林實現(xiàn)信號頻譜檢測。對比仿真實驗結果表明,所提方法能夠實現(xiàn)較低信噪比下的主用戶信號頻譜檢測,且檢測性能優(yōu)于常用算法。研究內容為無線網(wǎng)絡頻譜檢測提供了一種新方法,下一步的研究方向是如何將該方法擴展到多用戶無線認知網(wǎng)絡的頻譜檢測中。