馬圣雨,石 堅(jiān),宋逸杰,陳麗萍,高 巖
(1.河南理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,河南 焦作 454000;2.嘉興南湖學(xué)院 圖書館;3.嘉興學(xué)院 信息網(wǎng)絡(luò)與智能研究院,浙江 嘉興 314000;4.江西理工大學(xué) 理學(xué)院,江西 贛州 341000)
在頻譜監(jiān)測和電子對(duì)抗等領(lǐng)域中,自動(dòng)調(diào)制識(shí)別(Automatic Modulation Recognition,AMR)作為信號(hào)檢測和解調(diào)之間的關(guān)鍵步驟,無需先驗(yàn)信息即可在接收端接收并識(shí)別出未知信號(hào)調(diào)制方式[1-2]。高效精準(zhǔn)、穩(wěn)定可靠的調(diào)制識(shí)別方法對(duì)未來日益復(fù)雜的通信環(huán)境具有重大意義。
早期的調(diào)制識(shí)別技術(shù)受限于科技水平,因此以人工提取特征的方式為主[3-8],這類傳統(tǒng)方法需要較多的先驗(yàn)信息,在使用上限制較大?;谏疃葘W(xué)習(xí)(Deep Learning,DL)的AMR 方法,采用網(wǎng)絡(luò)的非線性處理單元,直接從原始信號(hào)中獲取深層次特性。O’Shea 等[9]在2016 年首次將深度學(xué)習(xí)技術(shù)運(yùn)用于調(diào)制識(shí)別,利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)有效區(qū)分出了11 種調(diào)制方式,并在分類性能上取得了優(yōu)于傳統(tǒng)方法的效果。West等[10]對(duì)不同的深度神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比分析,發(fā)現(xiàn)網(wǎng)絡(luò)深度對(duì)識(shí)別精度影響有限。Zhang 等[11]在多通道神經(jīng)網(wǎng)絡(luò)中同時(shí)饋入同相正交(In-Phase and Quadrature,IQ)信號(hào)數(shù)據(jù)和四階累積量以補(bǔ)充通過網(wǎng)絡(luò)學(xué)習(xí)到的信息特征,有效改善了CNN 和長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)的分類能力。Ramjee 等[12]針對(duì)各種經(jīng)典神經(jīng)網(wǎng)絡(luò)進(jìn)行分析,并通過子采樣技術(shù)對(duì)數(shù)據(jù)特征降維,降低訓(xùn)練復(fù)雜性。Qi 等[13]通過深度殘差網(wǎng)絡(luò)(Deep Residual Networks,ResNet)提取多模態(tài)信號(hào)中的特征,通過并聯(lián)特征融合方式補(bǔ)充數(shù)據(jù)特征,有效識(shí)別出16 種調(diào)制方式,包括高階的正交振幅調(diào)制(Quadrature Amplitude Modulation,QAM),如256QAM 和1 024QAM。Wu 等[14]和Lu 等[15]將CNN 和序列模型的輸出加以拼接,通過并聯(lián)方式融合數(shù)據(jù)特征,以提高模型泛化能力。
鑒于以上研究,當(dāng)前AMR 模型以CNN、LSTM 及它們的相關(guān)變體為主,通過優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和加工數(shù)據(jù)特征等方式改善網(wǎng)絡(luò)性能,但識(shí)別精度方面仍有待提升。
本文受文獻(xiàn)[14]和文獻(xiàn)[15]的啟發(fā),針對(duì)當(dāng)前AMR方法識(shí)別精度低的問題,提出一種基于結(jié)合策略的調(diào)制識(shí)別協(xié)同協(xié)作模型(CNN-LSTM Collaboration Model,CLCM)。該識(shí)別方法通過加權(quán)投票結(jié)合策略聯(lián)合CNN 和LSTM 共同完成調(diào)制方式分類任務(wù),實(shí)現(xiàn)高精度的調(diào)制方式辨識(shí)。結(jié)果表明,CLCM 可有效識(shí)別24 種被廣泛應(yīng)用的調(diào)制方式,平均識(shí)別精度超過95%;在高信噪比下,對(duì)128QAM 和256QAM 等高階調(diào)制方式的識(shí)別精度均高于90%,這對(duì)于高速數(shù)據(jù)傳輸應(yīng)用意義重大。
無線通信系統(tǒng)基本結(jié)構(gòu)如圖1 所示,主要由3 部分組成:發(fā)射機(jī)、信道和接收機(jī)。信號(hào)的調(diào)制處理通常部署在發(fā)射機(jī)部分,通過調(diào)制可以擴(kuò)展信號(hào)帶寬,提高信號(hào)的抗干擾能力。
調(diào)制識(shí)別的處理模塊通常部署在接收機(jī)部分。假設(shè)接收機(jī)接收到的信號(hào)為r(t),則可以定義為:
其中,s(t)表示由發(fā)射機(jī)發(fā)出的傳輸信號(hào),c(t)表示無線通信信道的脈沖響應(yīng),n(t)指加性高斯白噪聲。
本文在接收端得到的信號(hào)數(shù)據(jù)被處理為IQ 信號(hào),這是調(diào)制識(shí)別任務(wù)中被廣泛使用的輸入數(shù)據(jù)[12-13]。接收端得到符號(hào)序列表示為I+jQ,符號(hào)序列的I 分量(實(shí)部)和Q分量(虛部)分別表示為I=[i1,i2,...,iL],Q=[q1,q2,...,qL]。L表示序列長度,以此獲得IQ 信號(hào)的二維數(shù)據(jù)表達(dá)形式,表示為。
Fig.1 Wireless communication system圖1 無線通信系統(tǒng)
利用極坐標(biāo)的形式可以有效表達(dá)出相位和振幅的變化規(guī)律,這是考慮到了序列模型對(duì)相位和振幅變化的敏感性,類似的應(yīng)用可見文獻(xiàn)[15]。極坐標(biāo)表達(dá)式表示為P=(ρ,θ),其中極半徑表示為,極角表示為θ=atan(Q/I)。
為實(shí)現(xiàn)高精度的調(diào)制方式智能辨識(shí),本文設(shè)計(jì)了一種AMR 協(xié)作模型CLCM。CLCM 的具體框架結(jié)構(gòu)如圖2 所示,它包含CNN 和LSTM 兩種分類模型,通過加權(quán)投票結(jié)合策略聯(lián)合兩種模型,達(dá)到提高模型泛化能力的目的。
其中,CNN 模型結(jié)構(gòu)如圖3 所示。CNN 用于接收輸入大小為2×1 024 的IQ 信號(hào),提取信號(hào)的空間特征。IQ 信號(hào)依次經(jīng)過5 個(gè)由卷積層和池化層構(gòu)成的單元結(jié)構(gòu)處理后,得到的特征通過兩個(gè)全連接層的非線性變換,輸出CNN 的預(yù)測結(jié)果。CNN 中的卷積層用于挖掘數(shù)據(jù)深層次的抽象特征,其前向傳播過程可以表示為:
其中,x表示CNN 的輸入數(shù)據(jù),濾波器(大小為m×n)的權(quán)重為w,*代表卷積操作,f(·)代表激活函數(shù),y為該卷積層的輸出。每個(gè)卷積層的濾波器大小為1×3,深度為64;池化層通過對(duì)數(shù)據(jù)特征進(jìn)行下取樣,壓縮數(shù)據(jù)維度降低計(jì)算復(fù)雜度,目前常用的池化方法有最大池化和平均池化。最大池化層的池化窗長寬分別設(shè)置為1 和2,平均池化層的池化窗長寬分別設(shè)置為1 和16。第一個(gè)和第二個(gè)全連接層的節(jié)點(diǎn)數(shù)分別設(shè)置為128 和24,第二個(gè)全連接層使用Softmax 激活函數(shù),設(shè)置的節(jié)點(diǎn)數(shù)與所需分類的信號(hào)調(diào)制方式類別數(shù)一致。Softmax 是一種將多種類別的輸出值映射為介于0和1之間的向量函數(shù),數(shù)學(xué)表達(dá)式為:
Fig.2 CLCM model圖 2 CLCM 模型
Fig.3 CNN model structure圖3 CNN模型結(jié)構(gòu)
其中,K表示所需分類的類別數(shù),xi表示激活函數(shù)所在層對(duì)應(yīng)的第i個(gè)節(jié)點(diǎn)輸出的預(yù)測值。
LSTM 作為一種循環(huán)神經(jīng)網(wǎng)絡(luò)的改進(jìn)模型,采用門控機(jī)制克服了訓(xùn)練過程中的梯度爆炸和梯度消失問題,在序列數(shù)據(jù)建模上具有長時(shí)記憶的優(yōu)勢。LSTM 主要由遺忘門、輸入門、輸出門、臨時(shí)單元狀態(tài)4 部分組成,基本原理如下:
其中,σ表示Sigmoid 激活函數(shù),·表示向量的元素積,X代表LSTM 的輸入數(shù)據(jù),H代表細(xì)胞單元的輸出,W代表連接不同門的權(quán)重矩陣,b代表相應(yīng)的偏置。分別表示t時(shí)刻下的遺忘門、輸入門、輸出門、臨時(shí)單元狀態(tài)和新單元狀態(tài)。本文設(shè)置的LSTM 共有3 層,其中前兩層分別包含128 個(gè)LSTM 單元結(jié)構(gòu),LSTM 單元結(jié)構(gòu)如圖4所示。第三層是一個(gè)帶有Softmax 的全連接層,節(jié)點(diǎn)數(shù)設(shè)置為24(調(diào)制方式的類別數(shù))。
Fig.4 LSTM unit structure圖4 LSTM 單元結(jié)構(gòu)
針對(duì)單個(gè)分類模型存在數(shù)據(jù)擬合程度不高、泛化能力較弱的問題,本文引入結(jié)合策略關(guān)聯(lián)獨(dú)立的CNN 和LSTM,通過加權(quán)投票結(jié)合策略聯(lián)合兩種模型協(xié)同合作,使某一分類模型造成的誤分類錯(cuò)誤通過其他分類模型進(jìn)行校正,平衡單一模型在分類性能上的短板。從假設(shè)空間的變化來看,加權(quán)投票結(jié)合策略有利于擴(kuò)大分類模型的假設(shè)空間[16],互補(bǔ)特征提取能力的優(yōu)勢,達(dá)到提高模型泛化能力的目的。
本文利用加權(quán)投票結(jié)合策略互補(bǔ)CNN 和LSTM 的特征提取優(yōu)勢。加權(quán)投票結(jié)合策略表示如下:
其中,x表示輸入數(shù)據(jù),m表示所使用的分類模型個(gè)數(shù),j表示當(dāng)前參與決策的網(wǎng)絡(luò)模型序號(hào),wj表示第j個(gè)網(wǎng)絡(luò)的權(quán)重大?。╳j≥0,),∏(·)表示指示函數(shù),y表示真實(shí)值。C(j)指當(dāng)前參與決策的網(wǎng)絡(luò)模型的預(yù)測結(jié)果。通過結(jié)合策略匯總多個(gè)神經(jīng)網(wǎng)絡(luò)模型對(duì)各數(shù)據(jù)標(biāo)簽的預(yù)測結(jié)果,最終選擇概率之和最大的類標(biāo)簽作為決策結(jié)果。這種方式填補(bǔ)了單個(gè)CNN 或LSTM 模型對(duì)個(gè)別信號(hào)數(shù)據(jù)特征表達(dá)能力不強(qiáng)的空缺,實(shí)現(xiàn)分類模型間的優(yōu)勢互補(bǔ)。
本文基于Python 匯編語言,運(yùn)用Tensorflow 深度學(xué)習(xí)開源框架及Keras 高階應(yīng)用程序接口進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)環(huán)境具體配置如表1所示。
Table 1 Experimental environment表1 實(shí)驗(yàn)環(huán)境
為驗(yàn)證CLCM 模型有效性,采用開源調(diào)制識(shí)別數(shù)據(jù)集RadioML2018.01a 并進(jìn)行離線實(shí)驗(yàn)。RadioML2018.01a[17]基于GnuRadio 平臺(tái)產(chǎn)生,模擬了真實(shí)無線通信系統(tǒng)中常見的損傷,涵蓋了24 種廣泛使用的單子載波調(diào)制方式,具體信息如表2所示。
調(diào)制識(shí)別可以看作是一項(xiàng)多分類任務(wù),常采用準(zhǔn)確率評(píng)價(jià)模型分類性能,準(zhǔn)確率的定義如下:
其中,TP、TN、FP 和FN 分別表示統(tǒng)計(jì)得到的真正例、真反例、假正例和假反例的個(gè)數(shù)。
為驗(yàn)證CLCM 模型的有效性,與XGBoost[17]、VGG[17]、ResNet[17]和DrCNN[18]等4 種當(dāng)前先進(jìn)的調(diào)制識(shí)別模型對(duì)比,所有模型均在相同條件下進(jìn)行訓(xùn)練和測試。各模型準(zhǔn)確率曲線如圖5 所示,隨著信噪比的增加,各模型識(shí)別精度開始增加。在信噪比超過12 dB 后,大多數(shù)模型的識(shí)別精度趨于穩(wěn)定,其中CLCM 的識(shí)別精度超過95%,比其他對(duì)比模型高20%以上。
Table 2 RadioML2018.01a parameters表2 RadioML2018.01a參數(shù)
Fig.5 Recognition performance comparison圖5 識(shí)別性能比較
以準(zhǔn)確率作為評(píng)價(jià)指標(biāo),通過準(zhǔn)確率曲線和混淆矩陣進(jìn)一步驗(yàn)證所提方法的識(shí)別性能。圖6 呈現(xiàn)了多種調(diào)制方式的識(shí)別精度隨信噪比增加的變化軌跡。
圖6(a)給出了CLCM 對(duì)PSK 調(diào)制信號(hào)和APSK 調(diào)制信號(hào)的識(shí)別精度結(jié)果。這些調(diào)制方式在信噪比超過10 dB時(shí),識(shí)別精度均達(dá)到95%以上。
圖6(b)給出了低階數(shù)字調(diào)制方式和模擬調(diào)制方式的準(zhǔn)確率曲線??梢钥闯?,大多數(shù)數(shù)字調(diào)制方式得到了有效識(shí)別。當(dāng)信噪比超過0 dB 時(shí),各數(shù)字調(diào)制方式的識(shí)別精度超過90%;當(dāng)信噪比大于10 dB 時(shí),模擬調(diào)制方式FM、AM-SSB-SC、AM-SSB-WC、AM-DSB-SC 和AM-DSB-WC的識(shí)別精度均超過70%。
Fig.6 Accuracy curve of modulation classification圖6 調(diào)制分類的準(zhǔn)確率曲線
圖6(c)給出了ASK 和QAM 調(diào)制方式的識(shí)別準(zhǔn)確率曲線。CLCM 在信噪比超過14 dB 的情況下,對(duì)高階調(diào)制方式的識(shí)別精度均超過90%。高階QAM 調(diào)制方式的識(shí)別性能受信道影響較大,往往識(shí)別難度較高,這是因?yàn)镼AM 類型的調(diào)制方式在數(shù)字域中的星座點(diǎn)存在重合。
圖7 為CLCM 在高信噪比條件(信噪比=18 dB)下的混淆矩陣。在混淆矩陣中,對(duì)角線上的顏色深淺代表著各調(diào)制方式識(shí)別精度的高低,顏色越深代表該類調(diào)制方式被正確分類的可能性越高。對(duì)角線以外區(qū)域表示某種調(diào)制方式被誤判為另一種調(diào)制方式的概率??梢钥闯?,CLCM能有效識(shí)別絕大多數(shù)調(diào)制方式,包括64QAM、128QAM 和256QAM 等高階QAM 調(diào)制方式;對(duì)于單邊帶模擬調(diào)制方式(AM-SSB-SC 和AM-SSB-WC)和雙邊帶模擬調(diào)制方式(AM-DSB-SC 和AM-DSB-WC)的識(shí)別存在輕微混淆,這是由于模擬調(diào)制方式數(shù)據(jù)經(jīng)由音頻信號(hào)采樣獲得,具有靜音周期,相對(duì)難以識(shí)別。
Fig.7 Confusion matrix at the signal to noise ratio of 18 dB圖7 混淆矩陣(信噪比=18 dB)
為實(shí)現(xiàn)高效精準(zhǔn)的無線通信信號(hào)調(diào)制方式辨識(shí),提出了一種基于加權(quán)投票結(jié)合策略的協(xié)作模型CLCM。仿真實(shí)驗(yàn)表明,CLCM 在高信噪比上的識(shí)別精度比當(dāng)前多數(shù)先進(jìn)模型(例如XGBoost、VGG 等)高20%以上;能有效識(shí)別24種被廣泛應(yīng)用的調(diào)制方式,平均識(shí)別精度超過95%;對(duì)64QAM、128QAM 和256QAM 等易混淆的高階調(diào)制方式的識(shí)別精度均超過90%,這在高速數(shù)據(jù)傳輸應(yīng)用中意義重大。
然而,實(shí)驗(yàn)具有一定局限性。深度學(xué)習(xí)模型由數(shù)據(jù)驅(qū)動(dòng),足夠的數(shù)據(jù)量才能保證模型具有良好的魯棒性,而在實(shí)際場景中獲取數(shù)據(jù)較為困難。此外,網(wǎng)絡(luò)模型能否勝任復(fù)雜多變的實(shí)際場景有待進(jìn)一步考究。