葛聽雨, 應(yīng)雨龍, 王申華, 張菲菲, 李靖超
(1.上海電力大學(xué), 上海 200090; 2.國網(wǎng)浙江武義縣供電有限公司, 浙江 金華 321200;3.上海電機學(xué)院, 上海 200240)
近年來,無線通信網(wǎng)絡(luò)加速構(gòu)建,物聯(lián)網(wǎng)飛速發(fā)展[1],推動了各領(lǐng)域的產(chǎn)業(yè)升級。作為物聯(lián)網(wǎng)設(shè)備相互連接的起點,無線通信輻射源負(fù)責(zé)信息的交互傳輸,而無線通信輻射源識別是物聯(lián)網(wǎng)安全的最重要一環(huán)。為了保障設(shè)備信息安全,阻止敏感信息泄露,構(gòu)建有效的無線通信輻射源識別模型很有必要。除了攜帶表征含義的信息外,無線通信輻射源所發(fā)出的射頻信號還富含射頻輻射源本身的物理特征,通過射頻信號統(tǒng)計量分析和譜分析能夠提煉出無線通信輻射源的物理特征,使無線輻射源物理層認(rèn)證成為可能。
以往的輻射源信號識別技術(shù)往往處于應(yīng)用層,基于編碼技術(shù)或是信道技術(shù),容易受到竊聽、跟蹤、仿冒等諸多安全威脅[2]。應(yīng)用層認(rèn)證機制可以在一定程度上保障信息傳輸安全及終端設(shè)備身份認(rèn)證,如輕量級射頻識別認(rèn)證方案、基于哈希消息認(rèn)證碼的輕量級密碼認(rèn)證方案[3]、基于節(jié)點微控制器實現(xiàn)低資源消耗的傳感網(wǎng)密碼算法[4]等。各類輕量級加密算法能在一定程度上滿足物聯(lián)網(wǎng)的認(rèn)證安全,但面對大規(guī)模網(wǎng)絡(luò)帶來的認(rèn)證數(shù)據(jù),會大量占用物聯(lián)網(wǎng)的計算資源,難以適應(yīng)物聯(lián)網(wǎng)設(shè)備本就稀缺的計算能力。此外,隨著硬件計算能力的大幅度增強,引入了更多安全風(fēng)險,非法人員很容易破解傳統(tǒng)非動態(tài)加密的結(jié)點身份,假冒數(shù)據(jù)流的身份,導(dǎo)致數(shù)據(jù)被篡改、喪失終端控制權(quán)等安全問題[5]。面對物聯(lián)網(wǎng)設(shè)備所具備的有限計算能力和存儲空間,以及苛刻的資源限制需求,無線通信輻射源物理層認(rèn)證相關(guān)技術(shù)的出現(xiàn),突破了傳統(tǒng)意義上物聯(lián)網(wǎng)應(yīng)用層的認(rèn)證機制,可以低錯誤率、高效及低成本來完成通信輻射源的個體識別,確保物聯(lián)網(wǎng)的安全穩(wěn)健運行。
無線通信輻射源識別最早起源于特定輻射源識別,即將輻射源獨特的電磁特性與輻射源個體關(guān)聯(lián)起來的能力。2003年,加拿大的HALL J等人提出了射頻指紋(Radio Frequency Fingerprint,RFF)這一概念[6],從發(fā)射機信號中提取一組具有差異性的細(xì)微特征集合,作為設(shè)備的物理層本質(zhì)特征?,F(xiàn)階段工業(yè)制造技術(shù)所制造的發(fā)射機存在一定的缺陷,包括數(shù)模轉(zhuǎn)換器中存在的量化誤差和取整非線性誤差[7],因IQ 路增益不平衡、相位不平衡、延時不平衡和載波泄露等原因引入非線性畸變[8],鎖相環(huán)因混入諧波而造成的相位噪聲[9]等。這些缺陷不會干擾正常的信息傳輸,但會對調(diào)制信號產(chǎn)生一定影響。相比于傳統(tǒng)要求苛刻的物聯(lián)網(wǎng)應(yīng)用層認(rèn)證技術(shù),物理層認(rèn)證能夠有效抵御模仿攻擊,具有認(rèn)證速度快、計算復(fù)雜度低、多系統(tǒng)易移植的特點,無需考慮各種通信協(xié)議及編碼設(shè)定。射頻指紋的出現(xiàn)突破了一定的傳統(tǒng)思維,使物理層的認(rèn)證機制為無線通信安全再添一層保護。各類射頻指紋提取算法成為近年熱門的研究對象,尤其是對易于獲取的穩(wěn)態(tài)信號射頻指紋的研究,如對于固有尺度分解提取出的信號特征,采取時頻能量分布灰度圖進行間紋理特征分析[10];改進雙譜和時域分析相結(jié)合的方法來提取穩(wěn)態(tài)信號中的射頻指紋[11];基于時域特征、小波特征、短時傅里葉變換和維格納分布的綜合射頻指紋提取方法[12]等。
本文提出了一種無線射頻源識別模型。該模型基于軸向積分雙譜(Axially Integrated Bispectra,AIB)、主成分分析(Principal Component Analysis,PCA)的特征提取理論及灰色關(guān)聯(lián)分類理論,能夠精確且高效地識別無線射頻輻射源穩(wěn)態(tài)信號,完成同廠同型號設(shè)備的認(rèn)證。
中心壓縮化是信號預(yù)處理的重要一環(huán),根據(jù)后續(xù)要求裁剪接收機所接收到的穩(wěn)態(tài)信號,能夠保證數(shù)字信號特征提取的規(guī)范化、高效化。截取穩(wěn)態(tài)信號(選取I路或者Q路信號)經(jīng)重采樣后,一定程度上減少了計算的復(fù)雜度,但因量綱原因,數(shù)值仍處于標(biāo)準(zhǔn)狀態(tài)。不同的量綱可能導(dǎo)致方差差異過大,無法提取出射頻指紋,導(dǎo)致無法進行后續(xù)計算。經(jīng)由數(shù)據(jù)標(biāo)準(zhǔn)化處理(中心化-壓縮處理)實現(xiàn)無量綱化,消除指標(biāo)之間的量綱影響,以解決數(shù)據(jù)指標(biāo)之間的可比性,適合進行綜合對比評價。
設(shè)通信輻射源穩(wěn)態(tài)信號為k,有限長數(shù)字序列為k(i),i=1,2,3,…,經(jīng)中心化-壓縮處理后數(shù)據(jù)為
(1)
雙譜分析屬于高階統(tǒng)計量信號處理方法,更大程度上保留了信號的幅值和相位信息[13]。經(jīng)裁剪后的無線通信源射頻信號,若以傳統(tǒng)的二階統(tǒng)計量進行處理,則存在識別不出最小相位系統(tǒng)、對加性噪聲敏感等缺陷。為能提取出無線通信輻射源的細(xì)微特征,本文以高階譜中的雙譜(三階譜)作為射頻信號處理。
設(shè)通信輻射源穩(wěn)態(tài)信號對應(yīng)的三階累積量為
a3x=E{x*(i)x(i+τ1)x(i+τ2)}
(2)
式中:E——對應(yīng)值的數(shù)學(xué)期望;
x*(i)——穩(wěn)態(tài)信號的共軛;
x(i)——穩(wěn)態(tài)信號;
τ1,τ2——延遲。
其對應(yīng)的雙譜(三階累積量的二階傅里葉變換)為
B(ω1,ω2)=
X(ω1)X(ω2)X*(ω1+ω2)
(3)
式中:B(ω1,ω2)——累積是a3x的雙譜表示;
X(ω)——x(t)的傅里葉變換;
X*(ω1+ω2)——X(ω1+ω2)的共軛。
雙譜變換能夠有效保留信號的相位幅值特征信息,但由于無線通信源信號的雙譜變換會直接導(dǎo)致計算復(fù)雜的二維模板匹配,引發(fā)“維數(shù)災(zāi)難”,在各類時效性要求高的項目中,無法達到目標(biāo)要求。鑒于此,為克服信號特征值計算復(fù)雜的問題,添加積分路徑,將二維特征值映射至一維特征。
積分雙譜主要有徑向積分雙譜、軸向積分雙譜(AIB)、圓周積分雙譜和矩形積分雙譜4種[14],分別沿著不同路徑完成特征值降維。AIB具有良好的尺度變換性,在保留了雙譜幅值信息的同時丟失了信號的部分相位信息。針對含幅值信息的樣本集,可以采用AIB的方法完成二維特征至一維特征的映射。在雙譜的雙頻率平面上沿平行與ω1軸或ω2軸的路徑進行積分,如圖1所示,即可得到AIB。
圖1 軸向積分雙譜AIB示意
穩(wěn)態(tài)信號的AIB為
(4)
PCA是一種用于探索高維數(shù)據(jù)結(jié)構(gòu)的技術(shù)。作為一種線性方法,它借助投影矩陣將高維度的信息數(shù)據(jù)映射到低維空間,通過協(xié)方差矩陣強大的分類特性,使之在所投影的維度上數(shù)據(jù)的方差最大,然后提取特征維度,形成一組新的相互無關(guān)(正交)的新特征代替原指標(biāo)[15],消除無關(guān)冗余信息,保留出原數(shù)據(jù)的細(xì)微特征,最后在AIB的基礎(chǔ)上進一步完成維數(shù)下降。假設(shè)樣本矩陣為W,每一列是同一樣本中經(jīng)AIB處理過后的一維數(shù)據(jù)。
(5)
式中:n——特征點數(shù);
m——樣本數(shù)。
為了找到能最大化方差的投影矩陣,設(shè)原數(shù)據(jù)矩陣W的協(xié)方差矩陣為C,即
C=
(6)
協(xié)方差矩陣C為對稱矩陣,主對角線上元素為樣本內(nèi)數(shù)據(jù)離散程度的表征,其余元素為樣本間數(shù)據(jù)分類程度的表征。
為約束高維數(shù)據(jù),重構(gòu)數(shù)據(jù)值,通過特征根與特征向量的關(guān)系式推導(dǎo)出正交基,以線性關(guān)系映射至合理的特征空間。設(shè)協(xié)方差矩陣C滿足
C×I=t×I
(7)
式中:t——特征值;
I——特征向量。
t=[t1,t2,t3,…,tn]
(8)
(9)
為達到射頻指紋提取及降維,特征值t降序排列,取前x個特征值,并將對應(yīng)的特征向量I對應(yīng)排列組成轉(zhuǎn)移矩陣T
T=[I1,I2,I3,…,Ix]
(10)
將原數(shù)據(jù)矩陣W經(jīng)轉(zhuǎn)移矩陣T投影后,得到新數(shù)據(jù)矩陣S
S=W×T
(11)
經(jīng)PCA映射過的數(shù)據(jù)矩陣,數(shù)據(jù)特征得以重構(gòu),表現(xiàn)出類內(nèi)數(shù)據(jù)離散特性及類間數(shù)據(jù)分類特性。
灰色關(guān)聯(lián)分類器(Grey Relation Classification,GRC)是基于灰色關(guān)聯(lián)度分析(Grey Relation Analysis,GRA)的多分類器。其基本思想是通過確定參考數(shù)據(jù)列和若干個比較數(shù)據(jù)列的數(shù)值相似程度來判斷樣本間的聯(lián)系是否緊密,以反映類間的關(guān)聯(lián)程度。
將關(guān)聯(lián)系數(shù)和關(guān)聯(lián)度作為類間區(qū)分指標(biāo)。在非線性系統(tǒng)中,通過灰色關(guān)聯(lián)度這一指標(biāo)來獲知不同特征對類間樣本的影響程度。在無線通信信號識別中,GRA具有良好的特性,如強抗噪聲性能、優(yōu)秀的分類特性、高效的計算速度及簡潔的模板數(shù)據(jù)庫匹配能力[16-18]等。
設(shè)從無線通信輻射源提取待識別的特征向量為
(12)
式中:Bi——待識別的無線通信輻射源樣本,i=1,2,3,…;
bi——某一測試樣本特征參數(shù)。
設(shè)所建立無線通信輻射源特征向量模板為
(13)
式中:Cj——無線通信輻射源樣本特征向量模板,j=1,2,3…;
cj——某一特征樣本特征參數(shù)。
設(shè)灰色關(guān)聯(lián)系數(shù)為ζ(bi(x),cj(x)),灰色關(guān)聯(lián)度為ζ(Bi,Cj),則
(14)
(15)
式中:ρ——分辨系數(shù),通常取0.5。
求得Bi與每一個線通信輻射源樣本特征向量模板Cj(j=1,2,3…)的灰色關(guān)聯(lián)度ζ(Bi,Cj),選取最大關(guān)聯(lián)度,匹配至相應(yīng)通信輻射源樣本特征向量模板。
基于AIB-PCA-GRC的模型建立的射頻信號主要分為如下7個部分:
(1) 采集接收機所收到射頻基帶信號,采集I/Q兩路信號,選取I路或者Q路信號進行方差軌跡檢測,以截取穩(wěn)態(tài)信號片段;
(2) 信號數(shù)據(jù)進行降采樣、中心化及壓縮化處理,完成數(shù)據(jù)的預(yù)處理;
(3) 將數(shù)據(jù)以3∶2的比例分為訓(xùn)練樣本和測試樣本;
(4) 將用于訓(xùn)練樣本的穩(wěn)態(tài)信號片段進行AIB變換;
(5) 通過PCA降維得到多維特征向量模板;
(6) 將用于訓(xùn)練樣本的穩(wěn)態(tài)信號片段進行AIB變換及PCA降維;
(7) 運用GRC進行測試樣本與模板樣本匹配,實現(xiàn)物理層認(rèn)證。
射頻指紋認(rèn)證模型整體構(gòu)建如圖2所示。
圖2 射頻指紋認(rèn)證模型構(gòu)建
本文以同廠家、同型號、同批次的100個WiFi網(wǎng)卡設(shè)備為例,基帶信號采集設(shè)備為FSW26頻譜儀,采集環(huán)境為實驗室LOS,100個WiFi網(wǎng)卡為待檢測設(shè)備,每個設(shè)備采集50個樣本;信號采集帶寬為80 MHz,每次采集1.75 ms,即每樣本有140 000個樣本點(以單路為例),其中經(jīng)過方差軌跡檢測除去信號噪聲段的有效數(shù)據(jù)傳輸段為80 000個樣本點(均為穩(wěn)態(tài)信號),再對其進行切片(以40 000個點為新的樣本)處理。切片信號波形如圖3所示(以設(shè)備1樣本1為例)。
圖3 切片信號波形
為進一步減少計算復(fù)雜度,進行降采樣處理,為1 334個樣本點。重采樣信號波形如圖4所示(以設(shè)備1樣本1為例)。
圖4 重采樣信號波形
將5 000個總樣本按3∶2的比例隨機抽取分為3 000個訓(xùn)練樣本以及2 000個測試樣本(100個設(shè)備分類情況下),由雙譜變換提取雙譜特征,由AIB完成二維至一維的映射,PCA降維特征提取射頻指紋模板,再選擇測試樣本進行識別模板匹配測試。以下內(nèi)容將圍繞不同PCA降維點數(shù)、設(shè)備數(shù)量、添加不同程度的高斯白噪聲以及不同分類算法對于模型效果的影響,設(shè)計最優(yōu)參數(shù)并驗證模型的高效性和精確性。同時,由于采用隨機收取樣本,所以在使用相同方法測試時,會出現(xiàn)3%左右的誤差,但這在可接受范圍內(nèi)。
PCA降維參數(shù)選取過大則影響效率,選取過小則不能保障模型的感知能力[19]。為追求模型的最大效益,以20個設(shè)備的樣本作為實驗對象,每個設(shè)備所采集的樣本數(shù)以3∶2的比例隨機分成訓(xùn)練集和驗證集,由PCA提取不同維數(shù)的射頻指紋,由GRC的分類結(jié)果判斷降維參數(shù)的好壞。
經(jīng)PCA降維提取射頻指紋,當(dāng)射頻指紋維數(shù)從1增至10,識別準(zhǔn)確率從10.5%提升至84%,其準(zhǔn)確率曲線如圖5所示。
圖5 射頻指紋維數(shù)為1到10的識別準(zhǔn)確率曲線
由圖5可知,射頻指紋維數(shù)的提升帶來顯著的準(zhǔn)確率的提升,因此后續(xù)還需繼續(xù)增加指紋維數(shù)來探索射頻指紋的最佳構(gòu)成。
當(dāng)射頻指紋維數(shù)從10增至120,識別準(zhǔn)確率從84%提升至96%,其準(zhǔn)確率曲線如圖6所示。
圖6 射頻指紋維數(shù)為10到250的識別準(zhǔn)確率曲線
由圖6可知,分類器識別準(zhǔn)確率保持上升,并達到最高點,表明120個特征點所組成的特征向量已經(jīng)能夠在很大程度上映射出無線通信輻射源信號本身的射頻指紋。當(dāng)射頻指紋維數(shù)大于120時,識別準(zhǔn)確率已經(jīng)維持在95%左右,沒有繼續(xù)增長。表明維數(shù)在120之后的特征點已經(jīng)不足以當(dāng)成射頻指紋的成分,增加的維數(shù)不能提高識別準(zhǔn)確率,只會增加特征向量的冗余,浪費計算資源。
為驗證基于AIB-GRC模型的抗噪聲能力,人為添加高斯噪聲,改變信噪比,在其他影響因素不變的情況下(PCA降維數(shù)為120,設(shè)備數(shù)為20),研究噪聲對基于AIB-GRC識別模型的影響程度。
經(jīng)實驗驗證,在信噪比為0 db和10 db的情況下,模型識別準(zhǔn)確率達到90.0%和92.0%,但是當(dāng)信噪比下降至-10 db,識別準(zhǔn)確率僅為28.2%,表明一定程度的高斯白噪聲無法對無線射頻源信號識別產(chǎn)生影響。信噪比與識別準(zhǔn)確率的關(guān)系如表1所示。
表1 信噪比與識別準(zhǔn)確率的關(guān)系
由表1可知,基于AIB-GRC的模型具有強的抗干擾能力,適用于日常實際非極端通信場景下,但若是處于多噪聲或強噪聲環(huán)境下,還需要對無線通信輻射源進行抗噪聲處理,以增加魯棒性。
為驗證GRC的分類效果,與射頻指紋提取方法保持一致(原數(shù)據(jù)經(jīng)AIB,PCA降維后,單個射頻指紋由120個特征值組成),選取最鄰近(K-Nearest Neighbor,KNN)分類器和支持向量機(Support Vector Machine,SVM)分類器進行比較驗證。KNN和SVM都是目前常用的數(shù)據(jù)分類器,在分類任務(wù)中均能取得良好的效果[20-23]。
基于GRC的識別模型展示出優(yōu)良的識別準(zhǔn)確率及識別速度。在設(shè)備數(shù)為10個的情況下,識別準(zhǔn)確率達到了99%,基于AIB-GRC的模型完全適用于小規(guī)模設(shè)備組;在設(shè)備數(shù)從20增加至100個的情況下,設(shè)備數(shù)的改變并未對識別準(zhǔn)確率造成過大的影響,識別準(zhǔn)確率始終保持在90%以上;當(dāng)待認(rèn)證設(shè)備數(shù)達到100個時,GRC的識別準(zhǔn)確率比SVM高了2.1%,比KNN高了7.55%。3種分類算法的識別準(zhǔn)確率比較如圖7所示。
圖7 3種分類算法識別準(zhǔn)確率對比
在識別效率方面,KNN分類器的識別效率要遠(yuǎn)優(yōu)于其他兩類分類器,主要在于其單一的時間復(fù)雜性。相同的前提條件下,當(dāng)設(shè)備數(shù)大于等于70個(驗證樣本為1 400個)時,GRC識別通過AIB和PCA的射頻指紋所花費的時間要少于SVM的識別時間。當(dāng)設(shè)備數(shù)為100個(驗證樣本為2 000個)時,GRC花費的時間為156.35 s,為SVM所消耗時間(182.3 s)的85.76%。3種算法耗時對比如圖8所示。
圖8 3種分類算法耗時對比
由此可知,GRC在占據(jù)較少計算機資源的情況下,還能夠保持平穩(wěn)的高識別準(zhǔn)確率。
針對于現(xiàn)有技術(shù)對通信輻射源個體識別率低的問題,本文提出了一種基于AIB和PCA降維,通過實現(xiàn)無線通信輻射源個體識別模型。通過實驗可以得到以下結(jié)論:
(1) 對于小規(guī)模設(shè)備(設(shè)備數(shù)小于10個),基于AIB-GRC的識別模型能準(zhǔn)確識別,識別準(zhǔn)確率達到99%;
(2) 對于中大規(guī)模設(shè)備(設(shè)備數(shù)在10~100個),基于AIB-GRC的識別模型的識別準(zhǔn)確率能維持在90%以上;
(3) 針對無線通信輻射源信號,GRC的識別效率顯著,可達KNN分類器和SVM分類器的3倍以上;
(4) 所建模型具備優(yōu)良的魯棒性,抗噪聲能力強,適用于日常非極端通信場景。