鄭雅文,任佳鑫,劉銘
(北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,交通數(shù)據(jù)分析與挖掘北京市重點(diǎn)實(shí)驗(yàn)室,北京100044)
隨著移動(dòng)網(wǎng)絡(luò)的快速普及,無(wú)線網(wǎng)絡(luò)技術(shù)逐漸深入滲透到人們生活中的方方面面,產(chǎn)生了智慧家居、車(chē)聯(lián)網(wǎng)、智慧城市、智慧醫(yī)療[1]等新型的物聯(lián)網(wǎng)應(yīng)用,正在形成一個(gè)“萬(wàn)物互聯(lián)”的世界。無(wú)線網(wǎng)絡(luò)的通信過(guò)程具有開(kāi)放性,無(wú)線網(wǎng)絡(luò)中不同設(shè)備發(fā)送的無(wú)線信號(hào)都可能被其他設(shè)備接收到。這種開(kāi)放性在給無(wú)線網(wǎng)絡(luò)帶來(lái)部署便利的同時(shí),也產(chǎn)生了用戶(hù)信息安全隱患。惡意用戶(hù)可能偽裝成合法用戶(hù),入侵無(wú)線網(wǎng)絡(luò)展開(kāi)主動(dòng)攻擊,使得合法用戶(hù)信息有被竊取盜用的風(fēng)險(xiǎn)。2016 年美國(guó)域名解析服務(wù)提供商Dyn 公司遭受大規(guī)模DDoS攻擊,攻擊源主力為Mirai 病毒控制的物聯(lián)網(wǎng)設(shè)備,導(dǎo)致美國(guó)東海岸地區(qū)網(wǎng)絡(luò)大面積癱瘓[2]。惡意用戶(hù)也可能偽裝成基站[3]或者設(shè)置釣魚(yú)AP[4],欺騙合法用戶(hù)接入,可能竊取合法用戶(hù)信息甚至控制合法用戶(hù)設(shè)備,對(duì)合法用戶(hù)信息安全造成威脅。在360 互聯(lián)網(wǎng)安全中心最新發(fā)布的《2019 年手機(jī)安全狀況報(bào)告》中顯示[5],360手機(jī)衛(wèi)士識(shí)別和攔截的垃圾短信高達(dá)95.3 億條,且因信息竊取引起的電信詐騙損失金額高達(dá)1546.5 萬(wàn)元。由此可見(jiàn),一旦惡意用戶(hù)突破網(wǎng)絡(luò)接入的安全認(rèn)證環(huán)節(jié),將對(duì)無(wú)線網(wǎng)絡(luò)安全產(chǎn)生嚴(yán)重影響。因此,保障無(wú)線網(wǎng)絡(luò)安全的關(guān)鍵之一在于保障無(wú)線設(shè)備接入時(shí)身份識(shí)別環(huán)節(jié)的安全。
目前,無(wú)線設(shè)備的身份識(shí)別技術(shù)主要有傳統(tǒng)基于密碼的方法,這些方法主要使用IP、MAC 地址等作為身份識(shí)別的依據(jù)[6],或者使用復(fù)雜的數(shù)學(xué)運(yùn)算、協(xié)議產(chǎn)生密鑰、口令、數(shù)字簽名等用于完成用戶(hù)之間的身份識(shí)別工作[7]。但這樣的方法存在密鑰信息泄露、篡改等隱患,如今計(jì)算機(jī)能力的不斷提高,也使得破譯密碼的能力不斷增強(qiáng),從而威脅到基于密碼的身份識(shí)別方法的有效性。并且物聯(lián)網(wǎng)設(shè)備中包含大量輕量級(jí)設(shè)備,其運(yùn)算能力無(wú)法滿(mǎn)足這種復(fù)雜度較高的身份識(shí)別方法。因此,單純使用加密的方法變得不再可靠,需要尋找一種更加穩(wěn)定和安全的無(wú)線設(shè)備身份認(rèn)證方法。
近年來(lái),越來(lái)越多研究表明利用射頻指紋(Radio Frequency Fingerprinting,RFF)可以很好地進(jìn)行設(shè)備的身份識(shí)別。射頻指紋是無(wú)線網(wǎng)絡(luò)設(shè)備在制造生產(chǎn)過(guò)程中形成一種固有的設(shè)備缺陷。如圖1 所示,從基帶數(shù)字信號(hào)到射頻模擬信號(hào)的變換過(guò)程中會(huì)對(duì)射頻信號(hào)產(chǎn)生特有影響,因而可以基于這些固有的、穩(wěn)定且唯一的信號(hào)特征實(shí)現(xiàn)無(wú)線設(shè)備個(gè)體身份識(shí)別。例如正交混頻器中處理同相(I 路)與正交(Q 路)時(shí),由于二者之間的增益和相位不匹配,產(chǎn)生I/Q 偏移[8];振蕩器在發(fā)射機(jī)和接收機(jī)端進(jìn)行載波上變頻和下變頻時(shí),由于二者存在精度差異,導(dǎo)致載波頻偏出現(xiàn)[9];功率放大器在一段時(shí)間的線性增長(zhǎng)達(dá)到飽和后會(huì)出現(xiàn)非線性增長(zhǎng)的情況,此時(shí)會(huì)由于放大器性能不同而產(chǎn)生輸出信號(hào)的壓縮不同[10]。本文選擇主要考慮相位偏移[11]作為射頻指紋來(lái)進(jìn)行設(shè)備的身份識(shí)別,接收機(jī)端接收到的信號(hào)中包含了相位偏移帶來(lái)的穩(wěn)定影響,通過(guò)深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)達(dá)到分類(lèi)判別的目的。
圖1 射頻指紋的產(chǎn)生機(jī)理
利用射頻指紋進(jìn)行身份識(shí)別的識(shí)別技術(shù)主要分為兩種。其一是基于統(tǒng)計(jì)分析方法,Polak 等人利用假設(shè)檢驗(yàn)的方法[12],對(duì)射頻指紋特征進(jìn)行合適的檢驗(yàn)統(tǒng)計(jì)量設(shè)計(jì),以此進(jìn)行身份識(shí)別分類(lèi)。但該方法要求信號(hào)需要高斯分布,在實(shí)際環(huán)境中并不始終成立,因此使用有一定局限性。其二是基于機(jī)器學(xué)習(xí)的方法,彭林寧等人利用K-means 的聚類(lèi)方法對(duì)設(shè)備進(jìn)行分類(lèi)[13],但其結(jié)果在低信噪比下難以達(dá)到較好的識(shí)別效果,且利用差分星座軌跡圖進(jìn)行射頻指紋提取會(huì)因其統(tǒng)計(jì)性丟失一部分射頻指紋特征。在其更新的研究中,使用深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)對(duì)差分星座軌跡圖表示的射頻指紋進(jìn)行設(shè)備分類(lèi)[14],但該方法針對(duì)GFSK 調(diào)制設(shè)計(jì),應(yīng)用于其他調(diào)制方式和通信協(xié)議時(shí)性能有所降低。
對(duì)此,本文提出一種使用射頻信號(hào)的原始采樣數(shù)據(jù),并利用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行射頻指紋特征學(xué)習(xí)與分類(lèi)的無(wú)線設(shè)備身份識(shí)別方法。本文方法與以往算法相比,最大的區(qū)別在于直接使用射頻信號(hào)的原始采樣數(shù)據(jù)而不需要對(duì)采樣數(shù)據(jù)進(jìn)行預(yù)處理,使得設(shè)備識(shí)別性能不受信號(hào)預(yù)處理的影響,適用面更廣。實(shí)驗(yàn)證明,該方法具有良好的學(xué)習(xí)分類(lèi)特征的能力,在用戶(hù)數(shù)目增加和信噪比降低的環(huán)境中也可以獲得很好的分類(lèi)準(zhǔn)確率。
考慮一個(gè)存在非法設(shè)備主動(dòng)攻擊的無(wú)線通信環(huán)境。如圖2 所示,其中包括一個(gè)合法發(fā)射機(jī)(Bob)、一個(gè)合法接收機(jī)(Alice),以及1 到9 個(gè)非法發(fā)射機(jī)(Eve)。Bob 向Alice 發(fā)送接入請(qǐng)求信號(hào),二者之間的通信為正常通信,此時(shí)此信號(hào)首先從基帶數(shù)字信號(hào)轉(zhuǎn)化為射頻模擬信號(hào),該過(guò)程會(huì)經(jīng)過(guò)Bob 設(shè)備發(fā)射機(jī)的射頻前端,因射頻前端在制造過(guò)程中存在固有缺陷,會(huì)對(duì)模擬信號(hào)施加特有的影響。再經(jīng)過(guò)隨機(jī)的靜態(tài)瑞利信道HBA,此時(shí)信道以及所處環(huán)境中的噪聲也會(huì)對(duì)信號(hào)產(chǎn)生一定的影響,通??杀灰暈樵肼曇蛩?。合法接收機(jī)Alice 利用其接收機(jī)射頻前端,將射頻模擬信號(hào)再次轉(zhuǎn)化為數(shù)字信號(hào)。這一信號(hào)轉(zhuǎn)化過(guò)程同樣會(huì)對(duì)信號(hào)產(chǎn)生特定影響。同理,非法設(shè)備Eve 也發(fā)送接入請(qǐng)求,經(jīng)過(guò)非法發(fā)射機(jī)的射頻前端、信道HBA、到達(dá)合法接收機(jī)射頻前端,對(duì)信號(hào)產(chǎn)生不同的影響。此時(shí),若合法通信設(shè)備Bob 的身份識(shí)別機(jī)制(如密鑰)被Eve 竊取,則Eve可以模仿Bob 身份,對(duì)Alice 實(shí)施入侵。傳統(tǒng)基于密鑰的身份識(shí)別機(jī)制將難以發(fā)現(xiàn)此類(lèi)入侵,若在傳統(tǒng)密鑰的基礎(chǔ)上加上基于射頻指紋的身份認(rèn)證識(shí)別方法,在Alice 處設(shè)置一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的身份識(shí)別判別器D,通過(guò)對(duì)合法設(shè)備、非法設(shè)備不同射頻指紋的學(xué)習(xí)進(jìn)行判別,則可以依據(jù)發(fā)射機(jī)的射頻指紋特征實(shí)現(xiàn)無(wú)線設(shè)備的身份識(shí)別。由于射頻指紋來(lái)自于射頻信號(hào)特征,而與其所承載的信息無(wú)關(guān),因而可以在傳統(tǒng)密鑰機(jī)制上為無(wú)線網(wǎng)絡(luò)增加另一層安全保障。
圖2 存在惡意攻擊用戶(hù)的無(wú)線通信系統(tǒng)模型
由于本文所提出的算法從原始射頻采樣信號(hào)中提取射頻指紋,因此適用于采用各種調(diào)制方式的系統(tǒng)。為表述清晰起見(jiàn),本文假設(shè)用戶(hù)通信采用QPSK 調(diào)制方式。QPSK 調(diào)制包含四個(gè)輸出相位θ0,分別為每個(gè)相位攜帶兩位二進(jìn)制信息,分別對(duì)應(yīng)00、01、11、10。使用QPSK 調(diào)制方式對(duì)基帶數(shù)字信號(hào)進(jìn)行調(diào)制,首先數(shù)字信號(hào)經(jīng)過(guò)電平發(fā)生器產(chǎn)生相對(duì)應(yīng)的IQ 信號(hào),再經(jīng)過(guò)本地振蕩器使I/Q 兩路分別與cosω0t、sinω0t載波進(jìn)行調(diào)制,將信息加在到相應(yīng)輸出波形的相位上。根據(jù)歐拉公式,經(jīng)過(guò)QPSK 調(diào)制后的調(diào)制信號(hào)可表示為[15]:
由于生產(chǎn)制造中的工藝限制,每個(gè)設(shè)備會(huì)因自身制造誤差產(chǎn)生獨(dú)特且穩(wěn)定的相位偏移,令發(fā)射機(jī)的相位偏移為θT,接收機(jī)的相位偏移為θR,每個(gè)樣本點(diǎn)的采樣相位偏移為Δ。對(duì)于不同的發(fā)射機(jī)設(shè)備而言,θT為獨(dú)立且唯一的相位偏移值,以此作為區(qū)別不同設(shè)備的射頻指紋。由于接收信號(hào)為同一觀察者Alice,因此θR是相同。假設(shè)系統(tǒng)所處環(huán)境的信道為靜態(tài)瑞利信道,即在一定時(shí)間內(nèi)信道參數(shù)不隨時(shí)間變化而變化。在這樣具備開(kāi)放性與穩(wěn)定性的無(wú)線信道環(huán)境中,攻擊者易于竊聽(tīng)到穩(wěn)定的合法信號(hào)樣本,因此基于密鑰的設(shè)備身份識(shí)別機(jī)制非常容易受到攻擊[16]。信道也會(huì)對(duì)相位偏移造成影響θH,再設(shè)置環(huán)境中存在加性噪聲N,這些因素會(huì)對(duì)射頻指紋的識(shí)別帶來(lái)一定的干擾[11]。綜上,本文所考慮的信號(hào)可以表示為:
隨后本文將基于該模型生成數(shù)據(jù)集,用于仿真實(shí)驗(yàn)和性能驗(yàn)證。
本文將提出一種基于深度神經(jīng)網(wǎng)絡(luò)的設(shè)備身份識(shí)別方法,具體而言,本文設(shè)計(jì)了一個(gè)包含三層隱層的全連深度神經(jīng)網(wǎng)絡(luò),使用模擬仿真接收機(jī)接收到的原始采樣射頻信號(hào)作為數(shù)據(jù)集進(jìn)行訓(xùn)練學(xué)習(xí)與分類(lèi)。
深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN),是一個(gè)擁有多層隱層的神經(jīng)網(wǎng)絡(luò),其學(xué)習(xí)過(guò)程依據(jù)前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行[17]。以單個(gè)神經(jīng)元為例,神經(jīng)元在接收到上一層神經(jīng)元的輸入x后會(huì)按照權(quán)值ω與輸入值連接并傳遞,當(dāng)前神經(jīng)元接收到所有輸入后,與閾值進(jìn)行比較,并使用激活函數(shù)激活,得到下一個(gè)神經(jīng)元的輸入:
其中,b為偏置項(xiàng),f(·)為激活函數(shù)。以此類(lèi)推,在到達(dá)最后一個(gè)神經(jīng)元時(shí),使用BP 算法前向傳播,調(diào)整參數(shù),迭代優(yōu)化,使得最終訓(xùn)練誤差達(dá)到可接受范圍內(nèi)。本文算法使用的誤差函數(shù)為基于二分類(lèi)的交叉熵函數(shù):
其中y為樣本標(biāo)簽值,來(lái)自合法接收機(jī)的射頻信號(hào)樣本為1,來(lái)自非法接收機(jī)的射頻信號(hào)樣本為0。p為經(jīng)過(guò)Sigmoid 函數(shù)輸出所測(cè)試的射頻信號(hào)樣本來(lái)自于合法接收機(jī)的概率。
為了適應(yīng)模型的復(fù)雜度,僅僅使用這樣簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)顯然是不夠的。通過(guò)增加隱層的神經(jīng)元個(gè)數(shù)可以增加模型復(fù)雜度,但增加隱層層數(shù)會(huì)顯得更有效。因此,深度神經(jīng)網(wǎng)絡(luò)更能滿(mǎn)足復(fù)雜度高、容量大的學(xué)習(xí)任務(wù)。
本文所提出的基于深度神經(jīng)網(wǎng)絡(luò)的設(shè)備身份識(shí)別過(guò)程如圖3 所示。
圖3 基于深度神經(jīng)網(wǎng)絡(luò)的設(shè)備身份識(shí)別流程圖
在接收機(jī)Alice 端接收到分別來(lái)自合法發(fā)射機(jī)Bob 和非法發(fā)射機(jī)Eve 發(fā)送的信號(hào),令其為Y和Y' 。與(2)式中的相位偏移對(duì)應(yīng),θB與θE分別為合法與非法發(fā)射機(jī)射頻前端對(duì)發(fā)射信號(hào)造成的相位偏移,而θBA與θEA分別為合法與非法信道對(duì)信號(hào)產(chǎn)生的相位偏移。θA則是合法接收機(jī)射頻前端對(duì)接收信號(hào)產(chǎn)生的相位偏移。在訓(xùn)練期過(guò)程中,將從Bob 端發(fā)來(lái)的信號(hào)標(biāo)記為標(biāo)簽1,從Eve 端發(fā)來(lái)的信號(hào)標(biāo)記為標(biāo)簽0,將信號(hào)與標(biāo)簽綁定后輸入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。經(jīng)過(guò)一定的訓(xùn)練過(guò)程,便可得到一個(gè)本質(zhì)上是分類(lèi)器的設(shè)備身份識(shí)別網(wǎng)絡(luò)。
根據(jù)人工神經(jīng)網(wǎng)絡(luò)領(lǐng)域中的通用近似定理,任意一個(gè)定義在閉集上的連續(xù)函數(shù),均可由三層前饋神經(jīng)網(wǎng)絡(luò)模擬到任意精度[18]。因此,本文設(shè)計(jì)了一個(gè)包含三層隱層的深度神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)(2)式中的射頻指紋特征。本文所提出的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示。
圖4 深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
其中,主要包含三個(gè)部分,輸入層、隱層、輸出層。
(1)輸入層:
輸入層由800 個(gè)神經(jīng)元組成。由于本文針對(duì)射頻信號(hào)的原始IQ 采樣數(shù)據(jù),每個(gè)采樣數(shù)據(jù)均表示為復(fù)數(shù)形式。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)無(wú)法直接對(duì)復(fù)數(shù)進(jìn)行處理。為了解決這一問(wèn)題,本文將復(fù)數(shù)信號(hào)轉(zhuǎn)化成為實(shí)數(shù)形式后輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行后續(xù)處理[19]。具體而言,將數(shù)據(jù)集中每個(gè)復(fù)數(shù)的實(shí)部ai、虛部bi分離出來(lái),并按照每一個(gè)樣本點(diǎn)的實(shí)部和虛部交替排列,形成輸入數(shù)據(jù)向量。
(2)隱層:
本文提出的隱層采用3 層全連層,神經(jīng)元個(gè)數(shù)分別為200 個(gè)、100 個(gè)、100 個(gè)。隱層中的激活函數(shù)使用ReLU 函數(shù),并在最后一層隱層后使用dropout 層對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整。
(3)輸出層:
最后一層為輸出層,神經(jīng)元個(gè)數(shù)為1 個(gè),采用Sigmoid 函數(shù)作為激活函數(shù)。輸出結(jié)果為一個(gè)0 到1 的實(shí)數(shù),表征該輸入樣本的標(biāo)簽為0 和1 的概率,將其與數(shù)據(jù)的真實(shí)標(biāo)簽用交叉熵函數(shù)作為損失函數(shù)計(jì)算損失值,依此損失值進(jìn)行前饋調(diào)整、迭代學(xué)習(xí)。
依據(jù)前文所述的信號(hào)模型產(chǎn)生通信信號(hào)的數(shù)據(jù)集。信號(hào)所承載的信息為隨機(jī)生成,且各條信號(hào)樣本的信息獨(dú)立生成。訓(xùn)練集與測(cè)試集中的信號(hào)樣本均獨(dú)立。與傳統(tǒng)射頻指紋研究使用固定前導(dǎo)信息進(jìn)行射頻指紋提取不同[20],本文所提出的射頻指紋抽取方式僅與信號(hào)波形有關(guān),而與所承載的信息無(wú)關(guān)。更適用于傳輸隨機(jī)數(shù)據(jù)的實(shí)際場(chǎng)景??紤]靜態(tài)的瑞利信道,即它對(duì)信號(hào)產(chǎn)生的是一個(gè)隨機(jī)未知且在一段時(shí)間內(nèi)保持不變的影響。引入加性噪聲為5dB 到40dB,步長(zhǎng)為5dB共8 個(gè)信噪比(SNR)值,涵蓋到正常無(wú)線通信的信噪比范圍。
根據(jù)研究實(shí)驗(yàn)變量不同,分為兩個(gè)數(shù)據(jù)集,兩個(gè)用戶(hù)數(shù)據(jù)集(2users data)、十個(gè)用戶(hù)數(shù)據(jù)集(10users data),每個(gè)數(shù)據(jù)集中包含不同信噪比情況下的數(shù)據(jù)樣本。兩個(gè)用戶(hù)數(shù)據(jù)集代表的是最簡(jiǎn)單常見(jiàn)的設(shè)備身份識(shí)別場(chǎng)景,即一個(gè)合法用戶(hù)、一個(gè)非法用戶(hù)。而十個(gè)用戶(hù)數(shù)據(jù)集代表了常見(jiàn)的智慧家庭或者智慧辦公應(yīng)用環(huán)境下每個(gè)接入點(diǎn)所包括的設(shè)備數(shù)量。
(1)2users data:
該數(shù)據(jù)集中包含兩個(gè)用戶(hù),其中,相位偏移設(shè)置為合法發(fā)射機(jī)θB=π/3,合法接收機(jī)θA=π/4,非法接收機(jī)θE=π/6 。在每種信噪比下收集20000 條信號(hào)樣本(single SNR data),因此平均混合各個(gè)SNR 的數(shù)據(jù)集后,數(shù)據(jù)集總大小為160000 條信號(hào)樣本。
(2)10users data:
該數(shù)據(jù)集中包含十個(gè)用戶(hù),其中相位偏移設(shè)置為合法發(fā)射機(jī)θB=0,合法接收機(jī)θA=π/4,非法發(fā)射機(jī)θE=π/5*n(n=1,2,3,4,5,6,7,8,9),在每種信噪比下收集18000 條信號(hào)樣本,因此平均混合各個(gè)SNR 的數(shù)據(jù)集后,數(shù)據(jù)集總大小為144000 條信號(hào)樣本。
其中每一個(gè)樣本包含400 個(gè)射頻信號(hào)采樣點(diǎn),并將數(shù)據(jù)集按照8:1:1 的比例劃分為訓(xùn)練集、測(cè)試集、驗(yàn)證集。
本節(jié)介紹針對(duì)不同實(shí)驗(yàn)變量對(duì)本文所提出的網(wǎng)絡(luò)進(jìn)行參數(shù)優(yōu)化與性能評(píng)估。首先驗(yàn)證不同損失函數(shù)對(duì)神經(jīng)網(wǎng)絡(luò)性能的影響,接下來(lái)展示在不同用戶(hù)場(chǎng)景和不同信噪比情況下的性能。本文所提出算法使用Python 語(yǔ)言和PyTorch 的深度學(xué)習(xí)框架實(shí)現(xiàn)。
本文選用了四種損失函數(shù)進(jìn)行考察,分別為均方誤差損失函數(shù)(MSELoss)、平均絕對(duì)誤差損失函數(shù)(L1Loss)、平滑平均絕對(duì)誤差損失函數(shù)(SmoothL1Loss)與交叉熵?fù)p失函數(shù)(BSELoss)進(jìn)行對(duì)比。并且在三種環(huán)境下進(jìn)行訓(xùn)練和測(cè)試,分別為:①使用2users data;②在兩個(gè)用戶(hù)的環(huán)境中使用SNR 為5dB 數(shù)據(jù)集(2users single SNR data);③在十個(gè)用戶(hù)的環(huán)境中使用SNR為5dB 數(shù)據(jù)集(10users single SNR data)。
得到在不同數(shù)據(jù)集訓(xùn)練下的準(zhǔn)確率結(jié)果表1所示。
表1 不同損失函數(shù)在三種數(shù)據(jù)集訓(xùn)練下的判別準(zhǔn)確率
這里選擇展示在使用2users single SNR data 進(jìn)行訓(xùn)練時(shí)準(zhǔn)確率變化情況與損失函數(shù)值變化情況的實(shí)驗(yàn)結(jié)果如圖5、圖6 所示。
圖5 使用不同損失函數(shù)準(zhǔn)確率變化對(duì)比
圖6 使用不同損失函數(shù)損失值變化對(duì)比
在三種數(shù)據(jù)集訓(xùn)練下可以發(fā)現(xiàn),除了使用L1Loss無(wú)法達(dá)到判別效果,其他三種均可達(dá)到95.57%以上的判別準(zhǔn)確率。在使用2users data 進(jìn)行訓(xùn)練時(shí),更是均達(dá)到99.75%以上的準(zhǔn)確率。而使用BCELoss 是均使準(zhǔn)確率達(dá)到四種損失函數(shù)中最高位。結(jié)合損失值變化曲線也可以發(fā)現(xiàn),在使用BCELoss 時(shí),loss 值也可以更快地降到0 并保持平穩(wěn)。因此使用BCELoss 作為損失函數(shù),無(wú)論從運(yùn)行梯度下降的時(shí)間效率上看,還是從訓(xùn)練結(jié)果判別準(zhǔn)確率上看,均為較好的那一個(gè)。
由于本研究針對(duì)的模型問(wèn)題是一個(gè)判別二分類(lèi)問(wèn)題,神經(jīng)網(wǎng)絡(luò)模型設(shè)置的最后一層是Sigmoid 函數(shù),Sigmoid 函數(shù)缺點(diǎn)在于其函數(shù)曲線兩端的梯度接近于0,這不利于網(wǎng)絡(luò)的收斂和訓(xùn)練。但使用BCELoss 作為損失函數(shù)時(shí),求得反向傳播的梯度就與Sigmoid 函數(shù)無(wú)關(guān)了,從而便于容易進(jìn)行求導(dǎo)運(yùn)算且避免了梯度消失問(wèn)題。
其次,SmoothL1Loss 的效果略次于BCELoss,但是L1Loss 卻對(duì)模型不起作用,使得Loss 值一直為1,判別準(zhǔn)確率也一直是50%。這里是因?yàn)長(zhǎng)1Loss 函數(shù)存在缺陷,當(dāng)預(yù)測(cè)值與真實(shí)值相差為0 時(shí),損失函數(shù)是不可導(dǎo)的。換句話說(shuō),當(dāng)預(yù)測(cè)值與真實(shí)值相差不大時(shí),L1Loss容易造成無(wú)法收斂的情況出現(xiàn)。使用MSELoss 作為損失函數(shù),當(dāng)預(yù)測(cè)值與真實(shí)值差距較大時(shí),反向傳播的梯度會(huì)過(guò)大,而使得網(wǎng)絡(luò)訓(xùn)練抖動(dòng)較大,不利于網(wǎng)絡(luò)收斂。SmoothL1Loss 函數(shù)卻可以使得梯度在預(yù)測(cè)值與真實(shí)值相差不大時(shí)可以足夠小,在預(yù)測(cè)值與真實(shí)值相差很大時(shí)也不至于過(guò)高,最大為1,從而可以避免梯度爆炸。
本節(jié)將用戶(hù)數(shù)目作為實(shí)驗(yàn)變量,考察在用戶(hù)數(shù)目增多時(shí)對(duì)深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)能力的影響。除上一節(jié)中使用的三種數(shù)據(jù)集之外,再增加使用10users data 的情況納入考察范圍。訓(xùn)練后的測(cè)試結(jié)果如表2。
表2 四種數(shù)據(jù)集訓(xùn)練下的判別準(zhǔn)確率
圖7 不同用戶(hù)數(shù)目訓(xùn)練時(shí)準(zhǔn)確率變化曲線
從圖7、表2 中可以看出,深度神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到用戶(hù)的射頻指紋特征,判別合法非法設(shè)備,并且在用戶(hù)數(shù)量增多及環(huán)境噪聲變大時(shí),也可以保證準(zhǔn)確率能
達(dá)到96.33%這樣一個(gè)滿(mǎn)足判別需求的準(zhǔn)確率。在兩個(gè)用戶(hù)時(shí),更是能達(dá)到99.7%以上的準(zhǔn)確率。說(shuō)明本文設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力會(huì)因?yàn)榄h(huán)境復(fù)雜度變高而稍受影響,兩用戶(hù)比十用戶(hù)的準(zhǔn)確率高,而且收斂得更快,但準(zhǔn)確率在約23 個(gè)epoch 之后,復(fù)雜度高的一方也可以收斂到的穩(wěn)定值。
本節(jié)主要考慮將多種信噪比情況作為實(shí)驗(yàn)變量,考察本文提出的識(shí)別算法的有效性。設(shè)置了8 種信噪比環(huán)境,這8 種信噪比涵蓋了正常無(wú)線通信的信噪比范圍,包括低信噪比環(huán)境、中等信噪比環(huán)境和高信噪比環(huán)境。在四種數(shù)據(jù)集下訓(xùn)練后的測(cè)試準(zhǔn)確率如表3 所示。
表3 四種數(shù)據(jù)集訓(xùn)練下不同信噪比的判別準(zhǔn)確率
通過(guò)表4 中準(zhǔn)確率也可以發(fā)現(xiàn),本文提出的方法不僅實(shí)現(xiàn)了在各個(gè)信噪比環(huán)境中的設(shè)備身份識(shí)別分類(lèi)任務(wù),且在大于10dB 的情況下,均能達(dá)到97.68%以上的準(zhǔn)確率。因此,通過(guò)深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),在較差環(huán)境中也可以得到較好的判別準(zhǔn)確率,以滿(mǎn)足實(shí)際系統(tǒng)對(duì)非法用戶(hù)的鑒別需求。從使用single SNR data 數(shù)據(jù)集的判別準(zhǔn)確率上看,判別準(zhǔn)確率與SNR 之間具有一定正相關(guān)性,即SNR 越大,準(zhǔn)確率越高,但受影響效果并不顯著。但使用10users data 數(shù)據(jù)集時(shí),對(duì)信噪比為5dB 的環(huán)境較為敏感,準(zhǔn)確率下降較快,由于該環(huán)境為所有設(shè)置中噪聲影響最大的部分,但也可以得到84.25%的準(zhǔn)確率,并且在單獨(dú)訓(xùn)練5dB 的準(zhǔn)確率能達(dá)到97.61%。因此,在較低的信噪比且環(huán)境模型更為復(fù)雜的情況下,可以進(jìn)行單獨(dú)針對(duì)訓(xùn)練,以提高判別準(zhǔn)確率。
針對(duì)傳統(tǒng)的無(wú)線設(shè)備身份識(shí)別所存在的安全漏洞,本文提出一種基于深度神經(jīng)網(wǎng)絡(luò)的設(shè)備身份識(shí)別方法,本方法使用設(shè)備射頻前端產(chǎn)生的射頻指紋特征進(jìn)行設(shè)備身份識(shí)別,為無(wú)線網(wǎng)絡(luò)中設(shè)備身份識(shí)別提供了另一層安全保障。本方法從射頻接收機(jī)接收到的原始信號(hào)采樣中提取射頻指紋,保留了發(fā)射機(jī)的身份特征。本文設(shè)計(jì)了一種深度神經(jīng)網(wǎng)絡(luò),從所獲得的信號(hào)采樣中識(shí)別無(wú)線設(shè)備身份。通過(guò)不同場(chǎng)景下的仿真實(shí)驗(yàn)證明,本文所提出的方法在用戶(hù)數(shù)目增加、噪聲影響增大的復(fù)雜環(huán)境中依舊保證較高的識(shí)別準(zhǔn)確率,可達(dá)到97.61%以上,證明了本文所提出算法的有效性。