李竟銘 趙明杰 翟 會 丁國如 張小飛
(1.南京航空航天大學電子信息工程學院,南京,210016; 2.浙江理工大學信息學院,杭州,310018; 3.陸軍工程大學通信工程學院,南京,210007)
考試是教學活動的重要環(huán)節(jié),是選拔優(yōu)秀人才、檢驗教學質量和考察學生理解程度的主要手段。近年來,為彰顯國家對考試公平性的重視,考試作弊首次納入刑法。考試作弊所造成的危害極大,它不僅破壞了考試公平,侵犯了其他學生的利益,損害了學校的聲譽,更降低了高等教育的公信度,因此成為高校教學管理研究的熱點問題。隨著無線電通信的廣泛應用,考試作弊的手段也趨于隱性化、智能化,作弊者通常使用磁共振耳機、骨感耳機和針孔攝像頭等先進的作弊器材與外界進行試題及答案的傳遞。由于便于隱藏、不需要人為取出且具有強大的收發(fā)功能,無線電作弊設備已成為大型考試中的作弊利器。目前常見的用來考試防作弊的措施大致有以下幾種:(1)人臉識別指紋驗證;(2)使用金屬探測儀進行安檢;(3)使用屏蔽設備;(4)視頻監(jiān)控等。
室內定位是一種對室內環(huán)境的位置估計技術[1,2]。由于受到復雜的室內電波傳播環(huán)境、室內建筑布局和人員移動性等因素的影響,室內信號衰落模型無法準確建立,因此其發(fā)展遠滯后于室外定位技術。通常室內定位技術通過采集收發(fā)機之間無線鏈路的到達時間 (Time of arrival, TOA)、到達時間差(Time difference of arrival, TDOA)、到達角 (Angle of arrival, AOA)[2]和接收信號強度 (Receive signal strength indicator, RSSI)[3]來估計收發(fā)機之間的距離,以此來構建位置估計模型,從而獲取終端的位置信息。但是基于TOA,TDOA和AOA的定位技術需要進行相對時間和角度的測量,這大大增加了硬件成本,并不適用于廣泛普及,因此本文采用RSSI來構建位置估計模型。
指紋識別[4,5]方法專注于有效地比較實時的頻譜掃描信息與室內預先記錄的掃描數(shù)據(jù)庫,因此對于本地信號干擾更為穩(wěn)健。文獻[6]采用最近鄰插值法(K-nearest neighbor,KNN)方法,從指紋數(shù)據(jù)庫中查詢與其最相似的K個位置數(shù)據(jù),對其位置進行平均。文獻[7]對其進行了改進,使用了加權KNN方法。文獻[8]中,隨機森林算法也得到了很好的定位精度。然而,傳統(tǒng)的機器學習方法對數(shù)據(jù)敏感度較高,往往需要對數(shù)據(jù)進行歸一化、濾波等預處理,且容易過擬合導致泛化能力較弱,隨時間推移網(wǎng)絡的預測性能會受到影響。但隨著定位精度的需求越來越高,數(shù)據(jù)量也隨之增大,深度學習是一個很有前途的解決方案[9]。深度學習[10]可以直接學習提取數(shù)據(jù)隱含的結構特征而不需要預處理,并且可以有效避免過擬合等問題,從而提高網(wǎng)絡泛化能力。因此,使用深度學習與自動編碼器,將數(shù)據(jù)進行特征提取和降噪處理。文獻[11]中,就利用深度學習算法通過WiFi實現(xiàn)了室內定位;文獻[12]提出了一種對信道狀態(tài)信息(Channel state information,CSI)進行深度學習的室內指紋系統(tǒng),驗證了深度學習在室內定位領域的廣闊前景。
為了構建智慧考場,本文在室內定位和頻譜監(jiān)測技術的基礎上,設計了基于深度學習的無線電作弊信號發(fā)現(xiàn)與定位系統(tǒng),系統(tǒng)實現(xiàn)了無線電作弊設備判決、定位、告警以及移動終端實時顯示等功能。本文的主要貢獻為:(1)構建了基于通用軟件無線電外設(Universal software radio peripheral,USRP)平臺的無線電作弊信號發(fā)現(xiàn)與定位系統(tǒng),實現(xiàn)了告警、移動終端實時顯示等功能; (2)設計了基于深度學習的定位算法,實現(xiàn)了對電磁頻譜數(shù)據(jù)的訓練和學習,使平均定位精度達到0.178 8 m。
為使考場工作人員方便、直觀、遠程和實時地了解所監(jiān)測環(huán)境的安全情況,無線電作弊信號發(fā)現(xiàn)與定位系統(tǒng)利用物聯(lián)網(wǎng)的思想,在互聯(lián)網(wǎng)基礎上,將網(wǎng)絡延伸到現(xiàn)實環(huán)境中,進行頻譜和視頻信息的采集與共享,實現(xiàn)對頻譜監(jiān)測信息的呈現(xiàn),并且在網(wǎng)頁中為用戶提供了無線電作弊信號的定位與告警服務,并結合視頻信息混合判決。 如圖1所示,整個系統(tǒng)架構包含電磁頻譜數(shù)據(jù)采集、數(shù)據(jù)處理中心和網(wǎng)頁端實時顯示3個部分,分別完成對應的工作。
圖1 系統(tǒng)構架圖Fig.1 System architecture diagram
為了解當前檢測的室內環(huán)境的電磁輻射情況,利用頻譜監(jiān)測設備USRP和4根天線測量并收集當前環(huán)境的電磁能量值??紤]到無線電作弊信號工作周期及工作頻段,將采樣率設為1 MHz,采樣點數(shù)5 000,監(jiān)測中心頻率設為2.09 MHz。為了有助于數(shù)據(jù)的訓練和學習,將室內環(huán)境進行網(wǎng)格化分割,網(wǎng)格大小為20 cm×20 cm,取7行20列共計140個測試點,開啟發(fā)射源,反復在這140個測試點上進行測試,采集4根天線測得的頻譜數(shù)據(jù)。
系統(tǒng)采樣頻譜圖如圖2所示,圖中橫坐標表示頻率,縱坐標表示幅度。4幅圖分別對應4根天線采集到的數(shù)據(jù)。當頻譜圖出現(xiàn)如圖3所示的情況時,說明當前檢測環(huán)境有信號發(fā)出,即有存在無線電作弊信號的可能。
圖2 系統(tǒng)時域采樣結果Fig.2 System sampling results on time domain
圖3 作弊信號的發(fā)現(xiàn)Fig.3 Discovery of cheating signal
同時在監(jiān)測環(huán)境中布設視頻監(jiān)控設備,用于發(fā)現(xiàn)無線電作弊信號時,可以實時傳輸視頻數(shù)據(jù)到電腦上,便于監(jiān)考人員查看該考生有無作弊行為并留存證據(jù)。
將采集到的數(shù)據(jù)進行存儲和集成,為使測得的樣本數(shù)據(jù)更加精確,對樣本數(shù)據(jù)利用窄帶濾波器的方法,有效提高了信噪比。為了對無線電作弊設備進行精確定位,應用基于深度學習的室內定位算法,繼而利用樣本數(shù)據(jù)對模型進行訓練,得到模型后便可通過數(shù)值匹配的方法確定小范圍的精確位置。最后,對定位性能進行評估。本文將精確度和精密度作為評估標準,即精確度越高,定位效果越好,同等精確度時,精密度越高越好。
(1)精確度
精確度是定位系統(tǒng)的關鍵評估指標,通常用平均定位精度來衡量,即估計位置和實際位置的均方根誤差(Root mean squared error, RMSE),即
(1)
(2)精密度
與精確度不同,精密度考慮的是系統(tǒng)所獲取的精確度的分布概率,是對精確度魯棒性的度量。一般情況下,精密度可由幾何精度因子(Geometric dilution of precision, GDOP)或者累計概率分布(Cumulative probability functions, CPF)表示。本文使用累計概率分布表示精密度,在同等精確度時,當定位精確度在0.2 m范圍內,精密度越高越好。
當發(fā)現(xiàn)異常信號信息時,軟件界面和網(wǎng)頁終端適時發(fā)出告警,上報給終端用戶,終端用戶可立刻通過查看考場監(jiān)控視頻,來綜合判決當前環(huán)境和告警位置上有無作弊的隱患,并且通過視頻回放功能留存作弊證據(jù)。
深度學習基本模型類似于傳統(tǒng)神經(jīng)網(wǎng)絡的3層結構[13],是由輸入層、隱藏層和輸出層組成的多層網(wǎng)絡。深度學習通過逐層訓練方法使得梯度能夠有效傳播,因此深度神經(jīng)網(wǎng)絡通常含有多隱藏層,提高了網(wǎng)絡表達能力。如圖4所示,本系統(tǒng)所采用模型主要分為以下3個部分:自編碼器、多層感知機、深度學習回歸預測模型。
圖4 系統(tǒng)模型圖Fig.4 System model diagram
自編碼器(AutoEncoder)[14]可以用于壓縮數(shù)據(jù),提取特征或者降噪。利用深度學習的基本思想和網(wǎng)絡的特性直接構建一個能夠表達原始數(shù)據(jù)的網(wǎng)絡結構,通過設定輸入輸出近似相等,學習網(wǎng)絡的參數(shù)權值,進而構建自編碼模型。文獻[15]中提出了一種新穎的基于去噪自編碼器的室內定位方法,驗證了自編碼器可以提高定位精度。
多層感知機(Multilayer perceptron, MLP),又稱深度前反饋網(wǎng)絡,是典型的深度學習模型。MLP具有多層節(jié)點,其中每層與下一層完全連接,隱藏層的每個節(jié)點都使用非線性激活函數(shù)進行操作,并且利用反向傳播模型訓練網(wǎng)絡。
(1)激活函數(shù)
Sigmoid函數(shù):即S型函數(shù),在神經(jīng)網(wǎng)絡中被廣泛采用。Sigmoid函數(shù)可以將實數(shù)壓縮到 [0,1]區(qū)間,具有強大的解釋力,但在神經(jīng)元趨于0或者1的時候會產(chǎn)生飽和導致梯度彌散,因此權值需要小心初始化,其公式為
(2)
Tanh函數(shù):該函數(shù)擁有良好的數(shù)據(jù)控制力,其將實數(shù)映射到 [-1,1]區(qū)間,但依舊存在飽和問題。Tanh函數(shù)公式為
(3)
Relu函數(shù):是線性修正單元,當x<0時為0,當x>0時斜率為1。Relu收斂速度更快,但是Relu也更加脆弱,大的梯度流可能導致神經(jīng)元永久失效,選擇合適的學習率或者層間批正則化可以避免這種情況的出現(xiàn)。其公式為
f(x)=max(0,x)
(4)
(2)反向傳播算法
訓練樣本集為{(x(1),y(1)),…,(x(m),y(m))},其中m為樣本的個數(shù),用該樣本集訓練神經(jīng)網(wǎng)絡。實驗中的損失函數(shù)為
(5)
梯度下降法的關鍵步驟是計算偏導,對于網(wǎng)絡的權值W和偏置項b,其迭代公式分別為
(6)
(7)
其中α為學習速率。
采用室內指紋定位方案只能對離散指紋點進行預測估計,為了實現(xiàn)更高精度的連續(xù)預測定位,利用深度學習搭建一個回歸預測模型。該線性回歸模型可表示為
f(x)=wTx+b
(8)
式中:x表示輸入,w表示權重,b表示偏差。w和b訓練成最小化的目標函數(shù),該模型首先處理輸入數(shù)據(jù),然后執(zhí)行預訓練;當?shù)竭_輸出層時,模型會反向傳播;算法達到收斂時停止。文獻[16]采用了回歸預測模型來對基因數(shù)據(jù)進行學習。
圖5 深度學習分類仿真結果Fig.5 Simulation results of deep learning classification
室內定位場景通常采取基于指紋的定位方式。對室內環(huán)境的140個指紋點進行采集學習,從而估計出新的定位點。基于指紋的定位是一個多分類問題,傳統(tǒng)機器學習對于二分類問題可以取得較好的效果,但是隨著多分類問題數(shù)據(jù)維數(shù)的增高,機器學習問題變得相當困難。為了更好的泛化,機器學習方法往往會提出很強的針對特定任務的假設。同時,S函數(shù)的飽和特性使隱含層數(shù)受到限制,因此導致神經(jīng)網(wǎng)絡表達能力的不足。而深度學習的核心思想是假設數(shù)據(jù)由因素或特征組合,這些通用假設提高了深度學習算法。深度學習旨在克服機器學習中的‘維數(shù)災難’‘梯度彌散’等一系列困難,從而在多分類問題中取得更好的效果。
針對室內定位場景的多分類任務,本文采用深度學習框架搭建一個具有五隱含層的深度神經(jīng)網(wǎng)絡分類器。為了防止梯度彌散,采用Relu作為隱含層激活函數(shù),并利用Xavier初始化權重。對測試集分類效果進行仿真驗證的結果如圖5所示,其中實心圓為成功定位點,方框為實際測試點,三角為錯誤預測定位點。測試集樣本數(shù)量為100,仿真結果顯示定位精度可以達到90%的準確率。
(1)單隱含層和三隱含層對比
兩個網(wǎng)絡均不進行AutoEncoder且隱含層均采用Relu作為激活函數(shù),對測試集進行回歸擬合來預測坐標點的結果如表1所示。從表中可以看出多隱含層預測效果明顯優(yōu)于單層,但是在定位誤差上依舊較大。
表1 單隱含層和三隱含層對比結果
表2 AutoEncoder定位結果對比
表3 不同隱含層激活函數(shù)定位精度對比
(2)AutoEncoder
從數(shù)據(jù)分布可以看出,為了提高定位精度有必要將數(shù)據(jù)進行特征提取并降噪處理,為此在將數(shù)據(jù)輸入深度學習回歸網(wǎng)絡之前先進行自編碼處理,用于提取數(shù)據(jù)的高維特征并減小噪聲影響。表2列出了采用Tanh激活函數(shù)的三隱含層深度回歸預測網(wǎng)絡是否進行AutoEncoder的定位精度的對比結果。
(3)不同隱含層激活函數(shù)對比
隱含層激活函數(shù)的選擇也會在很大程度上響應定位的精度。在分類任務中表現(xiàn)良好的Relu函數(shù)由于其對數(shù)據(jù)的控制能力較弱,在數(shù)據(jù)分布不均勻的情況下效果并不如Sigmoid等函數(shù)好。由于Tanh相當于Sigmoid函數(shù)的擴展形式,其中心是關于零點對稱的,所以Tanh往往能取得比Sigmoid更好的效果,具體結果如表3所示。
圖6 仿真結果Fig.6 Simulation result
根據(jù)實驗結果,采用三隱藏層的深度學習回歸網(wǎng)絡對室內定位場景進行預測。將訓練參數(shù)保存后利用實測數(shù)據(jù)對實驗環(huán)境定位效果進行仿真驗證,結果如圖6所示。由圖6可知,通過本系統(tǒng),利用三隱藏層的深度學習回歸網(wǎng)絡對室內無線電作弊信號進行定位,其定位的精確度可達到0.170 07 m,符合考場實際場景對定位精度的需求。
本系統(tǒng)以無線電作弊信號的發(fā)現(xiàn)與定位為出發(fā)點,通過部署USRP頻譜監(jiān)測設備對室內環(huán)境中電磁信號進行檢測,了解目標區(qū)域的電磁安全情況。通過部署視頻監(jiān)控設備對室內環(huán)境進行實時監(jiān)控,并將采集的實時數(shù)據(jù)收集起來,聯(lián)網(wǎng)進行處理,運用深度學習算法將平均定位精度提高到0.170 07 m,系統(tǒng)融合頻譜監(jiān)測設備結果與視頻監(jiān)控設備結果,混合判決是否存在作弊現(xiàn)象。最后結果以網(wǎng)頁及APP形式直觀地展現(xiàn)出來,可使監(jiān)考和巡考人員可以方便、直觀、遠程和實時地了解所監(jiān)測環(huán)境的安全情況。