余星達(dá),陳文杰,王鼎,曹仰杰,陳薈慧
(1.鄭州大學(xué)軟件學(xué)院,450000,鄭州;2.佛山科學(xué)技術(shù)學(xué)院電子信息工程學(xué)院,528000,廣東佛山)
身份識(shí)別是普適計(jì)算和人機(jī)交互領(lǐng)域的重要研究?jī)?nèi)容,在安防系統(tǒng)中發(fā)揮著關(guān)鍵作用。臉像、指紋和虹膜等近距離的身份識(shí)別在實(shí)際應(yīng)用中受到了諸多限制[1]。步態(tài)具備遠(yuǎn)距離感知、非接觸、難以隱藏等特性,被公認(rèn)為人類(lèi)的獨(dú)特生物特征[2],受到了研究者們的廣泛關(guān)注。步態(tài)識(shí)別的前期研究中,研究者使用攝像機(jī)[3]、加速度傳感器[4]或地面?zhèn)鞲衅鱗5]對(duì)識(shí)別方法進(jìn)行了大量嘗試,這些方法易受光線(xiàn)等環(huán)境因素或部署條件的限制,不適合室內(nèi)身份識(shí)別。隨著室內(nèi)環(huán)境中Wi-Fi信號(hào)的大規(guī)模覆蓋,基于Wi-Fi信號(hào)的行為感知成為新興的研究領(lǐng)域。Wi-Fi感知方式是非接觸式的,不受光線(xiàn)限制,設(shè)備部署方式靈活,被檢測(cè)目標(biāo)無(wú)需攜帶任何設(shè)備,而且由于體型和運(yùn)動(dòng)模式的差異,每個(gè)人的步態(tài)以獨(dú)有的方式影響周?chē)鶺i-Fi信號(hào),從而在信道狀態(tài)信息(CSI)上產(chǎn)生獨(dú)特的模式[6],因此研究人員開(kāi)始探索利用Wi-Fi信號(hào)進(jìn)行身份識(shí)別。
通過(guò)采集Wi-Fi的CSI數(shù)據(jù),Zeng等提出了一種身份識(shí)別方法(WiWho),利用多徑消除和帶通濾波去除噪聲,并提取步行的特征進(jìn)行身份識(shí)別,在2~6人的團(tuán)體中識(shí)別出一個(gè)人的準(zhǔn)確率為92%~80%[7];Xin等提出了一種FreeSense的方法,該方法使用主成分分析和離散小波變換提取視距路徑波形的形狀特征,并通過(guò)最近鄰分類(lèi)器進(jìn)行身份識(shí)別,在6人情況下的識(shí)別率為88.9%[6];Zhang等提出的WiFi-ID通過(guò)連續(xù)小波變換提取不同頻段的信號(hào),利用ReliefF特征選擇算法計(jì)算所選頻段的時(shí)域和頻域特征作為每個(gè)人的特征庫(kù),在2~6人團(tuán)體達(dá)到了93%~77%的識(shí)別率[8]。
上述研究工作在身份識(shí)別中取得了一定的效果,但由于CSI描述了傳輸信號(hào)的散射、衰落、多普勒頻移等綜合效應(yīng)[9],傳統(tǒng)的手工特征提取方法需要大量的數(shù)據(jù)預(yù)處理工作,難以提取有效的特征以提高身份識(shí)別準(zhǔn)確率。由于CSI能夠在子載波級(jí)別刻畫(huà)多徑傳播,當(dāng)行為發(fā)生時(shí),不同天線(xiàn)對(duì)和子載波的CSI變化是相關(guān)聯(lián)的[10],因此本文利用深度學(xué)習(xí)提取CSI數(shù)據(jù)的時(shí)空特征,設(shè)計(jì)了一種端到端的非接觸式身份識(shí)別(WiID)算法,該算法使用CSI數(shù)據(jù)的幅度信息構(gòu)建輸入矩陣,通過(guò)卷積層提取子載波中CSI數(shù)據(jù)的空間特征,然后利用門(mén)限循環(huán)單元(GRU)[11]獲取其時(shí)間維度特征,取得了良好的身份識(shí)別效果。
商用Wi-Fi設(shè)備通常具有多個(gè)用于多輸入多輸出(MIMO)通信的天線(xiàn)對(duì),每個(gè)天線(xiàn)對(duì)的CSI數(shù)據(jù)包含子載波的幅度和相位信息[12],可表示如下
H(fk)=‖H(fk)‖ej∠H(fk),k∈[1,K]
(1)
式中:H(fk)是第k個(gè)子載波的CSI,它是一個(gè)復(fù)數(shù)值,‖H(fk)‖和∠H(fk)分別表示其幅度和相位,WiID算法使用幅度信息構(gòu)建輸入矩陣。
令Hk=‖H(fk)‖,代表第k個(gè)子載波的CSI信息。在MIMO系統(tǒng)中,Nt和Nr分別代表發(fā)射和接收天線(xiàn)的數(shù)量,構(gòu)成Nt×Nr個(gè)天線(xiàn)對(duì),令N=Nt×Nr,因此MIMO系統(tǒng)中第k個(gè)子載波的CSI信息Hk表示為
(2)
為了檢測(cè)步態(tài)特征,需要不斷收集均勻時(shí)間間隔測(cè)量的CSI信息,J個(gè)時(shí)刻收集的信息被表示為CSI序列,作為WiID模型的輸入矩陣如下
(3)
式中HJK表示J時(shí)刻第K個(gè)子載波的CSI信息。
WiID算法的模型結(jié)構(gòu)如圖1所示,由4部分組成,分別是卷積層(C1,C2,C3)、GRU層(G4,G5)、池化層(S6)和分類(lèi)層(L7)。通過(guò)卷積層和GRU層依次對(duì)CSI數(shù)據(jù)執(zhí)行特征提取,然后將提取的特征輸入至池化層進(jìn)行降維以增強(qiáng)分類(lèi)的準(zhǔn)確性,再對(duì)降維后的特征進(jìn)行分類(lèi)。接下來(lái)將描述每層的工作原理和設(shè)計(jì)。
(1)卷積層。WiID算法使用3層卷積層C1、C2、C3,通過(guò)二維卷積運(yùn)算提取空間特征,如下式
S(p,q)=(X*C)(p,q)=
(4)
式中:*代表卷積運(yùn)算;C是卷積核[13]。
WiID算法采用滑動(dòng)窗口,每次選取一段時(shí)間內(nèi)采集的CSI序列作為模型的輸入,滑動(dòng)窗口的大小為500 ms,步長(zhǎng)為200,同時(shí)WiID算法使用了3個(gè)天線(xiàn)對(duì),每個(gè)天線(xiàn)對(duì)子載波數(shù)量為30,因此卷積層C1的輸入是一個(gè)大小為500×90、行和列分別代表時(shí)間維度、子載波維度的矩陣。在卷積層C1中,為了從不同天線(xiàn)對(duì)的每個(gè)子載波中提取特征,使用30個(gè)100×3的卷積核對(duì)輸入進(jìn)行卷積操作,并且設(shè)置時(shí)間維度(垂直方向)的步長(zhǎng)為1,子載波維度(水平方向)的步長(zhǎng)為3,從而得到30個(gè)特征圖,每個(gè)特征圖的大小為401×30;在卷積層C2中,使用30個(gè)100×5的卷積核對(duì)C1層的特征圖進(jìn)行卷積操作,并在水平和垂直方向上步長(zhǎng)都設(shè)置為1,得到30個(gè)大小為302×26的特征圖;在卷積層C3中,使用與C2層相同的卷積操作,得到30個(gè)大小為203×22的特征圖。各卷積層使用線(xiàn)性整流函數(shù)(ReLU)作為激活函數(shù)[14],并且為了加速網(wǎng)絡(luò)的訓(xùn)練,每個(gè)卷積層的輸入都加入批標(biāo)準(zhǔn)化(BN)處理[15]。
圖1 WiID算法的模型結(jié)構(gòu)
(2)GRU層。GRU層在卷積層的基礎(chǔ)上獲取時(shí)間維度信息,該層通過(guò)內(nèi)置在結(jié)構(gòu)單元中的“門(mén)”提取特征,解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)處理長(zhǎng)期依賴(lài)問(wèn)題時(shí)面臨的梯度爆炸或者梯度消失問(wèn)題[16],其工作原理如下式
rt=σ(Wrxt+Urht-1+br)
(5)
zt=σ(Wzxt+Uzht-1+bz)
(6)
(7)
(8)
卷積層的輸出是203×22×30維的張量,其中203對(duì)應(yīng)的是時(shí)間維度信息,所以在G4層每個(gè)時(shí)刻的輸入是660維的向量。使用G4和G5兩個(gè)GRU層提取時(shí)間相關(guān)的特征,每層的神經(jīng)元數(shù)目為128,并在兩層之間使用dropout方法防止過(guò)擬合[17]。
(3)池化層。GRU單元獲取了不同時(shí)間尺度的信息,然而只使用最后時(shí)刻的GRU單元信息難以刻畫(huà)完整的時(shí)間特征,因此WiID算法通過(guò)將G5層中所有GRU的輸出作為池化層的輸入,然后獲得降維后的特征,有效地利用每個(gè)時(shí)刻的GRU單元信息。
池化在卷積神經(jīng)網(wǎng)絡(luò)中用來(lái)降低卷積層輸出的特征向量的維度[18],同時(shí)還可以起到預(yù)防過(guò)擬合的效果,其目的是用一個(gè)值來(lái)表示一個(gè)區(qū)域[19]。WiID算法需要利用池化結(jié)合每個(gè)時(shí)刻的GRU信息,所以采用均值池化層。將G5層的所有單元信息輸入到均值池化層得到降維后的特征
havg=avg([h1,h2,…,ht,…,hT])
(9)
然后將降維后的特征havg線(xiàn)性化得到輸出z,如下式
z=Whavg+b
(10)
式中:W和b分別代表系數(shù)矩陣和偏置。
(4)分類(lèi)層。將池化層的結(jié)果輸入到分類(lèi)層中進(jìn)行分類(lèi),分類(lèi)層通過(guò)softmax邏輯回歸計(jì)算輸入序列所對(duì)應(yīng)標(biāo)簽的預(yù)測(cè)概率分布,計(jì)算方法如下
(11)
式中:c為y的分類(lèi)數(shù);P(y|x)為由模型預(yù)測(cè)的輸入x屬于類(lèi)別y的后驗(yàn)概率。
在大廳和實(shí)驗(yàn)室兩個(gè)典型的室內(nèi)環(huán)境中收集CSI數(shù)據(jù)進(jìn)行實(shí)驗(yàn),前者是較為稀疏的多徑環(huán)境,如圖2a所示;后者則是較為復(fù)雜的多徑環(huán)境,如圖2b所示。TP_LINK AC1750路由器作為發(fā)射器,安裝了Intel 5300網(wǎng)卡的ThinkPad x201筆記本電腦作為接收器,兩臺(tái)設(shè)備相距2.5 m。使用安裝了定制驅(qū)動(dòng)程序[20]的Ubuntu 14.04系統(tǒng)收集CSI數(shù)據(jù),發(fā)射器和接收器天線(xiàn)數(shù)分別為Nt=1和Nr=3,每個(gè)天線(xiàn)對(duì)包含30個(gè)子載波。
(a)大廳環(huán)境 (b)實(shí)驗(yàn)室環(huán)境圖2 實(shí)驗(yàn)環(huán)境
為了減少環(huán)境中其他Wi-Fi信號(hào)的干擾,本文的實(shí)驗(yàn)均在5 GHz頻段上進(jìn)行,并且以1 kHz的采樣頻率收集CSI數(shù)據(jù)。有6名參與者參加了實(shí)驗(yàn),參與者包括男性和女性,年齡在18~30歲之間。數(shù)據(jù)采集時(shí)每個(gè)人沿著預(yù)定的路徑行走,預(yù)定的路徑設(shè)置在發(fā)射器和接收器之間,路徑寬度為1 m,參與者來(lái)回地穿過(guò)視距路徑(LOS),每次行走時(shí)間為5 s,循環(huán)行走100次。
對(duì)于收集的CSI數(shù)據(jù),使用參與者姓名作為標(biāo)簽輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行監(jiān)督學(xué)習(xí),WiID算法模型的學(xué)習(xí)率設(shè)置為0.000 1,使用Adam優(yōu)化器最小化損失。采用10倍交叉驗(yàn)證策略,將CSI數(shù)據(jù)分成10份,9份作為訓(xùn)練數(shù)據(jù),剩余1份作為測(cè)試數(shù)據(jù),交叉重復(fù)10次實(shí)驗(yàn),取平均值評(píng)價(jià)算法識(shí)別效果。
本文采用準(zhǔn)確率(A)、召回率(R)和精準(zhǔn)率(P)評(píng)估算法識(shí)別效果。
(12)
(13)
(14)
其中TP、FP、FN、TN分別表示屬于該類(lèi)且被分類(lèi)器分為該類(lèi)的樣本數(shù)、不屬于該類(lèi)但被分類(lèi)為該類(lèi)的樣本數(shù)、屬于該類(lèi)但被分類(lèi)為不屬于該類(lèi)的樣本數(shù)、不屬于該類(lèi)且被分類(lèi)為不屬于該類(lèi)的樣本數(shù)。
2.4.1 不同人數(shù)的準(zhǔn)確率 圖3給出了兩種室內(nèi)環(huán)境下不同人數(shù)的識(shí)別準(zhǔn)確率。當(dāng)識(shí)別人數(shù)由2人增加到6人,WiID算法在大廳和實(shí)驗(yàn)室環(huán)境中身份識(shí)別的準(zhǔn)確率分別為98.9%~95.6%和98.1%~93.7%。隨著識(shí)別人數(shù)的增加,兩種室內(nèi)環(huán)境下的身份識(shí)別準(zhǔn)確率均逐漸降低,這是由于人的體型與運(yùn)動(dòng)模式具有相似性,增加識(shí)別人數(shù)會(huì)降低步態(tài)特征的差異性,從而增大錯(cuò)誤分類(lèi)的概率。
圖3 兩個(gè)室內(nèi)環(huán)境下不同人數(shù)的識(shí)別準(zhǔn)確率
(a)大廳環(huán)境
(b)實(shí)驗(yàn)室環(huán)境圖4 不同環(huán)境下6人識(shí)別的混淆矩陣
圖4給出了當(dāng)識(shí)別人數(shù)為6時(shí),在兩種室內(nèi)環(huán)境下身份識(shí)別實(shí)驗(yàn)的混淆矩陣,其中行代表標(biāo)簽中給定的真實(shí)身份,列代表WiID算法預(yù)測(cè)的身份,混淆矩陣中的A、B、C、D、E、F分別代表6名參與者?;煜仃囍酗@示了參與者們的身份識(shí)別細(xì)節(jié),對(duì)于不同的參與者,在大廳實(shí)驗(yàn)環(huán)境中召回率的范圍為93.3%~97.5%,精準(zhǔn)率的范圍為94.2%~97.9%。在實(shí)驗(yàn)室環(huán)境中,召回率和精準(zhǔn)率的范圍分別為90.8%~95.8%和90.9%~96.5%。由于在大廳這類(lèi)多徑傳播較為稀疏的環(huán)境下,參與者行走對(duì)Wi-Fi信號(hào)造成的干擾相對(duì)于其他干擾來(lái)說(shuō)更加顯著,因此更有利于信道狀態(tài)信息中步態(tài)特征的提取,從而達(dá)到了更優(yōu)的身份識(shí)別效果。
2.4.2 不同采樣頻率的影響 為了驗(yàn)證CSI采樣頻率是否會(huì)影響WiID算法身份識(shí)別準(zhǔn)確率,在大廳環(huán)境下的6人身份識(shí)別實(shí)驗(yàn)中,改變收集CSI數(shù)據(jù)集的采樣時(shí)間間隔,并對(duì)采集的數(shù)據(jù)進(jìn)行10倍交叉驗(yàn)證實(shí)驗(yàn)。當(dāng)采樣頻率從1 000 Hz降低到800 Hz時(shí),識(shí)別準(zhǔn)確率從95.6%降低以93.3%,WiID算法仍然保持較高的識(shí)別率,但當(dāng)采樣頻率降低到500 Hz時(shí),識(shí)別準(zhǔn)確率降低到89.1%。實(shí)驗(yàn)結(jié)果表明,小幅降低CSI采樣頻率不會(huì)對(duì)WiID算法身份識(shí)別的準(zhǔn)確率造成過(guò)大影響;但在過(guò)低的采樣頻率下,無(wú)法采集到足夠的樣本數(shù)據(jù)量,不利于深度學(xué)習(xí)模型的訓(xùn)練,難以達(dá)到良好的識(shí)別率。
2.4.3 評(píng)估不同模型 為了更好地評(píng)估模型性能,在大廳環(huán)境下的6人身份識(shí)別實(shí)驗(yàn)中,分別使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)和WiID算法進(jìn)行實(shí)驗(yàn)。其中卷積神經(jīng)網(wǎng)絡(luò)包含3個(gè)卷積層,卷積的方式與WiID算法卷積層相同,并且在卷積層后面添加了兩個(gè)全連接層。循環(huán)神經(jīng)網(wǎng)絡(luò)包含兩個(gè)GRU層,參數(shù)設(shè)置與WiID算法的GRU層相同。3種算法的實(shí)驗(yàn)結(jié)果見(jiàn)表1。
表1 3種算法的實(shí)驗(yàn)結(jié)果
由表1可知,在準(zhǔn)確率、召回率、精準(zhǔn)率方面,WiID算法識(shí)別效果均優(yōu)于卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)算法,結(jié)合兩種算法,本文算法可以更有效地提取CSI數(shù)據(jù)步態(tài)特征,提高識(shí)別能力。
2.4.4 不同場(chǎng)景下的實(shí)驗(yàn)結(jié)果對(duì)比 為評(píng)估WiID算法的魯棒性,即在不同場(chǎng)景下正確識(shí)別同一人的性能穩(wěn)定性,實(shí)驗(yàn)分別設(shè)計(jì)了“正常情況”“改變穿著”“額外背包”“攜帶手提包”以及“偏離預(yù)定路徑”5種不同場(chǎng)景,并分別在每個(gè)場(chǎng)景下針對(duì)每位參與者各采集30組數(shù)據(jù)用于身份識(shí)別。表2給出了6名參與者在不同場(chǎng)景下的平均識(shí)別準(zhǔn)確率,其中“正常情況”是指訓(xùn)練數(shù)據(jù)的采集環(huán)境;在“改變穿著”的實(shí)驗(yàn)場(chǎng)景中,參與者們分別穿著薄T恤、羽絨服、帶上帽子等不同于正常情況下的服飾;在攜帶配件的實(shí)驗(yàn)場(chǎng)景下,分別驗(yàn)證了“額外背包”和“攜帶手提包”兩種不同情況對(duì)身份識(shí)別精度的影響;在“偏移預(yù)定路徑”實(shí)驗(yàn)場(chǎng)景下采集測(cè)試數(shù)據(jù)時(shí),要求參與者們?cè)谄x正常情況下預(yù)定路徑1 m處行走。
表2 不同場(chǎng)景下的平均識(shí)別準(zhǔn)確率
由表2可知,“改變穿著”“額外背包”“攜帶手提包”會(huì)不同程度降低平均識(shí)別準(zhǔn)確率,但影響較小,降幅均控制在0.8%以?xún)?nèi);而“偏移預(yù)定路徑”的實(shí)驗(yàn)場(chǎng)景下,由于路徑偏移會(huì)影響信號(hào)的傳播方式,因此平均準(zhǔn)確率的降幅較為明顯??傮w來(lái)說(shuō),WiID算法在人體裝飾改變及路徑小幅度偏離的情況下依然保持著穩(wěn)定的身份識(shí)別準(zhǔn)確率。
傳統(tǒng)身份識(shí)別方法需要大量數(shù)據(jù)預(yù)處理工作,并且難以達(dá)到較高的準(zhǔn)確率,而本文提出的WiID深度學(xué)習(xí)算法通過(guò)構(gòu)建時(shí)空網(wǎng)絡(luò)模型,自動(dòng)提取CSI數(shù)據(jù)的空間和時(shí)間維度的特征,不僅擺脫了對(duì)手工編碼特征的依賴(lài),且具有較高的識(shí)別準(zhǔn)確率,為端到端的非接觸式身份識(shí)別提供了切實(shí)有效的實(shí)施途徑。研究結(jié)果表明,基于深度學(xué)習(xí)的身份識(shí)別算法具有良好的魯棒性,但需要充足的訓(xùn)練數(shù)據(jù)來(lái)保證識(shí)別效果;對(duì)于基于Wi-Fi的身份識(shí)別算法,被檢測(cè)環(huán)境中人數(shù)的增加可能成為其提高準(zhǔn)確率的障礙。
下一步工作將在現(xiàn)有工作基礎(chǔ)上,提高算法在不同室內(nèi)環(huán)境下身份識(shí)別的泛化能力,并探索其有效的識(shí)別范圍,進(jìn)一步提高身份識(shí)別性能。