摘" 要: 在注重隱私或無光環(huán)境下,主流的基于機(jī)器視覺的人員識(shí)別方法不太適用?;谙∈梵w壓特征,文中提出一種將CNN與Bi?LSTM相融合再結(jié)合注意力機(jī)制的人員識(shí)別新方法。首先,對(duì)獲得的稀疏體壓數(shù)據(jù)使用CNN進(jìn)行空間特征提取;然后,使用Bi?LSTM神經(jīng)網(wǎng)絡(luò)獲取長(zhǎng)遠(yuǎn)的上下文信息,抽取潛藏在時(shí)序規(guī)律中的上下文特征;最后,將抽取的空間與時(shí)序特征并聯(lián)融合,結(jié)合注意力機(jī)制進(jìn)行權(quán)重參數(shù)優(yōu)化,使模型更關(guān)注于最具類別區(qū)分度的特征。實(shí)驗(yàn)結(jié)果表明,該方法擁有更快的收斂速度,識(shí)別準(zhǔn)確率達(dá)到93.86%。
關(guān)鍵詞: 人員識(shí)別; 體壓特征; 注意力機(jī)制; 雙向長(zhǎng)短期記憶; 神經(jīng)網(wǎng)絡(luò); 稀疏體壓
中圖分類號(hào): TN911.23?34; TP391.41" " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " 文章編號(hào): 1004?373X(2025)03?0111?08
Sparse body pressure feature personnel identification method
XIAO Hongzhou, LI Changyun, WANG Zhibing, GAN Yinghua, REN Guoxin
(1. School of Computer, Hunan University of Technology, Zhuzhou 412000, China;
2. Key Laboratory of Intelligent Information Perception and Processing Technology of Hunan Province, Hunan University of Technology, Zhuzhou 412000, China)
Abstract: Personnel identification methods based on mainstream machine vision are not so suitable in privacy?conscious or light?free environments. In view of this, a new method of human identification by fusing CNN and Bi?LSTM (bi?directional long short?term memory) and then combining with attention mechanism is proposed based on the sparse body pressure feature. CNN is used to extract spatial features from the obtained sparse body pressure data, and then the Bi?LSTM neural network is used to obtain long?term context information and extract the context features hidden in the time series law. Finally, the extracted spatial and temporal features are fused in parallel and then combined with the attention mechanism for the optimization of the weight parameters, so that the model pays more attention to the features with the most categorical discrimination. Experimental results show that the proposed method has a faster convergence speed and a recognition accuracy of 93.86%.
Keywords: personnel identification; body pressure feature; attention mechanism; Bi?LSTM; neural network; sparse body pressure
0" 引" 言
隨著人們對(duì)人員識(shí)別技術(shù)的需求日益增長(zhǎng),運(yùn)用生物特征進(jìn)行人員識(shí)別的生物識(shí)別技術(shù)因其具有自動(dòng)識(shí)別性、驗(yàn)證性、遺傳性與終身不變性等特點(diǎn),與傳統(tǒng)認(rèn)證識(shí)別技術(shù)相比更加的安全可靠[1]。但生物識(shí)別技術(shù)仍然存在諸多的問題,在一些特定的場(chǎng)景,如智能馬桶、智能床墊等應(yīng)用場(chǎng)景,隱私問題就顯得格外重要,傳統(tǒng)的人臉識(shí)別[2?3]、指紋識(shí)別[4]、虹膜識(shí)別[5]、步態(tài)識(shí)別[6]等生物識(shí)別技術(shù)對(duì)光線和采集設(shè)備的依賴性較大,且視頻設(shè)備會(huì)侵犯?jìng)€(gè)人隱私[7],無法進(jìn)行安全且私密的人員識(shí)別。
為了解決由于隱私問題帶來的不便因素,文獻(xiàn)[8]提出了一種新的基于足跡的個(gè)人識(shí)別方法。在實(shí)驗(yàn)中,足跡的壓力分布是用壓力感應(yīng)墊測(cè)量的。通過10名志愿者貢獻(xiàn)的足跡來測(cè)試所提出的方法,取得的最好識(shí)別率為85.00%。文獻(xiàn)[9]提出了一種基于步態(tài)使用地板壓力數(shù)據(jù)進(jìn)行人員識(shí)別的方法,從一對(duì)足跡的3D COP軌跡中提取一組特征并將其與其他特征(例如:平均壓力和步長(zhǎng))一起用于人員識(shí)別,取得的最好識(shí)別率為92.3%。文獻(xiàn)[10]使用了一種在壓敏地板上利用多分類器和拒絕選項(xiàng)實(shí)驗(yàn)進(jìn)行人員識(shí)別的方法,對(duì)于10個(gè)不同的步行者,總體準(zhǔn)確率為92%。當(dāng)添加拒絕選項(xiàng)時(shí),分類率達(dá)到95%,拒絕率為9%。文獻(xiàn)[11]利用從電容地板中提取的步行特征結(jié)合雙向長(zhǎng)短期記憶(Bi?LSTM)的深度神經(jīng)網(wǎng)絡(luò)來進(jìn)行人員識(shí)別,準(zhǔn)確率達(dá)到了98.12%。上述關(guān)于壓力傳感器進(jìn)行的人員識(shí)別研究中,大多都涉及高密度的壓力傳感器,而高密度壓力傳感器的人員識(shí)別系統(tǒng)成本往往隨著傳感器密度的增加而增加。過高成本的人員識(shí)別方案難以普及。
針對(duì)上述隱私與成本兩方面的問題考慮,本文設(shè)計(jì)了一種基于稀疏壓力傳感器的人員識(shí)別系統(tǒng),通過低密度排列的壓力傳感器獲取原始數(shù)據(jù),在保護(hù)了隱私性的同時(shí)也規(guī)避了由于高密度傳感器帶來的成本過高問題。在面對(duì)低密度的傳感器帶來的低數(shù)據(jù)量問題時(shí),本文采用特征工程和雙向長(zhǎng)短期記憶網(wǎng)絡(luò),提取了豐富的空間特征和上下文時(shí)間特征,以捕捉實(shí)驗(yàn)者體壓的動(dòng)態(tài)變化。最后結(jié)合注意力機(jī)制,使不同時(shí)刻輸入的重要性模型加強(qiáng)提取與人員識(shí)別相關(guān)性大的特征并通過實(shí)時(shí)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),證明該模型預(yù)測(cè)的準(zhǔn)確性。
1" 相關(guān)理論及技術(shù)
1.1" 長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)
長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)是一種特殊類型的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),由于傳統(tǒng)的RNN面臨梯度消失或爆炸的問題,導(dǎo)致網(wǎng)絡(luò)難以學(xué)習(xí)到時(shí)間序列中距離較遠(yuǎn)的依賴關(guān)系。LSTM通過其獨(dú)特的內(nèi)部結(jié)構(gòu),有效地解決了這一問題。為了解決梯度消失和梯度爆炸問題, Hochreiter首先提出了LSTM[12] 。圖1是典型LSTM的基本單元結(jié)構(gòu)圖。它在神經(jīng)元結(jié)構(gòu)中引入門的功能用于解決循環(huán)神經(jīng)網(wǎng)絡(luò)中的長(zhǎng)期依賴問題,特別適合時(shí)間序列信號(hào)的處理[13]。
LSTM單元包含4個(gè)互相協(xié)作的部分:輸入門[it]、遺忘門?[ft]、輸出門[Ot]?,以及一個(gè)細(xì)胞狀態(tài)[ct]。這些組件共同工作,共同決定網(wǎng)絡(luò)在每個(gè)時(shí)間步的行為。
輸入門:輸入門控制著新信息的流入。它由一個(gè) sigmoid激活層和一個(gè)點(diǎn)乘操作組成。
遺忘門:遺忘門負(fù)責(zé)決定細(xì)胞狀態(tài)中哪些信息應(yīng)該被保留或丟棄。
細(xì)胞狀態(tài):LSTM的關(guān)鍵部分是其細(xì)胞狀態(tài),它在整個(gè)鏈條中流動(dòng),只有輕微的線性交互。
輸出門:輸出門決定了下一個(gè)隱藏狀態(tài)的值,隱藏狀態(tài)包含了前一個(gè)輸出和當(dāng)前細(xì)胞狀態(tài)的信息。
[it=σ(Wxixt+Whiht-1+bi)] (1)
[ft=σ(Wxfxt+Whfht-1+bf)ct=ft*ct-1+it*ct] (2)
[ct=tanh(Wxcxt+Whfht-1+bc)Ot=σ(Wx0xt+Wh0ht-1+b0)] (3)
[ht=Oi*tanh(t)] (4)
1.2" 雙向長(zhǎng)短期記憶(Bi?LSTM)網(wǎng)絡(luò)
在進(jìn)行體壓特征的人員識(shí)別時(shí),由于傳統(tǒng)的LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)只能使用歷史的體壓特征數(shù)據(jù)對(duì)人員進(jìn)行分類識(shí)別,沒有考慮到之后時(shí)間的數(shù)據(jù)特征,而將前后時(shí)間的數(shù)據(jù)信息進(jìn)行關(guān)聯(lián)后可以有效地提高分類精確度。為此,本文使用雙向長(zhǎng)短期記憶(Bi?LSTM)網(wǎng)絡(luò)[14],通過在傳統(tǒng)LSTM的基礎(chǔ)上增加反向傳遞信息的能力,顯著提高了模型對(duì)時(shí)間序列數(shù)據(jù)的理解深度。圖2結(jié)構(gòu)使得Bi?LSTM在處理如體壓特征這類時(shí)間序列數(shù)據(jù)時(shí),能夠同時(shí)考慮前后時(shí)刻的信息,從而提高識(shí)別精度和效率。在模型中,Bi?LSTM還結(jié)合了注意力機(jī)制,這進(jìn)一步提升了模型對(duì)關(guān)鍵特征的識(shí)別能力。注意力機(jī)制通過加權(quán)重要的時(shí)間步,使模型能夠更加聚焦于影響人員識(shí)別的關(guān)鍵時(shí)刻和特征。
典型的Bi?LSTM結(jié)構(gòu)如圖2所示。
1.3" 注意力機(jī)制
在模型實(shí)驗(yàn)過程中發(fā)現(xiàn)有一些對(duì)于模型識(shí)別率比較重要的特征在模型中的重要性權(quán)重占比不高,因此引入注意力機(jī)制來解決此問題。注意力機(jī)制的核心思想是模擬人類的注意力過程,即在處理大量信息時(shí)能夠集中注意力于某些關(guān)鍵部分。
本文模型中的注意力機(jī)制[13]被實(shí)現(xiàn)為一個(gè)自定義的Attention Layer類。這個(gè)層的主要作用是為Bi?LSTM 網(wǎng)絡(luò)的輸出賦予不同的權(quán)重,使得模型能夠聚焦于對(duì)當(dāng)前預(yù)測(cè)任務(wù)最關(guān)鍵的信息。
[et=tanh(Whht+b)] (5)
[αt=exp(et)texp(et)] (6)
[c=tαtht] (7)
在本文的人體識(shí)別模型中,注意力機(jī)制使得Bi?LSTM能夠更有效地處理體壓特征數(shù)據(jù)。體壓數(shù)據(jù)包含了時(shí)間上的復(fù)雜模式,這些模式對(duì)于區(qū)分不同人員至關(guān)重要。通過聚焦于這些關(guān)鍵模式,注意力機(jī)制提高了模型在處理每個(gè)人獨(dú)特體壓特征時(shí)的精確度。例如,對(duì)于一個(gè)長(zhǎng)時(shí)間序列的體壓數(shù)據(jù),某些時(shí)間點(diǎn)的特征可能比其他時(shí)間點(diǎn)更有助于識(shí)別個(gè)體。注意力機(jī)制能夠識(shí)別這些關(guān)鍵時(shí)刻,并使模型在做出預(yù)測(cè)時(shí)更多地依賴于它們。這種方法在提高分類準(zhǔn)確性和模型性能方面非常有效,特別是在面對(duì)高度個(gè)性化和變化多端的體壓數(shù)據(jù)時(shí)。
2" 基于稀疏傳感器的人體識(shí)別模型
2.1" 基于稀疏壓力傳感器設(shè)計(jì)的數(shù)據(jù)采集設(shè)備
由于人們對(duì)于睡眠過程中的隱私性、感光性、非入侵性十分看重,為此設(shè)計(jì)了一種新型智能床墊,能夠在實(shí)驗(yàn)人員完全感知不到傳感器存在的情況下,完成對(duì)實(shí)驗(yàn)人員軀干的4個(gè)主要部位:肩、腰、臀、腿的實(shí)時(shí)壓力數(shù)據(jù)采集,真正做到了非入侵式的數(shù)據(jù)采集。圖3b)相比于文獻(xiàn)[15](見圖3a))采用1 024個(gè)有效電容傳感單元與文獻(xiàn)[16]使用傳感器陣列式布局,整個(gè)傳感器分布著2 048個(gè)電容傳感單元的高密度矩陣排列的薄膜壓力傳感器數(shù)據(jù)采集設(shè)備。本文設(shè)計(jì)了一種基于氣囊壓力的數(shù)據(jù)采集設(shè)備,僅使用單邊4個(gè)氣囊配合壓力傳感器,便可完成對(duì)實(shí)驗(yàn)數(shù)據(jù)的采集。該方法降低了傳感器排列密度,做到了稀疏排列的傳感器設(shè)計(jì),極大地降低了數(shù)據(jù)采集成本。
2.2" CNN?Bi?LSTM模型整體框架
在原始傳感器數(shù)據(jù)處理階段,采用的訓(xùn)練與分類的原始數(shù)據(jù)集主要來源于實(shí)驗(yàn)人員在稀疏壓力傳感器設(shè)備上進(jìn)行的各種動(dòng)態(tài)與靜態(tài)行為的壓力數(shù)據(jù)。算法模型構(gòu)建階段旨在解決傳統(tǒng)串聯(lián)模式在空間和時(shí)序特征提取中可能遇到的特征丟失問題。通過結(jié)合CNN和Bi?LSTM,并采用并聯(lián)融合策略,本文模型不僅優(yōu)化了特征提取流程,還顯著提升了人員識(shí)別系統(tǒng)的性能。CNN層負(fù)責(zé)提取精確的空間特征,Bi?LSTM層負(fù)責(zé)處理時(shí)序依賴信息,通過并聯(lián)策略全面整合這些數(shù)據(jù)。最后,再將注意力機(jī)制層放在特征融合處理后,對(duì)關(guān)鍵信息進(jìn)行篩選,通過對(duì)特征進(jìn)行加權(quán),顯著提高了模型對(duì)關(guān)鍵數(shù)據(jù)的敏感度和識(shí)別準(zhǔn)確性。
該模型結(jié)構(gòu)主要分為以下四個(gè)部分。
1) CNN特征提取層:在本文模型中,CNN特征提取層專門用于從每個(gè)時(shí)間點(diǎn)的傳感器數(shù)據(jù)中提取空間特征。這些特征對(duì)于理解在同一時(shí)間點(diǎn)上不同傳感器之間的空間關(guān)系至關(guān)重要。該層由多個(gè)卷積層和池化層串聯(lián)組成,每個(gè)卷積層后接ReLU激活函數(shù),以增強(qiáng)模型的非線性處理能力和整體穩(wěn)定性。通過這些連續(xù)的卷積和池化操作,模型能夠捕獲與特定行為或事件相關(guān)的關(guān)鍵空間模式,例如在不同傳感器上的壓力分布。這種處理方式有效地將復(fù)雜的空間信息簡(jiǎn)化為更易于處理的形式。CNN層的網(wǎng)絡(luò)結(jié)構(gòu)以及參數(shù)如圖4a)所示,公式表達(dá)如下。
設(shè)[X]為輸入的多維傳感器數(shù)據(jù),每個(gè)時(shí)間點(diǎn)的數(shù)據(jù)都通過CNN處理。
[FCNN(X)=ReLUPoolWConv*X+bConv] (8)
式中:[WConv]和[bConv]分別表示卷積層的權(quán)重和偏置;“[*]”表示卷積操作;[Pool]是池化操作;[ReLU]是激活函數(shù)。
2) Bi?LSTM層:在CNN輸出的基礎(chǔ)上,嵌入雙向LSTM(Bi?LSTM)層,以捕獲時(shí)間依賴性。Bi?LSTM層位于模型的中間部分,設(shè)計(jì)用來處理時(shí)序數(shù)據(jù),提取長(zhǎng)期依賴信息。兩層Bi?LSTM分別嵌入到先前的卷積層輸出中,增強(qiáng)了時(shí)間序列特征的提取能力,并與空間特征并聯(lián)融合。具體的結(jié)構(gòu)和參數(shù)如圖4b)所示。
[FCNN(X)]為CNN層的輸出,[St]表示時(shí)間步[t]的特征向量,Bi?LSTM處理為:
[Ht=Bi?LSTMSt,Ht-1,Ht+1;ΘBi?LSTM] (9)
式中:[Ht-1]和[Ht+1]表示前后時(shí)間步的隱藏狀態(tài);[ΘBi?LSTM]表示Bi?LSTM層的參數(shù)。
3) 多層特征聚合與匯總:將Bi?LSTM的輸出與先前CNN層的輸出進(jìn)行聚合,利用注意力統(tǒng)計(jì)池化層時(shí)間信息和通道信息共同建模,獲得輸入的統(tǒng)計(jì)信息,并通過全連接層降維,得到深度表征來融合并優(yōu)化多層特征。
4) 注意力機(jī)制層:模型在特征合并后,綜合考慮到了空間和時(shí)間維度的信息,為了進(jìn)一步篩選和強(qiáng)調(diào)對(duì)決策最關(guān)鍵的綜合特征。本文選擇使用注意力機(jī)制層來學(xué)習(xí)每個(gè)特征的重要性分布,選擇性地強(qiáng)調(diào)對(duì)最終任務(wù)最為關(guān)鍵的特征,從而優(yōu)化整體的決策過程。注意力機(jī)制層以融合的特征向量為輸入,輸出一個(gè)與特征向量同樣長(zhǎng)度的注意力分?jǐn)?shù)。然后,這些權(quán)重通過softmax函數(shù)進(jìn)行歸一化處理,以確保它們的和為1。最后,這些歸一化的權(quán)重與原始的特征向量進(jìn)行元素乘,得到加權(quán)的特征向量。
并行特征融合與注意力機(jī)制的具體融合操作如下。
[H]為Bi?LSTM層輸出的時(shí)間序列特征,[FCNN]為同一時(shí)間序列的空間特征。
[Fmerged=concat(H,F(xiàn)CNN)] (10)
將注意力權(quán)重計(jì)算和特征進(jìn)行加權(quán)。
[α=softmaxwattFmerged+batt] (11)
[Ffinal=tαt?Fmerged,t] (12)
式中:[watt]和[batt]是注意力層的權(quán)重和偏置;[αt]是時(shí)間步[t]的注意力權(quán)重;“[?]”表示元素乘法,以強(qiáng)化對(duì)關(guān)鍵時(shí)間點(diǎn)特征的識(shí)別。
模型整體框架如圖5所示。
通過這種結(jié)構(gòu)設(shè)計(jì),結(jié)合了注意力機(jī)制的CNN?Bi?LSTM并聯(lián)融合模型在處理稀疏數(shù)據(jù)量的環(huán)境下,不僅優(yōu)化了特征提取過程,還通過并聯(lián)方式有效保持了空間與時(shí)間特征的完整性,從而提高了整體的檢測(cè)效果。這一改進(jìn)對(duì)于人員識(shí)別系統(tǒng)的性能提升具有重要意義。
3" 實(shí)驗(yàn)與結(jié)果分析
3.1" 數(shù)據(jù)集與實(shí)驗(yàn)設(shè)置
3.1.1" 數(shù)據(jù)收集
實(shí)驗(yàn)使用的數(shù)據(jù)集由10名實(shí)驗(yàn)者的數(shù)據(jù)構(gòu)成,其中男性6人、女性4人,身高在165~180 cm之間。使用自主研發(fā)的智慧床墊進(jìn)行數(shù)據(jù)采集,主要由智慧床墊上4個(gè)氣囊的壓力傳感器獲取數(shù)據(jù),具體如表1所示。
3.1.2" 數(shù)據(jù)處理
實(shí)驗(yàn)在采集數(shù)據(jù)時(shí)要求采集者按照日常習(xí)慣完成實(shí)驗(yàn)的采集過程,共分為兩步。
第一步:對(duì)實(shí)驗(yàn)者進(jìn)行正臥、左側(cè)臥、右側(cè)臥以及俯臥4種指定姿勢(shì)的數(shù)據(jù)采集。
第二步:固定實(shí)驗(yàn),讓實(shí)驗(yàn)者根據(jù)自己的日常行為習(xí)慣在氣囊上進(jìn)行隨意的運(yùn)動(dòng)、切換姿勢(shì)、翻滾等多種行為模式,且在采集時(shí)不施加任何約束。通過兩步的實(shí)驗(yàn)數(shù)據(jù)收集,初步采取到了實(shí)驗(yàn)者的體壓空間特征和體壓時(shí)序特征,由此,進(jìn)一步得到了實(shí)驗(yàn)者的生理體壓特征和行為體壓特征。
數(shù)據(jù)采集設(shè)備拆解圖如圖6所示。
數(shù)據(jù)采集過程如下:
1) 對(duì)收集的數(shù)據(jù)進(jìn)行預(yù)處理,步驟包括對(duì)氣囊壓力數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和歸一化處理,以確保數(shù)據(jù)質(zhì)量和可比性。
2) 提取出三種直觀有效的特征,通過計(jì)算每個(gè)氣囊的平均壓力值和標(biāo)準(zhǔn)差,以評(píng)估氣囊壓力的分布均勻度。平均壓力值反映了實(shí)驗(yàn)者在各個(gè)氣囊上的平均壓力水平,而標(biāo)準(zhǔn)差則反映了壓力分布的離散程度。較小的標(biāo)準(zhǔn)差表示氣囊壓力分布較為均勻,而較大的標(biāo)準(zhǔn)差則表示壓力分布較為不均勻。本文使用壓力分布均勻度來稱呼這一特征并使用各氣囊壓力值的變異系數(shù)來表達(dá)這一特征,公式如下:
[Cov=i=1N(xi-μ)2Ni=1NXi*N] (13)
3) 在對(duì)氣囊壓力數(shù)據(jù)進(jìn)行預(yù)處理后,識(shí)別壓力曲線中的峰值和谷值,并計(jì)算它們之間的時(shí)間間隔和頻率。峰值和谷值的頻率和間隔反映了實(shí)驗(yàn)者體壓變化的節(jié)奏和規(guī)律性。較高的頻率和較短的間隔表明實(shí)驗(yàn)者體壓變化較為頻繁和規(guī)律,而較低的頻率和較長(zhǎng)的間隔則反映了體壓變化的緩慢和不規(guī)律。頻繁的峰值和谷值可能表明頻繁的移動(dòng)或調(diào)整姿勢(shì),使用壓力峰谷值頻率來稱呼這一特征。
4) 計(jì)算氣囊壓力曲線的最大值和最小值,并計(jì)算它們之間的差值,即壓力變化的幅度。較大的壓力變化幅度表示實(shí)驗(yàn)者體壓變化較大,而較小的壓力變化幅度則反映了體壓變化較小。使用氣囊壓力變化的幅度來稱呼這一特征。
5) 再結(jié)合設(shè)備收集到的氣囊壓力值的波動(dòng)情況(單個(gè)氣囊壓力、平均壓力與極限壓力差以及單個(gè)氣囊壓力值、氣囊總壓力值)等特征,輸入到本文模型中進(jìn)行實(shí)驗(yàn)。床墊傳感器記錄的壓力數(shù)據(jù)采用標(biāo)準(zhǔn)的壓力單位帕斯卡(Pascal),時(shí)間數(shù)據(jù)以秒為單位進(jìn)行記錄。對(duì)于每個(gè)樣本數(shù)據(jù),標(biāo)注了實(shí)驗(yàn)者的睡眠姿勢(shì)作為樣本的標(biāo)簽,以便神經(jīng)網(wǎng)絡(luò)模型進(jìn)行監(jiān)督學(xué)習(xí)。數(shù)據(jù)采集過程如圖7所示。
為了驗(yàn)證本文提出的結(jié)合注意力機(jī)制和Bi?LSTM模型對(duì)基于體壓特征進(jìn)行人員識(shí)別模型的最終現(xiàn)實(shí)效果,在實(shí)驗(yàn)開始前,對(duì)所采集到的數(shù)據(jù)集進(jìn)行了滑動(dòng)窗口化采樣、標(biāo)準(zhǔn)化等預(yù)處理,最終得到4 717個(gè)數(shù)據(jù)樣本。實(shí)驗(yàn)將數(shù)據(jù)集按照8∶2的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集。最后根據(jù)劃分好的數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練和測(cè)試。
3.1.3" 實(shí)驗(yàn)環(huán)境
本文提出的模型在下述實(shí)驗(yàn)平臺(tái)進(jìn)行:操作系統(tǒng)為64位Windows 10 操作系統(tǒng),CPU處理器為Intel? CoreTM i5?5600 CPU@3.60 GHz,GPU顯卡為NVIDIA RTX 2060 Super GP基于TensorFlow 2.5.0框架實(shí)現(xiàn)。批次大小選擇32,損失函數(shù)為Categorical Crossentropy,優(yōu)化器為Adam,初始學(xué)習(xí)率設(shè)置為0.001,總訓(xùn)練回合數(shù)為300 Epochs。
3.2" 評(píng)估策略
該算法使用的是分類識(shí)別中常用的評(píng)價(jià)指標(biāo),為準(zhǔn)確率(Precision)、召回率(Recall)和[F1]分?jǐn)?shù)([F1]?score)。
[Precision=TPTP+FP×100%] (14)
[Recall=TPTP+FN×100%] (15)
[F1?score=2×Precision×RecallPrecision+Recall×100%] (16)
這些指標(biāo)是評(píng)估分類模型性能時(shí)常用的重要度量。通常情況下,希望模型的準(zhǔn)確率和召回率都越高越好,而[F1]值則綜合考慮了這兩者的表現(xiàn)。
3.3" 實(shí)驗(yàn)對(duì)比分析
為了驗(yàn)證本文算法(CNN?Bi?LSTM)的優(yōu)越性,以及模型中每個(gè)模塊的作用,本文完成建模后, 使用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,然后使用測(cè)試集進(jìn)行驗(yàn)證。使用LSTM、Bi?LSTM進(jìn)行相同的實(shí)驗(yàn)進(jìn)行驗(yàn)證,結(jié)果如表2所示。
模型的優(yōu)劣可以通過識(shí)別率和損失函數(shù)這兩個(gè)關(guān)鍵參數(shù)進(jìn)行評(píng)判。當(dāng)一個(gè)模型能夠在提高識(shí)別率的同時(shí)降低損失函數(shù)值,那么這樣的模型就被視為更為優(yōu)越。因此,識(shí)別率的提升與損失函數(shù)的降低是評(píng)判模型性能好壞的重要標(biāo)志。
消融實(shí)驗(yàn)訓(xùn)練過程如圖8所示。
如圖8a)所示,本文模型(CNN?Bi?LSTM)在迭代50個(gè)周期后,識(shí)別準(zhǔn)確率的變化曲線進(jìn)入了收斂狀態(tài),測(cè)試集上的準(zhǔn)確率達(dá)到了93.86%。在測(cè)試集上交叉熵?fù)p失函數(shù)值達(dá)到了16.06%。
由表2與圖8b)、圖8c)可知:Bi?LSTM相比于LSTM在準(zhǔn)確率上高了0.11%,模型收斂速度更快,Bi?LSTM模型在第50個(gè)周期之前已經(jīng)基本達(dá)到收斂狀態(tài),而LSTM的收斂速度則明顯慢于Bi?LSTM,由此可知,Bi?LSTM模型的性能要強(qiáng)于LSTM;再將CNN?Bi?LSTM與Bi?LSTM進(jìn)行對(duì)比可以看出,CNN?Bi?LSTM模型在準(zhǔn)確率上比Bi?LSTM模型高出了1.58%。CNN?Bi?LSTM模型比Bi?LSTM模型總體上要好的原因是,CNN?Bi?LSTM模型引入了注意力機(jī)制,成功捕捉到了核心實(shí)體之間的依賴關(guān)系,注意力機(jī)制模塊還能高效地分配注意力,將注意力放到更有價(jià)值的信息上,由此更加合理高效地分配資源,最后獲取信息,相關(guān)度越強(qiáng),價(jià)值越高,實(shí)驗(yàn)結(jié)果越好。
實(shí)驗(yàn)結(jié)果印證了本文對(duì)體壓特征提取和人員識(shí)別方法的論述,將CNN?Bi?LSTM融合模型與注意力機(jī)制有效結(jié)合,與其他算法對(duì)比實(shí)現(xiàn)了真實(shí)場(chǎng)景下的高正確率人員識(shí)別,因而在人員識(shí)別領(lǐng)域具有一定的參考價(jià)值。
為了驗(yàn)證方法的有效性,所有模型使用統(tǒng)一的評(píng)估標(biāo)準(zhǔn),包括準(zhǔn)確率、召回率和[F1]分?jǐn)?shù)。
本文將提出的模型和近幾年來的幾種主流的方法進(jìn)行了對(duì)比實(shí)驗(yàn),結(jié)果如表3所示。
對(duì)比模型的詳細(xì)參數(shù)如表4所示。
4" 結(jié)" 語
本文實(shí)現(xiàn)了一種在特定場(chǎng)景下通過體壓特征來識(shí)別人員的方法,通過稀疏傳感器的排列方式在保護(hù)隱私的同時(shí)降低了成本。將采集數(shù)據(jù)應(yīng)用到CNN與Bi?LSTM進(jìn)行并行融合再結(jié)合注意力機(jī)制的人員識(shí)別模型中,通過對(duì)模型各參數(shù)進(jìn)行有效的組合優(yōu)化以及調(diào)整,最后通過實(shí)驗(yàn)得出,不論是在對(duì)比實(shí)驗(yàn)中與其他常用算法進(jìn)行對(duì)比,還是在消融實(shí)驗(yàn)中與模型各部分相比,本文模型的準(zhǔn)確度都有一定的增長(zhǎng)。在LSTM與Bi?LSTM、CNN等模型進(jìn)行消融實(shí)驗(yàn)得出本文模型對(duì)人員識(shí)別的效果最好,平均識(shí)別準(zhǔn)確率達(dá)到了93.86%。
下一步的研究,擬通過強(qiáng)化學(xué)習(xí)的方法,提升場(chǎng)景感知能力,創(chuàng)建一個(gè)能夠適應(yīng)不同環(huán)境和情況的模型,以滿足更廣泛的需求。
注:本文通訊作者為李長(zhǎng)云。
參考文獻(xiàn)
[1] 李一.計(jì)算機(jī)信息安全管理中的生物識(shí)別技術(shù)分析:評(píng)《生物特征識(shí)別技術(shù)及應(yīng)用》[J].中國油脂,2023,48(10):156?157.
[2] IMAOKA H, HASHIMOTO H, TAKAHASHI K, et al. The future of biometrics technology: From face recognition to related applications [J]. APSIPA transactions on signal and information processing, 2021, 10: 18937.
[3] 余璀璨,李慧斌.基于深度學(xué)習(xí)的人臉識(shí)別方法綜述[J].工程數(shù)學(xué)學(xué)報(bào),2021,38(4):451?469.
[4] 葉得學(xué),韓如冰,顏魯合.基于輕量級(jí)DenseNet和ZigBee的指紋識(shí)別方法[J].湖南科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,38(4):78?87.
[5] 孫潔,趙世鵬,苗盛,等.基于距離特征和聚類損失的深度學(xué)習(xí)虹膜識(shí)別[J].計(jì)算機(jī)仿真,2023,40(8):245?248.
[6] 王全坤,郭冰菁,尤愛民,等.基于SVM的偏癱患者異常步態(tài)識(shí)別與臨床康復(fù)輔助診斷系統(tǒng)[J].計(jì)算機(jī)應(yīng)用與軟件,2023,40(10):94?100.
[7] 王會(huì)勇,唐士杰,丁勇,等.生物特征識(shí)別模板保護(hù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2020,57(5):1003?1021.
[8] NAKAJIMA K, MIZUKAMI Y, TANAKA K. Footprint?based personal recognition [J]. IEEE transactions on biomedical engineering, 2000, 47(11): 1534?1537.
[9] QIAN G, ZHANG J Q, KIDANé A. People identification using floor pressure sensing and analysis [J]. IEEE sensors journal, 2010, 10(9): 1447?1460.
[10] SUUTALA J, R?NING J. Methods for person identification on a pressure?sensitive floor: Experiments with multiple classifiers and reject option [J]. Information fusion, 2008, 9(1): 21?40.
[11] KONINGS D, ALAM F, FAULKNER N, et al. Identity and gender recognition using a capacitive sensing floor and neural networks [J]. Sensors, 2022, 22(19): 7206.
[12] HOCHREITER S, SCHMIDHUBER J. Long short?term memory [J]. Neural computation, 1997, 9(8): 1735?1780.
[13] YU Y, SI X S, HU C H, et al. A review of recurrent neural networks: LSTM cells and network architectures [J]. Neural computation, 2019, 31(7): 1235?1270.
[14] 武維,李澤平,楊華蔚,等.融合內(nèi)容特征和時(shí)序信息的深度注意力視頻流行度預(yù)測(cè)模型[J].計(jì)算機(jī)應(yīng)用,2021,41(7):1878?1884.
[15] 劉今越,周志文,賈曉輝,等.基于柔性壓力傳感器的睡姿識(shí)別方法研究[J].傳感器與微系統(tǒng),2021,40(9):10?13.
[16] 趙海文,王佳闊,齊德瑄,等.基于壓力感知的坐臥姿勢(shì)識(shí)別方法研究[J].傳感器與微系統(tǒng),2023,42(1):30?33.