馬詩(shī)洋, 王 宇, 王鵬飛, 李君嬋,白 清, 劉 昕, 靳寶全,2
(1.太原理工大學(xué)物理與光電工程學(xué)院新型傳感器與智能控制教育部與山西省重點(diǎn)實(shí)驗(yàn)室,山西 太原 030024; 2.煤與煤層氣共采國(guó)家重點(diǎn)實(shí)驗(yàn)室,山西 晉城 048012)
分布式光纖振動(dòng)傳感系統(tǒng)因具有靈敏度高,抗電磁干擾以及傳感距離長(zhǎng)等優(yōu)點(diǎn)[1~4],被廣泛應(yīng)用于周界安防、軌道交通、管道輸送及目標(biāo)識(shí)別等眾多領(lǐng)域[5~7]。傳感光纖通常會(huì)受到敷設(shè)環(huán)境的影響,如刮風(fēng)下雨、動(dòng)物活動(dòng)及行人誤碰等,使得傳感系統(tǒng)產(chǎn)生誤報(bào),不利于監(jiān)控人員對(duì)入侵事件進(jìn)行準(zhǔn)確判斷與識(shí)別。
為此,國(guó)內(nèi)外相關(guān)學(xué)者圍繞光纖傳感系統(tǒng)中振動(dòng)信號(hào)的準(zhǔn)確識(shí)別問題開展了深入研究。2013年,謝鑫等[8]提出了自適應(yīng)動(dòng)態(tài)閾值的特征提取算法,將特征向量放入3層誤差反向傳播(BP)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。文獻(xiàn)[9]中,王思遠(yuǎn)等利用人工神經(jīng)網(wǎng)絡(luò)(ANN),對(duì)從原始信號(hào)提取的時(shí)間特性進(jìn)行分類訓(xùn)練。孫茜等[10]基于圖像處理中的形態(tài)學(xué)變換提取時(shí)空二維特征信號(hào),并用相關(guān)向量機(jī)進(jìn)行模式識(shí)別;蔣立輝等[11]在經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)中加入白噪聲進(jìn)行特征提取后,放入雙重支持向量機(jī)中分類。文獻(xiàn)[12]中,Tejedor等針對(duì)管道威脅入侵檢測(cè),利用短時(shí)快速傅立葉變換提取特征,并與高斯混合模型相結(jié)合,對(duì)管道進(jìn)行監(jiān)控與危險(xiǎn)源識(shí)別。沈隆翔等[13]對(duì)振動(dòng)信號(hào)波形圖進(jìn)行圖像識(shí)別處理,利用反向傳播神經(jīng)網(wǎng)絡(luò)作為分類器進(jìn)行分類。王艷歌等[14]通過希爾伯特-黃變換構(gòu)造特征向量,經(jīng)概率神經(jīng)網(wǎng)絡(luò)(PNN)訓(xùn)練實(shí)現(xiàn)分類;陳沛超等[15]基于短時(shí)傅里葉變換獲取信號(hào)的時(shí)頻圖,之后采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)特征向量進(jìn)行分類處理;張艾倫[16]基于概率神經(jīng)網(wǎng)絡(luò)對(duì)入侵振動(dòng)事件進(jìn)行分類處理;張沫等[17]利用圖像處理提取特征向量,將支持向量機(jī)與遺傳算法優(yōu)化結(jié)合來進(jìn)行分類訓(xùn)練。張金鳳等[18]將商空間與支持向量機(jī)結(jié)合,搭建了智能診斷模型。由此可以看出將模式識(shí)別技術(shù)引入光纖振動(dòng)傳感系統(tǒng)中可以進(jìn)行振動(dòng)事件識(shí)別。
由于傳感光纖敷設(shè)環(huán)境復(fù)雜,傳統(tǒng)單一的時(shí)域或頻域特征提取手段易受沿線環(huán)境因素干擾,難以對(duì)沖擊性、突變性、頻率分量復(fù)雜的非平穩(wěn)性振動(dòng)信號(hào)進(jìn)行精確識(shí)別。為此,本文在分布式光纖振動(dòng)傳感系統(tǒng)中引入了小波能量譜特征提取方法,根據(jù)振動(dòng)信號(hào)的頻率特性引入合適的小波基函數(shù),將原始信號(hào)分解為高頻部分與低頻部分。采用了核函數(shù)構(gòu)造簡(jiǎn)單、泛化能力高、訓(xùn)練速度快且對(duì)小樣本數(shù)據(jù)分類準(zhǔn)確性高的支持向量機(jī),利用“一對(duì)一法”的多分類策略實(shí)現(xiàn)了對(duì)振動(dòng)信號(hào)的識(shí)別,并在實(shí)驗(yàn)室環(huán)境中模擬了天氣、土壤等因素對(duì)光纖傳感系統(tǒng)的影響,對(duì)敲擊、行走和慢跑3類典型入侵事件的識(shí)別結(jié)果進(jìn)行了性能評(píng)估。
振動(dòng)信號(hào)的頻率分布隨時(shí)間的改變而改變,即為非平穩(wěn)信號(hào),在非平穩(wěn)振動(dòng)信號(hào)的時(shí)域或頻域分析當(dāng)中,傳統(tǒng)傅里葉變化具有一定局限性,而小波分析以小波基為基函數(shù),對(duì)信號(hào)分解后可以在較短時(shí)間范圍內(nèi)觀察到頻率的變化[19]。
通過小波變換,信號(hào)被分解到各個(gè)頻率部分,其中,高頻段的信號(hào)時(shí)間分辨率較高,低頻段的信號(hào)頻率分辨率較高[20,21]。
本文基于多分辨率分析,即利用正交小波基將原始信號(hào)f(t)分為近似分量A(t)與細(xì)節(jié)分量D(t):
f(t)=A(t)+D(t)
(1)
近似分量A(t)滿足:
(2)
細(xì)節(jié)分量D(t)滿足:
(3)
由式(2)和式(3)可知,下一層的近似系數(shù)aj+1,k和細(xì)節(jié)系數(shù)dj+1,k是由上一級(jí)系數(shù)經(jīng)濾波器后求得。圖1顯示了小波分解與能量譜重構(gòu)過程,以3層分解為例。
圖1 3層小波分解與重構(gòu)Fig.1 3 layers decomposition and reconstruction of wavelet energy spectrum
經(jīng)過小波分解后,原始信號(hào)被分解為各個(gè)頻段內(nèi)的信號(hào),再采用能量值作為原始信號(hào)的特征向量,對(duì)各個(gè)頻段內(nèi)信號(hào)的能量逐次求解,并按順序組合后作為一個(gè)特征向量。設(shè)重構(gòu)系數(shù)長(zhǎng)度為N,則重構(gòu)系數(shù)Ej在j分解層下的能量值以及重構(gòu)系數(shù)EJ+1對(duì)應(yīng)的最后一個(gè)能量值為
(4)
(5)
對(duì)能量值求解組合后,可得特征信號(hào)的能量譜E為
E=[E1,E2,…,EJ+1]
(6)
能量譜E即為特征向量,為使分類模型的參數(shù)容易收斂,再對(duì)特征向量E進(jìn)行歸一化處理,如下式:
(7)
在樣本數(shù)量較小時(shí),通常使用支持向量機(jī)(support vector machine,SVM)對(duì)樣本類別進(jìn)行分類[22]。在本實(shí)驗(yàn)條件下,訓(xùn)練樣本包含3類事件,需利用SVM的多分類策略對(duì)振動(dòng)事件進(jìn)行分類[23],常使用的方法為“一對(duì)多法”與“一對(duì)一法”。
“一對(duì)一法”的基本原理是:將N個(gè)類別的每?jī)蓚€(gè)組合構(gòu)造一個(gè)分類器,因此一共需構(gòu)造K=N(N-1)/2個(gè)分類器,將待測(cè)樣本依次放入每個(gè)分類器中進(jìn)行分類,結(jié)果為“+”時(shí),相應(yīng)的類別票數(shù)加“一”,反之亦然,分類結(jié)束后統(tǒng)計(jì)各個(gè)類別的票數(shù)和,得票最多的即為待測(cè)樣本的類別?!耙粚?duì)一法”SVM多分類流程如圖2所示。
圖2 “一對(duì)一法”SVM多分類流程圖Fig.2 “One to one method” SVM multi-class flowchart
“一對(duì)一法”優(yōu)勢(shì)為每個(gè)分類器只包含2個(gè)類別,分類速度快且準(zhǔn)確率較高,且結(jié)合本實(shí)驗(yàn)條件,所采集的振動(dòng)事件只有3類事件,需構(gòu)建的分類器數(shù)量少,對(duì)樣本訓(xùn)練分類時(shí)花費(fèi)時(shí)間短,故本文采用該法進(jìn)行分類。
采用“一對(duì)一法”時(shí),針對(duì)第u類事件和第v類事件之間的分類訓(xùn)練器,通過求解式(8)優(yōu)化問題:
(8)
式(8)滿足以下約束條件:
(9)
式中:xi為特征向量;buv為實(shí)數(shù);yi為事件類別。
“一對(duì)一法”的決策函數(shù)為:
f(x)=sign(ωuvxi+buv)
(10)
式中:sign(*)為符號(hào)函數(shù),當(dāng)ωuvxi+buv>0時(shí),f(x)=1;當(dāng)ωuvxi+buv<0時(shí),f(x)=-1。
通過構(gòu)造N(N-1)/2個(gè)決策函數(shù),來判斷測(cè)試樣本所屬的類別。
本文對(duì)SVM機(jī)器學(xué)習(xí)分類結(jié)果的評(píng)估,引入性能度量來評(píng)估分類器的性能,分別計(jì)算其準(zhǔn)確率Ai、精確率Pi、召回率Ri、以及F值。
列有以下計(jì)算式:
(11)
(12)
(13)
(14)
式中:TP為真正例;TN為假反例;FP為假正例;FN為真反例;N為樣本總數(shù)。
為了使實(shí)驗(yàn)分類和性能度量結(jié)果清晰直觀,本文利用混淆矩陣對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行呈現(xiàn),樣本類別的混淆矩陣與性能度量如圖3所示。
圖3 樣本類別的混淆矩陣與性能度量Fig.3 Sample category comfusion matrix and performance measurement
在模式識(shí)別的性能評(píng)估時(shí),必須確保2個(gè)數(shù)據(jù)集相互獨(dú)立,即測(cè)試樣本和訓(xùn)練樣本相互獨(dú)立,同時(shí),還要保證訓(xùn)練樣本的數(shù)據(jù)量足夠大,來使得所有模式特征均被覆蓋,使得特征庫(kù)具有穩(wěn)定性和可靠性。
在訓(xùn)練時(shí),不可避免地會(huì)出現(xiàn)過擬合的問題,即SVM分類器可以準(zhǔn)確匹配訓(xùn)練樣本,但無法準(zhǔn)確預(yù)測(cè)訓(xùn)練樣本外的樣本點(diǎn),如果利用測(cè)試樣本去調(diào)整SVM模型訓(xùn)練參數(shù),會(huì)影響最終分類結(jié)果。針對(duì)此問題,通常從訓(xùn)練樣本中拿出一部分?jǐn)?shù)據(jù)作為驗(yàn)證樣本,放入SVM模型中對(duì)模型性能進(jìn)行評(píng)估,該方法稱為k折交叉檢驗(yàn)法(k-fold cross-validation)[24]。
k折交叉驗(yàn)證法的具體步驟為將訓(xùn)練集等分為k個(gè)子樣本,選取其中一個(gè)作為驗(yàn)證集,剩下的k-1個(gè)樣本作為訓(xùn)練集,SVM模型訓(xùn)練完成后放入驗(yàn)證樣本得到一個(gè)評(píng)估結(jié)果,反復(fù)進(jìn)行k次,則得到k個(gè)評(píng)估結(jié)果。
(15)
(16)
(17)
(18)
基于相干探測(cè)的相位敏感光時(shí)域反射儀(coherent detection phase-sensitive ptical time-domain reflectometer,COTDR)搭建光纖傳感系統(tǒng),如圖4所示。
圖4 COTDR系統(tǒng)裝置圖Fig.4 COTDR system installation diagram
當(dāng)傳感光纖受到干擾時(shí),光纖的折射率和散射點(diǎn)位置發(fā)生改變,導(dǎo)致瑞利后向散射光相位的變化,因此通過檢測(cè)后向瑞利散射光干涉信號(hào),可實(shí)現(xiàn)振動(dòng)信號(hào)的定位與還原。超窄線寬激光器中發(fā)出的光信號(hào)被1:99耦合器分為兩路光,其中,99%的傳感光通過聲光調(diào)制器(AOM)進(jìn)行調(diào)制,再經(jīng)過摻鉺光纖放大器(EDFA)被放大為光脈沖后,從環(huán)形器進(jìn)入傳感光纖。傳感光纖中的后向瑞利散射光與1%的本振光在2*2耦合器匯聚后進(jìn)入光電探測(cè)器,將光信號(hào)轉(zhuǎn)為電信號(hào)后被采樣率為50 MHz/s的高速采集卡采集并上傳到上位機(jī)。實(shí)驗(yàn)中傳感光纖長(zhǎng)度設(shè)定為10 km,探測(cè)脈沖的重復(fù)頻率為8 kHz,脈沖寬度為200 ns。
基于COTDR系統(tǒng),設(shè)計(jì)了模式識(shí)別方案并驗(yàn)證其可行性。實(shí)驗(yàn)中分別對(duì)沿光纖行走、敲擊光纖、沿光纖慢跑3類振動(dòng)事件進(jìn)行模式識(shí)別。
同時(shí),為了保證模式識(shí)別在實(shí)際應(yīng)用中的有效性,加入了實(shí)際環(huán)境中的天氣、土壤等因素,在實(shí)驗(yàn)室模擬實(shí)際環(huán)境進(jìn)行實(shí)驗(yàn)。依次在傳感光纖的2,5,8 km處,對(duì)每類振動(dòng)事件分別進(jìn)行40次實(shí)驗(yàn),且每次實(shí)驗(yàn)采集事件定為4 s。此外,進(jìn)行了對(duì)實(shí)際環(huán)境的模擬來確保模式識(shí)別在實(shí)際應(yīng)用的有效性??紤]了傳感光纖實(shí)際敷設(shè)環(huán)境和天氣因素的影響,分別將光纖放置在大理石板、干燥土壤和潮濕土壤3種不同環(huán)境中,來模擬3種實(shí)際環(huán)境中的實(shí)驗(yàn)條件。
首先,單獨(dú)在大理石板上進(jìn)行了3類事件的振動(dòng)信號(hào)采集實(shí)驗(yàn),共采集到360個(gè)樣本(3個(gè)位置×3類事件×40次重復(fù))。此外,每一類振動(dòng)事件均包含120個(gè)振動(dòng)樣本,且每一個(gè)振動(dòng)樣本包含32 000個(gè)數(shù)據(jù)采樣點(diǎn),因此對(duì)采集到的振動(dòng)樣本進(jìn)行整理后,可以得到360×32 000的二維矩陣,用于后續(xù)的小波分解特征提取。3類振動(dòng)事件的時(shí)域波形如圖5所示。
圖5 3類振動(dòng)事件時(shí)域波形圖Fig.5 Time-domain waveforms of three types of vibration events
得到3類事件的振動(dòng)樣本后,考慮綜合信號(hào)固有特性,采用Daubechies3正交小波基對(duì)原始信號(hào)進(jìn)行分解,共得到360個(gè)振動(dòng)樣本的特征向量。因小波分解的層數(shù)對(duì)特征向量的好壞有著重要的影響,從而還需對(duì)360個(gè)振動(dòng)樣本在不同分解層下提取特征向量。因此,將不同分解層數(shù)下提取的特征向量分別放入SVM分類器中進(jìn)行訓(xùn)練后,通過10折交叉驗(yàn)證來觀察分類準(zhǔn)確率的變化。不同小波分解層數(shù)下的10層交叉驗(yàn)證如圖6所示,分解層從1層至10層,交叉驗(yàn)證折數(shù)從1折至10折,且不同層數(shù)的分類準(zhǔn)確率由不同線條表示。
圖6 不同小波分解層數(shù)下的10層交叉驗(yàn)證Fig.6 Ten-layer cross-validation under different wavelet decomposition layers
圖7 不同分解層下的平均分類準(zhǔn)確率Fig.7 Average classification accuracy under different wavelet decomposition layers
設(shè)定小波分解層為5層后,對(duì)振動(dòng)樣本進(jìn)行特征提取,以信號(hào)能量值為特征值,對(duì)各頻帶的信號(hào)求取能量值后并作歸一化處理得到3類事件的特征向量,3類事件的歸一化能量分布如圖8所示。其中,行走事件(藍(lán)色線)和慢跑事件(黑色線)的能量分布較為相似,因其都含有步行過程,而敲擊事件(紅色線)的能量E分布明顯不同于與其他兩類事件。
圖8 3類事件的歸一化能量分布Fig.8 The average normalized energy distribution of three types of events
最后加入干燥土壤和潮濕土壤實(shí)驗(yàn)條件,共采集到1 080個(gè)樣本(3個(gè)環(huán)境×3個(gè)位置×3類事件×40次重復(fù)),由小波分解提取特征向量后將其放入SVM模型中進(jìn)行分類,輸出其中一折最優(yōu)懲罰因子對(duì)應(yīng)下的分類結(jié)果,如圖9所示。
圖9 最優(yōu)懲罰因子下SVM分類結(jié)果及性能度量Fig.9 SVM classification results and performance metrics under optimal penalty factors
由圖9可知,混淆矩陣中主對(duì)角線表示類別的正確分類,由正確分類數(shù)可以得到一次交叉驗(yàn)證后SVM分類Ai為89.8%。其中行走,敲擊,慢跑3類事件的F值分別為86.1%,97.3%,85.7%。
完成全部的10折交叉驗(yàn)證后可以得到10組混淆矩陣。圖10的折線圖反映了3類事件下的Pi、Ri、F值隨折數(shù)的變化規(guī)律。其中,圖10(a)、10(b)、10(c)分別為沿光纖行走、敲擊光纖和沿光纖慢跑3類事件性能度量的變化趨勢(shì),圖10(d)代表了每次交叉驗(yàn)證后的分類Ai。
圖10 3類振動(dòng)事件10折交叉驗(yàn)證后的性能度量Fig.10 Performance measurement of three types of vibration events under ten-fold cross-validation
最后結(jié)合式(15)~式(18)可以對(duì)10組性能度量求平均來得出3類事件的宏觀指標(biāo),見表1。
表1 3類事件的平均性能度量Tab.1 Average performance metrics of three types of events (%)
在實(shí)驗(yàn)中考慮實(shí)際環(huán)境的條件,采用小波能量譜和支持向量機(jī)的模式Ai達(dá)到了84.9%。其中,敲擊事件F值為96.7%,可知敲擊事件很難與其他2類事件混淆,而行走和慢跑事件因振動(dòng)類型相似,所以F值較低。
本文針對(duì)分布式光纖振動(dòng)傳感系統(tǒng)中誤報(bào)率高的問題,將小波分解與支持向量機(jī)結(jié)合,提出一種新型模式識(shí)別方法。鑒于光纖敷設(shè)環(huán)境對(duì)振動(dòng)信號(hào)的影響,在實(shí)驗(yàn)室中模擬了3種實(shí)際環(huán)境,并在傳感光纖不同位置處對(duì)3種振動(dòng)類型分別進(jìn)行重復(fù)實(shí)驗(yàn)以獲取較多樣本數(shù)據(jù)。此外,對(duì)采集到的振動(dòng)數(shù)據(jù)進(jìn)行不同層數(shù)的小波分解來確定最優(yōu)分解層數(shù),獲取特征向量后將其放入支持向量機(jī)中進(jìn)行分類訓(xùn)練,并在最優(yōu)參數(shù)下輸出分類結(jié)果。通過性能度量來對(duì)SVM分類模型性能進(jìn)行評(píng)估。最后,對(duì)樣本數(shù)據(jù)進(jìn)行10折交叉驗(yàn)證,實(shí)現(xiàn)了84.9%的振動(dòng)事件分類準(zhǔn)確率。