吳世海,任梓豪,何抒航,賈建華,孟雨盈,孔 勇
(上海工程技術(shù)大學(xué) 電子電氣工程學(xué)院,上海 201620)
由于相位敏感光時(shí)域反射計(jì)(φ-OTDR)[1-2]具有高靈敏度、高空間分辨率、監(jiān)控距離長(zhǎng)的優(yōu)勢(shì),可以準(zhǔn)確的定位振動(dòng)事件位置。所以,φ-OTDR分布式聲傳感器已被廣泛應(yīng)用于油氣管道安全檢測(cè)[3]、高速軌道的入侵檢測(cè)[4]、周界安防[5]等領(lǐng)域。但是,在這些領(lǐng)域?qū)τ谧R(shí)別實(shí)際環(huán)境下的振動(dòng)事件還是非常具有挑戰(zhàn)性的任務(wù)。
對(duì)振動(dòng)信號(hào)的識(shí)別主要分為3個(gè)步驟:振動(dòng)信號(hào)的預(yù)處理、振動(dòng)信號(hào)的特征提取、對(duì)振動(dòng)信號(hào)進(jìn)行分類。振動(dòng)信號(hào)的預(yù)處理主要是對(duì)信號(hào)進(jìn)行去噪,劃分?jǐn)?shù)據(jù)集;特征提取需要通過不同方式來獲取不同類型的振動(dòng)信號(hào)特征。提取到的特征應(yīng)能很好的表達(dá)振動(dòng)信號(hào)具有的性質(zhì),不同特征之間的搭配也會(huì)形成不同的分類效果。提取的典型特征有短時(shí)過零率、短時(shí)能量、梅爾頻率倒頻系數(shù)(MFCC)[6-8]。除了直接提取特征外,還可以使用EMD、VMD分解算法將信號(hào)分解后再提取信號(hào)的相關(guān)特征[9-10]。根據(jù)提取的振動(dòng)信號(hào)的特征使用分類器進(jìn)行分類。典型的分類器有支持向量機(jī)(SVM)[11]、相關(guān)向量機(jī)(RVM)[12]、高斯混合模型[13]和隨機(jī)森林樹[14]。然而在使用分布式光纖傳感系統(tǒng)進(jìn)行長(zhǎng)距離監(jiān)測(cè)時(shí),數(shù)據(jù)量會(huì)隨監(jiān)測(cè)長(zhǎng)度的增加而增加,但上訴方式在處理大量數(shù)據(jù)時(shí)會(huì)非常耗費(fèi)時(shí)間。對(duì)于振動(dòng)信號(hào)特征的選擇也是一件很困難的事情,對(duì)于不同類型的振動(dòng)事件使用相同的特征可能會(huì)出現(xiàn)識(shí)別效果不理想的情況。
隨著深度學(xué)習(xí)算法在圖像識(shí)別[15]、情緒識(shí)別[16]、故障診斷[17]中的應(yīng)用,深度學(xué)習(xí)算法也開始被應(yīng)用到對(duì)分布式聲傳感器振動(dòng)信號(hào)的識(shí)別中。文獻(xiàn)[18]中提出,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到分布式光纖聲傳感系統(tǒng)中,去識(shí)別電纜的放電現(xiàn)象。使用的方式為:使用梅爾頻率倒譜算法,將采集到的電纜一維振動(dòng)信號(hào)轉(zhuǎn)為二維的MFCC后,根據(jù)得到的MFCC畫出二維圖像;將該MFCC圖像作為深度神經(jīng)網(wǎng)絡(luò)的輸入,使識(shí)別平均準(zhǔn)確率達(dá)到97.1%。文獻(xiàn)[19]提出使用一維卷積神經(jīng)網(wǎng)絡(luò)代替二維卷積神經(jīng)網(wǎng)絡(luò),在降低識(shí)別時(shí)間的同時(shí)提高了識(shí)別準(zhǔn)確率。文獻(xiàn)[20]提出使用兩種不同類型的卷積神經(jīng)網(wǎng)絡(luò),對(duì)高速軌道的入侵事件進(jìn)行檢測(cè),克服了大量噪聲的影響,將誤報(bào)率減小到10%,準(zhǔn)確率到達(dá)了91%。雖然這些方法提供了很好的結(jié)果,但為了提高在實(shí)際環(huán)境下的識(shí)別準(zhǔn)確率,仍然需要開辟新的方式。
因此,本文嘗試使用雙輸入多層卷積神經(jīng)網(wǎng)絡(luò)(TI_CNN)對(duì)振動(dòng)事件進(jìn)行分類。首先將經(jīng)過小波包去噪的原始信號(hào)輸入1-D CNN,把通過小波變換得到的小波時(shí)頻圖輸入2-D CNN中;將1-D CNN和2-D CNN提取的特征使用SVM來進(jìn)行分類。由于TI_CNN融合了兩種不同類型CNN輸出的特征,所以相比于傳統(tǒng)1-D CNN、2-D CNN能獲得更多的特征。TI_CNN相比于CNN+LSTN[21],具有更淺的網(wǎng)絡(luò)層次。所以在輸入數(shù)據(jù)量小的時(shí)候不容易出現(xiàn)過擬合的現(xiàn)象,并且識(shí)別時(shí)間更短。通過對(duì)比LeNet-5型1-D CNN與TI_CNN的性能差異證實(shí):本文所提模型能更好的對(duì)振動(dòng)信號(hào)進(jìn)行分類,并且由于采用了SVM進(jìn)行最后的識(shí)別分類,可以將全連接層的數(shù)量減小且識(shí)別時(shí)間也滿足了實(shí)時(shí)識(shí)別的要求。
在對(duì)路面振動(dòng)事件的長(zhǎng)距離監(jiān)測(cè)中,所使用的分布式光纖聲傳感器系統(tǒng),如圖1所示。所采用的分布式光纖聲傳感器系統(tǒng)主要分為3大部分:φ-OTDR傳感系統(tǒng)、傳感光纖、信號(hào)識(shí)別單元。分布式光纖聲傳感系統(tǒng)的主要工作步驟如下:
圖1 phi-OTDR 系統(tǒng)實(shí)驗(yàn)設(shè)置
(1)激光經(jīng)過聲光調(diào)制器(AOM)后被調(diào)制為光脈沖。該光脈沖被摻鉺光纖放大器(EDFA)放大后通過一個(gè)帶通濾波器(BPF),濾除由EDFA產(chǎn)生的放大自發(fā)輻射(ASE)噪聲。
(2)得到的濾波光脈沖從環(huán)形器的1號(hào)端口進(jìn)入環(huán)形器,再?gòu)沫h(huán)形器的2號(hào)端口射入傳感光纖。由傳感光纖返回的后向瑞利散射光經(jīng)環(huán)形器的3號(hào)端口輸出到EDFA,經(jīng)過EDFA放大后,再使用BPF濾除ASE噪聲。
(3)光電探測(cè)器將濾波后的后向瑞利散射光轉(zhuǎn)換為電信號(hào),在通過信號(hào)采集卡后將采集到的信號(hào)輸入到信號(hào)處理單元進(jìn)行識(shí)別。
在本次應(yīng)用中,主要的識(shí)別任務(wù)是區(qū)分通過路面的汽車、路面挖掘機(jī)的挖掘工作和路面破路機(jī)的工作事件。
圖中,AOM為聲光調(diào)制器;EDFA為摻鉺光纖放大器;PD為光電探測(cè)器;DAQ為數(shù)據(jù)采樣器。
本文所提出的TI_CNN的識(shí)別方式如圖2所示,主要步驟為:數(shù)據(jù)的預(yù)處理、數(shù)據(jù)集的準(zhǔn)備、數(shù)據(jù)集轉(zhuǎn)為小波時(shí)頻圖、使用TI_CNN進(jìn)行訓(xùn)練、對(duì)訓(xùn)練結(jié)果分類。
圖2 系統(tǒng)操作過程
振動(dòng)數(shù)據(jù)是通過采集傳感光纖上每個(gè)點(diǎn)的空間響應(yīng)以及積累沿時(shí)間軸的空間響應(yīng)得到的。獲得的在每個(gè)點(diǎn)空間的一維時(shí)間序列被輪流作為識(shí)別目標(biāo)。由于在實(shí)際環(huán)境中存在有許多的噪聲,導(dǎo)致信號(hào)被淹沒在各種噪聲中,嚴(yán)重影響最后的識(shí)別結(jié)果。因此,在對(duì)數(shù)據(jù)進(jìn)行分析之前,需對(duì)數(shù)據(jù)進(jìn)行去噪處理。本文使用文獻(xiàn)[22]中提到的基于小波分解的信噪分離方式,并使其更好的應(yīng)用到分布式光纖振動(dòng)傳感信號(hào)上。WD的處理過程如圖3所示。
(a)WD方法 (b)WPD方法
小波包分解與小波分解相比,小波包分解能將前一步分解結(jié)果中的高頻部分繼續(xù)分解,會(huì)將原始信號(hào)分解到2i(i為分解尺度)小波包子空間中。因此,小波包分解能得到比小波分解更詳細(xì)的信息。小波包分解公式為:
(1)
(2)
小波包重構(gòu)的公式為:
(3)
因此,在本文中使用一個(gè)3層,母波為‘sym8’的小波包分解,對(duì)振動(dòng)信號(hào)進(jìn)行去噪。小波包分解的層數(shù)和母波類型是通過實(shí)驗(yàn)選擇的最優(yōu)設(shè)置。
在圖1所示的對(duì)地面振動(dòng)事件的監(jiān)測(cè)中存在著很多的振動(dòng)源,而本文主要研究小汽車通過,挖掘機(jī)挖掘,破路機(jī)工作這3種振動(dòng)源,將這3種事件依次命名為類型1、類型2、類型3。
對(duì)時(shí)序信號(hào)的分析主要有兩種方式:連續(xù)小波變換(CWT)、短時(shí)傅里葉變換(STFT)。STFT的窗口是固定的,在實(shí)際使用中很難尋找到一個(gè)合適的窗口大小。一方面,如果窗口尺寸太窄,則窗口所截取的信號(hào)將太短,從而導(dǎo)致頻率分析不精準(zhǔn)。另一方面,如果窗口尺寸太寬,則導(dǎo)致截取的信號(hào)長(zhǎng)度太長(zhǎng),從而導(dǎo)致較低的時(shí)間分辨率。所以短時(shí)傅里葉變換不能滿足非穩(wěn)態(tài)信號(hào)變化的頻率要求.
連續(xù)小波變換很好的解決了短時(shí)傅里葉變換(STFT)固定窗口的問題。其通過采用一個(gè)有限長(zhǎng)衰減小波基函數(shù)來代替STFT中的無限長(zhǎng)三角基函數(shù),更適合用于非穩(wěn)態(tài)的時(shí)序信號(hào)的處理。通過使用CWT,可以將一維時(shí)序信號(hào)轉(zhuǎn)變?yōu)槎S的時(shí)頻圖像。二維時(shí)頻圖像包含了一維時(shí)序信號(hào)的時(shí)間和頻率的信息,相比于原始信號(hào),時(shí)頻圖能全面、更準(zhǔn)確的反應(yīng)出原始信號(hào)的特征。
分布式光纖傳感系統(tǒng)返回的振動(dòng)信號(hào)屬于非穩(wěn)態(tài)信號(hào),所以采用CWT對(duì)其進(jìn)行分析。對(duì)任意L2(r)空間的函數(shù)f(t),其CWT的變換方程如下:
(4)
其中:
(5)
在公式(4)中,a是一個(gè)尺度分解因子,a> 0代表頻率相關(guān)拓展;b是平移量,代表時(shí)間相關(guān)的拓展;ψa,b(t)是小波基函數(shù)。
給出尺度分解因子和小波基函數(shù)后,就可以根據(jù)公式(1)得到各振動(dòng)信號(hào)的小波系數(shù),并將小波系數(shù)序列轉(zhuǎn)變?yōu)閷?shí)際的頻率序列。結(jié)合點(diǎn)序列,畫出各振動(dòng)信號(hào)的小波時(shí)頻圖。
對(duì)分布式光纖聲傳感系統(tǒng)采集的振動(dòng)信號(hào)進(jìn)行小波時(shí)頻分析中,根據(jù)實(shí)驗(yàn)得出最優(yōu)小波基函數(shù)參數(shù)選擇‘Cgau1’,尺度分解因子為30。小汽車通過、破路機(jī)工作、挖掘機(jī)挖掘所生成的小波時(shí)頻圖像如圖4所示。
(a)汽車通過的情況 (b)挖掘機(jī)工作的情況
采用TI_CNN(3層1-D CNN、2層2-D CNN)比采用單獨(dú)網(wǎng)絡(luò)結(jié)構(gòu)的LSTM、1-D CNN、2-D CNN得到更好的性能,如圖5所示。
圖5 TI_CNN網(wǎng)絡(luò)
圖5顯示出該識(shí)別網(wǎng)絡(luò)具有兩種不同輸入類型卷積神經(jīng)網(wǎng)絡(luò)。下臂使用的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為3層1-D CNN,其網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)見表1;由于2-D CNN輸入的參數(shù)較多運(yùn)算量較大,所以在本文中提出僅采用2層2-D CNN對(duì)小波時(shí)頻圖進(jìn)行識(shí)別,大大減小了2-D CNN對(duì)圖像特征提取的時(shí)間,雙層2-D CNN的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)見表2;使用兩個(gè)全連接層(FC)將上下臂卷積神經(jīng)網(wǎng)絡(luò)輸出的特征映射到樣本標(biāo)記空間,從而將所有特征整合到一起,最后使用一個(gè)SOFTMAX分類層輸出各標(biāo)記事件的概率值。其網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)見表3。
表1 1-D CNN的參數(shù)
表2 2-D CNN 的參數(shù)
表3 全連接層的參數(shù)
使用TI_CNN進(jìn)行分類前需要先將CNN模型訓(xùn)練好,但由于SVM不能進(jìn)行反向梯度傳播,故先使用softmax層來輸出TI_CNN的準(zhǔn)確率,當(dāng)準(zhǔn)確率達(dá)到要求時(shí)便認(rèn)為TI_CNN的模型已經(jīng)訓(xùn)練好,再將訓(xùn)練好的TI_CNN模型用來提取特征,使用SVM來進(jìn)行最后的分類。SVM的核函數(shù)設(shè)置為高斯核函數(shù),超參數(shù)C設(shè)置為0.09,degree設(shè)置為3。
下臂的1-D CNN網(wǎng)絡(luò)輸入的是經(jīng)過濾波的原始一維振動(dòng)信號(hào),上臂的2-D CNN網(wǎng)絡(luò)輸入的是使用濾波信號(hào)經(jīng)過CWT得到的小波時(shí)頻圖。卷積層和全連接層使用的激活函數(shù)都是線性整流函數(shù)(ReLU)。ReLU是一個(gè)非線性函數(shù),其定義如下:
φ(x)=Max(x,0)
(6)
ReLU激活函數(shù)可以有效避免梯度消失的問題,并且運(yùn)算簡(jiǎn)單,可以提高計(jì)算速度且能讓網(wǎng)絡(luò)很快收斂。
TI_CNN采用的損失函數(shù)為:
(7)
采用隨機(jī)梯度下降(SGD)去更新TI_CNN的網(wǎng)絡(luò)參數(shù)。在本文中SGD損失函數(shù)的學(xué)習(xí)率設(shè)置為0.01,該參數(shù)是經(jīng)過實(shí)驗(yàn)得出的最優(yōu)參數(shù)。在訓(xùn)練結(jié)束后,使用Accuracy、Recall、Precision、F1來評(píng)估模型的有效性。具體公式如下:
(8)
(9)
(10)
(11)
式中,TP代表在判斷正類中判斷正確的個(gè)數(shù);TN代表在判斷負(fù)類中判斷正確的個(gè)數(shù);FP代表在判斷正類中判斷錯(cuò)誤的個(gè)數(shù);FN代表在判斷負(fù)類中判斷錯(cuò)誤的個(gè)數(shù)。
實(shí)驗(yàn)設(shè)置如圖1所示。一個(gè)線寬為3 kHz,能源為10 mW的分布式反饋激光器(DFB-LD)產(chǎn)生連續(xù)激光。這個(gè)光源被AOM(100 M)調(diào)制為光脈沖。然后通過一個(gè)EDFA(插入損耗為4 dB,增益為27 dB)被放大,并使用BPF濾除ASE噪聲。這個(gè)光被注入一段20 km長(zhǎng)的傳感光纖中通過一個(gè)光學(xué)環(huán)形器。后向瑞利散射光往回傳播通過傳感光纖,由EDFA放大和BPF濾波后被PD(100 M)檢測(cè),然后由采樣率為200 MS/s,位數(shù)為12 bit的DAQ采樣。實(shí)驗(yàn)數(shù)據(jù)在上海滬松路和文翔東路工地上采集。其中,20 km長(zhǎng)的傳感光纖被深埋在地下大約1~2 m處。
實(shí)驗(yàn)中,3種主要的振動(dòng)事件被選擇作為振動(dòng)信號(hào)識(shí)別的對(duì)象,總共設(shè)置1 200個(gè)一維數(shù)據(jù)樣本和1 200個(gè)小波時(shí)頻圖樣本,按照7:3的劃分比例,隨機(jī)將數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,每個(gè)樣本的幀長(zhǎng)為2 s。在施工現(xiàn)場(chǎng)的左方大約5 m處有一條大約4.8m寬的公路,當(dāng)有汽車通過時(shí)便記錄下此時(shí)的振動(dòng)波形;挖掘機(jī)挖掘是挖掘機(jī)在施工現(xiàn)場(chǎng)進(jìn)行挖掘工作時(shí)采集到的波形;破路機(jī)工作是指將挖掘機(jī)原有的鏟斗更換為破碎錘時(shí)進(jìn)行工作的振動(dòng)信號(hào)。振動(dòng)識(shí)別實(shí)驗(yàn)在一臺(tái)配備了NVIDIA Quadro P5000 GPU的圖形工作站上進(jìn)行。
本文中,CNN結(jié)構(gòu)是在基于keras框架上使用python編程語言實(shí)現(xiàn)的。LeNet-5 1-D CNN結(jié)構(gòu)如圖6所示。
圖6 1_D CNN 結(jié)構(gòu)
網(wǎng)絡(luò)詳細(xì)信息見表4。表4中主要展示了1-D CNN網(wǎng)絡(luò)的輸入值大小、卷積層中卷積核的大小以及卷積核的數(shù)量。
表4 LeNet-5 1D_CNN 參數(shù)
上述兩個(gè)網(wǎng)絡(luò)每次迭代輸入的數(shù)據(jù)量(Batch_size)設(shè)置為300。LeNet-5型1-D CNN網(wǎng)絡(luò)輸入的是數(shù)據(jù)集中的經(jīng)過濾波后的一維原始信號(hào)樣本。TI_CNN(輸入的是經(jīng)過濾波的一維原始信號(hào)和使用濾波后的一維信號(hào)通過CWT得到的小波時(shí)頻圖。
兩種方法在測(cè)試集上的混淆矩陣如圖7所示。在圖7中,使用TI_CNN對(duì)小汽車通過、挖掘機(jī)挖掘、破路機(jī)工作的識(shí)別準(zhǔn)確率分別為95%、94%、100%,平均識(shí)別率為96.3%;LeNet-5 型1-D CNN對(duì)小汽車通過、挖掘機(jī)挖掘、破路機(jī)工作的識(shí)別率分別為94%、93%、86%,平均識(shí)別為91%。
(a)1_D CNN(LeNet-5)方法 (b)TI_CNN方法
由此可見,由于TI_CNN采用兩種卷積神經(jīng)網(wǎng)絡(luò)對(duì)振動(dòng)信號(hào)進(jìn)行特征的提取,能提取到更加豐富的特征,再加上使用SVM進(jìn)行分類,使其準(zhǔn)確率和識(shí)別時(shí)間都有所提升,其平均準(zhǔn)確率高于LeNet-5型1-D CNN。TI_CNN和LeNet-5型1-D CNN的驗(yàn)證集損失函數(shù)下降曲線如圖8所示、驗(yàn)證集準(zhǔn)確率上升曲線如圖9所示。
在圖8中,LeNet-5型1-D CNN損失函數(shù)的下降速度優(yōu)于TI_CNN,但在圖9中,LeNet-5 1-D CNN出現(xiàn)過擬合(準(zhǔn)確率曲線振蕩過大)的程度比TI_CNN嚴(yán)重。其主要原因是:TI_CNN不僅從原始一維信號(hào)中提取出信號(hào)的時(shí)域特征,還從小波時(shí)頻圖中獲得了時(shí)頻域特征,而LeNet-5 1-D CNN只能從一維信號(hào)中獲得信號(hào)的時(shí)域特征。TI_CNN由于合并了兩種卷積神經(jīng)網(wǎng)絡(luò)的特征,加大了識(shí)別的數(shù)據(jù)量,所以在輸入數(shù)據(jù)量較小時(shí)也不易出現(xiàn)過擬合。
圖8 損失函數(shù)下降曲線
圖9 準(zhǔn)確率上升曲線
表5為L(zhǎng)eNet-5型1-D CNN和TI_CNN識(shí)別結(jié)果計(jì)算指標(biāo)的對(duì)比。從表中可以看出:TI_CNN的各項(xiàng)計(jì)算指標(biāo)都優(yōu)于LeNet-5型1-D CNN,這說明TI_CNN模型能很好的識(shí)別各種振動(dòng)數(shù)據(jù)。
表5 TI_CNN 和 LeNet-5 1_D CNN識(shí)別結(jié)果對(duì)比
本文提出了一種新穎的方式,去識(shí)別分布式光纖聲傳感器采集的振動(dòng)事件,提高了檢測(cè)精度。為了驗(yàn)證所提方法的有效性,將該方法與文獻(xiàn)[19]中所提出的多層1-D CNN識(shí)別模型進(jìn)行了對(duì)比,實(shí)驗(yàn)證明TI_CNN可以在使用較小數(shù)據(jù)集時(shí),達(dá)到較好的效果并且降低過擬合現(xiàn)象的出現(xiàn)。該方法通過同時(shí)提取一維信號(hào)的時(shí)域特征和小波時(shí)頻圖的時(shí)頻域特征增加了最后識(shí)別的特征數(shù)量,但網(wǎng)絡(luò)層次并沒有加深,減小了模型的過擬合和識(shí)別時(shí)間,提高了識(shí)別的準(zhǔn)確率。
基于本研究采集的數(shù)據(jù)構(gòu)成的數(shù)據(jù)集,采用TI_CNN對(duì)小汽車通過、挖掘機(jī)挖掘、破路機(jī)工作的識(shí)別準(zhǔn)確率分別可以達(dá)到95%、94%、100%,平均識(shí)別率為96.3%,并且識(shí)別時(shí)間為0.61 s.