国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于補(bǔ)償距離估計的光纖振動信號特征提取算法

2022-05-07 03:30許海燕寇慶康謝迎娟朱俊李敏
光子學(xué)報 2022年4期
關(guān)鍵詞:降維特征向量特征提取

許海燕,寇慶康,謝迎娟,朱俊,李敏

(河海大學(xué)物聯(lián)網(wǎng)工程學(xué)院,江蘇常州 213022)

0 引言

光纖傳感系統(tǒng)廣泛用于油氣長輸管道、隧道安全監(jiān)測、大型結(jié)構(gòu)安全監(jiān)測、周邊安全等諸多領(lǐng)域[1-5]。光纖傳感信號識別在實時監(jiān)測、異常報警等多個方面起關(guān)鍵作用,其工作性能直接決定了整個監(jiān)測系統(tǒng)的性能,因此,能否快速、準(zhǔn)確地進(jìn)行識別分類對于保障維護(hù)各個領(lǐng)域的安全和減少設(shè)備損壞造成的成本損失而言具有重要意義。

經(jīng)過光纖傳感系統(tǒng)提取的特征向量代表了光纖振動信號的特征,提取算法的有效性直接影響事件識別結(jié)果的準(zhǔn)確性。因此,根據(jù)特征提取算法,獲得有效的特征參數(shù),對提高識別率尤為關(guān)鍵。國內(nèi)外學(xué)者已經(jīng)在這方面做出大量研究。LI Junchan 等提出了一種基于相關(guān)向量機(jī)的光纖振動傳感器模式識別方法[6]。首先對初始振動信號進(jìn)行小波去噪預(yù)處理,然后利用小波分解算法得到各級分解系數(shù),構(gòu)建特征向量,最后利用相關(guān)向量機(jī)作為分類器進(jìn)行分類識別。但是基于小波分解的特征提取方法由于信號的特征容易受到高斯噪聲的影響,在小波分解處理過程中存在模糊提取和線性穩(wěn)態(tài)的缺陷。WANG Liang 等提出基于門限過零率和稀疏編碼器的算法提取光纖振動信號的兩級特征[7]。第一級特征提取過零率特征,以識別振動是否發(fā)生,通過第一級特征提取,降低光纖振動信號數(shù)據(jù)的維數(shù)。在發(fā)生振動的情況下,采用稀疏自編碼神經(jīng)網(wǎng)絡(luò)算法提取振動信號的高維特征。但是采用神經(jīng)網(wǎng)絡(luò)算法需要大量數(shù)據(jù)進(jìn)行訓(xùn)練。LIU Kun 等提出并論證了一種基于混合特征提取算法和組合分類器的識別方案[8]。提取過零率、樣本熵、小波包能量熵、峰度和多尺度置換熵組合為混合特征向量,然后采用一種支持向量機(jī)和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)相結(jié)合的分類器進(jìn)行識別分類。但是多種特征提取方案會增加特征提取過程的時間成本。

近年來,借鑒聽覺感知機(jī)理的Mel 頻率倒譜系數(shù)(Mel-frequency Cepstral Coefficients,MFCC)特征提取方法在振動信號特征提取中得到了廣泛的應(yīng)用,其算法簡單,能有效提取出高度可識別的特征信息,并取得良好的分類效果。 MFCC 特征提取方法可以對光纖傳感系統(tǒng)采集到的振動信號進(jìn)行特征提取,進(jìn)而對模式進(jìn)行預(yù)測,從而識別干擾信號[9]。使用MFCC 特征提取算法時,提取的特征向量存在維數(shù)高、向量冗余的問題。當(dāng)它被送到分類器進(jìn)行訓(xùn)練和識別時,不僅會增加時間成本,還會降低識別準(zhǔn)確率[10]。因此,如何實現(xiàn)對MFCC 特征向量的有效降維是提高光纖傳感振動信號實時性和準(zhǔn)確性的關(guān)鍵。

目前已知的降維技術(shù)分為兩類:一類是基于原始特征向量進(jìn)行選擇,另一類是從原始特征中重新提取特征[11]。主成分分析(Principal Component Analysis,PCA)被廣泛用于降低MFCC 特征向量的維數(shù)。通過從原始特征向量中重新提取特征向量,實現(xiàn)了MFCC 特征向量的特征降維,可以提高識別和分類[12]。但是,由于主成分分析方法是從原始特征向量中重新提取特征矩陣,對原始特征向量的各個特征維度的意義具有一定的模糊性,方差小的非主成分也可能包含不同的信息。對后續(xù)的識別和分類會產(chǎn)生一定的影響。

針對上述問題,本文提出了一種基于補(bǔ)償距離估計技術(shù)(Compensation Distance Estimation Technology,CDET)的特征提取方法,采用對特征向量類內(nèi)離散性和類間離散性聯(lián)合評估的方式,對特征矩陣的不同維度進(jìn)行特征評分,通過在原有特征向量矩陣中刪減低評分冗余向量進(jìn)行特征降維,從而解決冗余向量對分類的影響以及特征提取維數(shù)過多造成的運算復(fù)雜問題。

1 算法原理

本文提出一種基于補(bǔ)償距離估計的特征提取方法。通過該算法可以解決特征向量維數(shù)過多導(dǎo)致的復(fù)雜運算問題。基于補(bǔ)償距離估計的特征提取算法可以優(yōu)化特征向量矩陣,減少影響分類精度的冗余向量。采用基于聽覺感知機(jī)理的MFCC 算法進(jìn)行初次特征提取,并制定特征篩選策略,采用補(bǔ)償距離估計技術(shù)降低特征維數(shù),解決MFCC 提取的特征矩陣維數(shù)過多的問題,提高光纖傳感信號識別的有效性和實時性。MFCC 特征提取算法流程如下:

輸入:{Xc,n|1 ≤c≤C,1 ≤n≤Nc}

輸出:{C(n),D(n),D2(n)}

1.1 光纖傳感信號MFCC 特征提取

MFCC 特征提取方法是語音識別、故障識別和光纖信號識別中常用的一種特征提取方法[13-15]。 MFCC將信號頻率轉(zhuǎn)換為Mel 頻率,設(shè)置等距Mel 頻率,再轉(zhuǎn)換為頻率,得到Mel 頻率濾波器,然后將每個帶通濾波器的輸出信號能量作為信號的基本特征[16]。MFCC 特征提取算法的輸入為不同類型的光纖振動信號樣本,根據(jù)算法流程得到MFCC 系數(shù)與差分系數(shù)組合矩陣的輸出。MFCC 向量的三維圖如圖1。

圖1 MFCC 三維特征圖Fig.1 MFCC 3 dimension feature map

1.2 基于CDET 的特征篩選算法

補(bǔ)償距離估計技術(shù)(CDET)基于特征篩選策略,通過求取特征類別之間的類間距與特征的類內(nèi)距,根據(jù)其比值獲得特征評分,去掉評分低的冗余特征維度從而達(dá)到降維的目的。詳細(xì)步驟如下:

設(shè)有C個模式類集合為

式中,fc,n,k為第C個模式類下第n個樣本第k個特征;Nc為c類模式下的樣本總數(shù);K為每個樣本特征數(shù)目。

在每類模式下,有Nc個樣本,因此共有Nc個樣本,則有個特征,特征集定義為{fc,n,k}。

補(bǔ)償距離評估技術(shù)實現(xiàn)步驟具體如下:

1)計算相同條件樣本的平均距離

平均化dc,k得到平均類內(nèi)距

2)定義并計算的方差因子

3)計算不同條件樣本之間的平均距離

計算不同條件樣本之間的平均類間距離

4)定義并計算的方差因子

5)定義和計算補(bǔ)償因子為

6)計算和的比值并乘以補(bǔ)償因子

將gk歸一化,得到距離評價標(biāo)準(zhǔn)

7)設(shè)閾值為N,根據(jù)評分值確定閾值內(nèi)的特征數(shù),選擇在閾值范圍內(nèi)的L個特征,將k維降至L維。

2 實驗結(jié)果與分析

2.1 實驗數(shù)據(jù)

實驗所用的光纖信號數(shù)據(jù)來源于實驗室光纖傳感信號采集系統(tǒng)采集的三種信號種類,分別是晃動、輕敲、重敲,三種信號的時域圖如圖2。經(jīng)過預(yù)處理與端點檢測,將信號分割。實驗使用三類信號共210 個樣本,每類使用50 個樣本,共150 個樣本作為訓(xùn)練集;每類使用20 個樣本,共60 個樣本作為測試集。其中,樣本的采樣頻率為10 kHz。

圖2 三種信號時域圖Fig.2 Time domain diagram of three kinds of signals

2.2 結(jié)果與分析

為了驗證提出的MFCC 優(yōu)化方法的有效性,實驗中將采用支持向量機(jī)(SVM)的方法驗證MFCC 特征向量優(yōu)化前與優(yōu)化后的整個處理系統(tǒng)對三類信號分類識別的準(zhǔn)確率,如表1。經(jīng)過SVM 的分類準(zhǔn)確率結(jié)果為與人工標(biāo)注比較獲得。實驗流程可描述為3 個步驟:

1)MFCC 特征向量提?。簩γ總€光纖振動信號樣本加窗分幀并做FFT,然后將信號變換到Mel 頻率刻度下,最后通過倒譜分析得到MFCC 向量。

2)特征降維:特征降維技術(shù)主要分為兩類,一類是通過選擇原有特征向量,刪減冗余向量,例如本文所提出的補(bǔ)償距離估計算法;另一類是通過從現(xiàn)有特征重新提取特征來降低維度,例如作為對比實驗方法的主成分分析。

3)SVM 識別分類:將MFCC 特征向量或者經(jīng)過降維方法處理的特征向量輸入訓(xùn)練好的SVM 分類器進(jìn)行識別,標(biāo)識結(jié)果與識別結(jié)果比對,計算正確率并輸出。

采用本文提出的對MFCC 向量進(jìn)行CDET 特征評分算法,評分結(jié)果如圖3,從圖中可以發(fā)現(xiàn)1 維、41 維、78 維的評分結(jié)果最高,根據(jù)評分圖可以選擇高評分維度,通過刪減低評分維度即冗余向量進(jìn)行特征降維優(yōu)化。為了便于觀察并選擇合理降維維度,設(shè)置了閾值N,不同閾值下的維度分布如表2,隨著閾值的增大,高評分維度相應(yīng)減少。在SVM 分類實驗中對于降維維度的選擇根據(jù)不同閾值下的特征維度進(jìn)行分類實驗。

圖3 CDET 評分表Fig.3 CDET-score chart

表2 不同閾值下特征維度Table 2 Characteristic dimensions at different thresholds

采用SVM 分類器識別三類光纖振動信號的結(jié)果如圖4。從圖4 可以看出,使用CDET 降維到18 維、24維、30 維時,分類效果最好,保留了有用特征向量,對所有冗余向量進(jìn)行刪減,此時的特征評分范圍為0.45 到0.55 之間;而PCA 在15 維、18 維、24 維時降維效果最好,根據(jù)PCA 的原理符合低緯度時降維分類效果更好的情況。在10 維與15 維時,使用PCA 降維處理的分類效果要優(yōu)于使用CDET 降維處理的分類效果,因為PCA 是通過對原有特征向量集成產(chǎn)生的新的特征向量,而CDET 是在原有特征向量上選擇高評分特征向量,刪減冗余向量,當(dāng)刪減過多時,會造成非冗余特征向量的損失。隨著特征維數(shù)的增加,使用PCA 降維處理的分類效果逐漸下降,甚至低于未經(jīng)過降維處理的分類效果,而使用CDET 降維處理的分類效果僅僅下降了1.5%,保持穩(wěn)定。

圖4 三類信號不同降維維度下的分類準(zhǔn)確率Fig.4 Classification accuracy under different dimensionality reduction dimensions of three kinds of signals

在傳統(tǒng)的MFCC 特征提取方法的基礎(chǔ)上使用CDET 降維處理,識別正確率與未做優(yōu)化前相比有所提升,平均識別正確率較傳統(tǒng)MFCC 方法提升了3%左右。

對應(yīng)圖4 不同維度下的分類結(jié)果,圖5 顯示了不同維度下的時間成本。計算降維優(yōu)化時間和分類時間。降維優(yōu)化的時間成本是直接根據(jù)訓(xùn)練樣本的CDET 得分圖提取特征向量所需的時間,不同維度下的降維優(yōu)化時間可以保持在0.5 s 左右。沒有降維優(yōu)化的MFCC 特征向量需要2.2 s 才能通過SVM 分類器進(jìn)行分類。經(jīng)過降維優(yōu)化后,SVM 分類器對MFCC 特征向量分類的時間隨著維數(shù)的增加而增加,總的時間消耗也隨著維數(shù)的增加而增加。在61 維中,時間成本等于沒有降維優(yōu)化的時間成本。結(jié)合不同維度的分類結(jié)果和時間成本,在低維度上可以提高分類結(jié)果,降低時間成本。

圖5 時間消耗曲線Fig.5 Time consumption curve

為了進(jìn)一步對兩種方法做出比較,通過驗證不同信噪比下MFCC 特征向量的優(yōu)化效果比較兩種方法的抗噪性能。實驗中將高斯白噪聲以0 dB、5 dB、10 dB、15 dB、20 dB 的信噪比疊加到三種光纖振動信號中,對SVM 分類器識別正確率進(jìn)行對比,測量優(yōu)化方法的抗噪性能。圖6 為疊加不同信噪比噪聲的CDET 評分圖,隨著信噪比減小,噪聲比例增大,觀察評分圖可以發(fā)現(xiàn)高評分特征向量減少,特征向量的中間評分值增多,表明特征向量辨識度減小。

圖6 不同信噪比下CDET 評分圖Fig.6 CDET-score chart under different signal-to-noise ratio

疊加噪聲后測試的分類正確率結(jié)果如表3,參考分類實驗的實驗結(jié)果,選擇最優(yōu)分類結(jié)果時的維度進(jìn)行疊加噪聲的實驗,不同維度的分類準(zhǔn)確率與差值結(jié)果如圖7。從表3 的結(jié)果可以發(fā)現(xiàn),在同一信噪比的情況下,隨著維數(shù)的增多,基于CDET 優(yōu)化的MFCC 特征向量通過SVM 分類準(zhǔn)確率增加,說明在存在噪聲的情況下,由于特征辨識度下降,從而需要的特征向量維數(shù)增多。從圖7 的結(jié)果可以看出,隨著信噪比的降低,傳統(tǒng)MFCC 特征向量在SVM 分類器中的分類結(jié)果正確率也隨著下降,這是由于噪聲的增加掩蓋了原有的信號特征;基于PCA 和CDET 降維的MFCC 特征向量在使用SVM 分類時,隨著信噪比減小,分類結(jié)果正確率雖然也隨著下降,但是下降幅度不是很大。從圖7 可以發(fā)現(xiàn)在相同信噪比下,使用降維處理的特征向量比傳統(tǒng)MFCC 特征向量在使用SVM 分類時對于分類結(jié)果有著提升效果,在18 維時,PCA 的性能優(yōu)于CDET 的性能,根據(jù)差值圖可以發(fā)現(xiàn),隨著信噪比的減小,差值逐漸接近;在24 維與30 維時CDET 的性能要優(yōu)于PCA的性能,此時根據(jù)差值圖可以發(fā)現(xiàn),隨著信噪比的減小,差值逐漸增大,這表明CDET 在低信噪比時有更優(yōu)性能。補(bǔ)償距離估計技術(shù)是根據(jù)特征向量的類間距離與類內(nèi)距離的比值進(jìn)行評估,雖然疊加噪聲會對信號產(chǎn)生影響,但是通過刪減冗余向量而降低疊加噪聲產(chǎn)生的影響,基于CDET 的特征提取方法會對特征辨識度高的特征向量進(jìn)行提取,因此基于CDET 的特征提取方法具備一定的抗噪性能。

表3 不同信噪比下的分類精度Table 3 Classification accuracy under different signal-to-noise ratio

圖7 不同信噪比下的準(zhǔn)確率與差值圖Fig.7 Accuracy and accuracy difference under different signal-to-noise ratio

3 結(jié)論

本文針對光纖傳感振動信號易被噪聲淹沒,特征弱且難以表征等問題進(jìn)行研究,提出了一種基于補(bǔ)償距離估計技術(shù)的特征提取方法,以實現(xiàn)對光纖傳感振動信號的有效識別。該方法在從光纖振動信號中借鑒人類聽覺認(rèn)知機(jī)理,提取MFCC 特征向量的基礎(chǔ)上,并利用CDET 對特征進(jìn)行評估和優(yōu)化。在光纖傳感振動信號識別中,該算法較傳統(tǒng)MFCC 特征提取方法而言,通過刪減冗余信息,突出有效性強(qiáng)、貢獻(xiàn)率大的特征向量,解決維數(shù)過多導(dǎo)致的復(fù)雜運算問題并提高分類準(zhǔn)確性。實驗結(jié)果表明,該方法提高了光纖傳感振動信號模式識別的有效性和實時性,對比PCA 降維處理方法而言,低維度時性能相同,隨著維數(shù)的增多,CDET 的性能更加穩(wěn)定。通過本文所提方法能夠有效提高光纖振動信號的MFCC 特征向量在SVM 分類器中的識別正確率,提升分類系統(tǒng)性能,且算法具備一定的抗噪性能。

猜你喜歡
降維特征向量特征提取
同步定位與建圖特征提取和匹配算法研究
基于數(shù)據(jù)降維與聚類的車聯(lián)網(wǎng)數(shù)據(jù)分析應(yīng)用
高中數(shù)學(xué)特征值和特征向量解題策略
三個高階微分方程的解法研究
基于MED—MOMEDA的風(fēng)電齒輪箱復(fù)合故障特征提取研究
基于曲率局部二值模式的深度圖像手勢特征提取
導(dǎo)數(shù)在幾何中的“降維”作用
氨基酸序列特征向量提取方法的探討
幾種降維算法的研究及應(yīng)用
矩陣方法求一類數(shù)列的通項