苗軍 周建亭 袁睿思 寧潤澤
摘? 要: 為了對系統(tǒng)采集到的光纖振動數(shù)據(jù)進行更細致的特征刻畫,文中采用傅里葉變換對數(shù)據(jù)進行特征提取。對特征提取后的數(shù)據(jù),通過二分類任務決策樹模型以及約束極速學習機(CELM)算法,進行挖掘機挖掘、人工挖掘、汽車行走、人員行走以及環(huán)境噪音總共5個類別進行識別。實驗結(jié)果表明,與采用傳統(tǒng)的短時能量/過零率特征及極速學習機(ELM)算法相比,該文采用傅里葉變換特征和CELM算法對光纖振動數(shù)據(jù)識別的分類正確率有顯著提高。
關鍵詞: 信號識別; 入侵事件檢測; 光纖振動信號; 數(shù)據(jù)采集; 特征提取; 分類識別
中圖分類號: TN929.11?34; TP181? ? ? ? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? 文章編號: 1004?373X(2019)16?0040?04
0? 引? 言
將一定數(shù)量的光纖傳感器設置在目標區(qū)域邊界處,外界壓力和各類振動會導致光纖產(chǎn)生內(nèi)力變化,從而產(chǎn)生振動信號。系統(tǒng)對該過程中產(chǎn)生的振動信號進行識別分析,當檢測到入侵事件或干擾事件時,即可做出對應的預警。該系統(tǒng)不僅被用于石油和天然氣的防護中,還被廣泛應用于機場、炸藥庫、邊境等領域,并在逐漸取代傳統(tǒng)的安防解決方案[1?2]。
在光纖信號的特征提取和分類識別方面,相關的研究報道較少。熊林林基于Mach Zehnders光纖干涉儀原理設計了分布式光纖微振動傳感器,用于研究管道沿途的異常振動信號[3]。該定位監(jiān)測系統(tǒng)具有較高的測試靈敏度和準確的定位精度,而結(jié)構(gòu)卻十分簡單。楊丹基于人耳聽覺原理,給出了光纖振動信號的梅爾頻率倒譜系數(shù)(MFCC)特征表達方法[4]。該方法根據(jù)電鎬信號特殊的頻段分布特點對光纖振動信號的MFCC特征進行自適應特征提取與識別,能夠有效地區(qū)分電鎬、挖地和過車這三類信號;并且利用改進的MFCC特征提取算法,提升了電鎬信號的識別性能。李國相等人提出了無害強風干擾源的數(shù)學模型[5],對于有害的人員攀爬入侵信號,其過零率特征明顯區(qū)別于無害強風干擾振動信號,從而實現(xiàn)對二者的區(qū)分和識別。通過所觀察到的時頻域信號特性,李靜云等人提出了基于時頻熵和重心頻率的光纖信號特征表達方法,分析信號隨時間變化的規(guī)律從而進行入侵類型的識別[6]。
通過對挖掘機挖掘、人工挖掘、汽車行走、人員行走和噪聲這5類事件信號的特征可視化和觀察,本文在信號的過零律和能量[7]基本表達的基礎上,提出采用傅里葉變換對信號進行特征提取的處理方法。在分類器的選擇和設計方面,本文采用了有約束的極速學習機(CELM)的算法[8]進行分類識別實驗。
1? 光纖振動數(shù)據(jù)的傅里葉特征表達和樣本生成
本文首先借鑒文獻[9]的做法,將原始二維時空圖進行前、背景區(qū)域進行劃分,并在前景區(qū)域中選取各事件的過零率特征數(shù)據(jù)塊和能量特征數(shù)據(jù)塊(為后續(xù)進行傅里葉變化,塊的尺寸應該足夠大,例如取23×23大?。┳鳛榇聿煌愂录拇植谠紭颖?,然后對這些原始樣本進行傅里葉變換作為代表不同類事件的特征樣本。
2? 基于CLEM的光纖振動數(shù)據(jù)識別
文獻[8]提出的CELM算法對ELM算法[10]進行了優(yōu)化以及改進。由于ELM算法中的輸入權(quán)重向量是隨機產(chǎn)生的,因此若要產(chǎn)生效果良好的分類面需要產(chǎn)生足夠多的隨機隱節(jié)點才有可能實現(xiàn)。CELM算法將輸入權(quán)重向量的賦值方式進行改進,改進方法是將若干對標有不同類別的樣本的差向量正則化后設置為輸入權(quán)向量,并用[12]的差向量模長對隱單元的偏置進行賦值。由于輸入權(quán)向量的垂直平分線代表基本分類面, 經(jīng)過約束方式這樣的改進,使得產(chǎn)生的輸入權(quán)重能夠產(chǎn)生一組效果良好的基本分類面。
3? 二分類任務決策樹模型
在本次研究中,為了與文獻[9]的方法進行比較,五類數(shù)據(jù)仍舊按4個階段分析,每個階段采用二分類任務的方式進行類別劃分。在第一階段,主要是將事件分為危害性事件和非危害性事件;在第二階段則對第一階段中分類為危害性事件的數(shù)據(jù)進行分類,判斷破壞事件為挖掘機挖掘還是人工挖掘;在第三階段,則對第一階段中分類為非危害性事件的數(shù)據(jù)進行干擾事件的類型判斷,判斷非破壞性事件為噪聲還是行走類事件;在第四階段,對第三階段中判斷為行走類的事件進行分類,即將其分類為汽車行走或人員行走。
4? 實驗及結(jié)果分析
根據(jù)文獻[9]描述,樣本大小、算法中不同激勵函數(shù)對識別率沒有明顯影響,但隱層神經(jīng)元個數(shù)對識別率影響較大。故在下列各實驗中對不進行傅里葉變換的實驗樣本均取3×3大小的數(shù)據(jù)塊,對進行傅里葉變換的樣本數(shù)據(jù)塊取23×23大小,后者這一參數(shù)是根據(jù)各類事件的原始二維時空圖的有效前景區(qū)域的最小寬度得出的。實驗中模型的激勵函數(shù)取為Sigmoid,隱層神經(jīng)元個數(shù)為500。
在實驗設置上,考慮單獨采用傅里葉變換特征或CELM算法以及同時采用傅里葉變換特征與CELM算法這三種情況對系統(tǒng)識別率的影響。對五類事件按照3×3大小在原始二維時空圖上不重疊采樣得到的樣本總數(shù)約為42 000個,其中[13]用于測試(五類測試樣本的數(shù)目分別為5 730,1 342,398,664,5 841),其余用來訓練;按照23×23大小在原始二維時空圖上有重疊采樣得到的樣本總數(shù)約為16 400個,[13]用于測試(5類測試樣本的數(shù)目分別為2 263,118,436,1 556,1 092),其余用來訓練。綜上所述,整個識別過程分為第一階段、第二階段、第三階段、第四階段。
實驗軟件平臺為Windows 10 專業(yè)版操作系統(tǒng)和Matlab(R2017b版)編程框架,硬件平臺為聯(lián)想G50?70型號筆記本(酷睿i5?4285U型號CPU、主頻2.40 GHz、8 GB內(nèi)存)。
4.1? 有無傅里葉變換、使用ELM識別的實驗
在本節(jié)的實驗中,考慮采用傅里葉變換對實驗結(jié)果的影響。在進行識別任務的4個階段中均按上文所述的樣本選取方法,分別對選取的訓練樣本事先進行傅里葉變換以及不進行傅里葉變換,并采用ELM算法獲得實驗結(jié)果如表1所示。
從表1可知,在一、三階段即區(qū)分危害事件與環(huán)境噪聲的階段,進行傅里葉變換后的得到樣本數(shù)據(jù)塊經(jīng)ELM算法測試的正確率略高于未進行傅里葉變換的原始樣本數(shù)據(jù)塊的測試正確率;在二、四階段即區(qū)分挖掘類型與行走類型,變換后的樣本數(shù)據(jù)塊的測試正確率明顯高于未變換樣本數(shù)據(jù)塊的測試正確率。由于有無危害事件下光纖的振動信號、有無噪聲下光纖的振動信號、兩種挖掘下的光纖振動信號以及兩種行走下的光纖振動信號之間在頻率上均有一定差別,樣本數(shù)據(jù)塊在進行傅里葉變換后在一、二、三、四各階段測試正確率相較于未變換的ELM測試正確率均有所提升。
4.2? 無傅里葉變換、使用CELM識別的實驗
對于沒有經(jīng)過傅里葉變換的樣本數(shù)據(jù)塊,考慮是否采用CELM算法對實驗結(jié)果的影響。采用CELM算法在識別任務4個階段的實驗結(jié)果見表2,將表2數(shù)據(jù)與表1中無傅里葉變換采用ELM算法的數(shù)據(jù)比較可得出:采用CELM算法的測試正確率在一、二、三、四階段均高于ELM算法測試正確率,CELM算法相較于ELM算法對測試數(shù)據(jù)準確率有一定提高。
4.3? CELM的隱層神經(jīng)元不同個數(shù)的實驗
對于沒有經(jīng)過傅里葉變換的樣本數(shù)據(jù)塊,激活函數(shù)仍為Sigmoid,對CELM隱層神經(jīng)元不同個數(shù)進行實驗,第一階段實驗結(jié)果見表3、圖1。
從表3中可以看出,測試識別率隨著隱層節(jié)點數(shù)的增加而提高,但是相差不大;當隱層節(jié)點個數(shù)增加到500時,測試正確率趨于穩(wěn)定,當隱層節(jié)點數(shù)增加到2 000時測試正確率最高,當隱層節(jié)點數(shù)增加到3 000時測試正確率有輕微下降,對應的訓練時間達到了195.39 s。
經(jīng)過對第二、三、四階段的驗證,它們的實驗結(jié)果與第一階段的現(xiàn)象相似。因此,為了方便實驗對比,在后續(xù)的實驗設計中,模型隱節(jié)點的數(shù)目都設置為500。
4.4? 有傅里葉變換、使用CELM識別的實驗
第4.1,4.2節(jié)的實驗揭示了單獨采用傅里葉變換或CELM算法對實驗結(jié)果的影響。在本節(jié)的試驗中,將考慮同時對原始樣本數(shù)據(jù)塊進行傅里葉變換并采用CELM算法進行識別,實驗結(jié)果如表4所示。將表4與表1無傅里葉變換的ELM實驗結(jié)果比較可知:在識別任務一、二、三、四階段,采用傅里葉變換以及CELM算法的測試正確率均明顯高于未經(jīng)傅里葉變換的ELM算法的測試正確率。
由于CELM算法相較于ELM在分類性能上有所優(yōu)化,且第4.1節(jié)的實驗揭示了傅里葉變換對系統(tǒng)性能的提升作用,因而采用CELM算法對傅里葉變換特征數(shù)據(jù)的測試正確率相較于采用ELM算法對原始數(shù)據(jù)的測試正確率有了明顯提升。
根據(jù)上述實驗結(jié)果,給出兩種算法的實驗結(jié)果對比圖如圖2所示。該圖表明采用CELM對傅里葉變換特征數(shù)據(jù)進行識別的方法在一、二、三、四階段的正確識別率都高于采用ELM對未經(jīng)傅里葉變換的原始數(shù)據(jù)進行識別的正確率。
綜上,根據(jù)對光纖振動信號識別過程的4個階段的劃分,按照各類事件的識別正確率等于各類事件中正確識別的樣本數(shù)除以測試集中該類事件的樣本數(shù)目,以及各類事件的識別時間等于各階段測試識別時間相加的計算方法,可以得出各類事件識別的正確率和所需時間,如表5所示。從表中可以獲知,采用了CELM算法與傅里葉變換的實驗結(jié)果,除了在人工挖掘方面的識別效果略有降低,在挖掘機挖掘、汽車行走、人員行走和噪聲方面都取得了更高的識別率,因而在總體平均識別率上獲得了顯著提高。由于CELM在權(quán)值初始化上比ELM復雜,因而系統(tǒng)在各個事件的識別時間花費上相對有所上升。
5? 結(jié)? 論
本文在文獻[9]對光纖振動數(shù)據(jù)進行短時原始特征表達的基礎上, 對數(shù)據(jù)進一步進行了傅里葉變換的特征表達和數(shù)據(jù)處理,并提出采用CELM算法替代ELM算法對5種光纖事件的振動信號進行識別。將光纖振動信號的短時過零率和短時能量數(shù)據(jù)進行傅里葉變換處理,并將二者結(jié)合起來作為特征樣本向量,然后使用CELM模型對樣本向量進行事件的分類識別。
實驗結(jié)果表明,與采用ELM等方法[9]對無傅里葉變換的原始光纖振動數(shù)據(jù)進行識別得到的結(jié)果相比,采用CELM算法對有傅里葉變換的光纖振動數(shù)據(jù)進行識別提高了前者的正確識別率,同時保持模型的訓練時間和測試時間與原有模型在同一數(shù)量級。
由于光纖振動信號存在非平穩(wěn)性的特點,并且某些事件信號,如挖掘機挖掘與人工挖掘信號,在頻率特征上相似,故在識別實驗中仍有部分誤分類現(xiàn)象產(chǎn)生。能否在噪聲干擾的情況下更準確地區(qū)分不同的振動事件是下一步需要繼續(xù)研究和解決的問題。
注:本文通訊作者為周建亭。
參考文獻
[1] SEEDAHMED S, JIM K, YUVARAJA V. Real?time distributed fiber optic sensor for security systems: performance, event classification and nuisance mitigation [J]. Photonic sensors, 2012, 2(3): 225?236.
[2] JIANG L H, LIU X M, ZHANG F. Multi?target recognition used in airpoty fiber fence warning system [C]// Proceeding of the 9th International Conference on Machine Learning and Cybernetics. Qingdao: IEEE, 2010: 1126?1129.
[3] 熊林林.基于光纖傳感器的光纜監(jiān)測預警系統(tǒng)及其仿真[J].計算機工程與應用,2017,53(z2):112?115.
XIONG Linlin. Optical cable online monitoring system and simulation based on fiber sensor [J]. Computer engineering and applications, 2017, 53(S2): 112?115.
[4] 楊丹.光纖振動信號特征提取與識別算法研究[D].北京:北方工業(yè)大學,2018.
YANG Dan. Research on the feature extraction and recognition for optical fiber vibration signals [D]. Beijing: North China University of Technology, 2018.
[5] 李國相,茍武侯.基于光纖振動安全預警系統(tǒng)的抗干擾算法研究[J].浙江水利水電學院學報,2018,30(1):63?67.
LI Guoxiang, GOU Wuhou. Method of mechanical vibration source identification based on fiber optic vibration safety warning system [J]. Journal of Zhejiang University of Water Resources and Electric Power, 2018, 30(1): 63?67.
[6] 李靜云,安博文,陳元林,等.基于時頻特征的光纖振動模式識別研究[J].光通信技術(shù),2018,42(7):55?59.
LI Jingyun, AN Bowen, CHEN Yuanlin, et al. Research on optical fiber vibration pattern recognition based on time?frequency characteristics [J]. Optical communication technology, 2018, 42(7): 55?59.
[7] 呂衛(wèi)強,黃荔.基于短時能量加過零率的實時語音端點檢測方法[J].兵工自動化,2009,28(9): 69?73.
L? Weiqiang, HUANG Li. Realtime voice activity detection based on short time energy plus rate of passing zero [J]. Ordnance industry automation, 2009, 28(9): 69?73.
[8] ZHU W T, MIAO J, QING L Y. Constrained extreme learning machine: A novel highly discriminative random feedforward neural network [C]// International Joint Conference on Neural Networks. Beijing: IEEE, 2014: 800?807.
[9] 鄒柏賢,苗軍,許少武,等.基于ELM算法的光纖振動信號識別研究[J].計算機工程與應用,2017,53(16):126?133.
ZOU Baixian, MIAO Jun, XU Shaowu, et al. Research on vibration signal recognition of optical fiber based on ELM algorithm [J]. Computer engineering and applications, 2017, 53(16): 126?133.
[10] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: A new learning scheme of feedforward neural networks [C]// 2004 IEEE International Joint Conference on Neural Networks. Budapest, Hungary: IEEE, 2004: 985?990.