姜 坤,張 帥,傅 翔,史二禎,安博文,陳元林,崔桂艷
(1.國(guó)家能源集團(tuán)東臺(tái)海上風(fēng)電有限責(zé)任公司,江蘇 東臺(tái) 224200;2.上海安馨信息科技有限公司,上海 201306)
當(dāng)海纜敷設(shè)深度過(guò)淺或裸露在海床表面時(shí),會(huì)受到海水腐蝕、船舶錨害、漁網(wǎng)拖拽等。海纜受到損傷后會(huì)產(chǎn)生缺陷,容易造成故障發(fā)生,若不及時(shí)發(fā)現(xiàn)并修復(fù)將會(huì)威脅到電網(wǎng)系統(tǒng)的安全穩(wěn)定運(yùn)行,因此有必要對(duì)海纜淺埋進(jìn)行識(shí)別[1]。海纜淺埋狀態(tài)識(shí)別常采用溫度分析法,而現(xiàn)場(chǎng)采集的溫度信號(hào)具有非平穩(wěn)、非線性特點(diǎn),如何從溫度信號(hào)中提取有效特征是進(jìn)行狀態(tài)識(shí)別的關(guān)鍵。隨著狀態(tài)識(shí)別理論研究的深入,學(xué)者們提出了各種狀態(tài)識(shí)別方法,例如:EMD[2]、BP神經(jīng)網(wǎng)絡(luò)[3]、小波分析[4]和SVD[5]等。隨著人工智能技術(shù)的不斷發(fā)展,深度學(xué)習(xí)體系結(jié)構(gòu)即遞歸神經(jīng)網(wǎng)絡(luò)(RNN)[6]、卷積神經(jīng)網(wǎng)絡(luò)(CNN)[7]、長(zhǎng)短期記憶(LSTM)[8]等在狀態(tài)識(shí)別領(lǐng)域中得到廣泛的應(yīng)用。
利用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)[9]處理光纖溫度信號(hào)可以降低噪聲和提取狀態(tài)特征,但其存在端點(diǎn)效應(yīng)及模態(tài)混疊等問(wèn)題;Wu等[10]提出集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD),在模式混疊問(wèn)題上比原始EMD有很大改進(jìn),但得到的IMF中會(huì)殘留一定的白噪聲;Torres等[11]提出完備集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN),可以有效解決模態(tài)混疊和殘余噪聲問(wèn)題,但需要一個(gè)試錯(cuò)過(guò)程來(lái)獲得信號(hào)的良好分解。針對(duì)這些問(wèn)題,Dragomiretskiy等[12]提出一種非平穩(wěn)信號(hào)處理方法:變分模態(tài)分解(VMD),對(duì)采樣和噪聲具有較好的魯棒性,可以降低復(fù)雜度高和非線性強(qiáng)的時(shí)間序列非平穩(wěn)性,分解獲得包含多個(gè)不同頻率尺度且相對(duì)平穩(wěn)的子序列,廣泛應(yīng)用于故障診斷和狀態(tài)識(shí)別。文獻(xiàn)[13]提出優(yōu)化的VMD方法,分別利用遺傳算法和包絡(luò)峰度的最大值確定VMD的模態(tài)分量個(gè)數(shù)。
海纜狀態(tài)識(shí)別的關(guān)鍵在于光纖溫度信號(hào)的特征提取,通過(guò)構(gòu)建混合域特征集,提取時(shí)域特征、頻域特征和時(shí)頻域特征,盡可能全面的從溫度信號(hào)中提取狀態(tài)特征信息。但高維特征集中會(huì)存在冗余特征,影響模型的識(shí)別結(jié)果和計(jì)算效率。所以,需要對(duì)高維特征集進(jìn)行降維[14],主要有主成分分析(PCA)[15]、核主成分分析(KPCA)[16]、距離評(píng)估技術(shù)[17]等。文獻(xiàn)[18]提出一種基于補(bǔ)償距離評(píng)估技術(shù)的特征選擇方法,從聲發(fā)射信號(hào)中提取特征集,提高故障診斷的準(zhǔn)確度。
近年來(lái),深度學(xué)習(xí)在狀態(tài)識(shí)別領(lǐng)域得到了一定的應(yīng)用[19]。長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)作為其中的主要方法之一,通過(guò)疊加多個(gè)LSTM層,利用輸入和輸出之間的非線性映射層進(jìn)行分層特征學(xué)習(xí),能夠從不同方面學(xué)習(xí)原始信號(hào)的特征,加速收斂并細(xì)化原始數(shù)據(jù)的非線性操作[8]。
針對(duì)上述方法,本文提出一種基于優(yōu)化VMD混合域特征和LSTM的海纜淺埋狀態(tài)識(shí)別方法,實(shí)現(xiàn)海纜淺埋狀態(tài)的準(zhǔn)確識(shí)別。
VMD基于維納濾波理論,Dragomiretskiy等在2014年引入VMD進(jìn)行自適應(yīng)信號(hào)處理。VMD是一個(gè)完全非遞歸的變分模態(tài)分解模型,在該算法中,本征模態(tài)函數(shù)(IMF)被定義為一個(gè)有帶寬限制的調(diào)幅-調(diào)頻函數(shù),VMD算法是通過(guò)構(gòu)造并求解約束變分問(wèn)題,將原始信號(hào)分解為指定個(gè)數(shù)的IMF分量。在對(duì)信號(hào)進(jìn)行VMD分解之前,需要確定VMD的參數(shù),即需要預(yù)先確定模數(shù)和懲罰因子。確定影響參數(shù)后,對(duì)信號(hào)進(jìn)行VMD分解,得到一系列本征模函數(shù)[12]。
采用一種由希爾伯特變換計(jì)算包絡(luò)峰度值的方法,從而有效地優(yōu)化VMD模數(shù),本文采用懲罰因子和帶寬的默認(rèn)值α=2000,s=0,初始模數(shù)設(shè)為K=2,借鑒唐等[20]對(duì)模數(shù)K的討論范圍。如果模數(shù)K過(guò)大,則效率低,計(jì)算負(fù)荷重;如果模數(shù)K過(guò)小,容易引入噪聲。所以選擇K∈[2,15]作為模數(shù)的搜索域,步長(zhǎng)設(shè)置為1。
對(duì)采集到的光纖溫度信號(hào)進(jìn)行VMD分解,計(jì)算設(shè)定模數(shù)K下各模態(tài)信號(hào)的包絡(luò)峰度值,通過(guò)比較得到該模數(shù)下包絡(luò)峰度的最大值,然后K=K+1繼續(xù)進(jìn)行上述分析,直到取K=15,得到各模數(shù)下包絡(luò)峰度的最大值。
假設(shè)VMD的模數(shù)為K,K∈[2,15],可以計(jì)算出每個(gè)模數(shù)的包絡(luò),即:
(1)
此外,K的第i個(gè)模式的包絡(luò)峰度計(jì)算如下:
(2)
可以獲得局部最大ekKmax:
ekKmax=max (ek1,ek2,ek3,…,ekK)
(3)
因?yàn)镵的搜索范圍為[2,15],搜索步長(zhǎng)設(shè)置為1,所以在整個(gè)搜索范圍內(nèi)可以獲得14個(gè)局部最大值。因此,我們可以得到全局最大值:
ekgmax=max(ek2max,ek3max,ek4max,…,ek15max)
(4)
根據(jù)式(4)可以得到取ekgmax時(shí),對(duì)應(yīng)的K值,用K′表示,其中K′可以從公式(5)得到:
K′=argmax(ekgmax)
(5)
VMD方法獲得的各IMF分量包括了原始信號(hào)不同時(shí)間尺度的局部特征,前幾個(gè)IMF分量體現(xiàn)了原始信號(hào)的主要特征。為有效保留原始信號(hào)的狀態(tài)特征,同時(shí)避免噪聲等成分的干擾,采用相關(guān)系數(shù)法篩選分解后的各個(gè)IMF分量,篩選相關(guān)系數(shù)最大的IMF分量作為計(jì)算混合域特征的數(shù)據(jù)。相關(guān)系數(shù)的計(jì)算公式如下[21]:
(6)
其中:L為信號(hào)長(zhǎng)度;ρ(i)為第i個(gè)IMF分量與原始信號(hào)x(t)之間的相關(guān)系數(shù)。
通過(guò)提取原始光纖溫度信號(hào)的時(shí)域和頻域特征,結(jié)合所選IMF的時(shí)域和頻域特征以及能量和熵特征構(gòu)建54維混合域特征集,能夠表征信號(hào)的頻率分布特征和變化趨勢(shì)以及在不同時(shí)刻和頻率處的能量信息等,全面挖掘海纜覆埋狀態(tài)特征信息。其中,時(shí)域分析方法通常用于表征原始信號(hào)的概率統(tǒng)計(jì)特征,能夠降低噪聲的干擾,減少冗余數(shù)據(jù);頻域分析方法通過(guò)傅里葉變換處理時(shí)域信號(hào)進(jìn)行頻譜分析,獲得信號(hào)的主頻帶、頻率能量以及頻譜能量等信息;時(shí)頻域分析方法采用優(yōu)化VMD對(duì)溫度信號(hào)進(jìn)行處理,引入能量和熵特征,反應(yīng)信號(hào)的能量大小和分布趨勢(shì),以及信號(hào)的混亂程度。
傅里葉變換公式如下:
(7)
本文采用統(tǒng)計(jì)分析方法歸納總結(jié)15種時(shí)域特征參數(shù);基于FFT得到的頻域信號(hào)提取10種頻域特征參數(shù);基于優(yōu)化VMD篩選的IMF分量提取能量、排列熵、樣本熵和模糊熵4種時(shí)頻特征參數(shù),具體特征參數(shù)如表1所示。
表1 特征參數(shù)表
由于高維特征集中可能含有冗余特征,會(huì)影響狀態(tài)識(shí)別精度以及計(jì)算效率。因此,需要對(duì)高維特征集進(jìn)行降維生成具有較高代表性且維度較低的敏感特征集[15]。補(bǔ)償距離評(píng)估技術(shù)(CDET)是利用距離評(píng)估指標(biāo)進(jìn)行敏感特征選擇的方法,充分考慮特征對(duì)狀態(tài)識(shí)別的敏感性,篩選出狀態(tài)敏感特征,降低特征集維度,其算法原理如下所示[19]。
具體步驟如下:
①計(jì)算ωC(c=1,2,…,C)類(lèi)特征向量的平均距離,如式:
(8)
對(duì)dc,k(c=1,2,…,C)求平均類(lèi)內(nèi)距離,如式:
(9)
②定義并計(jì)算dkω的方差因子,如式:
(10)
③計(jì)算C個(gè)模式類(lèi)的類(lèi)間距離,如式:
(11)
④定義并計(jì)算dkb的方差因子,如式:
(12)
⑤定義并計(jì)算補(bǔ)償因子,如式:
(13)
⑥計(jì)算距離評(píng)估指標(biāo)αk,如式:
(14)
(15)
利用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)建立海纜淺埋狀態(tài)識(shí)別模型。疊加多個(gè)LSTM層,利用輸入和輸出之間的非線性映射層進(jìn)行分層特征學(xué)習(xí),LSTM的內(nèi)部結(jié)構(gòu)如圖1所示,LSTM的模型結(jié)構(gòu)如圖2所示,整體網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖1 LSTM網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)圖
圖2 LSTM模型結(jié)構(gòu)圖
圖3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖
海纜監(jiān)測(cè)系統(tǒng)中的溫度監(jiān)測(cè)以海纜內(nèi)置光纖為傳感介質(zhì),通過(guò)分布式光纖測(cè)溫設(shè)備周期性的采集海纜所有位置的溫度信息,形成歷史光纖溫度數(shù)據(jù)。目前,海纜淺埋狀態(tài)識(shí)別主要以溫度信號(hào)分析為基礎(chǔ),根據(jù)海床表面和海床深處存在溫度差異,夏季海床表面溫度高于海床深處溫度,冬季海床表面溫度低于海床深處溫度?;谠摤F(xiàn)象,根據(jù)夏季和冬季的光纖溫差可以有效識(shí)別海纜深埋和淺埋位置。但基于光纖溫差識(shí)別海纜淺埋位置存在一定的局限性,在海床表面和海床深處溫度近似相等即溫度平衡時(shí)間(5月和10月),難以根據(jù)光纖溫差識(shí)別海纜淺埋位置。
基于歷史光纖溫度數(shù)據(jù)提取1月和8月某一時(shí)刻光電復(fù)合海纜所有位置的光纖溫度數(shù)據(jù),選取1月光纖溫度T1與8月光纖溫度T2之間溫差Ts=|T2-T1|≤3 ℃的區(qū)段,構(gòu)建5月份海纜深埋光纖溫度數(shù)據(jù)樣本;選取1月光纖溫度T1與8月光纖溫度T2之間溫差Ts=|T2-T1|≥18 ℃的區(qū)段,構(gòu)建5月份海纜淺埋光纖溫度數(shù)據(jù)樣本。光纖距離-溫度關(guān)系曲線如圖4所示。
圖4 光纖距離-溫度關(guān)系曲線圖
在搜索域中,淺埋狀態(tài)和深埋狀態(tài)模式數(shù)K和局部包絡(luò)峰度最大值之間的關(guān)系繪制在圖5中,由2.2節(jié)“VMD模數(shù)確定”可知,根據(jù)14個(gè)局部包絡(luò)峰度最大值可以得到全局包絡(luò)峰度最大值,其對(duì)應(yīng)的K值即為樣本的最佳模式數(shù)K′。針對(duì)海纜覆埋兩種狀態(tài)樣本,可以得到每個(gè)樣本取最佳模式數(shù)K′時(shí)全局包絡(luò)峰度的最大值,如表2所示。
圖5 K與局部最大包絡(luò)峰度
表2 K′與全局最大包絡(luò)峰度
由表2可知,具體海纜狀態(tài)樣本與最佳模式數(shù)一一對(duì)應(yīng),給出淺埋狀態(tài)樣本的VMD分解示例。當(dāng)K′=6時(shí)包絡(luò)峰度最大,對(duì)淺埋樣本使用具有6種模式的VMD分析原始溫度信號(hào),每個(gè)IMF分量的時(shí)域表示如圖6所示。計(jì)算原始信號(hào)與6個(gè)IMF的相關(guān)系數(shù),其中IMF1相關(guān)系數(shù)達(dá)到80.4 %,IMF2~I(xiàn)MF6的相關(guān)系數(shù)在25 %左右。
圖6 VMD 分解示例
對(duì)海纜覆埋狀態(tài)的混合域特征集進(jìn)行歸一化處理,淺埋和深埋狀態(tài)的歸一化特征值如圖7所示,可以看出部分特征對(duì)海纜覆埋狀態(tài)不敏感,即存在部分冗余特征。
圖7 混合域特征集特征值對(duì)比
(a)距離評(píng)估圖
降維得到的低維特征集組成如表3所示,54維混合域特征集降為15維,其中時(shí)域特征8維,頻域特征5維,時(shí)頻域特征2維。
表3 降維后的特征集組成
基于光纖溫度混合域特征的海纜淺埋狀態(tài)識(shí)別方法包括四個(gè)部分內(nèi)容,圖9是整體算法流程圖,步驟如下:
圖9 整體算法流程圖
第一部分:海纜在線監(jiān)測(cè)系統(tǒng)
(1)將分布式光纖傳感采集到的海纜光纖溫度信號(hào)等距分段,制作淺埋和深埋兩種海纜覆埋狀態(tài)的原始光纖溫度信號(hào)樣本數(shù)據(jù)集;
(2)數(shù)據(jù)預(yù)處理:首先,利用希爾伯特變換計(jì)算包絡(luò)峰度最大值方法優(yōu)化VMD模數(shù);其次,對(duì)每個(gè)數(shù)據(jù)樣本進(jìn)行VMD分解,并利用相關(guān)系數(shù)法篩選IMF分量;最后,制作淺埋和深埋狀態(tài)的IMF分量樣本數(shù)據(jù)集。
第二部分:混合域特征提取
(1)計(jì)算15維原始光纖溫度信號(hào)的時(shí)域特征和15維IMF分量的時(shí)域特征;
(2)計(jì)算10維原始光纖溫度信號(hào)的頻域特征和10維IMF分量的頻域特征;
(3)計(jì)算4維IMF分量的時(shí)頻域特征;
(4)根據(jù)計(jì)算得到的時(shí)域特征、頻域特征和時(shí)頻域特征組成特征向量構(gòu)造混合域特征集。
第三部分:輸入特征降維優(yōu)化
(1)利用補(bǔ)償距離評(píng)估技術(shù)選取敏感特征;
第四部分:建立海纜淺埋狀態(tài)識(shí)別模型
(1)根據(jù)上述步驟從海纜覆埋狀態(tài)的光纖溫度數(shù)據(jù)中得到低維特征數(shù)據(jù)集,作為L(zhǎng)STM訓(xùn)練和測(cè)試的數(shù)據(jù);
(2)隨機(jī)劃分訓(xùn)練集和測(cè)試集,利用訓(xùn)練集訓(xùn)練LSTM網(wǎng)絡(luò),同時(shí)在訓(xùn)練過(guò)程中根據(jù)損失收斂情況優(yōu)化調(diào)整網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù);
(3)測(cè)試集驗(yàn)證網(wǎng)絡(luò)的有效性,預(yù)測(cè)海纜覆埋狀態(tài)分類(lèi)結(jié)果。
根據(jù)3.1節(jié)構(gòu)建的海纜覆埋狀態(tài)光纖溫度信號(hào)數(shù)據(jù)集驗(yàn)證基于光纖溫度混合域特征的海纜淺埋狀態(tài)識(shí)別方法的效果。海纜覆埋狀態(tài)一共生成4000個(gè)樣本,每種狀態(tài)2000個(gè)樣本。隨機(jī)分配訓(xùn)練集和測(cè)試集,每種狀態(tài)訓(xùn)練集和測(cè)試集的分配數(shù)量分別為1600和400。
將網(wǎng)絡(luò)運(yùn)行5次,圖10展示了五次測(cè)試得到的測(cè)試集識(shí)別準(zhǔn)確率和損失率。其中,第2次測(cè)試的訓(xùn)練集和測(cè)試集精度變化曲線如圖11所示,第2次測(cè)試的訓(xùn)練集和測(cè)試集損失變化曲線如圖12所示。
圖10 多次測(cè)試的準(zhǔn)確率和損失
圖11 訓(xùn)練集和測(cè)試集的精度變化曲線
圖12 訓(xùn)練集和測(cè)試集的損失變化曲線
在訓(xùn)練中一次迭代指所有數(shù)據(jù)在網(wǎng)絡(luò)中完成一次前向計(jì)算及反向傳播的過(guò)程。準(zhǔn)確率反映了模型正確識(shí)別的樣本比例,損失率用來(lái)評(píng)估模型的預(yù)測(cè)值與真實(shí)值的不一致程度。準(zhǔn)確率越大、損失率越小,說(shuō)明模型的識(shí)別能力和魯棒性越好。
分析圖10中的數(shù)據(jù),本文提出的方法獲得了較好的結(jié)果,5次測(cè)試的測(cè)試集平均識(shí)別準(zhǔn)確率為100 %。由此可見(jiàn),利用基于光纖溫度混合域特征的海纜淺埋狀態(tài)識(shí)別方法能夠有效實(shí)現(xiàn)海纜淺埋狀態(tài)識(shí)別且穩(wěn)定性較高。
從圖11和圖12可以看出,無(wú)論訓(xùn)練還是測(cè)試,精度變化曲線迅速上升并趨于穩(wěn)定,損失變化曲線迅速下降并趨于穩(wěn)定,經(jīng)過(guò)100次迭代后,最終的測(cè)試精度和損失的值分別為100 %和0.006 %。
為了表示海纜不同覆埋狀態(tài)的分類(lèi)情況,給出分類(lèi)結(jié)果混淆矩陣,圖13展示了第2次測(cè)試結(jié)果的混淆矩陣。其中橫軸表示預(yù)測(cè)類(lèi)別,縱軸表示實(shí)際類(lèi)別,對(duì)角線數(shù)值表示每一類(lèi)別測(cè)試樣本的分類(lèi)準(zhǔn)確率,非對(duì)角線位置的數(shù)值表示某一狀態(tài)分類(lèi)的錯(cuò)誤率。從混淆矩陣結(jié)果圖可以看出,海纜深埋和淺埋類(lèi)別的分類(lèi)正確率均達(dá)到100 %。
圖13 狀態(tài)分類(lèi)混淆矩陣
為了驗(yàn)證基于光纖溫度混合域特征的海纜淺埋狀態(tài)識(shí)別方法的有效性,對(duì)比其他四種方法。方法1:對(duì)于本文提出的方法,不進(jìn)行降維處理,以混合域特征集作為 LSTM 網(wǎng)絡(luò)的輸入。方法2:對(duì)于本文提出的方法,僅改變特征集組成,以時(shí)域特征集作為 LSTM 網(wǎng)絡(luò)的輸入。方法3:對(duì)于本文提出的方法,僅改變特征集組成,以頻域特征集作為 LSTM 網(wǎng)絡(luò)的輸入。方法4:對(duì)于本文提出的方法,僅改變特征集組成,以時(shí)頻域特征集作為L(zhǎng)STM 網(wǎng)絡(luò)的輸入。表4展示了本文所提方法與其他四種方法的結(jié)果對(duì)比,可以看出,基于優(yōu)化VMD混合域特征和LSTM的海纜淺埋狀態(tài)識(shí)別方法相較于其他四種對(duì)比方法識(shí)別準(zhǔn)確率高,穩(wěn)定性好。
表4 不同狀態(tài)識(shí)別方法的比較
針對(duì)光纖溫度信號(hào)非平穩(wěn)、非線性的特點(diǎn),以及在海床表面溫度和海床深處溫度近似相等即溫度平衡時(shí)間段內(nèi),利用光纖溫差識(shí)別海纜淺埋位置存在一定的局限性問(wèn)題,提出一種基于優(yōu)化VMD混合域特征和LSTM的海纜淺埋狀態(tài)識(shí)別方法,全面挖掘海纜覆埋狀態(tài)特征,提高識(shí)別模型準(zhǔn)確率,實(shí)現(xiàn)準(zhǔn)確穩(wěn)定的海纜淺埋狀態(tài)識(shí)別。主要結(jié)論如下:
(1)提出了一種基于希爾伯特變換計(jì)算包絡(luò)峰度最大值的VMD參數(shù)優(yōu)化方法處理海纜光纖溫度信號(hào),并利用相關(guān)系數(shù)法篩選IMF,有效降低噪聲干擾。
(2)通過(guò)提取原始溫度信號(hào)的時(shí)域和頻域特征,結(jié)合所選IMF的時(shí)域和頻域特征以及能量和熵特征構(gòu)建混合域特征集,充分挖掘訓(xùn)練樣本中的海纜覆埋狀態(tài)信息,提高樣本利用率。
(4)所設(shè)計(jì)的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)收斂速度快且具有較好的魯棒性,基于現(xiàn)場(chǎng)采集數(shù)據(jù),測(cè)試準(zhǔn)確率達(dá)到100 %,表現(xiàn)出良好的泛化能力。