国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進(jìn)典型相關(guān)分析的中低速懸浮系統(tǒng)異常檢測(cè)方法

2022-03-22 08:40:18龍志強(qiáng)
關(guān)鍵詞:站間高斯分布類別

王 平,梅 子,龍志強(qiáng)

(1.中國(guó)空氣動(dòng)力研究與發(fā)展中心設(shè)備設(shè)計(jì)及測(cè)試技術(shù)研究所,四川綿陽 621000;2.國(guó)防科技大學(xué)智能科學(xué)學(xué)院,湖南長(zhǎng)沙 410073)

中低速磁浮列車作為一種新型的城市軌道交通工具,越來越得到公眾的關(guān)注和認(rèn)可。懸浮系統(tǒng)作為中低速磁浮列車的關(guān)鍵系統(tǒng)之一,其安全性和可靠性對(duì)中低速磁浮列車的運(yùn)行具有十分重要的影響。其中,異常檢測(cè)技術(shù)作為一種提高系統(tǒng)運(yùn)行安全的有效手段,受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注和研究。因此,為提高中低速磁浮列車懸浮系統(tǒng)的安全性和可靠性,研究懸浮系統(tǒng)的異常檢測(cè)技術(shù)具有十分重要的意義。

國(guó)外,Harrou等提出了一種基于主成分分析(principal component analysis,PCA)的MCUSUM異常檢測(cè)策略,能更好地檢測(cè)出系統(tǒng)的微小異常[1]。Bi等提出了一種基于PCA的異常檢測(cè)模型,能夠準(zhǔn)確有效地檢測(cè)出異常,提高了算法的效率和穩(wěn)定性[2]。Xie等針對(duì)在線和準(zhǔn)確的異常檢測(cè)問題提出了一種基于雙邊PCA的異常檢測(cè)方法,實(shí)現(xiàn)了快速準(zhǔn)確的實(shí)時(shí)異常檢測(cè)[3]。Pan等提出了一種用于傳感器數(shù)據(jù)集成核PCA和關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù)驅(qū)動(dòng)異常檢測(cè)方法,可實(shí)現(xiàn)衛(wèi)星電力系統(tǒng)的異常檢測(cè)[4]。Yin等提出了一種改進(jìn)的數(shù)據(jù)流聚類算法,并根據(jù)改進(jìn)的算法設(shè)計(jì)了異常檢測(cè)模型,所建立的模型能夠隨著數(shù)據(jù)流的變化進(jìn)行修改,從而及時(shí)檢測(cè)出異常的發(fā)生[5]。Gu提出了一種系統(tǒng)的方法來識(shí)別客流異常的性質(zhì)并動(dòng)態(tài)估計(jì)其警報(bào)級(jí)別,能夠很好應(yīng)用于預(yù)警管理和優(yōu)化客流組織策略的實(shí)時(shí)決策[6]。Li提出了一種新的基于群集的異常檢測(cè)方法來檢測(cè)異常航班,能夠在事故發(fā)生之前識(shí)別和減輕風(fēng)險(xiǎn)[7]。針對(duì)物聯(lián)網(wǎng)應(yīng)用程序中實(shí)時(shí)檢測(cè)異常問題,Lyu提出了一種Fog-Empowered異常檢測(cè)方法,不僅能夠減少延遲和能耗還能實(shí)時(shí)檢測(cè)異常,并且有較高的檢測(cè)精度[8]。針對(duì)從異常環(huán)境中的訓(xùn)練集導(dǎo)出的主成分可能會(huì)被異常扭曲的問題,O’Reilly等提出了一種最小體積橢圓主成分分析的分布式異常檢測(cè)方法,能夠得到更為穩(wěn)健的訓(xùn)練集主成分[9]。針對(duì)大多數(shù)異常檢測(cè)算法無法滿足有效性和實(shí)時(shí)能力的問題,Ding提出了一種基于長(zhǎng)短期記憶(long shortterm memory,LSTM)神經(jīng)網(wǎng)絡(luò)和高斯混合模型(Gaussian mixture models,GMM)的實(shí)時(shí)異常檢測(cè)算法[10]。Yang等提出了一個(gè)基于二部圖和共聚的異常檢測(cè)創(chuàng)新框架,能夠在新浪微博數(shù)據(jù)集上高精度地檢測(cè)個(gè)體和群體異常[11]。Yan提出了一種深度半監(jiān)督異常檢測(cè)方法,并將該方法應(yīng)用于燃?xì)廨啓C(jī)燃燒室異常檢測(cè)方面,能夠有效地檢測(cè)出燃燒室的異?;蚬收希?2]。Lu等提出了一種用于異常檢測(cè)的半監(jiān)督機(jī)器學(xué)習(xí)算法,解決了傳統(tǒng)的基于關(guān)鍵質(zhì)量指標(biāo)的硬決策方法難以承擔(dān)大數(shù)據(jù)環(huán)境下監(jiān)控體驗(yàn)質(zhì)量異常檢測(cè)任務(wù)的問題[13]。針對(duì)無線通信中的頻譜異常檢測(cè)問題,F(xiàn)eng等采用深結(jié)構(gòu)自編碼神經(jīng)網(wǎng)絡(luò)對(duì)頻譜異常進(jìn)行檢測(cè),并以時(shí)頻圖作為學(xué)習(xí)模型的特征,同時(shí)用閾值來區(qū)分異常和正常數(shù)據(jù)[14]。為了解決無法獲得異常的經(jīng)驗(yàn)知識(shí)或歷史數(shù)據(jù)完全沒有標(biāo)記而導(dǎo)致的傳統(tǒng)故障識(shí)別方法不適用等問題,Li等提出了一種新穎的基于深度學(xué)習(xí)的機(jī)械設(shè)備異常檢測(cè)方法[15]。Liang等提出了一種共享的連接深度神經(jīng)網(wǎng)絡(luò),用于電力消耗時(shí)間序列異常預(yù)測(cè)[16]。

國(guó)內(nèi),對(duì)于車載靈活數(shù)據(jù)速率控制器局域網(wǎng)絡(luò),羅峰等提出了一種基于支持向量機(jī)的異常入侵檢測(cè)算法[17]。針對(duì)多波束海底地質(zhì)數(shù)據(jù)的異常問題,何書鋒等提出了一種新的異常檢測(cè)方法——深度支持向量檢測(cè)算法[18]。王慧珍等提出了一種基于Logistic集成學(xué)習(xí)的列車MVB網(wǎng)絡(luò)異常檢測(cè)方法[19]??紤]無人機(jī)傳感器易受網(wǎng)絡(luò)攻擊問題,充分利用數(shù)據(jù)的時(shí)間相關(guān)性,李晨等提出了針對(duì)無人機(jī)傳感器數(shù)據(jù)的異常檢測(cè)模型[20]。針對(duì)非規(guī)則采樣且具有缺失值的多維航空時(shí)序數(shù)據(jù),閆媞錦等提出了非規(guī)則采樣多維時(shí)序數(shù)據(jù)異常檢測(cè)算法[21]。韓昭蓉等提出了一種基于雙向LSTM模型的軌跡異常點(diǎn)檢測(cè)算法。該方法的檢測(cè)性能顯著優(yōu)于恒定速度閾值法、不考慮數(shù)據(jù)時(shí)序性的經(jīng)典機(jī)器學(xué)習(xí)分類算法和卷積神經(jīng)網(wǎng)絡(luò)模型[22]。為了解決訓(xùn)練樣本數(shù)據(jù)集中正類、負(fù)類樣本不平衡的問題,姚宇等提出一種考慮負(fù)類樣本信息的加權(quán)超橢球體支持向描述方法[23]。針對(duì)傳統(tǒng)異常檢測(cè)模型在數(shù)據(jù)不平衡情況下對(duì)少數(shù)異常類樣本識(shí)別效果較差的問題,王杰等提出了一種基于改進(jìn)擴(kuò)散映射的支持向量數(shù)據(jù)描述算法,構(gòu)建新的模型并將其應(yīng)用于工業(yè)異常檢測(cè)[24]。針對(duì)核動(dòng)力系統(tǒng)故障類型多、故障發(fā)生概率小、故障樣本匱乏的特殊問題,基于夾角余弦距離計(jì)算理論,從正常歷史運(yùn)行數(shù)據(jù)出發(fā),王雯珩等提出一種檢測(cè)系統(tǒng)異常的算法,有效應(yīng)對(duì)了故障樣本不足的現(xiàn)實(shí)問題[25]。針對(duì)目前大多數(shù)方法僅從單一視角檢測(cè)業(yè)務(wù)流程執(zhí)行異常而導(dǎo)致的異常檢測(cè)不全面問題,孫笑笑等提出了一種基于上下文感知的多角度業(yè)務(wù)流程在線異常檢測(cè)方法[26]。

此外,雖然在實(shí)際工程應(yīng)用中,根據(jù)《中低速磁浮交通車輛懸浮控制系統(tǒng)技術(shù)條件CJ/T458-2014》,目前懸浮系統(tǒng)已具備一套自診斷系統(tǒng),且該自診斷系統(tǒng)根據(jù)上述經(jīng)驗(yàn)閾值進(jìn)行異常檢測(cè),但額定的懸浮間隙以及間隙波動(dòng)的情況比較復(fù)雜。主要有:

(1)根據(jù)線路情況和列車的狀況調(diào)整額定的懸浮間隙,如北京線設(shè)計(jì)為8mm,長(zhǎng)沙線為9mm等,且懸浮控制器會(huì)根據(jù)速度的變化來調(diào)整額定的懸浮間隙。另外,由于每個(gè)傳感器和結(jié)構(gòu)安裝的差異性使得每個(gè)點(diǎn)的額定懸浮間隙不一定是8mm。

(2)列車運(yùn)行時(shí)由于速度、軌道不平順等多種因素綜合作用,或者列車懸浮靜止時(shí)由于車軌共振等因素作用導(dǎo)致異常的間隙值低于經(jīng)驗(yàn)閾值,從而導(dǎo)致漏報(bào)。

綜上所述,雖然LSTM等深度學(xué)習(xí)方法取得了較好的結(jié)果,但實(shí)際工程中不能標(biāo)記出足夠多的異常數(shù)據(jù)。而多元分析技術(shù)能利用歷史數(shù)據(jù)進(jìn)行異常檢測(cè),且不需要大量的異常數(shù)據(jù),甚至直接通過健康數(shù)據(jù)就能檢測(cè)異常數(shù)據(jù)。常用的多元分析技術(shù)有基于PCA、基于偏最小二乘方法(partial least squares,PLS)和基于典型相關(guān)分析(canonical correlation analysis,CCA)的異常檢測(cè)方法。雖然三種方法都有模型訓(xùn)練和異常檢測(cè)兩步,但又有一定的區(qū)別。基于PCA的檢測(cè)方法在整個(gè)過程中只考慮一個(gè)數(shù)據(jù)集,基于PLS的檢測(cè)方法考慮的是過程變量和質(zhì)量相關(guān)變量,而基于CCA的檢測(cè)方法面向的是系統(tǒng)中存在明確的輸入輸出關(guān)系且輸入輸出數(shù)據(jù)在線可測(cè)的情況,即基于CCA的檢測(cè)方法可以視為基于PCA和基于PLS的檢測(cè)方法的一種擴(kuò)展[27]。因此,針對(duì)懸浮系統(tǒng)異常檢測(cè)問題,利用懸浮系統(tǒng)的輸入輸出數(shù)據(jù),提出了一種基于改進(jìn)的CCA的多維時(shí)間序列異常檢測(cè)方法。通過CCA處理懸浮系統(tǒng)的多維數(shù)據(jù)以獲得故障檢測(cè)指標(biāo),即二次統(tǒng)計(jì)量。由于懸浮系統(tǒng)中部分?jǐn)?shù)據(jù)呈非高斯分布導(dǎo)致二次統(tǒng)計(jì)量也呈非高斯分布的問題,使用Box-Cox變換將每種類別下建立的二次統(tǒng)計(jì)量轉(zhuǎn)換為高斯分布變量,并利用高斯分布的置信區(qū)間來確定異常閾值。

1 懸浮系統(tǒng)的異常數(shù)據(jù)

1.1 數(shù)據(jù)分類

由于懸浮系統(tǒng)在不同的運(yùn)行場(chǎng)景下所產(chǎn)生的數(shù)據(jù)之間存在較大的差異,故需要對(duì)數(shù)據(jù)進(jìn)行劃分,以便在不同的運(yùn)行場(chǎng)景下進(jìn)行異常檢測(cè),這樣有利于提高檢測(cè)的可靠性。懸浮系統(tǒng)在運(yùn)行中會(huì)產(chǎn)生大量的數(shù)據(jù),主要包括懸浮間隙、電磁鐵電流、懸浮電磁鐵的垂向加速度、懸浮控制器的輸入電壓和車輛運(yùn)行速度。

圖1為懸浮監(jiān)控單元中某一個(gè)懸浮控制單元在某一天的間隙數(shù)據(jù),由車庫(kù)內(nèi)、出庫(kù)、正線運(yùn)行和回庫(kù)4部分?jǐn)?shù)據(jù)組成,其中,一天的數(shù)據(jù)約不到70萬個(gè)樣本點(diǎn),而在正線運(yùn)行過程中采集的懸浮數(shù)據(jù)有近50萬個(gè)采樣點(diǎn)。因此,正線運(yùn)行過程的數(shù)據(jù)是本文的研究重點(diǎn)。由圖可知,在正線運(yùn)行的數(shù)據(jù)中,站內(nèi)懸浮靜止的間隙數(shù)據(jù)(如第1個(gè)虛線區(qū)域所示)與站間運(yùn)行的間隙數(shù)據(jù)(如第2個(gè)虛線區(qū)域所示)的幅值有明顯的差異。

圖1 某一個(gè)懸浮控制單元在某一天的間隙數(shù)據(jù)Fig.1 The gap data of a certain suspension control unit on a certain day

為了更為直觀地反映兩者之間的差異,從懸浮系統(tǒng)的歷史數(shù)據(jù)中選擇一段列車從始發(fā)站運(yùn)行到終點(diǎn)站的懸浮系統(tǒng)歷史數(shù)據(jù),如圖2所示。從圖2可以看出,站內(nèi)懸浮靜止的間隙數(shù)據(jù)與站間運(yùn)行的間隙數(shù)據(jù)之間的差異大且站間運(yùn)行的間隙波動(dòng)較為頻繁。因此,本文將磁懸浮列車的數(shù)據(jù)分為2類(站內(nèi)靜止懸浮和站間行駛),其中,第1個(gè)虛線框中的數(shù)據(jù)屬于站內(nèi)靜止懸浮,第2個(gè)虛線框中的數(shù)據(jù)屬于站間行駛。

圖2 懸浮系統(tǒng)的歷史數(shù)據(jù)曲線Fig.2 The historical data curve of the suspension system

1.2 典型的異常類型

結(jié)合工程經(jīng)驗(yàn)和運(yùn)營(yíng)數(shù)據(jù),本文從站間行駛和站內(nèi)靜止懸浮中分別選擇一些典型的異常。

1.2.1 站間行駛時(shí)異常類型

本文從站間行駛的歷史數(shù)據(jù)中選擇含有3類異常的數(shù)據(jù)。圖3~圖5分別為第1類異常、第2類異常和第3類異常的數(shù)據(jù),其中虛線框中的數(shù)據(jù)屬于異常數(shù)據(jù),圖a中兩條直線分別為基于經(jīng)驗(yàn)的上、下限閾值。當(dāng)前數(shù)據(jù)來源于標(biāo)準(zhǔn)間隙為9mm的懸浮系統(tǒng),則基于經(jīng)驗(yàn)的上、下限閾值分別為5mm和13mm。

圖3 第1類異常的數(shù)據(jù)Fig.3 The first type of abnormal data

圖3中間隙有明顯的波動(dòng),但沒有超過經(jīng)驗(yàn)閾值,此時(shí)加速度、電流和電壓也對(duì)應(yīng)有一定的波動(dòng)。在實(shí)際工程中,當(dāng)懸浮系統(tǒng)過三型接頭或彎道時(shí)容易發(fā)生該類異常。對(duì)于這類異常,通過經(jīng)驗(yàn)閾值不一定能檢測(cè)出來。圖4的這類異常的現(xiàn)象是間隙有很大的波動(dòng),且超過經(jīng)驗(yàn)閾值,此時(shí)加速度、電流和電壓也對(duì)應(yīng)有巨大的波動(dòng)。在實(shí)際工程中,當(dāng)懸浮系統(tǒng)多次與軌道發(fā)生碰撞時(shí)容易發(fā)生該類異常。對(duì)于這類異常,通過經(jīng)驗(yàn)閾值很容易檢測(cè)出來。圖5的這類異常中,除了個(gè)別位置的間隙稍微大點(diǎn)外,其他位置的間隙沒有明顯的波動(dòng),且都沒有超過經(jīng)驗(yàn)閾值,此時(shí)電流和電壓也沒有明顯的波動(dòng),但加速度的波動(dòng)很明顯。在實(shí)際工程中,當(dāng)加速度傳感器有異?;蚣铀俣葌鞲衅鞯撵`敏度比間隙傳感器高或控制器內(nèi)部接插件出現(xiàn)問題時(shí)容易發(fā)生該類異常。對(duì)于這類異常,根據(jù)經(jīng)驗(yàn)閾值方法無法檢測(cè)出來。

圖4 第2類異常的數(shù)據(jù)Fig.4 The second type of abnormal data

圖5 第3類異常的數(shù)據(jù)Fig.5 The third type of abnormal data

1.2.2 站內(nèi)靜止懸浮時(shí)異常類型

本文從站內(nèi)靜止懸浮的歷史數(shù)據(jù)中選擇含有第4類異常的數(shù)據(jù)。圖6為第4類異常的數(shù)據(jù),其中虛線框中的數(shù)據(jù)屬于異常數(shù)據(jù)。這類異常的現(xiàn)象是間隙沒有明顯的波動(dòng),此時(shí)電壓不變,但電流有明顯的波蕩,加速度有劇烈的波動(dòng)。在實(shí)際工程中,當(dāng)列車與軌道產(chǎn)生共振時(shí)容易產(chǎn)生這類異常,但經(jīng)驗(yàn)閾值方法無法檢測(cè)出來。

圖6 第4類異常的數(shù)據(jù)Fig.6 The fourth type of abnormal data

2 異常檢測(cè)方法

考慮多維時(shí)間序列進(jìn)行異常檢測(cè)時(shí),一般會(huì)面臨兩方面的問題:檢測(cè)異常的指標(biāo)難以建立和數(shù)據(jù)呈非高斯分布難以處理。

由于經(jīng)驗(yàn)閾值方法僅采用懸浮系統(tǒng)的間隙數(shù)據(jù),并沒有充分利用懸浮系統(tǒng)的其它數(shù)據(jù),導(dǎo)致該方法對(duì)于第3類和第4類異常的檢測(cè)能力存在一定的不足。對(duì)此,利用懸浮系統(tǒng)的間隙、電流、加速度、電壓和速度等數(shù)據(jù),采用CCA建立指標(biāo)。

由于懸浮系統(tǒng)中間隙、電流、加速度、電壓和速度等數(shù)據(jù)并不都服從高斯分布,導(dǎo)致當(dāng)直接通過CCA處理懸浮數(shù)據(jù)并獲得檢測(cè)指標(biāo),即二次統(tǒng)計(jì)量后,二次統(tǒng)計(jì)量不服從高斯分布。此時(shí),通過常規(guī)的閾值設(shè)置方法獲得的異常閾值,很容易導(dǎo)致誤報(bào)或漏報(bào)的情況。因此,需要將二次統(tǒng)計(jì)量的分布轉(zhuǎn)換成高斯分布。

對(duì)此,通過Box-Cox變換將每種類別建立的二次統(tǒng)計(jì)量轉(zhuǎn)換為高斯分布變量,并利用高斯分布的特點(diǎn)來確定不同類別下的異常閾值。

2.1 傳統(tǒng)的CCA算法

假設(shè)某一個(gè)類別下的N個(gè)過程數(shù)據(jù)樣本可表示為

式中:x0(i)和y0(i)(i=1,…,N)是在相同類別下測(cè)得的過程輸入和輸出向量;l和m分別為輸入和輸出的變量個(gè)數(shù)。

通過式(3)和式(4)去掉平均值,即

2.2 基于Box-Cox變換的異常閾值設(shè)定

2.2.1 傳統(tǒng)閾值設(shè)定的不足

根據(jù)文獻(xiàn)[30]進(jìn)行閾值設(shè)置。

當(dāng)Q(k)為高斯分布時(shí),通過公式(17)獲得的閾值會(huì)比較理想。然而,當(dāng)Q(k)是非高斯分布時(shí),該方法確定的閾值將產(chǎn)生較大誤差。

2.2.2 新閾值的設(shè)定

為了確定與系統(tǒng)的不同健康狀況相對(duì)應(yīng)的Q(k)的范圍,可以通過Box-Cox變換將非高斯分布轉(zhuǎn)換為高斯分布[31],然后利用高斯分布的性質(zhì)來確定Q(k)的范圍。

Box-Cox轉(zhuǎn)換的過程為通過式(20)將(p1,p2,…,pn)轉(zhuǎn)換為(z1,z2,…,zn)。

其中,λ是一個(gè)使得每個(gè)獨(dú)立的pj(λ)服從正態(tài)分布N(μ,σ2)的常數(shù)。為了確定λ的值,定義將聯(lián)合概率密度函數(shù)(p1(λ),p2(λ),…,pn(λ))為

其中,In是n階單位向量。

λ固定時(shí),將μ和σ2的似然函數(shù)表示為

在經(jīng)過式(28)處理后,其他步驟與式(20)~(27)相同。

通過Box-Cox變換將Q(k)的分布轉(zhuǎn)換為高斯分布后,選擇[μ-3σ,μ+3σ]作為異常閾值,這意味著在這個(gè)范圍內(nèi)約99.73%的樣本是健康的[33]。

2.3 算法流程

異常檢測(cè)的流程如圖7所示,它由模型訓(xùn)練和異常檢測(cè)兩部分組成。左側(cè)的虛線框是模型訓(xùn)練,右側(cè)的虛線框表示異常檢測(cè)。

圖7 異常檢測(cè)流程圖Fig.7 The flow chart of anomaly detection

模型訓(xùn)練主要是通過健康的歷史數(shù)據(jù)獲得每個(gè)類別下的異常檢測(cè)模型和用于異常檢測(cè)的μx、μy、Σx、Σy、Σxy、γ、ρ、L、MT、D1和D2。模型訓(xùn)練的步驟為

(1)獲得n個(gè)類別;

(2)在第n0個(gè)類別下獲得N個(gè)健康樣本,分別構(gòu)建X0和Y0;

(3)根據(jù)式(3)~(9)計(jì)算μx,μy,X,Y,Σx,Σy,Σxy;

(4)根據(jù)式(11)~(16)計(jì)算τ、R、L、MT、r和Q;

(5)根據(jù)式(20)、式(21)和式(27)計(jì)算λ和z,并根據(jù)置信區(qū)間計(jì)算閾值;

(6)存儲(chǔ)該類別下μx、μy、Σx、Σy、Σxy、τ、R、L、MT;

(7)n0<n?是,返回到步驟2);否則,結(jié)束。

而異常檢測(cè)主要是根據(jù)數(shù)據(jù)判斷系統(tǒng)當(dāng)前的類別,然后調(diào)取該類別下的μx、μy、Σx、Σy、Σxy、τ、R、L和MT用于計(jì)算當(dāng)前的殘差,再將殘差與D1和D2進(jìn)行比較。異常檢測(cè)的步驟為

(1)獲得k時(shí)刻的數(shù)據(jù)x(k)和y(k);

(2)判斷和切換當(dāng)前的類別;

(3)選擇當(dāng)前類別下μx,μy,Σx,Σy,Σxy,L和MT;

(4)根據(jù)式(15)和式(16)計(jì)算r(k)和Q(k);

(5)根據(jù)式(20)或式(28)計(jì)算z(k);

(6)判斷:

μ-3σ<z(k)<μ+3σ?系統(tǒng)是健康的;

其他?系統(tǒng)是異常的。

3 實(shí)驗(yàn)結(jié)果與分析

3.1 數(shù)據(jù)處理與分析

使用懸浮系統(tǒng)的監(jiān)測(cè)數(shù)據(jù),其中一段數(shù)據(jù)為健康數(shù)據(jù),另一段數(shù)據(jù)為含有3類異常的數(shù)據(jù)。由于使用多維數(shù)據(jù),因此,只通過長(zhǎng)度為4個(gè)采樣點(diǎn)的移動(dòng)時(shí)間窗口獲得140 000組訓(xùn)練數(shù)據(jù)。

圖8為懸浮間隙、電流、電壓、加速度和速度的正態(tài)分布檢驗(yàn)圖。從圖中可以看出,懸浮間隙、電流、電壓、加速度和速度這5個(gè)量的分布并不都呈高斯分布。

圖8 懸浮系統(tǒng)數(shù)據(jù)的正態(tài)分布檢驗(yàn)圖Fig.8 The normal distribution test chart of suspension system data

由于多維數(shù)據(jù)中有部分?jǐn)?shù)據(jù)不呈高斯分布,如果直接采用CCA處理多維數(shù)據(jù)并獲得二次統(tǒng)計(jì)量Q,那二次統(tǒng)計(jì)量Q的分布也不理想,如圖9所示。此時(shí),根據(jù)二次統(tǒng)計(jì)量Q,利用傳統(tǒng)的閾值設(shè)置方法所獲得的閾值會(huì)很不合理,即,當(dāng)使用式(17)~(19)來計(jì)算Q的閾值時(shí),將不可避免地導(dǎo)致較大的誤差。通過式(17)~(19)可得,μ0=2.224 6×10-5,s=

圖9 Q的分布直方圖Fig.9 The distribution histogram of Q

圖10為通過CCA獲得的Q值,且這些值絕大部分都大于通過傳統(tǒng)閾值設(shè)置方法獲得的閾值Jth,Q。在圖10中,大量樣本明顯分布在閾值以上。因此,該方法不可行。

圖10 Q值及傳統(tǒng)方法的閾值Fig.10 Q value and the threshold of the traditional method

圖11為Q的正態(tài)分布檢驗(yàn)圖。從圖11可以看出,Q的分布不遵循高斯分布。對(duì)此,可通過Box-Cox變換將Q變換為正態(tài)分布變量Q1,即將Q代入式(20)~(28),并獲得的參數(shù)λ為0.138 2。

圖12和圖13是Q1的曲線和分布直方圖。由圖12和圖13可知,Q1的分布明顯比Q的分布更接近高斯分布。為了進(jìn)一步證明這點(diǎn),可通過Q1的正態(tài)分布檢驗(yàn)圖進(jìn)行直觀顯示,如圖14所示。與圖11相比,圖14中幾乎所有的離散點(diǎn)都分布在直線附近。這表明Box-Cox變換可以有效地將非高斯分布數(shù)據(jù)轉(zhuǎn)換為高斯分布數(shù)據(jù)。

圖11 Q的正態(tài)分布檢驗(yàn)圖Fig.11 The normal distribution test chart of Q

圖12 Q1曲線Fig.12 The Q1 curves

圖13 Q1分布直方圖Fig.13 The distribution histogram of Q1

圖14 Q1的正態(tài)分布檢驗(yàn)圖Fig.14 The normal distribution test chart of Q1

3.2 異常檢測(cè)結(jié)果分析

圖15為本文方法對(duì)站間行駛下3類異常的檢測(cè)結(jié)果。圖15的a~f分別為間隙、加速度、電流、電壓、速度的測(cè)量數(shù)據(jù)和二次統(tǒng)計(jì)量及其對(duì)應(yīng)的閾值,3類異常分別用3個(gè)虛線框圈出,從左往右分別是第1類、第2類和第3類異常,且圖f中正方形為本文方法檢測(cè)出的異常點(diǎn)。由圖f可知,本文提出的方法能有效檢測(cè)出3類異常。

圖15 站間行駛下3類異常的檢測(cè)結(jié)果Fig.15 The detection results for three types of abnormalities under driving between stations

圖16為本文方法對(duì)第4類異常的檢測(cè)結(jié)果,其中直線為本文的閾值。

第4類異常持續(xù)的時(shí)間為538個(gè)采樣點(diǎn),本文的方法能檢測(cè)出531個(gè)點(diǎn),這說明本文方法能有效檢測(cè)出第4類異常。

為驗(yàn)證所提方法的有效性,從現(xiàn)有的運(yùn)營(yíng)線數(shù)據(jù)中提取了32個(gè)第1類異常數(shù)據(jù)、104個(gè)第2類異常數(shù)據(jù)、41個(gè)第3類異常數(shù)據(jù)、208個(gè)第4類異常數(shù)據(jù),分別采用本文的方法、基于K-medoids的方法[32]和基于SVDD的方法[33]計(jì)算異常的檢測(cè)率,計(jì)算結(jié)果如表1所示。

表1 檢測(cè)結(jié)果對(duì)比Tab.1 Comparison of test results

由表可知,對(duì)于第2類異常,3種方法的檢測(cè)率都為100%;對(duì)于第1類和第3類異常,本文方法的檢測(cè)率明顯比另外兩種高;對(duì)于第4類異常,3種方法的檢測(cè)率都為100%。綜上所述,與基于K-medoids的方法和基于SVDD的方法相比,本文的方法能更有效地檢測(cè)出4類異常。

4 結(jié)語

針對(duì)懸浮系統(tǒng)異常檢測(cè)問題,為進(jìn)一步提高異常檢測(cè)率,提出了一種基于改進(jìn)的CCA的多維時(shí)間序列異常檢測(cè)方法。通過CCA處理懸浮系統(tǒng)的多維數(shù)據(jù)以獲得故障檢測(cè)指標(biāo),即二次統(tǒng)計(jì)量。由于懸浮系統(tǒng)中部分?jǐn)?shù)據(jù)呈非高斯分布導(dǎo)致二次統(tǒng)計(jì)量也呈非高斯分布的問題,使用Box-Cox變換將每種類別下建立的二次統(tǒng)計(jì)量轉(zhuǎn)換為高斯分布變量,并利用高斯分布的置信區(qū)間來確定異常閾值。實(shí)驗(yàn)結(jié)果表明,本文方法能有效檢測(cè)出4類異常,而且與基于K-medoids的方法和基于SVDD的方法相比,能更有效地檢測(cè)出4類異常。

本文方法的貢獻(xiàn)主要有:

(1)利用懸浮系統(tǒng)的多維健康數(shù)據(jù),提出了一種基于改進(jìn)的CCA的多維時(shí)間序列異常檢測(cè)方法,該方法對(duì)4類異常的檢測(cè)率都在96%以上。

(2)使用Box-Cox變換將每種類別下建立的二次統(tǒng)計(jì)量轉(zhuǎn)換為高斯分布變量,解決了呈非高斯分布的二次統(tǒng)計(jì)量導(dǎo)致傳統(tǒng)閾值設(shè)定不合理的問題。

作者貢獻(xiàn)聲明:

王平:算法研究的執(zhí)行人,構(gòu)造新的算法,完成數(shù)據(jù)分析和實(shí)驗(yàn)驗(yàn)證、論文初稿的寫作。

梅子:數(shù)據(jù)分析,論文寫作與修改。

龍志強(qiáng):研究的構(gòu)思者及負(fù)責(zé)人。

猜你喜歡
站間高斯分布類別
利用Box-Cox變換對(duì)移動(dòng)通信中小區(qū)級(jí)業(yè)務(wù)流量分布的研究
2種非對(duì)稱廣義高斯分布模型的構(gòu)造
站間未設(shè)通過信號(hào)機(jī)的區(qū)間紅燈轉(zhuǎn)移問題探討
一種基于改進(jìn)混合高斯模型的前景檢測(cè)
單線自動(dòng)站間聯(lián)系電路的改進(jìn)
ZPW-2000A站間聯(lián)系電路的改進(jìn)
服務(wù)類別
基于AFC數(shù)據(jù)的城軌站間客流量分布預(yù)測(cè)
論類別股東會(huì)
商事法論集(2014年1期)2014-06-27 01:20:42
中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
县级市| 普宁市| 陕西省| 岑巩县| 青冈县| 大埔区| 老河口市| 洛川县| 嘉定区| 通山县| 宜川县| 汉阴县| 永德县| 普兰县| 徐水县| 安泽县| 固阳县| 东丰县| 左云县| 类乌齐县| 随州市| 蛟河市| 石棉县| 延庆县| 汝城县| 青浦区| 营山县| 军事| 钟祥市| 应用必备| 东安县| 巴林左旗| 延边| 泗阳县| 晋宁县| 隆林| 外汇| 聂拉木县| 汉源县| 周口市| 承德市|