国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于掩碼自編碼器的小樣本深度學習道岔故障診斷模型

2022-12-16 03:37:30徐長明盧佩玲董賀超史維利
中國鐵道科學 2022年6期
關鍵詞:掩碼道岔編碼器

李 剛,徐長明,龔 翔,盧佩玲,董賀超,史維利

(1.中國鐵道科學研究院 研究生部,北京 100081;2.中國鐵道科學研究院集團有限公司 通信信號研究所,北京 100081;3.中國鐵道科學研究院集團有限公司 國家鐵路智能運輸系統(tǒng)工程技術研究中心,北京 100081;4.東北大學秦皇島分校 計算機與通信工程學院,河北 秦皇島 066004;5.河北環(huán)境工程學院 信息工程系,河北 秦皇島 066102;6.中國鐵路沈陽局集團有限公司 吉林電務段,吉林 吉林 130051)

道岔轉轍機作為鐵路信號系統(tǒng)重要的基礎設備之一,其工作狀態(tài)正常與否直接關系到運輸效率和行車安全。根據(jù)鐵路行業(yè)的統(tǒng)計數(shù)據(jù),在發(fā)生故障的信號設備中道岔轉轍機的故障約占39%[1],占比較高,也說明了道岔轉轍機的故障率很高。目前道岔轉轍機設備的日常維護和故障處理,主要依據(jù)信號集中監(jiān)測系統(tǒng)提供的道岔動作曲線,信號集中監(jiān)測系統(tǒng)能提供簡單的預警和報警功能,但主要分析還是依靠人工瀏覽判斷來完成,勞動強度很大,且容易出現(xiàn)漏判和錯判情況。因而亟須設計出準確、可靠和高效的故障診斷系統(tǒng),能夠自動判斷出故障及其原因,指導現(xiàn)場維修人員快速處理故障,切實提高維護效率和水平。

目前,國內(nèi)許多相關學者通過道岔動作曲線對道岔故障診斷技術進行了研究。趙林海等[2]主要針對道岔轉轍機典型故障下的動作功率曲線變化規(guī)律,提出1種基于灰關聯(lián)的道岔故障診斷方法,通過采用Fisher準則對相應故障模式對應的特征向量進行選擇,通過優(yōu)化分辨系數(shù)并計算待測樣本與各故障模式特征間的灰色關聯(lián)度,將滿足門限要求的最大灰色關聯(lián)度對應的故障模式作為待測樣本的故障診斷結果。張凱等[3]在分析提速道岔動作電流曲線變化規(guī)律的基礎上,提出1 種基于BP 神經(jīng)網(wǎng)絡的提速道岔故障智能診斷算法,通過設計BP 神經(jīng)網(wǎng)絡對提速道岔特征向量與道岔故障類型的映射樣本集進行訓練及測試。楊陽等[4]針對目前我國道岔控制電路故障后難以快速準確診斷的現(xiàn)狀,采用遺傳算法優(yōu)化支持向量機參數(shù)的方法完成對道岔控制電路的故障診斷。Zhang 等[5-6]提出通過人工參與的手段對曲線數(shù)據(jù)進行故障特征提取,從而建立相應的故障特征矩陣,將其轉換為BP 神經(jīng)網(wǎng)絡的輸入,以此進行故障識別。鐘志旺等[7]提出基于主題模型PLSA 和支持向量機SVM 的道岔設備故障特征提取與診斷方法,通過分詞算法將故障文檔表達在詞項特征空間中。謝博才等[8]介紹了一些傳統(tǒng)機器學習手段在道岔故障診斷研究中的應用,包括特征提取方法、聚類分析研究及一些神經(jīng)網(wǎng)絡模型的使用。Shi 等[9]提出1 種基于半監(jiān)督學習算法的道岔動作曲線故障狀態(tài)診斷方法。池毅等[10]提出采用一維卷積捕捉空間結構實現(xiàn)端到端的故障診斷,降低模型的計算量、提高模型的抗噪性能。李婉婉等[11]基于GMM 聚類和PNN 進行了道岔故障診斷的研究。劉應君等[12]基于粒子群的支持向量機算法,提出1種補償距離評估技術。鄭云水等[13]針對道岔健康狀態(tài)評估及故障檢測,采用了基于相似度的方法,用SURF算法進行特征提取,并用Hausdorff 距離計算待識別曲線與標準曲線間的相似度。許慶陽等[14]提出了基于隱馬爾科夫模型的道岔故障診斷方法。以上研究主要是基于道岔轉轍機的功率曲線、電流曲線等數(shù)據(jù)對道岔轉轍機進行故障預測和診斷,探索出了多種經(jīng)實驗室測試驗證的有效故障診斷方法。但這些方法都面臨著1個共同的問題:故障樣本過少,部分文獻報告研究所使用的故障案例數(shù)量多為每種幾十條。為解決此問題,一些研究者通過加入多種多樣的具體先驗知識,以彌補故障數(shù)據(jù)少導致故障特征難以提取的不足。然而,大部分此類先驗知識因缺乏靈活性,往往會限制模型的學習能力,尤其會限制模型的泛化能力。

近年來,研究人員在深度學習方面的研究取得了長足的進步。尤其是2015年以來,谷歌、微軟等企業(yè)在自然語言、圖像等領域中,通過采用模型的預訓練方法[15]推動深度學習技術取得了跨越式發(fā)展,著名的BERT[16]和GPT-3[17]等模型在各知名大數(shù)據(jù)集上的評測結果提升明顯。預訓練方法有3個關鍵技術:基于注意力機制的變壓器[18]、基于掩碼的自監(jiān)督[19]以及微調技術。深度學習技術的快速發(fā)展,為研究道岔故障診斷技術提供了新的途徑。

本文提出1 種無須具體先驗知識的端到端[19-20]的基于掩碼自編碼器的小樣本深度學習[21-22]模型,可基于常識性約束和結構化約束[23-24]等多個約束實現(xiàn)端到端的聯(lián)合優(yōu)化,解決小樣本故障診斷問題。

1 道岔電流曲線及故障類型

1.1 電流曲線

研究對象為ZYJ7 型轉轍機,信號集中監(jiān)測系統(tǒng)采集的正常ABC三相動作電流曲線如圖1所示。

圖1 ZYJ7型轉轍機三相動作電流曲線

道岔轉轍機執(zhí)行1 次動作的完整過程可大致分為以下9 個階段。(1)T1—T2 階段:道岔1 啟動繼電器(1DQJ)吸起,道岔1 啟動復示繼電器(1DQJF)未吸起,此時還監(jiān)測不到電流。(2)T2—T3階段:1DQJ與1DQJF均被吸起,道岔2啟動繼電器(2DQJ)未轉極,即啟動電源加在了表示電路上,曲線上形成了小的臺階,但時間持續(xù)很短。(3)T3—T4 階段:2DQJ 轉極后,接通道岔啟動電路,電機上電,曲線上形成了1 個電流峰值。(4)T4—T5 階段:轉轍機解鎖,該段曲線稱作道岔解鎖曲線。(5)T5—T6 階段:道岔轉換過程,三相電流大小基本一致。(6)T6—T7 階段:道岔鎖閉。(7)T7—T8 階段:自動開閉器接點斷開,啟動電路接通表示電路,三相電流值均出現(xiàn)1個小的下降過程。(8)T8—T9 階段:在1DQJ 緩放時間內(nèi),啟動電源A相與B相或C相,加在了表示電路上,形成了電流約0.5 A,長度小于1 s的小臺階曲線。(9)T9—T10 階段:1DQJ 由前接點斷開到后接點接通,1個完整的道岔動作過程就完成了。

1.2 故障類型

運行中的道岔轉轍機設備出現(xiàn)故障屬于偶發(fā)個例,故障道岔電流曲線數(shù)據(jù)也就非常少見。通過在多個車站長期搜集,記錄到了一些道岔轉轍機故障電流和電壓曲線數(shù)據(jù)。結合現(xiàn)場專家經(jīng)驗,對發(fā)生概率較高的故障案例進行了總結,歸納出6 種ZYJ7 型交流轉轍機的典型故障類型,分別用類型F1—F6表示,為方便處理,其余故障一概歸為類型F7,詳見表1。6 種典型故障案例所對應的曲線故障形態(tài)如圖2 所示。后續(xù)隨著運用積累,故障類型還可以不斷擴充。

表1 ZYJ7交流轉轍機典型故障

圖2 典型故障案例曲線

2 基于掩碼自編碼器的小樣本深度學習模型

為解決道岔故障曲線樣本少的問題,提出基于掩碼自編碼器的小樣本深度學習模型,在編碼器結構中借鑒預訓練變壓器的位置編碼技術,以便捕獲曲線形態(tài)的位置信息;在神經(jīng)網(wǎng)絡訓練中采用掩碼技術對數(shù)據(jù)進行擴充,從而滿足深度學習對數(shù)據(jù)量的基本要求;同時,也增加自監(jiān)督信號,以便強制還原被掩碼的數(shù)據(jù),迫使神經(jīng)網(wǎng)絡學習電流曲線數(shù)據(jù)中的結構知識。

2.1 數(shù)據(jù)預處理

ZYJ7 型轉轍機正常轉換1 次時間大約為6 s 左右,每個正常的動作電流曲線數(shù)據(jù)可以由3×150型矩陣描述。其中,3 表示它由A,B,C 三相電流曲線構成,150 表示它沿時間軸延伸了150 維(150 個時刻,信號集中監(jiān)測系統(tǒng)每40 ms 采集1 個數(shù)據(jù)點)。而在故障發(fā)生的情況下轉換時間最長可以達到20 s 左右,這時數(shù)據(jù)維度高達500維,因此,統(tǒng)一設定樣本數(shù)據(jù)為500維,對不足500 維的原始曲線數(shù)據(jù)進行補0 處理,同時將500 維的道岔動作電流曲線均勻地劃分為50個分段。

2.2 模型結構

該模型包含數(shù)據(jù)預處理、掩碼處理和深度神經(jīng)網(wǎng)絡3 個部分,模型總體結構如圖3 所示。圖中:w1和w2分別為編碼器和解碼器對應的網(wǎng)絡權重參數(shù);w3—w5分別為故障診斷網(wǎng)絡中的各子網(wǎng)絡權重參數(shù);Zm為自編碼器中間層m維空間隱變量;X∈Rd表示輸入層與輸出層均為實數(shù)R的d維空間數(shù)據(jù);P∈Rn表示故障診斷網(wǎng)絡的輸出結果為n維的實數(shù)向量。

圖3 基于掩碼自編碼器的小樣本深度學習模型

由圖3 可以看出:首先,對經(jīng)過數(shù)據(jù)預處理的曲線原始數(shù)據(jù)進行掩碼處理,即對曲線的50 個分段進行掩碼,掩碼處理模塊右側的圖形為掩碼后的曲線示意圖,灰色方塊代表相對應的曲線分段被遮蓋;其次,經(jīng)過掩碼后的曲線數(shù)據(jù)被送入位置編碼層,位置編碼層每次都對曲線的50 個分段分別疊加,組成曲線數(shù)據(jù)點的數(shù)值保持不變,從而形成彼此之間各不相同的50個6維位置編碼;然后,經(jīng)過位置編碼后的曲線數(shù)據(jù)被送入自編碼器,自編碼器由編碼器(Encoder)和解碼器(Decoder)組成,編碼器的輸出除了送給解碼器以便重建輸入曲線之外,還作為故障診斷網(wǎng)絡的低維輸入,自編碼器右側的圖形為重建后的輸入曲線示意圖;網(wǎng)絡輸出了被掩碼處理去除部分的曲線段,損失函數(shù)會約束輸出使其盡量還原成對應的輸入部分(圖中未被灰塊遮蓋部分);故障診斷網(wǎng)絡由多層全連接層、故障分類子網(wǎng)絡和故障位置子網(wǎng)路組成,分別負責曲線故障類型和故障時刻診斷;由于采用了并列輸出的模型結構,編碼器同時影響了解碼器、故障分類子網(wǎng)絡及故障位置子網(wǎng)絡,這些輸出上的損失也將會反向傳播回編碼器,不斷優(yōu)化編碼器網(wǎng)絡;最終,整個訓練過程是以上多個約束共同作用的聯(lián)合優(yōu)化過程。

2.2.1 掩碼處理

掩碼處理能把原始故障樣本處理成更多的新樣本,也能給正常樣本添加額外的約束,從而更好地降噪和獲得數(shù)據(jù)本身的深層結構信息。掩碼的一般處理過程如圖4所示。

圖4 掩碼處理過程示意圖

將500維的道岔動作電流曲線均勻地劃分為50個分段,并將其輸入到掩碼處理層,掩碼處理層隨機掩碼50 個分段中的1—2 個分段。在輸入端,被掩碼的分段數(shù)據(jù)替換成0,和未被掩碼的分段一起送入神經(jīng)網(wǎng)絡。在輸出端,被掩碼的原始分段將作為解碼器輸出的監(jiān)督信號。

通過隨機掩碼處理,小樣本故障數(shù)據(jù)擴充成大量樣本。例如,通過設置G組不同的隨機掩碼方式,對n條故障曲線數(shù)據(jù)的不同數(shù)據(jù)段進行隨機遮蓋,由此可以產(chǎn)生n×G組不同的結果。通過這種簡單的變換,小樣本的故障曲線數(shù)據(jù)可以成倍添加至訓練集中,更好地完成模型的學習與訓練。

此外,利用掩碼變換還相當于讓模型從多個角度看待同一條原始數(shù)據(jù),反復在不同的輸入中向網(wǎng)絡回放相同的正常特征和故障特征。通過讓網(wǎng)絡在部分輸出端重構輸入數(shù)據(jù),約束網(wǎng)絡盡早學會提取數(shù)據(jù)分段之間的結構關系,獲得原始數(shù)據(jù)良好的低維嵌入表示,進而全面提升網(wǎng)絡的預測和泛化能力。

2.2.2 位置編碼層

位置編碼層負責為曲線的50 個分段分別進行位置編碼。文獻[16]提出了1 種基于三角函數(shù)的位置編碼算法,本文模型也采用該算法對位置進行編碼,表達式為

式中:P為進行位置編碼后得到的d維向量;pos為分段曲線序列數(shù)據(jù)的次序號,pos=1,2,…,50;2i和2i+1 分別為分段曲線d維位置編碼中各個偶數(shù)分量和奇數(shù)分量的次序號,i=1,2,…,d/2。

式(1)和式(2)表明,特征向量的偶數(shù)位置元素用正弦函數(shù)計算,奇數(shù)位置的元素用余弦函數(shù)計算。

在位置編碼層,為經(jīng)過隨機掩碼后的每個曲線分段增加了1 個6 維的位置編碼。具體過程為:將進入位置編碼層的50 個分段曲線,通過50 個彼此獨立無關的非線性變換轉換成6維,再與計算得到的位置編碼P相加,就完成了位置編碼。

被掩碼的分段曲線設置為0 向量,由于位置編碼非0,神經(jīng)網(wǎng)絡依然可以區(qū)分哪1 段曲線從輸入中被去除了。

2.2.3 自編碼器

自編碼器包含編碼器和解碼器2 部分。編碼器是為了將輸入信息映射到某個更低維度的空間,生成包含重要特征的編碼Zm,可用函數(shù)h=f(x)表示(h為編碼器函數(shù),x為輸入變量);解碼器是將特征編碼重構為盡量能還原出原輸入的結果,用函數(shù)r=g(h)表示(g為解碼器函數(shù))。自編碼器的目的就是盡量使g(f(x))=x。

編碼器依據(jù)曲線序列數(shù)據(jù)通過位置編碼后的有效值提取特征,并輸出相應的曲線特征向量到解碼器。解碼器則根據(jù)這些特征向量,重構曲線時間序列數(shù)據(jù),同時將掩碼處理層進行隨機掩碼后的曲線序列進行還原,至此模型學到重要特征之間的聯(lián)系。

在掩碼處理層完成對樣本的部分特征隨機掩蓋操作后,利用樣本的部分特征預測被掩蓋掉的曲線特征以訓練自編碼器。這樣可以讓自編碼器盡量保留樣本結構特征信息,在后續(xù)聯(lián)合故障診斷網(wǎng)絡實現(xiàn)共同優(yōu)化,形式化表達式如式(3)。在自編碼器部分采用MAE[25]的網(wǎng)絡結構。

式中:z為編碼網(wǎng)絡輸出的樣本編碼;xmask為解碼器輸出的預測原樣本被掩碼位置的部分信息表達;Encoder()和Decoder()分別為基于mask 思想的編碼器和解碼器。

通過最小化預測的掩碼信息、原始樣本掩碼信息的距離及后續(xù)故障診斷網(wǎng)絡的損失函數(shù)(損失函數(shù)將在2.7節(jié)給出),共同指導自編碼器的訓練。

2.3 故障診斷網(wǎng)絡

故障診斷網(wǎng)絡是把隱變量z作為輸入,用多層前饋網(wǎng)預測z在嵌入空間得到各個故障時刻的概率分布。分別從故障分類和故障時刻2 個方面的擬合操作去指導自編碼器對樣本的信息提取過程。故障診斷網(wǎng)絡是由多層全連接層、故障分類子網(wǎng)絡和故障位置子網(wǎng)絡組成。把經(jīng)過位置編碼的樣本輸入編碼網(wǎng)絡得到的低維特征表示輸入故障診斷網(wǎng)絡,得到1個共同的樣本編碼;然后將這個共同的樣本編碼分別傳入故障分類子網(wǎng)絡和故障位置子網(wǎng)絡。故障分類子網(wǎng)絡是輸出維度為故障類型數(shù)量維度的編碼器,其輸出經(jīng)過模型判定后曲線分別屬于F0—F6故障類型的概率分布,F(xiàn)0—F6概率分布的總和為1(其中,F(xiàn)0為正常曲線數(shù)據(jù),F(xiàn)1—F6為待診斷的故障類型),其中預測結果中最大的概率值即表示模型對該條曲線進行故障診斷后的預測結果。故障位置子網(wǎng)絡是輸出維度為50 維的編碼器,這50 維分別對應原始樣本的50 段發(fā)生故障的概率分布,每段分布的概率用0 或1 表示。即在該種故障類型下,曲線最有可能是哪段時刻(0—49 段)發(fā)生了故障。在做到故障診斷分類問題的同時,快速診斷出故障時刻。形式化表達式為

式中:Estk()為子評估網(wǎng)絡,k∈[1,3];zlatent為編碼器輸出的隱變量;p1和p2分別為2 個子網(wǎng)絡預測的樣本編碼。

本文搜集了ZYJ7 轉轍機的6 類常見故障,如果新增M類故障,修改神經(jīng)網(wǎng)絡的輸出層為M+6維,在新數(shù)據(jù)集上進行訓練即可。如果M較大,可以適當修改網(wǎng)絡的拓撲結構,以相對復雜的網(wǎng)絡模型進行訓練。

2.4 損失函數(shù)

故障診斷網(wǎng)絡通過聯(lián)合掩碼表達的損失函數(shù),共同引導自編碼器從位置結構和擬合類別分布特征角度訓練優(yōu)化。損失函數(shù)由4 部分構成,用L(x,w)表示要學習的變量x關于參數(shù)w的損失函數(shù),表達式為

式中:L1為曲線重構階段的損失函數(shù);x為原輸入曲線特征;x'為模型輸出重構后的曲線特征;w1和w2為自編碼器部分的權值矩陣;L2為故障診斷網(wǎng)絡中故障分類子網(wǎng)絡預測階段的損失函數(shù);w1,w3和w4分別為該網(wǎng)絡中的權值矩陣;L3為故障診斷網(wǎng)絡中故障位置子網(wǎng)絡預測階段的損失函數(shù),其權值矩陣對應分別為w1,w3和w5;L4為w1,w2,w3,w4和w5這幾組參數(shù)聯(lián)合構成的正則化損失函數(shù)。

模型通過端到端聯(lián)合優(yōu)化的方式,通過預測的樣本和實際的樣本產(chǎn)生的誤差反向傳播指導網(wǎng)絡參數(shù)學習,共同作用使得損失函數(shù)L達到最小。

3 試驗驗證

3.1 試驗環(huán)境和試驗數(shù)據(jù)

在上節(jié)所提模型基礎上構建試驗驗證環(huán)節(jié),無須GPU 服務器等特殊的硬件條件,僅在普通個人計算機上即可訓練,并可以實時作出預測。代碼在PyTorch1.7 框架下編寫和調試。試驗數(shù)據(jù)為某站ZYJ7型轉轍機實際運行數(shù)月所產(chǎn)生的7 905條正常道岔電流數(shù)據(jù)和40 條故障道岔電流數(shù)據(jù),40 條故障數(shù)據(jù)涵蓋了6類故障。把數(shù)據(jù)劃分成50段,每段包含10個時刻的三維電流曲線。首先,按照圖4把曲線進行掩碼處理;然后,再把全部相同的曲線進行去重操作,最終將故障曲線數(shù)據(jù)變?yōu)? 800條,其中600 條數(shù)據(jù)每條有1 段被掩碼,另外4 200 條數(shù)據(jù)每條有2 段被掩碼。正常數(shù)據(jù)隨機掩碼其任意2段,掩碼后的數(shù)據(jù)量還保持7 905 條不變。為了保證各類故障數(shù)據(jù)的分布均衡,將正常數(shù)據(jù)和各類故障數(shù)據(jù)進行分層抽樣,劃分成訓練集和測試集。具體為:正常數(shù)據(jù)按照9∶1的比例劃分,9份用于訓練,1 份用于測試;每種故障類型的數(shù)據(jù)分別按照5∶1 抽樣,5 份用于訓練,1 份用于測試。最終,數(shù)據(jù)集中各類數(shù)據(jù)的劃分結果見表2。

表2 樣本數(shù)據(jù) 條

訓練時,批的大小設定為256 個樣本;總訓練迭代次數(shù)為300次。

3.2 試驗結果

在訓練集上模型各部分損失函數(shù)、準確率及混淆矩陣的變化如圖5 所示(各圖分別出自模型第10,50,150,300 次迭代過程)。圖中:混淆矩陣中每行之和,代表各類數(shù)據(jù)的總條數(shù);第i行第j列元素為第i類故障被誤認為是第j種故障的數(shù)量。

圖5 訓練集上模型的表現(xiàn)

由圖5 中不同次數(shù)迭代后損失函數(shù)及準確率變化曲線可以看出:(1)隨著訓練次數(shù)的增加,模型的損失函數(shù)很快達到收斂;(2)綠色曲線一開始方差較大,但下降很快并持續(xù)下降接近0,后期的方差也變小了,這表明模型診斷故障的能力持續(xù)提升,并最終穩(wěn)定在高水平;(3)藍色曲線開始下降很快,并維持損失不變,表明自編碼器很早就學會了原始數(shù)據(jù)較為恰當?shù)牡途S表示;(4)紅色曲線始終維持較小的損失,表示故障位置子網(wǎng)絡的預測很準確,這與故障曲線中故障發(fā)生的時間有明顯且簡單的規(guī)律性有關;(5)代表總損失的黃色曲線也在持續(xù)下降,表明網(wǎng)絡在訓練集上收斂較快,大概在迭代150 次左右就已經(jīng)達到了很低的數(shù)值,第150次之后的進步,從曲線中很難讀出,但是可以在隨后介紹的混淆矩陣中看得很清楚;(6)診斷準確率曲線在震蕩上升,前期方差較大,后期方差變小,說明學習過程穩(wěn)定且收斂。

由圖5 不同次數(shù)迭代后混淆矩陣可以看出:除F4和F5類故障外,其他類型故障都被很好地進行了分類,造成這一現(xiàn)象的原因是模型區(qū)分F4和F5類故障的關鍵特征被遮蔽掉了,而曲線未被遮蔽掉的其余部分特征表明當前故障為F4類或F5類故障;在混淆矩陣對角線上是故障被正確分類的條數(shù);對角線上的個數(shù)值越大,表示預測效果越好?;煜仃囌故玖松窠?jīng)網(wǎng)絡學習逐漸改正錯誤的過程。網(wǎng)絡最開始傾向于把故障曲線預測為占絕大多數(shù)的正常曲線類別,經(jīng)過一定次數(shù)的迭代之后,才逐漸分類正確。如前文所述,在損失函數(shù)和準確率曲線變化不明顯時,混淆矩陣能夠展示更多細節(jié)。例如,對于迭代150 次的F1類故障,仍然有15 條被錯誤預測為F6類故障,但到了第300次,則全部F1類故障都被準確識別出來。

各故障類型的識別準確率見表3,表中F00為故障類型F0被正確識別的概率。由表3可知:模型在訓練集上的總體準確率達到了98.9%,優(yōu)于文獻[1]中采用CNN-GRU方法的95%的準確率。

表3 訓練集上的識別準確率

在測試集上模型各部分損失函數(shù)、準確率及混淆矩陣的變化如圖6 所示。由圖6 可以看出:在測試集上3 類損失函數(shù)曲線均接近0,表明模型在測試集上表現(xiàn)優(yōu)異,具有穩(wěn)定的泛化能力;各類型的曲線基本集中在了混淆矩陣的主對角線上,表明模型預測效果很好。

圖6 測試集上模型的表現(xiàn)

模型在測試集上的準確率見表4。由表4可知:模型在測試集上的總體準確率達到98%以上,與在訓練集上的表現(xiàn)接近,表明模型泛化能力強。

表4 測試集上的識別準確率

T-SNE 降維算法不具有預測能力,但具有較好的解釋性,采用該算法來說明用于試驗的訓練集樣本的分布特征。對經(jīng)過掩碼后的所有訓練集樣本采用T-SNE 算法進行降維,其二維可視化結果如圖7所示。圖中:每個不同顏色的散點數(shù)字代表該故障類型的1 個或多個樣本(可能重疊);紅色代表正常樣本;綠色、紫色和橙色分別代表故障類型F3,F(xiàn)4和F5。由圖7 可以看出:代表正常樣本(紅色)的0聚集程度較好,但分散半徑較大說明正常樣本的個體也有較大差異,因此,正常樣本總體質量較好,但存在不同程度的噪聲;異常樣本則較為分散,一些異常樣本聚集程度比較明顯,例如故障類型F3(綠色);前文試驗中混淆矩陣中顯示難以劃分的故障類型F4和F5曲線,在二維可視化圖中也出現(xiàn)了重疊(中上方位置紫色的4 和橙色的5),說明其確實難以辨別。

圖7 故障診斷分類可視化結果

在普通的個人計算機上(CPU:AMD Ryzen7 5800U;主頻:1.90 GHz;內(nèi)存:16 G;64位操作系統(tǒng)),算法的代碼實現(xiàn)基于PyTorch1.7框架。迭代訓練300 次需要105 s,神經(jīng)網(wǎng)絡模型預測的速率大約為3×104條·S-1電流曲線,具有很強的實時性。

3.3 試驗方案的優(yōu)勢和不足

機器學習的目的在于對從未見過,但與訓練數(shù)據(jù)服從相同分布的數(shù)據(jù)進行很好的預測,即在所有可能的測試集上的期望誤差,即泛化誤差要小。根據(jù)誤差分解理論:泛化誤差=偏差+方差+噪聲。其中,擬合能力強的模型,偏差較??;當數(shù)據(jù)集較小的情況下,更換數(shù)據(jù)集導致數(shù)據(jù)分布發(fā)生劇烈變化,測試集上的誤差的方差較大,表明泛化能力差;噪聲是不可學習的,噪聲大代表所學習的任務難度大。

由于缺乏一致認可的基準數(shù)據(jù)集,各研究均采用含有私有數(shù)據(jù)的非公開數(shù)據(jù)集,因此評價指標僅在一定的置信區(qū)間下表現(xiàn)出統(tǒng)計意義。需要指出,絕大多數(shù)關于道岔故障診斷的研究,所采用的數(shù)據(jù)集都是小樣本(幾十條、上百條數(shù)據(jù)),這會導致評價指標的方差很大,即更換成不一樣的數(shù)據(jù)集以后,評價指標大概率會發(fā)生較大變化。

在魯棒性上,本文試驗方案顯著優(yōu)于現(xiàn)有方法。主要體現(xiàn)在:采用的深度學習模型參數(shù)相對多、模型復雜、擬合能力強、偏差小;通過掩碼進行了數(shù)據(jù)擴充,增加了訓練數(shù)據(jù)量,擴充后的訓練集數(shù)據(jù)多達11 114條,測試集數(shù)據(jù)達到了1 591條,會顯著降低方差;噪聲不可學習,如果模型擬合了噪聲就一定會過擬合,直接使用少量數(shù)據(jù)訓練出來的模型難免會過擬合,而深層的神經(jīng)網(wǎng)絡模型在對抗過擬合方面有很大優(yōu)勢。

本文試驗方案也存在不足,主要體現(xiàn)在以下2個方面。

一方面,可能存在“一定程度”的數(shù)據(jù)泄露。在本文中,測試集中的每條數(shù)據(jù)都是由訓練集中的數(shù)據(jù)的特征片段拼接而成,在一定程度上訓練數(shù)據(jù)向模型泄露了測試集上的信息。為了緩解“特征泄露”的影響,在訓練時,給訓練集數(shù)據(jù)的輸入上加入了高斯白噪聲。具體地,在輸入數(shù)據(jù)的每個維度上都加入噪聲分量ε~N(0,σ2),σ=0.1。

另一方面,掩碼可能導致一部分關鍵特征丟失。圖5 和圖6 的F4和F5故障類型比較接近,但是由于隨機掩碼,掩碼后的數(shù)據(jù)和標簽之間缺乏典型的函數(shù)映射關系,使數(shù)據(jù)標簽看起來具有隨機性,這就人為地在標簽上引入了噪聲。后續(xù)將考慮設計相應的算法改善掩碼可能帶來的不確定性。

4 結論

(1)模型在道岔故障診斷領域的實際應用表明,通過現(xiàn)場采集的真實數(shù)據(jù),無須預訓練海量的道岔電流曲線數(shù)據(jù),僅需要少量的故障曲線數(shù)據(jù)及人工標簽即可完成模型的訓練,并得到了98%以上故障診斷分類準確率,同時也達到了對曲線故障發(fā)生位置作出快速定位的目的。

(2)在現(xiàn)場實際應用及測試過程中,診斷結論可靠,模型具有及時性強、準確性高等特點,可以滿足現(xiàn)場實時分析道岔電流曲線的應用需求,符合鐵路電務修護的未來發(fā)展方向。

(3)所提出的模型具有良好的魯棒性及可擴展性,對于未知的均不能劃分至F1-F6故障類型中的故障曲線,可以統(tǒng)一劃分至F7中。并且對于今后可以總結并歸納成另外1 種全新的典型故障類型,考慮將其增加并擴充至模型的訓練過程中。

猜你喜歡
掩碼道岔編碼器
中低速磁浮道岔與輪軌道岔的差異
低面積復雜度AES低熵掩碼方案的研究
通信學報(2019年5期)2019-06-11 03:05:56
場間銜接道岔的應用探討
既有線站改插鋪臨時道岔電路修改
基于FPGA的同步機軸角編碼器
基于布爾異或掩碼轉算術加法掩碼的安全設計*
通信技術(2018年3期)2018-03-21 00:56:37
基于PRBS檢測的8B/IOB編碼器設計
JESD204B接口協(xié)議中的8B10B編碼器設計
電子器件(2015年5期)2015-12-29 08:42:24
基于掩碼的區(qū)域增長相位解纏方法
基于掩碼的AES算法抗二階DPA攻擊方法研究
丹寨县| 隆林| 武川县| 来安县| 乌苏市| 同仁县| 黎平县| 阜城县| 谷城县| 金塔县| 博爱县| 鄢陵县| 濉溪县| 莱芜市| 蕉岭县| 保亭| 冀州市| 中阳县| 巴彦县| 贵溪市| 林州市| 涡阳县| 七台河市| 大同县| 白银市| 嵩明县| 建德市| 蓝田县| 邵阳县| 阿勒泰市| 姚安县| 浦城县| 崇信县| 桦南县| 河源市| 格尔木市| 鄂托克旗| 南阳市| 新干县| 南靖县| 阿城市|