張恒遠 畢肇駿 柴耀軍 章正傳
摘 ? 要:汽輪機異常檢測對于其可靠和經(jīng)濟的運行具有重要的意義。考慮到異常數(shù)據(jù)和檢測模型的敏感性和魯棒性,本文提出了一種基于序列符號的異常檢測方法,并將其應用于汽輪機回熱器的異常檢測。本文采用有限狀態(tài)機評估回熱器產(chǎn)生符號序列的后驗概率,然后基于概率估計的模型用于檢測異常。實驗結(jié)果表明,模型具有理想的性能,并且基于估計的模型具有較強的魯棒性。因此,本文所提出的方法可以很好地促進現(xiàn)有的基于符號動態(tài)分析的異常檢測方法,特別是在汽輪機異常檢測領域。
關鍵詞:有限狀態(tài)機 ?異常檢測 ?汽輪機狀態(tài)監(jiān)測
中圖分類號:TK262 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2019)02(b)-0075-02
汽輪機作為工業(yè)級是最復雜的裝置,在工業(yè)制造中扮演重要角色。然而,汽輪機的日常的維護對于檢測異常和消除故障來說是一個巨大的挑戰(zhàn)。自從Urban[1]首次涉及EHM研究以來,許多技術和方法在這個領域得到了很好的應用。以往的工作主要集中在2種方法,基于模型的異常檢測和基于數(shù)據(jù)驅(qū)動的異常檢測。汽輪機異常的檢測模型既需要靈敏度又要求魯棒性。與主成分分析(PCA),人工神經(jīng)網(wǎng)絡(ANN)和貝葉斯方法[2]等其他方法相比,符號動態(tài)濾波(SDF)[3]在異常檢測領域都有較好的靈敏度和魯棒性。
本文結(jié)合汽輪機運行的實際情況,建立基于SDA的符號化異常檢測模型,用于檢測汽輪機高壓缸效率異常。本文的結(jié)構如下,在第2節(jié)中,給出了關于動態(tài)符號分析的初步數(shù)學理論和數(shù)據(jù)的符號分區(qū)方法。第3節(jié)提出了有限狀態(tài)機訓練和異常檢測模型。因此,第4節(jié)對實驗結(jié)果和分析進行了闡述,第5節(jié)簡要進行了討論。
1 ?有限狀態(tài)機模型和數(shù)據(jù)符號化方法
1.1 有限狀態(tài)機模型
假設在當前t時刻,一個系統(tǒng)的狀態(tài)為,同時該系統(tǒng)產(chǎn)生了一個可觀測的符號。其中系統(tǒng)的狀態(tài)不可見而符號可見,因此一個給定長度的隱狀態(tài)序列也會產(chǎn)生一個可見的觀測序列。我們稱這種模型為有限狀態(tài)機(Finite State Machine)。
1.2 數(shù)據(jù)符號化
在汽輪機狀態(tài)監(jiān)測中,傳感器觀測到的所有運行數(shù)據(jù)都是連續(xù)的,無法自動獲取多個離散符號的條件。因此在本節(jié)中,我們將重點放在可以分散表示不同負荷條件的符號提取上。在本文中,數(shù)據(jù)資源來自某330MW亞臨界機組,實時參數(shù)取自SIS系統(tǒng)。在FSM中,隱藏狀態(tài)和可見符號的數(shù)量都是有限的,所以我們將一種聚類方法應用于符號提?。篕均值聚類。本文中,有7個集群對應7種不同的負荷條件。因此在這里,KM模型的k=7。
2 ?有限狀態(tài)機建模和異常檢測方法
在汽輪機性能異常檢測中建立序列符號模型的主要任務是構建一個有限狀態(tài)機來估計出現(xiàn)異常序列的概率,建立檢測模型來定義序列是否異常。
本文建立了一個估計模型來計算FSM產(chǎn)生一個符號序列的概率。在這種情況下,通過排除異常樣本的訓練數(shù)據(jù)構建有限狀態(tài)機模型,在計算得到測試數(shù)據(jù)中包含的異常序列的概率就會很低。異常檢測的流程是:首先,將數(shù)據(jù)按長度為T的初始滑動窗口分割成時間序,然后將數(shù)據(jù)分為訓練數(shù)據(jù)和測試數(shù)據(jù)兩部分。訓練數(shù)據(jù)被用來構造FSM,估計未知狀態(tài)和可見符號的傳輸和激活概率,測試數(shù)據(jù)被用來評估FSM的性能。對FSM進行建模后,將通過異常檢測策略對性能進行測試。通過不斷更新長度T直到模型達到最佳性能。
2.1 有限狀態(tài)機訓練
訓練有限狀態(tài)機的主要任務是確定隱狀態(tài)之間的轉(zhuǎn)移概率aij和隱狀態(tài)向外發(fā)出可見符號的激活概率bjk。本文采用Baum-Welch算法來進行概率估計。定義一個前向遞歸概率,如式(3)所示。
2.2 基于有限狀態(tài)機的異常檢測模型
通過A部分利用訓練數(shù)據(jù)中的正常樣本建立的有限狀態(tài)機模型,就可以用該模型對測試數(shù)據(jù)進行異常檢測。測試數(shù)據(jù)中包含異常樣本和正常樣本,當模型計算正常樣本的可見符號的序列時,概率值會比估計異常樣本的概率要高得多,通過合理確定分類閾值即可實現(xiàn)異常檢測。
首先,設定分類閾值θ,當一個測試序列送入模型時,逐一計算序列中每個可見符號的概率乘積,得到最終的概率。當時,則表示系統(tǒng)處于正常狀態(tài),反而,說明系統(tǒng)處于異常狀態(tài)。需要指出的是,這種異常檢測方法的性能不僅取決于有限狀態(tài)機的訓練效果,還取決于分類閾值的選取。因此,為了得到最佳性能,我們遍歷θ的取值,直到達到最佳效果。
3 ?實驗設計和結(jié)果分析
3.1 模型評價指標
在模型的訓練與測試中,假設正常的樣本被標記為“正類(Positive)”,異常的樣本被標記為“負類(Negative)”。當一個正類樣本被正確地識別時,這個樣本就被稱為“正確的正類(True Positive)”,當一個負類樣本被錯誤的識別成正類時,這個樣本就被稱為“錯誤的正類(False Positive)”。同理,當一個負類樣本被正確地識別時,稱為“正確的負類(True Negative)”,當一個正類樣本被錯誤地分為負類時,稱“錯誤的負類(False Negative)”,因此每個樣本都有四種可能的標記。
3.2 實驗案例和結(jié)果
首先本文給出了兩個典型的檢測樣本的序列:一個是正??常的序列,另一個是異常的序列。所選擇的序列長度為T= 0,即10min采樣間隔,共100min。表1給出了交叉驗證中每個數(shù)據(jù)組的模型性能,模型的TPrate=0.9192,TNrate=8661??梢缘贸鼋Y(jié)論,在T=10,θ=0.00743的條件下,該估計模型很好地檢測汽輪機高壓缸效率異常。但是,正如前面所分析的,分類閾值的選取會嚴重影響檢測性能。 因此,需要進一步討論閾值對分類模型效果的影響。
4 ?結(jié)語
異常檢測的基本任務是從大量看似正常的數(shù)據(jù)中發(fā)現(xiàn)異常。許多傳統(tǒng)的點異常的檢測方法大都建立在連續(xù)的實時傳感器觀測上。尤其對于汽輪機這種大型設備。噪聲、工況波動或環(huán)境條件的變化都包含在原始數(shù)據(jù)中,大量的擾動淹沒了異常數(shù)據(jù)的特征。然而異常特征往往隱藏在反映設備運行狀態(tài)的各種結(jié)構化的數(shù)據(jù)中。汽輪機由于其結(jié)構復雜,工作環(huán)境惡劣,導致設備的異常檢測非常困難,尤其是實現(xiàn)早期的異常檢測。本文提出了基于符號分析學的異常檢測辦法,通過構建馬爾科夫概率模型分析符號化序列的后驗概率,能夠很大程度上消除由于各種干擾因素導致的異常檢測結(jié)果的偏離。這種方法在大型設備的異常檢測中具有很好的指導意義。
參考文獻
[1] Urban, Louis A. Gas Path Analysis Applied to Turbine Engine Condition Monitoring.[J].Journal of Aircraft 1973,10(7):400-406.
[2] Rao, Chinmay, et al. Review and comparative evaluation of symbolic dynamic filtering for detection of anomaly patterns. Signal, Image and Video Processing,2009,3(2):101-114.
[3] Ray, A. Symbolic dynamic analysis of complex systems for anomaly detection[J].Signal Processing,2004,84(7):1115-1130.