馬 波,張 穎,于 雷
往復壓縮機是流程工業(yè)重要設備之一,應用廣泛,尤其在煉油、化工行業(yè)中起著至關(guān)重要的作用[1]。由于其結(jié)構(gòu)復雜,振動激勵源多,導致異常檢測困難,重大事故頻發(fā)。一旦發(fā)生故障,輕則影響生產(chǎn),重則機毀人亡,因此對往復壓縮機進行實時智能異常檢測,保障機組健康運行,具有重大意義[2]。
傳統(tǒng)檢測方式主要采集往復壓縮機振動信號,提取數(shù)據(jù)的一個或少數(shù)幾個特征,設置特征報警門限,超過門限值認為發(fā)生異常[3]。而在實際生產(chǎn)過程中由于受到外界或自身偶然因素的影響,即使在正常工況下,振動波形的特征值也可能超過報警門限,導致錯誤報警等類似狀況發(fā)生。因此,如何依據(jù)特征值變化,對設備運行狀態(tài)做出更加全面可靠的評估,減少異常檢測不及時、漏報、誤報的問題,成為當前研究的難點。
相空間廣泛應用于多個領域的狀態(tài)監(jiān)測和故障診斷。在數(shù)學與物理學中,相空間是一個用來表示系統(tǒng)所有可能狀態(tài)的空間,系統(tǒng)每個可能的狀態(tài)都有對應的相空間的點[4]。文獻[5]中運用神經(jīng)網(wǎng)絡模型構(gòu)建相空間實現(xiàn)大壩安全監(jiān)控。針對不同的系統(tǒng),運用不同的方法將數(shù)據(jù)映射入相空間,根據(jù)相空間中點的變化,可有效判斷系統(tǒng)當前狀態(tài)?;谙嗫臻g的往復壓縮機預警方法一般采用 PCA(Principal Component Analysis)和 KPCA(Kernel Principal Component Analysis)將振動波形數(shù)據(jù)高維特征映射入相空間,根據(jù)相空間中點的變化,判斷往復壓縮機系統(tǒng)當前狀態(tài)[6-7]。雖然這些方法取得了一定的效果,但是也存在一定的局限性:首先,往復壓縮機振動數(shù)據(jù)具有非線性特征,用線性方法構(gòu)造相空間分析非線性數(shù)據(jù),會弱化方法的性能。其次,核方法在一定程度上能緩解非線性帶來的影響,但是基于核的方法高度依賴于所選的核函數(shù)。因此用這些方法構(gòu)造相空間進行往復壓縮機異常檢測,會使準確率下降。
隨著機器學習發(fā)展,LDA(Latent Dirichlet Allocation)模型在多個領域得到越來越多的應用。文獻[8]用主題模型實現(xiàn)了軟件缺陷的分類。文獻[9]提出一種基于傳統(tǒng)LDA概率主題模型的文檔聚類方法,實現(xiàn)了普通文本語料庫和數(shù)字圖書語料庫的有效聚類。文獻[10]用主題模型挖掘三峽工程中的學術(shù)相關(guān)問題。LDA廣泛應用于非線性系統(tǒng)高維數(shù)據(jù)建模,只需要簡單的數(shù)據(jù)表示形式就可以建立性能良好的模型,利用LDA模型將數(shù)據(jù)映射入相空間,根據(jù)相空間中點的變化判斷機組運行狀態(tài),更適用于往復機系統(tǒng)異常檢測。
本研究提出一種基于多特征融合的相空間LDA模型的異常檢測方法。為全面涵蓋波形特征信息,首先提取了振動波形的多個特征值,并對特征值進行預處理。然后,用LDA方法計算特征分量,構(gòu)造相空間。最后,用JS(JensenShannondivergence)距離計算相空間的差異度。機組運行狀態(tài)發(fā)生變化后,相空間也會發(fā)生相應的改變,根據(jù)相空間變化的差異度,判定機組是否發(fā)生異常。
基于LDA模型的往復壓縮機異常智能診斷方法聯(lián)合數(shù)據(jù)多種特征值,建立正常數(shù)據(jù)相空間,并預測當前運行數(shù)據(jù)相空間,計算二者差異度,依據(jù)差異度實現(xiàn)往復壓縮機異常檢測,流程,如圖1所示。
圖1 基于LDA模型的異常檢測流程圖Fig.1 Flow Chart of Anomaly Detection Based on LDA Model
具體步驟如下:
(1)特征提取及特征集預處理:提取多種特征值,對特征值進行歸一化和離散化,得到離散化后的特征集。
(2)設定特征分量個數(shù)T:特征分量個數(shù)可依據(jù)經(jīng)驗進行設定,確定最優(yōu)T的最簡單的方法是用不同的T重復實驗,當評價指標如困惑度、預料似然值、分類正確率等最優(yōu)時認為此時的T是模型的最佳選擇[11、13]。
(3)構(gòu)造數(shù)據(jù)集:選擇適當組數(shù)的離散化后的特征集作為一個數(shù)據(jù)集,一般至少8組。
(4)計算相空間:用機組24h的正常運行振動數(shù)據(jù)的數(shù)據(jù)集計算特征分量及對應的相空間Q1。
(5)預測實時運行數(shù)據(jù)集相空間:根據(jù)第五步計算得到的特征分量參數(shù)預測實時運行數(shù)據(jù)集的相空間Q2。
(6)用JS距離計算實時運行數(shù)據(jù)集和正常數(shù)據(jù)集相空間的差異度,并設定機組的報警線,使異常檢測準確率最高。
(7)當機組JS距離超過報警線時,則報警,否則繼續(xù)采樣,持續(xù)監(jiān)測。
當往復壓縮機組發(fā)生異常時,振動數(shù)據(jù)會發(fā)生同步變化。振動波形數(shù)據(jù)量較大,為了實現(xiàn)往復壓縮機異常檢測,需從中提取具有代表性的特征。相較于傳統(tǒng)異常檢測特征提取方法,本研究提取信號的大量特征,保留了更多的故障征兆信息。提取特征,如圖2所示。
圖2特征值種類Fig.2 Characteristic Value Category
圖2 中的特征構(gòu)成一個特征集,對特征集預處理。特征集預處理主要包括特征值歸一化和離散化。依據(jù)故障早期和晚期數(shù)據(jù)特征對數(shù)據(jù)進行離散化,每個特征可離散化為3個特征。將每個特征離散化的結(jié)果進行聯(lián)合,得到一個離散化后的特征集。對部分離散化后的特征進行說明,如表1所示。
表1 特征說明Tab.1 Feature Description
LDA(Latent Dirichelet Allociation)模型于 2003 年提出[11],該模型通過對隱形語義索引進行拓展得到三層貝葉斯概率模型,包含詞項、主題和文檔三層結(jié)構(gòu),是文檔生成模型。其基本思想是把文檔看成隱含主題的混合,而每個主題則表現(xiàn)為與該主題相關(guān)的詞項的概率分布?;谕瑯拥乃枷耄瑢⒃撃P鸵胪鶑蛪嚎s機異常檢測,可認為,往復壓縮機在不同的運行狀態(tài)下,特征聯(lián)合概率分布在相空間上的映射是不同的。
狄利克雷分布是多項分布,可以對離散集特征分布進行評價。假設隨機變量X有k個可能狀態(tài)(x1,x2,…,xk),對X多重采樣服從狄利克雷分布。用X表示k個離散隨機元素的評價結(jié)果。則 Xi表示第 i個特征值,其中集合為 D={X1=x1,X2=x2,…,Xk=xk}。設離散隨機向量 γ={γ1,γ2,…,γk}表示 x的概率密度分布(1≤i≤k,Σki=1γi=1)。p(γ|ξ)表示給定知識背景下 γ 的概率密度函數(shù)。設離散隨機變量 α={α1,α2,…,αk}表示 x 的觀察值,這里稱 α={α1,α2,…,αk}為x的超參數(shù)。γ的先驗概率密度為:
式中:ξ—背景知識;α1,α2,…,αk都>0;記 γ|ξ~Dir(γ|α1,α2,…,αk)。
設定特征分量個數(shù)T,對T個特征分量計算先驗概率密度后,得到當前狀態(tài)在相空間中的點θ→=(p1,p2,…,pT)。
由于數(shù)據(jù)集的相空間是數(shù)據(jù)集向相空間的簡單映射,因此在數(shù)據(jù)集的相空間表示情況下,計算兩個數(shù)據(jù)集的差異度可以通過計算與之對應的相空間的差異度實現(xiàn),KL(Kullback-Leibler)距離可作為差異度量標準[12],KL距離如下所示:
當pj=qj時,DKL(p,q)=0,但是KL距離并不是對稱的,因此常常使用其對稱版本:
當λ=1/2時,上述公式轉(zhuǎn)變?yōu)镴S距離:
式中:P和q—機組實時運行數(shù)據(jù)映射到相空間中的點和正常工況數(shù)據(jù)映射到相空間中的點;T—設定的特征分量數(shù)。
以JS距離公式為標準來度量相空間之間的差異度,JS值越大則認為差異度越大。
以某石化往復壓縮機活塞桿斷裂故障為例對該方法進行驗證。該機組十字頭傳感器布置方案,如圖3所示。在往復壓縮機每個缸體的十字頭上方安裝壓電加速度傳感器,通過采集的振動信號,監(jiān)測閥片啟閉過程或零部件斷裂瞬間產(chǎn)生的沖擊。該機組現(xiàn)場故障圖片,如圖4所示。該機組為4缸臥式往復壓縮機,額定轉(zhuǎn)速為333r/min。取該機組104組十字頭正常振動波形數(shù)據(jù)作為學習樣本,其中一組數(shù)據(jù)波形,如圖5所示。計算數(shù)據(jù)特征集,對特征集歸一化和離散化后,得到306個特征。依據(jù)數(shù)據(jù)處理結(jié)果,特征分量數(shù)為T=8時異常檢測準確率和計算效率都較高,因此將特征分量種類設定為8,用正常數(shù)據(jù)訓練得到的特征分量,如表2所示。用上述特征分量對正常和故障數(shù)據(jù)相空間分布進行計算和預測,正常數(shù)據(jù)和部分故障數(shù)據(jù)計算和預測得到的結(jié)果,如表3所示。
圖3 往復壓縮機十字頭振動傳感器測點布局圖Fig.3 The Layout of Measuring Points of the Cross Vibration Sensor of Reciprocating Compressor
圖4 活塞桿斷裂故障Fig.4 Fracture Fault of Piston Rod
圖5 正常數(shù)據(jù)波形Fig.5 Normal Data Waveform
表2 相空間模型特征分布計算結(jié)果Tab.2 Calculation Results of Phase Space Model Feature Distribution
表3 相空間分布預測結(jié)果Tab.3 Results of Phase Space Distribution
分別計算正常數(shù)據(jù)和異常數(shù)據(jù)相空間分布JS距離,運用機組正常數(shù)據(jù)自學習報警線,當報警線設定為正常數(shù)據(jù)JS距離2.7倍時,可將正常和故障數(shù)據(jù)區(qū)分,計算結(jié)果,如圖6所示。
圖6 活塞桿斷裂JS距離Fig.6 JS of Fracture Fault
從圖5中可以看出,當振動數(shù)據(jù)采集到第107h時,JS距離超過設定閾值發(fā)生報警,比故障發(fā)生時刻提前了37h,若此時現(xiàn)場設備管理人員采取有效措施,可有效避免事故的發(fā)生。
圖7 拉缸故障Fig.7 Scuffing Fault
以某石化拉缸數(shù)據(jù)進行驗證,該機組現(xiàn)場故障圖片,如圖7所示。該機組為4缸臥式往復壓縮機,額定轉(zhuǎn)速為370r/min。最后計算得到的JS距離結(jié)果,如圖8所示。
從圖8中可以看出,當振動數(shù)據(jù)采集到第40h時,JS距離超過設定閾值發(fā)生報警,比故障發(fā)生時刻提前了24h,有效對機組異常進行了預測。
圖8 拉缸JS距離Fig.8 JS of Scuffing Fault
(1)對往復壓縮機正常和故障振動波形提取多種特征值,構(gòu)造特征集,該特征集能更加全面的反映波形特征,用于異常檢測可有效避免單一特征值的片面性,有效避免誤診和漏診的情況,提高異常檢測準確率。(2)用LDA模型計算正常和異常數(shù)據(jù)集相空間分布,將二者帶入JS距離計算公式,得到JS距離,當機組正常運行時,JS距離無明顯變化;發(fā)生異常后,JS距離明顯升高,該方法可有效實現(xiàn)往復壓縮機異常檢測。且相較于傳統(tǒng)的異常檢測方法,該方法可大幅提前往復壓縮機異常預警時間點。(3)運用LDA模型構(gòu)造相空間進行異常檢測,只需往復壓縮機正常運行數(shù)據(jù),有效避免因數(shù)據(jù)樣本少而不能進行異常檢測的問題。(4)往復壓縮機在設計與制造精度不夠高時,更容易發(fā)生異常,因此實現(xiàn)往復壓縮機異常檢測十分必要,本方法有效實現(xiàn)了往復壓縮機智能預警和異常檢測。
參考文獻
[1]余良儉.往復壓縮機故障診斷技術(shù)現(xiàn)狀與發(fā)展趨勢[J].流體機械,2014,42(1):36-39.
(Yu Liang-jian.The present situation and development trend of fault diagnosis technology of reciprocating compressor[J].Fluid Machinery,2014,42(1):36-39.)
[2]Shen L,Tay F E H,Qu L.Fault diagnosis using rough sets theory[J].Computers in Industry,2000,43(1):61-72.
[3]彭琦,馬波.概率神經(jīng)網(wǎng)絡在往復壓縮機多故障診斷技術(shù)研究中的應用[J].機械設計與制造,2014(4).
(Peng Qi,Ma Bo.Application of probabilistic neural network in fault diagnosis of reciprocating compressor[J].Mechanical Design and Manufacturing,2014(4).)
[4]張志強,趙懷慈,趙大威.基于SVD算法的紅外熱波無損檢測方法研究[J].機械設計與制造,2012(4):53-55.
(Zhang Zhi-qiang,Zhao Huai-ci,Zhao Da-wei.Study on infrared thermal wave nondestructive testing method based on SVD algorithm[J].Mechanical Design and Manufacturing,2012(4):53-55.)
[5]徐洪鐘,吳中如.相空間神經(jīng)網(wǎng)絡模型在大壩安全監(jiān)控中的應用[J].水利學報,2001(6):67-71.
(Xu Hong-zhong,Wu Zhong-ru.Application of phase space neural network model in dam safety monitoring[J].Journal of Hydraulic Engineering,2001(6):67-71.)
[6]Yanwei H.Data reconstruction based on robust kernel principal component analysis[J].Information and Control,2010(3):022.
[7]Liu Y,Yuan W,Wang S G.A Method of fault diagnosis for reciprocating compressor based on phase space reconstruction(PSR)and empirical mode decomposition[J].Applied Mechincs&Materials,2012,151(1p1):83-86.
[8]黃小亮,郁抒思,關(guān)佶紅.基于LDA主題模型的軟件缺陷分派方法[J].計算機工程,2011,37(21):46-48.
(Huang Xiao-liang,Yu Yu-si,Guan Zhe-hong.Software defect allocation method based on LDA subject model[J].Computer Engineering,2011,37(21):46-48.)
[9]王李冬,魏寶剛,袁杰.基于概率主題模型的文檔聚類[J].電子學報,2012,40(11):2346-2350.
(Wang Li-dong,Wei Bao-gang,Yuan Jie.Document clustering based on probabilistic topic model[J].Electronic Journal,2012,40(11):2346-2350.)
[10]Jiang H C,Qiang M S,Lin P.Finding academic concerns of the Three Gorges Project based on a topic modeling approach[J].Ecological Indicators,2016(60):693-701.
[11]Blei D M,Ng A Y,Jordan M I.Latent dirichlet allocation[J].The Journal of Machine Learning Research,2003(3):993-1022.
[12]Eissa T,Razak S A,Ngadi M D.Towards providing a new lightweight authentication and encryption scheme for MANET[J].Wireless Networks,2011,17(4):833-842.
[13]Griffiths T L,Steyvers M.Finding scientific topics[J].Proceedings of the National Academy of Sciences,2004,101(suppl 1):5228-5235.