蔣麗英,彭昌毅,崔建國,于明月,張 瑞,林澤力
(1.沈陽航空航天大學 自動化學院,沈陽 110136;2.中國航發(fā)沈陽發(fā)動機研究所 12室,沈陽 110015;3.中航工業(yè)上海航空測控技術(shù)研究所 PHM實驗室,上海 201601)
航空發(fā)動機做為飛機飛行時的動力來源,它工作時的好壞會直接影響到飛機的飛行安全。而氣路系統(tǒng)做為航空發(fā)動機的核心子系統(tǒng),它在飛機飛行時的故障與否將會對發(fā)動機的工況產(chǎn)生重要影響。因此,實現(xiàn)高效的航空發(fā)動機氣路系統(tǒng)故障診斷,對于提高出行安全,降低飛行風險,減少發(fā)動機視情維修的成本,具有重要的實際工程意義。
以神經(jīng)網(wǎng)絡為代表的智能算法被廣泛應用于航空發(fā)動機故障診斷研究中。文獻[1]針對航空發(fā)動機氣路系統(tǒng)診斷過程中出現(xiàn)的相似故障提出了一種基于SVM和SNN相結(jié)合的航空發(fā)動機氣路系統(tǒng)故障診斷,在診斷過程中使用了多級SVM診斷模型和SNN協(xié)同學習模式識別,有效地提高了診斷率。文獻[2]根據(jù)航空發(fā)動機氣路系統(tǒng)數(shù)據(jù)非線性、非高斯的特點,提出了SANNWA-PF算法,顯著提高了診斷的速度。文獻[3]提出了一種基于LVQ網(wǎng)絡對航空發(fā)動機氣路系統(tǒng)進行特征提取方法,并達到了91%的平均診斷準確率,該文獻針對高維度的航空發(fā)動機氣路系統(tǒng)參數(shù)所做的特征降維與特征選擇提供了較好的思路。文獻[4]提出了基于灰色關(guān)聯(lián)分析的航空發(fā)動機氣路系統(tǒng)關(guān)鍵部件的故障診斷方法,取得了很好的診斷精度。借鑒以上學者研究航空發(fā)動機故障診斷的經(jīng)驗,本文引入一種新的人工神經(jīng)網(wǎng)絡模型——概率神經(jīng)網(wǎng)絡(Probabilistic Neural Network,PNN)。PNN是徑向基神經(jīng)網(wǎng)絡(Radial Basis Function Neural Network,RBF)的一種擴展。PNN采用基于待分類樣本的后驗概率估計方法進行類型識別。對于具有足夠多的有代表性的樣本數(shù)據(jù),可以直接通過算法學習,生成相應的模型。從而避免了反復訓練,而且訓練很快收斂。由于在輸出層采用了競爭機制,這樣有效地避免了樣本被拒絕識別[5]的情況。
本文針對航空發(fā)動機氣路系統(tǒng)特征參數(shù)具有高維度、高冗余,并且特征參數(shù)之間相關(guān)性強等特點,并結(jié)合現(xiàn)有成熟的基于神經(jīng)網(wǎng)絡的診斷方案,提出了一種基于ReliefF-PNN的發(fā)動機氣路系統(tǒng)診斷策略。使用ReliefF算法選擇得到最優(yōu)特征參數(shù)子集,將原始特征降低至6個維度。利用最優(yōu)特征參數(shù)子集訓練生成基于PNN的診斷模型,最終診斷實驗得到100%的精度。
特征選擇是指按照某一評價準則從給定系統(tǒng)中的原始特征數(shù)據(jù)集中篩選出能夠表征系統(tǒng)的最優(yōu)特征子集。
已知某一系統(tǒng)的數(shù)據(jù)集X,具備n個特征,記為:X={x1,x2,…,xn}。給定一個特征選擇方法Feature-Selection-Method,在評價準則Judge下,評價每一個特征xi(i∈n),從中篩選出能夠表征原始系統(tǒng)的最優(yōu)特征子集Y,其中Y滿足Y?X。
Relief算法[6]是一種經(jīng)典的特征選擇算法,也是目前普遍公認的最好的過濾(Filter)式算法。所謂Filter是指不依賴任何其他算法的指導,僅使用原始數(shù)據(jù)集內(nèi)在的特性來進行特征選擇[7]。
Relief算法具有較快的計算效率,且對數(shù)據(jù)的類型和規(guī)模沒有限制。其本質(zhì)是利用特征對于分類的影響來評價特征權(quán)重,通過特征權(quán)重的大小獲得對應的最優(yōu)特征子集[8]。特征權(quán)重大意味著對應的特征有助于區(qū)分類別。當特征的權(quán)重足夠小到接近0時,表明這個特征與類別相關(guān)性極低。當特征權(quán)重計算結(jié)果出現(xiàn)負值時,表明同一類別的鄰近樣本距離比不同類別鄰近樣本距離大,那么說明該特征對類別區(qū)分是起到負面作用的。
對于隨機選取的m個樣本x,Relief算法通過計算樣本在各個屬性上的假設間隔[9],并累加起來作為最終特征屬性的權(quán)重。屬性p的權(quán)重更新可表示為
(1)
式(1)中,H(x)表示與樣本x處于同一類別中的最近鄰樣本點;M(x)表示與樣本x處于不同類別中的最近鄰樣本點。
當屬性為離散時,函數(shù)diff()定義如下
(2)
當屬性為連續(xù)時,函數(shù)diff()定義如下
(3)
式(3)中,max(p)和min(p)分別是屬性p的最大值和最小值,對應權(quán)重的上界和下界。
僅能針對兩分類的問題作特征選擇是Relief算法的局限性。在傳統(tǒng)的Relief算法基礎上Kononenko提出了能夠解決多分類和回歸問題,以及應對數(shù)據(jù)缺失的ReliefF算法[10]。
ReliefF算法的權(quán)重更新公式為
(4)
對于含有噪聲的特征數(shù)據(jù)會在原有的基礎上產(chǎn)生微小的偏移,從而干擾特征對類別的準確表示。當噪聲的影響波及到多個屬性時,會嚴重影響對非同一類別中近鄰樣本的判定。ReliefF算法選擇使用k近鄰樣本而不是最近鄰樣本,通過計算k個樣本的平均,在一定程度上減少了噪聲對原始數(shù)據(jù)的影響。
概率神經(jīng)網(wǎng)絡[11](Probabilistic Neural Network,PNN)是一種用于模式識別的分類器。其本質(zhì)是基于貝葉斯最小風險準則發(fā)展而來的一種并行計算方法。目前已經(jīng)廣泛應用于故障診斷[12-13]、電力保護[14-15]及模型評價[16-17]等各個領(lǐng)域中。
基于PNN的故障診斷方法實際上是概率統(tǒng)計學中被廣泛接受的一種決策方法。假設有兩種已知的故障模式Y(jié)1和Y2,對于要判斷的故障特征的樣本數(shù)據(jù)集X={x1,x2,…,xn},若滿足下式
if(P1·L1·F1(x)>P2·L2·F2(x)),then(x∈Y1)
if(P1·L1·F1(x) (5) L1表示將原本屬于模式Y(jié)1的故障樣本錯誤的劃分到模式Y(jié)2所產(chǎn)生的代價因子。同理L2意為將原本屬于模式Y(jié)2的故障樣本錯誤的劃分到模式Y(jié)1所產(chǎn)生的代價因子。 F1和F2表征故障模式Y(jié)1和Y2的概率密度函數(shù)(Probability Density Function, PDF)。通常PDF值不能夠精確的獲得,普遍的做法是根據(jù)現(xiàn)有的故障樣本數(shù)據(jù)集求其統(tǒng)計值做近似代替。Parzen[18]提出了從已知隨機樣本中估計PDF的方法 (6) 式中:D表示訓練樣本集的維度,對應訓練樣本集中特征參數(shù)的個數(shù);σ為平滑因子,σ值的大小決定了以樣本點為鐘形曲線的寬度;x1j表示故障模式Y(jié)1類的第j個中心矢量。同理可以計算出F2(x)。 PNN是包含四層結(jié)構(gòu)的網(wǎng)絡模型,分別是輸入層、模式層、求和層和輸出決策層。神經(jīng)網(wǎng)絡的輸入層接收來自給定集合的數(shù)據(jù)。模式層的激活函數(shù)定義為高斯函數(shù),其神經(jīng)元個數(shù)是訓練樣本的個數(shù)。求和層將模式層的輸出按類別相加,相當于加法器,在求和層中計算所得結(jié)果即為故障模式的估計概率密度函數(shù)值,其神經(jīng)元個數(shù)等于類別的數(shù)目。神經(jīng)網(wǎng)絡的輸出由競爭層判決,在各個故障模式的估計概率密度中選擇出最大的后驗概率密度的神經(jīng)元作為整個網(wǎng)絡的輸出值,輸出結(jié)果只有一個1,其余結(jié)果都是0,其中概率值最大的那一類將輸出1。PNN網(wǎng)絡模型正是通過模式層和求和層的計算實現(xiàn)了貝葉斯決策,這一點也可以將式(6)代入式(5)中得到驗證。 在實際工程領(lǐng)域中,航空發(fā)動機氣路系統(tǒng)故障診斷所面臨的問題是,如何從高維度的樣本中選擇出具有代表性的特征進行診斷識別,進而達到提高診斷效率與診斷精度的目的。所以對氣路系統(tǒng)進行特征參數(shù)選擇必然成為診斷前的第一步工作。特征選擇是指從系統(tǒng)原始特征數(shù)據(jù)集中選擇出一個能表達系統(tǒng)的特征子集,并且這個特征子集能夠在所使用的選擇方法中達到最優(yōu)的評估結(jié)果。一般稱所選的特征子集為最優(yōu)特征子集。對于一個模式識別問題,優(yōu)秀的機器學習樣本是訓練出好的分類器模型的關(guān)鍵。樣本數(shù)量的龐大,樣本特征之間的冗余性以及不相關(guān)性都會使得訓練生成分類模型時產(chǎn)生混亂,進而影響最終的測試結(jié)果。因此,選擇較好的特征,降低樣本的規(guī)模去除冗余性,對于加速機器學習速度和提高模型分類性能起到重要的作用。 為提高航空發(fā)動機氣路系統(tǒng)故障診斷的精度,本文結(jié)合氣路系統(tǒng)采集的數(shù)據(jù)維度高及相關(guān)性強等特點,提出了一種基于ReliefF-PNN的氣路系統(tǒng)故障診斷方法,算法的流程圖如圖1所示,建立的PNN診斷模型如圖2所示。 圖1 基于ReliefF-PNN的發(fā)動機氣路系統(tǒng)故障診斷 圖2 氣路系統(tǒng)故障診斷的PNN網(wǎng)絡結(jié)構(gòu) 基于ReliefF-PNN方法的氣路系統(tǒng)故障診斷主要步驟如下: 步驟2: 利用ReliefF算法選擇得到S個具備表征氣路系統(tǒng)的參數(shù),其中s=1,2,…,S,表示第s個特征。以這S個參數(shù)構(gòu)建氣路系統(tǒng)的最優(yōu)特征參數(shù)子集,記為SubF={f1,f2,…,fS}。 步驟3: 設置PNN網(wǎng)絡平滑因子σ,一般取值σ∈(0,1]。 步驟9: 通過對最終輸出的C(X)來分析氣路系統(tǒng)的診斷結(jié)果。 本次實驗采集某型航空發(fā)動機氣路系統(tǒng)的14個特征參數(shù)。具體是:低壓轉(zhuǎn)子相對物理轉(zhuǎn)速(N1)、高壓轉(zhuǎn)子相對物理轉(zhuǎn)速(N2)、高壓轉(zhuǎn)子按25截面的相對轉(zhuǎn)換速度(N2c25)、大氣壓強(Pla)、高壓導葉實際溫度(Alfa2)、發(fā)動機進口溫度(T2)、低壓渦輪后溫度(T6)、25界面壓氣機進口溫度(T25)、發(fā)動機進口壓力(P2)、壓氣機出口壓力(P3)、低壓渦輪后壓力(P6)、落壓比反饋值(EPR)、主燃油流量給定值(WfmDem)和噴口喉道面積反饋值(A8)。這14個特征參數(shù)構(gòu)成的數(shù)據(jù)集對應航空發(fā)動機氣路系統(tǒng)的3種故障模式,定義為發(fā)動機溫度故障(M1)、發(fā)動機轉(zhuǎn)子故障(M2)和發(fā)動機扇葉故障(M3)。分別在每種故障模式下采集數(shù)據(jù)300組。部分數(shù)據(jù)顯示如表1所示。 表1 發(fā)動機氣路系統(tǒng)特征參數(shù)原始數(shù)據(jù)集(部分) 參見表1中的數(shù)據(jù)樣本,定義全特征參數(shù)樣本集為:AllFeatures={N2,N2c25,Alfa2,P3,T25,N1,WfmDem,A8,ERP,T6,P6,T2,P2,Pla}。使用ReliefF算法對AllFeatures集合中三類故障模式下的14個特征參數(shù),做特征選擇。本文實驗環(huán)節(jié)中選取ReliefF算法中近鄰樣本個數(shù)為k=100。實驗所得結(jié)果為AllFeatures集合中每個參數(shù)的特征權(quán)重。按從大到小對特征權(quán)重排序,如下表2所示。 從表2的特征參數(shù)權(quán)重排名可以看出前6個參數(shù)的特征權(quán)重明顯大于0,說明這幾個特征對于區(qū)分不同的故障類別起到正向的積極作用。其 表2 特征參數(shù)權(quán)重排名 他特征參數(shù)的特征權(quán)重出現(xiàn)了負值,表明同一故障狀態(tài)下的鄰近樣本距離比不同狀態(tài)的鄰近樣本距離大,這些特征對故障狀態(tài)的診斷會起到負面的作用。本次實驗最終選擇特征權(quán)重大于0的前6個特征參數(shù),創(chuàng)建最優(yōu)特征參數(shù)子集為:BestSubFeatures={T2,T25,T6,N2c25,Alfa2,N1}。 將最優(yōu)特征參數(shù)子集BestSubFeatures中的特征參數(shù),共計900組數(shù)據(jù),分為訓練集和測試集兩組。其中訓練集使用600組數(shù)據(jù),測試集使用300組數(shù)據(jù)。使用訓練集數(shù)據(jù)訓練得到基于PNN的氣路系統(tǒng)故障診斷模型,使用測試集數(shù)據(jù)測試模型的準確性。采集對應BestSubFeatures集合中的傳感器參數(shù)300組,驗證PNN模型的診斷精度,結(jié)果如圖3所示??梢钥闯鲈\斷精度高達100%。對于未經(jīng)ReliefF算法選擇的全特征參數(shù)集AllFeatures,使用同樣樣本規(guī)模的訓練和測試數(shù)據(jù),進行網(wǎng)絡的訓練與測試,最終驗證模型的精度,結(jié)果如圖4所示。診斷精度雖然也能達到94.67%。但是在實驗的過程中發(fā)現(xiàn),生成基于PNN的診斷模型后,使用全特征參數(shù)集的數(shù)據(jù)做診斷驗證,所得到的結(jié)果并不穩(wěn)定。多次實驗觀察,原因是第三個故障模式的識別得不到較好的效果。實驗結(jié)果記錄參見表3。 圖3 ReliefF特征選擇后PNN診斷結(jié)果 圖4 ReliefF特征選擇前PNN診斷結(jié)果 序號診斷樣本及模型診斷精度M3的診斷精度1BestSubFeatures-PNN100%100%2AllFeatures-PNN94.67%84%3AllFeatures-PNN92.67%78%4AllFeatures-PNN94.33%83%5AllFeatures-PNN95%85% 在最優(yōu)特征子集BestSubFeatures中逐一減少特征參數(shù),減少規(guī)則按表2中的前6個參數(shù)的特征權(quán)重排名從小到大依次減少。訓練生成PNN的診斷網(wǎng)絡并測試,得到如表4的驗證結(jié)果。 表4 減少最優(yōu)特征子集中特征參數(shù)的實驗對比 表4結(jié)果說明,本文實驗時依據(jù)特征權(quán)重大于0為準則,選取全部大于0的特征參數(shù)創(chuàng)建得到的最優(yōu)特征參數(shù)子集,為最好的氣路系統(tǒng)故障診斷依據(jù)。 在最優(yōu)特征子集BestSubFeatures中逐一增加不屬于本集合中的特征參數(shù)。增加特征參數(shù)的規(guī)則為:從表2中的第7個特征參數(shù)開始,按特征權(quán)重排名從大到小的規(guī)則依次增加。訓練生成PNN診斷網(wǎng)絡并測試,得到如下表5的驗證結(jié)果。 表5 增加非最優(yōu)特征子集中特征參數(shù)的實驗對比 表5結(jié)果說明,本文研究的航空發(fā)動機氣路系統(tǒng)故障診斷,可以使用最少的特征參數(shù),也即使用最優(yōu)特征子集BestSubFeatures中的全部參數(shù),達到診斷精度很高的效果。 根據(jù)PNN故障診斷的理論模型可知,對于具備表征故障模式的充足樣本,PNN可以直接通過算法學習,避免反復訓練,以較快的速度達到收斂,最終生成相應的診斷模型。為了驗證PNN的診斷效率,本文分別設計了BP神經(jīng)網(wǎng)絡和RBF神經(jīng)網(wǎng)絡的診斷模型與之進行對比,采用最優(yōu)特征子集中的實驗數(shù)據(jù)進行建模、測試與診斷驗證。得到如下表6結(jié)果。 表6 診斷模型的實驗對比 從表6的對比結(jié)果可以看出,使用最優(yōu)特征樣本集獲得的BP診斷模型得到的診斷精度遠不符合工程需求。分析得知,BP網(wǎng)絡在訓練模型時出現(xiàn)了過擬合,導致在診斷分析的過程中陷入了局部最優(yōu)解的困境,從而出現(xiàn)大量當前故障模式樣本被錯誤的劃歸為鄰近模式中。相較于BP神經(jīng)網(wǎng)絡,RBF網(wǎng)絡的診斷精度和網(wǎng)絡收斂時間要好很多。但是和PNN網(wǎng)絡對比,可以看出,PNN模型能夠更快的達到收斂結(jié)果,而且診斷精度也大幅提升。 (1)本文利用ReliefF算法對3個類別的發(fā)動機氣路系統(tǒng)數(shù)據(jù)進行特征選擇。有效地選擇出能夠反應氣路系統(tǒng)故障狀態(tài)的6個最優(yōu)特征參數(shù)。實現(xiàn)了特征降維的目的,提高了故障診斷精度。 (2)通過對比PNN、RBF和BP神經(jīng)網(wǎng)絡的診斷模型分析??梢钥闯?,在樣本數(shù)據(jù)量相同的情況下,使用PNN訓練最優(yōu)特征子集得到的診斷模型,在診斷精度和診斷效率上有很大的優(yōu)勢。 (3)在今后的實際應用中,可以利用ReliefF算法選擇得到某型發(fā)動機氣路系統(tǒng)的最優(yōu)特征參數(shù),并在離線狀態(tài)下訓練生成基于PNN的診斷模型。通過訓練好的診斷模型實現(xiàn)氣路系統(tǒng)實時狀態(tài)的故障診斷。3 基于ReliefF-PNN的氣路系統(tǒng)故障診斷
3.1 發(fā)動機氣路系統(tǒng)故障診斷存在的問題
3.2 基于ReliefF-PNN的氣路系統(tǒng)故障診斷流程
3.3 基于ReliefF-PNN的氣路系統(tǒng)故障診斷主要步驟
4 發(fā)動機氣路系統(tǒng)故障診斷分析
4.1 基于ReliefF的氣路系統(tǒng)特征參數(shù)選擇
4.2 基于PNN的氣路系統(tǒng)故障診斷
5 結(jié)論