孫 擴(kuò),吳忠德,吳陽勇,吳昱舟
(海軍航空大學(xué), 山東 煙臺 264001)
機(jī)載電子設(shè)備故障診斷往往會遇到很多未知性的問題。原因就在于測試對象的故障機(jī)理較為復(fù)雜、測試項目有限,以及提供的知識經(jīng)驗不夠準(zhǔn)確。針對歷史數(shù)據(jù)不完備、不確定性的問題,Pearl于1988年在概率推理和貝葉斯理論的基礎(chǔ)上提出了貝葉斯網(wǎng)絡(luò),它適用于具有關(guān)聯(lián)測試屬性的故障診斷,是當(dāng)前不確定性知識表達(dá)和推理方面最常見的診斷方法之一[1]。針對電網(wǎng)中故障不確定性和模糊性的特點(diǎn),文獻(xiàn)[2]提出了基于故障區(qū)域識別和貝葉斯網(wǎng)絡(luò)的新型故障診斷方法。文獻(xiàn)[3]針對故障診斷領(lǐng)域中先驗信息缺乏的特點(diǎn),提出了一種基于模糊貝葉斯網(wǎng)絡(luò)的故障診斷方法。文獻(xiàn)[4]針對故障診斷中的不確定或不完備信息,提出利用故障樹和鍵合圖結(jié)合共同構(gòu)建貝葉斯網(wǎng)絡(luò)的故障診斷方法。
基于核的方法在去除冗余信息、調(diào)整非線性數(shù)據(jù)結(jié)構(gòu)所表現(xiàn)出的優(yōu)良特性已被廣范應(yīng)用并結(jié)合故障特征提取的其他方法中。最基本的原理就是通過引入核函數(shù)完成數(shù)據(jù)樣本特征空間的變化使原始數(shù)據(jù)線性可分,將特征空間的內(nèi)積運(yùn)算轉(zhuǎn)化為核函數(shù)的運(yùn)算,減少了運(yùn)算量[5-6]??臻g的變換過程如圖1所示。
圖1 核空間變換過程
圖1中的xi,xj代表數(shù)據(jù)空間中的樣本點(diǎn),以核函數(shù)為橋梁進(jìn)行空間變換:
(xi,xj)→K(xi,xj)=〈φ(xi),φ(xj)〉
(1)
xi∈Rd(i=1,2,…,N),Rd為數(shù)據(jù)樣本空間,該空間的維數(shù)是d,由Hilbert空間變換可知存在一個非線性映射φ把數(shù)據(jù)空間轉(zhuǎn)換為Hilbert空間,即φ∶Rd→H。選取核函數(shù)時應(yīng)滿足Mercer條件,得到任意連續(xù)正定的核函數(shù):
(2)
由式(1)、式(2)可以看出:在數(shù)據(jù)空間變換過程中核函數(shù)與特征空間的內(nèi)積是等價的,因而只需要知道核函數(shù)的特征空間點(diǎn)內(nèi)積,非線性映射φ的具體形式并不重要,只要根據(jù)故障特征的特點(diǎn)選擇合適的核函數(shù)即可。
核函數(shù)主元分析法(KPCA)的基本原理是利用核函數(shù)的內(nèi)積運(yùn)算將非線性的數(shù)據(jù)樣本空間映射為線性的高維特征空間[7],然后再用主元分析法(PCA)的算法進(jìn)行故障特征分析并提取主元成分,將高維的特征空間投影為低維的數(shù)據(jù)樣本空間,以便對數(shù)據(jù)的聚類分析。
(3)
設(shè)協(xié)方差矩陣C的特征值為λ,特征向量為α,將協(xié)方差矩陣C特征值分解得到:
λα=Cα
(4)
定義一個核函數(shù)矩陣K滿足Mercer條件[8]:
K=φ(x)Tφ(x)
(5)
對核函數(shù)矩陣K進(jìn)行特征值分解
λkαk=Kαk=φ(x)Tφ(x)αk
(6)
(7)
將特征向量ν單位化得
(8)
進(jìn)而求得特征空間樣本φ(x)在特征向量ν上的投影,則樣本x的第k個非線性主元為
(9)
KPCA算法的實(shí)現(xiàn)步驟如下:
步驟1 假定從數(shù)據(jù)空間中選取m組數(shù)據(jù)集,每組數(shù)據(jù)中包含n個特征屬性。構(gòu)造出一個m×n維的數(shù)據(jù)樣本矩陣。
步驟2 選取合適的核函數(shù)。為了故障診斷和分類效果,此處選擇簡單可行的徑向基高斯核函數(shù)
步驟3 對核函數(shù)矩陣中心化,防止經(jīng)過非線性映射后無法均值化;
步驟4 采用Jacobi矩陣計算式(6)中K的特征值和特征向量。
步驟6 計算協(xié)方差矩陣的主元貢獻(xiàn)率Bi并按由大到小順序排列有B1≥B2≥…≥Bt≥…Bn,i∈(1,2,…,n),令Bt≥P,通常取P=85%,所以前t個特征值所對應(yīng)的變量就是所需要提取的主元變量。
步驟7 計算數(shù)據(jù)在提取主元特征向量上的投影βi,i∈(1,2,…,t)。所得投影即為特征空間經(jīng)KPCA降維處理后的數(shù)據(jù)。
建立好網(wǎng)絡(luò)模型后,通過貝葉斯公式計算出故障模塊的最大后驗概率,實(shí)現(xiàn)故障的隔離定位。只討論單故障情況,即與每項測試相關(guān)聯(lián)的至多只有一個模塊發(fā)生故障。假定一個測試tj與m個模塊相關(guān)聯(lián),則該測試的條件概率的個數(shù)就是對應(yīng)相關(guān)模塊的個數(shù)m,記為Pdij。已知故障模塊si的先驗概率P(si),所以測試項的故障全概率為
(10)
(11)
采用貝葉斯公式計算測試檢測故障情況下模塊的故障后驗概率為
(12)
具體計算見第3節(jié),通過計算可以得到測試tj所對應(yīng)的m個模塊的故障后驗概率,并通過比較得出單個測試特征的故障模塊最大后驗概率最優(yōu)估計值為
(13)
假設(shè)貝葉斯網(wǎng)絡(luò)模型內(nèi)共有n個測試狀態(tài),計算后會產(chǎn)生n個有關(guān)故障模塊的最大后驗概率,而這n個值并不完全是同一測試故障狀態(tài)下得到的,所以在單故障條件下無法定位故障模塊的位置,引起“匹配沖突”的問題。
為解決“匹配沖突”引入屬性加權(quán)規(guī)則。屬性加權(quán)的基本原理,是在各個測試屬性的基礎(chǔ)上,乘上一個權(quán)值,來對不同屬性特征帶來的影響加以區(qū)分。由于各模塊的最大后驗概率是針對不同測試屬性條件而言的,我們定義一個可靠性因子α作為加權(quán)項,即α=P(tj)。則有關(guān)聯(lián)屬性加權(quán)后的公式為
(14)
KPCA-BN診斷模型首先采用KPCA對故障數(shù)據(jù)進(jìn)行特征降維處理,然后再將所得數(shù)據(jù)輸入貝葉斯網(wǎng)絡(luò)中進(jìn)行故障診斷。將KPCA在處理冗余及非相關(guān)特征量的優(yōu)點(diǎn)與貝葉斯網(wǎng)絡(luò)對不確定信息的故障分類優(yōu)良特性相結(jié)合應(yīng)用在故障診斷方面會有較好的效果[10]。該方法的故障診斷流過程如圖2所示。
圖2 故障診斷流程
對診斷對象—某型高度表作為一個外場可更換單元(LRU,Line ),通過自動測試系統(tǒng)平臺及數(shù)據(jù)庫,應(yīng)用KPCA-BN故障診斷方法,選取合適的故障模式和故障測試特征屬性,其故障—測試關(guān)聯(lián)表見表1。本文研究的某型機(jī)載高度表測量范圍為0~1 500 m,發(fā)射機(jī)發(fā)出的射頻信號載波頻率為4 300 MHz、脈沖重復(fù)頻率為10 kHz、功率為100 W的射頻信號,剩余的一部分進(jìn)入距離計算器模塊作為時間基準(zhǔn)信號使用。發(fā)射信號經(jīng)過地面或水面的反射作為回波信號被接收機(jī)成功接收,經(jīng)過一系列變換、放大、檢波等操作變?yōu)橐曨l回波脈沖信號進(jìn)入距離計算器。將時間基準(zhǔn)時間信號與視頻回波脈沖信號之間的時間間隔轉(zhuǎn)換為與真實(shí)高度成正比的直流電壓。
表1 高度表故障—測試關(guān)聯(lián)表
故障模式共有4種,分別為S1(穩(wěn)壓電源模塊故障)、S2(發(fā)射機(jī)模塊故障)、S3(接收機(jī)模塊故障)和S4(距離計算器模塊故障)。故障測試特征屬性有6種,分別為t1(+5 V電壓測試)、t2(脈沖重復(fù)頻率測試)、t3(內(nèi)部隔離度測試)、t4(外部距離電壓測試)、t5(模擬距離精度測試)和t6(零高度靈敏度測試)。表中主體部分?jǐn)?shù)字“1”代表模塊與測試間有關(guān)聯(lián),“0”則代表無關(guān)聯(lián)。
在數(shù)據(jù)庫和知識庫中選取穩(wěn)壓電源模塊、發(fā)射機(jī)模塊、接收機(jī)模塊、距離計算器模塊等4個模塊所對應(yīng)的故障訓(xùn)練數(shù)據(jù)集是4×48=192組。測試數(shù)據(jù)集樣本也是192組,見表2。
表2 高度表樣本數(shù)據(jù)集
在192組數(shù)據(jù)集中對應(yīng)4個模塊,包含6個測試特征屬性。采用訓(xùn)練樣本對貝葉斯網(wǎng)絡(luò)進(jìn)行推理訓(xùn)練,然后將通過核主元分析法降維的測試樣本的特征向量輸入訓(xùn)練好的貝葉斯網(wǎng)絡(luò)中實(shí)現(xiàn)故障診斷與分類。核函數(shù)與核參數(shù)的選擇對數(shù)據(jù)的特征選取非常重要。經(jīng)過試驗比對,選擇徑向基高斯函數(shù)作為核函數(shù),取核參數(shù)σ=0.8。
在6維的測試特征空間中,前3個測試特征向量的累積貢獻(xiàn)率>85%,故通過PCA和KPCA對數(shù)據(jù)特征降維處理后得到三維特征空間投影效果,見圖3和圖4。
圖3 PCA處理數(shù)據(jù)三維特征投影
圖4 KPCA處理數(shù)據(jù)三維特征投影
通過圖3和圖4的比較可以看出:PCA和KPCA兩種特征選取方法都壓縮了試驗數(shù)據(jù)量,對數(shù)據(jù)都有一定的聚類效果。但是對比可以發(fā)現(xiàn),PCA處理過的故障模式下的數(shù)據(jù)樣本中,如s1和s4、s2和s3樣本數(shù)據(jù)之間有些許的重疊,而KPCA處理的數(shù)據(jù)樣本基本沒有重疊,可分性好。結(jié)果表明:KPCA采用核函數(shù)特征空間變換由非線性數(shù)據(jù)空間映射為低維空間相比PCA有更好的效果。
根據(jù)表1可以建立相應(yīng)的基于測試特征的貝葉斯網(wǎng)絡(luò)模型,見圖5。根據(jù)機(jī)載高度表的有關(guān)專家先驗知識及數(shù)據(jù)庫歷史測試數(shù)據(jù)統(tǒng)計計算,可以得到故障模塊的先驗故障概率及故障的條件概率。這里取模塊的先驗故障概率P(s1)=0.23,P(s2)=0.27,P(s3)=0.19,P(s4)=0.31,其故障的條件概率為:P(tj|si)(i=1,2,3,4,j=1,2,…,6),見表3。
圖5 基于測試特征的貝葉斯網(wǎng)絡(luò)模型
故障模式測試t1t2t3t4t5t6S10.530.410.000.000.000.00S20.250.390.340.310.230.00S30.330.000.370.000.250.53S40.210.000.320.240.200.49
以圖5中的貝葉斯網(wǎng)絡(luò)模型圖5(a)為例,已知模塊s1的故障先驗概率及測試t1的條件概率Pd11、Pd21、Pd31、Pd41,由式(10)可得測試t1故障的全概率為
p(t1)=(t1|s1)·P(s1)·(1-P(s2))·
(1-P(s3))·(1-P(s4))+(t1|s2)·
P(s2)·(1-P(s1))·(1-P(s3))·
(1-P(s4))+(t1|s3)·P(s3)·
(1-P(s1))·(1-P(s2))·(1-P(s4))+
(t1|s4)·P(s4)·(1-P(s1))·
(1-P(s2))·(1-P(s3))
其他的測試的故障全概率及測試下各模塊的故障概率也同理可得。診斷測試故障全概率分別為0.133、0.150、0.145、0.112、0.095、0.193。測試下的最大后驗概率包括s1、s2、s4三個模塊,由于并不是同一測試狀態(tài)下的最大后驗概率,需要利用可靠性因子加權(quán)來判斷(表4)。代入式(14)中可得模塊s1、s2、s4對應(yīng)的加權(quán)最大后驗概率分別是0.121 9、0.105 3、0.151 9。
所以可以得出結(jié)論是距離計算器模塊發(fā)生故障。上述基于測試的貝葉斯網(wǎng)絡(luò)故障診斷方法,可以通過運(yùn)算得到最大后驗概率來判斷故障模塊及故障模式。貝葉斯網(wǎng)絡(luò)是針對不確定性故障診斷的主流方法之一,所以本文以貝葉斯網(wǎng)絡(luò)作為故障診斷的核心方法,將PCA和KPCA分別與貝葉斯網(wǎng)絡(luò)方法結(jié)合,并與基于測試的貝葉斯網(wǎng)絡(luò)方法[11]進(jìn)行試驗對比。以特征維數(shù)、各模塊故障診斷準(zhǔn)確率為評價指標(biāo)對BN、PCA-BN和KPCA-BN三種推理機(jī)算法結(jié)果進(jìn)行比較,見表4。KPCA-BN與PCA-BN相比較而言,加入核的方法增強(qiáng)了故障特征提取的特性,使得最終的故障診斷準(zhǔn)確率提升了1.5%。
表4 三種方法故障診斷結(jié)果比較
通過主成分分析處理后,特征維數(shù)由6維降到3維,再將經(jīng)KPCA處理的數(shù)據(jù)輸入基于測試的貝葉斯網(wǎng)絡(luò)中推理得到與單獨(dú)采用貝葉斯網(wǎng)絡(luò)方法相同的故障隔離結(jié)果,即距離計算器模塊故障,并且與實(shí)際故障模塊相一致。說明本文采用的改進(jìn)方法確實(shí)有效。而且經(jīng)過PCA和KPCA數(shù)據(jù)處理后,各個模塊的故障診斷準(zhǔn)確率得到了大幅度提高。
提出了通過核函數(shù)主元分析進(jìn)行特征選取的貝葉斯網(wǎng)絡(luò)故障診斷研究模型。利用基于核函數(shù)的主元分析法對數(shù)據(jù)進(jìn)行降維處理,實(shí)現(xiàn)了非線性高維數(shù)據(jù)樣本空間到低維的特征向量空間轉(zhuǎn)換。以某型機(jī)載高度表為研究對象進(jìn)行基于測試的貝葉斯網(wǎng)絡(luò)模型構(gòu)建,采用貝葉斯公式計算模塊的最大后驗故障概率,提出可靠性因子的概念,對后驗概率進(jìn)一步修正,得出最終的故障診斷結(jié)果。以故障識別率、特征提取時間等指標(biāo)作為評價標(biāo)準(zhǔn),將本文中提出的KPCA-BN方法與PCA-BN和BN兩種方法對比,證明所提方法在故障診斷中的有效性。