□ 郭濟(jì)鳴 □ 齊金平 ,3 □ 李興運(yùn)
1.蘭州交通大學(xué) 機(jī)電技術(shù)研究所 蘭州 730070
2.甘肅省物流及運(yùn)輸裝備信息化工程技術(shù)研究中心 蘭州 730070
3.甘肅省物流與信息技術(shù)研究院 蘭州 730070
故障樹分析法將所要分析的系統(tǒng)問題以圖形的形式進(jìn)行表達(dá)處理,在分析步驟中,將所分析的系統(tǒng)發(fā)生故障設(shè)為頂事件,將無法再細(xì)分的事件稱為底事件,將其余剩下的所有事件稱為中間事件。故障樹分析法將整個系統(tǒng)的最終故障及形成每一級故障的原因通過一個倒置的樹形圖來表達(dá),對于系統(tǒng)處理計算,找出影響較大的環(huán)節(jié)進(jìn)行分析,為系統(tǒng)運(yùn)行和維修提供信息參考,在可靠性處理研究方法中所占的比重逐漸增大。由于該方法對于可靠性分析所具有的很多優(yōu)勢,因此近幾年國內(nèi)外各領(lǐng)域不斷對其進(jìn)行研究,促成其繼續(xù)發(fā)展。
1961年,貝爾實(shí)驗(yàn)室最初以系統(tǒng)可靠性分析方法推出發(fā)表了故障樹分析法,自此故障樹分析法被許多學(xué)者認(rèn)可應(yīng)用,也因此得到了深入發(fā)展?,F(xiàn)如今,該方法已經(jīng)與多種其它學(xué)科和理論結(jié)合,非常廣泛地應(yīng)用于不同學(xué)科和區(qū)域。
1989年,Esary和Smotherman等通過故障樹和馬爾可夫模型結(jié)合,對階段性動態(tài)進(jìn)行了建模,以限制系統(tǒng)的靈活性,將相位變化通過分布函數(shù)表示,提高了求解速度。1992年,Dugan等以空間站和空中交通管理等系統(tǒng)為研究背景,將馬爾可夫理論與組合數(shù)學(xué)應(yīng)用到一起,研發(fā)了動態(tài)故障樹模型,推算出了三種應(yīng)用于動態(tài)故障樹的模塊化算法,解決了動態(tài)故障樹計算速率慢的問題,并為解決關(guān)鍵應(yīng)用程序中容錯計算機(jī)程序的可靠性問題,給出了容錯并行處理器、任務(wù)航空電子系統(tǒng)和容錯多維數(shù)據(jù)集三種先進(jìn)的容錯計算機(jī)系統(tǒng)[1]。1996年,Pullum等對硬件、軟件繁雜的計算機(jī)系統(tǒng)進(jìn)行可靠性分析,得出了一種對動態(tài)和靜態(tài)都可計算的Shade樹方法。1997年,Gulati等通過計算獨(dú)立子樹得到的數(shù)據(jù),歸納整合處理得出一種混合模塊化方法,對于靜態(tài)故障樹應(yīng)用二元決策圖方案,對于動態(tài)故障樹應(yīng)用馬爾可夫模型方案,同時,采用獨(dú)立模塊的獨(dú)立解,再將方法結(jié)合進(jìn)行整體處理[2]。
Ragavan為了簡化動態(tài)故障樹結(jié)構(gòu)構(gòu)建系統(tǒng)的表達(dá),推算出更加精準(zhǔn)的動態(tài)故障樹計算應(yīng)用算法,增強(qiáng)了針對系統(tǒng)故障問題的動態(tài)故障樹框架的有效性,以更加嚴(yán)謹(jǐn)?shù)卮_認(rèn)故障樹的構(gòu)成和基本事件,使故障樹得到更準(zhǔn)確的表達(dá),分析馬爾可夫模型,提出數(shù)值解決方案。2003年,Ou等基于之前已經(jīng)得出的成果又推理出了計算近似重要度無環(huán)馬爾可夫可靠性結(jié)構(gòu)的研究算法,對馬爾可夫鏈計算問題結(jié)果進(jìn)一步化簡,針對非維護(hù)關(guān)鍵性計算機(jī)程序的可靠性,提出一種適用于任何非循環(huán)的馬爾可夫鏈可靠性分析模型,通過近似計算來解決動態(tài)故障問題[3]。2007年,Boudali等以交互式馬爾可夫鏈為背景,對于輸入和輸出端口進(jìn)行模塊化,以應(yīng)對組合過大時計算爆炸和非模塊化的問題,使用輸入輸出交互式馬爾可夫鏈形式來分析動態(tài)故障樹。使用這一形式,解決了模塊分析的局限性對于狀態(tài)空間爆炸問題的脆弱性問題,以及模塊構(gòu)建不成熟的問題[4]。
2008年,Marquez等將混合貝葉斯網(wǎng)絡(luò)框架用于處理動態(tài)故障樹的靈敏性、模糊性和故障率等問題。對于動態(tài)離散變量域的近似推理算法,獲得了靜態(tài)和動態(tài)故障樹結(jié)構(gòu)的故障分布準(zhǔn)確逼近。對于已有的最初故障數(shù)據(jù)和專家判斷先驗(yàn)信息,得到了參數(shù)化的邊緣失效分布后驗(yàn)估計,得出了混合貝葉斯網(wǎng)絡(luò)框架[5]。Duan等針對傳統(tǒng)動態(tài)馬爾可夫鏈方法的缺陷,結(jié)合線性時間算法,將整個大系統(tǒng)整體劃分為獨(dú)立子樹,應(yīng)用二元決策圖對靜態(tài)子樹進(jìn)行處理,同時用貝葉斯網(wǎng)絡(luò)對動態(tài)子樹進(jìn)行分析計算[6]。Kolek等提出了動態(tài)故障樹分析法、馬爾可夫鏈和可靠性塊圖,并介紹了一個塊庫,以解決復(fù)雜可靠性結(jié)構(gòu)、多種形式軟件和硬件冗余,以及熱冷備份系統(tǒng)等問題。采用蒙特卡羅模擬法,提出了一種基于工業(yè)的案例研究,通過故障模式和效果分析,對冗余可編程邏輯控制器系統(tǒng)的關(guān)鍵故障進(jìn)行了識別[7]。
季會媛將動態(tài)故障樹處理分為單獨(dú)的靜態(tài)子樹和動態(tài)子樹,再對其進(jìn)行二元決斷圖法和馬爾可夫過程計算處理。當(dāng)動態(tài)子樹規(guī)模比較小時,系統(tǒng)計算效率會提高。應(yīng)用馬爾可夫鏈法來得出動態(tài)子樹的頂事件發(fā)生概率,利用馬爾可夫狀態(tài)轉(zhuǎn)移圖得到故障模式和對整體結(jié)構(gòu)影響最大的事件,使整個系統(tǒng)的處理分析更加容易便捷[8]。朱正福等在狀態(tài)轉(zhuǎn)移圖的基礎(chǔ)上將馬爾可夫鏈劃分為幾個狀態(tài)轉(zhuǎn)移鏈,由于鏈的長度不一樣,因此計算出適用于不同鏈長的失效概率計算公式,避免對于難度較大的方程計算,使現(xiàn)實(shí)的案例分析更加可行[9]。李彥鋒應(yīng)用三角模糊數(shù)賦值零部件和系統(tǒng)的故障發(fā)生概率,將事先建立的動態(tài)故障樹結(jié)構(gòu)用來獲得模糊馬爾可夫結(jié)構(gòu)。結(jié)合模糊數(shù)學(xué)中擴(kuò)展定理和拉普拉斯-斯蒂爾切斯變換計算處理獲得的結(jié)構(gòu),獲取系統(tǒng)在特定時間的模糊故障率和模糊可靠度圖像。同時應(yīng)用貝葉斯網(wǎng)絡(luò)和動態(tài)故障樹對系統(tǒng)可靠性進(jìn)行建模,將無效的動態(tài)故障樹模型變換為貝葉斯網(wǎng)絡(luò)模型,以此將模型求解的復(fù)雜度大大化簡[10]。房丙午等通過已知的函數(shù)對條件概率表進(jìn)行描述,解決了組合爆炸問題。由已獲得的備件門故障原因和相應(yīng)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)特點(diǎn),結(jié)合指數(shù)分布的備件節(jié)點(diǎn)故障時間特性,推理出基于動態(tài)故障樹的貝葉斯網(wǎng)絡(luò)精確算法,應(yīng)用該算法提出了系統(tǒng)失效分布、部件重要度等概率公式[11]。孫麗娜等將傳統(tǒng)二態(tài)性故障樹變形為多態(tài)的Takagi-Sugeno模糊故障樹系統(tǒng),通過結(jié)合統(tǒng)計學(xué)期望來處理系統(tǒng)多態(tài)故障問題,并對底事件和中間事件處理得到多態(tài)系統(tǒng)可靠性的分析方法[12]。
貝葉斯網(wǎng)絡(luò)最開始是為了解決人工智能存在的因素?zé)o法確定的問題。貝葉斯網(wǎng)絡(luò)通過圖形表達(dá)系統(tǒng)故障間的聯(lián)系,能夠得出事件概率。如今,貝葉斯網(wǎng)絡(luò)的問題主要在于如何創(chuàng)建、推算貝葉斯網(wǎng)絡(luò),以及學(xué)習(xí)功能方面。貝葉斯網(wǎng)絡(luò)的主要建模方法如下:①根據(jù)相關(guān)領(lǐng)域?qū)<业慕?jīng)驗(yàn)直接建模;②根據(jù)對網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)來建模;③將專家知識庫和網(wǎng)絡(luò)數(shù)據(jù)學(xué)習(xí)組合利用后建模。對于系統(tǒng)的特點(diǎn)和條件差異,應(yīng)用不同的建模方法。建造貝葉斯網(wǎng)絡(luò)主要應(yīng)用的是概率推理,特別是后驗(yàn)概率的分析。
貝葉斯網(wǎng)絡(luò)為有向無環(huán)圖,由節(jié)點(diǎn)和邊構(gòu)成。隨機(jī)變量通過節(jié)點(diǎn)來代替,變量和變量的相互關(guān)系通過有向邊來表達(dá)。貝葉斯網(wǎng)絡(luò)賦予了有向圖中全部變量的特定聯(lián)合概率分布,通過獲得節(jié)點(diǎn)的聯(lián)合概率分布來獲取某一事件的概率。貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)成立的前提是隨機(jī)變量相對獨(dú)立。
貝葉斯網(wǎng)絡(luò)中變量的聯(lián)合概率分布為:
式中:Pa(Xi)為節(jié)點(diǎn)Xi的所有父節(jié)點(diǎn)變量集。
聯(lián)合概率分布的連續(xù)函數(shù)形式為:
要想得到指定變量的邊緣概率分布,需要得到聯(lián)合概率分布。例如,假設(shè)有兩個離散隨機(jī)變量X和 Y,X 有 m 個狀態(tài),X={a1,a2,…am},Y 有 n 個狀態(tài),Y={b1,b2,…,bn},得到聯(lián)合概率分布 P(X,Y),則能計算出X的邊緣概率分布P(X):
式(3)的連續(xù)形式為:
如果節(jié)點(diǎn)事件A在節(jié)點(diǎn)事件B前失效,那么節(jié)點(diǎn)事件X與節(jié)點(diǎn)事件B同時失效。如果節(jié)點(diǎn)事件B在節(jié)點(diǎn)事件A前失效,那么節(jié)點(diǎn)事件X在將來無窮遠(yuǎn)的時間失效,如圖1、圖2所示。
圖1 優(yōu)先與門
圖2 優(yōu)先與門貝葉斯網(wǎng)絡(luò)圖
優(yōu)先與門輸出的條件概率密度函數(shù)為:
節(jié)點(diǎn)的故障概率分布函數(shù)為:
考慮 x<∞,δ(x-∞)=0,則 X 在時間段[0,t]的故障發(fā)生概率為:
有n個輸入事件的故障樹與門,則X在時間段[0,t]的故障發(fā)生概率為:
優(yōu)先或門表示只有當(dāng)?shù)谝粋€輸入門,也就是故障樹最左邊輸入門失效時,整個門才輸出失效,如圖3、圖4所示。由圖2、圖4可見,優(yōu)先與門和優(yōu)先或門的貝葉斯網(wǎng)絡(luò)圖一致。
圖3 優(yōu)先或門
圖4 優(yōu)先或門貝葉斯網(wǎng)絡(luò)圖
優(yōu)先或門輸出的條件概率密度函數(shù)為:
優(yōu)先或門輸出的邊緣概率分布函數(shù)為:
δ(x-∞)=0,則 X 在時間段[0,t]的故障發(fā)生概率為:
有n個輸入事件的故障樹或門,則X在[0,t]時間段的故障發(fā)生概率為:
由于真實(shí)工程系統(tǒng)中零部件故障的形成很復(fù)雜,彼此間有很多聯(lián)系,有的是靜態(tài)的,有的是動態(tài)的,而且部件故障還存在發(fā)生順序的問題,因此傳統(tǒng)的靜態(tài)故障樹是無法準(zhǔn)確表達(dá)零部件失效的原因和結(jié)果的,需要馬爾可夫模型方法來解決這些問題。應(yīng)用馬爾可夫鏈法處理動態(tài)子樹,先要將動態(tài)子樹處理為對應(yīng)的馬爾可夫鏈,繼而根據(jù)動態(tài)故障樹狀態(tài)轉(zhuǎn)移圖,獲得故障模式和傳遞線路。對于狀態(tài)轉(zhuǎn)移圖,若馬爾可夫鏈最后的狀態(tài)為系統(tǒng)故障,那么該鏈上的全部事件故障的轉(zhuǎn)移關(guān)系稱為系統(tǒng)的一種故障。從系統(tǒng)故障的狀態(tài)開始,順著馬爾可夫鏈返回追蹤,能夠得到動態(tài)故障樹系統(tǒng)的全部故障狀態(tài)。
一條鏈在Δt時段內(nèi),事件發(fā)生概率為λij,狀態(tài)i轉(zhuǎn)移到狀態(tài)j的轉(zhuǎn)移概率為:
狀態(tài)i的自身轉(zhuǎn)移概率Pij(Δt)為:
鏈長為1的狀態(tài)轉(zhuǎn)移鏈如圖5所示。
圖5 鏈長為1狀態(tài)轉(zhuǎn)移鏈
令Pj(t)是該轉(zhuǎn)移鏈?zhǔn)瓜到y(tǒng)在時刻t處于鏈長為1狀態(tài)的概率,那么,P(t)=(P0(t),P1(t))符合下列微分方程組及初始條件:
對于系統(tǒng)的狀態(tài)轉(zhuǎn)移鏈,由0到j(luò)若有鏈長為1的狀態(tài)轉(zhuǎn)移鏈T1,則Pj(t)在T1上的分量為:
式中:λ00>0;λjj≥0。
鏈長為2的狀態(tài)轉(zhuǎn)移鏈如圖6所示。
圖6 鏈長為2狀態(tài)轉(zhuǎn)移鏈
由0到j(luò)若有鏈長為2的狀態(tài)轉(zhuǎn)移鏈T2,則Pj(t)在T2上的分量為:
鏈長為n的狀態(tài)轉(zhuǎn)移過程如圖7所示。
圖7 鏈長為n狀態(tài)轉(zhuǎn)移鏈
式中:j=1,2,…n;λkk>0;λjj≥0。
當(dāng) j=n 時,λnn=0,則有:
貝葉斯網(wǎng)絡(luò)所具有的條件獨(dú)立的特性可以降低系統(tǒng)計算的難度,尤其適用于分析擁有隨機(jī)性質(zhì)的不確定動態(tài)時序系統(tǒng)。在計算的過程中,避開了組合爆炸,且所求得的計算結(jié)果精度會有所提高。同樣也可以應(yīng)用于對動態(tài)復(fù)雜系統(tǒng)備件節(jié)點(diǎn)失效的處理,因?yàn)榭梢员磉_(dá)系統(tǒng)的多態(tài)性和不確定性。
在應(yīng)用貝葉斯網(wǎng)絡(luò)時,會因?yàn)槠涔逃械牟淮_定性事件之間因果關(guān)系的缺陷,而需要確定事件間的關(guān)聯(lián)概率,因此增大了網(wǎng)絡(luò)構(gòu)成的難度。對于建模的過程,需要相關(guān)科研人員不斷進(jìn)行改進(jìn),但處理過程可能反而變得麻煩。
馬爾可夫鏈法是利用狀態(tài)空間矩陣的方法來描述系統(tǒng)中各個狀態(tài)轉(zhuǎn)移的隨機(jī)過程,可以充分描述系統(tǒng)故障的順序相關(guān)性、功能相關(guān)性、優(yōu)先性等動態(tài)特點(diǎn),具有對不確定性進(jìn)行推理的能力。
應(yīng)用馬爾可夫鏈法處理分析較大的動態(tài)故障系統(tǒng)時,隨著底事件及中間事件數(shù)量的增加,計算量會變得很大,而且應(yīng)用馬爾可夫鏈法是需要一定前提的,只有組成系統(tǒng)的所有部件的壽命和維修時間都滿足指數(shù)分布時,才可以對其進(jìn)行分析和處理。因此,馬爾可夫鏈法無法在實(shí)際系統(tǒng)中得以廣泛推廣應(yīng)用。
將故障樹分析法應(yīng)用于分析故障系統(tǒng)時,僅僅對系統(tǒng)總體采用了故障樹建模,而未對系統(tǒng)每一個部分進(jìn)行定性定量分析,因此還需要細(xì)化延伸對各模塊分別處理。對于智能化分析的要求,也沒有特定完善的故障樹分析軟件。
對于兼顧分析模糊不確定性和動態(tài)失效特性等條件下的故障樹處理,現(xiàn)有成果仍然欠缺,因此導(dǎo)致應(yīng)用現(xiàn)有研究手段來處理獲得的數(shù)據(jù)與現(xiàn)實(shí)情況不匹配,甚至有很大的出入。于是,針對結(jié)合零部件動態(tài)故障特征和模糊無法確定的系統(tǒng)可靠性處理方法,其發(fā)展有很大空間。
針對上述有待改進(jìn)的問題,相關(guān)學(xué)者提出可以從模塊化的思維入手來對系統(tǒng)故障樹建模,使所建立的故障樹模型結(jié)構(gòu)更加符合實(shí)際要求。將過于巨大的系統(tǒng)進(jìn)一步細(xì)化分解,最終重新將故障樹各個模塊子樹組合成整體進(jìn)行分析。此外,對于分析處理某些效率較低的算法,出現(xiàn)計算機(jī)系統(tǒng)處理無法匹配的現(xiàn)象,算法設(shè)計者可以應(yīng)用多線程并行處理計算的方法來攻克這些問題。
目前我國對于應(yīng)用計算機(jī)作為輔助來建立故障樹和計算機(jī)自行處理計算的研究還不是十分完善,普遍只是應(yīng)用于試驗(yàn)階段的單一制圖,尚無法直接對故障樹定性和定量處理。個別研究領(lǐng)域的學(xué)者開發(fā)出的軟件只能應(yīng)用于自身所在領(lǐng)域所特定的故障樹定性和定量處理,尚無法隨著系統(tǒng)條件的改變而隨意更改故障樹。由于存在諸多尚未解決的問題,因此故障樹分析法還無法突破領(lǐng)域間的界限。
無論是馬爾可夫鏈法,還是貝葉斯網(wǎng)絡(luò)法,都是用于處理不確定問題的方法,可以在此基礎(chǔ)上考慮研究結(jié)合其它不確定理論及處理方法,從而在多種類別問題上構(gòu)造出更為適合不確定問題,且可以應(yīng)用于更大范圍的通用解決方法。
[1]DUGAN J B,BAVUSO S J,BOYD M A.Dynamic Fault-tree Models for Fault-tolerant Computer Systems[J].IEEE Transactions on Reliability,1992,41(3):363-377.
[2]GULATI R,DUGAN J B.A Modular Approach for Analyzing Static and Dynamic Fault Trees[C].Reliability and Maintainability Symposium.1997 Proceedings,Annual,Philadelphia,1997.
[3]OU Y,DUGAN J B.Approximate Sensitivity Analysis for Acyclic Markov Reliability Models[J].IEEE Transactions on Reliability,2003,52(2):220-230.
[4]BOUDALI H,CROUZEN P,STOELINGA M.Dynamic Fault Tree Analysis Using Input/Output Interactive Markov Chains[C].Dependable Systems and Networks,2007.DSN’07.37th Annual IEEE/IFIP International Conference on,Edinburgh,2007.
[5]MARQUEZ D,NEIL M,F(xiàn)ENTON N.Solving Dynamic Fault Trees Using A New Hybrid Bayesian Network Inference Algorithm[C].Control and Automation,2008 16th MediterraneanConference on,Ajaccio,2008.
[6]DUAN R X,WAN G C,DONG D C.A New Assessment Method for System Reliability Based on Dynamic Fault Tree[C].Intelligent Computation Technology and Automation(ICICTA),2010 International Conference on,Changsha,2010.
[7]KOLEK L,IBRAHIM M Y,GUNAWAN I,et al.Evaluation of Control System Reliability Using Combined Dynamic Fault Treesand MarkovModels[C].Industrial Informatics(INDIN),2015 IEEE 13th International Conference on,Cambridge,2015.
[8]季會媛.動態(tài)故障樹分析方法研究[D].哈爾濱:國防科學(xué)技術(shù)大學(xué),2002.
[9]朱正福,李長福,何恩山,等.基于馬爾可夫鏈的動態(tài)故障樹分析方法[J].兵工學(xué)報.2008,29(9):1104-1107.
[10]李彥鋒.復(fù)雜系統(tǒng)動態(tài)故障樹分析的新方法及其應(yīng)用研究[D].成都:電子科技大學(xué),2013.
[11]房丙午,黃志球,李勇,等.基于貝葉斯網(wǎng)絡(luò)的復(fù)雜系統(tǒng)動態(tài)故障樹定量分析方法[J].電子學(xué)報,2016,44(5):1234-1239.
[12]孫利娜,黃寧,仵偉強(qiáng),等.基于T-S模糊故障樹的多態(tài)系統(tǒng)性能可靠性[J].機(jī)械工程學(xué)報,2016,52(10):191-198.
[13]王雪飛,李青,馮力.基于模型和故障樹的飛機(jī)故障診斷方法[J].科學(xué)技術(shù)與工程,2017,17(20):308-313.
[14]張佳,賈向陽.基于故障樹與Rete算法的電泵井工況診斷方法研究[J].現(xiàn)代電子技術(shù),2017,40(2):34-38.
[15]陳衛(wèi)東,張昌衛(wèi),琚選擇,等.水下生產(chǎn)系統(tǒng)管匯的故障樹分析[J].哈爾濱工程大學(xué)學(xué)報,2016,37(8):1022-1026.
[16]王煒俊.基于故障樹法的城市軌道交通受電弓可靠性分析[J].科技創(chuàng)新導(dǎo)報,2016,13(1):59-61.
[17]張國喜,李曉鐘.基于灰色關(guān)聯(lián)故障樹的運(yùn)營期隧道病害風(fēng)險研究[J].工程管理學(xué)報,2016,30(1):77-81.
[18]寇海霞,安宗文,劉波,等.基于貝葉斯網(wǎng)絡(luò)的風(fēng)電齒輪箱可靠性分析[J].蘭州理工大學(xué)學(xué)報,2016,42(1):40-45.
[19]張軍.故障樹最小割集法在S76直升機(jī)故障診斷中的應(yīng)用[J].航空維修與工程,2015(12):79-80.
[20]陳德道,安虎平,胡宗政.基于模糊理論的數(shù)控刀架故障診斷方法研究[J].組合機(jī)床與自動化加工技術(shù),2015(10):84-87,90.