張偉,賈瑤
(中國(guó)電子科技集團(tuán)公司第三十六研究所,嘉興 314033)
系統(tǒng)工程中關(guān)于系統(tǒng)的定義為,是由相互聯(lián)系、相互作用的許多要素組成的具有特定功能的復(fù)合體。系統(tǒng)整體與構(gòu)成系統(tǒng)的部分是相對(duì)而言的,整體中的某些部分可以看成是該系統(tǒng)的子系統(tǒng),而整個(gè)系統(tǒng)又可以成為一個(gè)更大規(guī)模系統(tǒng)中的一個(gè)組成部分或者子系統(tǒng)[1]。
所謂“系統(tǒng)可靠性”主要區(qū)別于一般的元器件、零部件和組件模塊的可靠性,它的研究對(duì)象是整個(gè)系統(tǒng)。系統(tǒng)可靠性分析方法又有區(qū)別于眼下比較流行的失效物理(Physics of Failure,PoF)法,失效物理研究方法是基于產(chǎn)品失效的實(shí)際物理過程,通過探究產(chǎn)品失效模式與失效根因,從而構(gòu)建相應(yīng)的失效物理模型,達(dá)到對(duì)于產(chǎn)品失效的定量化描述和評(píng)價(jià)的目的。顯然,失效物理研究方法不適用于系統(tǒng)可靠性評(píng)價(jià)問題,系統(tǒng)可靠性評(píng)價(jià)的核心目的在于達(dá)成針對(duì)對(duì)象產(chǎn)品的量化評(píng)價(jià)要求,即在數(shù)值上合理確定并最終給出對(duì)象產(chǎn)品的可靠性量化指標(biāo)或稱可靠性特征量。
不同的系統(tǒng),不同的應(yīng)用場(chǎng)合具有不同的可靠性分析手段,但研究系統(tǒng)可靠性的方法不外乎以下幾種,分別是可靠性框圖(RBD)法、故障樹分析(FTA)法、Markov分析法、Monte-Carlo仿真、GO法和Petri網(wǎng)等方法。本文以這六種系統(tǒng)可靠性分析方法為基礎(chǔ),從方法的研究背景、原理、適用范圍出發(fā),闡述所謂“系統(tǒng)可靠性”分析方法的基本內(nèi)涵與特征,在此基礎(chǔ)上,針對(duì)不同分析方法的特點(diǎn),結(jié)合工程實(shí)踐與應(yīng)用需求,對(duì)各種分析方法做了比較研究,研究結(jié)論供廣大工程人員在做系統(tǒng)可靠性分析選擇時(shí)參考。
可靠性框圖法為各種系統(tǒng)可靠性分析方法中最簡(jiǎn)單的方法,但也是使用最為廣泛的方法。可靠性框圖是用方框表示系統(tǒng)各組成部分的故障或它們的組合如何導(dǎo)致產(chǎn)品故障的邏輯關(guān)系圖,它描述了系統(tǒng)各組成部分之間的可靠性關(guān)系,并能夠給出一個(gè)確切的數(shù)學(xué)表達(dá)式。典型的系統(tǒng)可靠性框圖有:串聯(lián)系統(tǒng)、并聯(lián)系統(tǒng)、表決系統(tǒng)、旁聯(lián)系統(tǒng)和網(wǎng)絡(luò)系統(tǒng)??煽啃钥驁D的研究基礎(chǔ)是概率論,適用場(chǎng)合為不可修系統(tǒng)。下面簡(jiǎn)單描述以上幾種典型的系統(tǒng)可靠性框圖及其數(shù)學(xué)表達(dá)形式[2]。
1)串聯(lián)系統(tǒng)
組成系統(tǒng)的所有單元中任一單元的故障都會(huì)導(dǎo)致整個(gè)系統(tǒng)的故障稱為串聯(lián)系統(tǒng)。
其邏輯框圖(RBD)如圖1所示。
圖1 串聯(lián)模型
其數(shù)學(xué)模型為:
式中:
Rs(t)—系統(tǒng)可靠度;
Ri(t)—第i個(gè)單元的可靠度。
2)并聯(lián)系統(tǒng)
組成系統(tǒng)的所有單元都發(fā)生故障時(shí),系統(tǒng)才發(fā)生故障稱為并聯(lián)系統(tǒng),并聯(lián)系統(tǒng)是最簡(jiǎn)單的冗余系統(tǒng)(熱儲(chǔ)備)。
其RBD如圖2所示。
圖2 并聯(lián)模型
其數(shù)學(xué)模型為:
式中:
Rs(t)—系統(tǒng)可靠度;
Ri(t)—第i個(gè)單元的可靠度。
3)表決系統(tǒng)
組成系統(tǒng)的n個(gè)單元中,正常的單元數(shù)不小于r(1≤r≤n)系統(tǒng)就不會(huì)故障,這樣的系統(tǒng)稱為r/n(G)表決模型。
其RBD如圖3所示。
圖3 表決模型
其數(shù)學(xué)模型為:
式中:
Rs(t)—系統(tǒng)可靠度;
R (t)—單元可靠度。
4)旁聯(lián)系統(tǒng)
組成系統(tǒng)的各單元只有一個(gè)單元工作,當(dāng)工作單元故障時(shí),通過轉(zhuǎn)換裝置接到另一個(gè)單元繼續(xù)工作,直到所有單元都故障時(shí)系統(tǒng)才故障,稱為旁聯(lián)系統(tǒng),又稱非工作貯備(冷備)系統(tǒng)。
其RBD如圖4所示。
圖4 旁聯(lián)模型
其數(shù)學(xué)模型為:
式中:
Rs(t)—系統(tǒng)可靠度;
RD—轉(zhuǎn)換裝置可靠度;
λ—第i個(gè)單元的故障率。
5)網(wǎng)絡(luò)系統(tǒng)
網(wǎng)絡(luò)系統(tǒng)為上述幾種系統(tǒng)的組合,系統(tǒng)某些功能冗余形式或替代工作方式的實(shí)現(xiàn),是一種既非串聯(lián)也非并聯(lián)的橋形式,稱為橋聯(lián)系統(tǒng)或網(wǎng)絡(luò)系統(tǒng)。其數(shù)學(xué)模型的建立較為復(fù)雜且有個(gè)性,不能建立通用的表達(dá)式,具體情況需要具體去分析。
故障樹分析(Fault tree analysis,F(xiàn)TA)是以一個(gè)不希望發(fā)生的產(chǎn)品故障事件或?yàn)?zāi)難性危險(xiǎn)事件作為頂事件,通過由上向下的嚴(yán)格層次的故障因果邏輯分析,找到導(dǎo)致頂事件發(fā)生的所有原因和原因組合的邏輯因果關(guān)系圖。FTA不僅能夠?qū)ο到y(tǒng)進(jìn)行定性風(fēng)險(xiǎn)分析,在有基礎(chǔ)數(shù)據(jù)時(shí)還可以進(jìn)行定量分析計(jì)算,估計(jì)系統(tǒng)頂事件發(fā)生概率以及底事件的重要度。
FTA的核心在于尋找故障樹的最小割集,所謂的最小割集是指導(dǎo)致頂事件發(fā)生故障的底事件組合,且缺少這個(gè)組合中的任一底事件都將不能導(dǎo)致系統(tǒng)故障。
FTA一般有3個(gè)步驟[2]:
第一步:建立故障樹。確定分析目的、明確系統(tǒng)定義和故障判據(jù),利用專用的事件和邏輯門符號(hào),將系統(tǒng)中故障事件之間的邏輯關(guān)系表達(dá)出來,形成故障樹。
第二步:規(guī)范故障樹。將建立的故障樹規(guī)范化,形成僅含有底事件、結(jié)果事件和與、或、非三種邏輯門的故障樹,并將故障事件用字母代替予以簡(jiǎn)化。
第三步:分析與建議。根據(jù)建立的故障樹,求得故障樹的割集和最小割集,進(jìn)行定性分析和定量計(jì)算。根據(jù)分析結(jié)果確定系統(tǒng)薄弱環(huán)節(jié)并提出相應(yīng)的改進(jìn)措施。
Markov分析將系統(tǒng)看做由多種狀態(tài)構(gòu)成,屬于狀態(tài)圖State Diagrams的一種,具有兩種狀態(tài),即工作狀態(tài)和故障狀態(tài)。系統(tǒng)從一種狀態(tài)到另一種狀態(tài)的轉(zhuǎn)移概率僅與系統(tǒng)的當(dāng)前狀態(tài)相關(guān),而與系統(tǒng)先前的狀態(tài)無關(guān),稱之為Markov過程。
對(duì)于一個(gè)由N個(gè)相同單元組成的并聯(lián)系統(tǒng),可以確定N+1種狀態(tài),其中狀態(tài)N表示所有N個(gè)單元均可正常工作,狀態(tài)N-1表示有一個(gè)單元故障處于維修狀態(tài),而其它N-1個(gè)單元可正常工作,……,狀態(tài)1則表示只有一個(gè)單元處于工作狀態(tài),而其它N-1個(gè)單元中的一個(gè)或多個(gè)處于維修狀態(tài),狀態(tài)0表明系統(tǒng)中所有的單元均故障,即整個(gè)系統(tǒng)處于故障狀態(tài)。應(yīng)用Markov分析的一般過程為[3]:
第一步:確定系統(tǒng)所有存在的狀態(tài)。
第二步:在僅考慮傳輸率的情況下確定系統(tǒng)在t時(shí)刻處于每種狀態(tài)的概率,并給出用于描述系統(tǒng)整體狀態(tài)的不同方程。
第三步:求解系統(tǒng)不同的方程,并定義系統(tǒng)的可靠度為:
式中:
R0(t)—系統(tǒng)在t時(shí)刻故障的概率;
λ和μ—系統(tǒng)中單元的故障率和維修率,一般均為常數(shù),如果不是常數(shù)時(shí)將會(huì)變成半Markov過程或非Markov過程,其應(yīng)用求解將會(huì)更為復(fù)雜。
對(duì)于給定的系統(tǒng),通常有3種方法用于求解并可得到3種不同的方程,即系統(tǒng)狀態(tài)分析方法、狀態(tài)傳輸矩陣以及Markov圖方法。這些方法在大量的教程和文獻(xiàn)中已有系統(tǒng)詳細(xì)的論述,本文不再贅述。
在大多數(shù)情況下,由于方程求解的難度很難得到一個(gè)精確的解析解時(shí),Monte-Carlo是一種很好的解決方法。
Monte-Carlo方法是一種以概率和數(shù)理統(tǒng)計(jì)理論為基礎(chǔ), 通過隨機(jī)變量的統(tǒng)計(jì)試驗(yàn),隨機(jī)模擬來求解數(shù)學(xué)物理、工程技術(shù)問題的近似解的數(shù)學(xué)方法。根據(jù)求解問題的不同,這里的隨機(jī)變量主要有兩類,即一類是影響系統(tǒng)性能的參數(shù),另一類是系統(tǒng)各組成部分(部件或組件)的可靠性參數(shù)(如失效率、可靠度等)。
第一類隨機(jī)變量主要用于那些性能難以用解析形式來表達(dá),或者只能需要通過大量的試驗(yàn)結(jié)果對(duì)其性能進(jìn)行評(píng)估的問題,并且組成該系統(tǒng)的部件或組件的性能可以隨機(jī)變量的形式來表示的復(fù)雜系統(tǒng)。
對(duì)于這類問題的求解,首先需要確定那些所有可能影響系統(tǒng)性能的參數(shù),并確定相應(yīng)的隨機(jī)變量及其分布。然后通過隨機(jī)產(chǎn)生的性能參數(shù)來確定系統(tǒng)的性能,并與性能參數(shù)要求進(jìn)行比對(duì),按事先確定的失效判據(jù)來確定系統(tǒng)的故障與否,即若性能參數(shù)超標(biāo)則計(jì)系統(tǒng)故障發(fā)生一次,最后可以確定系統(tǒng)的可靠度為:
由于Monte-Carlo方法以大數(shù)定理為基本原則之一,故仿真的次數(shù)越多,其預(yù)計(jì)或評(píng)估的結(jié)果越真實(shí),利用Monte-Carlo方法分析系統(tǒng)可靠性的基本流程如圖5所示[4]。
圖5 Monte-Carlo仿真的基本流程圖
對(duì)于復(fù)雜的電子產(chǎn)品而言,就可以考慮利用Monte-Carlo方法,在產(chǎn)品電路基礎(chǔ)上對(duì)其功能進(jìn)行仿真,來評(píng)估或預(yù)計(jì)電子產(chǎn)品的系統(tǒng)可靠性。
第二類隨機(jī)變量主要用于那些已知系統(tǒng)各組成部分的可靠性特征量,并且可以給出該系統(tǒng)的可靠性框圖或故障樹的情況。但由于系統(tǒng)的可靠性模型過于復(fù)雜,難于推導(dǎo)出一個(gè)可以求解的通用公式時(shí),Monte-Carlo方法可根據(jù)單元完成任務(wù)的概率,直接通過可靠性框圖或故障樹的近似計(jì)算來預(yù)計(jì)系統(tǒng)的可靠度。
GO法的基本思想是在20世紀(jì)60年代中期由美國(guó)Kaman科學(xué)公司最先提出,經(jīng)過應(yīng)用中不斷完善,20世紀(jì)80年代以后在核領(lǐng)域得到了應(yīng)用,是一種用圖形演繹法來分析系統(tǒng)可靠性的方法。
GO法以成功為導(dǎo)向,運(yùn)用操作符與信號(hào)流將系統(tǒng)的原理圖或工程圖直接翻譯成GO圖,并且用GO法程序計(jì)算所分析系統(tǒng)的各種狀態(tài)的發(fā)生概率,用于評(píng)估系統(tǒng)的可靠度或可用度。
運(yùn)用GO法進(jìn)行系統(tǒng)可靠性分析的一般過程為[5]:
第一步:定義系統(tǒng)與邊界。定義系統(tǒng),確定系統(tǒng)的范圍,明確系統(tǒng)中所有的可修單元和單元組成的系統(tǒng)結(jié)構(gòu),并給出系統(tǒng)的原理圖或工程圖。確定系統(tǒng)的輸入邊界與輸出邊界,確定系統(tǒng)、子系統(tǒng)和元件之間的接口關(guān)系。
第二步:建立GO圖。根據(jù)系統(tǒng)工作原理圖或工程圖,用操作符表示系統(tǒng)的功能或部件,GO法中共定義了17種操作符。用信號(hào)流連接各個(gè)操作符,表示系統(tǒng)中各部件邏輯上的關(guān)系,最后生成GO圖,用于系統(tǒng)的定性分析與定量評(píng)價(jià)。
第三步:進(jìn)行GO運(yùn)算。輸入的系統(tǒng)單元可靠性參數(shù)(通常為故障率和平均修復(fù)時(shí)間MTTR), 根據(jù)GO法的運(yùn)算規(guī)則,從輸入操作符的輸出信號(hào)開始,逐步運(yùn)算至系統(tǒng)的輸出信號(hào),最終得到各個(gè)單元和系統(tǒng)的可靠性特征量。
Petri網(wǎng)最早是由聯(lián)邦德國(guó)的Carl Adam Petri于1962年在他的博士論文中提出,通過建立網(wǎng)狀結(jié)構(gòu)來模擬通信系統(tǒng)。Petri網(wǎng)是研究系統(tǒng)的一種工具,用來揭示出被模擬的系統(tǒng)在結(jié)構(gòu)和動(dòng)態(tài)行為方面的重要信息。Petri網(wǎng)既能圖形化建模也可以進(jìn)行數(shù)學(xué)計(jì)算,理論基礎(chǔ)是系統(tǒng)各種狀態(tài)及其動(dòng)態(tài)變化之間的相互聯(lián)系。Petri網(wǎng)是一種特殊的有向網(wǎng),可用于描述復(fù)雜系統(tǒng)的靜態(tài)和動(dòng)態(tài)變化,直觀的反映了系統(tǒng)狀態(tài)變化和事件發(fā)展的過程[6]。
Petri網(wǎng)由三種類型的對(duì)象組成:庫所(圓圈)、變遷(矩形)和有向?。^)。連接庫所與變遷之間的有向弧表示輸入輸出函數(shù),用黑點(diǎn)或數(shù)字來表示標(biāo)識(shí)以顯示庫所中資源的數(shù)量。庫所中標(biāo)識(shí)的數(shù)目決定變遷的使能和激發(fā),變遷的激發(fā)又將改變庫所中標(biāo)識(shí)的數(shù)目,變遷的激發(fā)使得標(biāo)識(shí)在庫所之間流動(dòng)[7]。因此,Petri網(wǎng)常用于描述系統(tǒng)動(dòng)態(tài)的變化過程,能夠直觀的反映系統(tǒng)的動(dòng)態(tài)特性。
在系統(tǒng)可靠性分析中Petri網(wǎng)尤其適合描述故障傳播的過程,推斷故障發(fā)生的原因,因此常用于故障診斷的場(chǎng)合,此外Petri網(wǎng)在可修系統(tǒng)的可靠性建模與分析、冗余系統(tǒng)的可靠性分析等方面也有廣泛的應(yīng)用。
系統(tǒng)可靠性量化評(píng)價(jià)必然要輸出可靠性指標(biāo),對(duì)于不可修系統(tǒng),通常選用的系統(tǒng)可靠性指標(biāo)為系統(tǒng)可靠度R、系統(tǒng)失效率λ、系統(tǒng)平均故障前時(shí)間MTTF(Mean Time To Failure,MTTF)。對(duì)于可修系統(tǒng),通常選用的系統(tǒng)可靠性指標(biāo)為系統(tǒng)可用度Ai、單元工作失效率λ與修復(fù)率μ、平均故障間隔時(shí)間MTBF(Mean Time Between Failure,MTBF)和平均故障修復(fù)時(shí)間MTTR(Mean Time To Repair,MTTR)。其中系統(tǒng)固有可用度Ai與其余可靠性指標(biāo)參數(shù)的關(guān)系為[8]:
對(duì)于可修系統(tǒng),不但要求使用期間具有很高的可靠性,同時(shí)還要求在使用以前能夠保持很高的可用能力,因此,在滿足系統(tǒng)高可靠性的前提下,還因適當(dāng)降低系統(tǒng)的維修時(shí)間,以保持系統(tǒng)足夠的可用度。
本文重點(diǎn)介紹了六種系統(tǒng)可靠性分析方法,包括可靠性框圖法、故障樹分析、Markov分析、Monte-Carlo仿真、GO法和Petri網(wǎng)?;谶@六種系統(tǒng)可靠性分析方法的特點(diǎn),分別從其適用范圍、輸入條件、輸出結(jié)果以及優(yōu)缺點(diǎn)等幾個(gè)維度進(jìn)行比較,比較結(jié)果如表1所示,研究結(jié)論供廣大工程人員在做系統(tǒng)可靠性分析時(shí)選擇。
表1 系統(tǒng)可靠性分析方法比較
系統(tǒng)可靠性分析需要建立相應(yīng)的系統(tǒng)可靠性模型,而系統(tǒng)可靠性模型一般分為兩類,即解析模型和仿真模型,而解析模型又可細(xì)分為網(wǎng)絡(luò)模型和Markov模型。
其中網(wǎng)絡(luò)模型由簡(jiǎn)單的可靠性框圖或故障樹組成。系統(tǒng)可靠性分析的輸出結(jié)果(指量化結(jié)果)一般為通常所說的可靠性指標(biāo),系統(tǒng)可靠性指標(biāo)一般用系統(tǒng)可用度進(jìn)行評(píng)價(jià),系統(tǒng)可用度綜合反映了系統(tǒng)的可靠性與系統(tǒng)的維修性水平。
本文介紹了六種常見的應(yīng)用于系統(tǒng)可靠性分析的方法,對(duì)六種方法從原理、適用范圍及工作流程分別進(jìn)行了簡(jiǎn)要的闡述分析,并對(duì)各種不同的系統(tǒng)可靠性方法分別從不同的維度進(jìn)行比較研究,給出其適用的范圍、輸入與輸出和優(yōu)缺點(diǎn)分析,以便于在工程實(shí)際應(yīng)用時(shí)進(jìn)行選擇參考。