杜光遠(yuǎn)
(北京機(jī)電工程研究所,北京 100074)
復(fù)雜電子裝備故障預(yù)測技術(shù)研究
杜光遠(yuǎn)
(北京機(jī)電工程研究所,北京 100074)
首先,強(qiáng)調(diào)了對復(fù)雜電子裝備進(jìn)行故障預(yù)測和健康管理的必要性;其次,簡要地介紹了故障預(yù)測單元法、故障預(yù)兆參數(shù)法和基于失效物理分析的環(huán)境監(jiān)測法3種故障預(yù)測方法;然后,總結(jié)了利用基于以上方法得到的故障相關(guān)數(shù)據(jù)來進(jìn)行復(fù)雜電子裝備的故障評價(jià)的主要原則和方法;最后,分析了復(fù)雜電子裝備相關(guān)故障預(yù)測數(shù)據(jù)的特點(diǎn)和應(yīng)重點(diǎn)關(guān)注的問題。
復(fù)雜電子裝備;健康管理;故障預(yù)測;測試;評價(jià)
目前,故障預(yù)測和健康管理 (PHM:Prognostics and Health Management)技術(shù)已經(jīng)得到了美英等軍事強(qiáng)國的高度重視和推廣應(yīng)用,并正在成為新一代飛機(jī)、艦船和車輛等系統(tǒng)設(shè)計(jì)和使用中的一項(xiàng)重要的測試技術(shù)。國外以F-35飛機(jī)的PHM系統(tǒng)[1]、直升機(jī)健康與使用監(jiān)控系統(tǒng) (HUMS)、波音公司的飛機(jī)狀態(tài)管理系統(tǒng) (AHM)和NASA飛行器綜合健康管理 (IvHM)等為代表的PHM相關(guān)技術(shù),已被廣泛地應(yīng)用于歐美等國的先進(jìn)戰(zhàn)機(jī)、直升機(jī)和大型客機(jī)上,包括美國海軍的先進(jìn)艦船也均采用了類似PHM技術(shù)的綜合狀態(tài)評估系統(tǒng),以增強(qiáng)故障預(yù)測與診斷能力。
據(jù)來自美軍的綜合數(shù)據(jù)可知,在武器裝備的全壽命周期費(fèi)用中,使用與保障費(fèi)用占到了總費(fèi)用的72%,并且1/3的維修費(fèi)用是由于不必要和不準(zhǔn)確的維修工作引起的。與使用保障費(fèi)用相比,維修保障費(fèi)用在技術(shù)上更具有可壓縮性。PHM是壓縮維修保障費(fèi)用的重要手段,其通過減少備件、保障設(shè)備和維修人力等保障資源需求來降低維修保障費(fèi)用;通過減少維修次數(shù),特別是計(jì)劃外的維修次數(shù)來縮短維修時(shí)間,提高戰(zhàn)備完好率;通過健康感知來減少任務(wù)過程中故障引起的風(fēng)險(xiǎn),提高任務(wù)成功率[2]。
我國的武器裝備中有大量的復(fù)雜電子裝備,目前針對這些裝備的測試主要是功能測試,由于很多技術(shù)參數(shù)均無法測量,因此,功能測試只能評價(jià)武器系統(tǒng)合格與否,而無法對其質(zhì)量和品質(zhì)進(jìn)行評估。如果在設(shè)計(jì)這些復(fù)雜的電子裝備時(shí),進(jìn)行PHM設(shè)計(jì)并配置相應(yīng)的測試手段和測試數(shù)據(jù)評估方法,則不僅能夠判斷裝備是否合格,而且還能對其健康狀況進(jìn)行評估,同時(shí)還可以對一些近期可能出現(xiàn)的故障進(jìn)行預(yù)測。
PHM技術(shù)通過最大程度地利用傳統(tǒng)的故障特征檢測技術(shù),采用先進(jìn)的傳感器,借助各種算法和智能模型來預(yù)測、監(jiān)控和管理武器裝備的運(yùn)行狀態(tài),進(jìn)而獲得虛警率極低的故障檢測和故障隔離的結(jié)果,并最終實(shí)現(xiàn)基于狀態(tài) (歷史、當(dāng)前及未來狀態(tài))的維修,以主動(dòng)性的3Rs(即在準(zhǔn)確的時(shí)間對準(zhǔn)確的部位采取準(zhǔn)確的維修活動(dòng))取代傳統(tǒng)的、基于事件的事后維修或基于時(shí)間的定期維修。該項(xiàng)技術(shù)在國外先進(jìn)國家已經(jīng)成為了新一代航空航天裝備實(shí)現(xiàn)自主式保障和降低壽命周期費(fèi)用的核心技術(shù)。
故障預(yù)測技術(shù)是采用故障預(yù)測單元、故障預(yù)兆參數(shù)監(jiān)測和基于失效物理分析的環(huán)境監(jiān)測等方法來獲得產(chǎn)品失效相關(guān)信息的,在此基礎(chǔ)上利用數(shù)據(jù)分析技術(shù)得到產(chǎn)品臨近失效的特征并以此給出產(chǎn)品即將失效的預(yù)警[3]。故障預(yù)測與產(chǎn)品失效關(guān)系示意圖如圖1所示。
圖1 故障預(yù)測與產(chǎn)品失效關(guān)系示意圖
目前,國際上常用的電子產(chǎn)品的故障預(yù)測方法主要有3種,即:基于保險(xiǎn)和預(yù)警裝置的方法 (故障預(yù)測單元法)[4]、基于故障預(yù)兆和推理的方法(故障預(yù)兆參數(shù)法)和基于失效物理分析的環(huán)境監(jiān)測的方法。關(guān)于PHM方法的分類有很多,但均與上述3種分類大致相同。實(shí)際使用中可以把以上2種或2種以上方法混合使用。
1.1 內(nèi)置故障預(yù)測單元的電子產(chǎn)品設(shè)計(jì)
故障預(yù)測單元法是指在產(chǎn)品上預(yù)置一個(gè)預(yù)警單元,以模擬被監(jiān)測產(chǎn)品的電特性和環(huán)境適應(yīng)特性。產(chǎn)品工作時(shí)對該單元施加大于被監(jiān)測產(chǎn)品的電應(yīng)力或環(huán)境應(yīng)力,使該單元在被監(jiān)測產(chǎn)品失效前失效。通過設(shè)定監(jiān)測單元的應(yīng)力級別,可以控制監(jiān)測單元失效到被監(jiān)測產(chǎn)品失效之間的距離;通過測試故障預(yù)警單元的狀態(tài),可以判定其是否失效,也可以由故障預(yù)警單元直接給出失效預(yù)報(bào)信號。該方法的另一種實(shí)現(xiàn)形式是保持故障預(yù)警單元的電應(yīng)力和環(huán)境應(yīng)力與被監(jiān)測產(chǎn)品的一致,而將預(yù)警單元承受電應(yīng)力和環(huán)境應(yīng)力的能力降低,這樣也能達(dá)到同樣的預(yù)警效果。
故障預(yù)測單元可以是設(shè)備功率參數(shù)的預(yù)測單元,也可以是環(huán)境參數(shù)的預(yù)測單元。對于功率器件,可以在相同的工作條件下配置一個(gè)耗散功率低于正常器件的預(yù)警芯片,該芯片在與工作芯片相同的功率條件下會(huì)早于工作芯片而失效,當(dāng)該芯片失效時(shí)說明工作應(yīng)力已經(jīng)達(dá)到了工作芯片即將失效的條件,因而可以據(jù)此給出提前維修的提示。例如:在額定電流為10 A的功率驅(qū)動(dòng)器附近,安裝一只額定電流為0.98 A的芯片,并在該預(yù)測芯片后端設(shè)置一個(gè)1 A的負(fù)載。這樣,當(dāng)額定電流為10 A的工作芯片通過10 A電流時(shí),額定電流為0.98 A的預(yù)測芯片通過了1 A的電流。此時(shí),預(yù)測芯片相當(dāng)于通過了略高于其額定電流的電流,將早于工作芯片失效。當(dāng)預(yù)測芯片失效時(shí),工作芯片也接近于失效的階段。這樣便可以在預(yù)測芯片失效時(shí),提前更換工作芯片或進(jìn)行設(shè)備的其他維修,從而避免設(shè)備在執(zhí)行正式任務(wù)時(shí)因失效而影響武器系統(tǒng)的作戰(zhàn)性能。本例中,故障預(yù)兆芯片的額定電流設(shè)置成0.98 A還是0.95 A,決定了圖1中預(yù)兆點(diǎn)與工作芯片真正失效的距離。在實(shí)際使用的過程中,器件要降額使用,預(yù)測芯片的降額要與工作芯片的降額等比例。
當(dāng)環(huán)境是引起武器系統(tǒng)失效的主要因素時(shí),可以設(shè)計(jì)一個(gè)耐環(huán)境應(yīng)力能力略低于工作器件的芯片,當(dāng)環(huán)境應(yīng)力積累到一定的量值時(shí),預(yù)測芯片先于工作器件失效,此時(shí)可以預(yù)測,工作芯片也即將失效。
故障預(yù)測芯片的失效可以作為工作芯片的故障預(yù)測指標(biāo),也可以將故障預(yù)測芯片設(shè)計(jì)成其特征參數(shù)與工作芯片有某種對應(yīng)關(guān)系,以這個(gè)特征參數(shù)達(dá)到某一門限值作為工作芯片即將失效的判據(jù)。這樣,通過測量故障預(yù)測芯片的某種特征參數(shù),便可以達(dá)到預(yù)測工作芯片是否即將失效的目的。
1.2 基于裝備故障預(yù)兆參數(shù)的電子產(chǎn)品的設(shè)計(jì)和測試
故障預(yù)兆參數(shù)法是指如果產(chǎn)品的被測參數(shù)中的某個(gè)參數(shù)發(fā)生變化即預(yù)示著該產(chǎn)品即將失效,則可以根據(jù)該參數(shù)的變化情況推斷出產(chǎn)品將要失效的結(jié)論,該參數(shù)就是該產(chǎn)品的故障預(yù)兆參數(shù)。
故障預(yù)兆參數(shù)法是故障預(yù)測最直觀、最有效的方法。該方法特別適用于電子產(chǎn)品的某個(gè)或多個(gè)參數(shù)的變化能夠準(zhǔn)確地反映產(chǎn)品的失效趨勢的情況。但是,不是每個(gè)產(chǎn)品都有能夠反映產(chǎn)品故障或壽命的參數(shù)。很多器件沒有表示功能退化失效的參數(shù),或者有能夠預(yù)兆元器件即將失效的參數(shù),但是該參數(shù)無法測量或測量將影響元器件的正常功能,從而使該方法的應(yīng)用受到了一定的限制。
有些芯片在同樣的負(fù)載和環(huán)境條件下,隨著功能的退化,器件的溫度較剛使用時(shí)升高較多,因此,器件的溫升就可以作為器件失效的預(yù)兆參數(shù)。具體的方法是:首先,測量器件在出廠初期額定工作條件下的環(huán)境溫度和器件的表面溫度作為基礎(chǔ)數(shù)據(jù);然后,在器件使用過程中測量環(huán)境溫度和器件溫度,并用這組數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)作比較。在相同的環(huán)境溫度和相同的負(fù)載條件下,器件的溫升與基礎(chǔ)數(shù)據(jù)偏離一定程度時(shí),即可給出器件即將失效的預(yù)警。到底應(yīng)該將使用中的溫升數(shù)值與基礎(chǔ)數(shù)值相差多少時(shí)作為預(yù)警的門限,則需要在產(chǎn)品交付前進(jìn)行大量的試驗(yàn)驗(yàn)證,根據(jù)試驗(yàn)數(shù)據(jù)來確定。預(yù)警門限的寬容度,可以根據(jù)器件溫升變化與失效對應(yīng)關(guān)系的離散性和器件在系統(tǒng)中的關(guān)鍵性等因素來決定。
再比如,充電電池類產(chǎn)品隨著使用的增多次數(shù)或時(shí)間的延長,其容量會(huì)逐漸地降低、等效內(nèi)阻會(huì)逐漸地加大,電池在充電過程中的溫升也較初期高。因此,容量、等效內(nèi)阻和溫升等都可作為電池壽命預(yù)測的參數(shù)。
繼電器觸點(diǎn)的電壓降會(huì)隨著使用次數(shù)的增加而增加,因而這個(gè)電壓降可以作為繼電器失效的預(yù)兆參數(shù)。在繼電器的使用過程中,測量繼電器觸點(diǎn)的壓降,在繼電器的負(fù)載和環(huán)境溫度不變的情況下,觸點(diǎn)壓降達(dá)到一定的數(shù)值時(shí),可以觸發(fā)繼電器故障預(yù)警。電連接器的孔接觸體和針接觸體之間的電阻也會(huì)因?yàn)橛|點(diǎn)的老化和電應(yīng)力的作用而增大,因而這個(gè)接觸電阻也可以作為電連接器失效的故障預(yù)兆參數(shù)。
要想預(yù)測一個(gè)設(shè)備的故障,則首先需要分析設(shè)備內(nèi)各種器件的失效模式和失效概率,并分析器件在設(shè)備中的關(guān)鍵性,選擇設(shè)備內(nèi)的關(guān)鍵器件和故障概率大的器件的故障預(yù)兆參數(shù)作為設(shè)備的故障預(yù)兆參數(shù)。如果一個(gè)器件有多個(gè)故障預(yù)兆參數(shù),則選擇最可能先失效的參數(shù)和發(fā)生概率高的參數(shù)作為器件的故障預(yù)兆參數(shù)。也可以根據(jù)這些參數(shù)的組合變化作為故障預(yù)兆參數(shù)。這需要對器件各種預(yù)兆參數(shù)進(jìn)行大量的測量、分析,并找出這些參數(shù)變化與器件失效的數(shù)學(xué)規(guī)律,依此設(shè)定一個(gè)數(shù)學(xué)模型,當(dāng)這些參數(shù)的變化達(dá)到按數(shù)學(xué)模型計(jì)算的數(shù)值時(shí),就會(huì)觸發(fā)故障預(yù)警。
1.3 基于裝備失效物理分析和環(huán)境監(jiān)測的電子產(chǎn)品的設(shè)計(jì)和測試
基于失效物理分析和環(huán)境監(jiān)測的故障預(yù)測方法是先通過分析產(chǎn)品的失效模式,再監(jiān)測環(huán)境應(yīng)力和使用應(yīng)力,然后通過一系列的算法和評定規(guī)則來推斷該產(chǎn)品所經(jīng)受的環(huán)境應(yīng)力和使用應(yīng)力是否達(dá)到了使該產(chǎn)品失效的條件,以此來預(yù)測產(chǎn)品的剩余壽命的方法。物理模型提供了一種將關(guān)鍵件損傷表征為運(yùn)行狀態(tài)函數(shù)的方法,并以損傷累積效應(yīng)來評估部件的剩余壽命[5]。將該方法用于復(fù)雜電子產(chǎn)品的PHM研究的難度很大,因?yàn)閺?fù)雜產(chǎn)品的失效模式有很多、不同的失效模式的觸發(fā)條件也不同,必須在諸多的故障模式和觸發(fā)條件中尋找最先滿足條件的那一個(gè),還要確定該故障模式對產(chǎn)品整體功能的影響。
在進(jìn)行復(fù)雜電子裝備失效分析時(shí),首先,應(yīng)對裝備進(jìn)行故障模式及影響分析,在此基礎(chǔ)上根據(jù)故障發(fā)生的概率和故障的危害性來確定關(guān)鍵件、重要件;然后,對關(guān)鍵件和重要件進(jìn)行故障誘發(fā)因素分析,找出容易誘發(fā)故障的工作應(yīng)力和環(huán)境引力;最后,在此基礎(chǔ)上針對所確定的誘發(fā)因素設(shè)計(jì)工作應(yīng)力和環(huán)境應(yīng)力測量方案。必要時(shí),針對某重點(diǎn)設(shè)備需進(jìn)行環(huán)境應(yīng)力和工作應(yīng)力對壽命影響的理論分析和試驗(yàn)驗(yàn)證。根據(jù)試驗(yàn)結(jié)果,確定不同的應(yīng)力誘發(fā)故障的門限值。
功率器件在額定功率下工作到一定的時(shí)間后會(huì)逐漸地老化,直至失效。如果掌握了某種功率器件在額定功率下的壽命參數(shù),即可以監(jiān)測器件的實(shí)際功率和工作時(shí)間的話,則當(dāng)該器件在額定功率下運(yùn)行到接近器件失效高發(fā)期時(shí),即可給出器件即將失效的預(yù)警。對于降額使用的器件,其實(shí)際可使用的時(shí)間比在額定功率下的要長一些,具體延長多久需要利用統(tǒng)計(jì)方法來確定。
海防導(dǎo)彈長期存放于海邊濕熱和高鹽霧環(huán)境下,濕熱和鹽霧就是影響導(dǎo)彈的重要環(huán)境因素。在某些器件附近進(jìn)行濕熱監(jiān)測或者對能夠引起電化學(xué)腐蝕的參數(shù)進(jìn)行監(jiān)測,就可以根據(jù)這些參數(shù)的變化給出器件可能到達(dá)即將失效條件的預(yù)警。
一些器件長期工作在低溫或高溫環(huán)境中,還有些器件長期工作在振動(dòng)等力學(xué)環(huán)境下,對這些器件進(jìn)行環(huán)境因素測量,可以根據(jù)環(huán)境應(yīng)力的累計(jì)值給出器件是否即將失效的預(yù)警。
復(fù)雜電子裝備的故障預(yù)測比一般產(chǎn)品的故障預(yù)測要復(fù)雜一些,其中,基于故障預(yù)測芯片的方法、基于故障預(yù)兆參數(shù)的方法和基于失效物理分析的環(huán)境監(jiān)測法是預(yù)測各種電子裝備的故障時(shí)都需要用到的方法。至于具體是3種方法都用還是只用其中1種方法則需要根據(jù)設(shè)備的功能和工作環(huán)境等因素來確定。復(fù)雜裝備與一般裝備最明顯的不同是如何利用以上3種方法收集的數(shù)據(jù)來對復(fù)雜裝備壽命的進(jìn)行評價(jià)。目前,國內(nèi)外一些組織和個(gè)人通過研究給出了一些壽命預(yù)測的方法或工具軟件。
若想進(jìn)行裝備的PHM,改變目前只進(jìn)行裝備主要功能測試的現(xiàn)狀,則需要進(jìn)行一些內(nèi)部在線測試和專項(xiàng)測試。例如:如果裝備內(nèi)部某個(gè)設(shè)備內(nèi)置了故障預(yù)警芯片,則需要為預(yù)警芯片配置相應(yīng)的測試方案。測試電路是配置在電路板上、設(shè)備內(nèi)部還是裝備外部的地面專用設(shè)備內(nèi),則需要根據(jù)具體的情況來進(jìn)行綜合的考慮。當(dāng)確定了裝備某些器件或部件的故障預(yù)兆參數(shù)后,還需要制定故障預(yù)兆參數(shù)測量方案,這些參數(shù)的檢測不能影響器件和設(shè)備的正常工作。
環(huán)境監(jiān)測法需要根據(jù)系統(tǒng)的特點(diǎn),在系統(tǒng)正常功能所需配置的基礎(chǔ)上增加一些測量用的傳感器、測量電路或測量設(shè)備。如果測量方案太復(fù)雜則必然會(huì)帶來成本的增加,因而需要在綜合分析器件和系統(tǒng)的實(shí)際情況的基礎(chǔ)上來設(shè)計(jì)測量方案。環(huán)境監(jiān)測方案需要兼顧能夠進(jìn)行故障預(yù)測、不影響器件的正常功能和盡量地降低成本的原則。
內(nèi)置故障芯片法、故障預(yù)兆參數(shù)法和環(huán)境監(jiān)測法可以同時(shí)使用,用這些方法得到的數(shù)據(jù)可以綜合地評價(jià)復(fù)雜電子裝備的預(yù)期壽命。各種數(shù)據(jù)對裝備壽命預(yù)期的權(quán)重是不一樣的,需要根據(jù)具體的器件進(jìn)行分析和試驗(yàn)驗(yàn)證,并用統(tǒng)計(jì)規(guī)律進(jìn)行綜合的權(quán)衡,得到某型裝備的具體預(yù)測規(guī)則和方法。
目前,國內(nèi)外進(jìn)行了大量的PHM研究,取得了一些成果,充分利用這些成果,可以對復(fù)雜電子裝備進(jìn)行PHM,提高裝備的工作可靠性,做到科學(xué)評價(jià)、精準(zhǔn)維修,提高裝備的有效利用率,減少使用維護(hù)成本。
對復(fù)雜電子裝備進(jìn)行故障預(yù)測時(shí),可以把裝備簡化成一般的電子裝備或功能模塊,再對這些具體的功能模塊進(jìn)行故障預(yù)測設(shè)計(jì)。在此基礎(chǔ)上,把從每個(gè)部分收集到的與故障預(yù)測相關(guān)的數(shù)據(jù)進(jìn)行整理,根據(jù)每個(gè)功能模塊在系統(tǒng)整機(jī)中的作用和特點(diǎn),給出這些故障相關(guān)數(shù)據(jù)與設(shè)備整機(jī)壽命的函數(shù)關(guān)系。利用這些數(shù)學(xué)模型處理相關(guān)數(shù)據(jù),就能找到復(fù)雜裝備的故障有關(guān)參數(shù)與裝備整機(jī)壽命的變化規(guī)律,進(jìn)而預(yù)測裝備的預(yù)期壽命。
[1]韓國泰.航空電子的故障預(yù)測與健康管理技術(shù) [J].航空電子技術(shù),2009,40(1):30-38.
[2]何厚伯,趙建民,郝茂森,等.PHM系統(tǒng)中的費(fèi)效模型[J].火力與指控控制,2013,38(1):129-133.
[3]張婧婧,杜磊,包軍林.電子元器件與系統(tǒng)可靠性保障的 PHM新方法 [J].電子產(chǎn)品可靠性與環(huán)境試驗(yàn),2009,27(2):17-23.
[4]王浩,羅宏偉,陳媛.半導(dǎo)體級別故障預(yù)測與健康管理[J].電子產(chǎn)品可靠性與環(huán)境試驗(yàn),2011,29(5):58-62.
[5]邵新杰,曹立軍,田廣,等.復(fù)雜裝備故障預(yù)測與健康管理 [M].北京:國防工業(yè)出版社,2013.
[6]徐風(fēng)建,車建國,許榮.基于知識推理的雷達(dá)裝備故障預(yù)測專家系統(tǒng) [J].電子產(chǎn)品可靠性與環(huán)境試驗(yàn),2010,28(5):29-32.
Research on Fault Prediction Technology of Complex Electronic Equipment
DU Guangyuan
(Beijing Electro-mechanical Engineering Institute,Beijing 100074,China)
Firstly,the necessity of conducting the prognostics and health management for complex electronic equipments is emphasized.Next,the fault prediction unit method,the fault omen parameter method and the environmental monitoring method based on the failure physical analysis are introduced briefly.And then,the main principles and methods of fault evaluation of complex electronic equipment with the failure related data obtained through the above methods are summarized.Finally, the characteristics of the related fault prediction data and the issues that need special attention are analyzed.
complex electronic equipment;health management;fault prediction;test;evaluation
TP 206+.3
:A
:1672-5468(2017)01-0045-05
10.3969/j.issn.1672-5468.2017.01.010
2016-07-06
杜光遠(yuǎn) (1961-),男,滿族,遼寧撫順人,北京機(jī)電工程研究所研究員,主要從事電源及供電控制技術(shù)、電子設(shè)備和電子元器件可靠性技術(shù)的研究工作。