劉亞兵, 劉海港, 張 波, 王 沖
航空工業(yè)沈陽(yáng)飛機(jī)設(shè)計(jì)研究所,遼寧 沈陽(yáng) 110030)
隨著現(xiàn)在科學(xué)技術(shù)的發(fā)展,特別是信息技術(shù)的迅速發(fā)展,航空、航天、通信、工業(yè)應(yīng)用等各個(gè)領(lǐng)域的工程系統(tǒng)日趨復(fù)雜,大量復(fù)雜系統(tǒng)的復(fù)雜性、綜合化、智能化程度不斷提高。伴隨著復(fù)雜系統(tǒng)的發(fā)展,其研制、生產(chǎn)尤其是維護(hù)和保障的成本越來(lái)越高[1-2]。同時(shí),由于組成環(huán)節(jié)和影響因素的增加,發(fā)生故障和功能失效的概率逐漸加大。因此,復(fù)雜系統(tǒng)故障的診斷和維護(hù)逐漸成為人們關(guān)注的焦點(diǎn)[3-5]。基于對(duì)復(fù)雜系統(tǒng)的可靠性、安全性、經(jīng)濟(jì)性的考慮,以故障預(yù)測(cè)為核心的故障預(yù)測(cè)與健康管理(Prognostics and Health Management,PHM)策略獲得越來(lái)越多的重視和應(yīng)用[6-7]。PHM主要是通過(guò)先進(jìn)的傳感器采集信息,并借助各種算法和智能模型來(lái)監(jiān)控、預(yù)測(cè)和管理系統(tǒng)的狀態(tài)[8-9]。波音B787使用了綜合系統(tǒng)健康管理(Integrated System Health Management,ISHM)有助于快速隔離故障件,減少返工時(shí)間。與B767相比,對(duì)未發(fā)現(xiàn)故障件(Not Fault Found,NFF)的移除率降低了約58%[10-11]。PHM技術(shù)在航空領(lǐng)域的工程應(yīng)用面臨著故障隔離率低、可信度低等問(wèn)題。
本文主要介紹了3種工程項(xiàng)目常用的故障綜合診斷推理方法。面向機(jī)載復(fù)雜系統(tǒng)對(duì)比分析了這3種方法的優(yōu)缺點(diǎn)及面臨的問(wèn)題,并進(jìn)行了綜合診斷推理機(jī)的設(shè)計(jì)與開(kāi)發(fā)。
測(cè)試性模型又稱(chēng)為多信號(hào)流圖模型,可對(duì)每一個(gè)監(jiān)測(cè)節(jié)點(diǎn)的信號(hào)流向以及每一組件影響的信號(hào)流向進(jìn)行動(dòng)態(tài)跟蹤,同時(shí)可以利用系統(tǒng)結(jié)構(gòu)模型對(duì)這些信號(hào)之間的依賴(lài)聯(lián)系進(jìn)行準(zhǔn)確描述[12]。由于多信號(hào)流圖模型同時(shí)具備了基于依賴(lài)模型故障診斷方法(系統(tǒng)功能、關(guān)系明確)與基于結(jié)構(gòu)模型故障診斷方法(層級(jí)劃分明確)的優(yōu)勢(shì)[13],因此適合規(guī)模較大、結(jié)構(gòu)復(fù)雜的大型系統(tǒng)的故障診斷模型的建立。
基于多信號(hào)流圖模型的測(cè)試性建模,以系統(tǒng)結(jié)構(gòu)、功能和故障模式、影響與危害分析(Failure Mode Effects and Criticality Analysis,FMECA)為基礎(chǔ)[14]。按照子系統(tǒng)關(guān)系劃分交聯(lián)模塊;按照子系統(tǒng)功能劃分外場(chǎng)可更換單元(Line Replaceable Unit,LRU)歸屬;按照LRU的設(shè)備實(shí)際輸入、輸出端口,結(jié)合功能和故障建模的需要,設(shè)置LRU信號(hào)端口;按照FMECA分析結(jié)果,結(jié)合系統(tǒng)工作模式和工作階段,設(shè)置LRU故障模式和故障測(cè)試點(diǎn),并根據(jù)系統(tǒng)工作原理,建立故障模式間的影響、傳遞關(guān)系。
以機(jī)載供電系統(tǒng)為例,故障模型自頂向下可分為分系統(tǒng)、子系統(tǒng)、LRU、故障模式4個(gè)層級(jí)。其中,分系統(tǒng)指飛機(jī)供電系統(tǒng);子系統(tǒng)指交流電源系統(tǒng)、直流電源系統(tǒng)、配電系統(tǒng);LRU為現(xiàn)場(chǎng)可更換單元,指飛機(jī)外場(chǎng)維護(hù)更換單元,例如交流發(fā)電機(jī)、交流控制裝置、直流配電裝置等;故障模式指LRU的故障類(lèi)型。對(duì)于結(jié)構(gòu)簡(jiǎn)單、部件較少的LRU,可按其主要功能部件建立故障模式,對(duì)于結(jié)構(gòu)復(fù)雜、部件多、交聯(lián)關(guān)系不易理清的LRU,按其對(duì)外主要功能建立故障模式。
機(jī)載復(fù)雜系統(tǒng)故障診斷可采用基于CLIPS(C Language Integrated Production System)的故障診斷專(zhuān)家系統(tǒng)加以實(shí)現(xiàn)。專(zhuān)家系統(tǒng)程序的總體框圖如圖1所示。
圖1 專(zhuān)家系統(tǒng)程序的總體框圖
① 狀態(tài)參量列表。它是在專(zhuān)家系統(tǒng)內(nèi)部開(kāi)辟的一段連續(xù)存儲(chǔ)空間,用于存儲(chǔ)狀態(tài)監(jiān)測(cè)點(diǎn)的參數(shù)信息,由外部系統(tǒng)程序負(fù)責(zé)實(shí)時(shí)刷新。
② 狀態(tài)監(jiān)測(cè)程序。該程序用于完成對(duì)狀態(tài)參量列表中各狀態(tài)監(jiān)測(cè)點(diǎn)參量的數(shù)據(jù)處理,判斷監(jiān)測(cè)點(diǎn)狀態(tài)是否發(fā)生變化,為事實(shí)更新提供依據(jù);同時(shí)判斷發(fā)生狀態(tài)變化的事實(shí)所屬子系統(tǒng),為推理機(jī)選擇子系統(tǒng)提供依據(jù)。
③ 事實(shí)更新控制。它用于根據(jù)狀態(tài)監(jiān)測(cè)程序的監(jiān)測(cè)結(jié)果,將需要更新的事實(shí)信息更新到事實(shí)庫(kù)。
④ 子系統(tǒng)選擇控制。它用于根據(jù)狀態(tài)監(jiān)測(cè)程序的監(jiān)測(cè)結(jié)果,控制推理機(jī)選擇被更新事實(shí)所在的子系統(tǒng)。
⑤ 診斷結(jié)論輸出接口單元。它用于接收推理機(jī)輸出的診斷結(jié)論,經(jīng)過(guò)格式轉(zhuǎn)換后按照系統(tǒng)程序要求輸出診斷結(jié)論。
⑥ 故障歷史數(shù)據(jù)記錄單元。它用于對(duì)系統(tǒng)運(yùn)行過(guò)程中所得出的故障案例進(jìn)行記錄,包括診斷時(shí)刻、故障事實(shí)、診斷結(jié)論、故障子系統(tǒng)等信息,以二進(jìn)制數(shù)據(jù)形式保存在文本中。
⑦ 控制命令輸入接口和系統(tǒng)總體控制。控制命令輸入接口單元接收系統(tǒng)程序控制命令,解析后由系統(tǒng)總體控制模塊對(duì)狀態(tài)監(jiān)測(cè)程序及推理機(jī)發(fā)出相應(yīng)控制操作。用于完成系統(tǒng)程序?qū)?zhuān)家系統(tǒng)組件的控制,主要包括5種操作,即啟動(dòng)診斷、執(zhí)行周期診斷任務(wù)、執(zhí)行突發(fā)事件診斷任務(wù)、停止周期診斷和系統(tǒng)復(fù)位。
⑧ 事實(shí)庫(kù)。以事實(shí)結(jié)構(gòu)的形式存放被診斷對(duì)象狀態(tài)信息以及推理過(guò)程中產(chǎn)生的中間事實(shí),供推理機(jī)調(diào)用。
⑨ 規(guī)則庫(kù)。它用于存放應(yīng)用于被診斷對(duì)象的診斷規(guī)則知識(shí)。規(guī)則庫(kù)中的規(guī)則和事實(shí)庫(kù)中的事實(shí)按照子系統(tǒng)形式管理。
⑩ 推理機(jī)。它用于對(duì)規(guī)則庫(kù)中的診斷規(guī)則和事實(shí)庫(kù)中的事實(shí)進(jìn)行模式匹配,推理得出診斷結(jié)論;對(duì)推理過(guò)程進(jìn)行執(zhí)行控制、子系統(tǒng)間的切換、規(guī)則間的沖突消解和規(guī)則右部的執(zhí)行。
專(zhuān)家系統(tǒng)推理機(jī)的核心算法采用Rete算法,提高了推理效率[14]。同時(shí),存儲(chǔ)不斷循環(huán)中匹配過(guò)程的狀態(tài),并在循環(huán)中重新計(jì)算在事實(shí)表達(dá)中發(fā)生的變化、又反映到本次狀態(tài)中的變化,避免大量不必要的計(jì)算,大幅提升了匹配速度。
圖2展示了Rete算法是如何利用時(shí)間冗余性來(lái)提高推理效率的,其中陰影部分為改變的事實(shí)。
圖2 采用Rete算法時(shí)的搜索和匹配
基于BP神經(jīng)網(wǎng)絡(luò)的故障綜合診斷推理故障模式識(shí)別過(guò)程包括故障信號(hào)獲取、信號(hào)預(yù)處理、故障識(shí)別和診斷結(jié)果等基本環(huán)節(jié)。首先,提取最能反映系統(tǒng)狀態(tài)的特征量,利用分類(lèi)工具對(duì)故障的類(lèi)別、位置和程度進(jìn)行診斷;然后對(duì)診斷結(jié)果進(jìn)行故障評(píng)估,從而為故障處理提供依據(jù)[15]。診斷過(guò)程分為兩步:首先,基于一定數(shù)量的訓(xùn)練樣本集對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到期望的診斷網(wǎng)絡(luò);其次,根據(jù)當(dāng)前診斷輸入對(duì)系統(tǒng)進(jìn)行診斷,診斷的過(guò)程即為利用神經(jīng)網(wǎng)絡(luò)進(jìn)行前向計(jì)算的過(guò)程。在學(xué)習(xí)和診斷之前,需要對(duì)診斷原始數(shù)據(jù)和訓(xùn)練樣本數(shù)據(jù)進(jìn)行適當(dāng)處理,包括預(yù)處理和特征選取/提取等,目的是為診斷網(wǎng)絡(luò)提供合適的診斷輸入和訓(xùn)練樣本。
本文介紹了3種常用的綜合診斷推理方法,對(duì)3種方法進(jìn)行分析:基于BP神經(jīng)網(wǎng)絡(luò)的故障綜合診斷推理從訓(xùn)練樣本中獲取樣本分布特征的統(tǒng)計(jì)規(guī)律,訓(xùn)練和診斷過(guò)程都是“黑箱”操作,克服了傳統(tǒng)診斷推理方法中知識(shí)獲取的瓶頸,應(yīng)用面較廣,但缺點(diǎn)是訓(xùn)練時(shí)間較長(zhǎng)、過(guò)程不可見(jiàn)?;趯?zhuān)家系統(tǒng)的故障綜合診斷推理得到了基于規(guī)則的推理,可以直觀地得到規(guī)則。用戶可以通過(guò)這些規(guī)則掌握問(wèn)題本身的規(guī)律,但是由于機(jī)載復(fù)雜系統(tǒng)問(wèn)題的多樣性,規(guī)則獲取難以實(shí)現(xiàn),同時(shí)受訓(xùn)練樣本集影響,訓(xùn)練樣本不全面可能會(huì)導(dǎo)致獲取規(guī)則的不全面,這是導(dǎo)致綜合診斷不準(zhǔn)確的直接原因?;跍y(cè)試性模型的故障綜合診斷推理以測(cè)試性模型為基礎(chǔ),將復(fù)雜系統(tǒng)內(nèi)部多信號(hào)流關(guān)系進(jìn)行了模型化設(shè)計(jì),同時(shí)添加可靠性指標(biāo),實(shí)現(xiàn)分層診斷推理,將故障定位到分系統(tǒng)/子系統(tǒng)級(jí)LRU,適合規(guī)模較大、結(jié)構(gòu)復(fù)雜的大型系統(tǒng)的故障診斷模型的建立。
測(cè)試性模型使用TEAMS-Designer或TesLab-Designer等工具,按照成員級(jí)、區(qū)域級(jí)進(jìn)行建模,進(jìn)行測(cè)試性分析,生成D矩陣,作為綜合診斷推理機(jī)的輸入信息。下面將對(duì)基于測(cè)試性模型的綜合診斷推理機(jī)進(jìn)行設(shè)計(jì)。
機(jī)載復(fù)雜系統(tǒng)進(jìn)行診斷推理之前,需要構(gòu)建測(cè)試性模型。測(cè)試性模型是否準(zhǔn)確、完善,與機(jī)上狀態(tài)是否一致,直接影響到診斷推理結(jié)果的準(zhǔn)確性。通過(guò)系統(tǒng)設(shè)計(jì)與測(cè)試性分析反復(fù)迭代的方式進(jìn)行測(cè)試性設(shè)計(jì),以降低對(duì)設(shè)計(jì)人員和工具的要求[16]。
參照“三段設(shè)計(jì)法”的基本設(shè)計(jì)流程[17-18],測(cè)試性建模、分析和改進(jìn)工作流程如圖3所示,主要步驟包括測(cè)試性信息收集、測(cè)試性要求分析與指標(biāo)分配、建模設(shè)計(jì)、指標(biāo)分析評(píng)估與測(cè)試性?xún)?yōu)化改進(jìn)與驗(yàn)證等[19]。完成測(cè)試性模型的建立后,需導(dǎo)出D矩陣,為系統(tǒng)綜合診斷推理提供依據(jù)。
圖3 測(cè)試性建模開(kāi)發(fā)流程
故障診斷推理算法的實(shí)現(xiàn)以測(cè)試性模型為基礎(chǔ),物理接口監(jiān)測(cè)數(shù)據(jù)為輸入條件,經(jīng)過(guò)推理運(yùn)算得出故障診斷結(jié)果。整體的故障診斷推理機(jī)算法結(jié)構(gòu)如圖4所示。它展示了整個(gè)推理機(jī)算法的過(guò)程,包括輸入、推理和輸出。其中以D矩陣為基礎(chǔ),輸入數(shù)據(jù)經(jīng)過(guò)故障診斷推理機(jī)算法推理運(yùn)算得到Good、Bad、Suspect、Unknow共4種故障模式集合。
圖4 故障診斷推理機(jī)算法結(jié)構(gòu)圖
推理機(jī)算法處理邏輯圖如圖5所示。其中,模型加載、解析和結(jié)果組包等接口通信功能的實(shí)現(xiàn)屬于服務(wù)核心算法的外部結(jié)構(gòu),依據(jù)測(cè)試數(shù)據(jù)監(jiān)測(cè)結(jié)果(正常或失效)對(duì)關(guān)聯(lián)故障模式進(jìn)行分析識(shí)別的推理過(guò)程是算法核心。
圖5 推理機(jī)算法處理邏輯圖
算法過(guò)程如下。
(1) 初始化集合。
設(shè)U=A,B=?,S=?,G=?,F=?。
(2) 處理測(cè)試正常項(xiàng)。
① 求通過(guò)的測(cè)試的并集,并計(jì)算正常模塊的集合UtjpassedTsj。
② 計(jì)算正常模塊與上次的差值,分別表示添加的和減少的ΔG=[UtjpassedTsj-G]+,此處僅表示增加的模塊,不考慮減少的模塊。
③ 更新由正常測(cè)試的變化導(dǎo)致的集合變化G=UtjpassedTsj∪G,S=S-ΔG,U=U-ΔG。
(3) 處理測(cè)試異常項(xiàng)。
① 定義3個(gè)異常測(cè)試集合:這次上報(bào)的異常測(cè)試集合Tk;與正常集合相沖突的故障模塊相關(guān)的歷史失效測(cè)試,即若δB=B∩G≠?,令TB={tl|tl?Tk,Tsl∩δB≠?,tl保留值為失效,包含F(xiàn)之外的測(cè)試};歷史已有但不沖突的失效測(cè)試集,即TJ={Tj|tj?Tk,Tsl∩δB=?,tj∈F,tj保留值為失效}。
② 更新未知和懷疑故障模式集合,即S=S∪{fk},U=U-{fk},其中tk∈Tk∪TB。
(4) 更新上次的測(cè)試子特征,更新失效模塊組。
① 更新上次的測(cè)試子特征:F={fj}←{Tsj-G},此處tj∈TJ。
② 更新故障模塊:若|fj|=1,則將其子特征設(shè)為故障。
根據(jù)表1給出的測(cè)試性模型與表2中提供的測(cè)試結(jié)果數(shù)據(jù),診斷出真正發(fā)生的是故障模式1,雖然根據(jù)測(cè)試異常數(shù)據(jù)可以發(fā)現(xiàn)故障模式2和故障模式3也可能發(fā)生故障,但根據(jù)通過(guò)的測(cè)試數(shù)據(jù)的故障模式相關(guān)性可以確定故障模式2~故障模式5都是正常狀態(tài),所以可以確定發(fā)生故障的即是故障模式1,再根據(jù)這個(gè)故障模式1查詢(xún)與它關(guān)聯(lián)的部件,就可定位當(dāng)前發(fā)生的故障模式。表1為測(cè)試項(xiàng)模型D矩陣,表2為測(cè)試項(xiàng)輸入和診斷結(jié)果顯示。
表1 測(cè)試性模型D矩陣
表2 測(cè)試項(xiàng)數(shù)據(jù)輸入和診斷結(jié)果
為方便仿真驗(yàn)證,進(jìn)行如下假設(shè)。
① 故障可復(fù)現(xiàn);
② 故障具有確定性,定義故障為1,正常為0。
以機(jī)電系統(tǒng)(包含供電分系統(tǒng)、燃油分系統(tǒng)、液壓分系統(tǒng)、環(huán)控分系統(tǒng)等)為例,根據(jù)FMECA分析,建立測(cè)試性模型。模型測(cè)試點(diǎn)73個(gè),故障模式498個(gè)。模型測(cè)試分析結(jié)果如表3所示,據(jù)此可生成D矩陣。
表3 模型測(cè)試分析結(jié)果
將測(cè)試性模型導(dǎo)出的D矩陣和開(kāi)發(fā)的綜合診斷推理機(jī)嵌入到仿真目標(biāo)機(jī)中,上位機(jī)按照測(cè)試用例實(shí)現(xiàn)故障信息注入或使用真實(shí)機(jī)載飛行參數(shù)信息作為綜合診斷推理機(jī)的輸入信息。機(jī)載復(fù)雜系統(tǒng)綜合診斷推理機(jī)仿真驗(yàn)證平臺(tái)如圖6所示[20]。
圖6 機(jī)載復(fù)雜系統(tǒng)綜合診斷推理機(jī)仿真驗(yàn)證平臺(tái)
綜合診斷推理機(jī)具備分層診斷推理能力,能夠?qū)崿F(xiàn)系統(tǒng)、分系統(tǒng)、子系統(tǒng)級(jí)的診斷推理,并將故障定位到LRU。綜合診斷推理機(jī)在接收到上位機(jī)發(fā)送的參數(shù)信息時(shí),首先剔除測(cè)試性模型中不相關(guān)數(shù)據(jù),然后對(duì)參數(shù)數(shù)據(jù)按照系統(tǒng)、分系統(tǒng)、子系統(tǒng)進(jìn)行分類(lèi)標(biāo)識(shí)。根據(jù)要診斷的目標(biāo)系統(tǒng)對(duì)識(shí)別的參數(shù)數(shù)據(jù)和測(cè)試性模型進(jìn)行匹配,實(shí)現(xiàn)綜合診斷推理機(jī)的高效運(yùn)行。
綜合診斷推理機(jī)對(duì)識(shí)別的參數(shù)數(shù)據(jù)進(jìn)行異常判斷,根據(jù)異常判斷規(guī)則轉(zhuǎn)換為綜合診斷推理算法能夠識(shí)別的0和1代碼。綜合診斷推理機(jī)判斷當(dāng)前飛機(jī)飛行狀態(tài),診斷推理出所發(fā)生的故障模式、故障模式的名稱(chēng)、故障部件名稱(chēng)、所屬的子系統(tǒng)及系統(tǒng)名稱(chēng)、故障代碼、故障等級(jí)以及提示是否上報(bào)飛行員等。診斷推理結(jié)果包括Good、Bad、Suspect、Unknow共4種故障模式集合。根據(jù)FMECA分析表,依次完成故障注入1000次,故障綜合診斷推理仿真結(jié)果如表4所示。
表4 故障綜合診斷推理仿真結(jié)果
仿真驗(yàn)證結(jié)果表明,基于測(cè)試性模型的故障綜合診斷推理能夠?qū)崿F(xiàn)機(jī)載復(fù)雜系統(tǒng)的故障診斷推理。將故障隔離定位到LRU的概率為84.2%,故障檢測(cè)率為95.1%,略低于模型測(cè)試分析結(jié)果中故障隔離率88.78%、故障檢測(cè)率95.38%的指標(biāo)。原因?yàn)榫C合診斷推理機(jī)在故障診斷推理過(guò)程中,算法對(duì)D矩陣的處理存在一定誤差,綜合診斷推理機(jī)有待進(jìn)一步優(yōu)化。
同時(shí),優(yōu)化和增加測(cè)試性模型測(cè)試點(diǎn)能夠進(jìn)一步提升綜合診斷推理仿真結(jié)果的故障隔離率等指標(biāo)。
本文介紹了3種綜合診斷推理方法,并對(duì)3種方法進(jìn)行了對(duì)比分析?;贐P神經(jīng)網(wǎng)絡(luò)的故障綜合診斷推理,克服了傳統(tǒng)診斷推理方法知識(shí)獲取的瓶頸,應(yīng)用面較廣,但訓(xùn)練時(shí)間較長(zhǎng)、過(guò)程不可見(jiàn);基于專(zhuān)家系統(tǒng)的故障綜合診斷推理可以直觀地得到規(guī)則,但是由于復(fù)雜系統(tǒng)問(wèn)題的多樣性,規(guī)則獲取難以實(shí)現(xiàn);基于測(cè)試性模型的故障綜合診斷推理以測(cè)試性模型為基礎(chǔ),將復(fù)雜系統(tǒng)內(nèi)部多信號(hào)流關(guān)系進(jìn)行模型化設(shè)計(jì),實(shí)現(xiàn)分層診斷推理,特別適合規(guī)模較大、結(jié)構(gòu)復(fù)雜的機(jī)載系統(tǒng)。本文重點(diǎn)對(duì)基于測(cè)試性模型的綜合診斷推理方法進(jìn)行了設(shè)計(jì),開(kāi)發(fā)了綜合診斷推理機(jī)。仿真驗(yàn)證結(jié)果表明,基于測(cè)試性模型的故障綜合診斷推理方法具有一定的實(shí)際工程應(yīng)用價(jià)值。