丁 鋒,張藝馨
(西安工業(yè)大學,西安 710021)
隨著現(xiàn)代工業(yè)技術(shù)自動化、數(shù)字化、智能化飛速發(fā)展,航空發(fā)動機、高鐵運載裝備、智能化武器裝備、燃氣輪機組、風電機組等重大裝備的可靠性、安全性備受關(guān)注,反映裝備的4大質(zhì)量指標(性能、可靠性、經(jīng)濟性、安全性)的可靠性指標成為衡量裝備質(zhì)量的重要指標,愈來愈凸顯出極其重要的地位。由“制造大國”走向“智造強國”的瓶頸之一就是裝備的可靠性不足。伴隨著裝備運行時間的不斷延續(xù),裝備出現(xiàn)了越來越多的運行健康問題,其可靠性、安全性受到不同程度風險影響。為了在早期發(fā)現(xiàn)并排除裝備可靠性、安全性隱患,保證裝備的可靠運行,避免重大事故發(fā)生,需要對裝備的功能部件進行可靠性適時評價,而實現(xiàn)由“定期維修”、“狀態(tài)維修”到“預測維修”的轉(zhuǎn)變,必須對裝備在運行過程中的可靠性進行評估。傳統(tǒng)的可靠性評價方法如故障模式影響分析[1]、故障樹分析[2]、模糊集方法[3]、貝葉斯網(wǎng)絡分析法[4–5]、響應面分析法[6]、矩法[7]、頻率分析法[8]、動態(tài)與漸變耦合分析法[9]等此類靜態(tài)或動態(tài)的評價方法不能很好地解決不確定性、隨機性、適時性的可靠性評價問題。表1比較了這些可靠性評估的主要分析方法。
表1 可靠性分析方法的比較Table 1 Comparison of reliability analysis methods
裝備的可靠性主要有固有可靠性和使用可靠性。其中,固有可靠性主要受裝備設計環(huán)節(jié)、制造環(huán)節(jié)、檢驗環(huán)節(jié)等影響,而裝備的使用可靠性即運行可靠性與裝備運行時的使用條件、所處環(huán)境、使用時間、功能件衰退失效等因素有關(guān),具有時變性、動態(tài)性和隨機性。隨著工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)、自動監(jiān)測技術(shù)和傳感器技術(shù)的迅速發(fā)展,裝備的大量系統(tǒng)運行監(jiān)測數(shù)據(jù)的獲取和處理成為必然。為了精準、有效地評估裝備運行可靠性的確定性及適時性,亟須在現(xiàn)有可靠性評估基礎上做出轉(zhuǎn)變。因此,面向健康監(jiān)測數(shù)據(jù)驅(qū)動的可靠性評估十分必要和迫切,并體現(xiàn)出前所未有的機遇。本研究分析監(jiān)測信息可靠性評估的國內(nèi)外研究現(xiàn)狀與進展,揭示面向健康監(jiān)測數(shù)據(jù)驅(qū)動下裝備可靠性評估研究存在的挑戰(zhàn),并指出應對現(xiàn)有挑戰(zhàn)的可能途徑。
歷經(jīng)近一個世紀的發(fā)展,以概率統(tǒng)計和故障物理為基礎的傳統(tǒng)可靠性理論方法盡管在處理隨機不確定性信息方面能夠確定設備的失效分布,從而獲得一批同類設備共性總體的平均可靠性,然而,針對個體特定設備,通常在不同工況與狀態(tài)下運行的可靠性評估難以獲得個體的可靠性。英國O’connor[10]指出現(xiàn)有的可靠性研究依賴于傳統(tǒng)的概率統(tǒng)計方法,闡明該可靠性方法在解決工程實際問題時,由于實際結(jié)構(gòu)的復雜性和人為因素,傳統(tǒng)可靠性研究方法容易產(chǎn)生誤導。Lin[11]和Yong[12]等在基于狀態(tài)的可靠性評估和預測維修方面做了有益的嘗試工作,提供了研究的新思路。意大利Zio[13]深刻洞察復雜系統(tǒng)可靠性分析是可靠性工程的新挑戰(zhàn),并提出利用狀態(tài)監(jiān)測來確保系統(tǒng)可靠的運行,以降低故障率、提高生產(chǎn)率。國內(nèi)謝里陽[14]剖析當前機械可靠性理論、方法及模型方面存在的一些問題,指出可靠性是一門仍在發(fā)展之中的學科,簡單移植或借用在不同領(lǐng)域或不同問題背景下發(fā)展起來的可靠性理論、方法或模型會引起各種各樣的問題。
面向健康監(jiān)測的裝備可靠性評估包括如圖1所示的幾個環(huán)節(jié): (1)裝備運行狀態(tài)信息獲?。?(2)可靠度映射模型構(gòu)建; (3)可靠度計算。國內(nèi)研究人員在這3個環(huán)節(jié)的諸多方面開展了大量的研究工作,本文未能詳細列舉所有相關(guān)文獻,只挑選了近年來代表性的工作予以綜述。
圖1 面向健康監(jiān)測的裝備可靠性評估Fig.1 Equipment reliability assessment based on health monitoring
針對傳統(tǒng)的可靠性分析方法難以在線、實時、動態(tài)地評估運行可靠性問題,國內(nèi)外學者開始進行實時、動態(tài)、基于監(jiān)測信息的裝備可靠性評估研究。Chinnam[15]研究了涉及多衰退信號的復雜系統(tǒng)可靠性在線評估。Lu等[16]提出一種具有線性趨勢指數(shù)平滑的適應模型,預測獨立單元的某一性能并評估基于狀態(tài)的可靠性。Lu等[17]將狀態(tài)空間方法結(jié)合卡爾曼濾波進行多元狀態(tài)性能可靠性評估。這些方法在失效邊界是已知的情況下對可靠性評估是十分有效的。Ahmad[18]提出一種新的基于狀態(tài)監(jiān)測數(shù)據(jù)的概率方法,用于考慮不確定性量化時風險因素對安全指標的影響,并對自主供電運行隨機過程進行了在線可靠性評估。Liu等[19]深入研究了基于系統(tǒng)級監(jiān)測數(shù)據(jù)的多狀態(tài)系統(tǒng)動態(tài)可靠性評估,通過部件退化遵循齊次連續(xù)時間馬爾可夫過程和非齊次連續(xù)時間馬爾可夫過程兩個案例驗證了該方法的有效性和準確性。Soliman等[20]提出基于監(jiān)測數(shù)據(jù)的鋁合金艦船零件疲勞可靠性與壽命預測方法,根據(jù)累積疲勞損傷和疲勞可靠性,對不同運行條件下獲得的結(jié)構(gòu)健康監(jiān)測數(shù)據(jù)進行量化。何正嘉等[21]綜述了基于機械設備狀態(tài)信息的運行可靠性評估的發(fā)展,并提出思考。丁鋒等[22–25]提出設備狀態(tài)振動特征的比例故障率模型可靠性評估新方法,建立主動監(jiān)測機制的可靠性評估模型,提出基于監(jiān)測信息的設備運行可靠性研究方法和基于比例風險模型的刀具磨損監(jiān)測及其可靠性分析方法。陳保家等[26–27]提出基于車刀振動信號和磨損數(shù)據(jù)建立的Logistic可靠性評估模型,實現(xiàn)基于振動信號logistic回歸模型的刀具可靠性評估。蔡改改等[28–29]提出基于狀態(tài)監(jiān)測信息的比例協(xié)變量模型,并用于刀具運行可靠性評估,提出利用設備響應狀態(tài)信息的運行可靠性評估方法。
自動監(jiān)測技術(shù)和傳感器技術(shù)的快速發(fā)展,使得數(shù)據(jù)驅(qū)動的可靠性評估中基于協(xié)變量的方法得到了廣泛應用。根據(jù)系統(tǒng)運行環(huán)境中協(xié)變量數(shù)據(jù)的不同變化規(guī)律,將基于協(xié)變量方法的可靠性評估模型主要分為固定協(xié)變量模型、時變協(xié)變量模型和隨機協(xié)變量模型3種類型[30]。
考慮協(xié)變量作用的壽命分析模型即比例風險模型(Proportional hazard model, PHM)自從Cox[31]提出以來,已經(jīng)被廣泛接受為一種半?yún)?shù)的模型,也是其中最有效的模型,可用于聯(lián)合協(xié)變量的風險分析,最早應用于生物醫(yī)學和經(jīng)濟學領(lǐng)域,在可靠性工程領(lǐng)域也得到了較多的應用[32–34]。由于比例風險模型所要求條件是不同協(xié)變量間失效率比值相等,這在實際系統(tǒng)中是比較難以達到的,因此,Kumar[35]和Hassan[36]等提出了分層比例風險模型 (Stratified proportional hazard model, SPHM),該模型只要求同一層協(xié)變量間的失效率比值相等,這與實際衰退化過程比較接近。上面所說的比例風險模型和分層比例風險模型主要應用于恒定協(xié)變量的狀況,由于實際工程系統(tǒng)運行狀態(tài)是時變的,協(xié)變量是變化的,即時變協(xié)變量數(shù)學模型,如Cox提出的比例強度模型 (Proportional intensities model, PIM);Sun等[37]提出比例協(xié)變量模型 (Proportional covariates model, PCM);Jardine等[38]采用基準分布為威布爾分布的比例風險模型,提出威布爾比例風險模型(Weibull proportional hazard model, WPHM);Compare等[39]建立衰退過程的貝葉斯三態(tài)Weibull回歸模型,不僅考慮了這些協(xié)變量的影響,還估計具有相關(guān)不確定性的模型參數(shù),對生物制藥工業(yè)中使用的隔膜閥進行了可靠性評估;為了能同時考慮外部協(xié)變量與內(nèi)部協(xié)變量對系統(tǒng)衰退的影響,Gorjian等[40]提出了顯式風險模型 (Explicit hazard model, EHM);Disadi等[41]指出該模型能更好地評估系統(tǒng)的可靠性。針對不同的隨機協(xié)變量,有泊松振動模型和Markov隨機模型,其中泊松振動模型[42–44]是系統(tǒng)衰退由隨機沖擊引起的隨機協(xié)變量模型,Markov隨機模型[45–47]是受隨機協(xié)變量影響的隨機過程協(xié)變量模型,這2個隨機協(xié)變量模型在工程上較多用于評估系統(tǒng)可靠性。
健康狀態(tài)監(jiān)測(Health condition monitoring, HCM)已被證明是提高裝備可靠性和改善客戶服務的一種經(jīng)濟有效的手段,而可靠性分析、評估是指導維護決策和數(shù)據(jù)驅(qū)動健康監(jiān)測的非常有用的手段。面向監(jiān)測健康狀態(tài)的可靠性評估是智能運維和健康管理的更高要求。
飛行器健康管理專家卿新林教授指出,在未來很長的一段時間內(nèi),飛行器健康管理將是航空航天領(lǐng)域的一個重要發(fā)展方向,結(jié)構(gòu)健康狀態(tài)監(jiān)測技術(shù)對于提高飛行器性能、可靠性及安全性意義重大[48]。Yue等[49]提出了基于導波的結(jié)構(gòu)健康狀態(tài)監(jiān)測不確定性量化和可靠性評估的分層方法,為不確定性情況下不同結(jié)構(gòu)提供了一種系統(tǒng)和實用的方法。Marcantonio等[50]提出了一種基于健康狀態(tài)數(shù)據(jù)驅(qū)動HCM系統(tǒng)的新診斷方法,通過測量被測系統(tǒng)的關(guān)鍵參數(shù),有效監(jiān)測風力渦輪機的健康狀況并檢測其損傷,重點指出了在設計的早期階段,可靠性分析如何成為指導維護決策和數(shù)據(jù)驅(qū)動CM有用且強大的手段。Zhang等[51]提出了一種基于健康狀態(tài)監(jiān)測和系統(tǒng)可靠性評估的架空線路維護策略,通過建立狀態(tài)監(jiān)測數(shù)據(jù)與架空線路故障率之間的定量關(guān)系,利用監(jiān)測數(shù)據(jù)評估系統(tǒng)可靠性,從而提出能夠以最低的維護成本和預算提供最大的可靠性改進策略。陳志為[52]基于健康狀態(tài)監(jiān)測數(shù)據(jù)建立運載裝備與風荷載的概率模型,使用概率模型和蒙特卡洛模擬方法,對大跨多荷載橋梁的疲勞可靠度進行評估。鄭蕊等[53]利用結(jié)構(gòu)健康監(jiān)測系統(tǒng)所記錄的應變時程曲線,同時選取若干天的應變時程曲線,通過統(tǒng)計分析得到其標準樣本,并且利用雨流計數(shù)法,得到標準樣本的應力幅譜,最終對橋面的疲勞壽命作出可靠性的評估。Hu等[54]針對機電設備的3種狀態(tài)的特點及獲得監(jiān)測數(shù)據(jù)的方式,對其可靠性壽命預測方法進行了系統(tǒng)研究和評述。肖鑫[55]提出的基于健康監(jiān)測和隨機車輛荷載模型的承載力可靠性評估方法具有較強的適用性。劉玉梅等[56]采用核密度估計法對采集數(shù)據(jù)統(tǒng)計處理,建立關(guān)鍵部件的威布爾失效率模型及Markov狀態(tài)轉(zhuǎn)移模型,基于實時故障率及維修率分析傳動系可靠性的變化。李游等[57]依據(jù)實橋動應變監(jiān)測數(shù)據(jù),參考了雨流計數(shù)法及Palmgren-Miner線性損傷累積理論,基于均勻設計–徑向基神經(jīng)網(wǎng)絡–重要蒙特卡羅法(UD–RBF–IMC)相結(jié)合的算法,運用線彈性斷裂力學對 U 肋對接焊縫疲勞可靠性進行了評估,與此同時,也研究了交通量及軸重增長對疲勞可靠度的影響規(guī)律。陳世杰等[58]通過對運營地鐵的結(jié)構(gòu)健康監(jiān)測數(shù)據(jù)進行壓縮和重構(gòu),以提高獲取的地鐵健康相關(guān)數(shù)據(jù)的信息完備與可靠性,為隧道結(jié)構(gòu)健康安全評價提供數(shù)據(jù)基礎,構(gòu)建運營地鐵隧道安全風險指標評價體系,采用云推理綜合評估運營地鐵隧道的可靠程度,并找到影響其可靠性的關(guān)鍵風險。Okasha等[59]提出了一種在不確定性條件下基于向量自回歸建模、利用結(jié)構(gòu)健康監(jiān)測數(shù)據(jù)進行高速艦船可靠性分析和損傷檢測的方法。
隨著大數(shù)據(jù)、人工智能、自動監(jiān)測技術(shù)和嵌入式傳感器技術(shù)的快速發(fā)展,目前面向健康監(jiān)測數(shù)據(jù)驅(qū)動的可靠性評估方法獲得了一定的數(shù)據(jù)支持,并且得到了較為廣泛的應用,但是,面向健康監(jiān)測數(shù)據(jù)驅(qū)動的可靠性評估方法還存在一定的問題與挑戰(zhàn)。
(1) 目前的協(xié)變量處理模型在一定程度上混淆了協(xié)變量與失效率的因果關(guān)系,實際中,二者互相影響,一些協(xié)變量影響失效率,如外部協(xié)變量,但另一些協(xié)變量則受失效率的影響,如內(nèi)部協(xié)變量。所以在研究協(xié)變量對系統(tǒng)衰退的影響時,應該對協(xié)變量類型進行有的放矢加以區(qū)分,并針對性建模,這是面向健康監(jiān)測的可靠性評估進一步深入研究的方向。
(2)目前數(shù)據(jù)驅(qū)動的可靠性評估方法是針對衰退數(shù)據(jù)尋求單一零部件的失效規(guī)律,未充分考慮不同零部件之間相互影響及作用對裝備整體衰退失效過程的影響。裝備是由諸多零部件組合的有機統(tǒng)一體,單一零部件的性能衰退會影響其他零部件,從而引起整個裝備的復合癥兆,對整個裝備可靠安全運行造成影響。所以,充分利用工業(yè)大數(shù)據(jù)資源實現(xiàn)整個裝備可靠性評估是面向健康監(jiān)測的可靠性評估的發(fā)展方向。
(3) 基于監(jiān)測信息的裝備運行可靠性評估,雖然能夠在基于裝備狀態(tài)監(jiān)測數(shù)據(jù)的基礎上得到及時的更新,為裝備的基于狀態(tài)的預測維修提供支持,并且在裝備運行可靠性評估方面有一定效果。但是,可靠性評估的精度、準確度仍依賴于樣本的大小和運行狀態(tài)與可靠性之間的關(guān)聯(lián)映射模型。因此,通過裝備狀態(tài)信息建立可靠度時間序列,準確反映裝備運行狀態(tài)與可靠性之間的關(guān)聯(lián)映射模型,這也是面向健康監(jiān)測的可靠性評估的重點發(fā)展方向。
隨著人工智能、大數(shù)據(jù)、深度學習、智能運維等技術(shù)的迅速發(fā)展,面向健康監(jiān)測的裝備運行可靠性評估的研究更加精準化、定量化、智能化、科學化,但仍然有諸多問題有待研究。
(1) 針對具體裝備健康監(jiān)測的兩個關(guān)鍵方面,即故障機理(故障物理)和狀態(tài)信號特征提取,二者的交叉研究是進一步加強運行可靠性評估的重要基石。
(2) 利用裝備運行狀態(tài)監(jiān)測信息建立個性化的準確可靠性模型,譬如進一步提高協(xié)變量模型在評估具體系統(tǒng)可靠性上的針對性,是對裝備進行瞬時或穩(wěn)態(tài)可靠度分析和運行可靠性評估的關(guān)鍵環(huán)節(jié)。
(3) 如何根據(jù)面向健康監(jiān)測的可靠度分析和可靠性評估進行裝備的故障預測和健康管理,從而進行裝備的剩余壽命預測,是實現(xiàn)裝備資產(chǎn)全周期管理和智能運維的最高追求。
(4) 綜合可靠性數(shù)學、可靠性物理、可靠性工程、人工智能、信號處理、故障診斷、大數(shù)據(jù)、自動監(jiān)測技術(shù)和嵌入式傳感器技術(shù)等多個領(lǐng)域,展開交叉融合研究,并形成全方面的數(shù)字孿生系統(tǒng)是推進面向健康監(jiān)測的運行可靠性評估理論和技術(shù)發(fā)展的有效途徑。