□ 楊家榮
上海電氣集團(tuán)股份有限公司 中央研究院 上海 200070
在制造系統(tǒng)越來越復(fù)雜,生產(chǎn)運營少人化、無人化的條件下,需要實現(xiàn)高效率、高質(zhì)量的設(shè)備維護(hù)和及時維修。智能運維是通過數(shù)據(jù)采集和分析等技術(shù)對傳統(tǒng)運維進(jìn)行的一種升級,能夠自動識別設(shè)備在生產(chǎn)制造過程中存在的隱患,對已發(fā)生或?qū)⒁l(fā)生的故障、問題及時發(fā)出警報,從而輔助運維管理者消除設(shè)備隱患,對故障原因進(jìn)行判斷和處理[1]。對工業(yè)企業(yè)而言,高效的運維管理意味著更少的設(shè)備故障、更高效的故障停機處理,以及更低的運維成本。筆者介紹故障預(yù)測與健康管理技術(shù)在智能運維中的應(yīng)用。
故障預(yù)測與健康管理技術(shù)最早在西方發(fā)達(dá)工業(yè)國家興起,早期概念起源于預(yù)測性維護(hù),之后逐步發(fā)展為故障預(yù)測與健康管理。故障預(yù)測與健康管理技術(shù)是基于狀態(tài)的維修的升級發(fā)展,強調(diào)設(shè)備管理中的狀態(tài)感知,監(jiān)控設(shè)備健康狀態(tài)、故障頻發(fā)區(qū)域與周期。通過數(shù)據(jù)監(jiān)控與分析,預(yù)測故障的發(fā)生,從而大幅度提高運維效率。故障預(yù)測與健康管理技術(shù)已經(jīng)形成了一套技術(shù)方法體系,具有包含數(shù)據(jù)采集與傳輸、數(shù)據(jù)處理、決策支持、綜合信息管理的技術(shù)結(jié)構(gòu),相應(yīng)的技術(shù)標(biāo)準(zhǔn)體系也相對完善。
目前,故障預(yù)測與健康管理技術(shù)已經(jīng)在民用飛機、直升機、戰(zhàn)斗機、航天器等方面得到了應(yīng)用,并且是研究的熱點。波音公司在法國航空、美國航空定購的多個機型中應(yīng)用故障預(yù)測與健康管理技術(shù),提高維修效率。在軍事武器裝備領(lǐng)域,故障預(yù)測與健康管理技術(shù)的實施效果最為顯著。如著名的F-35戰(zhàn)斗機,采用故障預(yù)測與健康管理技術(shù)后故障不可復(fù)現(xiàn)率和維修人力大大降低。統(tǒng)計數(shù)據(jù)充分證明,故障預(yù)測與健康管理技術(shù)在降低維修保障成本,提高安全性、可用度、完好性,確保任務(wù)成功性方面具有重要作用[2]。隨著我國制造業(yè)朝數(shù)字化、網(wǎng)絡(luò)化、智能化方向的發(fā)展,故障預(yù)測與健康管理技術(shù)逐步從最初的軍事、航天領(lǐng)域向民用高端裝備應(yīng)用,進(jìn)而提高裝備的安全性,降低運維成本。
當(dāng)前,我國的重大裝備取得了較大發(fā)展與突破,高鐵、數(shù)控機床、核電、風(fēng)電等領(lǐng)域都取得了舉世矚目的重大成就。這些高端裝備的制造過程十分復(fù)雜,裝備交付之后必須進(jìn)行經(jīng)常性維護(hù)檢修,保障穩(wěn)定性。一旦裝備出現(xiàn)異常,則損失巨大。以安全著稱的航空業(yè),因飛機故障原因?qū)е碌氖鹿驶蜓诱`仍無法完全避免。海恩法則指出,每一起嚴(yán)重事故的背后,必然有29次輕微事故、300起未遂先兆,以及1 000項事故隱患[3]。傳統(tǒng)維護(hù)檢修更依賴人的經(jīng)驗與能力,在設(shè)備發(fā)生故障后,會進(jìn)行故障記錄分析,但不具備對故障的預(yù)測、預(yù)警功能。在智能運維過程中,用戶希望能及時發(fā)現(xiàn)設(shè)備存在的隱患,及時制訂維修策略,降低故障發(fā)生概率。由此可見,故障預(yù)測與健康管理技術(shù)在設(shè)備安全和保障中發(fā)揮著越來越重要的作用。
目前,故障預(yù)測與健康管理技術(shù)的應(yīng)用深度、廣度和功能水平,與應(yīng)用對象、目標(biāo)、任務(wù)有直接關(guān)系,并且存在很大的差異性。故障預(yù)測與健康管理技術(shù)的應(yīng)用多表現(xiàn)為集成至工業(yè)互聯(lián)網(wǎng)等智能運維平臺的模式,這樣可以支撐業(yè)務(wù)的發(fā)展。
隨著我國經(jīng)濟(jì)的發(fā)展,高層建筑不斷增多。電梯作為一種特種設(shè)備,存在一定的安全隱患。據(jù)統(tǒng)計,門系統(tǒng)事故是電梯的最主要事故,80%以上的電梯故障和70%以上的電梯事故都是由于門系統(tǒng)出現(xiàn)問題造成的[4]。電梯門系統(tǒng)故障模擬臺如圖1所示。通過采集電梯運行過程中門系統(tǒng)的數(shù)據(jù),應(yīng)用故障預(yù)測與健康管理技術(shù),可以對門系統(tǒng)進(jìn)行故障診斷和預(yù)測。此外,用于運送乘客或貨物的轎廂也是電梯非常關(guān)鍵的組件,同樣可以應(yīng)用故障預(yù)測與健康管理技術(shù),對轎廂的振動信號進(jìn)行采集,并進(jìn)行故障診斷和預(yù)測。電梯轎廂故障分類混淆矩陣如圖2所示,其中,導(dǎo)靴大故障的預(yù)測準(zhǔn)確率在98%左右,其它故障模式的預(yù)測也均取得了良好的效果。應(yīng)用故障預(yù)測與健康管理技術(shù),可以將傳統(tǒng)電梯故障后檢修方式轉(zhuǎn)變?yōu)樾滦蜖顟B(tài)預(yù)測和維護(hù)方式,為現(xiàn)場設(shè)備的維護(hù)預(yù)留關(guān)鍵時間窗口,能夠避免事故發(fā)生和人員傷亡,節(jié)約大量不必要的維護(hù)資源。
圖1 電梯門系統(tǒng)故障模擬臺
圖2 電梯轎廂故障分類混淆矩陣
城市軌道交通的高速發(fā)展給運維市場帶來了廣闊的空間。我國軌道交通線路關(guān)鍵設(shè)施、設(shè)備陸續(xù)進(jìn)入中大修階段,而與此同時,運維呈現(xiàn)出人員分布不均情況,面臨客流量持續(xù)攀升、擁擠度超標(biāo)等局面,迫切需要提高運維效率,降低晚點率和突發(fā)事故的發(fā)生率。傳統(tǒng)上,城市軌道交通關(guān)鍵設(shè)備主要采用以計劃預(yù)防修和故障修為主的檢維修體系。當(dāng)前,構(gòu)建集狀態(tài)監(jiān)測與評估、特征提取、故障診斷與預(yù)測、維修模式優(yōu)化、維修決策于一體的軌道交通智能運維系統(tǒng),是業(yè)內(nèi)熱點[5]。應(yīng)用故障預(yù)測與健康管理技術(shù),可以對轉(zhuǎn)向架與輪對、屏蔽門、車門、空調(diào)、弓網(wǎng)關(guān)系、道岔等進(jìn)行故障預(yù)測與健康管理。軌道交通車輛轉(zhuǎn)向架運行狀態(tài)監(jiān)測系統(tǒng)界面如圖3所示,這一系統(tǒng)可以在軌道交通車輛運行過程中對轉(zhuǎn)向架的運行狀態(tài)實現(xiàn)故障預(yù)警信息集中管理和預(yù)警提示,從而預(yù)測可能發(fā)生的故障,給出車輛運營維護(hù)建議,提升乘客體驗。
圖3 軌道交通車輛轉(zhuǎn)向架運行狀態(tài)監(jiān)測系統(tǒng)界面
隨著風(fēng)力發(fā)電裝機容量和規(guī)模的不斷擴(kuò)大,風(fēng)電場運維已經(jīng)成為風(fēng)力發(fā)電產(chǎn)業(yè)重要的后市場。伴隨著裝機機組服役年限增加,近年來,風(fēng)力發(fā)電機事故頻發(fā),如失火、倒塔等,使風(fēng)電場運維的成本和壓力不斷增大。有機構(gòu)對風(fēng)力發(fā)電機事故的原因進(jìn)行總結(jié)后發(fā)現(xiàn),機組設(shè)備質(zhì)量不過關(guān)、機組研發(fā)與運維脫節(jié)等是造成風(fēng)力發(fā)電機事故的主要原因。在風(fēng)力發(fā)電檢修方面,故障預(yù)測與健康管理技術(shù)可以降低機組事故發(fā)生率,減少維修費用,縮短維修時間,提高機組運行效率和可靠性,同時能夠為設(shè)計人員提供指導(dǎo)。
目前,幾乎所有大型風(fēng)力發(fā)電企業(yè)都在開展故障預(yù)測與健康管理技術(shù)與運維系統(tǒng)的開發(fā),尤其是對大型海上風(fēng)電場而言,智能運維直接關(guān)系到海上風(fēng)力發(fā)電項目的安全和社會經(jīng)濟(jì)效益。風(fēng)力發(fā)電機組狀態(tài)監(jiān)測及智能分析系統(tǒng)界面如圖4所示,這一系統(tǒng)針對風(fēng)力發(fā)電機組傳動鏈,實現(xiàn)軸承和齒輪箱的智能故障診斷與狀態(tài)評估,自動分析故障位置與故障類型,并預(yù)測衰退趨勢,能夠提高風(fēng)力發(fā)電機組的運行效率和可靠性。
圖4 風(fēng)力發(fā)電機組狀態(tài)監(jiān)測及智能分析系統(tǒng)界面
故障預(yù)測與健康管理技術(shù)實現(xiàn)預(yù)測的方法主要分為三種:基于可靠性理論的預(yù)測、基于數(shù)據(jù)驅(qū)動的預(yù)測、基于時效物理模型的預(yù)測,三種方法在工程應(yīng)用中的廣泛性依次減弱,預(yù)測精度依次提高,相關(guān)的難度和成本依次增大[6]。
采用基于數(shù)據(jù)驅(qū)動的預(yù)測方法,模型構(gòu)建過程相對簡單,在獲取準(zhǔn)確、全面數(shù)據(jù)資源的前提下,只需要描述數(shù)據(jù)輸出關(guān)系和相關(guān)參數(shù),即可進(jìn)行狀態(tài)預(yù)測,不需要建立精確的物理模型。在近幾年工業(yè)大數(shù)據(jù)浪潮的推動下,基于數(shù)據(jù)驅(qū)動的預(yù)測方法獲得了空前的關(guān)注,成為研究和應(yīng)用的熱點。
基于數(shù)據(jù)驅(qū)動的預(yù)測方法對一個復(fù)雜系統(tǒng)對象進(jìn)行預(yù)測與維護(hù),需要確定可以直接表征系統(tǒng)故障及健康狀態(tài)的參數(shù)指標(biāo),或者可以間接推理判斷系統(tǒng)故障及健康狀態(tài)的參數(shù)信息,這是應(yīng)用故障預(yù)測與健康管理技術(shù)的數(shù)據(jù)基礎(chǔ)[7-8]。傳感器技術(shù)的應(yīng)用,將直接影響故障預(yù)測與健康管理技術(shù)的應(yīng)用效果,傳感器的類型、安裝位置、精度、傳輸?shù)榷紩a(chǎn)生影響。一旦獲取數(shù)據(jù),就可以開展下一步具體的建模工作。故障預(yù)測與健康管理技術(shù)建模流程如圖5所示。
圖5 故障預(yù)測與健康管理技術(shù)建模流程
采用基于數(shù)據(jù)驅(qū)動的預(yù)測方法,還離不開特征工程,尤其是有經(jīng)驗的數(shù)據(jù)建模工程師的工作。對采集到的數(shù)據(jù)進(jìn)行預(yù)處理之后,特征的提取與選擇等操作非常重要,需要有經(jīng)驗的工程師一起參與并進(jìn)行判斷。找到有效的特征后,可以應(yīng)用開發(fā)的模型進(jìn)行衰退性評估,如果衰退是一個逐漸損耗的過程,那么基本可以使用這一模型來預(yù)測未來的狀態(tài)變化和趨勢,否則需要進(jìn)行相應(yīng)的調(diào)整和優(yōu)化。
故障預(yù)測與健康管理技術(shù)雖然具有較好的應(yīng)用前景,但是實現(xiàn)難度較大,并且復(fù)雜度高。在當(dāng)前國內(nèi)企業(yè)眾多的應(yīng)用項目中,因為基礎(chǔ)理論及方法研究起步較晚,所以雖然開展了大量工作,但還是遇到了不少問題與挑戰(zhàn),主要有三方面。
第一,現(xiàn)有故障預(yù)測與健康管理技術(shù)故障診斷、性能預(yù)測效果欠佳。
復(fù)雜系統(tǒng)自身具有高維、非線性等特點,導(dǎo)致難以建立準(zhǔn)確的系統(tǒng)模型。早期故障特征表現(xiàn)不明顯,在傳感器測點有限或不可及的情況下,獲取的信息不完備,難以獲取有用的信息。以上因素導(dǎo)致現(xiàn)有故障預(yù)測與健康管理技術(shù)故障診斷、性能預(yù)測效果欠佳?;跁r間序列的數(shù)據(jù)雖然量大,但是價值密度不高,導(dǎo)致一些簡單的設(shè)備應(yīng)用故障預(yù)測與健康管理技術(shù)往往可以取得很好的效果,而在大型復(fù)雜裝備中應(yīng)用卻無法取得令人滿意的效果。當(dāng)前,對于故障預(yù)測與健康管理技術(shù)的追求逐步理性,從現(xiàn)實角度考慮,不追求準(zhǔn)確預(yù)測剩余使用壽命,只對子系統(tǒng)的性能衰退趨勢進(jìn)行跟蹤,是比較現(xiàn)實和可接受的預(yù)測形式。
第二,在現(xiàn)有故障預(yù)測與健康管理技術(shù)中,模型無法自適應(yīng)調(diào)整。
當(dāng)前故障預(yù)測與健康管理技術(shù)的預(yù)測模型多數(shù)屬于靜態(tài)模型,缺乏自學(xué)習(xí)能力,通常情況下預(yù)測模型通過一次建模獲得,模型參數(shù)保持固定不變,沒有考慮復(fù)雜工業(yè)場景下環(huán)境變化、負(fù)載變化、新增樣本、工況變化等對模型參數(shù)的影響,如果一個設(shè)備發(fā)生了狀態(tài)變化,模型無法自動優(yōu)化或升級,由此導(dǎo)致對于復(fù)雜裝備的預(yù)測在運行工況多變的情況下并不精確。
第三,當(dāng)前關(guān)于故障預(yù)測與健康管理技術(shù)的研究主要集中在故障知識推理和知識表示方面,異構(gòu)故障知識組織與管理、應(yīng)用方面的研究較少。
知識在故障預(yù)測與健康管理技術(shù)中具有重要作用,涉及產(chǎn)品設(shè)計、制造、運行、維護(hù)過程,包括結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等類型。實現(xiàn)對這些知識的有效管理和應(yīng)用,是提高故障預(yù)測與健康管理技術(shù)應(yīng)用效果的基礎(chǔ)和前提,也是故障預(yù)測與健康管理技術(shù)需要解決的難點。從知識管理和服務(wù)的角度來研究故障預(yù)測與健康管理技術(shù)中的知識建模和應(yīng)用,是當(dāng)前航空、高鐵等領(lǐng)域的關(guān)注點,尤其是在航空領(lǐng)域,已經(jīng)取得了很好的成效。另一方面,失效樣本少,數(shù)據(jù)測點不完整、不平衡等問題,都會導(dǎo)致故障預(yù)測與健康管理技術(shù)在應(yīng)用層面很難保證模型的準(zhǔn)確性和穩(wěn)定性[9-10]。各類故障試驗數(shù)據(jù)、性能退化征兆、故障發(fā)展到失效的數(shù)據(jù)等都非常寶貴,而目前大多數(shù)國內(nèi)企業(yè)尚未建立起完整的數(shù)據(jù)庫。
應(yīng)用故障預(yù)測與健康管理技術(shù)的根本目的是與運維過程中的其它系統(tǒng)集成,促進(jìn)維修保障模式向智能運維轉(zhuǎn)變,便于維護(hù)、維修計劃的制訂和調(diào)整,提出有針對性的運維計劃,降低運維成本。在推進(jìn)智能運維前期,尤其要做好故障預(yù)測與健康管理技術(shù)的探索和數(shù)據(jù)整理,為后續(xù)模型的優(yōu)化打下基礎(chǔ)。由于受到觀念和條件的限制,我國在產(chǎn)品研制時,沒有同步設(shè)計保障體系,配套的維護(hù)保障設(shè)施、設(shè)備維修方案、詳細(xì)備件及技術(shù)資料都不健全。對此,可以考慮結(jié)合智能運維平臺檔案履歷的電子化、交互化,在此基礎(chǔ)上發(fā)展故障預(yù)測與健康管理技術(shù)。故障預(yù)測與健康管理技術(shù)的應(yīng)用注定是一個緩慢推進(jìn)的過程,在當(dāng)前預(yù)測準(zhǔn)確度還存在一定不足的情況下,企業(yè)需要將產(chǎn)品的設(shè)計、研發(fā)、制造、銷售、服務(wù)等環(huán)節(jié)逐漸構(gòu)成閉環(huán),進(jìn)而依靠機器視覺、工業(yè)互聯(lián)網(wǎng)大數(shù)據(jù)分析等的綜合運用,結(jié)合專家經(jīng)驗知識,將海量工業(yè)數(shù)據(jù)轉(zhuǎn)變?yōu)橛袃r值信息,實現(xiàn)智能運維。