藺瑞管, 王華偉, 車暢暢, 倪曉梅, 熊明蘭
(南京航空航天大學(xué)民航學(xué)院, 江蘇 南京 210016)
作為飛機(jī)的關(guān)鍵部件之一,航空發(fā)動機(jī)的工作條件通常非常復(fù)雜,任何意外故障都可能導(dǎo)致災(zāi)難性后果。隨著傳感器技術(shù)的最新發(fā)展,以及通信系統(tǒng)和機(jī)器學(xué)習(xí)技術(shù)的顯著進(jìn)步,預(yù)測性維護(hù)(predictive maintenance,PdM)已經(jīng)成為航空發(fā)動機(jī)故障預(yù)測與健康管理(prognostic and health management,PHM)領(lǐng)域的研究熱點(diǎn)。通過建立航空發(fā)動機(jī)的PdM模型,管理者可以更有效地計(jì)劃維護(hù)活動,以減少發(fā)動機(jī)停車時間并降低平均維護(hù)成本,保證發(fā)動機(jī)運(yùn)行的可靠性和安全性。
隨著工業(yè)中實(shí)際需求的日益增長,PdM在近十年中受到了學(xué)者的極大關(guān)注。通常,航空發(fā)動機(jī)預(yù)測維護(hù)框架包括兩個相互聯(lián)系的關(guān)鍵部分:系統(tǒng)剩余使用壽命(remaining useful life, RUL)的預(yù)測和維修決策。在航空發(fā)動機(jī)的性能退化過程中,傳感器數(shù)據(jù)之間存在緊密的時間相關(guān)性。RUL預(yù)測就是根據(jù)該航空發(fā)動機(jī)的歷史傳感器時間序列數(shù)據(jù),辨識隱含其中的運(yùn)行規(guī)律,進(jìn)而應(yīng)用該規(guī)律對航空發(fā)動機(jī)剩余使用壽命進(jìn)行預(yù)測。
提高RUL預(yù)測的準(zhǔn)確性不僅可以提高安全性和可靠性,降低平均維護(hù)成本,并為航空發(fā)動機(jī)維修決策提供參考?;陬A(yù)測方法的研究主要分為兩大類:基于物理模型的PdM 框架和基于數(shù)據(jù)驅(qū)動的PdM 框架。但是由于設(shè)備結(jié)構(gòu)日益復(fù)雜,再加上各種環(huán)境的影響,很難用物理模型去準(zhǔn)確地預(yù)測RUL。隨著大數(shù)據(jù)時代的到來,以及計(jì)算機(jī)技術(shù)的不斷發(fā)展,基于人工智能的數(shù)據(jù)驅(qū)動方法已經(jīng)成為發(fā)動機(jī)RUL預(yù)測領(lǐng)域的研究熱點(diǎn)。
在最近的研究中,已經(jīng)開發(fā)了許多機(jī)器學(xué)習(xí)技術(shù)(尤其是深度學(xué)習(xí)),并成功應(yīng)用于預(yù)測各種復(fù)雜系統(tǒng)的RUL。深度學(xué)習(xí)算法可通過對歷史性能退化狀態(tài)序列的學(xué)習(xí),逼近傳感器數(shù)據(jù)的時間相關(guān)性規(guī)律,從而預(yù)測RUL。在深度學(xué)習(xí)中,循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)包含遞歸隱藏層,非常適用于利用時間序列信息預(yù)測RUL。但是,在RNN處理長時間序列數(shù)據(jù)時,會出現(xiàn)梯度消失現(xiàn)象,導(dǎo)致其在實(shí)際應(yīng)用中性能受限。為了解決RNN的這一問題,文獻(xiàn)[14]提出了長短期記憶(long short-term memory network, LSTM)網(wǎng)絡(luò),其作為一種RNN的變體,將長期內(nèi)存保存在單元狀態(tài),可有效處理發(fā)動機(jī)性能退化數(shù)據(jù)的長期依賴關(guān)系,適用于解決RUL預(yù)測問題,因此備受關(guān)注。
Che等提出了一種結(jié)合多種深度學(xué)習(xí)算法的PHM模型,通過深度置信網(wǎng)絡(luò)(deep belief network,DBN)和LSTM的集成來估計(jì)RUL。主要思想是使用構(gòu)造的健康因子(health indicator, HI)和目標(biāo)標(biāo)記來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,根據(jù)預(yù)測的HI,通過設(shè)置閾值以獲得發(fā)動機(jī)RUL的估計(jì)值。Tamilselvan等提出了一種使用DBN分類器的新型多傳感器健康診斷方法。Guo等提出了一種基于遞歸神經(jīng)網(wǎng)絡(luò)的健康指標(biāo),利用單調(diào)性和相關(guān)度量從原始特征集中選擇最敏感的特征,用于進(jìn)行RUL預(yù)測。Hinchi等提一種基于卷積和長短期記憶的深度RUL估計(jì)框架。首先,使用卷積層直接提取傳感器數(shù)據(jù)的局部特征,然后利用LSTM層獲得退化過程并估計(jì)RUL。Aldulaimi等提出了一種用于RUL估計(jì)的混合深度神經(jīng)網(wǎng)絡(luò)模型,該方法使用LSTM路徑提取時間特征,而同時使用卷積神經(jīng)網(wǎng)絡(luò)(con-volutional neural networks, CNN)提取空間特征,對復(fù)雜系統(tǒng)具有較好的預(yù)后效果。Yuan等利用LSTM在復(fù)雜操作,混合故障和強(qiáng)噪聲情況下預(yù)測發(fā)動機(jī)的RUL。張妍等提出由多層感知器(multi-layer perceptron,MLP)和進(jìn)化算法組成的框架,并利用跨步時間窗口和分段線性模型來估計(jì)機(jī)械組件的RUL。針對航空發(fā)動機(jī)性能退化和多狀態(tài)參數(shù)時間序列預(yù)測的問題, 車暢暢等構(gòu)建了基于多尺度排列熵算法和LSTM的RUL預(yù)測模型。針對RUL 預(yù)測精度低的問題。張永峰等提出基于一維CNN和雙向長短期記憶(bi-directional long-short term memory,BD-LSTM)的集成神經(jīng)網(wǎng)絡(luò)模型,并于其他深度學(xué)習(xí)模型進(jìn)行了比較。
在以上RUL預(yù)測的研究中,一般可以概括為以下3個步驟:①提取原始數(shù)據(jù)特征;②建立設(shè)備HI曲線;③預(yù)測設(shè)備RUL。該方法的關(guān)鍵是對原有HI曲線進(jìn)行向后的多步預(yù)測,即當(dāng) HI 值超過預(yù)先設(shè)定的閾值時視為失效,從而可計(jì)算得到RUL。提出的模型性能嚴(yán)格取決于故障閾值定義,這在實(shí)踐中并不簡單,不僅需要大量專家經(jīng)驗(yàn)參與,而且模型預(yù)測的魯棒性和準(zhǔn)確性也會受到閾值取值的影響。此外,這些研究為預(yù)測RUL值的回歸問題,其準(zhǔn)確性嚴(yán)格取決于預(yù)測范圍(從當(dāng)前時間到實(shí)際系統(tǒng)故障時間的時間段)。因此,若使用預(yù)測準(zhǔn)確性較低的RUL值可能會導(dǎo)致錯誤的決策。
針對以上問題,本文提出一種新的航空發(fā)動機(jī)預(yù)測性維護(hù)模型。采用滑動時間窗口方法標(biāo)記訓(xùn)練樣本,充分表征了多元傳感器數(shù)據(jù)的退化信息。運(yùn)用LSTM分類器強(qiáng)大的特征提取能力處理時間序列數(shù)據(jù),估計(jì)系統(tǒng)將來在特定時間窗口內(nèi)發(fā)生故障的概率。與以往研究相比,所提出的預(yù)后方法不需要設(shè)定故障閾值,而是將預(yù)測RUL轉(zhuǎn)化為二分類問題,即預(yù)測設(shè)備在特定時間窗口內(nèi)是否會失效,有效提高了維修決策的準(zhǔn)確性。通過分析窗口大小對模型性能的影響,得到最優(yōu)性能的模型參數(shù)。由于這些時間窗口是根據(jù)運(yùn)營計(jì)劃者的要求定義的,因此所提出的方法對進(jìn)一步的維修決策具有重要的研究意義。
LSTM 是在RNN基礎(chǔ)上的改進(jìn),通過多個序列的組合和前后連接,RNN能夠根據(jù)當(dāng)前信息和歷史信息來進(jìn)行預(yù)測。然而,隨著神經(jīng)網(wǎng)絡(luò)的復(fù)雜度逐漸提高,RNN往往出現(xiàn)信息過載和局部過優(yōu)化的問題。作為RNN的變體,LSTM 能夠利用門控制單元使網(wǎng)絡(luò)的信息提取更有選擇性,從而有效地提高信息的利用率和時間序列預(yù)測的準(zhǔn)確率。LSTM通過引入長時記憶單元、輸入門、遺忘門、輸出門、短時記憶單元等概念,讓整個網(wǎng)絡(luò)模型的運(yùn)行時間更短、誤差更小。
圖1 LSTM單元結(jié)構(gòu)Fig.1 LSTM unit structure
首先,遺忘門控制LSTM層哪些長期記憶可以被遺忘:
=(-1++)
(1)
接下來,輸入門計(jì)算可以從輸入中獲取的信息,并了解其中哪些部分應(yīng)該存儲到單元狀態(tài)中:
=tanh(-1++)
(2)
=(-1++)
(3)
然后,更新單元狀態(tài)中的長期記憶:
=-1?+?
(4)
最后,使用輸出門根據(jù)輸入,單元狀態(tài)和先前的隱藏狀態(tài)更新當(dāng)前隱藏層的狀態(tài):
=(-1++)
(5)
=?tanh()
(6)
在以上公式中,,,,是當(dāng)前隱藏層和先前隱藏層之間的隱藏層權(quán)重值,而,,,是當(dāng)前輸入層和當(dāng)前隱藏層之間的權(quán)重值;,,,是偏差向量;?是逐元素乘法運(yùn)算符;是Sigmoid函數(shù);tanh是激活函數(shù)。
在生產(chǎn)實(shí)踐中,通常需要長期提供預(yù)測信息,以制定不同的維護(hù)計(jì)劃。此外,由于技術(shù)和后勤方面的限制,無法在任何時間和任何地方執(zhí)行航空發(fā)動機(jī)的維護(hù)操作。因此,運(yùn)營計(jì)劃者需要先了解設(shè)備在確定時間段內(nèi)的故障概率,進(jìn)而根據(jù)這些預(yù)測信息做出相應(yīng)的預(yù)測性維修決策。
為了解決這一問題,本節(jié)提出一個基于LSTM分類器的預(yù)測性維護(hù)模型,該模型包含從數(shù)據(jù)預(yù)處理、模型的訓(xùn)練和測試到提供確定時間窗口內(nèi)故障概率的整個過程,如圖2所示。
圖2 基于LSTM分類器的預(yù)測性維護(hù)流程Fig.2 Predictive maintenance process based on LSTM classifier
首先,針對航空發(fā)動機(jī)全壽命周期的預(yù)測性維護(hù)過程,利用具有多個傳感器的監(jiān)控器系統(tǒng),采集各項(xiàng)發(fā)動機(jī)運(yùn)行性能參數(shù),建立數(shù)據(jù)集。其次,將預(yù)處理后的數(shù)據(jù)集分成訓(xùn)練集和測試集。將訓(xùn)練集和測試集輸入到LSTM分類器中,進(jìn)行模型訓(xùn)練,通過調(diào)整時間窗口得到最優(yōu)性能的LSTM模型。最后,預(yù)測設(shè)備在特定時間窗口的故障概率,以指導(dǎo)發(fā)動機(jī)維修決策。
本文使用美國國家航空航天局的 C-MAPSS渦扇發(fā)動機(jī)退化數(shù)據(jù)集進(jìn)行模型仿真。C-MAPSS數(shù)據(jù)集包括4個子集:FD001,FD002,FD003和FD004。其具有不同數(shù)量的運(yùn)行條件和故障模式,每個子數(shù)據(jù)集進(jìn)一步分為訓(xùn)練集和測試集。表1列出了C-MAPSS數(shù)據(jù)集的構(gòu)成部分。第1行和第2行分別代表每個引擎的發(fā)動機(jī)單元編號和退化周期,第3行描述了發(fā)動機(jī)的運(yùn)行設(shè)置,而最后的21列由來自21個傳感器的多元時間數(shù)據(jù)組成。在以后的實(shí)驗(yàn)中,將考慮用FD001數(shù)據(jù)集對所提出模型進(jìn)行驗(yàn)證和評估。在該數(shù)據(jù)集中,包括100個從運(yùn)行到失效的時間序列,其中包含20 631個不同時間的測試數(shù)據(jù),所有序列中測試數(shù)據(jù)的最大數(shù)量和最小數(shù)量分別為303和31。
表1 C-MAPSS數(shù)據(jù)集的構(gòu)成
在訓(xùn)練LSTM網(wǎng)絡(luò)之前,有必要對來自多個傳感器源的異構(gòu)數(shù)據(jù)進(jìn)行預(yù)處理。
(1) 數(shù)據(jù)歸一化
輸入數(shù)據(jù)是從多個傳感器源獲得的,這些傳感器源的范圍不同。為了使用這些異構(gòu)數(shù)據(jù)來訓(xùn)練LSTM分類器,有必要對它們進(jìn)行歸一化。本文采用Min-Max方法對訓(xùn)練集與測試集數(shù)據(jù)進(jìn)行歸一化,這種歸一化將確保所有功能在所有工作條件下的平等貢獻(xiàn)[26];歸一化的數(shù)據(jù)將在[0,1]之間。
(2) 時間窗處理
為了對模型進(jìn)行訓(xùn)練和測試,需要對訓(xùn)練集和測試集的數(shù)據(jù)進(jìn)行標(biāo)記。本文采用滑動時間窗口來定義數(shù)據(jù)標(biāo)簽。對于幾個連續(xù)時間序列的數(shù)據(jù),采用滑動時間窗以獲得特征向量,可以獲取更多有用的時間信息,這些信息可能會大大改善RUL分類性能。具體而言,就是利用先前的時間步長預(yù)測下一個時間步長,窗口沿時間方向滑動一個時間單位,便構(gòu)造出單個訓(xùn)練樣本,最后一個時間節(jié)點(diǎn)對應(yīng)的RUL作為該訓(xùn)練樣本的標(biāo)簽。
所提出的方法根據(jù)時間窗口來定義數(shù)據(jù)標(biāo)簽,在該時間窗口中,運(yùn)營計(jì)劃者需要故障預(yù)測信息來安排維護(hù)和生產(chǎn)活動。例如,運(yùn)營計(jì)劃者需要系統(tǒng)在規(guī)定時間窗中發(fā)生故障的概率,則將數(shù)據(jù)標(biāo)記為兩個類別。第一類記為Deg0,表示設(shè)備RUL大于的情況,即RUL>。第二類為Deg1,表征其中設(shè)備RUL小于,即RUL≤。如果RUL屬于給定的類別,則其對應(yīng)元素將設(shè)置為1,而輸出數(shù)組的其余元素設(shè)置為0。
本文提出的深層LSTM分類模型由Python 3.7.6 keras/tensorflow深度學(xué)習(xí)庫構(gòu)建,處理器為Intel(R) Core(TM) i7-9700 CPU @ 3.00 GHz 3.00 GHz,內(nèi)存為8 GB,操作系統(tǒng)為Windows 10。圖3顯示了深度LSTM中3種類型的層:輸入層,隱藏層和輸出層。
圖3 提出的深層 LSTM分類模型Fig.3 The proposed deep LSTM classification model
輸入層是將數(shù)據(jù)帶入LSTM的網(wǎng)絡(luò)層。輸入數(shù)據(jù)為三維格式,即[樣本,時間步長,特征數(shù)量]。這里的時間步長是指每個特征的信息能夠傳遞給下一個特征的長度。為了對全部設(shè)備的RUL預(yù)測值進(jìn)行二進(jìn)制分類,時間步長需要滿足測試集中記錄數(shù)據(jù)的最小長度。由于數(shù)據(jù)集FD001中記錄的最小長度為31,則本文設(shè)定的時間步長為30。
隱藏層介于輸入層和輸出層之間,是模型訓(xùn)練和測試的核心部分。在構(gòu)建的隱藏層中,先后設(shè)置了100個和50個單元的層。另外,在每個LSTM層之后應(yīng)用Dropout,以減少神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)的過擬合,從而提高網(wǎng)絡(luò)的特征提取能力。
輸出層是包含一個前饋神經(jīng)網(wǎng)絡(luò)的全連接層。該層用作網(wǎng)絡(luò)和輸出之間的原型。其允許將隱藏層輸出處的三維張量轉(zhuǎn)換為分類器輸出處的一維數(shù)組。在本文中,將分類器輸出定義為兩個元素的向量,這些特征描述了觀察結(jié)果屬于兩類的概率:Deg0(RUL>),Deg1(RUL≤)。然后,在輸出層中有兩個單元,并使用“ Sigmoid” 激活函數(shù)。輸出層提供了兩個類別(Deg0和Deg1)上的概率分布。
為了訓(xùn)練LSTM分類器,將目標(biāo)函數(shù)的損失(loss)定義為“binary_crossentropy”,該函數(shù)專門用于解決兩類別分類問題。接下來,本文采用Adam優(yōu)化算法,其是隨機(jī)梯度下降算法的擴(kuò)展式,具有計(jì)算效率高、內(nèi)存需求小以及對大數(shù)據(jù)適用性高等優(yōu)點(diǎn),被廣泛用于深度學(xué)習(xí)模型。為了評估模型的性能,將度量功能定義為“ binary_accuracy”。類似于目標(biāo)函數(shù),其為所有分類問題提供了所有預(yù)測的平均準(zhǔn)確率。
如表2所示,對于二分類問題來說,根據(jù)預(yù)測的結(jié)果得到混淆矩陣,對角線元素顯示每個類別的正確觀測值。
表2 二分類模型的混淆矩陣
本文選擇準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、F值(F1-score)來衡量二分類中不同模型算法的好壞,同時選擇ROC(receiver operating characteristic)曲線和ROC曲線下面積(area under ROC curve, AUC)來完善二分類的評價指標(biāo)。Accuracy表示分類正確的樣本數(shù)占總樣本數(shù)的比例。但是,對于不平衡數(shù)據(jù)的表現(xiàn)很差;Precision表示預(yù)測為正類的樣本中真正類所占的比例;Recall是在所有正類中被預(yù)測為正類的比例;F1-score是Precision和Recall的調(diào)和平均,一般用來衡量分類器的綜合性能。ROC曲線又稱作“受試者工作特性曲線”,橫坐標(biāo)為假正率(false positive rate, FPR),縱坐標(biāo)為真正率(true positive rate, TPR),曲線越靠近左上角的點(diǎn),效果越好。AUC定義為ROC曲線下的面積,取值范圍一般為(0.5,1.0)。AUC就越大,表示模型分類性能越好。
(7)
(8)
(9)
(10)
(11)
(12)
(13)
式中:TL表示真實(shí)標(biāo)簽;PL表示預(yù)測標(biāo)簽;∑((PL=)∩(TL=))是觀測值的預(yù)測標(biāo)簽為而其真實(shí)標(biāo)簽為的概率。
定義LSTM分類器的相關(guān)參數(shù)如表3所示。在模型訓(xùn)練過程中,本文采用keras.callbacks中的回調(diào)機(jī)制來加快訓(xùn)練過程并保存最佳分類模型。當(dāng)損失值或準(zhǔn)確率達(dá)到最優(yōu)值后,就停止訓(xùn)練,進(jìn)而提高訓(xùn)練效率和模型擬合精度。
表3 LSTM分類器的相關(guān)參數(shù)
首先,時間窗和的大小劃分如表4所示,分析對發(fā)動機(jī)RUL分類效果的影響;其次,將準(zhǔn)備好的C-MAPSS FD001數(shù)據(jù)集分成訓(xùn)練集、驗(yàn)證集和測試集;然后,利用滑動時間窗方法對數(shù)據(jù)集進(jìn)行標(biāo)記,將標(biāo)準(zhǔn)化后的數(shù)據(jù)集輸入建立的深層LSTM分類器中,預(yù)測設(shè)備在特定時間窗口內(nèi)的失效概率。通過設(shè)置時間窗口大小,輸出如表4所示的9組實(shí)驗(yàn)結(jié)果。其中,一個Epoch(時期)表示使用訓(xùn)練集的全部數(shù)據(jù)對模型進(jìn)行一次完整訓(xùn)練。
表4 分類模型的實(shí)驗(yàn)結(jié)果
圖4 為RUL二分類性能評價指標(biāo)的可視化展示??梢钥闯?當(dāng)=35和=40時,模型的分類準(zhǔn)確率最高為099。然后,隨著時間窗口增大,Accuracy逐漸減小到083,降幅為162%;當(dāng)=35和=40時,F1-score取值達(dá)到最大值098,可知兩組實(shí)驗(yàn)具有相近的綜合分類性能。由圖4可知,當(dāng)>40時,F1-score隨增大而逐漸減小;另外,第3組的AUC取值最大為0976,這與第4組的結(jié)果無明顯差別,=40時的二分類ROC曲線如圖5所示;圖6為模型運(yùn)行時間隨的變化趨勢(紅色虛線為平均運(yùn)行時間),可以看出第3組的運(yùn)行時間最長為281,第5組的運(yùn)行時間最小為57,兩組的AUC取值相近,因此在選擇模型時可優(yōu)先選擇第5組。另外,與第2組相比,第4組具有更小運(yùn)行時間,即更高運(yùn)行效率。
圖4 RUL二分類性能評價結(jié)果Fig.4 RUL binary classification performance evaluation results
圖5 w1=40時的二分類ROC曲線Fig.5 Two-class ROC curve when w1=40
圖6 模型運(yùn)行時間隨w1的變化趨勢Fig.6 Trend of model running time with w1
綜合以上分析可知,本文選擇第4組為最優(yōu)二分類模型,即時間窗口為=15和=40。圖7描述了=40時的模型訓(xùn)練過程,隨著時間的增加,訓(xùn)練集和驗(yàn)證集的loss逐漸減少。在運(yùn)行20 Epochs以后,訓(xùn)練集與驗(yàn)證集的loss誤差趨于平穩(wěn),并在Epoch=24時達(dá)到最優(yōu)的模型訓(xùn)練性能。訓(xùn)練集和驗(yàn)證集的Accuracy呈現(xiàn)出與loss相反的變化趨勢,同樣在Epoch=24時達(dá)到最優(yōu)值。圖8為二分類模型測試集的概率混淆矩陣(=15,=40)。當(dāng)系統(tǒng)屬于Deg1時,對于測試集,系統(tǒng)預(yù)測狀態(tài)為Deg0的概率非常低,僅為3.57%,而預(yù)測狀態(tài)為Deg1的概率為96.43%;當(dāng)系統(tǒng)屬于Deg0時,對于測試集,系統(tǒng)預(yù)測狀態(tài)都為Deg0,這表明此時模型具有優(yōu)良的分類性能。
圖7 w1=40時的模型訓(xùn)練過程Fig.7 Model training process when w1=40
圖8 測試集的概率混淆矩陣(w0=15,w1=40)Fig.8 Probability confusion matrix of the test set (w0=15, w1=40)
本文將提出的方法與Python scikit-learn庫中現(xiàn)有方法進(jìn)行了對比,包括邏輯回歸、決策樹、隨機(jī)森林(random forest, RF)、支持向量分類(support vector classification,SVC)、K近鄰(K-nearest neighbors,KNN)、高斯樸素貝葉斯分類器(Gaussian naive Bayesian classifier, Gaussian NB),各種方法的窗口大小設(shè)置均為=15和=40。
在Logistic Regression中,分類方式參數(shù)為“ovr”,并采用“l(fā)bfgs”作為求解器,利用海森矩陣對損失函數(shù)進(jìn)行迭代優(yōu)化,最大迭代次數(shù)為100;在Decision Tree中,特征選擇標(biāo)準(zhǔn)為“entropy”,決策樹最大深度為4,最小葉子節(jié)點(diǎn)為1,最小內(nèi)部節(jié)點(diǎn)為2,不考慮葉子節(jié)點(diǎn)的權(quán)重;在Random Forest中,特征選擇標(biāo)準(zhǔn)為“entropy”,決策樹最大深度為6,最小葉子節(jié)點(diǎn)為1,最小內(nèi)部節(jié)點(diǎn)為2,決策樹個數(shù)為50,并行工作數(shù)為1;在SVC中,核函數(shù)為“rbf”,函數(shù)維度為3,核函數(shù)參數(shù)為“auto”,不限制最大迭代次數(shù),停止訓(xùn)練的誤差值為0.001;在KNN中,數(shù)的大小為30,樹的距離度量為歐幾里德度量,并行工作數(shù)為1,近鄰數(shù)為13,預(yù)測的權(quán)函數(shù)為平均加權(quán);在Gaussian NB中,先驗(yàn)概率priors=None,即獲取各類別的先驗(yàn)概率。
表5中比較了所提方法和在發(fā)動機(jī)測試數(shù)據(jù)集FD001中的性能,性能指標(biāo)的可視化對比結(jié)果如圖9所示。與其他方法相比,本文所提方法具有最大的Accuracy、Precision、Recall和F1-Score。特別地,F1-Score為反映模型分類性能的綜合指標(biāo),由圖9可以直觀地看出所構(gòu)建的LSTM分類器較現(xiàn)有方法具有顯著的優(yōu)越性,尤其適用于多元長序列傳感器數(shù)據(jù)的處理過程。對比其他方法中最優(yōu)方法的性能,所提方法的準(zhǔn)確率提高了5.31%,而F1-Score提高了10.11%。這意味著所提出的方法具有最好的分類性能,表明了所提方法對發(fā)動機(jī)RUL分類問題的有效性。
表5 與現(xiàn)有方法的性能對比
圖9 與其他方法的性能指標(biāo)對比Fig.9 Comparison of performance indicators with other methods
(1) 本文提出了基于LSTM分類器的航空發(fā)動機(jī)預(yù)測性維護(hù)模型,與一般預(yù)測RUL值的方法不同,所提方法提供了設(shè)備RUL落入特定時間窗口的概率。
(2) 采用滑動時間窗口定義訓(xùn)練樣本標(biāo)簽,然后將預(yù)處理后的數(shù)據(jù)集輸入建立的深層LSTM分類器中,預(yù)測設(shè)備在特定時間窗口內(nèi)的失效概率。通過分析對故障概率的影響,得到最優(yōu)性能的LSTM分類模型,以更好地適應(yīng)實(shí)際維護(hù)需求。在特定的時間窗口內(nèi),維護(hù)工程師可以根據(jù)RUL分類信息來安排維護(hù)和生產(chǎn)活動。
(3) 提出的模型在美國國家航空航天局的 C-MAPSS的數(shù)據(jù)集上進(jìn)行了驗(yàn)證,評價指標(biāo)均優(yōu)于其他現(xiàn)有分類模型,驗(yàn)證了LSTM分類器的有效性。同時,更加準(zhǔn)確的RUL分類模型可降低維護(hù)成本,提高維護(hù)效率。