劉子俊,馮 勇,陳景龍,王 珺,張志偉
(1.西安航天動(dòng)力研究所,陜西 西安 710100;2.西安交通大學(xué) 制造與系統(tǒng)工程國家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710049)
21世紀(jì)以來,世界各國對(duì)太空資源愈加重視,使得航天技術(shù)發(fā)展迅猛,該技術(shù)甚至在一定程度上代表了國家的軍事、科技、經(jīng)濟(jì)等發(fā)展水平,近年來眾多民營企業(yè)的涌現(xiàn)更是促進(jìn)了航天領(lǐng)域的商業(yè)化發(fā)展。航天發(fā)射任務(wù)愈加頻繁,各類航天事故的發(fā)生不可避免,促使人們對(duì)火箭系統(tǒng)及關(guān)鍵部件開展?fàn)顟B(tài)監(jiān)測(cè)、異常檢測(cè)、故障診斷等進(jìn)行研究。發(fā)動(dòng)機(jī)作為液體火箭的動(dòng)力核心,對(duì)其進(jìn)行異常檢測(cè)方法的研究對(duì)于保證火箭系統(tǒng)運(yùn)行的可靠性和安全性具有重要意義。
液體火箭發(fā)動(dòng)機(jī)(liquid rocket engine, LRE)的異常檢測(cè)是指對(duì)傳感器測(cè)量的發(fā)動(dòng)機(jī)運(yùn)行數(shù)據(jù)進(jìn)行特征提取后,做出二元決策,即判斷該發(fā)動(dòng)機(jī)工作是否發(fā)生異常。由于航天發(fā)動(dòng)機(jī)結(jié)構(gòu)復(fù)雜,且具有機(jī)械—流體—燃燒等過程耦合的特點(diǎn),僅依靠單路傳感器所測(cè)數(shù)據(jù)無法準(zhǔn)確地判斷發(fā)動(dòng)機(jī)健康狀態(tài),因此常采用多傳感器采集的多源數(shù)據(jù)進(jìn)行LRE異常檢測(cè)。
目前的液體火箭發(fā)動(dòng)機(jī)異常檢測(cè)方法大致可分為以下3種:基于模型驅(qū)動(dòng)的方法、基于數(shù)據(jù)驅(qū)動(dòng)的方法、基于人工智能的方法。其中,基于模型驅(qū)動(dòng)的方法具有完備的理論,但該方法的分析結(jié)果依賴于建模的精確程度,而由于航天發(fā)動(dòng)機(jī)系統(tǒng)的復(fù)雜性和工況的復(fù)雜性(高溫、高壓、強(qiáng)振動(dòng)等),建立各種工況下的模型比較困難,限制了該方法在實(shí)際中的應(yīng)用?;跀?shù)據(jù)驅(qū)動(dòng)的方法主要是根據(jù)發(fā)動(dòng)機(jī)的輸出與故障之間的對(duì)應(yīng)關(guān)系,通過主成分分析、小波分析、聚類方法等對(duì)測(cè)量信號(hào)進(jìn)行分析處理,根據(jù)安全閾值判斷發(fā)動(dòng)機(jī)的健康狀態(tài)或故障類型,但該方法對(duì)所獲取的數(shù)據(jù)質(zhì)量要求較高。
隨著機(jī)器學(xué)習(xí)方法的發(fā)展與應(yīng)用,具有自組織和自學(xué)習(xí)能力的人工神經(jīng)網(wǎng)絡(luò)以及深層神經(jīng)網(wǎng)絡(luò)被應(yīng)用于航天發(fā)動(dòng)機(jī)故障診斷和異常檢測(cè)等領(lǐng)域中。聶僥利用過程神經(jīng)網(wǎng)絡(luò)對(duì)某大型氫氧火箭發(fā)動(dòng)機(jī)的故障進(jìn)行預(yù)測(cè)并實(shí)現(xiàn)部件級(jí)別的故障隔離,提高了火箭發(fā)動(dòng)機(jī)異常檢測(cè)效率。孫成志等提出了基于BP神經(jīng)網(wǎng)絡(luò)、證據(jù)理論和滾動(dòng)時(shí)域估計(jì)算法的火箭發(fā)動(dòng)機(jī)異常檢測(cè)模型,以解決火箭動(dòng)力系統(tǒng)故障的復(fù)雜特性帶來的異常檢測(cè)效率低的問題。彭軍等利用深度置信網(wǎng)絡(luò)對(duì)同樣具有高溫、高轉(zhuǎn)速、大應(yīng)力等惡劣工況的航空發(fā)動(dòng)機(jī)進(jìn)行異常檢測(cè),克服了淺層神經(jīng)網(wǎng)絡(luò)的不足,大大提高了檢測(cè)精度。An等提出利用自動(dòng)編碼器(deep autoencoder, DAE)的重構(gòu)損失來進(jìn)行異常檢測(cè)的方法。近年來,由Goodfellow等提出的生成對(duì)抗網(wǎng)絡(luò)(generative adversarial networks, GAN)被廣泛應(yīng)用于圖像分類、語音識(shí)別、故障診斷等領(lǐng)域中,由于GAN具有對(duì)數(shù)據(jù)的強(qiáng)大生成和鑒別能力,研究人員也將其應(yīng)用于異常檢測(cè)中。Sabokrou等將GAN與DAE結(jié)合,設(shè)計(jì)出具有端到端訓(xùn)練的異常檢測(cè)模型(adversarially learned one-class classifier, ALOCC)。Schlegl等提出無監(jiān)督訓(xùn)練的快速異常檢測(cè)模型f-AnoGAN,有效提高了醫(yī)學(xué)圖像中的病灶檢測(cè)效率。國內(nèi)研究中,基于人工智能尤其是深度學(xué)習(xí)的火箭發(fā)動(dòng)機(jī)異常檢測(cè)方法研究較少。張克明等提出基于生成對(duì)抗網(wǎng)絡(luò)的異常檢測(cè)模型,無需標(biāo)注數(shù)據(jù),僅利用系統(tǒng)運(yùn)作時(shí)的正常數(shù)據(jù)訓(xùn)練該模型,實(shí)現(xiàn)對(duì)航天異常事件的有效檢測(cè)。但該方法未在真實(shí)航天數(shù)據(jù)上進(jìn)行驗(yàn)證,且僅研究了基于單個(gè)傳感器數(shù)據(jù)的異常檢測(cè),檢測(cè)結(jié)果的不確定性較大。
鑒于液體火箭發(fā)動(dòng)機(jī)異常檢測(cè)方法的準(zhǔn)確性和通用性需求,本文在僅有發(fā)動(dòng)機(jī)健康數(shù)據(jù)可用的條件下對(duì)液體火箭發(fā)動(dòng)機(jī)異常檢測(cè)進(jìn)行了深入研究,提出了基于深度學(xué)習(xí)的自編碼式—生成對(duì)抗網(wǎng)絡(luò)(autoencoding generative adversarial network, AEGAN)以融合多源信息,根據(jù)輸入數(shù)據(jù)的重構(gòu)損失和鑒別分?jǐn)?shù),通過無參數(shù)的核密度估計(jì)完成二元決策。實(shí)驗(yàn)結(jié)果表明,該方法能有效地實(shí)現(xiàn)液體火箭發(fā)動(dòng)機(jī)的異常檢測(cè)。
本研究提出的AEGAN,結(jié)構(gòu)上由3部分組成:編碼器E、生成器G、鑒別器D。功能上,編碼器—生成器(E-G)構(gòu)成深度自編碼器,生成器—鑒別器(G-D)構(gòu)成相對(duì)生成對(duì)抗網(wǎng)絡(luò)(relativistic generative adversarial network, RGAN)。
(1)
反向傳播中采用梯度下降法進(jìn)行網(wǎng)絡(luò)權(quán)值更新,其優(yōu)化目標(biāo)為
(2)
式中為求平均操作。
在實(shí)際的操作中,使DAE僅具備復(fù)制輸入的功能是不夠的,通過加入噪聲以損壞輸入,再由自編碼器進(jìn)行恢復(fù)。因此DAE不僅需要去除噪聲損壞,還需要還原至最初的輸入,迫使自編碼器具有更強(qiáng)的特征提取能力。式(1)變?yōu)?/p>
(3)
式中~(0,01)為高斯噪聲。
一般地,GAN由生成偽數(shù)據(jù)的生成器和鑒別數(shù)據(jù)真?zhèn)涡缘蔫b別器組成,其優(yōu)化目標(biāo)為
(4)
式中~(0,1)為一維高斯噪聲。通過提高鑒別器的“鑒偽”能力和生成器的“造假”能力,可以生成高質(zhì)量的正常數(shù)據(jù)和低質(zhì)量的異常數(shù)據(jù),并通過鑒別器成功鑒別發(fā)動(dòng)機(jī)的正常/異常狀態(tài)。
相較于標(biāo)準(zhǔn)GAN而言,RGAN針對(duì)的不是增大鑒別器對(duì)真實(shí)數(shù)據(jù)的輸出概率,而是增大真實(shí)數(shù)據(jù)相對(duì)于重構(gòu)數(shù)據(jù)的真實(shí)程度,優(yōu)化目標(biāo)為
(5)
(6)
本研究提出自編碼式—生成對(duì)抗網(wǎng)絡(luò)AEGAN進(jìn)行液體火箭發(fā)動(dòng)機(jī)的異常檢測(cè),如圖1所示。
圖1 AEGAN異常檢測(cè)流程Fig.1 Flowchart of AEGAN anomaly detection
AEGAN異常檢測(cè)具體實(shí)施步驟如下:
1)使用多個(gè)傳感器采集LRE運(yùn)行狀態(tài)下的原始信號(hào)作為多源數(shù)據(jù),以固定長度截取時(shí)間序列得到數(shù)據(jù)樣本集,并對(duì)各樣本進(jìn)行預(yù)處理,將一維多通道數(shù)據(jù)轉(zhuǎn)換為二維多通道圖像;
2)將獲取的圖像樣本分類標(biāo)簽化,劃分樣本數(shù)據(jù)為訓(xùn)練集和測(cè)試集;
3)構(gòu)建相對(duì)生成對(duì)抗網(wǎng)絡(luò)作為異常檢測(cè)模型,使用步驟2)中的訓(xùn)練集進(jìn)行RGAN和DAE的訓(xùn)練,最終得到3個(gè)對(duì)LRE健康狀態(tài)具有良好識(shí)別能力的子網(wǎng)絡(luò);
4)使用步驟3)中訓(xùn)練的模型對(duì)步驟2)中的訓(xùn)練集樣本進(jìn)行狀態(tài)評(píng)估,對(duì)得到的評(píng)估分?jǐn)?shù)()進(jìn)行核密度估計(jì),計(jì)算LRE正常樣本的分?jǐn)?shù)閾值;
5)使用步驟3)中訓(xùn)練的模型對(duì)步驟2)中的測(cè)試集樣本進(jìn)行狀態(tài)評(píng)估,對(duì)每個(gè)樣本進(jìn)行鄰域信息聚合,根據(jù)步驟4)中的分?jǐn)?shù)閾值進(jìn)行異常檢測(cè)。
首先,對(duì)每個(gè)傳感器通道采集的每個(gè)時(shí)間序列樣本∈進(jìn)行歸一化,得出
(7)
(8)
式中表示信號(hào)通道數(shù)目。某型LRE地面熱試車數(shù)據(jù)加速度通道一維振動(dòng)信號(hào)及預(yù)處理后的二維圖像如圖2所示。
圖2 數(shù)據(jù)預(yù)處理Fig.2 Data preprocessing
因?yàn)橛?xùn)練集僅包含LRE健康狀態(tài)數(shù)據(jù),根據(jù)該部分?jǐn)?shù)據(jù)重建LRE健康狀態(tài)下的數(shù)據(jù)分布對(duì)于安全閾值的確定非常重要。核密度估計(jì)是一種用于估計(jì)給定樣本概率密度分布的非參數(shù)方法,如果給定樣本為=[,…,],則點(diǎn)=處的概率密度估計(jì)定義為
(9)
式中:=106()-02;表示高斯核函數(shù)。
模型訓(xùn)練完成后,對(duì)訓(xùn)練集中所有正常樣本(正樣本)進(jìn)行狀態(tài)評(píng)估,評(píng)估分?jǐn)?shù)由兩部分組成,如圖3所示,測(cè)量信號(hào)轉(zhuǎn)換為多通道圖像后,將其輸入到E-G構(gòu)成的自編碼器中得到重構(gòu)圖像,與原圖像對(duì)比得到重構(gòu)損失;將其輸入鑒別器中對(duì)其狀態(tài)為正常進(jìn)行估計(jì),得到鑒別分?jǐn)?shù),則最后的檢測(cè)分?jǐn)?shù)為
圖3 AEGAN異常檢測(cè)模型Fig.3 AEGAN anomaly detection model
()=sigmoid[()]-{[()-]}+
(10)
式中為大于0的常數(shù)。
(11)
式中:為置信度;(·)表示標(biāo)準(zhǔn)正態(tài)分布(0, 1) 的上側(cè)分位數(shù)。
為增強(qiáng)方法的檢測(cè)準(zhǔn)確率及其魯棒性,在測(cè)試中聚合鄰近信息得到最終檢測(cè)分?jǐn)?shù)為
(12)
筆者驗(yàn)證實(shí)驗(yàn)所用數(shù)據(jù)來自于某型號(hào)的液體火箭發(fā)動(dòng)機(jī)地面熱試車數(shù)據(jù),實(shí)驗(yàn)裝置結(jié)構(gòu)及原理如圖4所示。其結(jié)構(gòu)主要包括渦輪、氧泵、燃料泵、燃燒室、燃?xì)獍l(fā)生器等。發(fā)動(dòng)機(jī)氧化劑經(jīng)過氧主泵加壓后部分進(jìn)入噴注器,其余進(jìn)入發(fā)生器進(jìn)行燃燒產(chǎn)生高溫和富氧燃?xì)?,并在?duì)主渦輪做功后經(jīng)燃?xì)鈱?dǎo)管到達(dá)噴注器的氣噴嘴入口,最后由氣噴嘴進(jìn)入燃燒室;發(fā)動(dòng)機(jī)燃料經(jīng)過燃料一級(jí)泵增壓后主要分為兩路,其中大部分通過推力室冷卻通道進(jìn)入燃燒室,另一部分由燃料二級(jí)泵增壓后進(jìn)入燃?xì)獍l(fā)生器和推力室燃料入口路。燃料由燃燒室頭部噴注器混合霧化,形成細(xì)小液滴,被火焰加熱氣化并劇烈燃燒,產(chǎn)生高溫高壓燃?xì)飧咚賴姵?,進(jìn)而產(chǎn)生推力。
圖4 某型液體火箭發(fā)動(dòng)機(jī)原理圖Fig.4 Schematic diagram of a LRE
熱試車實(shí)驗(yàn)中,選取該發(fā)動(dòng)機(jī)10個(gè)關(guān)鍵位置作為測(cè)點(diǎn),采集的多通道信號(hào)主要包括推力室振動(dòng)信號(hào)、燃?xì)獍l(fā)生器振動(dòng)信號(hào)、氧泵振動(dòng)及氧化劑管路流體壓力信號(hào)、燃料泵振動(dòng)信號(hào)及燃料管路流體壓力信號(hào)等。
在25.6 kHz的采樣頻率下獲取LRE運(yùn)行數(shù)據(jù),以1 024數(shù)據(jù)點(diǎn)即0.04 s所采數(shù)據(jù)為一個(gè)單通道樣本,以18個(gè)通道所測(cè)信號(hào)作為多源數(shù)據(jù)樣本。驗(yàn)證實(shí)驗(yàn)中,選取該型號(hào)發(fā)動(dòng)機(jī)健康狀態(tài)下的1 500個(gè)正樣本以及異常狀態(tài)下的1 000個(gè)負(fù)樣本,以500個(gè)正樣本作為訓(xùn)練集訓(xùn)練異常檢測(cè)模型,以1 000個(gè)正樣本和負(fù)樣本作為測(cè)試集測(cè)試模型。
用于液體火箭發(fā)動(dòng)機(jī)異常檢測(cè)結(jié)果及檢測(cè)方法的性能指標(biāo)主要有精確率、召回率、準(zhǔn)確率、靈敏度、特異度、受試者工作特性曲線(receiver operating characteristic, ROC)及曲線下面積(area under curve, AUC)、F1—分?jǐn)?shù)等。如表1所示的混淆矩陣,若以P、N表示樣本的正負(fù),以T、F分別表示預(yù)測(cè)的真假,則上述指標(biāo)可解釋如下。
表1 異常檢測(cè)結(jié)果混淆矩陣Tab.1 Confusion matrix of anomaly detection results
1) 精確率與召回率。精確率描述的是預(yù)測(cè)為正的樣本中實(shí)際為正的比例,即=/(+);召回率描述的是預(yù)測(cè)為正的樣本占所有正樣本的比例,即=/(+)。
2)準(zhǔn)確率。準(zhǔn)確率描述的是預(yù)測(cè)為正確的樣本占所有樣本數(shù)的比例,即(+)/(+++)。
3)靈敏度與特異度。靈敏度即為召回率,特異度描述所有真實(shí)的負(fù)樣本中預(yù)測(cè)正確的比例,即/(+)。
4) ROC與AUC。以假正率(false positive rate, FPR)即1—特異度為橫坐標(biāo),以真正率(true positive rate, TPR)即靈敏度為縱坐標(biāo),可繪制受試者工作特性曲線,曲線下面積反映檢測(cè)模型的分類能力,面積越接近于1,性能越好。
5)F1—分?jǐn)?shù)。精確流程與召回率相互制約,為綜合評(píng)價(jià)二元分類結(jié)果,使用F1—分?jǐn)?shù)同時(shí)考慮精確率與召回率,即2/(+)。
筆者使用Python編程語言實(shí)現(xiàn)文中所提出的AEGAN異常檢測(cè)模型,所用版本為Python 3.8,深度學(xué)習(xí)框架采用PyTorch 1.6.0,GPU加速訓(xùn)練使用容量為6 GB的GeForce GTX 1 660。
為驗(yàn)證檢測(cè)模型的有效性及優(yōu)越性,筆者選取與本文方法相關(guān)且具有代表性的3個(gè)異常智能檢測(cè)模型——自編碼器DAE、ALOCC、D作為對(duì)比方法,在相同訓(xùn)練和測(cè)試條件下進(jìn)行LRE異常檢測(cè)。其中,D表示使用RGAN的鑒別器進(jìn)行異常檢測(cè)。
某型液體火箭發(fā)動(dòng)機(jī)異常檢測(cè)結(jié)果見表2,本文所提出檢測(cè)方法AEGAN能達(dá)到96.55%的準(zhǔn)確率,尤其是對(duì)于1 000個(gè)異常事件(負(fù)樣本)的檢測(cè)率達(dá)到98.90%,模型的AUC值也達(dá)到0.991 5,表明在實(shí)際異常檢測(cè)中,對(duì)于不同置信度下的檢測(cè)結(jié)果,AEGAN的性能更好。
表2 某型液體火箭發(fā)動(dòng)機(jī)異常檢測(cè)結(jié)果Tab.2 Anomaly detection results of a LRE
為更加直觀地描述異常檢測(cè)結(jié)果,繪制檢測(cè)結(jié)果分?jǐn)?shù)的分布如圖5所示,該圖展示了模型對(duì)于異常與正常樣本的區(qū)分情況,分布曲線越高、越窄,兩個(gè)分布的中心距離越遠(yuǎn),代表檢測(cè)模型性能越好;繪制ROC曲線如圖6所示,曲線下面積越大、曲線越靠近左上方,代表模型性能愈佳。
圖5 某型液體火箭發(fā)動(dòng)機(jī)異常檢測(cè)結(jié)果分布圖Fig.5 Distribution of a LRE anomaly detection results
圖6 某型液體火箭發(fā)動(dòng)機(jī)異常檢測(cè)結(jié)果ROC曲線圖Fig.6 ROC graph of anomaly detection results for a LRE
圖5和圖6所展示的結(jié)果分布與模型分類性能均能表明,相比于其他異常檢測(cè)模型,AEGAN在LRE異常檢測(cè)中更為有效。
為提升模型在實(shí)際異常檢測(cè)中所獲結(jié)果的可靠性、增加檢測(cè)模型的魯棒性,筆者提出融合檢測(cè)時(shí)刻的前{1, 2, 3, 4}個(gè)樣本的檢測(cè)結(jié)果,綜合判斷該時(shí)刻的健康狀態(tài),如式(12)所示。選取時(shí)間上連續(xù)的1 000個(gè)正樣本和1 000個(gè)負(fù)樣本進(jìn)行異常檢測(cè),結(jié)果見表3,可視化結(jié)果如圖7所示。
表3 鄰域信息聚合的某型液體火箭發(fā)動(dòng)機(jī)異常檢測(cè)結(jié)果Tab.3 Anomaly detection results of a LRE based on neighborhood information aggregation
圖7 不同數(shù)量的鄰域信息聚合后的異常檢測(cè)結(jié)果Fig.7 Anomaly detection results after neighborhood information aggregation with different amounts
表3中模型的檢測(cè)結(jié)果隨著鄰域信息的增加而向好。從圖7中可以看到,聚合鄰域信息使得模型對(duì)LRE健康狀態(tài)的檢測(cè)更加準(zhǔn)確,在該實(shí)驗(yàn)中準(zhǔn)確率最高可達(dá)100%,對(duì)于模型檢測(cè)性能的提升效果顯著。值得注意的是,離線時(shí)已經(jīng)訓(xùn)練好的檢測(cè)模型,在線測(cè)試時(shí)融合鄰域信息只需要在決策級(jí)進(jìn)行結(jié)果的融合,不會(huì)顯著增加時(shí)間成本從而影響檢測(cè)效率。
本研究提出的自編碼式-生成對(duì)抗網(wǎng)絡(luò),僅依靠正常數(shù)據(jù)進(jìn)行訓(xùn)練,在特征級(jí)融合多源數(shù)據(jù),根據(jù)輸入數(shù)據(jù)的重構(gòu)損失和鑒別分?jǐn)?shù),通過核密度估計(jì)確定閾值完成二元決策,實(shí)現(xiàn)對(duì)液體火箭發(fā)動(dòng)機(jī)的智能異常檢測(cè)。某型液體火箭發(fā)動(dòng)機(jī)地面熱試車數(shù)據(jù)分析結(jié)果表明,該方法能進(jìn)行準(zhǔn)確且可靠的LRE異常檢測(cè)。
在下一階段,本研究將繼續(xù)完善該方法以提升訓(xùn)練穩(wěn)定性和訓(xùn)練速度,并開展實(shí)驗(yàn)進(jìn)一步驗(yàn)證其在工程應(yīng)用中的適用性。