吳 奇 儲銀雪 /
(上海交通大學(xué),上海 200240)
基于深度學(xué)習(xí)的航空器異常飛行狀態(tài)識別
吳 奇 儲銀雪 /
(上海交通大學(xué),上海 200240)
飛行設(shè)備快速存取記錄儀(Quick Access Recorder, 以下簡稱QAR)保留了原始航班各類重要飛行參數(shù)在內(nèi)的航行信息,使研究分析航空器實時狀況和保障飛行質(zhì)量成為可能。針對QAR數(shù)據(jù)高維大樣本的特點,在如今大數(shù)據(jù)背景下,除了傳統(tǒng)機理建模分析航空器飛行狀態(tài)外,采用深度學(xué)習(xí)的方式建立基于數(shù)據(jù)驅(qū)動的航空器飛行狀態(tài)識別模型,理論與實用意義兼具。通過對真實QAR飛行數(shù)據(jù)的研究,開發(fā)了基于深度稀疏受限玻爾茲曼機的異常飛行狀態(tài)識別程序。首先利用小波降噪技術(shù)對原始飛行數(shù)據(jù)進(jìn)行預(yù)處理清洗,在一系列典型飛行參數(shù)上提取經(jīng)典時域特征以及小波奇異熵等信息熵特征構(gòu)成特征集。在此基礎(chǔ)上,分別利用經(jīng)典的線性主元分析技術(shù)和深度稀疏玻爾茲曼機對特征集進(jìn)行有效降維,最后采用四折交叉驗證方式,通過高斯過程分類器實現(xiàn)對飛行狀態(tài)的辨識。實驗結(jié)果顯示,基于深度受限玻爾茲曼機-高斯過程分類的飛行狀態(tài)識別具有較高分類準(zhǔn)確性。
飛行狀態(tài)識別;深度學(xué)習(xí);高斯過程
1903年,飛機的問世,為人類開辟了陸地、海洋之外的新邊疆。由此衍生出來的各類航空器除了作為交通工具極大便利了人們的出行外,還發(fā)揮了軍用、民用、商用等諸多用途。航空器大規(guī)模寬領(lǐng)域的普及應(yīng)用,隨之而來的最重要問題便是安全,其中最關(guān)鍵的考量當(dāng)屬如何確保航空器飛行狀態(tài)安全可控(新近事故如2014年3月馬航MH370客機失聯(lián),至今仍是未解之謎)。為此,分析和研究航空器飛行狀況的辨認(rèn)意義重大:不僅是航空器飛行狀態(tài)分析的必要基礎(chǔ),更能為繁忙空域多機(群)任務(wù)調(diào)度與目標(biāo)規(guī)劃、智能故障診斷和維修維護等安全監(jiān)控,以及航空器設(shè)計優(yōu)化與成本控制等方面提供重要有效的參考信息。
可行性上,航空器飛行狀態(tài)的識別目前大體有三種路徑:基于分解重構(gòu)的機理建模,其辨識效果與模型準(zhǔn)確性嚴(yán)格正相關(guān);基于知識經(jīng)驗庫的專家系統(tǒng),即便綜合主客觀分析,其不足在于領(lǐng)域?qū)I(yè)性與人為主觀判定的局限性;本課題采用第三種路徑,即基于數(shù)據(jù)驅(qū)動的信號處理方法,運用真實飛行數(shù)據(jù)進(jìn)行機器自學(xué)習(xí),進(jìn)而捕捉挖掘樣本數(shù)據(jù)內(nèi)在特征與飛行狀態(tài)之間的關(guān)聯(lián),兼具理論與實用意義。
首先在理論研究價值上,研究大數(shù)據(jù)云計算背景下基于數(shù)據(jù)挖掘驅(qū)動的航空器飛行狀態(tài)識別,將打破傳統(tǒng)機理建模和經(jīng)驗知識結(jié)合主觀判定分析飛行事件的套路,有助于建立并完善著眼全流程各環(huán)節(jié)的飛行數(shù)據(jù)分析與結(jié)果導(dǎo)向型飛行安全控制融合的研究體系。另一方面,也將助推理論研究從事后故障診斷研究向超前預(yù)防型預(yù)警風(fēng)控研究發(fā)展,從而更有效確保航空器飛行狀態(tài)的安全可控。
其次在應(yīng)用層面,通過深挖捕捉海量飛行數(shù)據(jù)樣本潛在的特征因子,進(jìn)而用于識別飛行過程的異常狀態(tài),預(yù)防或減少環(huán)境因子或人為因子導(dǎo)致的不安全隱患,等效達(dá)到了安全保障層前置和有效風(fēng)險防范的目標(biāo);進(jìn)一步,基于真實飛行數(shù)據(jù)在線分析平臺的狀況評估體系,呈現(xiàn)了航空器包括氣候狀況、飛行姿態(tài)等多維度全方位的情形再現(xiàn),進(jìn)一步可用于地面實時快速掌握航空器飛行狀態(tài),并在必要時為空中機組提供有力支援,從而最大限度地減少可能發(fā)生的損失。
國內(nèi)外關(guān)于航空器飛行狀態(tài)的研究,大體可劃分為兩大經(jīng)典模式:一是借由濾波分析模型遞推計算出航空器運動學(xué)方程;二是示教訓(xùn)練方式,經(jīng)由對歷史航班相關(guān)特征參數(shù)信息的訓(xùn)練學(xué)習(xí),形成空管領(lǐng)域的專家經(jīng)驗[1]。
1.1 國外飛行狀態(tài)識別研究現(xiàn)狀
國外的研究在濾波模型和機器學(xué)習(xí)兩方面均有涉足。Inseok Hwang等人基于濾波模型設(shè)計混合模型預(yù)測航空器飛行狀態(tài),采用卡爾曼濾波減小了因錯誤預(yù)測引入的誤差,進(jìn)而更有效地捕捉了短時飛行特征[2]。Neogi等人使用隱馬爾科夫模型研究航空器飛行狀態(tài)的變化,結(jié)合隨機混合系統(tǒng)探測飛行狀態(tài)的變化,考慮 了隨機擾動的影響[3-4]。還有學(xué)者采用Swarm模型,引入人工智能模擬類似動物的群體效應(yīng),用以形成沖突解脫方案[5-6]。2012年,WANG Qing等人基于QAR(Quick Accesses Recorder)數(shù)據(jù),提出了EKF-MBF(the Extended Kalman Filterassociated with Modified Bryson-Fraziersmoother)混合算法,改善了相關(guān)估計指標(biāo)精度[7]。C. EdwardLana等人則采用QAR數(shù)據(jù)分析了高緯度機場降落時的飛行特征,為潛在安全問題提供分析幫助[8]。B.Jia等人引入BF-PSO(Bacterial Foraging-Particle Swarm Optimization)算法來優(yōu)化KFCM的參數(shù)已達(dá)到辨識動態(tài)與靜態(tài)模式下的飛行狀態(tài)[9]。
1.2 國內(nèi)飛行狀態(tài)識別研究現(xiàn)狀
國內(nèi)學(xué)者則主要在濾波分析模型聚焦較多且通常結(jié)合了空管的專家經(jīng)驗[10]。張友民等學(xué)者為估計高維航空器姿態(tài),采取了非線性濾波模型[11]。耿建中等為確保準(zhǔn)確可靠辨識航空器狀況的同時降低運行成本,引入了無跡卡爾曼濾波(Unscented Kalman Filterm)的濾波方法。高原等專門針對飛行狀況規(guī)則辨認(rèn)與提取的課題,以典型參數(shù)為研究對象,提出新型量子遺傳算法以期組合尋優(yōu),歸納了飛行狀況識別的所謂產(chǎn)生式法則[12]。2013年,王潔寧等將終端區(qū)數(shù)據(jù)一致化,并利用歷史航行信息特征訓(xùn)練隱馬爾科夫模型,搭建了時序辨認(rèn)模型[13]。2015年,李軍亮等人預(yù)先將對待識別的飛行狀態(tài)經(jīng)由Elman網(wǎng)絡(luò)預(yù)先分類,在某款直升機的辨識應(yīng)用中取得成功[14]。2016年,熊邦書等人提出基于支持向量機(Support Vector Machine,SVM)的直升機飛行狀態(tài)辨認(rèn)方法,在數(shù)據(jù)集較少情況下明顯提升了分類正確率[15]。趙元棣、孫禾為準(zhǔn)確高效預(yù)測航空器飛行狀態(tài),提出了HMM-BP混合模型,通過HMM模型對航空器進(jìn)行時序建模,再利用BP神經(jīng)網(wǎng)絡(luò)對航空器飛行狀態(tài)進(jìn)行推理預(yù)測,計算快效率高[16]。谷潤平等選用新型數(shù)據(jù)融合算法和擴展卡爾曼濾波算法分析飛行參數(shù),提高了判別預(yù)測的準(zhǔn)確度[17]。
航空器飛行狀態(tài)的識別,是一類典型的模式識別問題,核心在于透過元始一般性的數(shù)據(jù)信號,發(fā)掘其內(nèi)在獨特的關(guān)聯(lián),從而將一般的飛行信號轉(zhuǎn)化為可識別的有特征信號。在完成前述對一手?jǐn)?shù)據(jù)降噪處理后,緊接著的難題便是對特征的表示與提取,試圖將原先隸屬于相異類別的典型參數(shù)進(jìn)行提取后轉(zhuǎn)化為或有物理解釋意義或有識別意義的數(shù)據(jù),更好地強化表征航空器所處的狀況。特征工程的方式層出不窮,經(jīng)典手段諸如均值、方差和均方根,在展示信號(也適用時間序列)的幅值特征及不同類別參數(shù)的差異性,已由早期統(tǒng)計學(xué)應(yīng)用推廣到各類數(shù)據(jù)分析領(lǐng)域。然而,僅僅使用傳統(tǒng)時域的特征分析技術(shù)已無法為高維度強耦合的繁雜飛行數(shù)據(jù)分析提供強有力支撐,難以準(zhǔn)確應(yīng)對非線性或非平穩(wěn)的信號特征。為滿足人們對更高識別準(zhǔn)確率的迫切現(xiàn)實需求,發(fā)展運用新的特征提取技術(shù)是一大廣闊的舞臺。本節(jié)除簡介經(jīng)典時域內(nèi)特征提取技術(shù)外,還將熵量特征融合信號變換技術(shù)創(chuàng)新特征工程,引入自回歸滑動平均系數(shù)熵(ARMAE)及小波奇異熵(WSE),以構(gòu)建更精確反映原始數(shù)據(jù)潛在關(guān)聯(lián)的特征集。
2.1 時域特征提取技術(shù)
特征是任何學(xué)習(xí)型算法的原材料。本小節(jié)引入三個常用的時域的統(tǒng)計特征量:均值(mean)、方差(variance/deviation)、均方根值(RMS, root means quare)。
對于時間序列進(jìn)行一維數(shù)據(jù)分析時,均值是最常用以描述飛行數(shù)據(jù)的特征量。這里均值不是幾何平均值,指的是算數(shù)平均值,計算方法見式(1)(xi為樣本內(nèi)數(shù)據(jù)值,Pxi為xi出現(xiàn)的幾率),常用以表征原始波形的幅值特征。若將原始信號視作不同頻率信號之疊加,此時,均值的物理意義表現(xiàn)為信號中直流分量的大小。
進(jìn)一步,為了反映原始全體單個樣本與均值的關(guān)系(離散程度),引入方差(用variance或deviation表示),計算方法見式(2)(其中,xi為樣本內(nèi)數(shù)據(jù)值,Pxi為xi出現(xiàn)的幾率)。由公式易知,方差是一個離差量,描述的是時間序列的波動范圍,而且是基于均值的分散特征:計算時扣除了均值這一表征直流分量的參考基準(zhǔn),故方差大小又表征了信號交流分量的強弱,也即交流信號的平均功率。
融合考慮交直流分量的功率,我們還可以引進(jìn)均方根值,用RMS(Root Mean Square)表示,計算公式見(3),也稱有效值。均方根的平方即均方值,物理意義為信號的平均功率,這里的平均功率即信號的直流分量功率與交流分量功率之和。
2.2 自回歸滑動平均熵
本小節(jié)從時域內(nèi)的自回歸滑動平均模型出發(fā),引入熵概念,定義自回歸滑動平均熵,用以衡量反映飛行數(shù)據(jù)的信息量及體現(xiàn)原始信號在時間維度上的隨機不確定性。
從理論視角來看,自回歸滑動平均模型(Auto-Regressiveand Moving Average Model, 簡稱ARMA)集自回歸模型(AR)和滑動平均模型(MA)之大成,是以待定系數(shù)標(biāo)準(zhǔn)模型應(yīng)對隨機過程的經(jīng)典手段:將輸入信號視為隨機變量,從而,信號在時間維度上的延展反映為隨機變量所具有的依存關(guān)系。該模型是差分多項式混合模型,綜合考慮受因素演化的聯(lián)動影響效應(yīng)和自身變動規(guī)律的影響效應(yīng),可用于消除序列的線性依賴從而去除序列的自相關(guān)性;同時也是長期追蹤歷史資料并加以回歸預(yù)測的利器,如可用于國家或省級內(nèi)城鄉(xiāng)居民的收入差距預(yù)測的研究、用于市場規(guī)模及銷量預(yù)測的零售消費業(yè)研究,等等。
我們在自動控制原理里學(xué)習(xí)過,一個零均值的平穩(wěn)序列,其在外界激勵下的響應(yīng)(在t時刻記為Xt)不僅與當(dāng)前和過往的響應(yīng)值相關(guān),還與激勵前外在的擾動值密切聯(lián)系,滿足這樣規(guī)律的可稱之為自回歸移動平均系統(tǒng)。在數(shù)學(xué)意義上建模即稱樣本集在時間維度上服從(p,q)階自回歸滑動平均混合模型,記為ARMA(p,q):
其中,{at}為白噪聲序列。特別地,p=0時模型退化為MA(q);q=0時模型即為AR(p)。
由上述公式易知:定階,即確定上述p,q值,是搭建自回歸滑動平均模型成功與否的關(guān)鍵?;舅枷肴菀桌斫猓ㄟ^逐步增加p,q值直到階數(shù)增加而殘差平方和無法明顯下降為止。本文采用先預(yù)估(p,q)范圍,而后通過模型擬合度量AIC極小準(zhǔn)則來定階。AIC[18]計算公式如(5)所示,V為模型殘差方差,N為序列的長度。
經(jīng)由上述步驟,ARMA模型參數(shù)業(yè)已確定,容易發(fā)現(xiàn),應(yīng)用于高維的飛行參數(shù)數(shù)據(jù)集時,各參數(shù)在時間維度上適用的ARMA模型系數(shù)的長度不同,不便于后續(xù)特征處理;同時,儀表盤參數(shù)在時間維度上呈現(xiàn)出的復(fù)雜性某種意義上可用隨機程度加以描述,因為序列增長隨之衍生出新序列,這種模式的演化正是系統(tǒng)復(fù)雜性的反映。能否考慮變化混亂度的因素呢?很幸運,可以用德國熱力學(xué)家R.Clausius提出的熵(Entropy)評價。回溯科學(xué)發(fā)展史,熵概念的問世,不僅標(biāo)志著衡量系統(tǒng)復(fù)雜度的全新思路誕生,更是有廣闊里程碑意義的:早已延拓至熱力學(xué)外的信息學(xué)、數(shù)理應(yīng)用和生命科學(xué)等領(lǐng)域。譬如,1948年Shannon第一次給出信息模型的信息熵,定量地解讀了信息這個抽象的觀點。本文使用的自回歸滑動平均熵(Auto Regressive Moving Average Entropy, ARMAE)源自于自回歸滑動平均模型[19],計算方式如下:
如此一來,借由通信原理的信息熵的思路:信息量大小反映于基本信息符號重復(fù)出現(xiàn)頻次的概率,結(jié)合消除序列自相關(guān)性的自回歸滑動平均模型,定義的體現(xiàn)飛行參數(shù)隨機不確定性的復(fù)合熵量ARMAE,將為后續(xù)的飛行狀態(tài)識別提供更堅實可靠的保障。
2.3 小波奇異熵
前述的特征提取著眼于人們?nèi)粘A?xí)慣的時域,然而,頻域分析是上世紀(jì)以來信號分析更為主流的分析方法,如傅里葉變換。不過,該方法也幾乎全然摒棄了時域的信息。于是,由傅里葉分析衍生進(jìn)化出的小波分析,成為了具備優(yōu)良時頻局部化性能的時-頻分析新方法。本小節(jié)將描述序列混亂度的奇異熵集成小波分析思想,引入小波奇異熵(Wavelet Singular Entropy, 簡稱WSE)刻畫非線性強噪聲奇異能量分散的統(tǒng)計特征,以綜合更多動態(tài)特征提高對噪聲的免疫力及狀態(tài)識別的準(zhǔn)確率。
小波變換的原理方法已在2.1節(jié)提及,此處不做贅述。降噪飛行數(shù)據(jù)經(jīng)小波變換后再經(jīng)由內(nèi)積公式即可得到小波系數(shù)陣A,從而在多頻率多尺度下分解原始信息為主要逼近分量和細(xì)節(jié)微調(diào)分量,等效于反復(fù)組合運用高低通濾波器,兼?zhèn)淞藛我粫r域或頻域分析法的優(yōu)勢。
數(shù)學(xué)的美在于簡潔,時頻的直觀分布還不夠,大數(shù)據(jù)量屬性是準(zhǔn)確進(jìn)行模式識別的掣肘。線性代數(shù)中的奇異值分解理論,能將秩為k的任何階次的矩陣A按奇異值分解為k個單秩子陣的加總(詳見公式(8)),達(dá)到特征值對角化呈現(xiàn)之效用,這樣一來,奇異對角陣實質(zhì)上表征了待分解陣A的最小模態(tài)特征。
其中,U、VT均為正交矩陣,Λ上對角元素λi(i=1,2,…,r)即為A陣的奇異特征值。
小波系數(shù)陣A通過SVD[24]分解后所得的對角陣,簡潔地刻畫了飛行數(shù)據(jù)的時頻分布特性。為進(jìn)一步度量分布的混亂程度,結(jié)合2.2節(jié)的介紹,將奇異特征值用熵進(jìn)行表示。奇異熵事實上是一種信息熵。我們知道,香農(nóng)信息熵理論奠定了通信原理的基石。通俗地借由生物學(xué)概念不難理解,在基本信息要素構(gòu)成的生態(tài)系統(tǒng)中,基本信息越多越難以加以定性,因為其出現(xiàn)的頻次不會完全一致,即出現(xiàn)了混亂隨機性;由此出發(fā),以概率視角刻畫這種隨機不確定性便十分自然了:考慮小波變換后系數(shù)陣A的奇異值,依信息熵原理計量得小波奇異熵如下,參數(shù)k表示非零特征值的數(shù)目。
綜上,小波奇異熵的計算過程如圖1所示。
3.1 深度置信網(wǎng)絡(luò)
與傳統(tǒng)(以主元分析為經(jīng)典)樣本數(shù)據(jù)特征分析程式相比,深度置信網(wǎng)絡(luò)是個概率發(fā)生器,不具備一般人工特征提取時不可避免的主觀不確定性,降低了對專家系統(tǒng)或稱經(jīng)驗知識的密切依賴從而具備自動提取信號特征的自適應(yīng)性;此外,該模型非常適合非線性非低維的飛行數(shù)據(jù)處理,這在后續(xù)的實驗驗證中可以得到完美體現(xiàn)。DBN模型由單層反向傳播網(wǎng)絡(luò)(BP,Back-propagation)和幾層限制玻爾茲曼機(RBM)構(gòu)成[25],結(jié)構(gòu)如圖2所示。
深度置信網(wǎng)絡(luò)的模型搭建過程主要分為兩大塊:其一是訓(xùn)練若干層的RBM,采用無監(jiān)督的方式,從而保證特征向量向其他空間投射時仍能保留盡可能多的能量[25];其二就是有監(jiān)督地借由頂層的反向傳播網(wǎng)絡(luò)訓(xùn)練優(yōu)化網(wǎng)絡(luò)全局,從而微調(diào)網(wǎng)絡(luò)模型以獲取深度置信網(wǎng)絡(luò)的最優(yōu)參數(shù)。
由上面的介紹,不難獲知:受限玻爾茲曼機(RBM)是DBN中的關(guān)鍵基本環(huán)節(jié)。作為玻爾茲曼機的一種特殊形式[26],受限玻爾茲曼機由可視層和隱含層構(gòu)成,底層靠n個可視節(jié)點排列而成,頂層由m個不可見節(jié)點堆成故稱為隱含層并用以提取特征。受限玻爾茲曼機的網(wǎng)絡(luò)結(jié)構(gòu)可用圖3展示。
定義受限玻爾茲曼機的網(wǎng)絡(luò)能量可用下式:
其中,b=(b1,b2,…,bn)表征的是底層可視節(jié)點的轉(zhuǎn)移量,c=(c1,c2,…,cm)表示隱含層的隱藏節(jié)點偏移量,wn×m則是溝通隱含節(jié)點與可視節(jié)點的權(quán)重矩陣。
采用概率發(fā)生的方式有效防止了人為主觀臆斷。受限玻爾茲曼機網(wǎng)絡(luò)實質(zhì)上是幾率模型:對于輸入數(shù)據(jù)v=(v1,v2,…,vn),RBM網(wǎng)絡(luò)充當(dāng)了中繼處理再生器,輸出對應(yīng)的隱含特征向量h=(h1,h2,…,hm),從而使得聯(lián)合概率p(v,h)極大化。其中,p(v,h)滿足式(13)。
進(jìn)一步詳解:可視意即一個觀察入口,從已知的底層可視節(jié)點獲取隱含層的節(jié)點值,有公式(14)作為橋梁;為達(dá)到不斷優(yōu)化不斷微調(diào),沒有反饋不行,即上述的逆向操作也需要可行:由已知的頂層節(jié)點亦可獲取底層可視節(jié)點的值,公式見(15)。
如前所述,深度置信網(wǎng)絡(luò)是將若干層受限玻爾茲曼機預(yù)訓(xùn)練的模型結(jié)合反向傳播網(wǎng)絡(luò)監(jiān)督下進(jìn)行微調(diào)的網(wǎng)絡(luò)模型,從而提高全模型的計算性能。以下將整套模型的實施步驟分為預(yù)訓(xùn)練環(huán)節(jié)和微調(diào)環(huán)節(jié)敘述。
首先,預(yù)訓(xùn)練環(huán)節(jié)指的是無監(jiān)督式地自下而上的采用若干層RBM自訓(xùn)練方法獲取穩(wěn)定的網(wǎng)絡(luò)結(jié)構(gòu)。這一模型參數(shù)的獲取可借由極大化RBM網(wǎng)絡(luò)訓(xùn)練集的對數(shù)似然函數(shù)獲取,見式(16)。
對訓(xùn)練樣本運用Gibbs采樣,可有下面的對數(shù)似然的梯度近似表達(dá)式。
不過針對飛行數(shù)據(jù)這樣的高維數(shù)據(jù)時,Gibbs采樣次數(shù)過多使得整個訓(xùn)練過程效率難以接受,需要保證計算精度的情況下提高計算速度。Hinton于2002年創(chuàng)立的對比散度(Contrastive Divergence, CD)是一種快速學(xué)習(xí)方法:通過CD法僅需k步(通常情況下僅需一步),下面展示了其參數(shù)的更新公式。
其中,ε是學(xué)習(xí)速率,<>recon為樣本分布的期望。
現(xiàn)在介紹微調(diào)階段。作為一個有監(jiān)督的分類器,反向傳播網(wǎng)絡(luò)(BP)在整套深度置信網(wǎng)絡(luò)中起著微調(diào)全體結(jié)構(gòu)從而達(dá)到全局最優(yōu)的作用。這一細(xì)調(diào)過程依靠的是誤差信號的逆?zhèn)鞑ヒ哉{(diào)整若干層前饋環(huán)節(jié)。訓(xùn)練數(shù)據(jù)逐層傳播到頂層獲取輸出過程中,每個神經(jīng)元均有一個激活函數(shù),通常為非線性的sigmoid函數(shù):
其中,xi稱為神經(jīng)元i的激活值,yi即為輸出。
將網(wǎng)絡(luò)輸出值與標(biāo)準(zhǔn)值作差即得誤差信號,再將這一反饋信號從輸出層向輸入層逐層傳播以對網(wǎng)絡(luò)參數(shù)尋優(yōu)即可。
3.2 稀疏受限玻爾茲曼機
生物醫(yī)學(xué)的臨床研究成果啟發(fā)我們:人腦處置信息的過程并不是滿倉全負(fù)荷行為,通常僅少數(shù)的神經(jīng)元被激發(fā)。這一規(guī)律被稱為稀疏編碼的算法用以模擬大腦編碼歷程[27]。那么,仍然從概率視角,限制整套網(wǎng)絡(luò)的激活概率能否提高網(wǎng)絡(luò)對噪聲干擾的魯棒性呢?經(jīng)過稀疏受限玻爾茲曼機(SRBM)即可。
需要首先說明的是,由于本文實驗測試采用的是真實飛行數(shù)據(jù),可視層輸入必須是真實數(shù)據(jù)不是布爾型二值數(shù)據(jù),故應(yīng)建立高斯受限玻爾茲曼機模型[28],此時確定狀態(tài)下RBM網(wǎng)絡(luò)的能量定義為:
上式中的參量與前面RBM能量式的定義相同,σ在實際應(yīng)用中設(shè)定為1較常見[28]。以此類推,我們?nèi)匀豢梢源罱梢妼庸?jié)點與隱含層節(jié)點的橋梁:
此時,數(shù)值上,隱含節(jié)點表現(xiàn)為稀疏性,故而還得在目標(biāo)函數(shù)上疊加一個正則化項以確保隱含節(jié)點數(shù)值維持低激活率。具體說來,對于擁有m個樣本的數(shù)組{v(1),…,v(m)},優(yōu)化目標(biāo)見式子(27)。
其中,λ表示正則化常數(shù),隱含節(jié)點的稀疏性由稀疏常數(shù)p把關(guān)控制。
這樣一來,經(jīng)過預(yù)訓(xùn)練過程后,得到的便是SRBM參數(shù)的值,再通過類似標(biāo)準(zhǔn)深度置信網(wǎng)絡(luò)模型的微調(diào)技術(shù)手段,便可有效獲取SRBM模型的最優(yōu)參數(shù),從而學(xué)習(xí)到不同類別的特征差異。下一部分,將結(jié)合實際應(yīng)用展示SRBM的強大功能。
定義一個二分類問題,首先訓(xùn)練集{(xi,yi)|i=1,…,m},xi為輸入向量,X=[x1,…,xm]T,yi∈{-1,+1},yi表示兩種輸出標(biāo)簽的類別。已知訓(xùn)練集,則測試集x*屬于+1類的概率可表示為:
其中σ(z)=1/(1+e^(-z)),易知此函數(shù)范圍為(0,1);一般當(dāng)π(x)>0.5,可認(rèn)為測試樣本x*屬于+1類,否則應(yīng)劃分至另一類。當(dāng)測試樣本x*為待預(yù)測樣本時,預(yù)測一般分兩步:計算f(x*)的分布及其概率預(yù)測值:
以上兩式計算前提在于似然函數(shù)是高斯函數(shù),也就要求在回歸情況下方可行。當(dāng)分類問題中,似然函數(shù)并非高斯函數(shù),上述兩式不能精確計算,只能近似這兩個積分,這時我們可用高斯分布近似f*的后驗分布:
上式的均值、方差如下(式中,k*=[k(x*,x*),…,k(xm,x*)T為測試集的數(shù)據(jù)與訓(xùn)練集的數(shù)據(jù)的協(xié)方差)
這樣一來,便可用近似解分析非高斯分布以最佳近似高斯分布,即對于測試集而言,其高斯預(yù)測概率值的解可表示為:
至此我們基本闡釋了高斯過程分類的基本原理,下一小節(jié)希望將其應(yīng)用到前述降維后的典型飛行參數(shù)的特征集中,以完成航空器飛行狀態(tài)模型的建立與測試。
5.1 實驗數(shù)據(jù)
自1997年起,中國民航總局(CAAC)依據(jù)中國民航適航指令要求所有國內(nèi)運輸類飛機強制安裝飛行設(shè)備記錄儀器(Quick Access Recorder,簡稱QAR)。也正是因為QAR記錄著航班包括飛行位置、操作控制等諸多性能方面的信息,分析研究QAR數(shù)據(jù)將有助于提高飛行安全和監(jiān)測飛行品質(zhì)。然而對于各大航空運輸公司而言,QAR飛行數(shù)據(jù)屬于核心商業(yè)機密,故無論國內(nèi)還是國外,基于QAR飛行數(shù)據(jù)的研究相對較少。本論文實驗數(shù)據(jù)源于國家級基金項目,實驗數(shù)據(jù)為真實飛行數(shù)據(jù),是同一家航空公司同一機型(波音747)的同一航線(浦東-白云)的兩次不同天氣狀況(能見度差異較大)的QAR飛行數(shù)據(jù)。選取的飛行任務(wù)為飛行中最危險也即事故發(fā)生率最高的進(jìn)近著陸階段[20],每組數(shù)據(jù)共3 000個樣本點。驗證平臺選取64位Windows10操作系統(tǒng),并利用編程軟件MatlabR2014a搭建實驗環(huán)境,如圖4所示。
考慮到最終搭建的飛行狀態(tài)識別不僅限于分析還要能進(jìn)一步用于實時惡劣狀態(tài)預(yù)警,因此模型判斷時間應(yīng)盡可能縮短,故本文選取最能反映航空器飛行姿態(tài)的典型飛行參數(shù)[21]進(jìn)行特征提取并建模,初始的典型飛參集列表詳見表1。接下來,本文將運用數(shù)據(jù)挖掘即機器學(xué)習(xí)的手段通過QAR數(shù)據(jù)搭建航空器飛行狀態(tài)的識別流程。
5.2 典型飛參特征集的降維
5.2.1主元分析線性降維
在5.1節(jié)我們完成了面向典型飛參的特征集構(gòu)建,本小節(jié)中我們利用本文前述的理論知識,將主元分析法應(yīng)用于典型飛參特征集的降維。如前所述,PCA主要流程為將中心化后的樣本求取其協(xié)方差,獲得降維矩陣后映射即得降維數(shù)據(jù)。這里,我們?yōu)榱酥庇^展示降維后效果,利用主元分析將5.1節(jié)中得到的包含時域、ARMAE、WSE特征在內(nèi)的120×72維典型飛參特征集(兩種天氣狀態(tài)下共計120組,每組72維特征),降維到3維空間使其可視化。
表1 建模所選取的典型飛行參數(shù)集
由圖5可見,對于典型飛行參數(shù)特征集通過PCA降至3維后,其特征點散落在三維空間各處;兩種相異天氣狀態(tài)類別的特征點互相交織,很多無法劃分。由于PCA是線性降維算法,雖對于原始信號一定程度上保留了更多能量卻無法提取非線性的重要特征。為此,我們接下來看看非線性數(shù)據(jù)降維算法SRBM處理的效果。
5.2.2稀疏受限玻爾茲曼機降維
如前所述,QAR數(shù)據(jù)屬于各大航空公司的商業(yè)數(shù)據(jù),由于數(shù)據(jù)來源的限制,無法獲取非常多的樣本訓(xùn)練模型,因此除了需要盡量減小噪聲對模型的干擾影響,還需要防止模型學(xué)習(xí)中容易發(fā)生的過擬合情況。本文前面幾節(jié)專門敘述了SRBM在這方面的強大優(yōu)勢:透過限制玻爾茲曼機(RBM)模型正則化隱含層里的隱藏點,便可有效對隱藏點概率加以限制從而達(dá)到稀疏的目的。下面將運用SRBM算法對5.1節(jié)得到的典型飛參特征集作降維。由于QAR記錄的參數(shù)是真實的航行狀態(tài),故不必對真實數(shù)據(jù)作二值化的脫敏處理,但要在降維前對典型飛參特征集的樣本作規(guī)范化處理。
所謂歸一化,即將待處理數(shù)據(jù)限制在擬定的范圍內(nèi),比如將樣本特征歸一化到[0,1]間,表征其在統(tǒng)計意義上的概率分布。這樣做的好處在于,一方面便于后續(xù)數(shù)據(jù)處理使本不具備可比性的數(shù)據(jù)具備相對可比性,同時由于是等比例縮放,也保留了原數(shù)據(jù)間相對大小關(guān)系;另一方面當(dāng)然也提升算法收斂速度以更好滿足實時要求,因為這樣處理避免了數(shù)值計算中的復(fù)雜度。本節(jié)采用的歸一化包含樣本中心化和去量綱處理兩步(需要說明的是,Matlab中僅使用自帶normalize函數(shù)即可完成歸一化操作)。
首先是數(shù)值中心化,即使數(shù)據(jù)集的均值歸零以便于后續(xù)降維算法處理:
第二步便是去量綱,即將數(shù)據(jù)的方差切換為1,公式如下:
與PCA降維輸入的樣本數(shù)據(jù)相同,我們已提取時域、ARMAE、WSE等特征在內(nèi)的典型飛參特征集,共計正常天氣狀態(tài)60×72維特征集數(shù)據(jù)、異常天氣狀態(tài)60×72維特征集數(shù)據(jù)。完成前述歸一化操作后,第二步就是設(shè)定SRBM的參數(shù),此處初始化SRBM網(wǎng)絡(luò)選擇以正態(tài)隨機分布,閾值初始化為0;最大迭代次數(shù)設(shè)定為100;sparsity Variance設(shè)定為0.1;稀疏度sparsity Target設(shè)定為0.02;稀疏代價sparsity Cost設(shè)定為3;參數(shù)表現(xiàn)模式選擇為“reconstruction”。最后,整套網(wǎng)絡(luò)通過將SRBM結(jié)構(gòu)與反向傳播網(wǎng)絡(luò)BP相結(jié)合從而達(dá)成有監(jiān)督降維,提高了網(wǎng)絡(luò)的全局性能。這是由于SRBM網(wǎng)絡(luò)學(xué)到的為一般化普適的概念化特征,僅能保障各層內(nèi)特征映射局部最優(yōu)卻不能整體最優(yōu),因此在頂層引入BP有監(jiān)督訓(xùn)練整個網(wǎng)絡(luò),可將誤差信息反饋給SRBM層從而細(xì)調(diào)整個網(wǎng)絡(luò)的模型參數(shù)以達(dá)成不同類別天氣狀態(tài)的特征數(shù)據(jù)降維的差異化。使用BP網(wǎng)絡(luò)在matlab中只需要調(diào)用自帶的backpropagation函數(shù)即可。
考慮到輸入特征的維數(shù),本文SRBM選擇3層較為適宜,即從72維先降維到30維,再降維到3維即可可視化通過SRBM降至3維的典型飛行參數(shù)特征集,如圖6所示。
由圖6可見,總體而言,SRBM降維得到的不同類別的典型飛參3維特征可較有效地達(dá)成一定程度的聚合,盡管仍有少量不同類別的特征點出現(xiàn)了重合,但相比線性PCA降維而言,降維效果獲得了較大的提升。下一節(jié)將進(jìn)一步通過機器學(xué)習(xí)分類器的方法展示該降維提取特征對于飛行狀態(tài)識別的有效性。
5.3 基于DSRBM-GP的航空器飛行狀態(tài)識別
本研究的目標(biāo)是利用機器學(xué)習(xí)的方式建立航空器的飛行狀況辨認(rèn)識別模型,是一類典型的模式識別問題,涵蓋原始預(yù)處理的數(shù)據(jù)清洗、特征提取的特征工程、特征降維和建立分類器一系列流程。依據(jù)前述的高斯分類器原理,可以建立如下的基于高斯過程分類的飛行狀態(tài)識別模型。
第一步,分別從經(jīng)過PCA和SRBM降維后的特征集中選擇適量的樣本(訓(xùn)練集大小后文交叉驗證時說明)作為高斯分類器的訓(xùn)練輸入。依據(jù)本文前述理論,將標(biāo)記為正常天氣狀態(tài)(y=+1)的特征集作為一類,標(biāo)記為異常天氣狀態(tài)(y=-1)的特征集作為另一類,初始化協(xié)方差矩陣,利用拉普拉斯近似法獲取協(xié)方差函數(shù)的最后超參數(shù)hyp1;
第二步,將待預(yù)測判定的樣本數(shù)據(jù)輸入對應(yīng)于hyp1的高斯過程分類器,并依據(jù)式(29)獲取預(yù)測樣本數(shù)據(jù)劃分為+1類的預(yù)測概率。此時,若預(yù)測概率值大于0.5,則認(rèn)定該樣本所屬的飛行天氣狀態(tài)為正常;否則,認(rèn)定所處的天氣狀態(tài)為糟糕。
為了驗證所建立的飛行狀態(tài)識別模型,需要將上述預(yù)測判定的類別與實際標(biāo)簽比對從而確定模型的識別準(zhǔn)確率。本研究的問題是二分類問題,容易定義識別準(zhǔn)確率公式如下:
為對比經(jīng)PCA降維和SRBM降維后分類的效果,本文采用4折交叉驗證,即將經(jīng)特征降維后的全體特征集樣本數(shù)據(jù)隨機等分成4組,其中3組作為模型的訓(xùn)練集訓(xùn)練基于高斯過程的狀態(tài)識別模型以確定高斯核參數(shù),剩下1組作為測試集檢驗識別模型準(zhǔn)確率;最后對4次交叉驗證的準(zhǔn)確率取平均值,更能代表該模型的準(zhǔn)確性。圖7展示了兩種降維算法在高斯過程分類下的四折交叉驗證結(jié)果,其中SRBM-GP分類準(zhǔn)確率高達(dá)83.33%,而PCA-GP分類準(zhǔn)確率僅為62.5%,容易得知經(jīng)過SRBM降維提取的三維特征擁有較高的分類正確率。
進(jìn)一步,為了更直觀展示經(jīng)過兩種降維算法降維后在高斯過程分類器下的分類結(jié)果,借助兩種降維模型提取有效兩維特征輸入高斯過程分類器,可在二維等高斯概率線上展現(xiàn)各個測試點的分類結(jié)果。如圖8~9所示,容易更直觀地比對出:SRBM-GP算法的分類效果是遠(yuǎn)高于PCA-GP算法的,與上面的交叉驗證結(jié)果相符,驗證了本文提出算法的有效性。
本文圍繞航空器飛行狀態(tài)識別的目標(biāo)建立了基于高斯過程分類器的識別算法。為驗證模型有效性,本文考慮到樣本數(shù)量,采用了四折交叉驗證取平均值作為模型分類正確性的標(biāo)準(zhǔn),并將分類結(jié)果進(jìn)一步作了二維可視化呈現(xiàn),比對了經(jīng)過主元分析和稀疏受限玻爾茲曼機降維后的特征,從而驗證了本文提出的基于深度稀疏玻爾茲曼機降維算法在高斯過程分類器下的分類正確性。
[1] 孫禾.航空器飛行狀態(tài)預(yù)測方法研究[D].天津:中國民航大學(xué),2014.
[2] Inseok Hwang, Jesse Hwang, Claire Tomlin. Flight-Mode-Based Aircraft Conflict Detection using a Residual-Mean Interacting Multiple Model Algorithm[C]// AIAA Guidance, Navigation and Control Conference and Exhibit, August 11-14, 2003.
[3] Natasha A. Neogi, Asal Naseri. Using hidden markov models to detect mode changes in aircraft flight data for conflict resolution[C]// IEEE International Conference on Systems, Man, and Cybernetics, Taipei, Taiwan, October 8-11, 2006.
[4] Asal Naseri, Natasha A. Neogi. Stochastic hybrid models with applications to air traffic management[C]// AIAA Guidance, Navigation and Control Conference and Exhibit, August 20-23, 2007.
[5] E.Ronchieri,L.Pollini,M. Innocenti. Decentralized Control of a Swarm of Unmanned Aerial Vehicles[C]// AIAA Guidance, Navigation, and Control Conference and Exhibit, South Carolina, August 20-23, 2007.
[6] Erik de Vries, Kamesh Subbarao. Cooperative Control of Swarms of Unmanned Aerial Vehicles[C]// 49th AIAA Aerospace Sciences Meeting including the New Horizons Forum and Aerospace Exposition, Florida, January 4-7, 2011.
[7] Qing WANG, Kaiyuan WU, Tianjiao ZHANG, Yi’nan KONG, Weiqi QIAN. Aerodynamic Modeling and Parameter Estimation from QAR Data of an Airplane Approaching a High-altitude Airport[J].Chinese Journal of Aeronautics. 2012, 25(3): 361-371.
[8] C. Edward LAN, Kaiyuan WU, Jiang YU. Flight Characteristics Analysis Based on QAR Data of a Jet Transport During Landing at a High-altitude Airport[J]. Chinese Journal of Aeronautics. 2012, 25(1): 13-24.
[9] B. Jia, C.F. Wei, J.F. Mao, R. Law, S. Fu, Q. Wu. Identification of flight state under different simulator modes using improved diffusion maps[J]. Optik—International Journal for Light and Electron Optics. 2016, 127(9): 3905-3911.
[10] 耿建中,姚海林.基于UKF的飛機飛行狀態(tài)估計[J]. 系統(tǒng)仿真技術(shù)及其應(yīng)用, 2008, 10: 56-59.
[11] 張友民,張洪才,戴冠中等.非線性濾波方法及其在飛行狀態(tài)及參數(shù)估計中的應(yīng)用[J]. 航空學(xué)報. 1994, 15(05): 620-626.
[12] 高原,倪世宏,王彥鴻等.一種基于改進(jìn)量子遺傳算法的飛行狀態(tài)規(guī)則提取方法[J]. 電光與控制, 2011, 18(1): 28-31.
[13] 王潔寧,孫禾,趙元棣. 面向終端區(qū)航空器飛行狀態(tài)識別的HMM方法[J]. 航空計算技術(shù),2013,02:1-5.
[14] 李軍亮,胡國才,韓維,柳文林.基于Elman網(wǎng)絡(luò)的某型直升機飛行狀態(tài)識別[J]. 火力與指揮控制,2015,12:57-60.
[15] 劉雨. 基于SVM的直升機飛行狀態(tài)識別方法及其應(yīng)用研究[D].南昌:南昌航空大學(xué),2016.
[16] 趙元棣,孫禾. 航空器飛行狀態(tài)預(yù)測的混合模型研究[J].飛行力學(xué),2016,04:81-85+89.
[17] 谷潤平,黃磊,趙向領(lǐng). QAR數(shù)據(jù)的數(shù)據(jù)融合算法[J]. 計算機系統(tǒng)應(yīng)用,2016,01:136-140.
[18] H Bozdogan. Model selection and Akaike’s information criterion (AIC): The general theory and its analytical extensions[J]. Psychometrika.1987, 52(3), 345-370.
[19] Box,G.E., Jenkins,G.M., Reinsel,G.C. Time series analysis: forecasting and control[M]. John Wiley & Sons, 2011.
[20] Verwey W B, Veltman H A, Detecting short periods of elevated workload: A comparison of nine workload assessment techniques[J]. Journal of experiment psychology, 1996, 2(3), pp 270-285.
[21] B. Jia, C.F. Wei, J.F. Mao, R. Law, S. Fu, Q. Wu. Identification of flight state under different simulator modes using improved diffusion maps[J]. Optik—International Journal for Light and Electron Optics. 2016, 127(9): 3905-3911.
[22] Hawkins, F.H., Human Factors in Flight[M]. 2nd edn. Ashgate. Brookfield, VT ,1993.
[23] Globerson A, Chechik G, Pereira F, et al. Euclidean embedding of co-occurrence data[J]. Journal of Machine Learning Research, 2007, 8(10): 2265-2295.
[24] 吳春國,梁艷春,孫延鳳等.關(guān)于SVD與PCA等價性的研究[J].計算機學(xué)報,004,27(2):286-288.
[25] Salakhutdinov R, Murray I, On the Quantitative Analysis of Deep Belief Networks[C]// Proc of International Conference on Machine Learning, 2008, 872-879.
[26] Ackley D H, Hinton G E, Sejnowski T J. A Learning Algorithm for Boltzmann Machines[J]. Cognitive Science, 1985, 9(1): 147-169.
[27] ManceraL, Portilla J.L0-norm-based sparse representation through alternateprojection[C]// 2006: 2089-2092.
[28] Lee H, Ekanadham C, Ng A Y.Sparse deep belief net model for visual area V2[C]. 2007: 873-880.
Abnormal Flight States of Aircraft Identification Based on Deep Learning Method
WU Qi CHU Yinxue
(Shanghai JiaoTong University, Shanghai 200240, China)
The quick access recorder(QAR) retains the navigational information of all important flight parameters of the original flight, making it possible to analyze aircraft real-time conditions and ensure flight quality. According to the characteristics of high-dimensional large-scale QAR data, under the background of Big Data, different from the traditional mechanism modeling and analysis of aircraft flight state, the paper uses deep learning to establish a data-driven aircraft flight state recognition model. Based on the study of real QAR flight data, an abnormal flight state recognition program based on the Sparse Restricted Boltzmann Machine is developed. First of all, we use the wavelet de-noising translation method to pre-process the original flight data. And then, we select a series of typical flight parameters, extract the classical time-domain features of these parameters and the mixed entropy feature like Wavelet Singular Entropy to form the feature set. Then we use the Principal Component Analysis technique and the Sparse Restricted Boltzmann Machine to effectively reduce the feature set. Finally, we use four-fold cross validation method. We put the training set into the Gaussian process classifier as a last step. The experimental results show that the flight state recognition based on the Sparse Restricted Boltzmann Machine-Gaussian process classification has high classification accuracy.
flight state recognition; deeping learning; gaussian process
10.19416/j.cnki.1674-9804.2017.03.013
吳奇男,博士,副教授。主要研究方向:人機交互,深度學(xué)習(xí),大數(shù)據(jù)分析。Tel: 021-34204492,E-mail: wuqi7812@sjtu.edu.cn
V226
:A
儲銀雪男,碩士。主要研究方向:深度學(xué)習(xí)。Tel: 021-34204492,E-mail: chuyinxue@sjtu.edu.cn