張夏陽(yáng), 殷之平, 劉飛, 黃其青
(西北工業(yè)大學(xué) 航空學(xué)院, 陜西 西安 710072)
?
飛機(jī)機(jī)動(dòng)劃分的數(shù)據(jù)挖掘方法
張夏陽(yáng), 殷之平, 劉飛, 黃其青
(西北工業(yè)大學(xué) 航空學(xué)院, 陜西 西安710072)
摘要:飛機(jī)機(jī)動(dòng)劃分是將飛行數(shù)據(jù)分解成若干具有明確物理意義的機(jī)動(dòng)動(dòng)作子序列的重要前處理方法,也是健康監(jiān)控、飛行模擬、飛行品質(zhì)評(píng)估等研究工作的必要步驟。結(jié)合數(shù)據(jù)挖掘技術(shù)提出一種自動(dòng)的飛機(jī)機(jī)動(dòng)劃分方法,該方法根據(jù)法向過(guò)載數(shù)據(jù)的趨勢(shì)提取出飛行數(shù)據(jù)中的機(jī)動(dòng)片段,并用ISODATA聚類(lèi)將機(jī)動(dòng)片段歸并為若干分類(lèi),可以證明每個(gè)分類(lèi)代表一種機(jī)動(dòng)動(dòng)作。將該方法分別應(yīng)用于小規(guī)模飛行數(shù)據(jù)與大規(guī)模飛行數(shù)據(jù)中能夠識(shí)別并正確劃分至少89%的機(jī)動(dòng)動(dòng)作,證明該方法有效且滿足工程精度要求。
關(guān)鍵詞:機(jī)動(dòng)劃分;數(shù)據(jù)挖掘;趨勢(shì)識(shí)別;ISODATA聚類(lèi)
飛機(jī)的飛行是一個(gè)復(fù)雜的過(guò)程,很難從完整的飛行起落數(shù)據(jù)中總結(jié)出飛機(jī)飛行的規(guī)律,而飛機(jī)的飛行可以看成一系列特定機(jī)動(dòng)動(dòng)作的組合,通過(guò)機(jī)動(dòng)劃分將繁雜的飛行數(shù)據(jù)劃分成多種有意義、有規(guī)律的機(jī)動(dòng)動(dòng)作片段并掌握在這些機(jī)動(dòng)動(dòng)作下的飛行規(guī)律,就能掌握飛機(jī)在整個(gè)飛行過(guò)程中的規(guī)律。目前結(jié)構(gòu)健康監(jiān)控[1]、故障檢測(cè)[2]、飛行品質(zhì)評(píng)估[3]等許多研究都建立在機(jī)動(dòng)劃分的思想上,國(guó)內(nèi)外學(xué)者也從不同的研究目的出發(fā)提出了多種機(jī)動(dòng)動(dòng)作劃分方法。
目前的機(jī)動(dòng)劃分方法主要有人工識(shí)別法、知識(shí)庫(kù)匹配、模式識(shí)別方法等。文獻(xiàn)[3]將飛參數(shù)據(jù)與知識(shí)庫(kù)中的判據(jù)逐條匹配找出機(jī)動(dòng)動(dòng)作的起止時(shí)刻;文獻(xiàn)[4]用已知機(jī)動(dòng)動(dòng)作的飛行數(shù)據(jù)構(gòu)建直升機(jī)機(jī)動(dòng)的區(qū)域識(shí)別模板,文獻(xiàn)[5]在此基礎(chǔ)上通過(guò)計(jì)算機(jī)再現(xiàn)機(jī)動(dòng)動(dòng)作并用視覺(jué)資料驗(yàn)證機(jī)動(dòng)識(shí)別的結(jié)果;文獻(xiàn)[6-7]用機(jī)動(dòng)動(dòng)作庫(kù)的數(shù)據(jù)訓(xùn)練支持向量機(jī)實(shí)現(xiàn)機(jī)動(dòng)識(shí)別,文獻(xiàn)[8-9]用神經(jīng)網(wǎng)絡(luò)得到了與之類(lèi)似的結(jié)果。
雖然以上文獻(xiàn)采用多種方法完成了機(jī)動(dòng)動(dòng)作識(shí)別,但這些方法都無(wú)法回避一個(gè)基本問(wèn)題:經(jīng)驗(yàn)判據(jù)與模板數(shù)據(jù)的獲取代價(jià)高昂。采用人工識(shí)別方法和知識(shí)庫(kù)方法的關(guān)鍵在于獲得機(jī)動(dòng)動(dòng)作的起止判據(jù),這些判據(jù)往往需要人工判讀大量的飛參數(shù)據(jù)后憑經(jīng)驗(yàn)總結(jié),耗費(fèi)人工并且效率很低。模式識(shí)別方法雖然不需要人工判讀飛參數(shù)據(jù),但是需要精心設(shè)計(jì)特殊的飛行動(dòng)作并通過(guò)多次飛行驗(yàn)證實(shí)驗(yàn)獲得標(biāo)準(zhǔn)機(jī)動(dòng)動(dòng)作模板,經(jīng)費(fèi)開(kāi)支巨大。并且,無(wú)論是機(jī)動(dòng)判據(jù)還是標(biāo)準(zhǔn)動(dòng)作模板都只針對(duì)特定的機(jī)型,不具備通用性。近年來(lái)國(guó)內(nèi)一些學(xué)者注意到了這一問(wèn)題,通過(guò)多種優(yōu)化算法提取原有動(dòng)作庫(kù)規(guī)則的數(shù)值特征、刪除冗余規(guī)則,達(dá)到自動(dòng)產(chǎn)生高效簡(jiǎn)潔的識(shí)別規(guī)則、減少人工工作量的目的[10-11]。
為擺脫機(jī)動(dòng)識(shí)別方法對(duì)經(jīng)驗(yàn)判據(jù)和模板數(shù)據(jù)的依賴(lài),自動(dòng)、自適應(yīng)地完成機(jī)動(dòng)劃分工作,本文創(chuàng)新性地提出了飛機(jī)機(jī)動(dòng)劃分的數(shù)據(jù)挖掘方法。該方法以趨勢(shì)識(shí)別技術(shù)識(shí)別出法向過(guò)載參數(shù)的變化趨勢(shì),并以此為依據(jù)提取出飛行數(shù)據(jù)中含有機(jī)動(dòng)動(dòng)作的子序列,而后用聚類(lèi)算法對(duì)子序列進(jìn)行聚類(lèi)分析形成機(jī)動(dòng)動(dòng)作分類(lèi)。
1飛機(jī)機(jī)動(dòng)劃分的數(shù)據(jù)挖掘方法
飛行參數(shù)是一系列離散的時(shí)序數(shù)據(jù),在沒(méi)有先驗(yàn)知識(shí)的情況下分析孤立的飛行參數(shù)數(shù)值是沒(méi)有意
義的,需要通過(guò)分析飛參序列的趨勢(shì)變化來(lái)挖掘數(shù)據(jù)中的機(jī)動(dòng)動(dòng)作子序列。顯然,在飛機(jī)平飛時(shí)各個(gè)飛參數(shù)據(jù)基本保持平穩(wěn),而當(dāng)飛機(jī)進(jìn)行機(jī)動(dòng)動(dòng)作時(shí)相應(yīng)的飛參數(shù)據(jù)的趨勢(shì)必然發(fā)生改變。據(jù)此,本文提出了如下機(jī)動(dòng)劃分方法:
首先,選取一個(gè)關(guān)鍵飛參作為主參數(shù),用趨勢(shì)識(shí)別方法識(shí)別出該飛參序列隨著時(shí)間的變化趨勢(shì),并將飛行數(shù)據(jù)劃分成若干只含有單一趨勢(shì)的子序列,稱(chēng)為“趨勢(shì)片段”。
其次,按一定規(guī)則合并相鄰趨勢(shì)片段,形成包含機(jī)動(dòng)動(dòng)作的數(shù)據(jù)序列,稱(chēng)為“機(jī)動(dòng)片段”。計(jì)算機(jī)動(dòng)片段序列中各飛參數(shù)據(jù)的均值與方差,并用一組均值與方差構(gòu)成的特征向量表示每個(gè)機(jī)動(dòng)片段。
最后,對(duì)機(jī)動(dòng)片段的特征向量進(jìn)行聚類(lèi)分析,得到若干機(jī)動(dòng)片段的集合。理想情況下這些集合就是劃分出的機(jī)動(dòng)動(dòng)作段。算法的流程圖如圖1所示:
圖1 機(jī)動(dòng)劃分的數(shù)據(jù)挖掘方法流程圖
2雙窗口的簡(jiǎn)單趨勢(shì)識(shí)別方法
趨勢(shì)識(shí)別技術(shù)是一種從含噪的過(guò)程數(shù)據(jù)中提取出趨勢(shì)信息的技術(shù)[13],它從定量的數(shù)據(jù)中提取定性信息并加以描述。描述趨勢(shì)的基本單元稱(chēng)為“基元”,考慮到飛參數(shù)據(jù)的信噪比高、趨勢(shì)清晰、線性趨勢(shì)明顯的特點(diǎn),僅用線性基元描述飛參趨勢(shì)是合適的。本文在此基礎(chǔ)上提出了一種雙窗口的簡(jiǎn)單趨勢(shì)識(shí)別方法,識(shí)別時(shí)選用上升、下降、平直三個(gè)線性基元,如圖2所示?;g通過(guò)片段擬合函數(shù)斜率數(shù)據(jù)加以區(qū)分。
圖2 趨勢(shì)識(shí)別采用的3種基元
2.1基元的選擇與識(shí)別準(zhǔn)則
設(shè)某時(shí)間序列片段含有m個(gè)樣本,記樣本的時(shí)間序號(hào)X=(x1,x2,…,xm)T,樣本值Y=(y1,y2,…,ym)T。對(duì)該時(shí)序片段做線性擬合,用最小二乘法可求得擬合參數(shù)
(1)
對(duì)于擬合函數(shù)斜率k規(guī)定斜率閾值ks,當(dāng)斜率k≥ks時(shí)將序列X識(shí)別為上升趨勢(shì)(C基元);當(dāng)k≤-ks時(shí)將X識(shí)別為下降趨勢(shì)(F基元);當(dāng)-ks 又考慮到飛行中經(jīng)常出現(xiàn)緩慢爬升或盤(pán)旋等斜率小但持續(xù)時(shí)間長(zhǎng)的動(dòng)作,僅用斜率來(lái)判定趨勢(shì)是不合適的。規(guī)定擬合函數(shù)的高差: (2) 引入高差閾值Δs,當(dāng)Δ>Δs時(shí),將序列識(shí)別為上升趨勢(shì)。 2.2雙窗口的調(diào)整與滑動(dòng) 窗口的大小會(huì)影響趨勢(shì)識(shí)別的效果,窗口過(guò)大會(huì)忽略局部趨勢(shì)造成混疊,窗口過(guò)小則對(duì)局部細(xì)節(jié)過(guò)于敏感不能把握整體趨勢(shì)信息。為了解決這一問(wèn)題,本文提出了一種雙窗口方法。 在算法中設(shè)置一個(gè)大小固定的滑動(dòng)窗口以及一個(gè)大小可調(diào)的固定窗口,如圖3所示。 圖3 雙窗口模型示意圖 初始時(shí),兩窗口的末端重合,窗口大小均為h。在算法執(zhí)行時(shí),滑動(dòng)窗口向前滑動(dòng)分析局部趨勢(shì),固定窗口擴(kuò)大相同長(zhǎng)度記錄并分析整體趨勢(shì)。窗口的行為由當(dāng)前分析的趨勢(shì)狀態(tài)決定: 1) 窗口內(nèi)的數(shù)據(jù)處于上升或下降狀態(tài)。此時(shí)滑動(dòng)窗口向前滑動(dòng)1個(gè)數(shù)據(jù)點(diǎn),固定窗口相應(yīng)擴(kuò)大??疾旎瑒?dòng)窗口中的斜率k,只要斜率符號(hào)保持不變就繼續(xù)滑動(dòng);若斜率符號(hào)改變,則輸出固定窗口中的識(shí)別結(jié)果,同時(shí)將固定窗口的起始點(diǎn)移動(dòng)至滑動(dòng)窗口的起始點(diǎn)位置,大小重置為h。 2) 窗口內(nèi)的數(shù)據(jù)處于平直狀態(tài)。此時(shí)滑動(dòng)窗口向前滑動(dòng)1個(gè)單位,固定窗口相應(yīng)擴(kuò)大。分別擬合固定窗口與滑動(dòng)窗口中的數(shù)據(jù),考察滑動(dòng)窗口中的斜率k與固定窗口中的高差Δ。這時(shí)出現(xiàn)以下3種情況: (a) |k|>ks,固定窗口中的數(shù)據(jù)識(shí)別為平直趨勢(shì),并將固定窗口長(zhǎng)度重置為h,起始點(diǎn)移置滑動(dòng)窗口位置。 (b) |k| (c) |k| 2.3參數(shù)對(duì)算法識(shí)別性能的影響 3個(gè)參數(shù)的取值對(duì)算法性能影響很大。ks主要影響算法識(shí)別趨勢(shì)轉(zhuǎn)折的能力,ks越小算法對(duì)趨勢(shì)的轉(zhuǎn)折就越敏感,但過(guò)小的ks會(huì)使算法局限于局部趨勢(shì),造成過(guò)分類(lèi)。Δs主要作為對(duì)ks準(zhǔn)則的補(bǔ)充以識(shí)別斜率小但持續(xù)上升或下降的趨勢(shì),同時(shí)也反映了對(duì)平直段中數(shù)據(jù)起伏的容忍程度。h表征了算法認(rèn)可的最小趨勢(shì)片段長(zhǎng)度,h越大算法對(duì)局部趨勢(shì)的關(guān)注度就越小,受噪聲的影響越小。但過(guò)大的h會(huì)使算法遲鈍,造成趨勢(shì)混疊。 綜上所述,只需給定合適的斜率閾值ks、高差閾值Δs和初始窗口大小h,算法即可自動(dòng)將飛參數(shù)據(jù)劃分成為一系列的“趨勢(shì)片段”,并且相鄰的兩個(gè)趨勢(shì)片段的趨勢(shì)一定不同。 3機(jī)動(dòng)片段提取 一個(gè)機(jī)動(dòng)動(dòng)作內(nèi)的飛參變化不會(huì)只呈單一的趨勢(shì),往往是多個(gè)相鄰趨勢(shì)片段組合而成的“起伏”形狀。因此需要將相鄰的趨勢(shì)片段組合成有意義的“機(jī)動(dòng)片段”。 考慮到飛行過(guò)程中平飛狀態(tài)的數(shù)據(jù)占大多數(shù),并且執(zhí)行機(jī)動(dòng)動(dòng)作后通常要回到平飛狀態(tài)。因此可以將兩段平飛狀態(tài)之間的一系列趨勢(shì)片段合并為一個(gè)機(jī)動(dòng)片段。 由于機(jī)動(dòng)動(dòng)作中也可能包含短暫的類(lèi)似平飛的動(dòng)作,為此引入最短平飛長(zhǎng)度閾值θh,只有長(zhǎng)度超過(guò)閾值的水平趨勢(shì)片段才能被識(shí)別為平飛狀態(tài)。 考慮到一些突變?cè)肼暫芸赡軐⒁粋€(gè)較長(zhǎng)的水平趨勢(shì)片段截成兩段而造成噪聲被識(shí)別為機(jī)動(dòng)片段的錯(cuò)誤,引入機(jī)動(dòng)片段最小長(zhǎng)度閾值Δhmin,若機(jī)動(dòng)片段長(zhǎng)度小于閾值則取消該分段。一般取長(zhǎng)度閾值為2倍的初始窗口長(zhǎng)度(2h)。 需要注意的是,至此得到的機(jī)動(dòng)片段僅僅是剔除平飛數(shù)據(jù)后的結(jié)果,還不能確定每個(gè)機(jī)動(dòng)片段究竟是何種機(jī)動(dòng)動(dòng)作。需要根據(jù)每個(gè)機(jī)動(dòng)片段的飛參特征對(duì)它們進(jìn)行分類(lèi)。這可以歸結(jié)為一個(gè)無(wú)導(dǎo)師的模式識(shí)別問(wèn)題并采用聚類(lèi)算法解決。 4迭代自組織的數(shù)據(jù)分析算法 4.1算法簡(jiǎn)介 迭代自組織的數(shù)據(jù)分析算法也被稱(chēng)為ISODATA算法[13]。它是一種自動(dòng)修改類(lèi)中心以及類(lèi)數(shù)目的動(dòng)態(tài)聚類(lèi)方法。該算法會(huì)自動(dòng)選擇若干樣本作為聚類(lèi)中心并在之后的運(yùn)算中通過(guò)樣本均值的迭代調(diào)整類(lèi)中心,通過(guò)模式類(lèi)的合并與分裂來(lái)實(shí)現(xiàn)聚類(lèi)中心數(shù)目的調(diào)整。 ISODATA算法的基本原則是:合并距離太近的分類(lèi),取消樣本數(shù)太少的分類(lèi),細(xì)分離散度太大的分類(lèi)。ISODATA算法的實(shí)現(xiàn)較為復(fù)雜,算法詳細(xì)流程見(jiàn)文獻(xiàn)[13],本文在此僅給出算法思路: 1) 初始化算法參數(shù)。算法一共包括6個(gè)參數(shù): K: 允許樣本能夠被分成的最多分類(lèi)個(gè)數(shù)。 θN: 一個(gè)類(lèi)內(nèi)的最少樣本數(shù)。若樣本數(shù)太少則取消該類(lèi)。 θS: 聚類(lèi)中樣本的標(biāo)準(zhǔn)差閾值。若某分類(lèi)的標(biāo)準(zhǔn)差大于閾值則將此分類(lèi)進(jìn)一步細(xì)分。 θC: 兩個(gè)聚類(lèi)中心之間的最短距離。若兩類(lèi)中心間距離小于閾值則合并這兩個(gè)分類(lèi)。 L: 一次迭代中允許合并的聚類(lèi)中心的最多數(shù)量。 I: 允許的最大迭代次數(shù)。 2) 選擇一些樣本作為初始的聚類(lèi)中心,按照最近鄰原則將樣本分類(lèi),并計(jì)算新的類(lèi)中心。 3) 計(jì)算各類(lèi)中的樣本數(shù)、類(lèi)內(nèi)標(biāo)準(zhǔn)差和各類(lèi)間距。按照給定的參數(shù)值決定是否調(diào)整類(lèi)中心的個(gè)數(shù)。 4) 判斷結(jié)果是否符合要求,若符合則結(jié)束運(yùn)算,否則返回步驟2)。 4.2特征向量的建立 機(jī)動(dòng)片段是時(shí)間序列數(shù)據(jù),不能直接使用ISODATA算法進(jìn)行聚類(lèi)。可以先提取機(jī)動(dòng)片段的統(tǒng)計(jì)特征,并用一個(gè)特征向量來(lái)表征機(jī)動(dòng)片段后再帶入聚類(lèi)算法。 文獻(xiàn)[1]中采用均值與方差來(lái)代表一個(gè)飛參序列并取得了成功,本文借鑒這種方法,使用機(jī)動(dòng)片段中各個(gè)飛參的均值與方差建立特征向量。 設(shè)含有n個(gè)飛參、m個(gè)數(shù)據(jù)點(diǎn)的機(jī)動(dòng)片段為: 矩陣中每一列為一種飛參,每一行為一個(gè)數(shù)據(jù)樣本,每個(gè)元素代表飛參的具體數(shù)值。 首先,為了消除各個(gè)飛參數(shù)據(jù)間數(shù)值量級(jí)上的差異需要對(duì)飛參數(shù)據(jù)進(jìn)行規(guī)范化處理,本文按下式將飛參數(shù)據(jù)規(guī)范為-0.5~0.5。 (3) 而后分別計(jì)算規(guī)范化后每組飛參數(shù)據(jù)的均值與方差 (4) (5) 最后構(gòu)建含2n個(gè)元素的特征向量 用ISODATA算法對(duì)所有機(jī)動(dòng)片段的特征向量分類(lèi)即可實(shí)現(xiàn)對(duì)機(jī)動(dòng)片段的分類(lèi)。 4.3聚類(lèi)結(jié)果的評(píng)價(jià) 在沒(méi)有驗(yàn)證數(shù)據(jù)集的情況下一般使用相對(duì)評(píng)價(jià)法評(píng)判聚類(lèi)結(jié)果[14],本文選用如下2個(gè)指標(biāo): 1) 類(lèi)中心間的距離。一般選取歐式距離 (6) 式中,zi與zj為第i類(lèi)與第j類(lèi)的類(lèi)中心,類(lèi)間距越大說(shuō)明兩類(lèi)的分類(lèi)越清晰。 2) 類(lèi)內(nèi)樣本標(biāo)準(zhǔn)差 (7) 式中,Ni為第i類(lèi)中的樣本個(gè)數(shù)。標(biāo)準(zhǔn)差越小說(shuō)明類(lèi)內(nèi)樣本越緊湊,該類(lèi)的劃分也越準(zhǔn)確。 本文采用以下評(píng)價(jià)函數(shù)來(lái)評(píng)價(jià)一次聚類(lèi)結(jié)果的整體效果: (8) 該函數(shù)實(shí)際上是對(duì)各類(lèi)的類(lèi)間距和類(lèi)內(nèi)標(biāo)準(zhǔn)差的加權(quán)平均再相除。可以看出,類(lèi)間距越大、類(lèi)內(nèi)標(biāo)準(zhǔn)差越小時(shí)函數(shù)值越大,對(duì)聚類(lèi)效果的評(píng)價(jià)越高。 5算例 為了驗(yàn)證本文方法的有效性,分別使用一組小規(guī)模數(shù)據(jù)與一組大規(guī)模數(shù)據(jù)驗(yàn)證算法的有效性。 根據(jù)文獻(xiàn)[1-5]中的經(jīng)驗(yàn),算法選擇高度、速度、俯仰角、傾斜角、側(cè)滑角和法向過(guò)載6個(gè)飛參進(jìn)行機(jī)動(dòng)劃分。由于飛機(jī)的機(jī)動(dòng)動(dòng)作必然伴隨著飛機(jī)法向過(guò)載的改變,因此選擇法向過(guò)載為主參數(shù)。 5.1小規(guī)模數(shù)據(jù)驗(yàn)證 現(xiàn)有某飛機(jī)的飛行數(shù)據(jù)如圖4所示,其中H為高度,V為速度,NY為法向過(guò)載。經(jīng)人工識(shí)別可確定該次飛行中共執(zhí)行了4種、6次機(jī)動(dòng)動(dòng)作,在圖4中以字母A~D標(biāo)出,其中A1與A2為一種相同機(jī)動(dòng)動(dòng)作,B1與B2為另一種相同機(jī)動(dòng)動(dòng)作。 圖4 某飛機(jī)部分飛行數(shù)據(jù) 1) 趨勢(shì)識(shí)別: 分析法向過(guò)載數(shù)據(jù)的數(shù)值特征,一種比較好的參數(shù)設(shè)置方法如表1所示。識(shí)別結(jié)果如圖5,圖中淺色實(shí)線表示平飛趨勢(shì),深色實(shí)線曲線表示上升趨勢(shì),虛線表示下降趨勢(shì)。從圖中可見(jiàn)趨勢(shì)識(shí)別結(jié)果準(zhǔn)確可靠。 表1 趨勢(shì)識(shí)別參數(shù)設(shè)置 2) 機(jī)動(dòng)片段提取與特征向量的建立: 選取θh=128從數(shù)據(jù)中提取出7個(gè)機(jī)動(dòng)片段,如圖6所示??梢钥闯?~6號(hào)機(jī)動(dòng)片段與真實(shí)機(jī)動(dòng)片段完全吻合,7號(hào)機(jī)動(dòng)片段為誤分導(dǎo)致的虛假機(jī)動(dòng)片段。按照公式(3)將機(jī)動(dòng)片段內(nèi)的飛參分別規(guī)范化處理,再按照公式(4)、(5)計(jì)算各機(jī)動(dòng)片段內(nèi)飛參的均值與方差構(gòu)建特征向量,特征向量如表 2所示(篇幅有限僅給出部分)。 圖5 法向過(guò)載參數(shù)趨勢(shì)識(shí)別結(jié)果 圖6 機(jī)動(dòng)片段劃分結(jié)果 序號(hào)特征向量1-0.30460.09580.06320.01990.05370.03980.00200.05490.06350.1990-0.36360.02612-0.09360.04720.08450.00910.08530.02290.01800.01410.43520.0018-0.37700.0259?……7-0.45730.0178-0.00050.08290.04990.2465-0.01900.1250-0.03790.2191-0.36450.0165 3) 聚類(lèi)參數(shù)的選擇: ISODATA的6個(gè)聚類(lèi)參數(shù)中,K、L、I3個(gè)參數(shù)比較容易選擇,θN、θS、θC難以調(diào)整。本文選取K=30,L=1,I=100,采用遺傳算法尋找θN、θS、θC。設(shè)適應(yīng)度函數(shù)為: (9) 遺傳算法參數(shù)設(shè)置如表3所示,算法進(jìn)化結(jié)果如圖7所示,圖中三角形代表每代最優(yōu)個(gè)體的適應(yīng)度,圓圈代表每代的平均適應(yīng)度。算法在70代時(shí)基本收斂,最終得到最優(yōu)的參數(shù)設(shè)置值為θN=1,θS=0.173 8,θC=0.143 7此時(shí)聚類(lèi)評(píng)價(jià)函數(shù)值V=2.061。 表3 遺傳算法參數(shù)設(shè)置表 4) 聚類(lèi)分析: 設(shè)置聚類(lèi)參數(shù)為K=30,L=1,I=100,θN=1,θS=0.173 8,θC=0.143 7,ISODATA算法將7個(gè)機(jī)動(dòng)片段歸為4類(lèi),每類(lèi)的包含的機(jī)動(dòng)片段個(gè)數(shù)以及機(jī)動(dòng)片段編號(hào)如表4所示。 圖7 遺傳算法進(jìn)化曲線 類(lèi)編號(hào)類(lèi)內(nèi)樣本數(shù)機(jī)動(dòng)片段編號(hào)121,2215327,6423,4 可見(jiàn)除了由于誤劃分而產(chǎn)生的虛假機(jī)動(dòng)片段7外,該算法成功識(shí)別出了數(shù)據(jù)中的全部6個(gè)機(jī)動(dòng)動(dòng)作并正確歸為4類(lèi)。 5.2大規(guī)模數(shù)據(jù)驗(yàn)證 為了進(jìn)一步驗(yàn)證算法的工程應(yīng)用價(jià)值,選擇某3組飛行數(shù)據(jù)進(jìn)行機(jī)動(dòng)識(shí)別。識(shí)別過(guò)程和算法各參數(shù)的選取與5.1節(jié)中相同,此處略去分析過(guò)程僅給出機(jī)動(dòng)劃分結(jié)果。 經(jīng)人工識(shí)別,3組飛行數(shù)據(jù)中共包含9種、67個(gè)機(jī)動(dòng)動(dòng)作,每種機(jī)動(dòng)動(dòng)作分別以A~I(xiàn)的字母表示。算法從數(shù)據(jù)中提取出75個(gè)機(jī)動(dòng)片段,經(jīng)聚類(lèi)分析后得到13種機(jī)動(dòng)分類(lèi),其中包括8個(gè)虛假機(jī)動(dòng)片段及2個(gè)虛假分類(lèi)。 算法得到的機(jī)動(dòng)劃分結(jié)果與人工識(shí)別的正確結(jié)果對(duì)比如表5所示。其中,劃分正確率定義為正確劃分的機(jī)動(dòng)片段個(gè)數(shù)除以機(jī)動(dòng)片段總數(shù);識(shí)別正確率定義為正確劃分的機(jī)動(dòng)片段個(gè)數(shù)除以實(shí)際機(jī)動(dòng)動(dòng)作總數(shù)。 表5 劃分結(jié)果統(tǒng)計(jì)表 從結(jié)果可以看出,89.55%的機(jī)動(dòng)動(dòng)作能夠被算法識(shí)別出并正確分類(lèi),證明算法具有解決工程實(shí)際問(wèn)題的能力。但為了保證算法能夠提取出數(shù)據(jù)中的所有潛在機(jī)動(dòng)片段,在參數(shù)設(shè)置時(shí)偏于激進(jìn),導(dǎo)致算法過(guò)分類(lèi),產(chǎn)生了8個(gè)虛假機(jī)動(dòng)片段與2個(gè)虛假分類(lèi),干擾了機(jī)動(dòng)劃分的準(zhǔn)確性。 6結(jié)論 本文提出了基于數(shù)據(jù)挖掘思想的飛機(jī)機(jī)動(dòng)劃分方法,該方法僅憑借飛行數(shù)據(jù)的數(shù)值特征即可實(shí)現(xiàn)對(duì)飛機(jī)機(jī)動(dòng)動(dòng)作的自動(dòng)劃分。根據(jù)本文分析可以得到以下結(jié)論: 1) 機(jī)動(dòng)劃分的數(shù)據(jù)挖掘方法充分利用了飛行數(shù)據(jù)本身的數(shù)值特征實(shí)現(xiàn)機(jī)動(dòng)動(dòng)作的識(shí)別與劃分,機(jī)動(dòng)劃分的精度與效果通過(guò)算法中的若干參數(shù)控制。算法參數(shù)的選取可以通過(guò)遺傳算法等優(yōu)化算法自適應(yīng)的完成,因此本文提出算法具有通用性與自適應(yīng)性。 2) 經(jīng)驗(yàn)證,本文提出的機(jī)動(dòng)劃分方法能夠識(shí)別并正確分類(lèi)飛行數(shù)據(jù)中89%以上的機(jī)動(dòng)動(dòng)作,具有一定的工程應(yīng)用價(jià)值。 3) 本方法能夠?yàn)閭鹘y(tǒng)機(jī)動(dòng)識(shí)別方法提供數(shù)據(jù)支持,極大的減少工作量。由于算法能自動(dòng)的將數(shù)據(jù)中相同或相似的機(jī)動(dòng)動(dòng)作歸類(lèi),因此僅需略微修正分類(lèi)結(jié)果并識(shí)別出各分類(lèi)所代表的機(jī)動(dòng)動(dòng)作的物理含義即可完成機(jī)動(dòng)識(shí)別。這在建立新機(jī)機(jī)動(dòng)庫(kù)等經(jīng)驗(yàn)知識(shí)不足的情況下能有效提高工作效率。 本文方法還存在著虛假分類(lèi)較多、分類(lèi)結(jié)果解釋困難等問(wèn)題。進(jìn)一步可以考慮結(jié)合專(zhuān)家經(jīng)驗(yàn)與推理機(jī),用少量推理規(guī)則消除聚類(lèi)結(jié)果中的虛假分類(lèi)并識(shí)別各個(gè)分類(lèi)所代表的具體機(jī)動(dòng)動(dòng)作。 參考文獻(xiàn): [1]EricBechhoefer.TheBestRegimeRecognitionAlgorithmforHUMS[C]∥AmericanHelicopterSocietySpecialist′sMeetingonConditionBasedMaintenance, 2008 [2]OzaNC,TumerK,TumerIY,etal.ClassificationofAircraftManeuversforFaultDetection[M].MultipleClassifierSystemsSpringerBerlinHeidelberg, 2003: 375-384 [3]倪世宏, 史忠科, 謝川,等. 軍用戰(zhàn)機(jī)機(jī)動(dòng)飛行動(dòng)作識(shí)別知識(shí)庫(kù)的建立[J]. 計(jì)算機(jī)仿真, 2005, 22(4):23-26 NiShihong,ShiZhongke,XieChuan,etal.EstablishmentofAvionInflightManeuverActionRecognizingKnowledgeBase[J].ComputerSimulation, 2005, 22(4): 23-26 (inChinese) [4]BarndtG,SarkarS,MillerC.ManeuverRegimeRecognitionDevelopmentandVerificationforH-60StructuralMonitoring[C]∥AnnualForumProceedings-AmericanHelicopterSociety,AmericanHelicopterSociety,INC, 2007, 63(1): 317 [5]SureshM,NamP,DavidC.ManeuverRecognitionVerification&ValidationUsingVisualization[C]∥AIAC-14FourteenthAustralianInternationalAerospaceCongressAPISAT2011,Melbourne,Australian [6]謝川, 倪世宏, 張宗麟,等. 基于狀態(tài)匹配與支持向量機(jī)的飛行動(dòng)作識(shí)別方法[J]. 彈箭與制導(dǎo)學(xué)報(bào), 2004, 24(2):240-245 XieChuan,NiShihong,ZhangZonglin,etal.RecognitionMethodofAcrobaticManeuverBasedonStateMatchingandSupportVectorMachines[J].JournalofProjectiles;Rockets;MissilesandGuidance, 2004, 24(2):240-245 (inChinese) [7]楊俊, 謝壽生. 基于模糊支持向量機(jī)的飛機(jī)飛行動(dòng)作識(shí)別[J]. 航空學(xué)報(bào), 2005, 26(6):738-742 YangJun,XieShousheng.FuzzySupportVectorMachinesBasedRecognitionforAeroplaneFlightAction[J].ActaAeronauticaetAstronauticaSinica, 2005, 26(6): 738-742 (inChinese) [8]KimD,PechaudL.ImprovedMethodologyforthePredictionoftheEmpennageManeuverIn-FlightLoadsofaGeneralAviationAircraftUsingNeuralNetworks[R].Embry-RiddleAeronauticalUniv,DaytonaBeachFl, 2001 [9]李玉峰, 倪世宏. 一種基于模糊Kohonen網(wǎng)絡(luò)的飛行數(shù)據(jù)智能處理方法[J]. 系統(tǒng)工程與電子技術(shù), 2002, 24(9): 53-55 LiYufeng,NiShihong.AnIntelligentApproachtoFlightDataProcessingBasedonaFuzzyKohonenNeuralNetwork[J].SystemsEngineeringandElectronics, 2002, 24(9): 53-55 (inChinese) [10] 蘇晨, 倪世宏, 王彥鴻. 一種改進(jìn)人工免疫的飛行狀態(tài)規(guī)則提取方法[J]. 計(jì)算機(jī)工程與應(yīng)用, 2011, 47(3): 237-239 SuCheng,NiShihong,WangYanhong.MethodofRuleAcquirementofFlightStateBasedonImprovedAIS[J].ComputerEngineeringandApplications, 2011, 47(3): 237-239 (inChinese) [11] 高原, 倪世宏, 王彥鴻, 等. 一種基于改進(jìn)量子遺傳算法的飛行狀態(tài)規(guī)則提取方法[J]. 電光與控制, 2011, 18(1): 28-31 GaoYuan,NiShihong,WangYanhong,etal.AMethodforFlightStateRuleAcquisitionBasedonImprovedQuantumGeneticAlgorithm[J].ElectronicsOptics&Control, 2011, 18(1): 28-31 (inChinese) [13] 高東, 馬昕, 許欣,等. 基于滑動(dòng)窗口的定性趨勢(shì)分析方法及應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用研究, 2014, 31(5): 1441-1444 GaoDong,MaXin,XuXin,etal.MethodandApplicationofQualitativeTrendAnalysiswithSlidingWindow[J].ApplicationResearchofComputers, 2014, 31(5): 1441-1444 (inChinese) [14] 齊敏, 李大健, 郝重陽(yáng). 模式識(shí)別導(dǎo)論[M]. 北京: 清華大學(xué)出版社, 2009: 27-35 QiMin,LiDajian,HaoChongyang.AnIntroductiontoPatternRecognition[M].Beijing,TsinghuaUniversityPress, 2009: 27-35 (inChinese) [15] 楊燕, 靳蕃,MohamedK. 聚類(lèi)有效性評(píng)價(jià)綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2008, 25(6): 1630-1632 YangYan,JinFan,MohamedK.SurveyofClusteringValidityEvaluation[J].ApplicationResearchofComputers, 2008, 25(6): 1630-1632 (inChinese) An Aircraft Maneuver Partition Method Based on Data Mining Zhang Xiayang, Yin Zhiping, Liu Fei, Huang Qiqing (College of Aeronautics, Northwestern Polytechnical University, Xi′an 710072, China) Abstract:An aircraft maneuver partition method is to divide flight data into several maneuver action sub-sequences that are meaningful in physics, being essential for health monitoring, flight simulation and flight quality evaluation. Based on data mining, we propose an automatic maneuver partition method, which extracts the maneuver segments of flight data according to the trend of normal overload data and then uses the iterative self-organized data analysis algorithm (ISODATA) to cluster the maneuver segments into some classes. We prove that each class represents a maneuver action. The maneuver partition method is applied to small scale flight data and large scale flight data respectively and can recognize and correctly partition at least 89% of maneuver actions, indicating that the method is effective and satisfies the requirements for engineering accuracy. Keywords:aircraft, algorithms, cluster analysis, data fusion, data mining, eigenvalues and eigenfunctions, genetic algorithms, least squares approximation, linear regression, signal to noise ratio, time series; ISODATA clustering, maneuver partition, non-supervised learning, trend recognition 中圖分類(lèi)號(hào):V212.1 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1000-2758(2016)01-0033-08 作者簡(jiǎn)介:張夏陽(yáng)(1991—),西北工業(yè)大學(xué)碩士研究生,主要從事飛行結(jié)構(gòu)健康監(jiān)控及系統(tǒng)建模研究。 收稿日期:2015-03-17