張浩東
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)
目前對于航空異常檢測的研究多是對于某一特定故障,取相關(guān)數(shù)據(jù)訓(xùn)練之后建模,根據(jù)模型檢測異常。然而,依據(jù)飛行軌跡進(jìn)行航空異常檢測很少有人涉及。針對傳統(tǒng)的檢測方法,無法應(yīng)用于一架飛機(jī)從起飛到降落整個(gè)過程,因?yàn)槠陂g的數(shù)據(jù)項(xiàng)和數(shù)據(jù)量超出了其算法的范疇。但是,應(yīng)用于飛行軌跡的檢測,我們只需要關(guān)心軌跡點(diǎn)的坐標(biāo)數(shù)據(jù),大大減少了數(shù)據(jù)量,提高了效率。
對于異常軌跡檢測的研究中,Lee等人通過計(jì)算線段Hausdorff的距離來鑒別異常軌跡[1],Li等人通過人工智能方法訓(xùn)練分類器,以此區(qū)別異常軌跡。但是他們都忽視了對于軌跡點(diǎn)方向的研究,軌跡點(diǎn)的方向信息可以反映出當(dāng)時(shí)物體的運(yùn)動(dòng)趨勢,并且該特征對軌跡的長度不敏感,可以用作一個(gè)有效的異常檢測方法。并且以保證準(zhǔn)確率和提升效率為目的,本文提出雙層異常軌跡檢測方法:由粗粒度到細(xì)粒度。
如圖1所示,在5條軌跡中,明顯可以看出軌跡3屬于異常軌跡。在航空飛行中,這樣偏離正常的軌道說明飛機(jī)在這個(gè)時(shí)間段遇到了異常狀況,有可能是內(nèi)部因素(航空器異常),也有可能是外部因素(天氣因素)??傊?,在這個(gè)時(shí)間段內(nèi)有危險(xiǎn)征候,需要加強(qiáng)防范。
當(dāng)軌跡出現(xiàn)異常的時(shí)候,軌跡點(diǎn)之間的夾角也隨之發(fā)生較大的偏差。因此,方向信息也可以反映出異常情況。在這種情況下,再對異常軌跡進(jìn)行細(xì)粒度劃分,如圖1中的p0p1、p1p2和p2p3三個(gè)子軌跡,以減少不必要的數(shù)據(jù)分析,提高效率,具體再對子軌跡進(jìn)行高精度異常分析,提高準(zhǔn)確率。
圖1 軌跡示意圖
軌跡一般由一個(gè)二維的點(diǎn)集合來表示:
方便提取方向向量,對軌跡點(diǎn)進(jìn)行橫坐標(biāo)和縱坐標(biāo)分解,我們可以把軌跡表示為:
首先,定義粗粒度和細(xì)粒度分別為pipi+jb和pipi+b(j>1),b是一個(gè)基本長度單位。用L表示粗粒度軌跡,用l表示粒度軌跡。
根據(jù)上一步中提取的方向特征,對軌跡進(jìn)行粗粒度的異常檢測,如果θiθi+1<0則表示軌跡在點(diǎn)i處進(jìn)行了大角度的方向變化,很有可能是異常情況。以此,將軌跡點(diǎn)i作為細(xì)粒度劃分起始點(diǎn),進(jìn)一步檢測異常情況。這樣就減少了對不必要的一段數(shù)據(jù)進(jìn)行細(xì)粒度檢測,于是提升了檢測效率。
在此,我們根據(jù)上一步粗粒度檢測出的異常子軌跡進(jìn)行在劃分,并進(jìn)行高精度異常檢測,確保準(zhǔn)確率。
為了方便計(jì)算,因?yàn)榇至6溶壽E和細(xì)粒度軌跡的角距離一般很小而且可以認(rèn)為它們是平行的,所以我們選擇忽略角距離,也不會(huì)引起誤差。
于是,我們只需考慮以最小基本單位b為細(xì)粒度劃分單位,將檢測出的粗粒度軌跡進(jìn)行劃分。再根據(jù)粗粒度的異常判別方法進(jìn)行細(xì)粒度的異常判別。
實(shí)驗(yàn)采用西南片區(qū)500架航班中的FOQA(飛行品質(zhì)監(jiān)控)作為實(shí)驗(yàn)數(shù)據(jù),在其中的50架航班中參入異常數(shù)據(jù),異常數(shù)據(jù)是由離散數(shù)據(jù)(飛機(jī)起落架放下、升起等)和連續(xù)數(shù)據(jù)(飛機(jī)速度等)組成的異構(gòu)數(shù)據(jù),足以組成傳統(tǒng)檢測方法和本文方法的測試數(shù)據(jù)。
傳統(tǒng)檢測方法我們使用神經(jīng)網(wǎng)絡(luò)算法作為實(shí)驗(yàn)對比,取其中250架正常航班數(shù)據(jù)作為其訓(xùn)練集,其余250架含有異常數(shù)據(jù)的航班數(shù)據(jù)作為測試集。
表1
圖2 神經(jīng)網(wǎng)絡(luò)(右)和本文算法(左)實(shí)驗(yàn)效果圖
可以看出當(dāng)實(shí)驗(yàn)數(shù)據(jù)量足夠大的時(shí)候,神經(jīng)網(wǎng)絡(luò)算法已經(jīng)無法保持檢測準(zhǔn)確率在90%以上,相對于本文算法來說較低,并且花費(fèi)時(shí)間也遠(yuǎn)遠(yuǎn)超過本文算法。所以從準(zhǔn)確率和效率來看,本文算法對大量數(shù)據(jù)的航空異常檢測是有效的。
在航空異常檢測中,本文提出的算法從傳統(tǒng)異常檢測的缺點(diǎn)入手,解決了數(shù)據(jù)量大對檢測的影響,并且提升了準(zhǔn)確率和效率。在關(guān)于軌跡研究發(fā)面提出了新的思路,用以解決航空器的軌跡異常,利用雙層粒度檢測方法在去除不必要的數(shù)據(jù)分析的同時(shí)確保了對異常情況的準(zhǔn)確檢測。
[1]J.G.Lee,J.Han,X.Li.Trajectory Outlier Detection:A Partition-and-Detect Framework.Washington:Computer Society,2008.
[2]X.Li,J.Han,S.Kim.ROAM:Rule-Based and Motif-Based Anomaly Dection in Massive Moving Object Data Sets.SIAM Press,2007.
[3]劉良旭,喬少杰,劉賓.V基于R-Tree的高效異常軌跡檢測算法.軟件學(xué)報(bào),2009,24:26-35.
[4]朱明.數(shù)據(jù)挖掘[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2002.