趙小瑞,李宏權(quán),梁復(fù)臺,3,楊 凡
(1.空軍預(yù)警學(xué)院,湖北 武漢 430019;2.解放軍96714部隊,福建 永安 366000;3.解放軍31121部隊,江蘇 南京 210000)
預(yù)警探測體系中,目標(biāo)航跡數(shù)據(jù)具有量大、更新快、價值高等特點。如何高效利用目標(biāo)歷史航跡大數(shù)據(jù),從數(shù)據(jù)中挖掘其蘊含的價值,尋找目標(biāo)內(nèi)在的規(guī)律,為快速、準(zhǔn)確地判斷空中目標(biāo)提供支撐是當(dāng)前研究的熱點。在數(shù)據(jù)壓縮上,文獻[1]提出基于空間曲線壓縮算法的空中目標(biāo)航跡提取算法,通過設(shè)定閾值提取關(guān)鍵點的方法,減少數(shù)據(jù)量,降低了計算的復(fù)雜度。航跡匹配通常采取K-means算法、層次方法[2]等進行航跡擬合聚類,再建立神經(jīng)網(wǎng)絡(luò)預(yù)測模型[3]進行航跡匹配。文獻[4]提出一種多屬性加權(quán)關(guān)聯(lián)關(guān)系匹配模型,重點解決熱點區(qū)域戰(zhàn)略空中目標(biāo)經(jīng)典航跡提取及實時航跡的關(guān)聯(lián)匹配問題。目前大部分文獻都是針對數(shù)據(jù)本身進行篩選,航跡匹配只與當(dāng)前輸入的數(shù)據(jù)有關(guān),對歷史數(shù)據(jù)利用率不高,對應(yīng)結(jié)果只能反映當(dāng)前數(shù)據(jù)信息,不具備可持續(xù)性。
本文針對空中目標(biāo)航跡數(shù)據(jù)量大、運算量過高,傳統(tǒng)目標(biāo)航跡空域特征提取較為復(fù)雜的情況,提出基于空間格的連續(xù)時間空域特征提取算法。通過對選定空域以一定長度為單位距離進行網(wǎng)格化劃分,再將收集到的航跡大數(shù)據(jù)進行預(yù)篩選、坐標(biāo)轉(zhuǎn)換,將航跡點與網(wǎng)格對應(yīng)匹配,統(tǒng)計出每個網(wǎng)格內(nèi)出現(xiàn)的航跡點次數(shù),實現(xiàn)對目標(biāo)航跡空域特征的提取,保留能突出航跡特點的網(wǎng)格,以減少數(shù)據(jù)量。并且可隨著數(shù)據(jù)的不斷輸入,結(jié)果不斷更新,該結(jié)果可反映出輸入數(shù)據(jù)所有時間的航跡總體規(guī)律,避免了歷史數(shù)據(jù)利用率不高以及結(jié)果反映過于片面的問題。
(1) 空間格定義
(2) 空間格坐標(biāo)
空間格采用直角坐標(biāo)系,將指定區(qū)域地圖的左下角坐標(biāo)作為空間格的原點(0,0),以正東方向為直角坐標(biāo)的x軸,正北方向為直角坐標(biāo)的y軸,以a作為單位長度,將空域范圍劃分成m×n的二維網(wǎng)格,每個網(wǎng)格都有一個唯一的編號,即由空間格左下角的x軸和y軸坐標(biāo)組成,坐標(biāo)之間用逗號分隔。
(3) 目標(biāo)空域特征
目標(biāo)空域是指目標(biāo)所在的空間位置。對于空中目標(biāo)而言,目標(biāo)空域通常由目標(biāo)情報點的經(jīng)度、緯度和高度來表示。單批目標(biāo)的空域信息就是由其整條航跡所有點的經(jīng)度、緯度和高度構(gòu)成;某類目標(biāo)的空域信息就是由該類所有歷史航跡數(shù)據(jù)點的經(jīng)度、緯度和高度構(gòu)成。目標(biāo)空域特征是指能夠表征某批或某類目標(biāo)空間位置信息的典型、有代表性的特殊數(shù)據(jù)集。本文所研究的目標(biāo)空域特征就是以空間格為基礎(chǔ),將歷史航跡的空間位置信息映射到空間格之中,進而獲取某批或某類目標(biāo)的空域特征值。
(4) 目標(biāo)空域特征提取
特征提取就是在目標(biāo)空域網(wǎng)格化的基礎(chǔ)上,將目標(biāo)航跡數(shù)據(jù)點按照地理坐標(biāo)位置,對應(yīng)放入網(wǎng)格中,同時對前后小于30 s的2個點進行連接,將2點間航跡粗略看成直線[5],航跡點本身,以及按時間順序相連的直線所經(jīng)過的網(wǎng)格,其對應(yīng)點數(shù)全部加1,以便增加對航跡判別有幫助的點數(shù)量。
由于常用算法大部分對單條航跡進行特征點提取,不具有針對時間的連續(xù)性。因此本文提出基于空間格的連續(xù)時間空域特征提取算法進行目標(biāo)空域特征提取。首先需要對原始航跡進行預(yù)處理,篩選出符合要求航跡點的基礎(chǔ)上,對目標(biāo)活動空域進行網(wǎng)格布設(shè),其次通過航跡坐標(biāo)變換,實現(xiàn)航跡點空域映射,最后得到目標(biāo)空域特征矩陣。
對目標(biāo)活動空域進行網(wǎng)格化處理,將目標(biāo)空域映射到直角坐標(biāo)系中。首先需要確定空域的區(qū)域范圍,然后根據(jù)區(qū)域邊緣經(jīng)緯度信息,按照經(jīng)緯度距離公式,求出最大區(qū)域距離范圍,再根據(jù)設(shè)定的網(wǎng)格邊長,求出劃分網(wǎng)格的長寬個數(shù)m×n。
需要特別注意的是數(shù)據(jù)空域范圍的選定,由于網(wǎng)格是由多個方格構(gòu)成的矩形,受地球曲率影響,相同距離下,在低緯度地區(qū)跨過的經(jīng)度要比高緯度地區(qū)跨過的經(jīng)度少。地球上同一經(jīng)度上所有緯度1°間的距離均約為111.12 km,即1′的距離均約為1.86 km,而對于同一緯度,2個不同經(jīng)度的距離為:
d=111.12(x2-x1)cosy
(1)
式中:d為同一緯度y上2點之間的距離,單位為km;x1、x2分別為2點經(jīng)度,單位為°;y為緯度數(shù)據(jù),單位rad。
由于2個經(jīng)度之間,高緯度長度低于低緯度,為了空間格的完整度,需要將高緯度的長度延長至低緯度長度,故高緯度區(qū)域的截止經(jīng)度將會發(fā)生改變。高緯度調(diào)整后的經(jīng)度計算方法為:
(2)
目標(biāo)航跡數(shù)據(jù)包含經(jīng)度、緯度、時間、類型、批次、架數(shù)等信息。將航跡點對應(yīng)到相應(yīng)空間格中,則需要對數(shù)據(jù)進行坐標(biāo)轉(zhuǎn)換,航跡坐標(biāo)變換就是將目標(biāo)航跡點的經(jīng)度和緯度從地理坐標(biāo)轉(zhuǎn)換成空域網(wǎng)格坐標(biāo)。設(shè)航跡點數(shù)據(jù)集合為Hi={P1,P2,…,Pk,…,Pn},其中n為航跡點總個數(shù),Pk=(類型,架數(shù),ak,bk),ak為第k個航跡點坐標(biāo)經(jīng)度,bk為第k個航跡點坐標(biāo)緯度(1≤k≤n)。
以選定空域高緯度為x軸,以西側(cè)經(jīng)度為y軸,兩者交點為原點,建立笛卡爾坐標(biāo)系。將航跡點數(shù)據(jù)集合Hi={P1,P2,…,Pk,…,Pn},即Pk=(類型,架數(shù),ak,bk)的經(jīng)緯度坐標(biāo),轉(zhuǎn)換為空域網(wǎng)格坐標(biāo)系里的距離坐標(biāo),即pk=(類型,架數(shù),xk,yk)。其中xk的坐標(biāo)為:
xk=111.12(ak-109°)cosbk
(3)
同理,yk的坐標(biāo)為:
yk=111.12|bk-21°|
(4)
形成一個新的數(shù)據(jù)點集合Hi={p1,p2,…,pk,…,pn},pk=(類型,架數(shù),xk,yk),xk為第k個數(shù)據(jù)點橫坐標(biāo)距離位置信息,yk為第k個數(shù)據(jù)點距離位置信息。
基于空間格定義,構(gòu)建空間格數(shù)據(jù)存儲矩陣,然后將航跡點空間特征值存入空間格矩陣。令空間格矩陣為G=(gij)m×n,gij=(類型,架數(shù),次數(shù)),i、j分別為空間格第i行、第j列的網(wǎng)格坐標(biāo),0≤i≤m,0≤j≤n。具體步驟如下:
(3) 判斷若i1≠i0,且|k|≥1,則將j0與j1之間的整數(shù)值依次代入函數(shù)關(guān)系式中的值y(j),求出對應(yīng)的值x(i),并將x(i)向上取整,對應(yīng)的gij中對應(yīng)的次數(shù)加1。若|k|<1,則將i0與i1之間的整數(shù)值依次代入函數(shù)關(guān)系式中的值x(i),求出對應(yīng)的值y(j),并向上取整y(j),對應(yīng)的gij中對應(yīng)的次數(shù)加1。
(4) 讀取新的航跡數(shù)據(jù),再次執(zhí)行(1)~(3)。
將點數(shù)較高的網(wǎng)格予以保留,但是防止航線過于密集,而出現(xiàn)整體航跡占用網(wǎng)格較寬的情況,只保留最密集最能體現(xiàn)航跡規(guī)律的網(wǎng)格;同時,對于數(shù)量不多,但是和其他航跡有明顯區(qū)別的航跡,所占用的網(wǎng)格也要保留。步驟如下:
(1) 以單個單元格中的數(shù)據(jù)點出現(xiàn)的次數(shù)為橫軸,以包含同一數(shù)據(jù)點量的單元格數(shù)量為縱軸,畫出柱狀圖;
(2) 設(shè)定單個單元格點內(nèi)數(shù)量閾值為M,若不少于M,則單元格暫時保留,并采用3×3的框架,將框架中的數(shù)據(jù)數(shù)量Aij進行排序,取最高的3個值的單元格予以徹底保留,舍棄其他的單元格;
(3) 若閾值小于M,但頻次不少于給定閾值N,則單元格暫時保留,且以此單元格為中心,用3×3的框架,框架內(nèi),若暫時保留的單元格數(shù)超過3個,則將所有暫時保留網(wǎng)格予以徹底保留,否則將該單元格去除;
以南北縱跨為400 km、緯度橫越為180 km的某空域為例。由于大多預(yù)警雷達掃描1圈的時間約為10 s,目標(biāo)飛行速度通常為800 km/h,則10 s內(nèi)的飛行距離約為2.22 km,故將空間單元格的邊長設(shè)為2 km,空間格由200×90個單元格組成。數(shù)據(jù)來源為某站1周內(nèi)在該區(qū)域經(jīng)過數(shù)據(jù)預(yù)處理后的150條航線的8 959條雷達數(shù)據(jù)。
將數(shù)據(jù)進行初步清洗后,按本文方法進行坐標(biāo)轉(zhuǎn)換,而后對應(yīng)到空間格中,數(shù)據(jù)點數(shù)量即空間格矩陣數(shù)值分布如圖1所示,橫坐標(biāo)為矩陣元素數(shù)值,縱坐標(biāo)為單元格數(shù)量,其中不包括數(shù)據(jù)量為0的單元格數(shù)量。
圖1 空間格矩陣數(shù)值分布圖
空間格矩陣做成的熱力圖如圖2所示。
圖2 空間格矩陣熱力圖
由圖1可知,橫坐標(biāo)中位數(shù)為12,因此將M閾值設(shè)為12,可得結(jié)果如圖3所示。篩選出典型航跡,但是原數(shù)據(jù)中下方的少量異常航跡被消除,損失了重要信息。從圖1也可以直觀地看出,眾數(shù)為6,即有700多個單元格中包含的數(shù)據(jù)點數(shù)量為6,因此可以得出結(jié)論:雖然數(shù)據(jù)點數(shù)量較少,但同時有大量單元格擁有相同數(shù)據(jù),證明此處很可能包含數(shù)據(jù)量較少的異常航跡,因此將2.4步驟中的閾值N設(shè)為5而不設(shè)置成6的原因是盡量保證異常航跡的數(shù)據(jù)量。得到的特征格矩陣做成熱力圖如圖4所示,異常航線顯現(xiàn)。
圖3 篩選后的高頻航線熱力圖
圖4 特征格矩陣熱力圖
由圖4可以直觀看出,未經(jīng)處理的航線數(shù)據(jù)較多且密集,經(jīng)過特征網(wǎng)格提取后的航線,數(shù)據(jù)量少很多,并且很好地保留了原有航線的特征,下方數(shù)量較少的異常航線也被很好保留。原8 959條數(shù)據(jù),經(jīng)過生成空間格,數(shù)據(jù)量減少至1 671,經(jīng)過提取特征格后,數(shù)據(jù)降為341,僅為原始數(shù)據(jù)的3.81%。
本算法的優(yōu)勢在于:存儲空間最多為m×n×2(空間格矩陣及特征格矩陣大小),此后不會因為原始航跡的增加而增加。航跡關(guān)鍵點提取[1]和曲線擬合法[6]等傳統(tǒng)航跡處理方法,都是對航跡點進行壓縮,達到用最少的參量來表示整條航跡的運動特征。但算法的處理能力有限,可同時處理的航線最多為幾十條,并且著眼于數(shù)據(jù)本身,反映的結(jié)果是當(dāng)前輸入的數(shù)據(jù)。本文方法可隨著數(shù)據(jù)的不斷輸入,特征網(wǎng)格位置隨著輸入數(shù)據(jù)的增加而發(fā)生變化,聚類結(jié)果能反映出隨著時間推移的總體航跡趨勢。因為航跡點的增加最終都會對應(yīng)成空間格矩陣中的數(shù)值變化,理論上可處理的數(shù)據(jù)無上限,但是若處理的數(shù)據(jù)在時間跨度上過長,會導(dǎo)致大量歷史因素對結(jié)果產(chǎn)生影響,降低時效性。
本文基于空中目標(biāo)的歷史大數(shù)據(jù),提出對目標(biāo)空域進行網(wǎng)格化處理,生成目標(biāo)活動空間格?;诓荚O(shè)的空間格,將歷史航跡的空間位置映射到空間格中,實現(xiàn)目標(biāo)空域特征的提取,也就是將海量的歷史航跡數(shù)據(jù)轉(zhuǎn)變成有限的空間格數(shù)據(jù)集。經(jīng)過算法處理后,大幅減少了數(shù)據(jù)量,在存儲空間利用、對連續(xù)時間的軌跡研究等方面具有較為明顯的優(yōu)勢,便于后續(xù)對目標(biāo)的空間活動規(guī)律進行聚類、分類、關(guān)聯(lián)關(guān)系等分析。并且本算法具備可持續(xù)性,可不斷輸入新數(shù)據(jù)進行規(guī)劃完善,輸入數(shù)據(jù)越多,航跡聚類越精確,且不增加數(shù)據(jù)存儲容量。但是此方法忽略了目標(biāo)航跡高度的影響,下一步還需把高度納入考慮范圍,對空間格進行三維化處理。