馬琳琪,李校男,晁 濤,及鵬飛
(1. 哈爾濱工業(yè)大學控制與仿真中心,哈爾濱 150080;2. 四川騰盾科技有限公司,成都 610036)
無人機作為一種飛行器,可以在遙控或者自主控制下完成復(fù)雜飛行任務(wù),近年來在軍事領(lǐng)域越來越多地被應(yīng)用[1-2]。但由于單架無人機受到探測能力、武器運載能力等多項因素的限制,在任務(wù)難度高、任務(wù)范圍廣的情況下不具有優(yōu)勢,因此出現(xiàn)了無人機群協(xié)同合作的作戰(zhàn)模式,這些無人機群通過編隊組織分工,可以完成戰(zhàn)場偵察、突防攻擊、火力支援等復(fù)雜任務(wù)[2]。隨著無人機在軍事作戰(zhàn)中的作用增強,如何監(jiān)測敵方無人機并有效預(yù)警的相關(guān)研究逐漸開展,其中包括無人機集群的編隊類型識別。無人機集群通過調(diào)整隊形,可以完成不同的作戰(zhàn)任務(wù),因此通過識別無人機集群的不同隊形,可以有效對來襲敵機進行預(yù)警預(yù)測,輔助指揮部門進行戰(zhàn)術(shù)決策。在軍事領(lǐng)域中常見的無人機隊形有楔形、菱形、縱形等,無人機采用菱形編隊可將保護對象圍在中間完成護送任務(wù),采用縱隊可對目標進行地毯式打擊[1],因此無人機編隊類型的識別問題對于判斷敵方意圖并根據(jù)預(yù)測的意圖來為我方及時作出預(yù)警至關(guān)重要。
編隊類型識別問題從本質(zhì)上來說是一種分類問題,通常采用基于模板匹配[3-4]或是機器學習的識別方法[5-7],模板匹配例如基于空間方向相似性[8]、基于領(lǐng)域知識[9]等,這些方法通常只針對一些具體的隊形模板,其隊形描述的方式固定,不適用于無人機坐標數(shù)據(jù)觀測不完全和含有雜波等干擾因素較多的情況,缺乏通用性。而基于機器學習的目標識別方法中,具有代表性的有基于BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)[10]、支持向量機SVM(Support Vector Machine)[11]、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN(Recurrent Neural Network)[12]等的目標識別算法,目前已有研究驗證了這些方法在無人機編隊識別問題中的有效性,但此類方法依賴大量的數(shù)據(jù)進行建模,對于小樣本情形下的編隊識別存在局限性。基于結(jié)合Hough 變換和K-means 聚類算法的隊形識別算法本質(zhì)上也是一種模板匹配算法,這種方法可以通過提取編隊輪廓特征的方式將編隊類型與輪廓參數(shù)相匹配,雖然同其他的模板匹配方法一樣也需要建立模板庫,但該算法特征提取的步驟簡潔,相應(yīng)特征的數(shù)據(jù)維度較小,并且可以在一定程度上過濾掉雜波等干擾因素的影響,同時相比于機器學習算法而言并不依賴于數(shù)據(jù)進行建模,因此該算法有著一定的優(yōu)越性。
另外,無人機樣本量少本質(zhì)上是目標分類領(lǐng)域的小樣本問題,針對小樣本問題現(xiàn)在常見的處理方式有兩種類型,一種是針對數(shù)據(jù)進行的數(shù)據(jù)增強(例如數(shù)據(jù)裁剪、翻轉(zhuǎn)、添加噪聲或是采用生成對抗網(wǎng)絡(luò)進行數(shù)據(jù)生成等),另一種是針對模型進行模型優(yōu)化(例如遷移學習、多任務(wù)學習、元學習等),這些方法均可以對小樣本引起的模型魯棒性等問題進行改善。
本文旨在結(jié)合Hough 變換和K-means 聚類算法,對含有噪聲的無人機隊列進行類型識別。針對無人機數(shù)目較少影響參數(shù)空間交點求解與聚類效果的問題,提出了一種基于高斯模型的原始數(shù)據(jù)增廣方法,將原始數(shù)據(jù)與生成的虛擬數(shù)據(jù)融合,以提高聚類算法的精度及魯棒性。將這些圖形空間中的無人機坐標點數(shù)據(jù)通過Hough 變換映射為參數(shù)空間中的正弦曲線,統(tǒng)計這些正弦曲線的交點,去除重疊交點數(shù)較少的數(shù)據(jù)點,將剩余交點進行K-means 聚類,用聚類后的交點即可得到原圖像空間中直線的參數(shù)。
本文首先介紹了Hough 變換和K-means 聚類算法的基本原理。然后,通過分析含雜波小樣本隊列信息帶來的問題,詳細介紹了編隊類型抗擾識別算法流程。最后,以常見的菱形隊列為例,通過計算機仿真對算法的有效性進行了分析。
Hough 變換[13]由Paul Hough 提出,它的基本原理是利用圖像空間和Hough 參數(shù)空間的點-線對偶性,將圖像空間中的檢測問題轉(zhuǎn)換至參數(shù)空間中進行。以直角坐標系為例,在直角坐標系中的直線,其斜率-截距表達式如式(1),式(1)可等價變換為式(2)。
將x,y視為參數(shù),k和b視為自變量,則x-y平面中的每一個點都對應(yīng)k-b平面中的一條直線,因此,x-y平面中同一條直線上的點可以轉(zhuǎn)換成kb平面中的多條直線,這些直線的交點即可確定xy平面中這條直線的參數(shù)[4]。
這種基于斜率-截距表達式的Hough 變換,對于垂直于x軸的直線很難進行表達,因此Dude等[13]將極坐標引入,把直角坐標系中的數(shù)據(jù)轉(zhuǎn)換到極坐標系表示。直線L的極坐標表達式為
式中,ρ表示圖像空間中原點到直線的垂線段的長度,而θ表示這條垂線與極坐標中極軸的夾角。若將x,y看作是參數(shù),對應(yīng)地將ρ和θ看作是自變量,那么直線L上的任意一點都可以轉(zhuǎn)變成極坐標系下的一條正弦曲線,如圖1 所示。這些參數(shù)空間中的正弦曲線交于一點,這一點對應(yīng)的ρ和θ即可確定直線L的表達式。
圖1 直線樣本及其Hough變換后曲線Fig.1 Straight line samples and their Hough transformed curves
K-means[14]為最常用的基于歐氏距離的聚類算法,該算法的使用基于一個基本前提,那就是如果兩個目標在歐氏距離度量下的距離越小,那么他們的相似度就越大。本文對提取到的候選交點使用K-means 聚類得到類中心,以類中心作為最終選擇的直線參數(shù),下面是算法的詳細介紹。
K-means 算法大致分為三步,第一步初始化類中心,第二步將數(shù)據(jù)點分配給最近的類中心,第三步更新類中心。其中第二步和第三步迭代進行,直到最后類中心穩(wěn)定收斂。
針對第一步類中心的選擇,可以隨機選擇k個數(shù)據(jù)點,也可使用Lloyd[15]、K-means++[16]、SKMeans++[17]等方法動態(tài)選擇。經(jīng)過綜合比較,本文最終使用K-means++選擇初始化k個類中心。
本章將詳細介紹本文提出的基于高斯模型增廣原始數(shù)據(jù)的無人機編隊類型抗擾識別算法。首先分析了當樣本數(shù)據(jù)較少,且含有噪聲干擾時,直接使用Hough 變換會帶來的問題。進而提出使用高斯模型對原始數(shù)據(jù)進行增廣,以獲得更好的交點提取與聚類效果。
本章以菱形隊列為例,詳細闡述了使用Hough變換,K-means 聚類進行隊形輪廓提取的方法。在該方法中將無人機編隊中的單個無人機視作一個坐標點,根據(jù)無人機群中各個無人機的相對位置將其抽象為一個點集,每個點由一個橫縱坐標表示,然后以該點集作為識別算法的輸入數(shù)據(jù),在菱形編隊示例中,該編隊的16 架無人機對應(yīng)著二維平面中的16 個坐標點,如圖2 所示,算法的具體流程如圖3所示。
圖2 帶擾動的菱形隊形數(shù)據(jù)Fig.2 Perturbed diamond formation data
在實際應(yīng)用中,可以通過雷達等觀測設(shè)備獲得無人機群的位置信息,再對獲得的觀測數(shù)據(jù)按照上述邏輯進行轉(zhuǎn)換,從而應(yīng)用該識別算法進行編隊類型的識別。
在實際應(yīng)用過程中,即使無人機保持直線編隊行進,受采集設(shè)備精度及噪聲影響,采集到的數(shù)據(jù)點也無法完美分布在同一直線上,這將導致參數(shù)空間中的曲線無法相交于一個點[18],如圖4所示。
圖4 帶擾動的直線樣本及其Hough變換后曲線Fig.4 The perturbed straight line sample and its Hough transformed curve
與圖1相比,圖4在原始圖像空間中的點不再完美符合直線分布,這樣一來,在參數(shù)空間中的曲線會相交于多個點。相交的點數(shù)增加無疑為問題的求解帶來了難度,需要求解的交點數(shù)增加,求得交點后如何選擇或融合為合適的一個點成為一個新的問題。
針對以上問題,已有前人的研究[4,19]選擇使用聚類算法來獲得最終的解,通過提取相交曲線數(shù)大于一定閾值的候選點,對候選點進行聚類,以最終的類中心作為結(jié)果。這樣的方法取得了不錯的效果。但由于在小樣本無人機編隊類型識別中,無人機的數(shù)目較少,可獲得的候選交點也會較少,聚類數(shù)據(jù)的不足無疑會嚴重影響聚類算法的準確性。因此本文提出了使用高斯模型在一定的小范圍內(nèi)增廣原始數(shù)據(jù),將原始數(shù)據(jù)與生成的虛擬數(shù)據(jù)一同進行Hough 變換與聚類,有效地增加了參數(shù)空間中的候選交點數(shù),為聚類算法提供了更加充足的數(shù)據(jù),能夠獲得更好的聚類效果。具體方法是將原始數(shù)據(jù)點視作一個高斯分布,而非獨立的點,則可以一定的方差σ,按照式(4)所示二維高斯概率分布來生成虛擬數(shù)據(jù)。
式中,(μ1,μ2)對應(yīng)原始數(shù)據(jù)中的點(x,y),σ1與σ2為高斯分布中的標準差,為不失一般性,在本文中使用σ=σ1=σ2。圖5 即為對原始數(shù)據(jù)中每個點使用σ= 0.2 的二維高斯分布生成10 個虛擬數(shù)據(jù)點后的結(jié)果。
圖5 高斯增廣后數(shù)據(jù)分布Fig.5 Gaussian augmented data distribution
得到增廣的數(shù)據(jù)后,對其使用Hough 變換即可得到參數(shù)空間的正弦曲線。為直觀展示數(shù)據(jù)增廣為交點選取帶來的有利影響,圖6 給出了原始數(shù)據(jù)和增廣后數(shù)據(jù)的參數(shù)空間曲線。
圖6 增廣后的樣本及其Hough變換后曲線Fig.6 Augmented samples and their Hough transformed curves
從圖中可以看出,使用高斯分布對原始數(shù)據(jù)進行增廣后,參數(shù)空間中的線條數(shù)增多,對應(yīng)的交點數(shù)也明顯增加,這將大大提高算法對原始數(shù)據(jù)中噪聲的魯棒性。
由于使用計算機對曲線進行處理的過程中,直接在參數(shù)空間中通過曲線的解析式來獲得交點的解析解計算成本過高,可實施性不強,所以需要恰當?shù)碾x散化手段對參數(shù)空間曲線進行離散化處理,然后根據(jù)離散化的結(jié)果,統(tǒng)計相交于同一點的曲線數(shù),根據(jù)統(tǒng)計的重疊交點分布設(shè)定合適閾值獲得最后用于聚類的候選交點。離散化間隔如果選取過大,則在同一個離散網(wǎng)格內(nèi)會囊括過多的點,甚至會包含進一些錯誤的交點;間隔若選取過小,則容易導致落在同一離散網(wǎng)格內(nèi)的點過少而錯過最優(yōu)交點,所以合適的離散化間隔選擇將尤為重要,如圖7 所示,即為選取Δθ為0.1 rad,Δρ為0.1 m時統(tǒng)計的重疊交點數(shù)分布圖。
圖7 重疊交點分布圖Fig.7 Overlapping intersection plots
統(tǒng)計出重疊交點數(shù)分布后,通過選擇合適的閾值提取出峰值點,提取出的峰值點將作為聚類的候選交點。重疊交點數(shù)的提取依賴合適的閾值,閾值選取過大會造成數(shù)據(jù)丟失,選取過小則會放大雜波干擾,影響后續(xù)的聚類效果,所以合適的閾值選擇也尤為重要,峰值點提取出來后便可以進一步聚類分析[20]。
得到提取出的峰值點后,應(yīng)用K-means++進行初始類中心的選取,接著使用通用K-means 算法進行聚類,在參數(shù)空間中獲得期望的類中心,具體步驟如下:
(1)首先從候選交點數(shù)據(jù)集X={(θi,ρi),i=1,2,3...N}中隨機均勻選擇一個數(shù)據(jù),將此數(shù)據(jù)點作為第一個初始類中心,記為c1。
(2)計算從每個數(shù)據(jù)點到已選擇類中心(初始時僅有c1)的距離。將cj和各個數(shù)據(jù)點xm之間的歐幾里得距離表示為d(xm,cj)。
(3)在數(shù)據(jù)集X中選擇余下的類中心,選擇的概率遵循
式中,Cp表示最接近cp的所有數(shù)據(jù)點的集合,即每次選擇類中心時,其被選擇概率與它到已選最近中心的距離成負相關(guān)。
(4)迭代步驟(3),直到選擇到了k個類中心。
使用K-means++選擇到k個類中心后,就可以在數(shù)據(jù)中迭代更新類中心直至最后收斂,具體步驟如(5)~(7)。
(5)計算所有數(shù)據(jù)點到每個類中心的歐幾里得距離,將每個數(shù)據(jù)點分配給離其最近的類中心,即對每一個樣本xp,將會按照式(6)分配給集合S(t):
式中,t代表迭代次數(shù)。
(6)計算每個簇S(t)中數(shù)據(jù)點的平均值,將此平均值作為新的k個類中心,
(7)迭代進行(5)、(6)步驟,直到最終的類中心不再改變。
至此,提取出的峰值點通過K-means 聚類算法提取出各個簇的類中心,將參數(shù)代回式(3)即可獲得在原始圖像空間取出的直線,如圖8所示。
圖8 高斯增廣后數(shù)據(jù)點的聚類與邊界提取Fig.8 Clustering and boundary extraction of data points after Gaussian augmentation
可以注意到,雖然菱形只有四條直線,但提取出的類中心是6個,對應(yīng)著6條直線。這是因為正弦函數(shù)具有周期性,所以在選取計算的窗口中可能存在多于期望直線數(shù)的交點。但這些周期性的點映射回原圖像空間后會重疊,經(jīng)過適當?shù)臑V波后便能融合在一起。獲得提取到的隊形輪廓后,使用模板匹配或神經(jīng)網(wǎng)絡(luò)等方法即可獲得編隊類型識別結(jié)果。
本文聚焦于無人機隊形識別,在常見的無人機隊形中選取了較為復(fù)雜的菱形隊列,通過生成含有噪聲的菱形無人機隊列數(shù)據(jù)來評估所提方法對編隊類型的識別性能。直接對原始數(shù)據(jù)使用識別算法與在高斯增廣后對數(shù)據(jù)使用抗擾識別算法的仿真結(jié)果對比如圖9所示。
圖9 原始數(shù)據(jù)與使用增廣數(shù)據(jù)仿真結(jié)果對比Fig.9 Comparison of original data and simulation results using augmented data
從實驗結(jié)果可以看到,在使用基于高斯模型的增廣數(shù)據(jù)后,可用于聚類的候選交點數(shù)目明顯增加,由此也獲得了更好的聚類效果。從最后映射回圖像空間的結(jié)果來看,使用增廣數(shù)據(jù)后提取的直線也更加準確。直接在原始數(shù)據(jù)上提取雖然提取到了正確的邊界,但還提取出了兩條錯誤的直線(另一條由于偏移過大,沒有顯示在圖9 選擇展示的范圍中)。這有力證明了使用基于高斯模型的增廣數(shù)據(jù)后,算法的魯棒性得到了顯著提升。
為進一步探索基于高斯模型的增廣數(shù)據(jù)對最終效果的影響,本文通過變化高斯模型中的標準差σ,探索不同σ對最終直線提取效果的影響。本文使用最終提取的隊形邊界直線的k,b參數(shù)與期望的標準直線的k,b參數(shù)的均方誤差作為評估指標。均方誤差越低,說明提取出的邊界信息越準確,具體結(jié)果如表1所示。
表1 使用不同σ得到邊界參數(shù)的均方誤差Table 1 Use different σto get the MSE of the boundary parameters
從表中可以看出,在使用了基于高斯模型的增廣數(shù)據(jù)后,模型提取出的隊形邊界更為準確,這是因為高斯分布的增廣數(shù)據(jù)有效增加了參數(shù)空間中的交點數(shù),使K-means 聚類算法表現(xiàn)得更加穩(wěn)定。除此之外,由于原始數(shù)據(jù)量小,且存在噪聲,加入額外高斯分布的數(shù)據(jù)能夠有效緩解原始數(shù)據(jù)中噪聲對識別算法帶來的負面影響。
本文所采用的算法與前面提到的數(shù)據(jù)增強方法有一定的相似性,但又略有不同,在做法上都是添加一定的高斯噪聲生成新的數(shù)據(jù),前面提到的數(shù)據(jù)增強算法是直接生成高斯噪聲納入訓練數(shù)據(jù),而本文是將生成的高斯噪聲圍繞原始數(shù)據(jù)點展開,即以原始數(shù)據(jù)作為原點生成相應(yīng)的噪聲,這樣能夠更好地保留數(shù)據(jù)的特征。
從實驗結(jié)果來看,基于高斯模型擴充原始數(shù)據(jù)后,使用Hough 和K-means 算法能夠有效提取出無人機隊形邊界,這樣一來再使用模板匹配或神經(jīng)網(wǎng)絡(luò)分類等方法就能輕松地識別無人機的編隊類型。
通過可視化的方式對仿真結(jié)果進行更加直觀的分析,如圖10 所示,可以看到當標準差等于0.3 時識別結(jié)果的均方誤差最小(0.46),以0.1的步長對標準差進行增大或者減小時,均方誤差均會增大,并且當標準差小于0.1 或者大于0.5時,均方誤差急劇增大,在0.1~0.5的范圍內(nèi)變化則較為平緩。
圖10 邊界參數(shù)的均方誤差隨高斯模型標準差的變化Fig.10 The variation of mean square error of boundary parameters with Gaussian model standard deviation
仿真結(jié)果中原始模型的均方誤差高達45.1,而本文采用的方法可以將均方誤差降低至0.46,證實了方法的有效性。
為了進一步證實本文提出的基于高斯數(shù)據(jù)增廣的小樣本數(shù)據(jù)無人機編隊類型抗擾識別算法對多種常見無人機編隊類型識別的有效性,設(shè)計帶有噪聲的縱行及楔形編隊并使用該算法進行識別,其對應(yīng)的待識別增廣數(shù)據(jù)和圖像空間邊界提取如圖11、圖12所示。
圖11 待識別編隊增廣數(shù)據(jù)Fig.11 The formation to be identified
圖12 圖像空間提取的邊界Fig.12 The boundary of image space
可以看到,本文提出的基于高斯數(shù)據(jù)增廣的小樣本數(shù)據(jù)無人機編隊類型抗擾識別算法在菱形編隊、楔形編隊、縱行編隊等常見編隊類型的邊界提取中均有著不錯的效果,在此邊界提取的基礎(chǔ)上可以進一步地有效進行編隊類型的判斷。
本文提出的基于高斯模型增廣原始數(shù)據(jù)的無人機機群特征聚類算法,將原始數(shù)據(jù)點視作一個高斯分布,而非獨立的點,從而將編隊中原始點擴充得到更豐富的候選點用于參數(shù)空間聚類,聚類得到的結(jié)果也更加趨近于真實值。這種方法的顯著優(yōu)點是對噪聲或者缺失值有著相當好的魯棒性,因為圍繞每個原始點額外添加的數(shù)據(jù)點有效地抵消了噪聲的影響,豐富了樣本的特征。另外,相對于如文獻[3]所用到的基于模板匹配的識別算法來說,本文的算法流程簡化了特征提取步驟的繁雜計算,避免了針對隊形規(guī)律的公式推導,從而提高了匹配并識別不同類型編隊的靈活性;而相對于近期興起的機器學習方法來說[5],本文所采用的算法不依賴大規(guī)模數(shù)據(jù)集來訓練網(wǎng)絡(luò),僅需要少量樣本來建立模板庫即可,很適合敵方無人機信息有限的應(yīng)用場景。
本文創(chuàng)新性地提出了通過將無人機編隊原始數(shù)據(jù)點視作一個高斯分布的方式對原始數(shù)據(jù)進行增廣,在增廣數(shù)據(jù)的基礎(chǔ)上通過使用Hough 變換、離散化參數(shù)空間、統(tǒng)計重疊交點并提取聚類候選點、對候選點進行K-means 聚類的方法實現(xiàn)了對無人機隊形輪廓的提取,并以帶有噪聲的菱形編隊為例通過仿真實驗驗證了方法的有效性。其中,將原始數(shù)據(jù)中的每個點視作一個高斯分布的數(shù)據(jù)增廣方式以及離散化參數(shù)空間以進行交點統(tǒng)計的交點計算方式均是本文的重點創(chuàng)新點,如前文所述,前者有效改善了候選點的聚類效果,提取出了更加準確的邊界參數(shù),后者則大大提高了交點統(tǒng)計的計算效率。文中也對應(yīng)用該方法到工程場景中時的數(shù)據(jù)來源、數(shù)據(jù)處理方式進行了分析和說明。通過該方法提取出的無人機隊形輪廓能夠為編隊類型識別提供良好的特征表示。
本文提出的使用高斯模型增廣原始小樣本數(shù)據(jù)的方式,為后續(xù)的聚類算法提供了更加豐富的樣本,提高了聚類算法的魯棒性,為之后的相關(guān)研究提供了很好的參考。在使用Hough 變換提取隊形輪廓時,正弦函數(shù)帶來的周期性重復(fù)點的去重問題還有待進一步研究。