周 穎,趙曉哲,逯 超
(西北工業(yè)大學(xué)電子信息學(xué)院,西安 710072)
地面目標(biāo)的檢測是對地作戰(zhàn)的基礎(chǔ),檢測的精確程度將影響對地攻擊效果。為取得戰(zhàn)場信息控制權(quán),敵方目標(biāo)的準(zhǔn)確定位與判別起著至關(guān)重要的作用。由于合成孔徑雷達是側(cè)視成像,偵查距離較遠,可以實現(xiàn)全天侯、全天時的探測、偵察,SAR成像技術(shù)在對地面目標(biāo)的檢測識別方面發(fā)揮了不可替代的作用[1-2]。
目前常用的SAR圖像目標(biāo)自動檢測系統(tǒng)主要包括預(yù)處理、目標(biāo)信息提取和目標(biāo)識別3個步驟[3-4]。SAR圖預(yù)處理是使用恒虛警率(Constant False Alarm Rate,CFAR)算法[5]、視覺注意模型等方法[6],獲取與SAR圖像背景有顯著差異的區(qū)域作為潛在目標(biāo)區(qū)域。目標(biāo)信息提取主要是對目標(biāo)的一種或多種特征進行分析和描述,通常利用目標(biāo)的灰度、形狀、紋理等特性進行潛在目標(biāo)的特征描述,以便高效地從潛在目標(biāo)中識別出正確的興趣目標(biāo)。特征鑒別通過模板匹配法、模型分類法、神經(jīng)網(wǎng)絡(luò)算法與支持向量機等分類方法對目標(biāo)與非目標(biāo)進行分類[7]。
與光學(xué)圖像不同,SAR成像過程中存在遮擋、疊掩、噪聲等情況,目標(biāo)的最終形態(tài)受SAR成像因素影響較大。如同類目標(biāo)在不同視角下可能具有完全不同的形狀和紋理,甚至?xí)c斑點噪聲相類似,這種情況在SAR分辨率不高的情況下尤為明顯。如果采用樣本訓(xùn)練學(xué)習(xí)的方法進行目標(biāo)分類,則需要預(yù)先獲取大量不同視角、不同分辨率的SAR目標(biāo)圖像,但現(xiàn)在SAR圖像目標(biāo)庫的構(gòu)建存在一定困難。因此,機器學(xué)習(xí)的方法并不能適用于所有情況的SAR目標(biāo)檢測,尤其是不確定目標(biāo)。
針對上述問題,為實現(xiàn)戰(zhàn)場中不確定性目標(biāo)的自動檢測,本文根據(jù)目標(biāo)紋理提取能夠準(zhǔn)確描述目標(biāo)的特征,并通過聚類方式對目標(biāo)與非目標(biāo)進行分類,最終實現(xiàn)場景中同類目標(biāo)的自動檢測。
雷達識別的目標(biāo)材質(zhì)往往具有較強的散射特性,因此,目標(biāo)在SAR圖像中具有較明顯的灰度特征。此外,目標(biāo)在SAR圖像中的有效特征還包括尺寸、邊緣紋理和輪廓等。且隨著分辨率的提高,照射對象的細(xì)小結(jié)構(gòu)、地物尺寸和輪廓等特征,可以得到更細(xì)致的描述,因此,對于SAR圖像中目標(biāo)進行紋理描述可以獲得更為準(zhǔn)確的特征。尺度不變特征變換[8-10](Scale-Invariant Feature Transform,SIFT)特征是一種電腦視覺的算法,用來偵測與描述影像中的局部性特征,可以同時處理尺度和仿射變換的變換,利用特征點來提取特征描述符。通過SIFT特征提取處理SAR圖像,可以很好地反映目標(biāo)的局部紋理信息,而且在光照、噪聲以及部分物體遮擋的條件下也具有良好的檢測性能。
傳統(tǒng)SIFT描述符特征點是通過計算高斯差分(Difference of Gaussian,DoG)空間中的極值點選取的,但在目標(biāo)檢測過程中,該方法不能確保極值點落在目標(biāo)區(qū)域。由于目標(biāo)在SAR圖像中具有較為明顯的灰度特征,本文采用全局CFAR算法確定SAR圖像中灰度值較高的潛在目標(biāo)區(qū)域,并選取該區(qū)域中心為構(gòu)造SIFT描述符的特征點。
訓(xùn)練目標(biāo)在SAR圖像中所占比例較小,基本不能對背景雜波分布產(chǎn)生影響,可以將整個SAR圖像作為背景雜波區(qū),通過灰度統(tǒng)計分布計算得到全局檢測閾值Tg,并將整幅圖像中像素灰度值與Tg進行比較,獲取含高亮像素點的潛在興趣目標(biāo)區(qū)域矩陣V,可以用式(1)來表示:
其中,M、N為圖像高度和寬度;Tg根據(jù)背景雜波的概率密度函數(shù)為 p(x)和虛警率 Pfa計算獲得,p(x)和Pfa之間的關(guān)系可以用式(2)來表示:
全局CFAR檢測的結(jié)果中包含了多個不同尺寸的獨立區(qū)域,即潛在目標(biāo)區(qū)域。為簡化計算,本文將目標(biāo)局部區(qū)域的質(zhì)心作為SIFT特征提取的區(qū)域中心特征點進行多尺度特征提取。
在SAR圖像中進行SIFT特征提取,需要確定以特征點為中心潛在目標(biāo)區(qū)域,該區(qū)域中包括目標(biāo)和目標(biāo)背景信息。如果該區(qū)域選取過大,特征中會過多地包含背景信息;反之,會造成紋理信息缺失。本文選取多尺度潛在目標(biāo)區(qū)域,使其既能保證目標(biāo)信息的完整性,又包含目標(biāo)的詳細(xì)紋理信息。
將全局CFAR獲取的高亮區(qū)域按面積大小對面積值進行擬合,如圖1所示。選取面積最大值,擬合曲線最高點所在面積值以及該區(qū)域間的中間高度值所在的面積值作為基準(zhǔn),選取3個面積值的外切正方形作為SIFT特征提取的局部區(qū)域,分別對其進行SIFT特征提取,并對提取特征進行PCA降維以獲得最終的SAR目標(biāo)特征描述,具體過程如下:
圖1 多尺度SIFT特征提取
SIFT特征描述是對種子點梯度方向和幅值的描述,其計算方式分別通過式(3)和式(4)獲得。
在計算SIFT描述時,對整個區(qū)域高斯加權(quán),同時采用雙線性插值的方法,對每個目標(biāo)區(qū)域的種子點均勻采樣。此時把目標(biāo)區(qū)域劃分為4×4個正方形區(qū)域,每個正方形區(qū)域一個采樣點。在計算梯度方向直方圖時,將360°分為8個方向,在新的坐標(biāo)系中計算區(qū)域內(nèi)像素點的梯度幅值和梯度幅角并進行高斯加權(quán),每個像素點的梯度以一定的權(quán)重劃分到鄰近的種子點上。梯度方向和梯度幅值分別以箭頭方向和箭頭長度表示,以每個種子點為中心對鄰近像素計算8個方向的梯度直方圖,并將其進行累加得到該種子點的描述,最終生成直方圖,得到SIFT描述向量,其構(gòu)造過程如圖2所示。
圖2 種子點向量構(gòu)造過程
針對每個特征點分別在3個不同尺度的局部區(qū)域進行SIFT特征提取,本文中多尺度SIFT向量長度(4×4)×8×3=384,比原始SIFT算法得到的特征向量大很多。此外,不同尺度的SAR目標(biāo)區(qū)域具有交叉部分,在種子的梯度方向和梯度幅值的計算過程中存在重復(fù)計算,導(dǎo)致不同尺度的特征描述存在較大的相關(guān)性。因此,該特征在能夠準(zhǔn)確描述目標(biāo)的紋理信息外,還具有較大的冗余,計算量大,且影響目標(biāo)檢測的結(jié)果。本文通過降維的方式減少特征描述向量中的冗余項。
主分量分析[11-12](Principal Component Analysis,PCA)算法的核心是求解特征描述中的主要特征分量,并用其代替目標(biāo)的特征,對目標(biāo)特征進行分類。其核心計算步驟如下:
2)求協(xié)方差矩陣的特征值及對應(yīng)的特征向量,設(shè)∑的前V個較大的特征值為0,分別對應(yīng)前V個主成分的方差值,設(shè)v對應(yīng)的單位特征向量av為主成分Fv的系數(shù),則Fv可以表達為:
主成分方差所占的比重記為b,則b可以反映Fv所包含的信息量的比重,其表達式為:
3)主成分的選擇,主成分的個數(shù)V可以通過V個主方差共同占有的比重來確定:
設(shè)定閾值Tp,當(dāng)G(m)大于該閾值時的V值用以作為SAR目標(biāo)特征向量降維處理的參數(shù)。
對于不確定環(huán)境下的多目標(biāo)檢測,其潛在目標(biāo)數(shù)量與形成的簇類的數(shù)量都是未知的。由于沒有樣本集,在選取初始聚類中心具有一定難度。基于密度的聚類DBSCAN算法[13-15],可以克服其他基于距離的算法只能發(fā)現(xiàn)“類圓形”的聚類問題。DBSCAN算法的核心是點密度的計算,并根據(jù)將該密度與設(shè)定閾值進行比較,以決定該點屬于哪一個聚類。將密度相連的點的最大集合定義為簇,具有高密度的區(qū)域劃分為簇類,在含噪聲的空間數(shù)據(jù)庫中可以發(fā)現(xiàn)任意形狀的聚類。
DBSCAN 算法通過參數(shù)(ε,MinPts)來描述鄰域數(shù)據(jù)的分布情況:ε表示數(shù)據(jù)的鄰域距離閾值,MinPts表示數(shù)據(jù)點的距離為ε的鄰域中數(shù)據(jù)點個數(shù)的閾值,圖3給出了DBSCAN算法的直觀顯示圖:
圖3 DBSCAN聚類算法示意圖
圖3中,MinPts=4,其中點A和其他紅色點為核心點,在這些點的ε鄰域內(nèi)至少包含4個點(包括點本身)。其中點B和C不是核心點,但可以從點A(或通過其他核心點)密度可達,B與C密度相連,也屬于集群;點N是一個既不是核心點也不是密度可達的噪聲點。
DBSCAN聚類算法的本質(zhì)就是由密度可達關(guān)系導(dǎo)出的最大密度相連的數(shù)據(jù)集合,其核心思想就是任選一個數(shù)據(jù)集中的核心點作為“種子”,再由此出發(fā)找出其密度可達的數(shù)據(jù)點生成聚類簇,直到所有的核心點都被訪問過。本文對SAR目標(biāo)潛在區(qū)域進行分類的具體計算過程為:
1)初始化核心對象集合Ω=?,初始化聚類簇數(shù)k=0,初始化未訪問數(shù)據(jù)點集合Γ=D;
2)檢測數(shù)據(jù)庫中的所有數(shù)據(jù)點xj,確定其ε鄰域,若包含的對象數(shù)不小于MinPts,則將xj加入核心對象集合Ω;
3)如果Ω=?,計算過程完成,反之進行 4)的計算;
4)在Ω中,隨機選取一個核心對象o,設(shè)定當(dāng)前簇核心對象隊列Ωcur={o},設(shè)定類別序號k=k+1,設(shè)定當(dāng)前簇數(shù)據(jù)集合Ck={o},并更新未訪問數(shù)據(jù)集合Γ=Γ-{o}。
5)如果當(dāng)前簇核心對象隊列Ωcur=?,則當(dāng)前聚類簇 Ck生成完畢,更新簇劃分 C={C1,C2,…,Ck},更新核心對象集合,轉(zhuǎn)入步驟3),否則轉(zhuǎn)入步驟6)。
6)在當(dāng)前簇核心對象隊列Ωcur中取出一個核心對象o',確定其ε鄰域Nε(o'),令Δ=Nε(o')∩T,更新當(dāng)前簇數(shù)據(jù)點集合Ck=Ck∪Δ,更新未訪問數(shù)據(jù)點集合 Γ=Γ-Δ,更新 Ωcur=Ωcur∪(Δ∩Ω)-{o'},轉(zhuǎn)入步驟 5)。
輸出結(jié)果為:簇劃分 C={C1,C2,…,Ck}。
1)坦克目標(biāo)檢測實驗
本實驗SAR圖像中的目標(biāo)為坦克,如圖4所示,圖中共包含了13個興趣目標(biāo)和一些灰度值較高的非目標(biāo)。首先根據(jù)全局CFAR算法確定SAR圖像中的潛在目標(biāo)區(qū)域。經(jīng)過初步檢測后的SAR圖像如圖5所示,圖中所有被標(biāo)注圓圈的區(qū)域為包含13輛坦克在內(nèi)的共計30個潛在目標(biāo)區(qū)域。
圖4 坦克SAR圖像
圖5 初步檢測結(jié)果圖
根據(jù)CFAR檢測結(jié)果確定特征點后,采取DBSCAN算法對潛在目標(biāo)的特征向量聚類,將潛在目標(biāo)劃分為目標(biāo)與非目標(biāo),具體結(jié)果如圖6所示。聚類檢測后形成聚類簇一類,含有13個檢測點,分別為13個興趣目標(biāo),剩余潛在目標(biāo)均被處理為噪聲點,檢測結(jié)果十分理想。
圖6 坦克目標(biāo)檢測圖
圖7 多類目標(biāo)檢測圖
圖8 各類目標(biāo)外形圖
DBSCAN聚類無需確定聚類簇數(shù),對于無訓(xùn)練集的多類目標(biāo)檢測問題,本算法具有一定的可行性。為了更好地驗證本文檢測算法的適應(yīng)性,本組實驗選取了一組Pleiades SAR圖像進行測試驗證,該圖像中停放了各種機型的飛機30余架,飛機大小外形迥異,此外SAR圖像還包括較多高亮非目標(biāo)區(qū)域,如圖7所示。根據(jù)本文算法對圖像進行初步檢測,篩選出40個潛在目標(biāo),由于圖像全局灰度檢測閾值較高,灰度值較小的目標(biāo)或尺寸較小的目標(biāo)未能被檢測為潛在目標(biāo)。然后,利用潛在目標(biāo)的特征向量進行聚類檢測,潛在興趣目標(biāo)被劃分為5類聚類簇。比較這5類目標(biāo)的外形,如圖8所示,其中標(biāo)注為紅色類別的目標(biāo)均為建筑物,剩下的4類為4種類型的飛機,其大小外形具有較明顯的區(qū)別,驗證了聚類的可靠性。另外部分飛機在大小外形上與其他目標(biāo)具有一定的差異性,因此被視為噪聲點。該算法的一個缺點是對于數(shù)量較少的一類目標(biāo),將無法進行目標(biāo)識別,對于聚類檢測后的噪聲點可能不僅僅含有噪聲,可能還存在低密度目標(biāo)。
從算法的適應(yīng)性來說,本文中針對單類多目標(biāo)檢測和多類多目標(biāo)檢測共做了兩組實驗,很好地驗證了算法的可行性與優(yōu)越性。對于單類多目標(biāo)檢測實驗,通過初步檢測便可以有效識別出圖中灰度值較高的顯著區(qū)域,并將其作為潛在目標(biāo),成功地檢測出了所有的興趣目標(biāo)。在目標(biāo)信息提取時,本文選取的不同尺寸目標(biāo)區(qū)域包含不同范圍的背景信息,信息提取結(jié)果既可以對目標(biāo)紋理進行準(zhǔn)確描述,又可以通過背景信息對目標(biāo)形狀進行不同程度的表達,能夠更好地利用SAR圖像中的目標(biāo)信息,虛警率要低很多。特征鑒別方面,與同樣基于多尺度SIFT特征提取的有訓(xùn)練集的檢測方法相比,聚類檢測在分辨能力和精度上還是略有差距,但神經(jīng)網(wǎng)絡(luò)和支持向量機等分類方法需要大量特征數(shù)據(jù),而且對于樣本信息的精確度要求較高。而基于特征數(shù)據(jù)分布的緊密程度來進行聚類,則不需要詳細(xì)的目標(biāo)種類、特征信息。通過實驗可以看出,聚類檢測算法可以有效地識別出眾多潛在目標(biāo)中同類型的目標(biāo),但數(shù)量少于3個的單類目標(biāo)由于數(shù)據(jù)密度較低,會被視為噪聲點,后期需要人為補判。
在復(fù)雜場景下的SAR圖像目標(biāo)檢測,傳統(tǒng)的目標(biāo)檢測方法中大量樣本及諸多先驗知識獲取困難,本文充分利用目標(biāo)在同一場景下的有效特征,提出了基于多尺度特征聚類的檢測方法,實現(xiàn)SAR圖像中同類目標(biāo)的自動檢測。通過CFAR算法對SAR圖像進行預(yù)處理,將可能的潛在目標(biāo)與背景分離,對潛在目標(biāo)進行多尺度SIFT特征提取,并進行DBSCAN聚類,從潛在目標(biāo)特征密度的角度考察目標(biāo)特征的可連接性,將特征分布緊密的興趣目標(biāo)歸為一簇,完成目標(biāo)的鑒別與分類。實驗結(jié)果表明,在無需訓(xùn)練集和諸多先驗知識的情況下,此算法在多目標(biāo)檢測中具有良好的檢測結(jié)果,能夠在包含坦克、飛機等目標(biāo)的SAR圖像中實現(xiàn)目標(biāo)檢測,為戰(zhàn)場決策提供強有力的支持。