涂 豫
(1.河南工業(yè)職業(yè)技術(shù)學(xué)院,河南 南陽 473000;2.華中科技大學(xué),湖北 武漢 430074)
作為一種監(jiān)督分類問題,合成孔徑雷達(dá)(SAR)目標(biāo)分類在近三十年時(shí)間內(nèi)得到了廣泛研究[1]。一般地,SAR目標(biāo)分類方法主要通過特征提取和分類決策兩個(gè)階段實(shí)施。特征提取階段獲得原始SAR圖像中目標(biāo)的幾何形狀、投影變換以及電磁散射等特征。文獻(xiàn)[2—5]基于目標(biāo)區(qū)域、輪廓、陰影等幾何形狀特征設(shè)計(jì)SAR目標(biāo)分類方法。文獻(xiàn)[7—11]采用主成分分析(PCA)、非負(fù)矩陣分解(NMF)、單演信號(hào)、非下采樣剪切波等信號(hào)處理算法獲得SAR圖像特征進(jìn)而用于目標(biāo)分類。文獻(xiàn)[12—14]以屬性散射中心為基本特征進(jìn)行SAR目標(biāo)分類。在分類階階段,通常采用現(xiàn)有的經(jīng)典分類器對(duì)提取特征進(jìn)行類別決策,例如K近鄰(KNN)[15]、支持向量機(jī)(SVM)[16]、稀疏表示分類(SRC)[17]等。可以看出,傳統(tǒng)的SAR圖像目標(biāo)分類算法在特征和分類之間存在一定的割裂,這也可能影響最終的分類精度。近年來提出并被廣泛運(yùn)用的深度學(xué)習(xí)模型在信號(hào)、圖像處理領(lǐng)域性能十分優(yōu)越。文獻(xiàn)[18—23]就是基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)設(shè)計(jì)SAR目標(biāo)分類方法。深度學(xué)習(xí)模型通過端到端的多層網(wǎng)絡(luò)實(shí)現(xiàn)輸入到類別的非線性變換,實(shí)現(xiàn)了特征學(xué)習(xí)和分類決策的一體化。根據(jù)公開報(bào)道,基于CNN的SAR目標(biāo)分類方法相比傳統(tǒng)方法具有一定的性能優(yōu)勢(shì)。然而,擴(kuò)展操作條件下的SAR目標(biāo)分類問題仍然是本領(lǐng)域的重難點(diǎn)問題。本文針對(duì)此問題,提出了基于貝葉斯卷積神經(jīng)網(wǎng)絡(luò)與數(shù)據(jù)增強(qiáng)的SAR圖像目標(biāo)分類方法。
貝葉斯卷積神經(jīng)網(wǎng)絡(luò)[24,-25]是貝葉斯理論與深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)結(jié)合的產(chǎn)物,通過將貝葉斯概率理論用于網(wǎng)絡(luò)參數(shù)學(xué)習(xí)獲得更為穩(wěn)健的分類網(wǎng)絡(luò)。在貝葉斯卷積神經(jīng)網(wǎng)絡(luò)中,通過對(duì)模型參數(shù)w施加一定的先驗(yàn)概率模型可有效推斷模型權(quán)重的分布規(guī)律,從而實(shí)現(xiàn)概率意義上的卷積神經(jīng)網(wǎng)絡(luò)理解,其中,權(quán)重參數(shù)w~p(w)服從標(biāo)準(zhǔn)的高斯先驗(yàn)分布。假設(shè)fw(x)為網(wǎng)絡(luò)輸出,p(y|fw(x))為模型的似然函數(shù)。記L(X,Y)和(x,y)分別為訓(xùn)練集和測(cè)試集,根據(jù)貝葉斯理論可得權(quán)重參數(shù)的后驗(yàn)概率為p(w|L)。對(duì)于多類別分類問題,采用Softmax函數(shù)對(duì)輸出進(jìn)行抽樣定義似然函數(shù)如下:
P(y=c|x,w)=Softmax(fw(x))
(1)
其中,模型的輸出預(yù)測(cè)為:
(2)
具體到分類問題中,可采用Monte-Carlo積分進(jìn)行求解,分類預(yù)測(cè)的表達(dá)式如下:
(3)
鑒于貝葉斯卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)良特性,本文將其運(yùn)用于SAR圖像目標(biāo)分類。具體地,設(shè)計(jì)如表1所示的貝葉斯卷積神經(jīng)網(wǎng)絡(luò)(以10類目標(biāo)分類為例),實(shí)現(xiàn)端到端的訓(xùn)練和分類。該網(wǎng)絡(luò)參照文獻(xiàn)[18]中的全卷積結(jié)構(gòu),共包括四個(gè)卷積層。在前兩個(gè)卷積層后分別接最大值池化層;采用Relu函數(shù)作為各個(gè)卷積層之后的激活函數(shù);最終,通過Softmax分類器進(jìn)行分類。通過貝葉斯卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法獲得最佳的網(wǎng)絡(luò)參數(shù),用于后續(xù)的分類。
表1 貝葉斯卷積神經(jīng)網(wǎng)絡(luò)的各層描述Tab.1 The descriptions of the designed Bayesian CNN
數(shù)據(jù)增強(qiáng)的目的是獲得更多的可用訓(xùn)練樣本,從而提高分類網(wǎng)絡(luò)的適應(yīng)性和穩(wěn)健性。為此,本文通過數(shù)據(jù)增強(qiáng)獲得更多的訓(xùn)練樣本對(duì)表1所示的貝葉斯卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。具體地,本文采用圖像平移和噪聲添加兩種途徑進(jìn)行數(shù)據(jù)增強(qiáng)。圖像平移過程中,以原始SAR圖像中心為參照,分割64×64大小的中心區(qū)域(與設(shè)計(jì)的貝葉斯卷積神經(jīng)網(wǎng)絡(luò)保持一致),同時(shí)對(duì)切割區(qū)域中心進(jìn)行平移,步長設(shè)置為2像素,最大平移量設(shè)置為20像素,最終可獲得21倍的訓(xùn)練樣本。在部分樣本中,目標(biāo)的一部分區(qū)域被切割,可模擬部分遮擋條件下的SAR圖像樣本。
噪聲添加分別采用加性噪聲和隨機(jī)噪聲進(jìn)行樣本構(gòu)造,其具體過程分別參照文獻(xiàn)[12]和文獻(xiàn)[18]。圖1顯示了加性噪聲(信噪比(SNR)-10 dB)和隨機(jī)噪聲(噪聲比例20%)干擾條件下SAR圖像樣本,可見二者都不同程度影響了目標(biāo)的形狀及像素分布。在實(shí)際應(yīng)用中,加性噪聲的信噪比設(shè)置為-10、-5、0、5和10 dB;隨機(jī)噪聲的比例設(shè)置為5%、10%、15%、20%。通過數(shù)據(jù)增強(qiáng)可以更為有效地訓(xùn)練貝葉斯卷積神經(jīng)網(wǎng)絡(luò),獲得更佳的分類性能。
圖1 噪聲干擾條件下的SAR圖像Fig.1 SAR images under noise corruption
本文提出結(jié)合貝葉斯卷積神經(jīng)網(wǎng)絡(luò)與數(shù)據(jù)增強(qiáng)的SAR目標(biāo)分類方法,具體流程如圖2所示。對(duì)于原始的訓(xùn)練樣本,采用2.1節(jié)描述的數(shù)據(jù)增強(qiáng)方法獲得擴(kuò)充后訓(xùn)練樣本。然后,通過擴(kuò)充后的訓(xùn)練集對(duì)表1所示的貝葉斯卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。分類階段,將測(cè)試樣本輸入訓(xùn)練完畢的網(wǎng)絡(luò),對(duì)其類別進(jìn)行判定。
圖2 結(jié)合貝葉斯卷積神經(jīng)網(wǎng)絡(luò)與數(shù)據(jù)增強(qiáng)的SAR目標(biāo)分類流程Fig.2 Procedure of SAR target classification based on combination of Bayesian CNN and data augmentation
訓(xùn)練階段:對(duì)訓(xùn)練圖像進(jìn)行圖像平移以及噪聲添加,基于增強(qiáng)訓(xùn)練集對(duì)貝葉斯卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,獲得有效的分類網(wǎng)絡(luò)。
分類階段:直接將測(cè)試樣本輸入訓(xùn)練完成后的貝葉斯卷積神經(jīng)網(wǎng)絡(luò),獲得測(cè)試樣本的目標(biāo)類別。
基于MSTAR數(shù)據(jù)集開展實(shí)驗(yàn),對(duì)提出的方法進(jìn)行測(cè)試。如圖3所示,該數(shù)據(jù)中包含了10類典型軍事車輛目標(biāo)的SAR圖像,分辨率達(dá)到0.3 m。該數(shù)據(jù)中樣本豐富,各類目標(biāo)SAR圖像覆蓋0°~360°方位角以及若干典型的俯仰角,為后續(xù)的網(wǎng)絡(luò)訓(xùn)練和樣本分類提供了豐富的素材。
圖3 MSTAR目標(biāo)的光學(xué)圖像Fig.3 Optical images of the MSTAR targets
實(shí)驗(yàn)中,還選用現(xiàn)有文獻(xiàn)中3類基于卷積神經(jīng)網(wǎng)絡(luò)的SAR目標(biāo)分類算法進(jìn)行對(duì)比分析,分別為文獻(xiàn)[18,21,23]中的“A-ConvNet”、“ResNet”和“ESENet”。與本文方法不同的是,這些網(wǎng)絡(luò)采用的是傳統(tǒng)的深度學(xué)習(xí)訓(xùn)練方法并且沒有充分考察樣本中可能出現(xiàn)的各類擴(kuò)展操作條件。后續(xù)實(shí)驗(yàn)分別在標(biāo)準(zhǔn)操作條件、噪聲干擾以及部分遮擋的條件下進(jìn)行,測(cè)試和分析本文方法的分類有效性和穩(wěn)健性。
3.2.1標(biāo)準(zhǔn)操作條件
標(biāo)準(zhǔn)操作條件通常在測(cè)試樣本與訓(xùn)練樣本相似度較高的情形下檢驗(yàn)分類方法的基礎(chǔ)性能,在SAR目標(biāo)分類問題中具有廣泛性和代表性。
表2給出了依托MSTAR數(shù)據(jù)集設(shè)置的一種典型標(biāo)準(zhǔn)操作條件,10類目標(biāo)的訓(xùn)練和測(cè)試樣本分別來自17°和15°俯仰角,其余條件保持一致。據(jù)此對(duì)本文方法進(jìn)行測(cè)試,獲得如圖4所示的混淆矩陣,圖中橫縱坐標(biāo)分別代表樣本的真實(shí)類別和決策類別,因此對(duì)角線元素則反應(yīng)了不同目標(biāo)的正確識(shí)別率。該矩陣直觀顯示了不同類別測(cè)試樣本經(jīng)過決策后所屬的類別比例,反映了其分類精度。對(duì)四類方法的平均分類精度進(jìn)行統(tǒng)計(jì),如表3所示,可見,在標(biāo)準(zhǔn)操作條件下,各類方法均可以取得99%以上的平均分類精度,表明卷積神經(jīng)網(wǎng)絡(luò)對(duì)于此情形的有效性。本文方法相比三類對(duì)比方法的分類精度更高,體現(xiàn)了貝葉斯卷積神經(jīng)網(wǎng)絡(luò)的性能優(yōu)勢(shì)。上述實(shí)驗(yàn)結(jié)果驗(yàn)證了本文方法在標(biāo)準(zhǔn)操作條件下的有效性。
表2 標(biāo)準(zhǔn)操作條件的訓(xùn)練和測(cè)試樣本Tab.2 Training and test samples under SOC
圖4 本文方法標(biāo)準(zhǔn)操作條件下的分類結(jié)果Fig.4 Classification results of the proposed method under SOC
表3 標(biāo)準(zhǔn)操作條件下平均分類精度Tab.3 Average classification accuracies under SOC
3.2.2噪聲干擾
SAR圖像中普遍存在噪聲并且形式復(fù)雜。本文在數(shù)據(jù)增強(qiáng)中就分別進(jìn)行了加性噪聲和隨機(jī)噪聲的樣本構(gòu)造,從而提升網(wǎng)絡(luò)對(duì)于復(fù)雜干擾的穩(wěn)健性。本實(shí)驗(yàn)向表2中的測(cè)試樣本添加不同程度的混合噪聲,即同時(shí)包含加性和隨機(jī)噪聲。其中,加性噪聲的信噪比設(shè)置為-10、-5、0、5和10 dB;隨機(jī)噪聲的比例設(shè)置為5%、10%、15%、20%。分別在各個(gè)組合下對(duì)四類方法進(jìn)行測(cè)試,統(tǒng)計(jì)分類結(jié)果如表4—表7所示。對(duì)比可見,本文方法在各個(gè)噪聲水平下均可以保持最高的分類精度,表明其對(duì)于復(fù)雜噪聲干擾的穩(wěn)健性。貝葉斯卷積神經(jīng)網(wǎng)絡(luò)在具體訓(xùn)練過程中考慮了噪聲影響,同時(shí)在訓(xùn)練樣本中加入了不同程度的噪聲樣本;因此,最終得到的分類網(wǎng)絡(luò)對(duì)于復(fù)雜噪聲的適應(yīng)性較強(qiáng)。對(duì)于三類對(duì)比方法,A-ConvNet、ResNet和ESENet的總體性能依次提升,主要是得益于網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化。然而,它們自身以及訓(xùn)練集對(duì)于噪聲干擾的考慮較少,因此在復(fù)雜噪聲干擾下的性能下降十分劇烈。
表4 本文方法在噪聲干擾下性能Tab.4 Performance of the proposed method under noise corruption
表5 A-ConvNet方法在噪聲干擾下性能Tab.5 Performance of A-ConvNet under noise corruption
表6 ResNet方法在噪聲干擾下性能Tab.6 Performance of ResNet under noise corruption
表7 ESENet方法在噪聲干擾下性能Tab.7 Performance of ESENet under noise corruption
3.2.3部分遮擋
在發(fā)生部分遮擋的情形下,局部目標(biāo)不能呈現(xiàn)在獲取的SAR圖像中。對(duì)于采用目標(biāo)全局結(jié)構(gòu)或分布特性的分類算法,部分遮擋的影響較為顯著。按照文獻(xiàn)[12]中的思路,本文對(duì)表2中的測(cè)試樣本進(jìn)行模擬遮擋。具體地,對(duì)SAR圖像中目標(biāo)區(qū)域按照設(shè)定的方向和比例進(jìn)行分割處理,并對(duì)分割后的區(qū)域以圖像中背景像素填充,最終分別在遮擋比例為10%、20%、30%、40%和50%條件下構(gòu)建測(cè)試集,然后測(cè)試并統(tǒng)計(jì)四類方法的分類性能如圖5所示。本文方法在部分遮擋條件下的性能優(yōu)勢(shì)十分明顯,特別是在遮擋比例較高的情形下。由于訓(xùn)練過程中進(jìn)行了平移切割構(gòu)造樣本,一定程度上模擬了目標(biāo)可能出現(xiàn)的不同方向、不同比例的遮擋情形;因此,最終的分類網(wǎng)絡(luò)對(duì)于部分遮擋的穩(wěn)健性也得到了提升。與噪聲干擾的情形類似,其他三類方法并沒有針對(duì)性考察可能存在的部分遮擋影響,其在遮擋條件下的性能下降十分顯著。
圖5 部分遮擋條件下的性能對(duì)比Fig.5 Performance comparison under partial occlusions
本文提出基于貝葉斯卷積神經(jīng)網(wǎng)絡(luò)與數(shù)據(jù)增強(qiáng)的SAR圖像目標(biāo)分類方法。該方法采用貝葉斯卷積神經(jīng)網(wǎng)絡(luò)獲得更為可靠的分類網(wǎng)絡(luò);通過數(shù)據(jù)增強(qiáng)可為網(wǎng)絡(luò)訓(xùn)練提供更為充足的樣本數(shù)據(jù),覆蓋噪聲干擾及部分遮擋等情形。實(shí)驗(yàn)結(jié)果表明,該方法在標(biāo)準(zhǔn)操作條件、噪聲干擾及部分遮擋條件下相比現(xiàn)有幾類方法具有更強(qiáng)的有效性和穩(wěn)健性。