雷 禹, 冷祥光, 周曉艷, 孫忠鎮(zhèn), 計(jì)科峰
(國(guó)防科技大學(xué)電子科學(xué)學(xué)院, 湖南 長(zhǎng)沙 410073)
合成孔徑雷達(dá)(synthetic aperture radar,SAR)采用微波相干成像,因此SAR圖像本質(zhì)上是復(fù)值的[1]。在像素信息量上SAR圖像更加豐富,這也是其和普通光學(xué)紅外遙感圖像顯著不同之處。同時(shí),SAR可以獲取全天時(shí)、全天候的二維高分辨圖像,能夠有效解決光學(xué)衛(wèi)星在夜間和不良?xì)夂蛳聼o(wú)法對(duì)海洋目標(biāo)監(jiān)視的問(wèn)題,是目前世界各國(guó)進(jìn)行海上目標(biāo)監(jiān)測(cè)的重要手段[2-3]。
在SAR圖像中,對(duì)海上的艦船目標(biāo)識(shí)別是SAR艦船圖像信息解譯的重要組成,也是多衛(wèi)星協(xié)同海洋監(jiān)測(cè)中一個(gè)重要環(huán)節(jié)。艦船目標(biāo)識(shí)別的目的是判斷出艦船所屬類(lèi)別,在軍事上可以用于分析軍事行動(dòng)和進(jìn)行軍事偵察,及時(shí)獲取海上作戰(zhàn)的相關(guān)軍事情報(bào)。在民用領(lǐng)域上可以應(yīng)用于監(jiān)視海運(yùn)交通、維護(hù)海洋權(quán)益等方面。相比于SAR圖像艦船目標(biāo)檢測(cè),利用SAR圖像進(jìn)行艦船目標(biāo)識(shí)別的相關(guān)研究起步較晚,因此具有重要的研究意義[4]。
當(dāng)前SAR圖像艦船目標(biāo)識(shí)別方法可以總結(jié)為:① 基于有效特征提取的識(shí)別方法。通過(guò)提取有效特征可以從不同角度描述圖像中目標(biāo)特性,再選擇有效的分類(lèi)方法進(jìn)行目標(biāo)識(shí)別。目前特征表達(dá)方法主要分為空間特征、統(tǒng)計(jì)特征、變換域特征和代數(shù)特征[5]。② 基于特征融合的識(shí)別方法。通過(guò)特征融合可以增加圖像的特征信息,實(shí)現(xiàn)更加全面的特征表達(dá)[6]。③ 基于模型匹配的識(shí)別方法。根據(jù)訓(xùn)練圖像獲取模型預(yù)測(cè)特征,再通過(guò)匹配模型的預(yù)測(cè)特征和圖像的提取特征來(lái)實(shí)現(xiàn)目標(biāo)識(shí)別。④ 基于SAR成像原理和地物電磁散射機(jī)理的識(shí)別方法。使用目標(biāo)的強(qiáng)散射信息[7]、SAR數(shù)據(jù)中方位不變性等特征[8]來(lái)提高分類(lèi)識(shí)別精度。⑤ 基于深度學(xué)習(xí)的識(shí)別方法。隨著深度學(xué)習(xí)方法的快速發(fā)展,已經(jīng)被廣泛地應(yīng)用到目標(biāo)識(shí)別的領(lǐng)域中,通過(guò)使用無(wú)監(jiān)督[9]或監(jiān)督學(xué)習(xí)方法的機(jī)器學(xué)習(xí)特征建立低級(jí)特征和高級(jí)語(yǔ)義之間的關(guān)系,大大提升了目標(biāo)識(shí)別的準(zhǔn)確性,也充分體現(xiàn)了深度學(xué)習(xí)在目標(biāo)識(shí)別中的巨大優(yōu)勢(shì)和潛力。
近年來(lái),卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)、全卷積網(wǎng)絡(luò)(fully convolutional networks, FCN)等深度學(xué)習(xí)框架用于SAR圖像目標(biāo)識(shí)別中,都取得了較好的結(jié)果。但目前應(yīng)用于SAR圖像識(shí)別的深度學(xué)習(xí)框架,都是針對(duì)其幅度信息。并且大多數(shù)學(xué)者在采用深度學(xué)習(xí)方法對(duì)SAR圖像進(jìn)行研究時(shí),認(rèn)為其包含的相位信息服從均勻分布因此不具有有用信息,故將其當(dāng)作光學(xué)圖像對(duì)待,只研究幅度信息。例如,在對(duì)OpenSARShip數(shù)據(jù)集進(jìn)行艦船目標(biāo)識(shí)別[6,10]時(shí)多采用的是地距多視(ground range detected,GRD)產(chǎn)品,在對(duì)斜距單視復(fù)數(shù)(single look complex,SLC)產(chǎn)品也只是將其轉(zhuǎn)換為幅度圖去使用,從而忽略了SAR圖像特有的復(fù)數(shù)信息。
但復(fù)數(shù)相比較于實(shí)數(shù)而言具有較好的表征能力和泛化特性[11-12]。近些年發(fā)表的文章,也表明了復(fù)數(shù)信息在語(yǔ)音識(shí)別、圖像分類(lèi)識(shí)別以及自然語(yǔ)言處理方面具有非常好的性能[13-15]。El-Darymli等[16-17]對(duì)復(fù)數(shù)SAR圖像目標(biāo)分類(lèi)問(wèn)題的研究也證明了復(fù)數(shù)信息對(duì)SAR圖像解譯的重要性。研究發(fā)現(xiàn),隨著SAR圖像分辨率的提高,完全發(fā)展的相干斑的部分假設(shè)條件并非嚴(yán)格成立,對(duì)此SAR圖像中的復(fù)數(shù)信息可以有助于更加完整地描述艦船目標(biāo),對(duì)提升復(fù)數(shù)SAR圖像艦船目標(biāo)識(shí)別能力和檢測(cè)性能具有重要作用[1]。
本文在艦船目標(biāo)識(shí)別應(yīng)用中考慮到SAR圖像的本質(zhì)特征,首先進(jìn)行輸入層隱式復(fù)數(shù)信息增強(qiáng),將SAR圖像的實(shí)部、虛部和幅度三通道信息進(jìn)行組合,使輸入數(shù)據(jù)包含復(fù)數(shù)信息表示。其次,在ResNet18網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行改進(jìn),通過(guò)引入通道注意力機(jī)制使網(wǎng)絡(luò)可以自適應(yīng)學(xué)習(xí)到實(shí)部、虛部和幅度三通道之間的復(fù)數(shù)信息。再次,針對(duì)復(fù)數(shù)數(shù)據(jù)集樣本較少,可能在網(wǎng)絡(luò)訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合現(xiàn)象,引入標(biāo)簽平滑正則化(label smoothing regularization, LSR)可以有效抑制過(guò)擬合問(wèn)題。最后進(jìn)行相關(guān)實(shí)驗(yàn),驗(yàn)證了本文方法的有效性。
本文內(nèi)容將按照4個(gè)小節(jié)進(jìn)行展開(kāi):第1節(jié)介紹本文所提出的方法,詳細(xì)介紹了輸入層隱式復(fù)數(shù)增強(qiáng),引入通道注意力機(jī)制和標(biāo)簽平滑正則化改進(jìn)網(wǎng)絡(luò)的方法與原理;第2節(jié)為實(shí)驗(yàn)數(shù)據(jù)與配置;第3節(jié)為實(shí)驗(yàn)結(jié)果與分析,在OpenSARShip數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),并與經(jīng)典神經(jīng)網(wǎng)絡(luò)方法進(jìn)行對(duì)比分析;第4節(jié)對(duì)本文內(nèi)容進(jìn)行總結(jié)。
本文所提出的基于改進(jìn)網(wǎng)絡(luò)的復(fù)數(shù)SAR圖像艦船目標(biāo)識(shí)別方法的整體架構(gòu)如圖1所示。其主要分為4部分:第1部分是輸入層隱式復(fù)數(shù)信息增強(qiáng),將SAR圖像的實(shí)部、虛部和幅度三通道信息進(jìn)行組合,增加復(fù)數(shù)信息表示;第2部分是基于ResNet18網(wǎng)絡(luò)引入通道注意力機(jī)制,使網(wǎng)絡(luò)能夠自適應(yīng)學(xué)習(xí)三通道之間的復(fù)數(shù)信息。第3部分是引入LSR,解決因復(fù)數(shù)數(shù)據(jù)集樣本少出現(xiàn)的過(guò)擬合問(wèn)題。第4部分是獲得識(shí)別結(jié)果。
圖1 本文方法整體架構(gòu)圖
目前絕大多數(shù)的研究者直接將基于深度學(xué)習(xí)的光學(xué)圖像處理方法遷移到SAR處理中,該方法只應(yīng)用了SAR圖像的幅度信息而忽略了復(fù)數(shù)信息。但是,SAR圖像復(fù)數(shù)信息中包含了更豐富的目標(biāo)特征信息[18],可用復(fù)數(shù)形式表示:
(1)
式中:i為實(shí)部;q為虛部; j為虛部單位;A為幅度;φ為相位信息,φ=arctan(q/i)。
在本文方法中從SAR圖像的本質(zhì)出發(fā),通過(guò)組合SAR圖像的實(shí)部、虛部和幅度三通道信息,隱式地提供了輸入數(shù)據(jù)復(fù)數(shù)信息表示。其實(shí)現(xiàn)過(guò)程由圖2所示。
圖2 輸入層隱式復(fù)數(shù)信息增強(qiáng)
本文提出了3種輸入層隱式復(fù)數(shù)信息增強(qiáng)方式:第1種方式是將復(fù)數(shù)SAR圖像中的實(shí)部i、虛部q和幅度A三通道信息直接進(jìn)行組合,并保留其16位原始灰度,可以表示為
Z1=[iq;A]
(2)
第2種方式在第1種方式的基礎(chǔ)上進(jìn)行處理,將數(shù)據(jù)的像素值縮放到0~255區(qū)間,如下所示:
(3)
式中:Z1_pixel表示第1種增強(qiáng)方式輸入數(shù)據(jù)的像素值。
考慮到負(fù)數(shù)像素值的影響,第3種方式是將第1種處理方式的實(shí)部i、虛部q分別加上絕對(duì)值處理再與幅度A進(jìn)行組合,并保留其16位原始灰度,可以表示為
Z3=[|i|; |q|;A]
(4)
圖3為3種輸入層隱式復(fù)數(shù)信息增強(qiáng)方式的可視化過(guò)程,展示了貨輪在3種增強(qiáng)方式下的實(shí)部圖像、虛部圖像和幅度圖像,以及復(fù)數(shù)信息增強(qiáng)圖像。3種增強(qiáng)方式下對(duì)幅度圖像的處理方式相同。在實(shí)部與虛部的處理上,第1種增強(qiáng)方式Z1最大程度保存了像素值,實(shí)部和虛部中含有復(fù)數(shù)像素值。第2種增強(qiáng)方式Z2按照傳統(tǒng)圖像處理方法將像素值縮放到0~255區(qū)間,將小于0的像素值統(tǒng)一變?yōu)?,在圖像中顯示為黑色。所以可以觀察到第2種方式下的實(shí)部與虛部圖像的顏色更深,但相較于第1種增強(qiáng)方式的實(shí)部和虛部圖像像素信息有一定損失。第3種增強(qiáng)方式Z3考慮到負(fù)數(shù)像素值的影響,并保證可以最大程度利用復(fù)數(shù)信息,加絕對(duì)值處理后將負(fù)數(shù)像素值變?yōu)檎?。通過(guò)觀察可以發(fā)現(xiàn),第3種增強(qiáng)方式下實(shí)部和虛部圖像相較于前兩種可以更好表示出艦船目標(biāo)信息。通過(guò)圖3總體可以觀察到實(shí)部圖像、虛部圖像和幅度圖像之間具有差異性,實(shí)部和虛部圖像展示出了艦船目標(biāo)不同的細(xì)節(jié)信息。所以,將復(fù)數(shù)SAR圖像的實(shí)部、虛部和幅度三通道信息進(jìn)行組合,可以更好利用復(fù)數(shù)信息的細(xì)節(jié)表示,在復(fù)數(shù)層面更加完整地描述艦船目標(biāo)。
圖3 輸入層隱式復(fù)數(shù)信息增強(qiáng)可視化過(guò)程
進(jìn)行圖像預(yù)處理過(guò)程通常會(huì)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使得輸入網(wǎng)絡(luò)的數(shù)據(jù)呈現(xiàn)一個(gè)穩(wěn)步的分布。其優(yōu)勢(shì)是一方面可以提升模型的精度,提高分類(lèi)器的準(zhǔn)確性;另一方面可以加快梯度下降的求解速度,加速模型收斂。但是目前在使用深度學(xué)習(xí)方法處理SAR數(shù)據(jù)時(shí),經(jīng)常直接使用由Imagenet數(shù)據(jù)集的百萬(wàn)張圖像計(jì)算得到的均值和標(biāo)準(zhǔn)差進(jìn)行標(biāo)準(zhǔn)化處理,而忽略了SAR數(shù)據(jù)集與Imagenet數(shù)據(jù)集在數(shù)據(jù)集大小、成像模式等方面的不同。因此,本文對(duì)復(fù)數(shù)信息增強(qiáng)的輸入數(shù)據(jù)使用標(biāo)準(zhǔn)分?jǐn)?shù)方法進(jìn)行標(biāo)準(zhǔn)化處理,由方差公式可得
(5)
(6)
因此,標(biāo)準(zhǔn)分?jǐn)?shù)方法的過(guò)程可表示為
(7)
依據(jù)上述公式,本文所實(shí)現(xiàn)的標(biāo)準(zhǔn)化過(guò)程只需要通過(guò)遍歷一次數(shù)據(jù)就可以獲得數(shù)據(jù)集均值和標(biāo)準(zhǔn)差,避免了占用內(nèi)存過(guò)大的問(wèn)題,大大縮短了用時(shí)。
典型的分類(lèi)識(shí)別網(wǎng)絡(luò)通過(guò)提取卷積層和池化層所融合的空間和通道信息特征對(duì)輸入的圖像進(jìn)行識(shí)別。在提高網(wǎng)絡(luò)性能時(shí),可以通過(guò)構(gòu)建深層的網(wǎng)絡(luò)結(jié)構(gòu)或者引入某些機(jī)制來(lái)增強(qiáng)網(wǎng)絡(luò)提取特征的能力。ResNet網(wǎng)絡(luò)在2015年由何凱明提出,以top1誤差為3.6%的圖像識(shí)別記錄獲得了2015年ImageNet大規(guī)模視覺(jué)識(shí)別競(jìng)賽比賽的冠軍[19]。并且目前的研究發(fā)現(xiàn),通過(guò)在網(wǎng)絡(luò)中引入注意力機(jī)制[20-22],可有效保留圖像中有價(jià)值的特征信息。
因此,本文在ResNet18網(wǎng)絡(luò)的基礎(chǔ)上引入壓縮-激勵(lì)(squeeze-and-excitation, SE)通道注意力機(jī)制模塊來(lái)提升網(wǎng)絡(luò)對(duì)通道特征的敏感度。通過(guò)對(duì)輸入數(shù)據(jù)的實(shí)部、虛部和幅度三通道進(jìn)行權(quán)重調(diào)整,可以實(shí)現(xiàn)自適應(yīng)關(guān)注各通道的有用特征和學(xué)習(xí)三通道之間的復(fù)數(shù)信息。圖4為改進(jìn)的ResNet18的網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖4 改進(jìn)的ResNet18的網(wǎng)絡(luò)結(jié)構(gòu)圖
圖5 SE通道注意力模塊結(jié)構(gòu)圖
壓縮操作過(guò)程如圖5中紅色框所示,這個(gè)過(guò)程對(duì)應(yīng)一個(gè)全局平均池化的操作,可以將全局空間信息壓縮到一個(gè)通道描述中。激活操作如圖5藍(lán)色框所示,包含兩個(gè)全連接層。第1個(gè)全連接層可以看作為一個(gè)降維率為r的降維層,將壓縮操作獲得的結(jié)果降低維度變?yōu)镃/r維向量,其中降維率r為一個(gè)固定的超參數(shù),影響網(wǎng)絡(luò)中SE通道注意力機(jī)制模塊的容量和計(jì)算開(kāi)銷(xiāo)。第2個(gè)全連接層將維度恢復(fù)為C維向量。最后通過(guò)sigmoid函數(shù)獲取各通道的權(quán)重。故通過(guò)SE通道注意力機(jī)制會(huì)保留特征圖中與權(quán)重值為1或接近1相乘的信息,而抑制與權(quán)重值小于1進(jìn)行相乘的信息,從而實(shí)現(xiàn)強(qiáng)化特征的效果。本文的網(wǎng)絡(luò)結(jié)構(gòu)分為5層,SE通道注意機(jī)制加在層2~層5結(jié)構(gòu)中,對(duì)每層結(jié)構(gòu)的輸出進(jìn)行結(jié)構(gòu)圖的可視化,如圖6所示,可知加入通道注意力及之后,網(wǎng)絡(luò)開(kāi)始更加關(guān)注艦船目標(biāo)的特征信息。
圖6 特征可視化
通常圖像的分類(lèi)識(shí)別網(wǎng)絡(luò)結(jié)構(gòu)的最后一層為全連接層,數(shù)據(jù)標(biāo)簽會(huì)以one-hot形式進(jìn)行編碼,再通過(guò)交叉損失函數(shù)進(jìn)行參數(shù)調(diào)整。這時(shí)損失函數(shù)可以表示為
(8)
式中:K表示類(lèi)別數(shù)目;k表示樣本數(shù)據(jù)集中某一類(lèi)別標(biāo)簽;p(k)為預(yù)測(cè)分布;q(k)為標(biāo)簽分布。在訓(xùn)練過(guò)程中,希望交叉損失函數(shù)可以盡可能小來(lái)更新權(quán)重參數(shù),得到最好的訓(xùn)練模型。這個(gè)過(guò)程通過(guò)softmax函數(shù)使得預(yù)測(cè)分布p(k)輸出的預(yù)測(cè)置信度分?jǐn)?shù)接近1,但是這個(gè)過(guò)程會(huì)使得正確標(biāo)簽的概率遠(yuǎn)遠(yuǎn)大于錯(cuò)誤標(biāo)簽的概率,導(dǎo)致模型的泛化能力低,出現(xiàn)對(duì)標(biāo)簽過(guò)分相信而產(chǎn)生的過(guò)擬合問(wèn)題。
本文方法在實(shí)驗(yàn)中考慮到所用的復(fù)數(shù)數(shù)據(jù)集樣本和類(lèi)別較少的情況,為避免在訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合現(xiàn)象,在模型訓(xùn)練中加入了LSR,首次提出是用于訓(xùn)練Inception-v2[24]。
LSR[25-26]通過(guò)改變真實(shí)標(biāo)簽的概率分布,加入一個(gè)超參數(shù)ε來(lái)修正標(biāo)簽分布q′(k),其中y為真實(shí)標(biāo)簽數(shù):
(9)
這時(shí)損失函數(shù)變?yōu)?/p>
(10)
因此,最優(yōu)的預(yù)測(cè)概率分布z′(k)可以表示為
(11)
式中:α可以為任意實(shí)數(shù)。
所以,LSR可以保證錯(cuò)誤標(biāo)簽的概率不為0,從而實(shí)現(xiàn)對(duì)模型的約束,防止正確標(biāo)簽的概率遠(yuǎn)遠(yuǎn)大于錯(cuò)誤標(biāo)簽的概率,從而降低過(guò)擬合現(xiàn)象。
本文實(shí)驗(yàn)所采用的數(shù)據(jù)是由上海交通大學(xué)在2017年和2018年發(fā)布的OpenSARShip數(shù)據(jù)集及其2.0版本[27-28]。該數(shù)據(jù)集是在Sentinel-1圖像上采集的,包含地距多視產(chǎn)品和斜距單視復(fù)數(shù)產(chǎn)品,具有VV極化和VH極化兩種方式。
本文主要選用OpenSARShip數(shù)據(jù)集中SLC模式和VH極化方式,該模式下SAR圖像包含復(fù)數(shù)信息,艦船數(shù)目統(tǒng)計(jì)如圖7所示。從圖7中可以看出,該數(shù)據(jù)集具有樣本不均衡的問(wèn)題,當(dāng)訓(xùn)練樣本不均衡時(shí)分類(lèi)器會(huì)將分類(lèi)邊界偏向少數(shù)的樣本目標(biāo),這樣就會(huì)導(dǎo)致少數(shù)樣本目標(biāo)幾乎都被錯(cuò)誤地識(shí)別為數(shù)目較多的樣本目標(biāo),深度學(xué)習(xí)無(wú)法訓(xùn)練出較好的模型[29]。本文希望可以更好探究針對(duì)復(fù)數(shù)信息改進(jìn)神經(jīng)網(wǎng)絡(luò)方法的性能,因此選擇其中數(shù)目較多的兩類(lèi)艦船目標(biāo)貨船和油船進(jìn)行研究,將數(shù)目較少的艦船目標(biāo)進(jìn)行舍棄,并對(duì)兩類(lèi)艦船目標(biāo)進(jìn)行了篩選和數(shù)量上均衡,兩類(lèi)目標(biāo)數(shù)量分別為760和756,并將每類(lèi)艦船隨機(jī)劃分為訓(xùn)練集和測(cè)試集,劃分比例為9∶1。
圖7 艦船數(shù)目統(tǒng)計(jì)圖
本實(shí)驗(yàn)的電腦環(huán)境為64位Windows10系統(tǒng),編程語(yǔ)言為python,深度學(xué)習(xí)框架為Pytorch。硬件采用AMD Ryzen 7 4800HS with Radeon Graphics @ 2.90 GHz,內(nèi)存為8G,顯卡為GeForce GTX 1660Ti,采用CUDA10.0和CUDNN7.5.1加速計(jì)算。實(shí)驗(yàn)超參數(shù)設(shè)置如表1所示。
表1 模型超參數(shù)設(shè)置
為驗(yàn)證本文實(shí)驗(yàn)的有效性,采用混淆矩陣,準(zhǔn)確率和精確率進(jìn)行評(píng)估。其中,混淆矩陣可以直觀展示艦船目標(biāo)被正確分類(lèi)識(shí)別的個(gè)數(shù)。并通過(guò)混淆矩陣可以進(jìn)一步計(jì)算準(zhǔn)確率Accuracy。Accuracy是指分類(lèi)模型判斷正確結(jié)果的占比,可以反映分類(lèi)器對(duì)整個(gè)樣本的判定能力。
(12)
式中:TP、FP、FN、TN分別表示為真正例、假正例、假負(fù)例和真負(fù)例。
精確率Precision用來(lái)計(jì)算每一類(lèi)艦船的分類(lèi)精度:
(13)
首先對(duì)3種輸入層隱式復(fù)數(shù)信息增強(qiáng)的輸入數(shù)據(jù)Z1、Z2和Z3進(jìn)行實(shí)驗(yàn)探究,尋找最優(yōu)的增強(qiáng)方式。并在實(shí)驗(yàn)中增加了一組只保留幅度通道信息的SAR圖像數(shù)據(jù),可以表示為Z4=[A],來(lái)驗(yàn)證復(fù)數(shù)信息在艦船目標(biāo)識(shí)別中的有效性。
實(shí)驗(yàn)中將復(fù)數(shù)增強(qiáng)的輸入數(shù)據(jù)Z1、Z2和Z3在VGG (visual geometry group) 16Net網(wǎng)絡(luò)、GoogleNet網(wǎng)絡(luò)和ResNet18網(wǎng)絡(luò)等經(jīng)典的神經(jīng)網(wǎng)絡(luò)上進(jìn)行實(shí)驗(yàn)對(duì)比。實(shí)驗(yàn)結(jié)果如表2所示。
表2 輸入層隱式復(fù)數(shù)信息增強(qiáng)實(shí)驗(yàn)結(jié)果
通過(guò)表2的實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),本文中所提出的第3種輸入層隱式復(fù)數(shù)信息增強(qiáng)方式在3種網(wǎng)絡(luò)上皆取得了最高的準(zhǔn)確率。對(duì)于第1種增強(qiáng)方式,直接將數(shù)據(jù)中的實(shí)部與虛部進(jìn)行組合的目的是希望可以最大程度上利用到復(fù)數(shù)信息,但在實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn)這樣的組合可能存在像素值正負(fù)抵消的問(wèn)題,導(dǎo)致重新組合的三通道信息并不能很好地表示艦船目標(biāo),在識(shí)別效果上并沒(méi)有得到提升反而下降。第2種增強(qiáng)方式是在第1種方式的基礎(chǔ)上進(jìn)行處理,將數(shù)據(jù)的像素值縮放到0~255區(qū)間,可以發(fā)現(xiàn)識(shí)別效果相較于第1種增強(qiáng)方式有了一定提高。考慮到負(fù)數(shù)像素值的影響,第3種增強(qiáng)方式在處理過(guò)程中進(jìn)行了絕對(duì)值處理,來(lái)保證數(shù)據(jù)組合中加入的實(shí)部和虛部信息是加強(qiáng)作用的,并保留原始16位灰度,這樣可以大大減少對(duì)數(shù)據(jù)像素信息的損失。實(shí)驗(yàn)驗(yàn)證也說(shuō)明了第3種增強(qiáng)方式效果好于其他兩種增強(qiáng)方式。
其次為驗(yàn)證復(fù)數(shù)信息可以增強(qiáng)數(shù)據(jù)信息表示,本文在VGG16Net網(wǎng)絡(luò)、GoogleNet網(wǎng)絡(luò)和ResNet18網(wǎng)絡(luò)對(duì)單通道幅度SAR圖像數(shù)據(jù)Z4和復(fù)數(shù)信息增強(qiáng)的輸入數(shù)據(jù)Z3進(jìn)行實(shí)驗(yàn)。通過(guò)表2可以看出,使用輸入數(shù)據(jù)Z3在整體識(shí)別準(zhǔn)確率上可以提升1%~2%,這表明將復(fù)數(shù)SAR圖像的實(shí)部、虛部和幅度通道進(jìn)行組合,可以在幅度信息的基礎(chǔ)上增加復(fù)數(shù)信息提供的細(xì)節(jié)信息,更加完整地表示艦船目標(biāo),有利于提高艦船目標(biāo)識(shí)別的準(zhǔn)確率。
為驗(yàn)證本文改進(jìn)網(wǎng)絡(luò)的有效性,本文設(shè)計(jì)了兩組實(shí)驗(yàn)。第一組實(shí)驗(yàn)是在VGG16Net網(wǎng)絡(luò)、GoogleNet網(wǎng)絡(luò)、ResNet18網(wǎng)絡(luò)和本文改進(jìn)網(wǎng)絡(luò)上使用復(fù)數(shù)信息增強(qiáng)的輸入數(shù)據(jù)Z3進(jìn)行實(shí)驗(yàn)對(duì)比。第二組實(shí)驗(yàn)考慮到深度學(xué)習(xí)往往需要大量的樣本進(jìn)行訓(xùn)練[30],因此在復(fù)數(shù)信息增強(qiáng)的輸入數(shù)據(jù)Z3和單通道幅度SAR圖像數(shù)據(jù)Z4上進(jìn)行數(shù)據(jù)增強(qiáng),來(lái)增加數(shù)據(jù)量進(jìn)行擴(kuò)展實(shí)驗(yàn),在ResNet18網(wǎng)絡(luò)和本文改進(jìn)網(wǎng)絡(luò)上進(jìn)行實(shí)驗(yàn)對(duì)比。數(shù)據(jù)增強(qiáng)時(shí)為保證盡可能減少對(duì)數(shù)據(jù)信息的損失和改變,本文方法只使用了翻轉(zhuǎn)變換,將圖像沿著水平和垂直方向翻轉(zhuǎn),此時(shí)貨船數(shù)據(jù)量變?yōu)? 741,油船數(shù)據(jù)量變?yōu)? 268。
第一組實(shí)驗(yàn)結(jié)果如表3所示,可以看出本文改進(jìn)網(wǎng)絡(luò)比VGG16Net網(wǎng)絡(luò)的識(shí)別效果提升4.8%,相較于GoogleNet網(wǎng)絡(luò)的識(shí)別效果提升6.0%,相較于ResNet18網(wǎng)絡(luò)的識(shí)別效果提升1.5%。表明本文改進(jìn)網(wǎng)絡(luò)中的通道注意力機(jī)制可以通過(guò)調(diào)整3個(gè)通道之間的權(quán)重,使網(wǎng)絡(luò)自適應(yīng)學(xué)習(xí)三通道之間的復(fù)數(shù)信息,更加關(guān)注到艦船目標(biāo)的完整信息,抑制了背景信息。同時(shí),使用LSR解決了因復(fù)數(shù)數(shù)據(jù)樣本較少出現(xiàn)的過(guò)擬合問(wèn)題,加強(qiáng)了網(wǎng)絡(luò)學(xué)習(xí)顯著性特征的能力,最終使得本文方法優(yōu)于其他方法。當(dāng)數(shù)據(jù)集類(lèi)間差異大且類(lèi)內(nèi)差異小時(shí)會(huì)獲得比較好的結(jié)果。通過(guò)對(duì)數(shù)據(jù)中貨船和油船進(jìn)行分析,發(fā)現(xiàn)貨船相較于油船在長(zhǎng)度和型號(hào)等具有多樣性,類(lèi)內(nèi)分布差異更大。因此,表現(xiàn)在網(wǎng)絡(luò)上的識(shí)別效果提升不明顯。
表3 改進(jìn)網(wǎng)絡(luò)實(shí)驗(yàn)結(jié)果
第二組擴(kuò)展實(shí)驗(yàn)結(jié)果如圖8所示,由混淆矩陣和結(jié)果統(tǒng)計(jì)圖可以發(fā)現(xiàn)在進(jìn)行數(shù)據(jù)量上的擴(kuò)增可以使得網(wǎng)絡(luò)進(jìn)行更好的學(xué)習(xí)。本文改進(jìn)網(wǎng)絡(luò)相比于ResNet18網(wǎng)絡(luò)使用單通道SAR幅度圖像Z4和復(fù)數(shù)信息增強(qiáng)的輸入數(shù)據(jù)Z3在總體識(shí)別率和每一類(lèi)艦船目標(biāo)的精確率上都有提升。同時(shí)也再一次驗(yàn)證了本文方法的識(shí)別效果更優(yōu)。
圖8 實(shí)驗(yàn)結(jié)果圖
本文從SAR圖像本質(zhì)為出發(fā)點(diǎn)進(jìn)行研究,提出了一種基于改進(jìn)網(wǎng)絡(luò)的復(fù)數(shù)SAR圖像艦船目標(biāo)識(shí)別方法。通過(guò)實(shí)驗(yàn)表明:
(1) 本文提出的輸入層隱式復(fù)數(shù)信息增強(qiáng)方式通過(guò)對(duì)復(fù)數(shù)SAR圖像的實(shí)部、虛部加絕對(duì)值處理然后和幅度進(jìn)行組合,可以實(shí)現(xiàn)最優(yōu)效果,并可隱式地提供輸入數(shù)據(jù)的復(fù)數(shù)信息表示。與單通道幅度SAR圖像在經(jīng)典神經(jīng)網(wǎng)絡(luò)上進(jìn)行識(shí)別效果對(duì)比,發(fā)現(xiàn)復(fù)數(shù)信息可以增強(qiáng)艦船目標(biāo)的細(xì)節(jié)信息,有助于提高艦船目標(biāo)的識(shí)別準(zhǔn)確率。
(2) 本文方法在ResNet18網(wǎng)絡(luò)基礎(chǔ)上引入了通道注意力機(jī)制,使得網(wǎng)絡(luò)可以調(diào)整各通道的權(quán)重,自適應(yīng)學(xué)習(xí)三通道之間的復(fù)數(shù)信息。同時(shí)通過(guò)引入標(biāo)簽平滑正則化有效地解決了復(fù)數(shù)數(shù)據(jù)集樣本較少而產(chǎn)生的過(guò)擬合問(wèn)題。
(3) 通過(guò)將本文方法與經(jīng)典神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比實(shí)驗(yàn),發(fā)現(xiàn)本文方法在艦船目標(biāo)識(shí)別準(zhǔn)確率和兩類(lèi)艦船目標(biāo)的識(shí)別精確度上都有所提升,也驗(yàn)證了本文方法的有效性。
最后本文方法也為今后利用SAR圖像的復(fù)數(shù)信息進(jìn)行課題研究和后續(xù)學(xué)習(xí)提供參考和思路。