黃燦
摘要:本文首先對卷積神經(jīng)網(wǎng)絡(luò)SAR圖像識別計(jì)算流程展開分析,而后進(jìn)一步討論了當(dāng)前常見的幾種模型的表現(xiàn)特征。
關(guān)鍵字:卷積神經(jīng)網(wǎng)絡(luò);SAR;圖像識別
合成孔徑雷達(dá)(SAR,Synthetic Aperture Radar)在實(shí)際應(yīng)用中有著良好的表現(xiàn),其能夠有效穿透云霧和植被,實(shí)現(xiàn)全天候的對地檢測。作為一種電磁波相干成像系統(tǒng),SAR圖像會隨著目標(biāo)姿態(tài)、俯仰角度、周圍環(huán)境的微小變化而發(fā)生較大的變化,在圖像穩(wěn)定性方面表現(xiàn)狀態(tài)并不好,并且具有較強(qiáng)的相干斑噪聲,這些都成為影響SAR圖像識別工作的重要不良因素。在針對SAR展開目標(biāo)識別這一問題相關(guān)領(lǐng)域中,眾多相關(guān)技術(shù)層出不窮,熱卷積神經(jīng)網(wǎng)絡(luò)在這個(gè)領(lǐng)域中則有著不錯(cuò)的應(yīng)用表現(xiàn)。
一、卷積神經(jīng)網(wǎng)絡(luò)SAR圖像識別計(jì)算流程分析
在SAR圖像識別領(lǐng)域引入的卷積神經(jīng)網(wǎng)絡(luò),其作為一種端對端的處理方式,可以直接將原始圖像進(jìn)行輸入,在一定程度上降低了對圖像數(shù)據(jù)預(yù)處理的要求,復(fù)雜的特征工程也因此得以避免,且卷積神經(jīng)網(wǎng)絡(luò)本身的自動學(xué)習(xí)數(shù)據(jù)的分層特征相比人工設(shè)計(jì)特征提取規(guī)則可以對原始數(shù)據(jù)進(jìn)行更本質(zhì)的刻畫。卷積神經(jīng)網(wǎng)絡(luò)在SAR圖像識別領(lǐng)域的優(yōu)勢不容忽視,對應(yīng)的研究也應(yīng)當(dāng)更加深入,才能不斷實(shí)現(xiàn)識別的優(yōu)化。
SAR圖像識別的卷積神經(jīng)網(wǎng)絡(luò)計(jì)算流程參見圖1。
圖1 卷積神經(jīng)網(wǎng)絡(luò)計(jì)算流程示意圖
結(jié)合圖1展開對于SAR圖像識別過程中卷積神經(jīng)網(wǎng)絡(luò)算法流程的考察,可以發(fā)現(xiàn),大體可以分為三個(gè)流程。首先是數(shù)據(jù)輸入,即將SAR系統(tǒng)捕獲到的各類地面圖像輸入到卷積神經(jīng)網(wǎng)絡(luò)中,準(zhǔn)備展開識別。其二為特征提取,即利用卷積層、下采樣層和非線性層來實(shí)現(xiàn)對于待識別圖像目標(biāo)切片的特征提取。卷積層以及緊隨其后的ReLU非線性層在這個(gè)環(huán)節(jié),能夠有效對梯度消失的問題進(jìn)行解決,并且因此而加速網(wǎng)絡(luò)本身的訓(xùn)練和學(xué)習(xí)速度。隨后需要依據(jù)特征展開對于圖像的分類,采用Softmax分類器,輸入上一個(gè)階段獲取到的對應(yīng)特征圖,隱含層的神經(jīng)元則使用sigmoid函數(shù)作為非線性函數(shù)。使用交叉熵代價(jià)函數(shù)評價(jià)模型的分類結(jié)果,并使用批量梯度下降算法(BGD,Batch Gradient Descent)進(jìn)行反向傳播,不斷地調(diào)整優(yōu)化網(wǎng)絡(luò)參數(shù),提高目標(biāo)識別的準(zhǔn)確率。
二、卷積神經(jīng)網(wǎng)絡(luò)模型分類概述
雖然卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算流程相對固定,但是具體到算法細(xì)節(jié)上,模型之間仍然存在顯著差異。不同的模型會在實(shí)際應(yīng)用中表現(xiàn)出不同的特征,而對于這些模型的選擇,則需要切實(shí)依據(jù)實(shí)際情況來謹(jǐn)慎確定。
1.AlexNet
AlexNet是一個(gè)八層卷積神經(jīng)網(wǎng)絡(luò),包括五個(gè)卷積層以及三個(gè)全連接層共同構(gòu)成,最后通過softmax層來實(shí)現(xiàn)分類評分。此種卷積模型的突出特征在于,它采用了修正線性單元(ReLU,Rectified Linear Units)作為激活函數(shù),更加符合神經(jīng)元信號激勵(lì)原理,也因此會收獲更快速的訓(xùn)練效果。除此以外,此種模型引入Dropout和數(shù)據(jù)增強(qiáng)等策略,對于降低神經(jīng)元復(fù)雜的互適應(yīng)關(guān)系,對于模型魯棒性也有提升。除此以外,AlexNet采用兩塊GTX 580 GPU并行訓(xùn)練,兩個(gè)GPU可以不用經(jīng)過主機(jī)內(nèi)存直接讀寫彼此的內(nèi)存,大幅提高了網(wǎng)絡(luò)訓(xùn)練速度。
2.VGGNet
VGGNet從誕生開始,其研究方向就瞄準(zhǔn)了卷積神經(jīng)網(wǎng)絡(luò)的深度與其性能之間的關(guān)系,并且證明了才采用很小卷積的時(shí)候,增加網(wǎng)絡(luò)深度可以有效提升整體模型性能。并且VGGNet在網(wǎng)絡(luò)優(yōu)化方面同樣展開了深入的研究,其采用尺度抖動的方法對原始圖片展開處理,獲取到尺寸具有一定差異的圖片,并且據(jù)此進(jìn)行訓(xùn)練,有助于增強(qiáng)模型的魯棒性和泛化能力。除此以外,VGGNet模型還引入了預(yù)訓(xùn)練的概念,其首先對淺層網(wǎng)絡(luò)進(jìn)行訓(xùn)練,而后進(jìn)一步利用訓(xùn)練好的參數(shù)對深層網(wǎng)絡(luò)進(jìn)行初始化,有助于加速整個(gè)模型的收斂。并且相對于AlexNet而言,VGGNet將局部響應(yīng)歸一化策略剔除掉,也有助于進(jìn)一步縮減計(jì)算時(shí)間,對于內(nèi)存的占用也因此得到一定程度的優(yōu)化。
3.GoogleNet
GoogleNet是一個(gè)基于Inception結(jié)構(gòu)的22層深度卷積神經(jīng)網(wǎng)絡(luò),其最突出的特征在于利用密集成分來近似最優(yōu)的局部稀疏結(jié)構(gòu),增加了網(wǎng)絡(luò)深度,并且引入了Inception模塊拓寬了網(wǎng)絡(luò)寬度。具體而言,GoogleNet采用了不同尺度的卷積核來進(jìn)行圖像處理,并且對相應(yīng)的結(jié)果進(jìn)行聚合,從而讓模型可以從不同的尺度運(yùn)算結(jié)果中獲取到更多圖片特征,因此增強(qiáng)了系統(tǒng)的學(xué)習(xí)能力。此種工作方式讓GoogleNet的參數(shù)比AlexNet涉及到的參數(shù)大大縮減,但準(zhǔn)確率卻更高。
4.ResNet
VGGNet面世之后,網(wǎng)絡(luò)深度成為諸多學(xué)者的關(guān)注點(diǎn),希望可以通過這一途徑實(shí)現(xiàn)性能的提升。但是網(wǎng)絡(luò)深度的增加,會帶來梯度彌散/爆炸等問題,梯度下降法卻難以有效落實(shí)深層網(wǎng)絡(luò)而帶來的退化,因此網(wǎng)絡(luò)訓(xùn)練和測試的誤差也隨之上升。在這樣的背景下,ResNet應(yīng)運(yùn)而生,這是一個(gè)152層的殘差網(wǎng)絡(luò)結(jié)構(gòu),如果某層原始期望映射輸出可以被描述為H(x),對應(yīng)的x為輸入,則可以通過快捷連接在網(wǎng)絡(luò)環(huán)境中加入一個(gè)恒等映射,相當(dāng)于從輸入端旁邊開設(shè)了一個(gè)通道使得輸入可以直達(dá)輸出,對應(yīng)的優(yōu)化目標(biāo)也從原來的輸出,變成輸出和輸入之間的差,即H(x)-x。相對于將一個(gè)映射逼近另一個(gè)非線性層而言,對殘差的優(yōu)化要簡單的多,因此這樣的計(jì)算方式有效降低了網(wǎng)絡(luò)參數(shù)優(yōu)化的速度,也能解決退化問題。
5.DenseNet
ResNet的本質(zhì)在于建立一個(gè)跨層連接來連通網(wǎng)路中前后層,而DenseNet模型則在此基礎(chǔ)之上進(jìn)一步設(shè)計(jì)了一種具有密集連接的卷積神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)的每一層輸入,都是前面所有網(wǎng)絡(luò)層輸入的并集。并且每一個(gè)層所學(xué)習(xí)的特征圖也會被直接傳給其后面所有層作為輸人,通過密集連接實(shí)現(xiàn)特征的重復(fù)利用,增強(qiáng)了網(wǎng)絡(luò)的泛化能力。此種模型能夠有效減弱梯度消失的問題,強(qiáng)化特征傳播能力,并且有效限制參數(shù)的數(shù)量。
6.SENet
此種模型是從卷積神經(jīng)網(wǎng)絡(luò)特征通道之間的關(guān)系角度入手,引入包括壓縮和激發(fā)操作的SE模塊。其中壓縮操作將每個(gè)二維特征通道變成一個(gè)實(shí)數(shù)來實(shí)現(xiàn)全局代表的感受野,并且輸出的維度和輸入的特征通道數(shù)相閃配。而激發(fā)操作則是一個(gè)類似于循環(huán)神經(jīng)網(wǎng)絡(luò)中門的機(jī)制,通過對應(yīng)參數(shù)來確定不同特征通道的權(quán)重,用來顯式地建模特征通道間的相關(guān)性。而后展開權(quán)重的重新標(biāo)定,將激發(fā)環(huán)節(jié)的輸出權(quán)重視為進(jìn)行過特征選擇后每個(gè)特征通道的重要性水平,并且通過乘法逐通道加權(quán)到先前的特征上,對有用的特征進(jìn)行權(quán)重提升,并且壓制作用有限的特征。
三、結(jié)論
卷積圣經(jīng)網(wǎng)絡(luò)在SAR目標(biāo)識別領(lǐng)域中的價(jià)值不可忽視,并且有著極為深厚的潛力可供發(fā)掘。實(shí)際應(yīng)用中唯有深入考證多種模型的表現(xiàn)特征,謹(jǐn)慎測試,才能獲取良好效果。
參考文獻(xiàn):
[1] 徐豐,王海鵬,金亞秋.深度學(xué)習(xí)在SAR目標(biāo)識別與地物分類中的應(yīng)用[J].雷達(dá)學(xué)報(bào),2017,6(2):136-148.
[2] 李君寶,楊文慧,許劍清,等.基于深度卷積網(wǎng)絡(luò)的SAR圖像目標(biāo)檢測識別[J].導(dǎo)航定位與授時(shí),2017,4(1):60-66