富 強(qiáng),楊 威,陳 杰,鄭世超,楚博策,3
(1.北京航空航天大學(xué) 電子信息工程學(xué)院,北京 100191;2.上海衛(wèi)星工程研究所,上海 200240;3.中國(guó)電子科技集團(tuán)公司航天信息應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室,河北石家莊 050081)
合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)是一種主動(dòng)式微波成像傳感器,它可以不受天氣的影響,不分晝夜,同時(shí)可以獲得更高質(zhì)量、更高分辨率的大范圍遠(yuǎn)距離圖像。因此,利用SAR 圖像進(jìn)行艦船檢測(cè)已成為國(guó)內(nèi)外研究的熱點(diǎn)。傳統(tǒng)的基于SAR 圖像的艦船檢測(cè)主要包括恒虛警率(Constant False Alarm Rate,CFAR)算法和基于特征提取的算法等。對(duì)于近岸艦船,要考慮艦船的密集停放,同時(shí)考慮陸地環(huán)境中大量的人工目標(biāo),如建筑物、車輛等,其目標(biāo)的特征與艦船相似,為準(zhǔn)確的目標(biāo)檢測(cè)帶來了很大的影響和挑戰(zhàn)。
近年來,隨著深度學(xué)習(xí)的快速發(fā)展,這一技術(shù)得到了廣泛的應(yīng)用,并在圖像識(shí)別領(lǐng)域取得了很大的進(jìn)展,許多研究人員在艦船識(shí)別中也引入了深度學(xué)習(xí)。深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neutral Network,CNN)通過逐層學(xué)習(xí)和自主提取特征,可以充分利用圖像中的信息,從而擺脫了傳統(tǒng)方法的限制,在各種復(fù)雜多變的環(huán)境中具有良好的魯棒性。文獻(xiàn)[7]設(shè)計(jì)了基于注意力機(jī)制特征重建網(wǎng)絡(luò)的艦船目標(biāo)檢測(cè)算法,引入注意力旋轉(zhuǎn)錨框以緩解密集排列目標(biāo)引起的噪聲問題,并利用特征重建模塊來實(shí)現(xiàn)特征精煉。文獻(xiàn)[8]通過網(wǎng)絡(luò)輕量化和聚類算法改進(jìn)YOLOv3 網(wǎng)絡(luò),提升檢測(cè)精度的同時(shí)加快了檢測(cè)速度。
本文利用真實(shí)的開源SAR 圖像構(gòu)建了一個(gè)近岸SAR 艦船數(shù)據(jù)集,在此基礎(chǔ)上進(jìn)行了檢測(cè)實(shí)驗(yàn),精確評(píng)估了檢測(cè)網(wǎng)絡(luò)在近岸艦船上的性能。然后,引入注意力模塊(Channel Attention Module,CAM)來提高網(wǎng)絡(luò)的檢測(cè)性能。在近岸測(cè)試集中,mAP 達(dá)到80%以上。此外,為了解決近岸地區(qū)艦船密集分布導(dǎo)致的檢測(cè)性能下降的問題,引入了基于YOLOv5 和CSL 算法的旋轉(zhuǎn)檢測(cè)網(wǎng)絡(luò),并證明了其可行性。
YOLO是一種基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法,屬于一階段檢測(cè)網(wǎng)絡(luò),相比于以SSD為代表的雙階段檢測(cè)網(wǎng)絡(luò),擁有運(yùn)行速度很快的特點(diǎn),適用于實(shí)時(shí)檢測(cè)。YOLO 網(wǎng)絡(luò)從v1 開始不斷改進(jìn)更新,現(xiàn)在該系列最新的網(wǎng)絡(luò)為YOLOv5,在許多方面都有應(yīng)用且達(dá)到了不錯(cuò)的效果。接下來是對(duì)YOLOv5 的結(jié)構(gòu)以及檢測(cè)運(yùn)用到的方法作介紹。YOLOv5 的整體網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
圖1 YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)[12]Fig.1 Network architecture of YOLOv5[12]
其中,骨干網(wǎng)絡(luò)(Backbone)用以提取圖像中的特征信息,頸部網(wǎng)絡(luò)(Neck)用以整合不同尺度的特征信息并傳輸?shù)捷敵鰧樱∣utput),輸出層用以生成預(yù)測(cè)結(jié)果。網(wǎng)絡(luò)中的模塊包含聚焦(Focus)模塊、基礎(chǔ)卷積(CONV)模塊、跨階段局部網(wǎng)絡(luò)(CSP)模塊、空間金字塔池化(SPP)模塊、連接(Concat)模塊、上采樣(Upsample)模塊。相同的模塊有不同的輸入通道數(shù)(in_channel)、輸出通道數(shù)(out_channel)、卷積核大?。╧ernel_size)、卷積步長(zhǎng)(stride)。
CONV 模塊是YOLOv5 中最基礎(chǔ)的模塊,由卷積模塊、BN 模塊、Leaky ReLU 激活函數(shù)組成。卷積模塊是卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)、Leaky ReLU 函數(shù),可以防止梯度飽和的問題,同時(shí)有效抑制梯度消失現(xiàn)象。
BN 算法引入了可學(xué)習(xí)參數(shù)、,從而恢復(fù)出前一層網(wǎng)絡(luò)所學(xué)習(xí)到的特征。BN 的引入減少了初始參數(shù)的限制,可以選擇較大的初始學(xué)習(xí)率,加快了訓(xùn)練速度;BN 極大增強(qiáng)了網(wǎng)絡(luò)泛化能力,減少過擬合,計(jì)算公式如下:
式中:x為神經(jīng)元輸入;[x]為各神經(jīng)元輸入值的平均值;Var(x)為各神經(jīng)元輸入值的方差。
跨階段局部網(wǎng)絡(luò)(Cross Stage Partial Network,CSPNet)是減少目前需要的大量推理計(jì)算。以往在實(shí)際應(yīng)用中能夠獲得較好結(jié)果的方法在很大程度上需要依賴龐大的計(jì)算量。CSPNet 是一種網(wǎng)絡(luò)設(shè)計(jì)思路,與殘差結(jié)構(gòu)的思想相似,可以與已有的網(wǎng)絡(luò)結(jié)合。實(shí)驗(yàn)中顯示,隨著CSPNet 的引入,計(jì)算量有了大幅下降的同時(shí),準(zhǔn)確率沒有下降,甚至有略微的提升。CSP 模塊結(jié)構(gòu)如圖2 所示。
基礎(chǔ)層的特征映射被CSP 模塊劃分為2 部分,即圖2 中左側(cè)的單卷積部分和中間的深層網(wǎng)絡(luò)部分,然后用跨階段結(jié)構(gòu)將合并這2 部分。深層網(wǎng)絡(luò)部分中的瓶頸模塊(Bottleneck)為一個(gè)使用了殘差結(jié)構(gòu)的特征提取模塊。
圖2 CSP 模塊結(jié)構(gòu)[12]Fig.2 Architecture of the CSP module[12]
路徑聚合網(wǎng)絡(luò)(Path Aggregation Network,PANet,PANet)提出的目的是在特征圖金字塔網(wǎng)絡(luò)(Feature Pyramid Network,F(xiàn)PN)的基礎(chǔ)上進(jìn)一步促進(jìn)不同層之間特征信息的流動(dòng),其結(jié)構(gòu)如圖3 所示。PANet 在自頂往下的網(wǎng)絡(luò)后,又增加了一個(gè)自底往上的金字塔結(jié)構(gòu)。
圖3 PANet 結(jié)構(gòu)[17]Fig.3 Architecture of the PANet[17]
語(yǔ)義特征通過FPN 層自頂往下傳達(dá),定位特征則通過PANet 自底向上傳達(dá),不同的卷積層從不同的主干層進(jìn)行融合,特征提取能力從而獲得提高。
目標(biāo)檢測(cè)最常用的損失函數(shù)是交并比(Intersection over Union,IoU),計(jì)算公式如下:
式中:DR(Detection Results)為檢測(cè)結(jié)果;GT(Ground Truth)為實(shí)際結(jié)果。
但I(xiàn)oU 無法反映兩框距離的遠(yuǎn)近,因此提出了綜合交并比(Generalized Intersection over Union,GIoU)。在GIoU 基礎(chǔ)上,距離交并比(Distance Intersection over Union,DIoU)考慮了檢測(cè)結(jié)果與真實(shí)值間的重疊率、距離以及尺度。更進(jìn)一步地,完備交并比(Complete Intersection over Union,CIoU)考慮到了檢測(cè)框的長(zhǎng)寬比,在DIoU 的公式中加入了一個(gè)影響因子,具體公式如下:
式中:為權(quán)重參數(shù);為2 個(gè)點(diǎn)的歐氏距離;衡量檢測(cè)值和真實(shí)值之間長(zhǎng)寬比的相似性,定義如下:
式中:為寬;為高。
CIoU 綜合考慮了檢測(cè)值和真實(shí)值之間的IoU、距離、長(zhǎng)寬比等因素,包含的方面較為全面,使得檢測(cè)值有較好的精度,因此YOLOv5 中默認(rèn)采用CIoU 作為計(jì)算預(yù)測(cè)值損失的方法。
計(jì)算機(jī)視覺的注意力機(jī)制的思想是通過尋找現(xiàn)有數(shù)據(jù)間的關(guān)聯(lián)性突出某些重要特征,是一個(gè)在[0,1]區(qū)間連續(xù)分布的問題,屬于軟注意力。軟注意力可以通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),經(jīng)過前向傳播和后向傳播來得到注意力的權(quán)重。
壓縮激發(fā)網(wǎng)絡(luò)(Squeeze and Excitation Networks,SENet)關(guān)注通道之間的關(guān)系,希望網(wǎng)絡(luò)能夠自發(fā)學(xué)習(xí)到特征圖不同通道的重要程度,其結(jié)構(gòu)如圖4 所示。
圖4 SENet 結(jié)構(gòu)[20]Fig.4 Architecture of the SENet[20]
如圖4 所示,任意特征圖經(jīng)過任意特征提取操作后獲得特征圖,其中分別為特征圖的高度、寬度、通道數(shù)。SENet 通過對(duì)特征圖進(jìn)行壓縮(Squeeze)和激發(fā)(Excitation)操作,即圖中和,得到1 個(gè)一維向量,向量中的每個(gè)參數(shù)作為每個(gè)通道的評(píng)分,然后在通道上施加對(duì)應(yīng)的權(quán)重,得到處理后的結(jié)果。其中壓縮操作對(duì)每個(gè)通道做平均池化,得到各個(gè)通道的統(tǒng)計(jì)數(shù)值;激發(fā)操作學(xué)習(xí)通道的相關(guān)程度,并根據(jù)相關(guān)程度調(diào)整權(quán)重。
卷積塊注意力模塊(Convolutional Block Attention Module,CBAM)結(jié)合了空間注意力和通道注意力,如圖5(a)所示。輸入特征圖(Input Feature)經(jīng)過通道CAM 和空間注意力機(jī)制模塊(Spatial Attention Module,SAM)獲得提煉后特征圖(Refined Feature)。通道CAM 與SENet 相似,不再贅述。圖5(b)是SAM,和通道注意力類似,空間注意力可以學(xué)習(xí)特征圖不同空間的重要程度。
圖5 CBAM 及SAM[21]Fig.5 Schematic diagram of the CBAM and SAM[21]
圖5(b)所示的SAM 的具體操作如下:首先對(duì)于輸入的特征圖,即經(jīng)過通道CAM 處理的特征圖(Channel-refined feature),分別做基于通道的平均池化(AvgPool)、最大池化(MaxPool),池化后的2個(gè)結(jié)果做基于通道的拼接操作;然后通過卷積(conv layer),將通道數(shù)減少為1;再通過激活函數(shù),獲得空間注意力特征圖。將獲得的空間注意力特征圖施加在原來的特征圖上得到最終的特征。與通道注意力類似,空間注意力可以學(xué)習(xí)特征圖不同空間的重要程度。不同于只關(guān)注通道注意力機(jī)制的SENet 模塊,CBAM 模塊往往可以取得更好的效果。
上述2 種注意力機(jī)制模塊都是輕量的通用模塊,由于2 種模塊輸入和輸出的特征圖大小是一致的,因此可以直接將模塊添加用于YOLOv5 網(wǎng)絡(luò)的各層,將其融入到各種卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行端到端的訓(xùn)練。本實(shí)驗(yàn)中,將2 種模塊分別添加與檢測(cè)頭前的位置。改進(jìn)后的網(wǎng)絡(luò)如圖6 所示。
圖6 改進(jìn)后YOLOv5 結(jié)構(gòu)Fig.6 Architecture of the improved YOLOv5
為了處理邊界問題,圓光滑標(biāo)簽(Circular Smooth Label,CSL)算法將角度問題從原本的回歸問題轉(zhuǎn)化為分類問題,解決了角度的邊界問題,可以很好地和長(zhǎng)邊定義法結(jié)合。CSL 將定義的角度進(jìn)行劃分,如圖7 所示。
圖7 角度的分類定義[22]Fig.7 Categorical definition of angles[22]
僅僅把角度當(dāng)作類別問題無法衡量預(yù)測(cè)角度和真實(shí)角度之間的距離,為了解決這個(gè)問題,CSL設(shè)計(jì)了如下表達(dá)式:
式中:()為窗口函數(shù);為窗口半徑。
滿足如下幾點(diǎn):周期性,周期為180/;對(duì)稱性,關(guān)于對(duì)稱;最大值為1;單調(diào)性,
將角度問題轉(zhuǎn)換為類別問題就是將一個(gè)連續(xù)問題轉(zhuǎn)換為離散問題,這意味著轉(zhuǎn)換過程中精度會(huì)有損失。CSL 作者在文章中計(jì)算了損失以確定其對(duì)最終結(jié)果的影響,計(jì)算公式如下:
式中:為相鄰兩類角度之間的差,比如將1°劃分為一類時(shí)=1,此時(shí)精度的最大損失、角度服從平均分布下的平均損失分別為0.5°和0.25°。這對(duì)于結(jié)果的影響很小,在實(shí)際應(yīng)用中可以不予考慮。
將該算法與YOLOv5 網(wǎng)絡(luò)相結(jié)合需對(duì)網(wǎng)絡(luò)做如下改動(dòng):1)數(shù)據(jù)輸入部分,增加數(shù)據(jù)維度,在原有的檢測(cè)框數(shù)據(jù)基礎(chǔ)上增加角度數(shù)據(jù)信息;2)網(wǎng)絡(luò)檢測(cè)部分,增加角度信息的預(yù)測(cè);3)損失函數(shù)部分,構(gòu)建目標(biāo)時(shí)增加角度信息列表,并在損失函數(shù)計(jì)算時(shí)增加角度信息損失的計(jì)算,計(jì)算函數(shù)與類別損失計(jì)算函數(shù)相同;4)可視化部分,將繪制水平矩形框修改為繪制旋轉(zhuǎn)矩形框。在YOLOv5 網(wǎng)絡(luò)的整體結(jié)構(gòu)上并無改動(dòng)。
本次實(shí)驗(yàn)計(jì)劃使用SSDD公開SAR艦船檢測(cè)數(shù)據(jù)集。該數(shù)據(jù)集包含了多種不同的成像條件。圖像主要來源于RadarSat-2、TerraSAR-X 和Sentinel-1 衛(wèi)星傳感器,一共4 種極化模式,分辨率的范圍為1~15 m。
通過位深度轉(zhuǎn)換和對(duì)比度調(diào)整,將原數(shù)據(jù)調(diào)整為更適合用于網(wǎng)絡(luò)訓(xùn)練和人工評(píng)估的圖像。之后選取包含艦船目標(biāo)的圖像區(qū)域,按照所構(gòu)建的神經(jīng)網(wǎng)絡(luò)要求,將圖像進(jìn)行切片為適合網(wǎng)絡(luò)進(jìn)行訓(xùn)練的圖像尺寸,完成訓(xùn)練集的制作。原圖和處理后圖像如圖8 所示。
圖8 處理前后數(shù)據(jù)對(duì)比Fig.8 Comparison of images before and after processing
數(shù)據(jù)集切片數(shù)量為1 386 張。將1 386 張圖片分為兩類,包含陸地的數(shù)據(jù)、不包含陸地的數(shù)據(jù),其中包含陸地的切片數(shù)量為304 張,不包含陸地的切片數(shù)量為1 082 張。由于數(shù)據(jù)集數(shù)量較少,按照6∶2∶2 的比例分別將上述兩類數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集、測(cè)試集,并在測(cè)試集中去除不包含陸地的目標(biāo),著重分析網(wǎng)絡(luò)對(duì)于近岸目標(biāo)的檢測(cè)性能。SSDD 數(shù)據(jù)集分配見表1。
表1 SSDD 數(shù)據(jù)集分配Tab.1 SSDD dataset distribution
使用YOLOv5 在coco 數(shù)據(jù)集的預(yù)訓(xùn)練權(quán)重進(jìn)行初步訓(xùn)練,處理批次大小設(shè)置為8。處理批次過大會(huì)導(dǎo)致梯度下降速度緩慢,過小會(huì)導(dǎo)致?lián)p失函數(shù)難以收斂。在合理的范圍內(nèi)增加處理批次可以使顯卡性能利用率提高,訓(xùn)練速度加快。迭代次數(shù)設(shè)置為300,采用隨機(jī)梯度下降作為梯度下降算法。初始學(xué)習(xí)率為0.01,周期學(xué)習(xí)率為0.2。YOLOv5訓(xùn)練過程中,隨著迭代次數(shù)增加,學(xué)習(xí)率減小,具體公式如下:
式中:為迭代總次數(shù);為第次迭代;lr為第次迭代的學(xué)習(xí)率;為初始學(xué)習(xí)率;為周期學(xué)習(xí)率。最后一次迭代時(shí),學(xué)習(xí)率為。
均值平均精度(Mean Average Precision,mAP),用以衡量網(wǎng)絡(luò)性能。計(jì)算時(shí),置信度閾值設(shè)置為0.001,NMS 置信度設(shè)置為0.5;檢測(cè)時(shí),置信度閾值為0.5,NMS置信度為0.5。測(cè)試結(jié)果如圖9所示。
圖9 中,左側(cè)為200 次迭代訓(xùn)練后的檢測(cè)結(jié)果,右圖為300 次迭代訓(xùn)練后的檢測(cè)結(jié)果。然而兩個(gè)結(jié)果之間差距不大,證明網(wǎng)絡(luò)已經(jīng)經(jīng)過充分訓(xùn)練,雖然出現(xiàn)過擬合的現(xiàn)象,但下降幅度不大,過擬合不嚴(yán)重,證明了YOLOv5 防止過擬合性能較為優(yōu)秀。部分檢測(cè)結(jié)果如圖10 所示。
圖9 精度-召回率曲線Fig.9 Precision-recall curves
圖10 檢測(cè)結(jié)果Fig.10 Detected results
為了進(jìn)一步提高準(zhǔn)確率,在YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)中加入注意力機(jī)制模塊,并重復(fù)實(shí)驗(yàn)。分別加入模塊SELayer 和CBAM,數(shù)量為1,位置為網(wǎng)絡(luò)第8層,處理批次大小設(shè)置為8。采用隨機(jī)梯度下降作為梯度下降算法,初始學(xué)習(xí)率為0.01,周期學(xué)習(xí)率為0.2,NMS 閾值為0.5。由于增加了模塊,模型參數(shù)增加,導(dǎo)致訓(xùn)練速度減慢,因此需要增加迭代次數(shù),迭代次數(shù)設(shè)置為400。加入CAM 后精度-召回率曲線如圖11 所示。
圖11 加入CAM 后精度-召回率曲線Fig.11 Precision-recall curves after adding CAM
圖中可見:加入SELayer的網(wǎng)絡(luò),mAP 值有小幅度提升,且準(zhǔn)確率下降到一定程度后沒有繼續(xù)下降,證明SELayer 模塊在減少檢測(cè)網(wǎng)絡(luò)錯(cuò)檢的效果上較為突出;加入CBAM 模塊的網(wǎng)絡(luò),mAP 值有更明顯的提升,證明了注意力機(jī)制模塊在提升檢測(cè)網(wǎng)絡(luò)性能方面的作用,且CBAM 較SELayer性能更好。
YOLOv5、改進(jìn)后YOLOv5 與其他典型檢測(cè)網(wǎng)絡(luò)性能對(duì)比見表2,典型檢測(cè)網(wǎng)絡(luò)包括Faster RCNN和SSD。
表2 檢測(cè)結(jié)果對(duì)比Tab.2 Comparison of the detected results
由表2 可知,原YOLOv5 網(wǎng)絡(luò)與典型檢測(cè)相比,在準(zhǔn)確率性能方面較為相近,但在檢測(cè)速度方面有明顯優(yōu)勢(shì)。增加CAM 的改進(jìn)后網(wǎng)絡(luò)雖然增加了網(wǎng)絡(luò)復(fù)雜度,因此增加了檢測(cè)用時(shí),但仍具有較高效率,同時(shí)在檢測(cè)準(zhǔn)確率方面也有提升。
由以上收集的檢測(cè)結(jié)果可以初步歸納檢測(cè)錯(cuò)誤原因,漏檢的原因主要為檢測(cè)目標(biāo)附近的干擾、艦船的密集分布,其中干擾包含由于噪聲導(dǎo)致的干擾和由于較為靠近陸地導(dǎo)致的陸地背景的干擾;錯(cuò)檢的原因主要為將形狀與艦船類似的目標(biāo)錯(cuò)誤判定為目標(biāo),將與艦船類似的目標(biāo)命名為干擾目標(biāo),干擾目標(biāo)可以分為離岸的干擾目標(biāo)和陸地干擾目標(biāo)。部分錯(cuò)檢結(jié)果如圖12 所示。
圖12 部分錯(cuò)檢結(jié)果Fig.12 Partial wrong detected results
針對(duì)以上問題提出如下解決方案:針對(duì)噪聲導(dǎo)致的干擾,增加圖像降噪的預(yù)處理環(huán)節(jié);針對(duì)靠近陸地導(dǎo)致的陸地背景的干擾以及陸地的干擾目標(biāo),增加海陸分割的預(yù)處理環(huán)節(jié);針對(duì)艦船密集分布的問題,加入旋轉(zhuǎn)框檢測(cè)網(wǎng)絡(luò)。除了以上針對(duì)性措施之外,還可以通過增加訓(xùn)練集、提高網(wǎng)絡(luò)的特征提取性能等方法,綜合提升網(wǎng)絡(luò)性能。
在以上實(shí)驗(yàn)中發(fā)現(xiàn),錯(cuò)檢漏檢目標(biāo)有部分原因來自于較為密集的目標(biāo),因此嘗試實(shí)現(xiàn)旋轉(zhuǎn)框的目標(biāo)檢測(cè)網(wǎng)絡(luò)。計(jì)劃使用CSL 算法,實(shí)現(xiàn)YOLOv5 旋轉(zhuǎn)框檢測(cè)網(wǎng)絡(luò)改建。
訓(xùn)練時(shí),處理批次大小設(shè)置為8,采用Adam 算法作為梯度下降算法優(yōu)化器。初始學(xué)習(xí)率為0.001,周期學(xué)習(xí)率為0.01,迭代次數(shù)為200 次。最終loss的訓(xùn)練結(jié)果 為box_loss=0.083 26,obj_loss=0.015 12,angle_loss=0.266,獲得的部分結(jié)果如圖13 所示。
圖13 部分旋轉(zhuǎn)框檢測(cè)結(jié)果Fig.13 Partial detected results of the rotating frame
由圖13 結(jié)果可知,在部分情況下旋轉(zhuǎn)框可以較為精確地框定出目標(biāo)范圍,能夠證實(shí)CSL+YOLOv5 算法進(jìn)行旋轉(zhuǎn)框檢測(cè)的可行性。但是漏檢、誤檢在大部分情況下較為嚴(yán)重,且目標(biāo)的置信度普遍不高。判斷原因主要在于網(wǎng)絡(luò)未得到充分的訓(xùn)練,loss 在下降到一定程度后無法繼續(xù)收斂,網(wǎng)絡(luò)訓(xùn)練陷入了局部最優(yōu)。后續(xù)需要改變訓(xùn)練策略,進(jìn)行進(jìn)一步的訓(xùn)練,嘗試將網(wǎng)絡(luò)充分訓(xùn)練;或者對(duì)CSL算法進(jìn)行改進(jìn),嘗試尋找更優(yōu)的旋轉(zhuǎn)標(biāo)簽標(biāo)注法和損失函數(shù)算法。
本文構(gòu)建了著重于近岸目標(biāo)的訓(xùn)練和測(cè)試集,開展以原YOLOv5 網(wǎng)絡(luò)為基礎(chǔ)的近岸艦船目標(biāo)檢測(cè)網(wǎng)絡(luò)實(shí)驗(yàn)和加入注意力機(jī)制模塊的改進(jìn)實(shí)驗(yàn),并取得了較為理想的效果——在近岸測(cè)試集中,mAP達(dá)到了80%以上。證實(shí)了YOLOv5 網(wǎng)絡(luò)作為近岸艦船目標(biāo)檢測(cè)網(wǎng)絡(luò)有著較為良好的性能,注意力機(jī)制模塊在提升檢測(cè)網(wǎng)路準(zhǔn)確率方面也有著較好的效果。
針對(duì)近岸情況中艦船目標(biāo)密集導(dǎo)致漏檢的問題,開展旋轉(zhuǎn)檢測(cè)框?qū)嶒?yàn),并且能夠初步證明CSL+YOLOv5 實(shí)現(xiàn)旋轉(zhuǎn)框檢測(cè)的可行性,但未能達(dá)到預(yù)期中提升檢測(cè)性能的效果。分析原因后提出如下改進(jìn)方案:嘗試不同的學(xué)習(xí)率,梯度優(yōu)化算法;修改原有的評(píng)估方法,得到適合旋轉(zhuǎn)框目標(biāo)的評(píng)估方法,指導(dǎo)訓(xùn)練網(wǎng)絡(luò)的參數(shù)優(yōu)化環(huán)節(jié),從而實(shí)現(xiàn)網(wǎng)絡(luò)的充分訓(xùn)練?;蛘邔?duì)CSL 算法進(jìn)行改進(jìn),嘗試尋找更優(yōu)的旋轉(zhuǎn)標(biāo)簽標(biāo)注法和損失函數(shù)算法。
在總結(jié)錯(cuò)誤原因后,除了旋轉(zhuǎn)框檢測(cè)之外,提出如下解決方案:針對(duì)噪聲導(dǎo)致的干擾,增加圖像降噪的預(yù)處理環(huán)節(jié);針對(duì)靠近陸地導(dǎo)致的陸地背景的干擾以及陸地的干擾目標(biāo),增加海陸分割的預(yù)處理環(huán)節(jié)。除了以上針對(duì)性措施之外,還可以通過增加訓(xùn)練集、提高網(wǎng)絡(luò)的特征提取性能等方法,綜合提升網(wǎng)絡(luò)性能。