基于YOLOv5 的近岸SAR 艦船目標(biāo)檢測(cè)方法

2022-07-15 19:23:50鄭世超楚博策

上海航天 2022年3期

富強(qiáng)，楊威，陳杰，鄭世超，楚博策，3

（1.北京航空航天大學(xué) 電子信息工程學(xué)院，北京 100191；2.上海衛(wèi)星工程研究所，上海 200240；3.中國(guó)電子科技集團(tuán)公司航天信息應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室，河北石家莊 050081）

0 引言

合成孔徑雷達(dá)（Synthetic Aperture Radar，SAR）是一種主動(dòng)式微波成像傳感器，它可以不受天氣的影響，不分晝夜，同時(shí)可以獲得更高質(zhì)量、更高分辨率的大范圍遠(yuǎn)距離圖像。因此，利用SAR 圖像進(jìn)行艦船檢測(cè)已成為國(guó)內(nèi)外研究的熱點(diǎn)。傳統(tǒng)的基于SAR 圖像的艦船檢測(cè)主要包括恒虛警率（Constant False Alarm Rate，CFAR）算法和基于特征提取的算法等。對(duì)于近岸艦船，要考慮艦船的密集停放，同時(shí)考慮陸地環(huán)境中大量的人工目標(biāo)，如建筑物、車輛等，其目標(biāo)的特征與艦船相似，為準(zhǔn)確的目標(biāo)檢測(cè)帶來了很大的影響和挑戰(zhàn)。

近年來，隨著深度學(xué)習(xí)的快速發(fā)展，這一技術(shù)得到了廣泛的應(yīng)用，并在圖像識(shí)別領(lǐng)域取得了很大的進(jìn)展，許多研究人員在艦船識(shí)別中也引入了深度學(xué)習(xí)。深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neutral Network，CNN）通過逐層學(xué)習(xí)和自主提取特征，可以充分利用圖像中的信息，從而擺脫了傳統(tǒng)方法的限制，在各種復(fù)雜多變的環(huán)境中具有良好的魯棒性。文獻(xiàn)［7］設(shè)計(jì)了基于注意力機(jī)制特征重建網(wǎng)絡(luò)的艦船目標(biāo)檢測(cè)算法，引入注意力旋轉(zhuǎn)錨框以緩解密集排列目標(biāo)引起的噪聲問題，并利用特征重建模塊來實(shí)現(xiàn)特征精煉。文獻(xiàn)［8］通過網(wǎng)絡(luò)輕量化和聚類算法改進(jìn)YOLOv3 網(wǎng)絡(luò)，提升檢測(cè)精度的同時(shí)加快了檢測(cè)速度。

本文利用真實(shí)的開源SAR 圖像構(gòu)建了一個(gè)近岸SAR 艦船數(shù)據(jù)集，在此基礎(chǔ)上進(jìn)行了檢測(cè)實(shí)驗(yàn)，精確評(píng)估了檢測(cè)網(wǎng)絡(luò)在近岸艦船上的性能。然后，引入注意力模塊（Channel Attention Module，CAM）來提高網(wǎng)絡(luò)的檢測(cè)性能。在近岸測(cè)試集中，mAP 達(dá)到80%以上。此外，為了解決近岸地區(qū)艦船密集分布導(dǎo)致的檢測(cè)性能下降的問題，引入了基于YOLOv5 和CSL 算法的旋轉(zhuǎn)檢測(cè)網(wǎng)絡(luò)，并證明了其可行性。

1 YOLOv5 網(wǎng)絡(luò)原理

YOLO是一種基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法，屬于一階段檢測(cè)網(wǎng)絡(luò)，相比于以SSD為代表的雙階段檢測(cè)網(wǎng)絡(luò)，擁有運(yùn)行速度很快的特點(diǎn)，適用于實(shí)時(shí)檢測(cè)。YOLO 網(wǎng)絡(luò)從v1 開始不斷改進(jìn)更新，現(xiàn)在該系列最新的網(wǎng)絡(luò)為YOLOv5，在許多方面都有應(yīng)用且達(dá)到了不錯(cuò)的效果。接下來是對(duì)YOLOv5 的結(jié)構(gòu)以及檢測(cè)運(yùn)用到的方法作介紹。YOLOv5 的整體網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。

圖1 YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)［12］Fig.1 Network architecture of YOLOv5［12］

其中，骨干網(wǎng)絡(luò)（Backbone）用以提取圖像中的特征信息，頸部網(wǎng)絡(luò)（Neck）用以整合不同尺度的特征信息并傳輸?shù)捷敵鰧樱∣utput），輸出層用以生成預(yù)測(cè)結(jié)果。網(wǎng)絡(luò)中的模塊包含聚焦（Focus）模塊、基礎(chǔ)卷積（CONV）模塊、跨階段局部網(wǎng)絡(luò)（CSP）模塊、空間金字塔池化（SPP）模塊、連接（Concat）模塊、上采樣（Upsample）模塊。相同的模塊有不同的輸入通道數(shù)（in_channel）、輸出通道數(shù)（out_channel）、卷積核大?。╧ernel_size）、卷積步長(zhǎng)（stride）。

1.1 CONV 模塊

CONV 模塊是YOLOv5 中最基礎(chǔ)的模塊，由卷積模塊、BN 模塊、Leaky ReLU 激活函數(shù)組成。卷積模塊是卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)、Leaky ReLU 函數(shù)，可以防止梯度飽和的問題，同時(shí)有效抑制梯度消失現(xiàn)象。

BN 算法引入了可學(xué)習(xí)參數(shù)、，從而恢復(fù)出前一層網(wǎng)絡(luò)所學(xué)習(xí)到的特征。BN 的引入減少了初始參數(shù)的限制，可以選擇較大的初始學(xué)習(xí)率，加快了訓(xùn)練速度；BN 極大增強(qiáng)了網(wǎng)絡(luò)泛化能力，減少過擬合，計(jì)算公式如下：

式中：x為神經(jīng)元輸入；［x］為各神經(jīng)元輸入值的平均值；Var（x）為各神經(jīng)元輸入值的方差。

1.2 CSP 結(jié)構(gòu)

跨階段局部網(wǎng)絡(luò)（Cross Stage Partial Network，CSPNet）是減少目前需要的大量推理計(jì)算。以往在實(shí)際應(yīng)用中能夠獲得較好結(jié)果的方法在很大程度上需要依賴龐大的計(jì)算量。CSPNet 是一種網(wǎng)絡(luò)設(shè)計(jì)思路，與殘差結(jié)構(gòu)的思想相似，可以與已有的網(wǎng)絡(luò)結(jié)合。實(shí)驗(yàn)中顯示，隨著CSPNet 的引入，計(jì)算量有了大幅下降的同時(shí)，準(zhǔn)確率沒有下降，甚至有略微的提升。CSP 模塊結(jié)構(gòu)如圖2 所示。

基礎(chǔ)層的特征映射被CSP 模塊劃分為2 部分，即圖2 中左側(cè)的單卷積部分和中間的深層網(wǎng)絡(luò)部分，然后用跨階段結(jié)構(gòu)將合并這2 部分。深層網(wǎng)絡(luò)部分中的瓶頸模塊（Bottleneck）為一個(gè)使用了殘差結(jié)構(gòu)的特征提取模塊。

圖2 CSP 模塊結(jié)構(gòu)［12］Fig.2 Architecture of the CSP module［12］

1.3 路徑聚合網(wǎng)絡(luò)結(jié)構(gòu)

路徑聚合網(wǎng)絡(luò)（Path Aggregation Network，PANet，PANet）提出的目的是在特征圖金字塔網(wǎng)絡(luò)（Feature Pyramid Network，F(xiàn)PN）的基礎(chǔ)上進(jìn)一步促進(jìn)不同層之間特征信息的流動(dòng)，其結(jié)構(gòu)如圖3 所示。PANet 在自頂往下的網(wǎng)絡(luò)后，又增加了一個(gè)自底往上的金字塔結(jié)構(gòu)。

圖3 PANet 結(jié)構(gòu)［17］Fig.3 Architecture of the PANet［17］

語(yǔ)義特征通過FPN 層自頂往下傳達(dá)，定位特征則通過PANet 自底向上傳達(dá)，不同的卷積層從不同的主干層進(jìn)行融合，特征提取能力從而獲得提高。

1.4 損失函數(shù)

目標(biāo)檢測(cè)最常用的損失函數(shù)是交并比（Intersection over Union，IoU），計(jì)算公式如下：

式中：DR（Detection Results）為檢測(cè)結(jié)果；GT（Ground Truth）為實(shí)際結(jié)果。

但I(xiàn)oU 無法反映兩框距離的遠(yuǎn)近，因此提出了綜合交并比（Generalized Intersection over Union，GIoU）。在GIoU 基礎(chǔ)上，距離交并比（Distance Intersection over Union，DIoU）考慮了檢測(cè)結(jié)果與真實(shí)值間的重疊率、距離以及尺度。更進(jìn)一步地，完備交并比（Complete Intersection over Union，CIoU）考慮到了檢測(cè)框的長(zhǎng)寬比，在DIoU 的公式中加入了一個(gè)影響因子，具體公式如下：

式中：為權(quán)重參數(shù)；為2 個(gè)點(diǎn)的歐氏距離；衡量檢測(cè)值和真實(shí)值之間長(zhǎng)寬比的相似性，定義如下：

式中：為寬；為高。

CIoU 綜合考慮了檢測(cè)值和真實(shí)值之間的IoU、距離、長(zhǎng)寬比等因素，包含的方面較為全面，使得檢測(cè)值有較好的精度，因此YOLOv5 中默認(rèn)采用CIoU 作為計(jì)算預(yù)測(cè)值損失的方法。

2 網(wǎng)絡(luò)改進(jìn)原理

2.1 注意力機(jī)制模型

計(jì)算機(jī)視覺的注意力機(jī)制的思想是通過尋找現(xiàn)有數(shù)據(jù)間的關(guān)聯(lián)性突出某些重要特征，是一個(gè)在［0，1］區(qū)間連續(xù)分布的問題，屬于軟注意力。軟注意力可以通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)，經(jīng)過前向傳播和后向傳播來得到注意力的權(quán)重。

壓縮激發(fā)網(wǎng)絡(luò)（Squeeze and Excitation Networks，SENet）關(guān)注通道之間的關(guān)系，希望網(wǎng)絡(luò)能夠自發(fā)學(xué)習(xí)到特征圖不同通道的重要程度，其結(jié)構(gòu)如圖4 所示。

圖4 SENet 結(jié)構(gòu)［20］Fig.4 Architecture of the SENet［20］

如圖4 所示，任意特征圖經(jīng)過任意特征提取操作后獲得特征圖，其中分別為特征圖的高度、寬度、通道數(shù)。SENet 通過對(duì)特征圖進(jìn)行壓縮（Squeeze）和激發(fā)（Excitation）操作，即圖中和，得到1 個(gè)一維向量，向量中的每個(gè)參數(shù)作為每個(gè)通道的評(píng)分，然后在通道上施加對(duì)應(yīng)的權(quán)重，得到處理后的結(jié)果。其中壓縮操作對(duì)每個(gè)通道做平均池化，得到各個(gè)通道的統(tǒng)計(jì)數(shù)值；激發(fā)操作學(xué)習(xí)通道的相關(guān)程度，并根據(jù)相關(guān)程度調(diào)整權(quán)重。

卷積塊注意力模塊（Convolutional Block Attention Module，CBAM）結(jié)合了空間注意力和通道注意力，如圖5（a）所示。輸入特征圖（Input Feature）經(jīng)過通道CAM 和空間注意力機(jī)制模塊（Spatial Attention Module，SAM）獲得提煉后特征圖（Refined Feature）。通道CAM 與SENet 相似，不再贅述。圖5（b）是SAM，和通道注意力類似，空間注意力可以學(xué)習(xí)特征圖不同空間的重要程度。

圖5 CBAM 及SAM［21］Fig.5 Schematic diagram of the CBAM and SAM［21］

圖5（b）所示的SAM 的具體操作如下：首先對(duì)于輸入的特征圖，即經(jīng)過通道CAM 處理的特征圖（Channel-refined feature），分別做基于通道的平均池化（AvgPool）、最大池化（MaxPool），池化后的2個(gè)結(jié)果做基于通道的拼接操作；然后通過卷積（conv layer），將通道數(shù)減少為1；再通過激活函數(shù)，獲得空間注意力特征圖。將獲得的空間注意力特征圖施加在原來的特征圖上得到最終的特征。與通道注意力類似，空間注意力可以學(xué)習(xí)特征圖不同空間的重要程度。不同于只關(guān)注通道注意力機(jī)制的SENet 模塊，CBAM 模塊往往可以取得更好的效果。

上述2 種注意力機(jī)制模塊都是輕量的通用模塊，由于2 種模塊輸入和輸出的特征圖大小是一致的，因此可以直接將模塊添加用于YOLOv5 網(wǎng)絡(luò)的各層，將其融入到各種卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行端到端的訓(xùn)練。本實(shí)驗(yàn)中，將2 種模塊分別添加與檢測(cè)頭前的位置。改進(jìn)后的網(wǎng)絡(luò)如圖6 所示。

圖6 改進(jìn)后YOLOv5 結(jié)構(gòu)Fig.6 Architecture of the improved YOLOv5

2.2 CSL 算法

為了處理邊界問題，圓光滑標(biāo)簽（Circular Smooth Label，CSL）算法將角度問題從原本的回歸問題轉(zhuǎn)化為分類問題，解決了角度的邊界問題，可以很好地和長(zhǎng)邊定義法結(jié)合。CSL 將定義的角度進(jìn)行劃分，如圖7 所示。

圖7 角度的分類定義［22］Fig.7 Categorical definition of angles［22］

僅僅把角度當(dāng)作類別問題無法衡量預(yù)測(cè)角度和真實(shí)角度之間的距離，為了解決這個(gè)問題，CSL設(shè)計(jì)了如下表達(dá)式：

式中：（）為窗口函數(shù)；為窗口半徑。

滿足如下幾點(diǎn)：周期性，周期為180/；對(duì)稱性，關(guān)于對(duì)稱；最大值為1；單調(diào)性，

將角度問題轉(zhuǎn)換為類別問題就是將一個(gè)連續(xù)問題轉(zhuǎn)換為離散問題，這意味著轉(zhuǎn)換過程中精度會(huì)有損失。CSL 作者在文章中計(jì)算了損失以確定其對(duì)最終結(jié)果的影響，計(jì)算公式如下：

式中：為相鄰兩類角度之間的差，比如將1°劃分為一類時(shí)=1，此時(shí)精度的最大損失、角度服從平均分布下的平均損失分別為0.5°和0.25°。這對(duì)于結(jié)果的影響很小，在實(shí)際應(yīng)用中可以不予考慮。

將該算法與YOLOv5 網(wǎng)絡(luò)相結(jié)合需對(duì)網(wǎng)絡(luò)做如下改動(dòng)：1）數(shù)據(jù)輸入部分，增加數(shù)據(jù)維度，在原有的檢測(cè)框數(shù)據(jù)基礎(chǔ)上增加角度數(shù)據(jù)信息；2）網(wǎng)絡(luò)檢測(cè)部分，增加角度信息的預(yù)測(cè)；3）損失函數(shù)部分，構(gòu)建目標(biāo)時(shí)增加角度信息列表，并在損失函數(shù)計(jì)算時(shí)增加角度信息損失的計(jì)算，計(jì)算函數(shù)與類別損失計(jì)算函數(shù)相同；4）可視化部分，將繪制水平矩形框修改為繪制旋轉(zhuǎn)矩形框。在YOLOv5 網(wǎng)絡(luò)的整體結(jié)構(gòu)上并無改動(dòng)。

3 檢測(cè)實(shí)驗(yàn)與結(jié)果分析

3.1 數(shù)據(jù)集

本次實(shí)驗(yàn)計(jì)劃使用SSDD公開SAR艦船檢測(cè)數(shù)據(jù)集。該數(shù)據(jù)集包含了多種不同的成像條件。圖像主要來源于RadarSat-2、TerraSAR-X 和Sentinel-1 衛(wèi)星傳感器，一共4 種極化模式，分辨率的范圍為1～15 m。

通過位深度轉(zhuǎn)換和對(duì)比度調(diào)整，將原數(shù)據(jù)調(diào)整為更適合用于網(wǎng)絡(luò)訓(xùn)練和人工評(píng)估的圖像。之后選取包含艦船目標(biāo)的圖像區(qū)域，按照所構(gòu)建的神經(jīng)網(wǎng)絡(luò)要求，將圖像進(jìn)行切片為適合網(wǎng)絡(luò)進(jìn)行訓(xùn)練的圖像尺寸，完成訓(xùn)練集的制作。原圖和處理后圖像如圖8 所示。

圖8 處理前后數(shù)據(jù)對(duì)比Fig.8 Comparison of images before and after processing

數(shù)據(jù)集切片數(shù)量為1 386 張。將1 386 張圖片分為兩類，包含陸地的數(shù)據(jù)、不包含陸地的數(shù)據(jù)，其中包含陸地的切片數(shù)量為304 張，不包含陸地的切片數(shù)量為1 082 張。由于數(shù)據(jù)集數(shù)量較少，按照6∶2∶2 的比例分別將上述兩類數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集、測(cè)試集，并在測(cè)試集中去除不包含陸地的目標(biāo)，著重分析網(wǎng)絡(luò)對(duì)于近岸目標(biāo)的檢測(cè)性能。SSDD 數(shù)據(jù)集分配見表1。

表1 SSDD 數(shù)據(jù)集分配Tab.1 SSDD dataset distribution

3.2 初步檢測(cè)實(shí)驗(yàn)

使用YOLOv5 在coco 數(shù)據(jù)集的預(yù)訓(xùn)練權(quán)重進(jìn)行初步訓(xùn)練，處理批次大小設(shè)置為8。處理批次過大會(huì)導(dǎo)致梯度下降速度緩慢，過小會(huì)導(dǎo)致?lián)p失函數(shù)難以收斂。在合理的范圍內(nèi)增加處理批次可以使顯卡性能利用率提高，訓(xùn)練速度加快。迭代次數(shù)設(shè)置為300，采用隨機(jī)梯度下降作為梯度下降算法。初始學(xué)習(xí)率為0.01，周期學(xué)習(xí)率為0.2。YOLOv5訓(xùn)練過程中，隨著迭代次數(shù)增加，學(xué)習(xí)率減小，具體公式如下：

式中：為迭代總次數(shù)；為第次迭代；lr為第次迭代的學(xué)習(xí)率；為初始學(xué)習(xí)率；為周期學(xué)習(xí)率。最后一次迭代時(shí)，學(xué)習(xí)率為。

均值平均精度（Mean Average Precision，mAP），用以衡量網(wǎng)絡(luò)性能。計(jì)算時(shí)，置信度閾值設(shè)置為0.001，NMS 置信度設(shè)置為0.5；檢測(cè)時(shí)，置信度閾值為0.5，NMS置信度為0.5。測(cè)試結(jié)果如圖9所示。

圖9 中，左側(cè)為200 次迭代訓(xùn)練后的檢測(cè)結(jié)果，右圖為300 次迭代訓(xùn)練后的檢測(cè)結(jié)果。然而兩個(gè)結(jié)果之間差距不大，證明網(wǎng)絡(luò)已經(jīng)經(jīng)過充分訓(xùn)練，雖然出現(xiàn)過擬合的現(xiàn)象，但下降幅度不大，過擬合不嚴(yán)重，證明了YOLOv5 防止過擬合性能較為優(yōu)秀。部分檢測(cè)結(jié)果如圖10 所示。

圖9 精度-召回率曲線Fig.9 Precision-recall curves

圖10 檢測(cè)結(jié)果Fig.10 Detected results

3.3 注意力機(jī)制改進(jìn)實(shí)驗(yàn)

為了進(jìn)一步提高準(zhǔn)確率，在YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)中加入注意力機(jī)制模塊，并重復(fù)實(shí)驗(yàn)。分別加入模塊SELayer 和CBAM，數(shù)量為1，位置為網(wǎng)絡(luò)第8層，處理批次大小設(shè)置為8。采用隨機(jī)梯度下降作為梯度下降算法，初始學(xué)習(xí)率為0.01，周期學(xué)習(xí)率為0.2，NMS 閾值為0.5。由于增加了模塊，模型參數(shù)增加，導(dǎo)致訓(xùn)練速度減慢，因此需要增加迭代次數(shù)，迭代次數(shù)設(shè)置為400。加入CAM 后精度-召回率曲線如圖11 所示。

圖11 加入CAM 后精度-召回率曲線Fig.11 Precision-recall curves after adding CAM

圖中可見：加入SELayer的網(wǎng)絡(luò)，mAP 值有小幅度提升，且準(zhǔn)確率下降到一定程度后沒有繼續(xù)下降，證明SELayer 模塊在減少檢測(cè)網(wǎng)絡(luò)錯(cuò)檢的效果上較為突出；加入CBAM 模塊的網(wǎng)絡(luò)，mAP 值有更明顯的提升，證明了注意力機(jī)制模塊在提升檢測(cè)網(wǎng)絡(luò)性能方面的作用，且CBAM 較SELayer性能更好。

3.4 模型性能對(duì)比

YOLOv5、改進(jìn)后YOLOv5 與其他典型檢測(cè)網(wǎng)絡(luò)性能對(duì)比見表2，典型檢測(cè)網(wǎng)絡(luò)包括Faster RCNN和SSD。

表2 檢測(cè)結(jié)果對(duì)比Tab.2 Comparison of the detected results

由表2 可知，原YOLOv5 網(wǎng)絡(luò)與典型檢測(cè)相比，在準(zhǔn)確率性能方面較為相近，但在檢測(cè)速度方面有明顯優(yōu)勢(shì)。增加CAM 的改進(jìn)后網(wǎng)絡(luò)雖然增加了網(wǎng)絡(luò)復(fù)雜度，因此增加了檢測(cè)用時(shí)，但仍具有較高效率，同時(shí)在檢測(cè)準(zhǔn)確率方面也有提升。

3.5 結(jié)果分析與改進(jìn)方案

由以上收集的檢測(cè)結(jié)果可以初步歸納檢測(cè)錯(cuò)誤原因，漏檢的原因主要為檢測(cè)目標(biāo)附近的干擾、艦船的密集分布，其中干擾包含由于噪聲導(dǎo)致的干擾和由于較為靠近陸地導(dǎo)致的陸地背景的干擾；錯(cuò)檢的原因主要為將形狀與艦船類似的目標(biāo)錯(cuò)誤判定為目標(biāo)，將與艦船類似的目標(biāo)命名為干擾目標(biāo)，干擾目標(biāo)可以分為離岸的干擾目標(biāo)和陸地干擾目標(biāo)。部分錯(cuò)檢結(jié)果如圖12 所示。

圖12 部分錯(cuò)檢結(jié)果Fig.12 Partial wrong detected results

針對(duì)以上問題提出如下解決方案：針對(duì)噪聲導(dǎo)致的干擾，增加圖像降噪的預(yù)處理環(huán)節(jié)；針對(duì)靠近陸地導(dǎo)致的陸地背景的干擾以及陸地的干擾目標(biāo)，增加海陸分割的預(yù)處理環(huán)節(jié)；針對(duì)艦船密集分布的問題，加入旋轉(zhuǎn)框檢測(cè)網(wǎng)絡(luò)。除了以上針對(duì)性措施之外，還可以通過增加訓(xùn)練集、提高網(wǎng)絡(luò)的特征提取性能等方法，綜合提升網(wǎng)絡(luò)性能。

3.6 CSL 旋轉(zhuǎn)框檢測(cè)實(shí)驗(yàn)

在以上實(shí)驗(yàn)中發(fā)現(xiàn)，錯(cuò)檢漏檢目標(biāo)有部分原因來自于較為密集的目標(biāo)，因此嘗試實(shí)現(xiàn)旋轉(zhuǎn)框的目標(biāo)檢測(cè)網(wǎng)絡(luò)。計(jì)劃使用CSL 算法，實(shí)現(xiàn)YOLOv5 旋轉(zhuǎn)框檢測(cè)網(wǎng)絡(luò)改建。

訓(xùn)練時(shí)，處理批次大小設(shè)置為8，采用Adam 算法作為梯度下降算法優(yōu)化器。初始學(xué)習(xí)率為0.001，周期學(xué)習(xí)率為0.01，迭代次數(shù)為200 次。最終loss的訓(xùn)練結(jié)果為box_loss=0.083 26，obj_loss=0.015 12，angle_loss=0.266，獲得的部分結(jié)果如圖13 所示。

圖13 部分旋轉(zhuǎn)框檢測(cè)結(jié)果Fig.13 Partial detected results of the rotating frame

由圖13 結(jié)果可知，在部分情況下旋轉(zhuǎn)框可以較為精確地框定出目標(biāo)范圍，能夠證實(shí)CSL+YOLOv5 算法進(jìn)行旋轉(zhuǎn)框檢測(cè)的可行性。但是漏檢、誤檢在大部分情況下較為嚴(yán)重，且目標(biāo)的置信度普遍不高。判斷原因主要在于網(wǎng)絡(luò)未得到充分的訓(xùn)練，loss 在下降到一定程度后無法繼續(xù)收斂，網(wǎng)絡(luò)訓(xùn)練陷入了局部最優(yōu)。后續(xù)需要改變訓(xùn)練策略，進(jìn)行進(jìn)一步的訓(xùn)練，嘗試將網(wǎng)絡(luò)充分訓(xùn)練；或者對(duì)CSL算法進(jìn)行改進(jìn)，嘗試尋找更優(yōu)的旋轉(zhuǎn)標(biāo)簽標(biāo)注法和損失函數(shù)算法。

4 結(jié)束語(yǔ)

本文構(gòu)建了著重于近岸目標(biāo)的訓(xùn)練和測(cè)試集，開展以原YOLOv5 網(wǎng)絡(luò)為基礎(chǔ)的近岸艦船目標(biāo)檢測(cè)網(wǎng)絡(luò)實(shí)驗(yàn)和加入注意力機(jī)制模塊的改進(jìn)實(shí)驗(yàn)，并取得了較為理想的效果——在近岸測(cè)試集中，mAP達(dá)到了80%以上。證實(shí)了YOLOv5 網(wǎng)絡(luò)作為近岸艦船目標(biāo)檢測(cè)網(wǎng)絡(luò)有著較為良好的性能，注意力機(jī)制模塊在提升檢測(cè)網(wǎng)路準(zhǔn)確率方面也有著較好的效果。

針對(duì)近岸情況中艦船目標(biāo)密集導(dǎo)致漏檢的問題，開展旋轉(zhuǎn)檢測(cè)框?qū)嶒?yàn)，并且能夠初步證明CSL+YOLOv5 實(shí)現(xiàn)旋轉(zhuǎn)框檢測(cè)的可行性，但未能達(dá)到預(yù)期中提升檢測(cè)性能的效果。分析原因后提出如下改進(jìn)方案：嘗試不同的學(xué)習(xí)率，梯度優(yōu)化算法；修改原有的評(píng)估方法，得到適合旋轉(zhuǎn)框目標(biāo)的評(píng)估方法，指導(dǎo)訓(xùn)練網(wǎng)絡(luò)的參數(shù)優(yōu)化環(huán)節(jié)，從而實(shí)現(xiàn)網(wǎng)絡(luò)的充分訓(xùn)練?；蛘邔?duì)CSL 算法進(jìn)行改進(jìn)，嘗試尋找更優(yōu)的旋轉(zhuǎn)標(biāo)簽標(biāo)注法和損失函數(shù)算法。

在總結(jié)錯(cuò)誤原因后，除了旋轉(zhuǎn)框檢測(cè)之外，提出如下解決方案：針對(duì)噪聲導(dǎo)致的干擾，增加圖像降噪的預(yù)處理環(huán)節(jié)；針對(duì)靠近陸地導(dǎo)致的陸地背景的干擾以及陸地的干擾目標(biāo)，增加海陸分割的預(yù)處理環(huán)節(jié)。除了以上針對(duì)性措施之外，還可以通過增加訓(xùn)練集、提高網(wǎng)絡(luò)的特征提取性能等方法，綜合提升網(wǎng)絡(luò)性能。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡