国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于YOLOv5 的近岸SAR 艦船目標(biāo)檢測(cè)方法

2022-07-15 19:23:50鄭世超楚博策
上海航天 2022年3期
關(guān)鍵詞:艦船注意力卷積

富 強(qiáng),楊 威,陳 杰,鄭世超,楚博策,3

(1.北京航空航天大學(xué) 電子信息工程學(xué)院,北京 100191;2.上海衛(wèi)星工程研究所,上海 200240;3.中國(guó)電子科技集團(tuán)公司航天信息應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室,河北石家莊 050081)

0 引言

合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)是一種主動(dòng)式微波成像傳感器,它可以不受天氣的影響,不分晝夜,同時(shí)可以獲得更高質(zhì)量、更高分辨率的大范圍遠(yuǎn)距離圖像。因此,利用SAR 圖像進(jìn)行艦船檢測(cè)已成為國(guó)內(nèi)外研究的熱點(diǎn)。傳統(tǒng)的基于SAR 圖像的艦船檢測(cè)主要包括恒虛警率(Constant False Alarm Rate,CFAR)算法和基于特征提取的算法等。對(duì)于近岸艦船,要考慮艦船的密集停放,同時(shí)考慮陸地環(huán)境中大量的人工目標(biāo),如建筑物、車輛等,其目標(biāo)的特征與艦船相似,為準(zhǔn)確的目標(biāo)檢測(cè)帶來了很大的影響和挑戰(zhàn)。

近年來,隨著深度學(xué)習(xí)的快速發(fā)展,這一技術(shù)得到了廣泛的應(yīng)用,并在圖像識(shí)別領(lǐng)域取得了很大的進(jìn)展,許多研究人員在艦船識(shí)別中也引入了深度學(xué)習(xí)。深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neutral Network,CNN)通過逐層學(xué)習(xí)和自主提取特征,可以充分利用圖像中的信息,從而擺脫了傳統(tǒng)方法的限制,在各種復(fù)雜多變的環(huán)境中具有良好的魯棒性。文獻(xiàn)[7]設(shè)計(jì)了基于注意力機(jī)制特征重建網(wǎng)絡(luò)的艦船目標(biāo)檢測(cè)算法,引入注意力旋轉(zhuǎn)錨框以緩解密集排列目標(biāo)引起的噪聲問題,并利用特征重建模塊來實(shí)現(xiàn)特征精煉。文獻(xiàn)[8]通過網(wǎng)絡(luò)輕量化和聚類算法改進(jìn)YOLOv3 網(wǎng)絡(luò),提升檢測(cè)精度的同時(shí)加快了檢測(cè)速度。

本文利用真實(shí)的開源SAR 圖像構(gòu)建了一個(gè)近岸SAR 艦船數(shù)據(jù)集,在此基礎(chǔ)上進(jìn)行了檢測(cè)實(shí)驗(yàn),精確評(píng)估了檢測(cè)網(wǎng)絡(luò)在近岸艦船上的性能。然后,引入注意力模塊(Channel Attention Module,CAM)來提高網(wǎng)絡(luò)的檢測(cè)性能。在近岸測(cè)試集中,mAP 達(dá)到80%以上。此外,為了解決近岸地區(qū)艦船密集分布導(dǎo)致的檢測(cè)性能下降的問題,引入了基于YOLOv5 和CSL 算法的旋轉(zhuǎn)檢測(cè)網(wǎng)絡(luò),并證明了其可行性。

1 YOLOv5 網(wǎng)絡(luò)原理

YOLO是一種基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法,屬于一階段檢測(cè)網(wǎng)絡(luò),相比于以SSD為代表的雙階段檢測(cè)網(wǎng)絡(luò),擁有運(yùn)行速度很快的特點(diǎn),適用于實(shí)時(shí)檢測(cè)。YOLO 網(wǎng)絡(luò)從v1 開始不斷改進(jìn)更新,現(xiàn)在該系列最新的網(wǎng)絡(luò)為YOLOv5,在許多方面都有應(yīng)用且達(dá)到了不錯(cuò)的效果。接下來是對(duì)YOLOv5 的結(jié)構(gòu)以及檢測(cè)運(yùn)用到的方法作介紹。YOLOv5 的整體網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。

圖1 YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)[12]Fig.1 Network architecture of YOLOv5[12]

其中,骨干網(wǎng)絡(luò)(Backbone)用以提取圖像中的特征信息,頸部網(wǎng)絡(luò)(Neck)用以整合不同尺度的特征信息并傳輸?shù)捷敵鰧樱∣utput),輸出層用以生成預(yù)測(cè)結(jié)果。網(wǎng)絡(luò)中的模塊包含聚焦(Focus)模塊、基礎(chǔ)卷積(CONV)模塊、跨階段局部網(wǎng)絡(luò)(CSP)模塊、空間金字塔池化(SPP)模塊、連接(Concat)模塊、上采樣(Upsample)模塊。相同的模塊有不同的輸入通道數(shù)(in_channel)、輸出通道數(shù)(out_channel)、卷積核大?。╧ernel_size)、卷積步長(zhǎng)(stride)。

1.1 CONV 模塊

CONV 模塊是YOLOv5 中最基礎(chǔ)的模塊,由卷積模塊、BN 模塊、Leaky ReLU 激活函數(shù)組成。卷積模塊是卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)、Leaky ReLU 函數(shù),可以防止梯度飽和的問題,同時(shí)有效抑制梯度消失現(xiàn)象。

BN 算法引入了可學(xué)習(xí)參數(shù)、,從而恢復(fù)出前一層網(wǎng)絡(luò)所學(xué)習(xí)到的特征。BN 的引入減少了初始參數(shù)的限制,可以選擇較大的初始學(xué)習(xí)率,加快了訓(xùn)練速度;BN 極大增強(qiáng)了網(wǎng)絡(luò)泛化能力,減少過擬合,計(jì)算公式如下:

式中:x為神經(jīng)元輸入;[x]為各神經(jīng)元輸入值的平均值;Var(x)為各神經(jīng)元輸入值的方差。

1.2 CSP 結(jié)構(gòu)

跨階段局部網(wǎng)絡(luò)(Cross Stage Partial Network,CSPNet)是減少目前需要的大量推理計(jì)算。以往在實(shí)際應(yīng)用中能夠獲得較好結(jié)果的方法在很大程度上需要依賴龐大的計(jì)算量。CSPNet 是一種網(wǎng)絡(luò)設(shè)計(jì)思路,與殘差結(jié)構(gòu)的思想相似,可以與已有的網(wǎng)絡(luò)結(jié)合。實(shí)驗(yàn)中顯示,隨著CSPNet 的引入,計(jì)算量有了大幅下降的同時(shí),準(zhǔn)確率沒有下降,甚至有略微的提升。CSP 模塊結(jié)構(gòu)如圖2 所示。

基礎(chǔ)層的特征映射被CSP 模塊劃分為2 部分,即圖2 中左側(cè)的單卷積部分和中間的深層網(wǎng)絡(luò)部分,然后用跨階段結(jié)構(gòu)將合并這2 部分。深層網(wǎng)絡(luò)部分中的瓶頸模塊(Bottleneck)為一個(gè)使用了殘差結(jié)構(gòu)的特征提取模塊。

圖2 CSP 模塊結(jié)構(gòu)[12]Fig.2 Architecture of the CSP module[12]

1.3 路徑聚合網(wǎng)絡(luò)結(jié)構(gòu)

路徑聚合網(wǎng)絡(luò)(Path Aggregation Network,PANet,PANet)提出的目的是在特征圖金字塔網(wǎng)絡(luò)(Feature Pyramid Network,F(xiàn)PN)的基礎(chǔ)上進(jìn)一步促進(jìn)不同層之間特征信息的流動(dòng),其結(jié)構(gòu)如圖3 所示。PANet 在自頂往下的網(wǎng)絡(luò)后,又增加了一個(gè)自底往上的金字塔結(jié)構(gòu)。

圖3 PANet 結(jié)構(gòu)[17]Fig.3 Architecture of the PANet[17]

語(yǔ)義特征通過FPN 層自頂往下傳達(dá),定位特征則通過PANet 自底向上傳達(dá),不同的卷積層從不同的主干層進(jìn)行融合,特征提取能力從而獲得提高。

1.4 損失函數(shù)

目標(biāo)檢測(cè)最常用的損失函數(shù)是交并比(Intersection over Union,IoU),計(jì)算公式如下:

式中:DR(Detection Results)為檢測(cè)結(jié)果;GT(Ground Truth)為實(shí)際結(jié)果。

但I(xiàn)oU 無法反映兩框距離的遠(yuǎn)近,因此提出了綜合交并比(Generalized Intersection over Union,GIoU)。在GIoU 基礎(chǔ)上,距離交并比(Distance Intersection over Union,DIoU)考慮了檢測(cè)結(jié)果與真實(shí)值間的重疊率、距離以及尺度。更進(jìn)一步地,完備交并比(Complete Intersection over Union,CIoU)考慮到了檢測(cè)框的長(zhǎng)寬比,在DIoU 的公式中加入了一個(gè)影響因子,具體公式如下:

式中:為權(quán)重參數(shù);為2 個(gè)點(diǎn)的歐氏距離;衡量檢測(cè)值和真實(shí)值之間長(zhǎng)寬比的相似性,定義如下:

式中:為寬;為高。

CIoU 綜合考慮了檢測(cè)值和真實(shí)值之間的IoU、距離、長(zhǎng)寬比等因素,包含的方面較為全面,使得檢測(cè)值有較好的精度,因此YOLOv5 中默認(rèn)采用CIoU 作為計(jì)算預(yù)測(cè)值損失的方法。

2 網(wǎng)絡(luò)改進(jìn)原理

2.1 注意力機(jī)制模型

計(jì)算機(jī)視覺的注意力機(jī)制的思想是通過尋找現(xiàn)有數(shù)據(jù)間的關(guān)聯(lián)性突出某些重要特征,是一個(gè)在[0,1]區(qū)間連續(xù)分布的問題,屬于軟注意力。軟注意力可以通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),經(jīng)過前向傳播和后向傳播來得到注意力的權(quán)重。

壓縮激發(fā)網(wǎng)絡(luò)(Squeeze and Excitation Networks,SENet)關(guān)注通道之間的關(guān)系,希望網(wǎng)絡(luò)能夠自發(fā)學(xué)習(xí)到特征圖不同通道的重要程度,其結(jié)構(gòu)如圖4 所示。

圖4 SENet 結(jié)構(gòu)[20]Fig.4 Architecture of the SENet[20]

如圖4 所示,任意特征圖經(jīng)過任意特征提取操作后獲得特征圖,其中分別為特征圖的高度、寬度、通道數(shù)。SENet 通過對(duì)特征圖進(jìn)行壓縮(Squeeze)和激發(fā)(Excitation)操作,即圖中和,得到1 個(gè)一維向量,向量中的每個(gè)參數(shù)作為每個(gè)通道的評(píng)分,然后在通道上施加對(duì)應(yīng)的權(quán)重,得到處理后的結(jié)果。其中壓縮操作對(duì)每個(gè)通道做平均池化,得到各個(gè)通道的統(tǒng)計(jì)數(shù)值;激發(fā)操作學(xué)習(xí)通道的相關(guān)程度,并根據(jù)相關(guān)程度調(diào)整權(quán)重。

卷積塊注意力模塊(Convolutional Block Attention Module,CBAM)結(jié)合了空間注意力和通道注意力,如圖5(a)所示。輸入特征圖(Input Feature)經(jīng)過通道CAM 和空間注意力機(jī)制模塊(Spatial Attention Module,SAM)獲得提煉后特征圖(Refined Feature)。通道CAM 與SENet 相似,不再贅述。圖5(b)是SAM,和通道注意力類似,空間注意力可以學(xué)習(xí)特征圖不同空間的重要程度。

圖5 CBAM 及SAM[21]Fig.5 Schematic diagram of the CBAM and SAM[21]

圖5(b)所示的SAM 的具體操作如下:首先對(duì)于輸入的特征圖,即經(jīng)過通道CAM 處理的特征圖(Channel-refined feature),分別做基于通道的平均池化(AvgPool)、最大池化(MaxPool),池化后的2個(gè)結(jié)果做基于通道的拼接操作;然后通過卷積(conv layer),將通道數(shù)減少為1;再通過激活函數(shù),獲得空間注意力特征圖。將獲得的空間注意力特征圖施加在原來的特征圖上得到最終的特征。與通道注意力類似,空間注意力可以學(xué)習(xí)特征圖不同空間的重要程度。不同于只關(guān)注通道注意力機(jī)制的SENet 模塊,CBAM 模塊往往可以取得更好的效果。

上述2 種注意力機(jī)制模塊都是輕量的通用模塊,由于2 種模塊輸入和輸出的特征圖大小是一致的,因此可以直接將模塊添加用于YOLOv5 網(wǎng)絡(luò)的各層,將其融入到各種卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行端到端的訓(xùn)練。本實(shí)驗(yàn)中,將2 種模塊分別添加與檢測(cè)頭前的位置。改進(jìn)后的網(wǎng)絡(luò)如圖6 所示。

圖6 改進(jìn)后YOLOv5 結(jié)構(gòu)Fig.6 Architecture of the improved YOLOv5

2.2 CSL 算法

為了處理邊界問題,圓光滑標(biāo)簽(Circular Smooth Label,CSL)算法將角度問題從原本的回歸問題轉(zhuǎn)化為分類問題,解決了角度的邊界問題,可以很好地和長(zhǎng)邊定義法結(jié)合。CSL 將定義的角度進(jìn)行劃分,如圖7 所示。

圖7 角度的分類定義[22]Fig.7 Categorical definition of angles[22]

僅僅把角度當(dāng)作類別問題無法衡量預(yù)測(cè)角度和真實(shí)角度之間的距離,為了解決這個(gè)問題,CSL設(shè)計(jì)了如下表達(dá)式:

式中:()為窗口函數(shù);為窗口半徑。

滿足如下幾點(diǎn):周期性,周期為180/;對(duì)稱性,關(guān)于對(duì)稱;最大值為1;單調(diào)性,

將角度問題轉(zhuǎn)換為類別問題就是將一個(gè)連續(xù)問題轉(zhuǎn)換為離散問題,這意味著轉(zhuǎn)換過程中精度會(huì)有損失。CSL 作者在文章中計(jì)算了損失以確定其對(duì)最終結(jié)果的影響,計(jì)算公式如下:

式中:為相鄰兩類角度之間的差,比如將1°劃分為一類時(shí)=1,此時(shí)精度的最大損失、角度服從平均分布下的平均損失分別為0.5°和0.25°。這對(duì)于結(jié)果的影響很小,在實(shí)際應(yīng)用中可以不予考慮。

將該算法與YOLOv5 網(wǎng)絡(luò)相結(jié)合需對(duì)網(wǎng)絡(luò)做如下改動(dòng):1)數(shù)據(jù)輸入部分,增加數(shù)據(jù)維度,在原有的檢測(cè)框數(shù)據(jù)基礎(chǔ)上增加角度數(shù)據(jù)信息;2)網(wǎng)絡(luò)檢測(cè)部分,增加角度信息的預(yù)測(cè);3)損失函數(shù)部分,構(gòu)建目標(biāo)時(shí)增加角度信息列表,并在損失函數(shù)計(jì)算時(shí)增加角度信息損失的計(jì)算,計(jì)算函數(shù)與類別損失計(jì)算函數(shù)相同;4)可視化部分,將繪制水平矩形框修改為繪制旋轉(zhuǎn)矩形框。在YOLOv5 網(wǎng)絡(luò)的整體結(jié)構(gòu)上并無改動(dòng)。

3 檢測(cè)實(shí)驗(yàn)與結(jié)果分析

3.1 數(shù)據(jù)集

本次實(shí)驗(yàn)計(jì)劃使用SSDD公開SAR艦船檢測(cè)數(shù)據(jù)集。該數(shù)據(jù)集包含了多種不同的成像條件。圖像主要來源于RadarSat-2、TerraSAR-X 和Sentinel-1 衛(wèi)星傳感器,一共4 種極化模式,分辨率的范圍為1~15 m。

通過位深度轉(zhuǎn)換和對(duì)比度調(diào)整,將原數(shù)據(jù)調(diào)整為更適合用于網(wǎng)絡(luò)訓(xùn)練和人工評(píng)估的圖像。之后選取包含艦船目標(biāo)的圖像區(qū)域,按照所構(gòu)建的神經(jīng)網(wǎng)絡(luò)要求,將圖像進(jìn)行切片為適合網(wǎng)絡(luò)進(jìn)行訓(xùn)練的圖像尺寸,完成訓(xùn)練集的制作。原圖和處理后圖像如圖8 所示。

圖8 處理前后數(shù)據(jù)對(duì)比Fig.8 Comparison of images before and after processing

數(shù)據(jù)集切片數(shù)量為1 386 張。將1 386 張圖片分為兩類,包含陸地的數(shù)據(jù)、不包含陸地的數(shù)據(jù),其中包含陸地的切片數(shù)量為304 張,不包含陸地的切片數(shù)量為1 082 張。由于數(shù)據(jù)集數(shù)量較少,按照6∶2∶2 的比例分別將上述兩類數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集、測(cè)試集,并在測(cè)試集中去除不包含陸地的目標(biāo),著重分析網(wǎng)絡(luò)對(duì)于近岸目標(biāo)的檢測(cè)性能。SSDD 數(shù)據(jù)集分配見表1。

表1 SSDD 數(shù)據(jù)集分配Tab.1 SSDD dataset distribution

3.2 初步檢測(cè)實(shí)驗(yàn)

使用YOLOv5 在coco 數(shù)據(jù)集的預(yù)訓(xùn)練權(quán)重進(jìn)行初步訓(xùn)練,處理批次大小設(shè)置為8。處理批次過大會(huì)導(dǎo)致梯度下降速度緩慢,過小會(huì)導(dǎo)致?lián)p失函數(shù)難以收斂。在合理的范圍內(nèi)增加處理批次可以使顯卡性能利用率提高,訓(xùn)練速度加快。迭代次數(shù)設(shè)置為300,采用隨機(jī)梯度下降作為梯度下降算法。初始學(xué)習(xí)率為0.01,周期學(xué)習(xí)率為0.2。YOLOv5訓(xùn)練過程中,隨著迭代次數(shù)增加,學(xué)習(xí)率減小,具體公式如下:

式中:為迭代總次數(shù);為第次迭代;lr為第次迭代的學(xué)習(xí)率;為初始學(xué)習(xí)率;為周期學(xué)習(xí)率。最后一次迭代時(shí),學(xué)習(xí)率為。

均值平均精度(Mean Average Precision,mAP),用以衡量網(wǎng)絡(luò)性能。計(jì)算時(shí),置信度閾值設(shè)置為0.001,NMS 置信度設(shè)置為0.5;檢測(cè)時(shí),置信度閾值為0.5,NMS置信度為0.5。測(cè)試結(jié)果如圖9所示。

圖9 中,左側(cè)為200 次迭代訓(xùn)練后的檢測(cè)結(jié)果,右圖為300 次迭代訓(xùn)練后的檢測(cè)結(jié)果。然而兩個(gè)結(jié)果之間差距不大,證明網(wǎng)絡(luò)已經(jīng)經(jīng)過充分訓(xùn)練,雖然出現(xiàn)過擬合的現(xiàn)象,但下降幅度不大,過擬合不嚴(yán)重,證明了YOLOv5 防止過擬合性能較為優(yōu)秀。部分檢測(cè)結(jié)果如圖10 所示。

圖9 精度-召回率曲線Fig.9 Precision-recall curves

圖10 檢測(cè)結(jié)果Fig.10 Detected results

3.3 注意力機(jī)制改進(jìn)實(shí)驗(yàn)

為了進(jìn)一步提高準(zhǔn)確率,在YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)中加入注意力機(jī)制模塊,并重復(fù)實(shí)驗(yàn)。分別加入模塊SELayer 和CBAM,數(shù)量為1,位置為網(wǎng)絡(luò)第8層,處理批次大小設(shè)置為8。采用隨機(jī)梯度下降作為梯度下降算法,初始學(xué)習(xí)率為0.01,周期學(xué)習(xí)率為0.2,NMS 閾值為0.5。由于增加了模塊,模型參數(shù)增加,導(dǎo)致訓(xùn)練速度減慢,因此需要增加迭代次數(shù),迭代次數(shù)設(shè)置為400。加入CAM 后精度-召回率曲線如圖11 所示。

圖11 加入CAM 后精度-召回率曲線Fig.11 Precision-recall curves after adding CAM

圖中可見:加入SELayer的網(wǎng)絡(luò),mAP 值有小幅度提升,且準(zhǔn)確率下降到一定程度后沒有繼續(xù)下降,證明SELayer 模塊在減少檢測(cè)網(wǎng)絡(luò)錯(cuò)檢的效果上較為突出;加入CBAM 模塊的網(wǎng)絡(luò),mAP 值有更明顯的提升,證明了注意力機(jī)制模塊在提升檢測(cè)網(wǎng)絡(luò)性能方面的作用,且CBAM 較SELayer性能更好。

3.4 模型性能對(duì)比

YOLOv5、改進(jìn)后YOLOv5 與其他典型檢測(cè)網(wǎng)絡(luò)性能對(duì)比見表2,典型檢測(cè)網(wǎng)絡(luò)包括Faster RCNN和SSD。

表2 檢測(cè)結(jié)果對(duì)比Tab.2 Comparison of the detected results

由表2 可知,原YOLOv5 網(wǎng)絡(luò)與典型檢測(cè)相比,在準(zhǔn)確率性能方面較為相近,但在檢測(cè)速度方面有明顯優(yōu)勢(shì)。增加CAM 的改進(jìn)后網(wǎng)絡(luò)雖然增加了網(wǎng)絡(luò)復(fù)雜度,因此增加了檢測(cè)用時(shí),但仍具有較高效率,同時(shí)在檢測(cè)準(zhǔn)確率方面也有提升。

3.5 結(jié)果分析與改進(jìn)方案

由以上收集的檢測(cè)結(jié)果可以初步歸納檢測(cè)錯(cuò)誤原因,漏檢的原因主要為檢測(cè)目標(biāo)附近的干擾、艦船的密集分布,其中干擾包含由于噪聲導(dǎo)致的干擾和由于較為靠近陸地導(dǎo)致的陸地背景的干擾;錯(cuò)檢的原因主要為將形狀與艦船類似的目標(biāo)錯(cuò)誤判定為目標(biāo),將與艦船類似的目標(biāo)命名為干擾目標(biāo),干擾目標(biāo)可以分為離岸的干擾目標(biāo)和陸地干擾目標(biāo)。部分錯(cuò)檢結(jié)果如圖12 所示。

圖12 部分錯(cuò)檢結(jié)果Fig.12 Partial wrong detected results

針對(duì)以上問題提出如下解決方案:針對(duì)噪聲導(dǎo)致的干擾,增加圖像降噪的預(yù)處理環(huán)節(jié);針對(duì)靠近陸地導(dǎo)致的陸地背景的干擾以及陸地的干擾目標(biāo),增加海陸分割的預(yù)處理環(huán)節(jié);針對(duì)艦船密集分布的問題,加入旋轉(zhuǎn)框檢測(cè)網(wǎng)絡(luò)。除了以上針對(duì)性措施之外,還可以通過增加訓(xùn)練集、提高網(wǎng)絡(luò)的特征提取性能等方法,綜合提升網(wǎng)絡(luò)性能。

3.6 CSL 旋轉(zhuǎn)框檢測(cè)實(shí)驗(yàn)

在以上實(shí)驗(yàn)中發(fā)現(xiàn),錯(cuò)檢漏檢目標(biāo)有部分原因來自于較為密集的目標(biāo),因此嘗試實(shí)現(xiàn)旋轉(zhuǎn)框的目標(biāo)檢測(cè)網(wǎng)絡(luò)。計(jì)劃使用CSL 算法,實(shí)現(xiàn)YOLOv5 旋轉(zhuǎn)框檢測(cè)網(wǎng)絡(luò)改建。

訓(xùn)練時(shí),處理批次大小設(shè)置為8,采用Adam 算法作為梯度下降算法優(yōu)化器。初始學(xué)習(xí)率為0.001,周期學(xué)習(xí)率為0.01,迭代次數(shù)為200 次。最終loss的訓(xùn)練結(jié)果 為box_loss=0.083 26,obj_loss=0.015 12,angle_loss=0.266,獲得的部分結(jié)果如圖13 所示。

圖13 部分旋轉(zhuǎn)框檢測(cè)結(jié)果Fig.13 Partial detected results of the rotating frame

由圖13 結(jié)果可知,在部分情況下旋轉(zhuǎn)框可以較為精確地框定出目標(biāo)范圍,能夠證實(shí)CSL+YOLOv5 算法進(jìn)行旋轉(zhuǎn)框檢測(cè)的可行性。但是漏檢、誤檢在大部分情況下較為嚴(yán)重,且目標(biāo)的置信度普遍不高。判斷原因主要在于網(wǎng)絡(luò)未得到充分的訓(xùn)練,loss 在下降到一定程度后無法繼續(xù)收斂,網(wǎng)絡(luò)訓(xùn)練陷入了局部最優(yōu)。后續(xù)需要改變訓(xùn)練策略,進(jìn)行進(jìn)一步的訓(xùn)練,嘗試將網(wǎng)絡(luò)充分訓(xùn)練;或者對(duì)CSL算法進(jìn)行改進(jìn),嘗試尋找更優(yōu)的旋轉(zhuǎn)標(biāo)簽標(biāo)注法和損失函數(shù)算法。

4 結(jié)束語(yǔ)

本文構(gòu)建了著重于近岸目標(biāo)的訓(xùn)練和測(cè)試集,開展以原YOLOv5 網(wǎng)絡(luò)為基礎(chǔ)的近岸艦船目標(biāo)檢測(cè)網(wǎng)絡(luò)實(shí)驗(yàn)和加入注意力機(jī)制模塊的改進(jìn)實(shí)驗(yàn),并取得了較為理想的效果——在近岸測(cè)試集中,mAP達(dá)到了80%以上。證實(shí)了YOLOv5 網(wǎng)絡(luò)作為近岸艦船目標(biāo)檢測(cè)網(wǎng)絡(luò)有著較為良好的性能,注意力機(jī)制模塊在提升檢測(cè)網(wǎng)路準(zhǔn)確率方面也有著較好的效果。

針對(duì)近岸情況中艦船目標(biāo)密集導(dǎo)致漏檢的問題,開展旋轉(zhuǎn)檢測(cè)框?qū)嶒?yàn),并且能夠初步證明CSL+YOLOv5 實(shí)現(xiàn)旋轉(zhuǎn)框檢測(cè)的可行性,但未能達(dá)到預(yù)期中提升檢測(cè)性能的效果。分析原因后提出如下改進(jìn)方案:嘗試不同的學(xué)習(xí)率,梯度優(yōu)化算法;修改原有的評(píng)估方法,得到適合旋轉(zhuǎn)框目標(biāo)的評(píng)估方法,指導(dǎo)訓(xùn)練網(wǎng)絡(luò)的參數(shù)優(yōu)化環(huán)節(jié),從而實(shí)現(xiàn)網(wǎng)絡(luò)的充分訓(xùn)練?;蛘邔?duì)CSL 算法進(jìn)行改進(jìn),嘗試尋找更優(yōu)的旋轉(zhuǎn)標(biāo)簽標(biāo)注法和損失函數(shù)算法。

在總結(jié)錯(cuò)誤原因后,除了旋轉(zhuǎn)框檢測(cè)之外,提出如下解決方案:針對(duì)噪聲導(dǎo)致的干擾,增加圖像降噪的預(yù)處理環(huán)節(jié);針對(duì)靠近陸地導(dǎo)致的陸地背景的干擾以及陸地的干擾目標(biāo),增加海陸分割的預(yù)處理環(huán)節(jié)。除了以上針對(duì)性措施之外,還可以通過增加訓(xùn)練集、提高網(wǎng)絡(luò)的特征提取性能等方法,綜合提升網(wǎng)絡(luò)性能。

猜你喜歡
艦船注意力卷積
交互設(shè)計(jì)在艦船零部件智能制造中的應(yīng)用
基于時(shí)域全卷積網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)
基于艦船使命的功能分解方法
讓注意力“飛”回來
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
“揚(yáng)眼”APP:讓注意力“變現(xiàn)”
A Beautiful Way Of Looking At Things
艦船腐蝕預(yù)防與控制系統(tǒng)工程
一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法
台湾省| 徐水县| 定陶县| 昌乐县| 铁力市| 托克逊县| 营山县| 宁国市| 略阳县| 鹰潭市| 阿瓦提县| 资兴市| 敦煌市| 望奎县| 开化县| 勃利县| 乌拉特后旗| 新竹县| 肇州县| 东阳市| 集安市| 宁安市| 道真| 桦川县| 历史| 江孜县| 禹州市| 上犹县| 高尔夫| 电白县| 肃北| 安福县| 紫阳县| 铜鼓县| 临湘市| 靖边县| 襄垣县| 蚌埠市| 长治县| 虎林市| 靖江市|