基于自訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)的遙感場景圖像異常探測方法

2024-01-29 14:42張方澤龔循強(qiáng)周秀芳劉卓濤

地理信息世界 2023年4期

關(guān)鍵詞：類別標(biāo)簽準(zhǔn)確率

張方澤，龔循強(qiáng)，周秀芳，劉卓濤

1. 寧波市阿拉圖數(shù)字科技有限公司，寧波 315042；

2. 東華理工大學(xué) 測繪與空間信息工程學(xué)院，南昌 330013；

3. 東華理工大學(xué) 自然資源部環(huán)鄱陽湖區(qū)域礦山環(huán)境監(jiān)測與治理重點(diǎn)實(shí)驗(yàn)室，南昌 330013；

4. 東華理工大學(xué) 江西生態(tài)文明建設(shè)制度研究中心，南昌 330013

1 引言

場景分類作為一項(xiàng)重要的遙感圖像解譯技術(shù)，可自動提取并識別遙感場景中豐富的語義信息，已經(jīng)成為遙感圖像信息提取的重要手段之一，在自然資源調(diào)查、城市規(guī)劃、土地利用等領(lǐng)域得到了廣泛的應(yīng)用（Ma 等，2022；龔健雅和鐘燕飛，2016）。面對海量遙感數(shù)據(jù)中的大量無標(biāo)簽場景圖像，如何賦予其準(zhǔn)確的標(biāo)簽已成為研究熱點(diǎn)。目前對無標(biāo)簽的遙感場景圖像進(jìn)行標(biāo)注通常采用監(jiān)督分類、非監(jiān)督分類和半監(jiān)督分類方法（賈霄等，2021；吳列等，2022）。然而，無論采用何種方法對無標(biāo)簽的遙感場景圖像進(jìn)行分類，其賦予的標(biāo)簽均可能存在與實(shí)際類別不匹配的異常情況，這種分類后含有異常標(biāo)簽的數(shù)據(jù)稱為偽標(biāo)簽數(shù)據(jù)（龔循強(qiáng)等，2020；楊雨龍等，2021）。使用含有異常標(biāo)簽的遙感場景圖像進(jìn)行科學(xué)研究和實(shí)際應(yīng)用，將會對結(jié)果造成較大的影響，因此，對遙感場景圖像中的異常標(biāo)簽進(jìn)行探測極為重要。

在圖像分類和異常探測領(lǐng)域，相關(guān)學(xué)者進(jìn)行了大量的研究。史旭東和熊偉麗（2020）為了處理工業(yè)數(shù)據(jù)中的無標(biāo)簽數(shù)據(jù)，提出了一種基于改進(jìn)自訓(xùn)練算法的高斯過程回歸軟測量建模方法。Gu 等（2022）引入了一種新的交叉檢查策略，使其在自訓(xùn)練過程中交換偽標(biāo)簽信息，能夠最大限度地提高偽標(biāo)簽的準(zhǔn)確率。張曉男等（2018）提出了一種集成多個(gè)模型的遙感場景分類算法，通過構(gòu)建反向傳播網(wǎng)絡(luò)實(shí)現(xiàn)了場景圖像的復(fù)雜度度量，并對多個(gè)卷積神經(jīng)網(wǎng)絡(luò)（convolutional neural network，CNN）進(jìn)行訓(xùn)練，從而提高分類準(zhǔn)確率和預(yù)測速度。Baloch（2020）針對小型網(wǎng)絡(luò)提出了一個(gè)五層的CNN 模型，其參數(shù)遠(yuǎn)少于其他常用的網(wǎng)絡(luò)，但分類的準(zhǔn)確性仍能與常用的網(wǎng)絡(luò)接近。Shi 等（2021）提出了一種基于多尺度CNN 的遙感圖像融合算法，通過CNN對多光譜圖像的每個(gè)波段進(jìn)行多尺度圖像分析，以提取多光譜圖像中不同波段的典型特征。此外，張能歡和王永濱（2020）為了解決 ResNet-18 和ResNet-50 網(wǎng)絡(luò)固定感受野的不足，引入自適應(yīng)感受野的方法，同時(shí)加入注意力機(jī)制來進(jìn)一步提高場景圖像識別的精度。

CNN 因具有較好的識別能力在遙感場景圖像中被廣泛采用，但該優(yōu)勢是建立在大量標(biāo)注的訓(xùn)練樣本之上，而數(shù)據(jù)標(biāo)注需要耗費(fèi)大量的人力、物力和財(cái)力（陳學(xué)業(yè)等，2022）。目前，遙感場景的樣本標(biāo)注主要由人工通過自身經(jīng)驗(yàn)進(jìn)行判讀，由于遙感場景的復(fù)雜性，遙感場景數(shù)據(jù)集常常存在類別標(biāo)注不合理、場景中存在其他類別的地物等標(biāo)簽異常情況，從而影響CNN 模型的訓(xùn)練效果。探測遙感場景數(shù)據(jù)集中存在的上述標(biāo)簽異常情況有助于提高模型的分類精度。自訓(xùn)練算法經(jīng)常被運(yùn)用在半監(jiān)督學(xué)習(xí)中，其通過迭代運(yùn)算將獲得的結(jié)果加入訓(xùn)練集中以增強(qiáng)網(wǎng)絡(luò)模型的性能，可以較好地解決CNN在訓(xùn)練時(shí)樣本不足的問題（趙嬋娟等，2019）。因此，本文提出一種基于自訓(xùn)練CNN 的遙感場景圖像異常探測方法，通過少量真實(shí)標(biāo)簽訓(xùn)練CNN 中常用的GoogLeNet、ResNet 和DenseNet 模型，并結(jié)合自訓(xùn)練算法對遙感場景圖像中標(biāo)簽和實(shí)際類別不匹配的異常圖像進(jìn)行探測，將探測結(jié)果為正類和異類的標(biāo)簽分別加入真實(shí)標(biāo)簽與偽標(biāo)簽進(jìn)行下一輪探測，直到各項(xiàng)指標(biāo)變化穩(wěn)定后結(jié)束探測，以實(shí)現(xiàn)在少量訓(xùn)練樣本下的高精度遙感場景圖像異常探測。

2 研究方法

本文提出的自訓(xùn)練CNN 方法是在CNN 的基礎(chǔ)上結(jié)合自訓(xùn)練算法構(gòu)建的，因此，在介紹自訓(xùn)練CNN 方法之前，有必要對常用的三種CNN 進(jìn)行介紹。

2.1 卷積神經(jīng)網(wǎng)絡(luò)

CNN 是一種前饋神經(jīng)網(wǎng)絡(luò)，其中包含卷積運(yùn)算且具有一定的深度結(jié)構(gòu)，本文將基于GoogLeNet、ResNet、DenseNet 這三種CNN 網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)驗(yàn)證。其中，GoogLeNet 網(wǎng)絡(luò)結(jié)構(gòu)中包含3 個(gè)卷積層（conv）、5 個(gè)池化層（pool）、2 個(gè)批規(guī)范化層（batch normal，BN）、9 個(gè)Inception 模塊和1 個(gè)全連接層（FC），最后通過softmax 函數(shù)進(jìn)行類別輸出（Jamali等，2021）。具體結(jié)構(gòu)如圖1 所示。本文主要對數(shù)據(jù)集中含有的異常標(biāo)簽進(jìn)行探測，因此，在softmax 之后增加一個(gè)判斷結(jié)構(gòu)，將輸入的標(biāo)簽與網(wǎng)絡(luò)輸出的標(biāo)簽進(jìn)行匹配，若匹配結(jié)果一致，認(rèn)為該圖像的標(biāo)簽是正確的；否則認(rèn)為該圖像的標(biāo)簽是異常標(biāo)簽。

圖1 GoogLeNet 結(jié)構(gòu)Fig.1 GoogLeNet structure diagram

ResNet 網(wǎng)絡(luò)結(jié)構(gòu)采用ResNet-50，其中，包含了1 個(gè)卷積層、2 個(gè)池化層、16 個(gè)殘差卷積層（Residual block）和1 個(gè)全連接層。殘差塊一共分為四部分，每部分的數(shù)量分別為3、4、6 和3（Balnarsaiah等，2021；龔國棟等，2022）。具體ResNet網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。同樣，在softmax 函數(shù)之后增加一個(gè)判斷結(jié)構(gòu)，將預(yù)先輸入的標(biāo)簽與網(wǎng)絡(luò)輸出的標(biāo)簽進(jìn)行匹配，判斷測試圖像的標(biāo)簽是否準(zhǔn)確。

圖2 ResNet 結(jié)構(gòu)Fig.2 ResNet structure diagram

DenseNet 網(wǎng)絡(luò)結(jié)構(gòu)采用DenseNet-121，其中包含了1 個(gè)卷積層、2 個(gè)池化層、4 個(gè)稠密連接模塊（Dense block）、3 個(gè)傳輸層（Transition Layer）和1個(gè)全連接層。4 個(gè)稠密連接模塊中含有的卷積層個(gè)數(shù)分別為6、12、24、16（Tao 等，2018；林超，2022）。具體DenseNet 網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。與GoogLeNet 和ReseNet 相同，在輸出模塊中增加判斷結(jié)構(gòu)用以測試圖像的標(biāo)簽是否準(zhǔn)確。

圖3 DenseNet 結(jié)構(gòu)Fig.3 DenseNet structure diagram

2.2 自訓(xùn)練CNN 方法

隨著現(xiàn)代科學(xué)技術(shù)的飛速發(fā)展，如今快速高效地獲取大量數(shù)據(jù)已成為可能，但獲得的大多數(shù)是無標(biāo)簽數(shù)據(jù)，而獲取有標(biāo)簽數(shù)據(jù)的成本依然較高。如果只使用少量的有標(biāo)簽數(shù)據(jù)進(jìn)行學(xué)習(xí)與使用，那么不僅會限制分類器的泛化能力，還會因忽略大量無標(biāo)簽數(shù)據(jù)中的有用信息而造成資源的浪費(fèi)（Ge 等，2021；呂佳和李婷婷，2021）。自訓(xùn)練算法不需要大量的標(biāo)簽數(shù)據(jù)作為先驗(yàn)知識，只需要少量的標(biāo)簽數(shù)據(jù)進(jìn)行迭代運(yùn)算就可不斷地?cái)U(kuò)充訓(xùn)練數(shù)據(jù)，因此在半監(jiān)督學(xué)習(xí)中被廣泛采用（程康明和熊偉麗，2020；Li 等，2021；Pedronette 和Latecki，2021）。

在遙感場景圖像中，每張圖像都具有一定的復(fù)雜性，其亮度值為0~255。如果只是簡單地將圖像轉(zhuǎn)化為數(shù)值進(jìn)行異常探測，那么將無法獲得準(zhǔn)確的探測結(jié)果。CNN 通過訓(xùn)練可以有效地識別出每個(gè)場景類別對應(yīng)的特征，因此，在圖像分類、目標(biāo)識別、遷移學(xué)習(xí)中被廣泛采用。雖然CNN 能夠較好地識別不同類別的復(fù)雜圖像，但其性能會受到初始訓(xùn)練樣本數(shù)量的影響，當(dāng)初始訓(xùn)練樣本較少時(shí)，其識別性能會大大降低，而自訓(xùn)練算法可以通過迭代運(yùn)算不斷地?cái)U(kuò)充訓(xùn)練集，以解決CNN 在訓(xùn)練樣本不足時(shí)性能較低的問題。為了探測出遙感場景圖像中標(biāo)簽和實(shí)際類別不匹配的情況，本文充分利用自訓(xùn)練算法和CNN 的優(yōu)勢，提出自訓(xùn)練CNN 方法。

自訓(xùn)練CNN 方法通過少量真實(shí)標(biāo)簽對CNN 進(jìn)行初始訓(xùn)練，然后對含異常標(biāo)簽的偽標(biāo)簽數(shù)據(jù)集進(jìn)行異常探測，將探測結(jié)果為正類的標(biāo)簽加入真實(shí)標(biāo)簽中，探測結(jié)果為異類的數(shù)據(jù)仍保留在偽標(biāo)簽中進(jìn)行下一輪探測；重復(fù)運(yùn)算直至各項(xiàng)指標(biāo)穩(wěn)定后輸出異常探測的結(jié)果。具體的步驟如下：

（1）提取少量準(zhǔn)確標(biāo)簽數(shù)據(jù)作為真實(shí)標(biāo)簽，并將剩余的數(shù)據(jù)作為偽標(biāo)簽數(shù)據(jù)；

（2）將真實(shí)標(biāo)簽數(shù)據(jù)作為訓(xùn)練集訓(xùn)練三種CNN模型，即GoogLeNet、ResNet 和DenseNet，利用訓(xùn)練結(jié)果對偽標(biāo)簽數(shù)據(jù)進(jìn)行異常探測；

（3）對探測結(jié)果進(jìn)行精度評定，根據(jù)各項(xiàng)評價(jià)指標(biāo)確定是否結(jié)束迭代，如果是則輸出結(jié)果，否則進(jìn)行步驟（4）；

（4）將探測結(jié)果為正類的數(shù)據(jù)加入真實(shí)標(biāo)簽中，探測結(jié)果為異類的數(shù)據(jù)作為偽標(biāo)簽，重復(fù)步驟（2）、（3），具體計(jì)算流程如圖4 所示。

圖4 自訓(xùn)練CNN 技術(shù)流程Fig.4 Flowchart of self-training CNN

3 實(shí)驗(yàn)設(shè)計(jì)

3.1 實(shí)驗(yàn)數(shù)據(jù)集和圖像預(yù)處理

本文采用SIRI-WHU 數(shù)據(jù)集、RSSCN7 數(shù)據(jù)集。SIRI-WHU 數(shù)據(jù)集由武漢大學(xué)在2016 年發(fā)布，數(shù)據(jù)資源來自Google Earth，其中包含12 個(gè)場景類別，分別是農(nóng)田、商業(yè)區(qū)、港口、裸地、工業(yè)區(qū)、草地、立交橋、公園、池塘、住宅區(qū)、河流和湖泊。每類均有200 張圖像，大小為200 像素×200 像素，空間分辨率為2 m（Zhao 等，2016；龔希等，2021）。每個(gè)場景圖像示例如圖5 所示。

RSSCN7 數(shù)據(jù)集，2015 年由武漢大學(xué)發(fā)布，其采集于不同的季節(jié)和天氣環(huán)境下，保證了同一類別圖像的豐富性（Zou 等，2015）。該數(shù)據(jù)集一共包含7 個(gè)場景類別，分別是草地、農(nóng)田、工業(yè)區(qū)、河湖、森林、住宅區(qū)和停車場，其中，每個(gè)類別包含400張圖像，大小為400 像素×400 像素，場景圖像示例如圖6 所示。

對含有異常標(biāo)簽的遙感場景圖像數(shù)據(jù)進(jìn)行異常探測時(shí)，本方法需要通過先驗(yàn)知識獲取一定數(shù)量的正常標(biāo)簽作為初始訓(xùn)練樣本，再不斷進(jìn)行迭代運(yùn)算以加強(qiáng)網(wǎng)絡(luò)模型的性能，從而提高對異常標(biāo)簽的探測能力。綜合考慮運(yùn)算效率和人工成本，本文選取10%的準(zhǔn)確標(biāo)簽作為真實(shí)標(biāo)簽，再對剩余90%圖像的標(biāo)簽進(jìn)行修改，使得每類圖像含有占比為5%~30%的異常標(biāo)簽作為偽標(biāo)簽并保持總數(shù)不變。每類場景含不同異常比例的標(biāo)簽數(shù)量如表1 所示，通過10%的真實(shí)標(biāo)簽及自訓(xùn)練CNN 對偽標(biāo)簽進(jìn)行探測。本文采用的數(shù)據(jù)集在讀取之后還需要進(jìn)行圖像預(yù)處理，對其依次進(jìn)行圖像裁剪并縮放至224 像素×224 像素、圖像翻轉(zhuǎn)、張量轉(zhuǎn)換和圖像歸一化處理。

表1 每類場景含不同異常比例的標(biāo)簽數(shù)量表Tab.1 Number of labels with different abnormal proportions in each type of scene

3.2 實(shí)驗(yàn)參數(shù)及環(huán)境

通過前期的測試，本文實(shí)驗(yàn)參數(shù)中的epoch 為200，由于CNN 訓(xùn)練時(shí)在前期可設(shè)置較大學(xué)習(xí)率以加快收斂速度，后期設(shè)置較小學(xué)習(xí)率使得損失函數(shù)收斂在最優(yōu)值附近，即loss 穩(wěn)定時(shí)其值盡可能的小，因此，學(xué)習(xí)率分為兩部分：在第1~100 的epoch 中學(xué)習(xí)率設(shè)置為0.01；第101~200 的epoch 中學(xué)習(xí)率設(shè)置為0.001。批次大小設(shè)置為32，損失函數(shù)選取交叉熵誤差，優(yōu)化方法為隨機(jī)梯度下降（stochastic gradient descent，SGD）法，動量設(shè)置為0.9。

實(shí)驗(yàn)環(huán)境采用Windows 10 操作系統(tǒng)，處理器為八核十六線程的Inte（lR） Core（TM） i7-11700K 3.6 GHz，內(nèi)存為16GB（8GB×2）3200 MHz 的雙通道內(nèi)存條，顯卡為華碩NVIDIA GeForce RTX 3060 12 GB，CUDA 為11.0，深度學(xué)習(xí)框架為Pytorch，編程語言為Python 3.6。

3.3 評價(jià)指標(biāo)

對遙感場景圖像異常探測效果采用四個(gè)評價(jià)指標(biāo)，分別是準(zhǔn)確率、精確率、召回率和F1 分?jǐn)?shù)。準(zhǔn)確率是探測正確的占所有探測的比例，即把正類探測為正類與異類探測為異類的和除以總類數(shù)。精確率是探測結(jié)果中實(shí)際為正類的占探測為正類的比例。召回率是探測為正類的占實(shí)際全部正類的比例。精確率和召回率是相互矛盾的，因此，可以同時(shí)考慮精確率和召回率，選擇它們之間的一個(gè)平衡點(diǎn)，即F1 分?jǐn)?shù)。準(zhǔn)確率（A）、精確率（P）、召回率（R）和F1 分?jǐn)?shù)（F1）的計(jì)算如下：

式中，TP、FN、FP 和TN 分別為正類探測為正類、正類探測為異類、異類探測為正類和異類探測為異類的數(shù)量。

4 實(shí)驗(yàn)結(jié)果與分析

探測次數(shù)和異常占比直接影響異常探測的效果，因此，有必要分別討論探測次數(shù)和異常占比對異常探測結(jié)果的影響。

4.1 探測次數(shù)對結(jié)果的影響

探測次數(shù)的選擇關(guān)乎異常探測的效果，前期由于初始真實(shí)標(biāo)簽僅占數(shù)據(jù)集的10%，探測效果通常不夠理想，而隨著迭代次數(shù)的增加，網(wǎng)絡(luò)性能的不斷增強(qiáng)，探測效果越來越好，但所需要的時(shí)間也在不斷增加，因此，有必要選擇一個(gè)合適的節(jié)點(diǎn)結(jié)束循環(huán)。三種自訓(xùn)練CNN 在含不同異常標(biāo)簽比例的兩種數(shù)據(jù)集探測中變化規(guī)律基本保持一致，因此，選取異常標(biāo)簽占15%的結(jié)果進(jìn)行展示，所得結(jié)果如圖7 所示。

圖7 自訓(xùn)練CNN 在不同探測次數(shù)中的結(jié)果Fig.7 Results of self-training CNN in different detection times

由圖7 可以看出，初次探測時(shí)的準(zhǔn)確率、召回率和F1 分?jǐn)?shù)都較低，分別為69.9%~81.0%、64.9%~78.0%、77.7%~87.1%。隨著探測次數(shù)的增加，三項(xiàng)指標(biāo)均在不斷提高，當(dāng)探測次數(shù)為6 次時(shí)，各項(xiàng)指標(biāo)已經(jīng)趨于穩(wěn)定，且均能夠達(dá)到94.0%以上。三種自訓(xùn)練 CNN 的精確率在初次探測時(shí)均在99.0%以上，其中，自訓(xùn)練GoogLeNet 的精確率更是達(dá)到了100%，證明加入真實(shí)標(biāo)簽的正類圖像中幾乎不含錯(cuò)誤標(biāo)簽，但是隨著探測次數(shù)的增加精確率會在99.0%~100%波動。這是因?yàn)樵谔綔y時(shí)可能會有少數(shù)含異常標(biāo)簽的圖像被當(dāng)作正類圖像加入到真實(shí)標(biāo)簽中，導(dǎo)致精確率不斷下降。綜合考慮準(zhǔn)確率、精確率、召回率和F1 分?jǐn)?shù)四項(xiàng)評價(jià)指標(biāo)可以看出，當(dāng)探測次數(shù)為6 時(shí)已經(jīng)趨于穩(wěn)定。因此，后續(xù)異常探測實(shí)驗(yàn)的探測次數(shù)均為6 次，即將第6次的異常探測結(jié)果作為最終結(jié)果。

4.2 異常占比對結(jié)果的影響

三種自訓(xùn)練CNN 在不同異常標(biāo)簽占比時(shí)的準(zhǔn)確率、精確率、召回率和F1 分?jǐn)?shù)，如圖8 所示。在含有5%~30%的6 種異常標(biāo)簽占比的SIRI-WHU數(shù)據(jù)集中，自訓(xùn)練GoogLeNet 的準(zhǔn)確率分別為96.944%、96.944%、96.435%、96.111%、96.435%和95.509%，均在95.5%以上。在含有5%~30%的6種異常標(biāo)簽占比的RSSCN7 數(shù)據(jù)集中，自訓(xùn)練GoogLeNet 的準(zhǔn)確率分別為96.865、96.429%、96.984%、95.714%、96.151%、96.270%，均在95.7%以上，通過比較可以發(fā)現(xiàn)兩種數(shù)據(jù)集的異常探測準(zhǔn)確率較為接近。自訓(xùn)練ResNet 在6 種異常標(biāo)簽占比的SIRI-WHU 數(shù)據(jù)集、RSSCN7 數(shù)據(jù)集中準(zhǔn)確率分別為95.370%、95.046%、95.926%、95.833%、96.157%、94.861%和95.595%、95.794%、96.270%、95.238%、95.437%、95.476%；其中，SIRI-WHU數(shù)據(jù)集在異常占比為25%時(shí)準(zhǔn)確率最高、占比為30%時(shí)最低，RSSCN7 數(shù)據(jù)集在異常占比為15%時(shí)準(zhǔn)確率最高、占比為20%時(shí)最低。自訓(xùn)練DenseNet在6 種異常標(biāo)簽占比的SIRI-WHU 數(shù)據(jù)集、RSSCN7數(shù)據(jù)集中準(zhǔn)確率分別為 95.046%、95.648%、94.444%、95.741%、95.185%、95.278%和95.952%、95.952%、95.794%、95.952%、95.595%、95.278%。通過以上數(shù)據(jù)可以看出，自訓(xùn)練GoogLeNet 的準(zhǔn)確率在不同異常標(biāo)簽占比時(shí)均高于另外兩種自訓(xùn)練CNN；在SIRI-WHU 數(shù)據(jù)集中自訓(xùn)練GoogLeNet的準(zhǔn)確率隨異常標(biāo)簽占比的增加呈降低的趨勢，而在RSSCN 數(shù)據(jù)集中自訓(xùn)練GoogLeNet 的準(zhǔn)確率隨異常標(biāo)簽占比的增加上下波動，整體相對穩(wěn)定。精確率是探測為正類的結(jié)果中實(shí)際為正類的比例，在實(shí)際探測過程中，由于網(wǎng)絡(luò)性能的限制，每次探測時(shí)都會有少量的異常標(biāo)簽被錯(cuò)誤地判斷為正類加入到真實(shí)標(biāo)簽中，因此，自訓(xùn)練CNN 的精確率在第一次能夠取得較高的結(jié)果，隨著探測次數(shù)的增加，其結(jié)果也在逐漸降低。原因是當(dāng)數(shù)據(jù)集中異常標(biāo)簽占比越高，異常標(biāo)簽被錯(cuò)誤判斷的情況就越多，其值就相對較低。

圖8 自訓(xùn)練CNN 在不同異常占比中的結(jié)果（%）Fig. 8 Results of self-training CNN in different anomaly proportions (%)

三種自訓(xùn)練CNN 在不同異常標(biāo)簽占比時(shí)的召回率變化趨勢和準(zhǔn)確率相似，其中，自訓(xùn)練GoogLeNet 的結(jié)果最好。自訓(xùn)練GoogLeNet 在不同異常標(biāo)簽占比的SIRI-WHU 數(shù)據(jù)集、RSSCN7 數(shù)據(jù)集中F1 分?jǐn)?shù)分別為98.335%、98.239%、97.794%、97.444%、97.551%、96.603%和98.310%、97.962%、98.191%、97.248%、97.385%、97.289%，其中，含5%異常占比的F1 分?jǐn)?shù)均達(dá)到最高。自訓(xùn)練ResNet異常探測的F1 分?jǐn)?shù)結(jié)果相對于準(zhǔn)確率同樣有所提升，整體上升呈現(xiàn)先快后慢的趨勢，其值分別為97.467%、97.116%、97.531%、97.297%、97.373%、96.192%和97.625%、97.603%、97.755%、96.958%、96.908%、96.724%，其中，含15%異常占比的F1分?jǐn)?shù)均達(dá)到最高。自訓(xùn)練DenseNet 在6 種異常標(biāo)簽占比的F1 分?jǐn)?shù)分別為97.266%、97.488%、96.564%、97.215%、96.621%、96.430%和97.803%、97.696%、97.459%、97.396%、96.981%、96.562%；在SIRI-WHU 數(shù)據(jù)集中含10%異常占比的F1 分?jǐn)?shù)最高，含30%異常占比的F1 分?jǐn)?shù)最低；在RSSCN7數(shù)據(jù)集中含5%異常占比的F1 分?jǐn)?shù)最高，含30%異常占比的 F1 分?jǐn)?shù)最低。綜上所述，自訓(xùn)練GoogLeNet 的整體效果要優(yōu)于其他兩種方法。

5 結(jié) 論

為了有效地對遙感場景圖像中標(biāo)簽與實(shí)際類別不匹配的異常圖像進(jìn)行探測，本文提出一種基于自訓(xùn)練CNN 的遙感場景圖像異常探測方法。采用SIRI-WHU 和RSSCN7 遙感場景數(shù)據(jù)集，首先，選取準(zhǔn)確的10%標(biāo)簽樣本作為真實(shí)標(biāo)簽，從而為CNN提供初始模型；其次，使用自訓(xùn)練算法增強(qiáng)網(wǎng)絡(luò)性能，不斷地對含有不同異常標(biāo)簽占比的遙感場景數(shù)據(jù)集進(jìn)行異常探測；再次，將探測為正類的加入真實(shí)標(biāo)簽中，探測為異類的返回至偽標(biāo)簽中；最后，通過不斷運(yùn)算，直至各項(xiàng)指標(biāo)穩(wěn)定后，將剩下的偽標(biāo)簽數(shù)認(rèn)定為異常圖像。結(jié)果表明，三種自訓(xùn)練CNN 在含有不同異常標(biāo)簽的SIRI-WHU 數(shù)據(jù)集、RSSCN7 數(shù)據(jù)集中，各項(xiàng)指標(biāo)均能夠取得較好的效果。即使僅選取10%的初始訓(xùn)練樣本，含有高達(dá)30%的異常標(biāo)簽這一苛刻條件下，其準(zhǔn)確率、召回率和F1 分?jǐn)?shù)均依然在93.8%以上，精確率能夠保持到97.8%以上。在不同自訓(xùn)練CNN 的異常探測中，自訓(xùn)練GoogLeNet 的總體表現(xiàn)最好，優(yōu)于自訓(xùn)練ResNet 和自訓(xùn)練DenseNet。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡