張方澤,龔循強(qiáng),周秀芳,劉卓濤
1. 寧波市阿拉圖數(shù)字科技有限公司,寧波 315042;
2. 東華理工大學(xué) 測繪與空間信息工程學(xué)院,南昌 330013;
3. 東華理工大學(xué) 自然資源部環(huán)鄱陽湖區(qū)域礦山環(huán)境監(jiān)測與治理重點(diǎn)實(shí)驗(yàn)室,南昌 330013;
4. 東華理工大學(xué) 江西生態(tài)文明建設(shè)制度研究中心,南昌 330013
場景分類作為一項(xiàng)重要的遙感圖像解譯技術(shù),可自動提取并識別遙感場景中豐富的語義信息,已經(jīng)成為遙感圖像信息提取的重要手段之一,在自然資源調(diào)查、城市規(guī)劃、土地利用等領(lǐng)域得到了廣泛的應(yīng)用(Ma 等,2022;龔健雅和鐘燕飛,2016)。面對海量遙感數(shù)據(jù)中的大量無標(biāo)簽場景圖像,如何賦予其準(zhǔn)確的標(biāo)簽已成為研究熱點(diǎn)。目前對無標(biāo)簽的遙感場景圖像進(jìn)行標(biāo)注通常采用監(jiān)督分類、非監(jiān)督分類和半監(jiān)督分類方法(賈霄等,2021;吳列等,2022)。然而,無論采用何種方法對無標(biāo)簽的遙感場景圖像進(jìn)行分類,其賦予的標(biāo)簽均可能存在與實(shí)際類別不匹配的異常情況,這種分類后含有異常標(biāo)簽的數(shù)據(jù)稱為偽標(biāo)簽數(shù)據(jù)(龔循強(qiáng)等,2020;楊雨龍等,2021)。使用含有異常標(biāo)簽的遙感場景圖像進(jìn)行科學(xué)研究和實(shí)際應(yīng)用,將會對結(jié)果造成較大的影響,因此,對遙感場景圖像中的異常標(biāo)簽進(jìn)行探測極為重要。
在圖像分類和異常探測領(lǐng)域,相關(guān)學(xué)者進(jìn)行了大量的研究。史旭東和熊偉麗(2020)為了處理工業(yè)數(shù)據(jù)中的無標(biāo)簽數(shù)據(jù),提出了一種基于改進(jìn)自訓(xùn)練算法的高斯過程回歸軟測量建模方法。Gu 等(2022)引入了一種新的交叉檢查策略,使其在自訓(xùn)練過程中交換偽標(biāo)簽信息,能夠最大限度地提高偽標(biāo)簽的準(zhǔn)確率。張曉男等(2018)提出了一種集成多個(gè)模型的遙感場景分類算法,通過構(gòu)建反向傳播網(wǎng)絡(luò)實(shí)現(xiàn)了場景圖像的復(fù)雜度度量,并對多個(gè)卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)進(jìn)行訓(xùn)練,從而提高分類準(zhǔn)確率和預(yù)測速度。Baloch(2020)針對小型網(wǎng)絡(luò)提出了一個(gè)五層的CNN 模型,其參數(shù)遠(yuǎn)少于其他常用的網(wǎng)絡(luò),但分類的準(zhǔn)確性仍能與常用的網(wǎng)絡(luò)接近。Shi 等(2021)提出了一種基于多尺度CNN 的遙感圖像融合算法,通過CNN對多光譜圖像的每個(gè)波段進(jìn)行多尺度圖像分析,以提取多光譜圖像中不同波段的典型特征。此外,張能歡和王永濱(2020)為了解決 ResNet-18 和ResNet-50 網(wǎng)絡(luò)固定感受野的不足,引入自適應(yīng)感受野的方法,同時(shí)加入注意力機(jī)制來進(jìn)一步提高場景圖像識別的精度。
CNN 因具有較好的識別能力在遙感場景圖像中被廣泛采用,但該優(yōu)勢是建立在大量標(biāo)注的訓(xùn)練樣本之上,而數(shù)據(jù)標(biāo)注需要耗費(fèi)大量的人力、物力和財(cái)力(陳學(xué)業(yè)等,2022)。目前,遙感場景的樣本標(biāo)注主要由人工通過自身經(jīng)驗(yàn)進(jìn)行判讀,由于遙感場景的復(fù)雜性,遙感場景數(shù)據(jù)集常常存在類別標(biāo)注不合理、場景中存在其他類別的地物等標(biāo)簽異常情況,從而影響CNN 模型的訓(xùn)練效果。探測遙感場景數(shù)據(jù)集中存在的上述標(biāo)簽異常情況有助于提高模型的分類精度。自訓(xùn)練算法經(jīng)常被運(yùn)用在半監(jiān)督學(xué)習(xí)中,其通過迭代運(yùn)算將獲得的結(jié)果加入訓(xùn)練集中以增強(qiáng)網(wǎng)絡(luò)模型的性能,可以較好地解決CNN在訓(xùn)練時(shí)樣本不足的問題(趙嬋娟等,2019)。因此,本文提出一種基于自訓(xùn)練CNN 的遙感場景圖像異常探測方法,通過少量真實(shí)標(biāo)簽訓(xùn)練CNN 中常用的GoogLeNet、ResNet 和DenseNet 模型,并結(jié)合自訓(xùn)練算法對遙感場景圖像中標(biāo)簽和實(shí)際類別不匹配的異常圖像進(jìn)行探測,將探測結(jié)果為正類和異類的標(biāo)簽分別加入真實(shí)標(biāo)簽與偽標(biāo)簽進(jìn)行下一輪探測,直到各項(xiàng)指標(biāo)變化穩(wěn)定后結(jié)束探測,以實(shí)現(xiàn)在少量訓(xùn)練樣本下的高精度遙感場景圖像異常探測。
本文提出的自訓(xùn)練CNN 方法是在CNN 的基礎(chǔ)上結(jié)合自訓(xùn)練算法構(gòu)建的,因此,在介紹自訓(xùn)練CNN 方法之前,有必要對常用的三種CNN 進(jìn)行介紹。
CNN 是一種前饋神經(jīng)網(wǎng)絡(luò),其中包含卷積運(yùn)算且具有一定的深度結(jié)構(gòu),本文將基于GoogLeNet、ResNet、DenseNet 這三種CNN 網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)驗(yàn)證。其中,GoogLeNet 網(wǎng)絡(luò)結(jié)構(gòu)中包含3 個(gè)卷積層(conv)、5 個(gè)池化層(pool)、2 個(gè)批規(guī)范化層(batch normal,BN)、9 個(gè)Inception 模塊和1 個(gè)全連接層(FC),最后通過softmax 函數(shù)進(jìn)行類別輸出(Jamali等,2021)。具體結(jié)構(gòu)如圖1 所示。本文主要對數(shù)據(jù)集中含有的異常標(biāo)簽進(jìn)行探測,因此,在softmax 之后增加一個(gè)判斷結(jié)構(gòu),將輸入的標(biāo)簽與網(wǎng)絡(luò)輸出的標(biāo)簽進(jìn)行匹配,若匹配結(jié)果一致,認(rèn)為該圖像的標(biāo)簽是正確的;否則認(rèn)為該圖像的標(biāo)簽是異常標(biāo)簽。
圖1 GoogLeNet 結(jié)構(gòu)Fig.1 GoogLeNet structure diagram
ResNet 網(wǎng)絡(luò)結(jié)構(gòu)采用ResNet-50,其中,包含了1 個(gè)卷積層、2 個(gè)池化層、16 個(gè)殘差卷積層(Residual block)和1 個(gè)全連接層。殘差塊一共分為四部分,每部分的數(shù)量分別為3、4、6 和3(Balnarsaiah等,2021;龔國棟等,2022)。具體ResNet網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。同樣,在softmax 函數(shù)之后增加一個(gè)判斷結(jié)構(gòu),將預(yù)先輸入的標(biāo)簽與網(wǎng)絡(luò)輸出的標(biāo)簽進(jìn)行匹配,判斷測試圖像的標(biāo)簽是否準(zhǔn)確。
圖2 ResNet 結(jié)構(gòu)Fig.2 ResNet structure diagram
DenseNet 網(wǎng)絡(luò)結(jié)構(gòu)采用DenseNet-121,其中包含了1 個(gè)卷積層、2 個(gè)池化層、4 個(gè)稠密連接模塊(Dense block)、3 個(gè)傳輸層(Transition Layer)和1個(gè)全連接層。4 個(gè)稠密連接模塊中含有的卷積層個(gè)數(shù)分別為6、12、24、16(Tao 等,2018;林超,2022)。具體DenseNet 網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。與GoogLeNet 和ReseNet 相同,在輸出模塊中增加判斷結(jié)構(gòu)用以測試圖像的標(biāo)簽是否準(zhǔn)確。
圖3 DenseNet 結(jié)構(gòu)Fig.3 DenseNet structure diagram
隨著現(xiàn)代科學(xué)技術(shù)的飛速發(fā)展,如今快速高效地獲取大量數(shù)據(jù)已成為可能,但獲得的大多數(shù)是無標(biāo)簽數(shù)據(jù),而獲取有標(biāo)簽數(shù)據(jù)的成本依然較高。如果只使用少量的有標(biāo)簽數(shù)據(jù)進(jìn)行學(xué)習(xí)與使用,那么不僅會限制分類器的泛化能力,還會因忽略大量無標(biāo)簽數(shù)據(jù)中的有用信息而造成資源的浪費(fèi)(Ge 等,2021;呂佳和李婷婷,2021)。自訓(xùn)練算法不需要大量的標(biāo)簽數(shù)據(jù)作為先驗(yàn)知識,只需要少量的標(biāo)簽數(shù)據(jù)進(jìn)行迭代運(yùn)算就可不斷地?cái)U(kuò)充訓(xùn)練數(shù)據(jù),因此在半監(jiān)督學(xué)習(xí)中被廣泛采用(程康明和熊偉麗,2020;Li 等,2021;Pedronette 和Latecki,2021)。
在遙感場景圖像中,每張圖像都具有一定的復(fù)雜性,其亮度值為0~255。如果只是簡單地將圖像轉(zhuǎn)化為數(shù)值進(jìn)行異常探測,那么將無法獲得準(zhǔn)確的探測結(jié)果。CNN 通過訓(xùn)練可以有效地識別出每個(gè)場景類別對應(yīng)的特征,因此,在圖像分類、目標(biāo)識別、遷移學(xué)習(xí)中被廣泛采用。雖然CNN 能夠較好地識別不同類別的復(fù)雜圖像,但其性能會受到初始訓(xùn)練樣本數(shù)量的影響,當(dāng)初始訓(xùn)練樣本較少時(shí),其識別性能會大大降低,而自訓(xùn)練算法可以通過迭代運(yùn)算不斷地?cái)U(kuò)充訓(xùn)練集,以解決CNN 在訓(xùn)練樣本不足時(shí)性能較低的問題。為了探測出遙感場景圖像中標(biāo)簽和實(shí)際類別不匹配的情況,本文充分利用自訓(xùn)練算法和CNN 的優(yōu)勢,提出自訓(xùn)練CNN 方法。
自訓(xùn)練CNN 方法通過少量真實(shí)標(biāo)簽對CNN 進(jìn)行初始訓(xùn)練,然后對含異常標(biāo)簽的偽標(biāo)簽數(shù)據(jù)集進(jìn)行異常探測,將探測結(jié)果為正類的標(biāo)簽加入真實(shí)標(biāo)簽中,探測結(jié)果為異類的數(shù)據(jù)仍保留在偽標(biāo)簽中進(jìn)行下一輪探測;重復(fù)運(yùn)算直至各項(xiàng)指標(biāo)穩(wěn)定后輸出異常探測的結(jié)果。具體的步驟如下:
(1)提取少量準(zhǔn)確標(biāo)簽數(shù)據(jù)作為真實(shí)標(biāo)簽,并將剩余的數(shù)據(jù)作為偽標(biāo)簽數(shù)據(jù);
(2)將真實(shí)標(biāo)簽數(shù)據(jù)作為訓(xùn)練集訓(xùn)練三種CNN模型,即GoogLeNet、ResNet 和DenseNet,利用訓(xùn)練結(jié)果對偽標(biāo)簽數(shù)據(jù)進(jìn)行異常探測;
(3)對探測結(jié)果進(jìn)行精度評定,根據(jù)各項(xiàng)評價(jià)指標(biāo)確定是否結(jié)束迭代,如果是則輸出結(jié)果,否則進(jìn)行步驟(4);
(4)將探測結(jié)果為正類的數(shù)據(jù)加入真實(shí)標(biāo)簽中,探測結(jié)果為異類的數(shù)據(jù)作為偽標(biāo)簽,重復(fù)步驟(2)、(3),具體計(jì)算流程如圖4 所示。
圖4 自訓(xùn)練CNN 技術(shù)流程Fig.4 Flowchart of self-training CNN
本文采用SIRI-WHU 數(shù)據(jù)集、RSSCN7 數(shù)據(jù)集。SIRI-WHU 數(shù)據(jù)集由武漢大學(xué)在2016 年發(fā)布,數(shù)據(jù)資源來自Google Earth,其中包含12 個(gè)場景類別,分別是農(nóng)田、商業(yè)區(qū)、港口、裸地、工業(yè)區(qū)、草地、立交橋、公園、池塘、住宅區(qū)、河流和湖泊。每類均有200 張圖像,大小為200 像素×200 像素,空間分辨率為2 m(Zhao 等,2016;龔希等,2021)。每個(gè)場景圖像示例如圖5 所示。
RSSCN7 數(shù)據(jù)集,2015 年由武漢大學(xué)發(fā)布,其采集于不同的季節(jié)和天氣環(huán)境下,保證了同一類別圖像的豐富性(Zou 等,2015)。該數(shù)據(jù)集一共包含7 個(gè)場景類別,分別是草地、農(nóng)田、工業(yè)區(qū)、河湖、森林、住宅區(qū)和停車場,其中,每個(gè)類別包含400張圖像,大小為400 像素×400 像素,場景圖像示例如圖6 所示。
對含有異常標(biāo)簽的遙感場景圖像數(shù)據(jù)進(jìn)行異常探測時(shí),本方法需要通過先驗(yàn)知識獲取一定數(shù)量的正常標(biāo)簽作為初始訓(xùn)練樣本,再不斷進(jìn)行迭代運(yùn)算以加強(qiáng)網(wǎng)絡(luò)模型的性能,從而提高對異常標(biāo)簽的探測能力。綜合考慮運(yùn)算效率和人工成本,本文選取10%的準(zhǔn)確標(biāo)簽作為真實(shí)標(biāo)簽,再對剩余90%圖像的標(biāo)簽進(jìn)行修改,使得每類圖像含有占比為5%~30%的異常標(biāo)簽作為偽標(biāo)簽并保持總數(shù)不變。每類場景含不同異常比例的標(biāo)簽數(shù)量如表1 所示,通過10%的真實(shí)標(biāo)簽及自訓(xùn)練CNN 對偽標(biāo)簽進(jìn)行探測。本文采用的數(shù)據(jù)集在讀取之后還需要進(jìn)行圖像預(yù)處理,對其依次進(jìn)行圖像裁剪并縮放至224 像素×224 像素、圖像翻轉(zhuǎn)、張量轉(zhuǎn)換和圖像歸一化處理。
表1 每類場景含不同異常比例的標(biāo)簽數(shù)量表Tab.1 Number of labels with different abnormal proportions in each type of scene
通過前期的測試,本文實(shí)驗(yàn)參數(shù)中的epoch 為200,由于CNN 訓(xùn)練時(shí)在前期可設(shè)置較大學(xué)習(xí)率以加快收斂速度,后期設(shè)置較小學(xué)習(xí)率使得損失函數(shù)收斂在最優(yōu)值附近,即loss 穩(wěn)定時(shí)其值盡可能的小,因此,學(xué)習(xí)率分為兩部分:在第1~100 的epoch 中學(xué)習(xí)率設(shè)置為0.01;第101~200 的epoch 中學(xué)習(xí)率設(shè)置為0.001。批次大小設(shè)置為32,損失函數(shù)選取交叉熵誤差,優(yōu)化方法為隨機(jī)梯度下降(stochastic gradient descent,SGD)法,動量設(shè)置為0.9。
實(shí)驗(yàn)環(huán)境采用Windows 10 操作系統(tǒng),處理器為八核十六線程的Inte(lR) Core(TM) i7-11700K 3.6 GHz,內(nèi)存為16GB(8GB×2)3200 MHz 的雙通道內(nèi)存條,顯卡為華碩NVIDIA GeForce RTX 3060 12 GB,CUDA 為11.0,深度學(xué)習(xí)框架為Pytorch,編程語言為Python 3.6。
對遙感場景圖像異常探測效果采用四個(gè)評價(jià)指標(biāo),分別是準(zhǔn)確率、精確率、召回率和F1 分?jǐn)?shù)。準(zhǔn)確率是探測正確的占所有探測的比例,即把正類探測為正類與異類探測為異類的和除以總類數(shù)。精確率是探測結(jié)果中實(shí)際為正類的占探測為正類的比例。召回率是探測為正類的占實(shí)際全部正類的比例。精確率和召回率是相互矛盾的,因此,可以同時(shí)考慮精確率和召回率,選擇它們之間的一個(gè)平衡點(diǎn),即F1 分?jǐn)?shù)。準(zhǔn)確率(A)、精確率(P)、召回率(R)和F1 分?jǐn)?shù)(F1)的計(jì)算如下:
式中,TP、FN、FP 和TN 分別為正類探測為正類、正類探測為異類、異類探測為正類和異類探測為異類的數(shù)量。
探測次數(shù)和異常占比直接影響異常探測的效果,因此,有必要分別討論探測次數(shù)和異常占比對異常探測結(jié)果的影響。
探測次數(shù)的選擇關(guān)乎異常探測的效果,前期由于初始真實(shí)標(biāo)簽僅占數(shù)據(jù)集的10%,探測效果通常不夠理想,而隨著迭代次數(shù)的增加,網(wǎng)絡(luò)性能的不斷增強(qiáng),探測效果越來越好,但所需要的時(shí)間也在不斷增加,因此,有必要選擇一個(gè)合適的節(jié)點(diǎn)結(jié)束循環(huán)。三種自訓(xùn)練CNN 在含不同異常標(biāo)簽比例的兩種數(shù)據(jù)集探測中變化規(guī)律基本保持一致,因此,選取異常標(biāo)簽占15%的結(jié)果進(jìn)行展示,所得結(jié)果如圖7 所示。
圖7 自訓(xùn)練CNN 在不同探測次數(shù)中的結(jié)果Fig.7 Results of self-training CNN in different detection times
由圖7 可以看出,初次探測時(shí)的準(zhǔn)確率、召回率和F1 分?jǐn)?shù)都較低,分別為69.9%~81.0%、64.9%~78.0%、77.7%~87.1%。隨著探測次數(shù)的增加,三項(xiàng)指標(biāo)均在不斷提高,當(dāng)探測次數(shù)為6 次時(shí),各項(xiàng)指標(biāo)已經(jīng)趨于穩(wěn)定,且均能夠達(dá)到94.0%以上。三種自訓(xùn)練 CNN 的精確率在初次探測時(shí)均在99.0%以上,其中,自訓(xùn)練GoogLeNet 的精確率更是達(dá)到了100%,證明加入真實(shí)標(biāo)簽的正類圖像中幾乎不含錯(cuò)誤標(biāo)簽,但是隨著探測次數(shù)的增加精確率會在99.0%~100%波動。這是因?yàn)樵谔綔y時(shí)可能會有少數(shù)含異常標(biāo)簽的圖像被當(dāng)作正類圖像加入到真實(shí)標(biāo)簽中,導(dǎo)致精確率不斷下降。綜合考慮準(zhǔn)確率、精確率、召回率和F1 分?jǐn)?shù)四項(xiàng)評價(jià)指標(biāo)可以看出,當(dāng)探測次數(shù)為6 時(shí)已經(jīng)趨于穩(wěn)定。因此,后續(xù)異常探測實(shí)驗(yàn)的探測次數(shù)均為6 次,即將第6次的異常探測結(jié)果作為最終結(jié)果。
三種自訓(xùn)練CNN 在不同異常標(biāo)簽占比時(shí)的準(zhǔn)確率、精確率、召回率和F1 分?jǐn)?shù),如圖8 所示。在含有5%~30%的6 種異常標(biāo)簽占比的SIRI-WHU數(shù)據(jù)集中,自訓(xùn)練GoogLeNet 的準(zhǔn)確率分別為96.944%、96.944%、96.435%、96.111%、96.435%和95.509%,均在95.5%以上。在含有5%~30%的6種異常標(biāo)簽占比的RSSCN7 數(shù)據(jù)集中,自訓(xùn)練GoogLeNet 的準(zhǔn)確率分別為96.865、96.429%、96.984%、95.714%、96.151%、96.270%,均在95.7%以上,通過比較可以發(fā)現(xiàn)兩種數(shù)據(jù)集的異常探測準(zhǔn)確率較為接近。自訓(xùn)練ResNet 在6 種異常標(biāo)簽占比的SIRI-WHU 數(shù)據(jù)集、RSSCN7 數(shù)據(jù)集中準(zhǔn)確率分別為95.370%、95.046%、95.926%、95.833%、96.157%、94.861%和95.595%、95.794%、96.270%、95.238%、95.437%、95.476%;其中,SIRI-WHU數(shù)據(jù)集在異常占比為25%時(shí)準(zhǔn)確率最高、占比為30%時(shí)最低,RSSCN7 數(shù)據(jù)集在異常占比為15%時(shí)準(zhǔn)確率最高、占比為20%時(shí)最低。自訓(xùn)練DenseNet在6 種異常標(biāo)簽占比的SIRI-WHU 數(shù)據(jù)集、RSSCN7數(shù)據(jù)集中準(zhǔn)確率分別為 95.046%、95.648%、94.444%、95.741%、95.185%、95.278%和95.952%、95.952%、95.794%、95.952%、95.595%、95.278%。通過以上數(shù)據(jù)可以看出,自訓(xùn)練GoogLeNet 的準(zhǔn)確率在不同異常標(biāo)簽占比時(shí)均高于另外兩種自訓(xùn)練CNN;在SIRI-WHU 數(shù)據(jù)集中自訓(xùn)練GoogLeNet的準(zhǔn)確率隨異常標(biāo)簽占比的增加呈降低的趨勢,而在RSSCN 數(shù)據(jù)集中自訓(xùn)練GoogLeNet 的準(zhǔn)確率隨異常標(biāo)簽占比的增加上下波動,整體相對穩(wěn)定。精確率是探測為正類的結(jié)果中實(shí)際為正類的比例,在實(shí)際探測過程中,由于網(wǎng)絡(luò)性能的限制,每次探測時(shí)都會有少量的異常標(biāo)簽被錯(cuò)誤地判斷為正類加入到真實(shí)標(biāo)簽中,因此,自訓(xùn)練CNN 的精確率在第一次能夠取得較高的結(jié)果,隨著探測次數(shù)的增加,其結(jié)果也在逐漸降低。原因是當(dāng)數(shù)據(jù)集中異常標(biāo)簽占比越高,異常標(biāo)簽被錯(cuò)誤判斷的情況就越多,其值就相對較低。
圖8 自訓(xùn)練CNN 在不同異常占比中的結(jié)果(%)Fig. 8 Results of self-training CNN in different anomaly proportions (%)
三種自訓(xùn)練CNN 在不同異常標(biāo)簽占比時(shí)的召回率變化趨勢和準(zhǔn)確率相似,其中,自訓(xùn)練GoogLeNet 的結(jié)果最好。自訓(xùn)練GoogLeNet 在不同異常標(biāo)簽占比的SIRI-WHU 數(shù)據(jù)集、RSSCN7 數(shù)據(jù)集中F1 分?jǐn)?shù)分別為98.335%、98.239%、97.794%、97.444%、97.551%、96.603%和98.310%、97.962%、98.191%、97.248%、97.385%、97.289%,其中,含5%異常占比的F1 分?jǐn)?shù)均達(dá)到最高。自訓(xùn)練ResNet異常探測的F1 分?jǐn)?shù)結(jié)果相對于準(zhǔn)確率同樣有所提升,整體上升呈現(xiàn)先快后慢的趨勢,其值分別為97.467%、97.116%、97.531%、97.297%、97.373%、96.192%和97.625%、97.603%、97.755%、96.958%、96.908%、96.724%,其中,含15%異常占比的F1分?jǐn)?shù)均達(dá)到最高。自訓(xùn)練DenseNet 在6 種異常標(biāo)簽占比的F1 分?jǐn)?shù)分別為97.266%、97.488%、96.564%、97.215%、96.621%、96.430%和97.803%、97.696%、97.459%、97.396%、96.981%、96.562%;在SIRI-WHU 數(shù)據(jù)集中含10%異常占比的F1 分?jǐn)?shù)最高,含30%異常占比的F1 分?jǐn)?shù)最低;在RSSCN7數(shù)據(jù)集中含5%異常占比的F1 分?jǐn)?shù)最高,含30%異常占比的 F1 分?jǐn)?shù)最低。綜上所述,自訓(xùn)練GoogLeNet 的整體效果要優(yōu)于其他兩種方法。
為了有效地對遙感場景圖像中標(biāo)簽與實(shí)際類別不匹配的異常圖像進(jìn)行探測,本文提出一種基于自訓(xùn)練CNN 的遙感場景圖像異常探測方法。采用SIRI-WHU 和RSSCN7 遙感場景數(shù)據(jù)集,首先,選取準(zhǔn)確的10%標(biāo)簽樣本作為真實(shí)標(biāo)簽,從而為CNN提供初始模型;其次,使用自訓(xùn)練算法增強(qiáng)網(wǎng)絡(luò)性能,不斷地對含有不同異常標(biāo)簽占比的遙感場景數(shù)據(jù)集進(jìn)行異常探測;再次,將探測為正類的加入真實(shí)標(biāo)簽中,探測為異類的返回至偽標(biāo)簽中;最后,通過不斷運(yùn)算,直至各項(xiàng)指標(biāo)穩(wěn)定后,將剩下的偽標(biāo)簽數(shù)認(rèn)定為異常圖像。結(jié)果表明,三種自訓(xùn)練CNN 在含有不同異常標(biāo)簽的SIRI-WHU 數(shù)據(jù)集、RSSCN7 數(shù)據(jù)集中,各項(xiàng)指標(biāo)均能夠取得較好的效果。即使僅選取10%的初始訓(xùn)練樣本,含有高達(dá)30%的異常標(biāo)簽這一苛刻條件下,其準(zhǔn)確率、召回率和F1 分?jǐn)?shù)均依然在93.8%以上,精確率能夠保持到97.8%以上。在不同自訓(xùn)練CNN 的異常探測中,自訓(xùn)練GoogLeNet 的總體表現(xiàn)最好,優(yōu)于自訓(xùn)練ResNet 和自訓(xùn)練DenseNet。