国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

構(gòu)建地塊二維表征及CNN模型的作物遙感分類

2022-08-11 05:45:28張乾坤蒙繼華任超
遙感學(xué)報 2022年7期
關(guān)鍵詞:波段卷積精度

張乾坤,蒙繼華,任超

1.桂林理工大學(xué) 測繪地理信息學(xué)院,桂林 541004;2.中國科學(xué)院空天信息創(chuàng)新研究院 數(shù)字地球重點實驗室,北京 100101

1 引 言

通過農(nóng)業(yè)遙感監(jiān)測和調(diào)查能夠及時準確地獲取作物種植面積及時空分布信息,對農(nóng)業(yè)經(jīng)營管理、種植業(yè)結(jié)構(gòu)調(diào)整、國家糧食安全均具有重要意義(平躍鵬,2016)。農(nóng)作物的時空分布是農(nóng)業(yè)生產(chǎn)過程中的基本信息,也是掌握植物生長狀況,指導(dǎo)農(nóng)業(yè)生產(chǎn),開展其他農(nóng)業(yè)遙感應(yīng)用的重要依據(jù)(陳仲新等,2016)。如何通過遙感手段對農(nóng)作物的類型精準識別仍然是農(nóng)業(yè)遙感研究中最活躍的議題之一(Onojeghuo等,2018)。遙感識別的本質(zhì)是從傳感器對地觀測的影像到代表用戶感興趣的地面覆蓋類型的標簽字段的映射(Li 等,2019)。監(jiān)督分類是農(nóng)作物遙感識別的主要方法,依賴于有足夠的類標簽已知的可用像元來訓(xùn)練分類器。通過訓(xùn)練完成對分類器所需參數(shù)的估計,以便能夠識別和標記其他未標記像元(Seal 等,2020)。根據(jù)分類對象是否為像元而又可以分為逐像元分類和面向?qū)ο蠓诸悾≧ahman和Saha,2008;Blaschke,2010)。面向?qū)ο蠓诸惒捎昧擞舌徑裨鶚?gòu)成的圖斑作為分類單元,圖斑對象不僅包含原始的像元屬性,還可以加入全局性的光譜特征統(tǒng)計變量以及局部性的空間特征(Zhang 等,2017),可以克服傳統(tǒng)逐像元進行作物分類精度較低、分類結(jié)果常常是椒鹽圖像等問題。作物遙感分類與其他的類型的地物遙感分類的主要區(qū)別在于不同農(nóng)作物都表現(xiàn)出各自典型的物候特征(Cai等,2018),其光譜在不同季節(jié)有著明顯的變化,并且在區(qū)域內(nèi)同一種作物的生長發(fā)育規(guī)律相對穩(wěn)定(李中元等,2019)。越來越多的研究顯示增加植物生長變化更加敏感的波段和利用多時相的遙感影像可以提高作物的識別能力(Sun 等,2019)。遙感技術(shù)的發(fā)展提供了便利,對地觀測衛(wèi)星搭載的傳感器空間、波譜、時間分辨率逐漸提升(史舟等,2015)。采用多時相影像和加入敏感波段帶來精度提升的本質(zhì)是參與分類的特征得到擴充。這種擴充不僅僅是原始的波譜特征的增加,也表明研究者有更多的選擇來構(gòu)造衍生特征(Su 等,2018)。分類特征的增加使得模型將更加復(fù)雜,其泛化能力下降,而且特征變量過多會引起“維數(shù)災(zāi)難”,識別精度反而會降低(Cavallaro 等,2015)。盡管這也使得特征提取、特征選擇等手段有著更多的選擇方案(Zhang 等,2012,2017;Valero 等,2016),但在實踐中,要找到有效且合適的方案并非易事。手工設(shè)計的特征工程依賴于人的經(jīng)驗和領(lǐng)域知識,且冗長和耗時的。通常需要人為干預(yù)來應(yīng)對給定條件的變化。人類知識很難同時考慮到類間相似性、類內(nèi)變異性、大氣條件和光散射機制等復(fù)雜因素(Zhong 等,2019)。預(yù)先定義的模型和相關(guān)的數(shù)學(xué)假設(shè)的固定形式限制了處理不同模式的靈活性。

神經(jīng)網(wǎng)絡(luò)具有近似任意非線性函數(shù)的能力,通過簡單組合但非線性的模塊進行多層表征學(xué)習(xí)(LeCun等,2015)。經(jīng)典的神經(jīng)網(wǎng)絡(luò)稱為多層感知器MLPs(MultiLayer Perceptrons),可以應(yīng)用于各類的數(shù)據(jù)預(yù)測問題。MLPs 近似一個從輸入變量到輸出變量的映射函數(shù)(Hinton 等,2012)。這種通用能力對于監(jiān)督分類任務(wù)是有價值的,一方面是其神經(jīng)網(wǎng)絡(luò)對輸入數(shù)據(jù)和映射函數(shù)中的噪聲具有很強的魯棒性,甚至可以在缺失值存在的情況下支持學(xué)習(xí)和預(yù)測。另一方面,神經(jīng)網(wǎng)絡(luò)對映射函數(shù)沒有很強的假設(shè),容易學(xué)習(xí)線性和非線性關(guān)系,支持映射函數(shù)中任意定義但固定數(shù)量的輸入和輸出。這意味著多變量輸入,可以指定任意數(shù)量的輸入特征,為多元預(yù)測提供直接支持。卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Network)通過卷積核作為中介,在每一圖像層共享卷積核內(nèi)的參數(shù),圖像通過卷積操作保留原始位置關(guān)系形成下一圖像層(LeCun等,2015)。共享權(quán)值(卷積核)帶來的直接好處是減少網(wǎng)絡(luò)各層之間的連接,極大的限制參數(shù)的數(shù)量,克服了訓(xùn)練MlPs 梯度消失和梯度爆炸的技術(shù)問題(Shin 等,2016)。CNN 在遙感領(lǐng)域已開展多方面的應(yīng)用研究(Wang 等,2017;Shao 等,2018)。利用卷積機制結(jié)合堆疊自編碼高效的特征提取及特征表示能力一方面降低數(shù)據(jù)復(fù)雜性,另一方面提升數(shù)據(jù)表征的有效性(Zabalza 等,2016;Han 等,2016;Lu 等,2018)。該方法多用于高光譜影像的降維以及雷達影像的降噪。通過構(gòu)造更為復(fù)雜的卷積層(Wei 等,2018)、構(gòu)建多流網(wǎng)絡(luò)結(jié)構(gòu)(Anwer 等,2018)、進行多模型的決策融合(Zhang 等,2018)等方式增加非線性映射的復(fù)雜程度來提升影像的分類精度。這種通過延擴網(wǎng)絡(luò)結(jié)構(gòu)的方式雖然能應(yīng)對更為復(fù)雜的分類情景,但同時其要求更多的樣本來訓(xùn)練其內(nèi)部參數(shù)而使得應(yīng)用受限。(Long 等,2015;Audebert 等,2017)采用全卷積神經(jīng)網(wǎng)(FCN)絡(luò)始終保持影像的二維結(jié)構(gòu)產(chǎn)生與原影像同尺寸的類別輸出。但其類別邊界分類模糊,與實際有較大差距。雖然(Bittner 等,2017;Guo 等,2018)利用條件隨機場CRF(Conditional Random Field)做后處理細化區(qū)域邊界,但問題并沒有得到完全解決。另外,CNN 通常用于空間和光譜領(lǐng)域,但在遙感研究中幾乎不涉及時間維度。

調(diào)用已有地理信息作為條件約束參與遙感應(yīng)用之中也逐步成為遙感應(yīng)用的發(fā)展趨勢。地塊數(shù)據(jù)在遙感分類中起著一種地理約束功能。其作為同一權(quán)屬且完整封閉的農(nóng)田,提供邊界、位置、面積等地理信息,具有長期的穩(wěn)定性(韓衍欣,2018)。很自然的與面向?qū)ο蠓诸愡M行聯(lián)系,地塊可以作為特殊對象參與分類,相較于利用影像分割而獲得的圖斑對象,地塊有著更多的優(yōu)勢(黃啟廳等,2016;韓衍欣和蒙繼華,2019)。除了其提供準確的分類邊界,還可以禁止了農(nóng)田外的其他地物類別參與分類。地塊數(shù)據(jù)的加入對于神經(jīng)網(wǎng)絡(luò)還提供潛在的優(yōu)勢,可以有效的縮減神經(jīng)網(wǎng)絡(luò)模型計算規(guī)模。使得多類深度學(xué)習(xí)算法如全卷積神經(jīng)網(wǎng)FCN(Fully Convolutional Networks)等算法并不需要以完成像素到像素的映射。一方面是研究單元數(shù)量的大幅減少,另一方面可以避免重疊卷積的使用而減少過多的冗余計算。訓(xùn)練神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜性也因此得到極大降低。

本文提取地塊全部影像的各波段地表反射率均值,地塊單元的地表反射率在波譜和時相上仍具有二維特征。從而構(gòu)建二維表征形式的特征圖作為該地塊的抽象表示。通過構(gòu)建合適CNN 模型完成對光譜、時間維度上的復(fù)合表征,完成對所構(gòu)建特征圖的分類,從而達到對地塊的分類。最后對該模型的分類結(jié)果與其他一些機器學(xué)習(xí)分類器進行了比較。期望通過適當?shù)目梢暬陀成湓O(shè)置有效地評估分類結(jié)果。

2 研究區(qū)與數(shù)據(jù)

2.1 研究區(qū)介紹

選擇新疆生產(chǎn)建設(shè)兵團第八師(簡稱為八師)為研究區(qū)。八師位于中國西北地區(qū),地處天山北麓中段,準噶爾盆地南緣,分布在石河子、克拉瑪依、沙灣、瑪納斯境內(nèi)。研究區(qū)位置如圖1 所示。研究區(qū)屬于典型的溫帶大陸性氣候,氣溫年差日差較大,平均氣溫7.5 ℃—8.2 ℃,無霜期147—191 d;氣候干旱,降水稀少,年降水量180—270 mm,年蒸發(fā)了在1000—1500 mm;日照充沛,年日照時長在2721—2818 h;墾區(qū)內(nèi)地勢平坦,平均海拔約為450 m;田塊規(guī)整,作物規(guī)模種植,農(nóng)業(yè)機械化程度較高。研究區(qū)生育期內(nèi)可獲得無云或少云影像較多,種植結(jié)構(gòu)及種植模式穩(wěn)定,區(qū)域內(nèi)自然及生產(chǎn)條件差異較小。

圖1 研究區(qū)位置及其區(qū)域Fig.1 Location and area of study area

受自然和生產(chǎn)條件限制,實驗區(qū)種植模式穩(wěn)定,多為一年一熟單作。其主要作物包括棉花、玉米、小麥、辣椒、桃子、葡萄、瓜類等。棉花種植模式屬于典型的西北內(nèi)陸棉區(qū)種植模式于4月播種,9月到10月收獲。玉米種植區(qū)劃屬于西北灌溉玉米區(qū),多為一年一熟春玉米單作,于4月種植,也存在少量的青貯玉米于6月種植。小麥種植區(qū)劃屬于新疆冬春播秋春性麥區(qū),八師小麥于10月前后播種,6月中下旬收獲。此外,該地區(qū)還種植較多瓜果蔬菜,葡萄、桃子、辣椒占有較大比重。

2.2 遙感影像

采用Landsat 8 數(shù)據(jù)作為本次實驗的遙感數(shù)據(jù)源。Landsat 8 衛(wèi)星由美國航空航天局(NASA)發(fā)射,搭載兩個傳感器,分別是OLI 陸地成像儀(Operational Land Imager) 和TIRS 熱紅外傳感器(Thermal Infrared Sensor)。Landsat 8 在空間分辨率和光譜特性等方面如表1 所示,衛(wèi)星一共有11 個波段,波段1—7,9—11的空間分辨率為30 m,波段8 為15 m 分辨率的全色波段,衛(wèi)星每16 d 可以實現(xiàn)一次全球覆蓋。

表1 Landsat 8波段配置Table 1 Landsat 8 band setting

數(shù)據(jù)獲取于Google Earth Engine 平臺的USGS Landsat 8 表面反射率數(shù)據(jù)集,該數(shù)據(jù)集由Google使用USGS 提供的Docker 鏡像利用Landsat 8 OLI/TIRS 傳感器數(shù)據(jù),經(jīng)過大氣校正獲得的包含4 個可見光、近紅外(VNIR)波段以及2 個短波紅外(SWIR)波段,經(jīng)過正射校正后的地表反射率,以及2 個熱紅外(TIR)波段經(jīng)過正射校正后的輻射亮度。即相對原始數(shù)據(jù)去除了全色波段、和用于評估數(shù)據(jù)質(zhì)量的卷云波段,同時將兩個近紅外重采樣到30 m 分辨率。獲得覆蓋試驗區(qū)生育期內(nèi)4—10月全部Landsat 8影像如表2所示。

表2 研究區(qū)作物生育期內(nèi)影像Table 2 RS image of crop growth period in the study area

2.3 地塊及樣本數(shù)據(jù)

地塊數(shù)據(jù)是通過人工勾繪完成地塊矢量化,采用的是Google Earth 17 級數(shù)據(jù),空間分辨率為1.19 m,Google Earth 影像包含多類遙感平臺數(shù)據(jù)以及一些航拍數(shù)據(jù),為多景多源數(shù)據(jù)拼接且時間并不統(tǒng)一、非現(xiàn)勢影像,但其具有較高分辨率,包含較為準確的地理信息。根據(jù)Google Earth 影像以及高分辨率影像GF、Sentinel-2等數(shù)據(jù)參考勾繪地塊矢量,該套地塊數(shù)據(jù)在最初于2017年完成。并在此基礎(chǔ)上于2019年8月中旬前往研究區(qū)通過進行地面調(diào)查以及參考當年高分辨率影像對該套地塊數(shù)據(jù)進行修正。在實驗區(qū)對地塊類別進行地面調(diào)查并通過人工解譯標注了共計了2184 個作物樣本地塊,其中實地調(diào)查了1160 個地塊類別。全部地塊樣本包含了233 個玉米地塊、120 個小麥地塊、873 個棉花地塊、109 個辣椒地塊、128 個包含西瓜、打瓜、甜瓜、哈密瓜在內(nèi)的瓜類地塊、40 個番茄地塊、98 個桃樹地塊、297 個葡萄地塊以及286個包含荒地、苗圃、樹林等林草地塊。地塊數(shù)據(jù)及樣本數(shù)據(jù)如圖2所示。

圖2 地塊數(shù)據(jù)及樣本分布Fig.2 Field parcel data and sample distribution

2.4 云掩膜數(shù)據(jù)

Landsat 8 影像的云掩膜數(shù)據(jù)來源于Landsat 8的質(zhì)量評定頻段。質(zhì)量評定波段定義某些質(zhì)量條件的位組合在PIXELQA 波段中顯示為整數(shù)值。將像元值所表示的位分解為可理解的條件描述。對PIXELQA 波段中可能的像元值進行二進制變換后的可以得到影像像元的質(zhì)量。質(zhì)量評定波段由16 位二進制數(shù)表示,其二進制位所具有的具體含義說明如表3 所示,其中位11—15 未利用。通過GEE 平臺對PIXELQA 進行波段計算可以獲得云掩膜數(shù)據(jù)。

表3 Landsat 8像素質(zhì)量評定波段比特值Table 3 Landsat 8 pixel quality assessment bit index

3 研究方法

本文技術(shù)路線如圖3所示。利用Landsat 8質(zhì)量評定波段獲取生育期內(nèi)全部影像的云掩膜文件。在做地塊的統(tǒng)計過程中僅統(tǒng)計無云區(qū)域,若地塊所在區(qū)域均被云覆蓋,采用其它影像進行二維插值獲得。構(gòu)建地塊特征圖作為CNN 的輸入,通過逐步優(yōu)選模型結(jié)構(gòu)及參數(shù)構(gòu)建相對有效模型。最后完成對測試集分類精度評價及分類結(jié)果分析。

圖3 研究技術(shù)路線Fig.3 Technical route of the study

3.1 地塊的二維表征

地塊的表征可以作為地塊種植信息的反映,也可以看作地塊種植信息被加工的客體。從衛(wèi)星遙感的角度,地塊種植信息的體現(xiàn)是在于對地衛(wèi)星的觀測而獲得的遙感影像,更近一步說是影像上各像元反射率值。而區(qū)分目標物的屬性即特征具有相對性,它總是相對于兩個或多個相互比較的目標物而言。因此像元反射率值可以被作為區(qū)分種植類別的原始特征存在。表征是目標物信息的呈現(xiàn)方式,保留了主要信息,其具有抽象性,并受到規(guī)則的控制。我們把區(qū)分地塊種植類別的屬性按照一定規(guī)則進行編碼而獲得的輸出稱之為地塊表征。在以地塊為研究單元,忽略了地塊的位置、形狀、尺寸等幾何信息,其在光譜和時相上仍具有二維特性??梢酝ㄟ^一定的編碼方式對二維特性得以保留,通過該方式而獲得的輸出被稱之為地塊的二維表征。

地塊表征的構(gòu)建出于作物類型信息在生育期整體性的考慮。不同的地塊的表征我們采用相同尺寸的特征圖來具體體現(xiàn)。特征圖既是表征表示形式也是數(shù)據(jù)儲存形式。特征圖是通過地塊矢量對影像集內(nèi)各時相及波段進行區(qū)域統(tǒng)計。由于云覆蓋的原因,對于地塊統(tǒng)計出來的數(shù)字與實際上的存在很大的差距。云覆蓋區(qū)域的可見光波段遠高于實際值。熱紅外波段低于實際值。對于單一時相而言,云對地塊有3 種情況,(1)未遮蓋,(2)部分遮蓋,(3)全部遮蓋。對不同的情況分別做不同的處理。對于未遮蓋的地塊,只需要對地塊區(qū)域的像素進行統(tǒng)計即可。地塊的區(qū)域統(tǒng)計最為常用的就是均值統(tǒng)計,一般認為地塊像素均值可以作為地塊的整體反射率。一個地塊內(nèi)的作物類別相同,種植條件接近,在地塊內(nèi)的差異小,故而對于部分遮蓋的地塊,只需要統(tǒng)計地塊內(nèi)未遮蓋區(qū)域的像元,通過部分來代替整體。而全部遮蓋的地塊,作為缺失值,缺失值的補全可以采用多種方式,包括通過不完全變量自身的插值擬合。以及通過數(shù)據(jù)集中的完全變量對缺失值進行估計。

本文使用Google Earth Engine (GEE)平臺的USGS Landsat 8表面反射率數(shù)據(jù)集。在GEE 平臺利用地塊矢量數(shù)據(jù)統(tǒng)計覆蓋研究區(qū)地塊4—10月的可獲得全部影像的各波段反射率均值。以數(shù)組形式構(gòu)建地塊上波譜、時相二維特征圖作為該地塊的的二維表征,也是該地塊抽象表示。橫軸為時相,T0 到T10 與影像日期順序相對應(yīng)??v軸為波段,band1—band7、band10、band11 共計9 個波段,與表面反射率數(shù)據(jù)集波段構(gòu)成一致。

圖4(a)所示的地塊在T6、T8 時相被云覆蓋造成區(qū)域統(tǒng)計值異常,作為缺失值,這里采用二維cubic 插值來完成構(gòu)造成如圖4(b)所示特征圖。

圖4 多時相各波段構(gòu)成的特征圖Fig.4 Feature maps of each band composition of multi-temporal RS images

3.2 CNN模型及參數(shù)設(shè)置

在構(gòu)建CNN 的結(jié)構(gòu)時,由于專用架構(gòu)的多功能性,因此沒有標準的過程來搜索超參數(shù)和各種類型的層的最佳組合。在這次實驗中卷積層、池化層、Dropout 和全連接層相結(jié)合,設(shè)置的CNN 模型構(gòu)件或參數(shù)及其預(yù)設(shè)值如表4 所示。測試了2、3 和5 的卷積核尺寸和卷積層具有8 或16 個通道,池化層固定為窗口大小為2 的最大池化。Dropout是一種正則化技術(shù),可在訓(xùn)練過程中將一些神經(jīng)元隨機失活,防止訓(xùn)練較小的數(shù)據(jù)集時容易造成過擬合提高神經(jīng)網(wǎng)絡(luò)的性能。神經(jīng)元失活的可能性設(shè)置為20%、30%和40%。將不同核尺寸的卷積層和最大池化層連接起來以同時處理多尺度特征。利用Flatten 層用來將輸入“壓平”,即把二維的輸入一維化,完成從卷積層到全連接層的過渡。每個模型在輸出端包含3層的全連接層。最后一層包含9 個神經(jīng)元,對應(yīng)于分類任務(wù)9 個類別的概率。全連接各層神經(jīng)元個數(shù)通過考慮最后輸出以及Flatten層扁平化的輸入來確定的。最后一層分類采用softmax 作為激活函數(shù),輸出被映射成為(0,1)的值,而這些值的累和為1(滿足概率的性質(zhì))。其余各層均采用采用線性整流函數(shù)ReLU(Rectified Linear Unit),又稱修正線性單元作為激活函數(shù)。

表4 CNN模型構(gòu)件或參數(shù)Table 4 CNN model components or parameters

在模型的訓(xùn)練過程中,訓(xùn)練次數(shù)不是越多越好,對訓(xùn)練集進行過多的學(xué)習(xí),會導(dǎo)致過擬合現(xiàn)象,隨著學(xué)習(xí)的進行,對于CNN 模型權(quán)權(quán)值學(xué)習(xí)迭代次數(shù)足夠多,BP 算法使權(quán)值可能收斂過于復(fù)雜的決策面,擬合了訓(xùn)練樣本中的噪聲和其中并不具有代表性的特征。批量訓(xùn)練是將批量樣本訓(xùn)練取平均損失來進行梯度計算。批量設(shè)置過小,梯度的估值就越不準確,梯度下降的方向波動也越大,難以達到收斂效果。而批次過大,參數(shù)的修正變得緩慢,達到相同的精度所耗損的時間增加。且當批次增大到一定范圍內(nèi),其確定的下降方向基本不會變化。優(yōu)化器選擇Adam 進行了訓(xùn)練。遵循原始論文(Kingma和Ba,2014)提供的參數(shù)作為默認參數(shù)(β1=0.9,β2=0.999,學(xué)習(xí)率為0.001。)損失函數(shù)采用交叉熵損失函數(shù)。

3.3 分類精度指標

本文計算了測試集的混淆矩陣、整體精度和Kappa系數(shù),以評估所訓(xùn)練分類器的整體性能。計算用戶精度、制圖精度對單一類別分類性能。總體精度與正確映射的區(qū)域成比例,并且適合于區(qū)域估計。用戶精度表示分類結(jié)果中某類別被正確分類的概率,主要用來評價分類結(jié)果的可信度。制圖精度表示地面的某類別被制圖者正確分類的概率。主要用來評價分類方法的好壞。Kappa系數(shù)采用另一種離散多元統(tǒng)計技術(shù),它綜合運用了混淆矩陣的所有參數(shù)來計算一個最終指標,從而克服了整體精度、用戶精度、制圖精度指標過分依賴于所選樣本點的問題。Kappa 系數(shù)的計算公式如下:

式中,n為混淆矩陣中的總列數(shù),也就是類別數(shù);xii是混淆矩陣中第i行、第i列上的樣本個數(shù),也就是分類正確的數(shù)目;xi+和x+i分別為第i行和第i列的總樣本個數(shù);N為總樣本個數(shù)。

4 實驗與分析

4.1 訓(xùn)練過程及結(jié)果

訓(xùn)練樣本占比增加,會使得測試樣本占比減少,從而降低總體精度的容錯性。這里選用50%作為訓(xùn)練,50%作為驗證,這與其他分類器設(shè)置一致。在訓(xùn)練CNN時,訓(xùn)練樣本的30%留作驗證,進行超參數(shù)調(diào)優(yōu)設(shè)置。即訓(xùn)練集占全體樣本的35%,驗證集15%,測試集50%。利用測試集與驗證集進行參數(shù)設(shè)定,搜索過程構(gòu)建模型的過程是通過測試集的精度來進行多輪的搜索。最初統(tǒng)一采用批量為50,每500 次訓(xùn)練后通過測試集分類錯誤率在兩次增加來決定停止一組參數(shù)設(shè)置下的訓(xùn)練。在對CNN 模型的超參數(shù)逐步選擇完畢,即CNN 模型構(gòu)建完成后開啟對訓(xùn)練參數(shù)的搜索。其搜索過程如表5所示。

表5 構(gòu)件或參數(shù)搜索過程Table 5 Component or parameter search process

通過前兩輪的搜索構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)如圖5 所示。不能否認的是依然存在大量潛在的網(wǎng)絡(luò)體系結(jié)構(gòu)并不能全部嘗試。更多的是根據(jù)經(jīng)驗進行逐步選擇超參數(shù)。從相對簡單的模型開始,通過更改一個或兩個超參數(shù),添加新層,重新排序?qū)踊蛴酶鼜?fù)雜的組件替換網(wǎng)絡(luò)的一部分來生成新模型。在獲取具有良好分類性能的模型被用作啟動新一輪搜索的開始。通過這種方式測試模型的大小和復(fù)雜性不斷增長,直到分類結(jié)果沒有進一步改善。最終訓(xùn)練超參數(shù)選擇為批次為2500,批量為75。

圖5 CNN模型結(jié)構(gòu)Fig.5 CNN model construction

4.2 分類結(jié)果及分析

通過訓(xùn)練的模型對全部的地塊表征進行分類,獲得如圖6 所示新疆生產(chǎn)建設(shè)兵團第八師2019年的作物分布圖。相較于基于像素或者面對對象的分類方法,本算法最大的特點是有著清晰的地塊邊界,遠高于遙感影像的分辨率。

圖6 實驗區(qū)2019年作物分布Fig.6 Crop distribution in the experimental area in 2019

通過計算了測試集的混淆矩陣、整體精度和Kappa系數(shù),以評估所訓(xùn)練分類器的整體性能。結(jié)果如表3所示。注意到番茄類制圖精度都遠低于遠低于其他類對象,造成該結(jié)果的主要原因是番茄地塊樣本過少,在訓(xùn)練過程中造成對番茄分類的欠擬合,不能對未知的測試樣本較好的完成分類任務(wù)。棉花作為實驗區(qū)種植面積最多的作物,其精度高的原因,一方面是樣本數(shù)量足夠,另一方面其收獲在10月,生育期與其他作物有著明顯區(qū)別。其他類別除了桃樹的用戶精度為86.96%,林草類的制圖精度為82.73%,其余作物的用戶與制圖精度都高于90%。分類器的整體精度為93.04%、Kappa 系數(shù)為91.09%。在9 類作物分類中獲得較好的結(jié)果。依據(jù)分類器所采用的模型形式可以將監(jiān)督分類算法分為4類:概率模型、幾何模型、邏輯(規(guī)則)模型、網(wǎng)絡(luò)模型。分別選用4 類中最為典型機器算作為本算法的對比,包括了基于概率模型的樸素貝葉斯(Naive Bayes);基于幾何模型的支持向量機SVM(Support Vector Machine);基于邏輯(規(guī)則)模型的隨機森林RF(Random Forest)以及基于網(wǎng)絡(luò)模型的多層感知機MLPs(Multilayer Perceptron)。將所獲得的分類精度與其他4 種常見分類器與本文算法進行對比。為了減少單次分類精度可能由于樣本劃分帶來的偶然誤差,對樣本集進行10 次劃分后分別用以上算法進行20 次重復(fù)實驗。結(jié)果如圖7所示,對比其他算法,可以發(fā)現(xiàn)該算法所的到的分類模型的平均整體精度為93.91%、平均Kappa 系數(shù)為92.20%,均高于其他算法。而本文算法受模型訓(xùn)練形式限制,實際上參與訓(xùn)練樣本的數(shù)量只占全部樣本的35%,低于其他算法50%的訓(xùn)練樣本,但仍然獲得最高的分類精度。分類精度具有飽和性,分類精度越高,提升精度的難度也就越大,分類精度的上限易受到樣本質(zhì)量的限制??梢钥闯霰舅惴ǐ@得了明顯的精度提升。其次,20 次重復(fù)實驗也說明了該方法分類結(jié)果受到樣本劃分的精度差異小于其他算法,分類精度在一個較小區(qū)間范圍,具有更強的穩(wěn)點性。

5 結(jié) 論

本文以新疆生產(chǎn)建設(shè)兵團第八師為研究區(qū),基于全生育期Landsat 8 影像集與地塊數(shù)據(jù),開展作物分類的CNN 模型的構(gòu)建。所提出的算法優(yōu)于傳統(tǒng)機器學(xué)習(xí)分類算法,是深度學(xué)習(xí)在農(nóng)業(yè)遙感應(yīng)用中一次有效的結(jié)合。結(jié)果表明CNN 模型在波段、時相二維特征表示中具有巨大潛力,應(yīng)被視為基于地塊的多時相圖像分類任務(wù)的優(yōu)選方法。地塊表征的概念將提供分類的信息可以通過整體來看待。表征可以看作為特征的組合或者對特征某種規(guī)則的編碼。數(shù)據(jù)組織的方式中也會蘊含著可供分類的信息。最重要的是表征并不僅僅是特征圖這一種表現(xiàn)形式。表征作為相對于特征的更高層次表達,作為聯(lián)系多類數(shù)據(jù)獲得特定儲存形式的深度學(xué)習(xí)輸入。并不需要對遙感數(shù)據(jù)進行過多選擇。這些優(yōu)勢也意味著利用該方法可以減少了人類知識及先驗假設(shè)的加入,易于實現(xiàn)作物遙感識別的系統(tǒng)集成,提高分類工作自動化和系統(tǒng)化、流程化程度。

本文研究有著很多的可擴展的方面,這里列出主要的擴展研究主題以供參考:

(1)加入其他地塊特征。本文在進行構(gòu)建時相、波譜的特征圖作為地塊表征時,使用是各波段地塊地表反射率的均值。這里可以加入其他統(tǒng)計量,如變異系數(shù)、偏度、峰度等反演地塊內(nèi)部反射率綜合統(tǒng)計特性。也可以加入紋理分析,提取獲得地塊紋理的定量描述。以此聯(lián)合構(gòu)建更高維度的特征圖,通過卷積操作,獲得更能體現(xiàn)地塊的綜合表征??梢蕴岣叻诸惥然蜃R別地塊間更精細的分類,如作物品種、地塊種植結(jié)構(gòu)等。

(2)使用多源遙感數(shù)據(jù)。由于地塊數(shù)據(jù)的存在,很容易利用地塊數(shù)據(jù)提取地塊內(nèi)影像像元的統(tǒng)計值,按照波長、影像拍攝時間構(gòu)成的平面上的點。擁有不同波段設(shè)置的多源遙感數(shù)據(jù)可以很容易的在二維顯示。通過二維的插值處理,獲得包含多源數(shù)據(jù)信息構(gòu)成的特征圖。這張圖包含了地塊作物生育期內(nèi)更多時相、波譜信息所構(gòu)成的復(fù)合特征??梢砸源碎_展空間上、時間上的分類任務(wù)的泛化。

(3)加入半監(jiān)督學(xué)習(xí)。通過加入更易獲得的無標簽地塊樣本來解決樣本數(shù)量不足問題或改善分類結(jié)果。除了傳統(tǒng)的半監(jiān)督學(xué)習(xí)算法外如標簽傳播算法;還包含無監(jiān)督預(yù)訓(xùn)練,有監(jiān)督的微調(diào)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練形式;以及最近應(yīng)用廣泛的生成對抗網(wǎng)絡(luò)(GAN) 的擴展——輔助分類器GAN(ACGAN),以生成網(wǎng)絡(luò)產(chǎn)生偽數(shù)據(jù),利用判別網(wǎng)絡(luò)對真?zhèn)螖?shù)據(jù)進行判斷并進行分類,既使用標簽信息進行訓(xùn)練,同時也重建標簽信息。

分類作為機器學(xué)習(xí)的最主要的任務(wù)之一,誕生了最多的機器學(xué)習(xí)算法。遙感分類一直得益于機器學(xué)習(xí)領(lǐng)域的發(fā)展。以神經(jīng)網(wǎng)絡(luò)為代表深度學(xué)習(xí)作為機器學(xué)習(xí)的子集,近年來發(fā)展迅速,這為遙感分類帶來了新的模式。包括農(nóng)業(yè)的各個領(lǐng)域遙感應(yīng)用,都有一個普遍的趨勢:從研究區(qū)小范圍擴展到大區(qū)域;從數(shù)據(jù)的單一傳感器擴展到多源異構(gòu)數(shù)據(jù)共同參與;從單機模式擴展到高性能并行運算模式。深度學(xué)習(xí)將與物遙感分類將會有更深入結(jié)合,通過可增長的數(shù)據(jù)量及運算量來提高作物分類各方面指標,以完成智能化、系統(tǒng)化、自動化的農(nóng)作物識別任務(wù)。

猜你喜歡
波段卷積精度
春日暖陽
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于DSPIC33F微處理器的采集精度的提高
電子制作(2018年11期)2018-08-04 03:25:38
基于傅里葉域卷積表示的目標跟蹤算法
M87的多波段輻射過程及其能譜擬合
GPS/GLONASS/BDS組合PPP精度分析
日常維護對L 波段雷達的重要性
西藏科技(2015年4期)2015-09-26 12:12:58
改進的Goldschmidt雙精度浮點除法器
一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法
布拖县| 建阳市| 泾源县| 凤城市| 滕州市| 永安市| 秦安县| 神农架林区| 保靖县| 阳城县| 阳春市| 新晃| 嘉荫县| 隆回县| 平武县| 常德市| 商丘市| 翁源县| 白水县| 宁河县| 教育| 疏附县| 岳池县| 怀化市| 勃利县| 佳木斯市| 南皮县| 剑川县| 茂名市| 孝义市| 安龙县| 高密市| 玛纳斯县| 湖北省| 巴里| 江都市| 龙里县| 隆尧县| 买车| 通榆县| 天镇县|