翟涌光,屈忠義
?
基于非線性降維時序遙感影像的作物分類
翟涌光1,2,屈忠義1※
(1. 內蒙古農業(yè)大學水利與土木建筑工程學院,呼和浩特 010018; 2. 中國科學院遙感與數(shù)字地球研究所,北京 100101)
當前基于時序遙感數(shù)據(jù)的作物分類方法大都需要較多專家知識及人工干預,難以自動化,也難以移植到其他地區(qū)。將光譜降維技術用于時序遙感影像分析可以很好地解決這一問題。其中,非線性降維方法已經成功應用于高光譜數(shù)據(jù),并且獲得了比線性降維方法更好的結果。但是,直接將非線性降維方法用于時序遙感影像無法充分利用其時相維度的信息。該文改進了一種非線性降維算法——Laplacian Eigenmaps(LE)用于時序遙感影像的作物分類,該方法更加關注相同時相下不同作物生長季的物候特征差異,而不再僅依賴于整個生長季的物候曲線輪廓。改進的LE算法被應用于美國伊利諾伊州覆蓋作物全生長季的Landsat 8時間序列影像。降維后保留的波段結合隨機森林分類器基于美國農業(yè)部Cropland Data Layer(CDL)提供的訓練數(shù)據(jù)完成了一系列的分類試驗,并與傳統(tǒng)插值未降維的方法進行對比。試驗結果表明,改進的LE降維方法完成了更高的整體及各個類別的分類精度,其中整體分類精度達到85.37%,該方法作為一種自動化的方法,不需要人工干預,可直接移植到其他研究區(qū),并且只需要較少的訓練樣本就可以完成一個較高的分類精度,為日后不同尺度的作物識別和提取研究提供了有效的方法。
遙感;數(shù)據(jù)處理;作物;分類;非線性光譜降維;時間序列;動態(tài)時間彎曲
近年來,全球人口數(shù)量持續(xù)增長,預計到2030年將達到87億[1]。由于全球土地總量有限,因此人口增長將帶來嚴重的糧食安全問題。為了更好地解決糧食短缺引起的經濟和社會問題,急需提升農業(yè)用地的管理和監(jiān)測水平[2-3]。精確、及時的作物種植結構信息對于各級政府制定相應農業(yè)政策和經濟發(fā)展計劃、確保國家糧食安全和社會穩(wěn)定具有重要意義。遙感技術憑借其觀測范圍大、監(jiān)測周期短等優(yōu)點,已經成為農情監(jiān)測最主要的手段之一,廣泛應用于作物種植結構識別及面積估算等方面[4]。
當前,已有很多研究人員使用遙感數(shù)據(jù),結合監(jiān)督或非監(jiān)督分類算法,完成作物種植結構制圖[5-7]。由于作物類型復雜多樣,不同作物間的“異物同譜”現(xiàn)象使得僅利用單一時相遙感數(shù)據(jù)進行作物類型識別存在明顯不足,而基于時間序列遙感影像的制圖方法已經被證明可以完成更高的分類精度[8-12]。盡管時間序列遙感數(shù)據(jù)已經廣泛應用于作物種植結構識別,但是要建立高精度、自動化的分類模型,仍然面臨著一些挑戰(zhàn)。首先,對于一定時期內,土地覆蓋類型沒有發(fā)生變化的區(qū)域,其相應時間序列數(shù)據(jù)之間存在高度相關性,這一特點已經在遙感影像變化監(jiān)測研究中被廣泛使用,換言之,高度相關性意味著時間序列遙感數(shù)據(jù)也存在著數(shù)據(jù)冗余問題[13-15]。因此,為了提高分類精度,時間序列遙感影像在分類前有必要進行降維處理。其次,遙感影像在成像過程中,觀測到的場景分量貢獻與其表面積不成線性關系,這一點對植被類型尤其明顯。加之,遙感影像成像過程會經歷不同場景分量之間的多次散射,這種散射受波長、觀測角度和光照條件、及場景分量三維結構等多種因素影響,因此,使得遙感影像有著內在的非線性特征,所以非線性降維技術更適合用于遙感影像[16-18]。其次,時間序列影像在成像過程中易受云覆蓋的影響,導致部分時相數(shù)據(jù)無效,這使得時間序列數(shù)據(jù)使用前往往需要較多的人工預處理操作,例如可用數(shù)據(jù)篩選、時相插值或者時間序列曲線濾波等,這顯然降低了分類模型的自動化程度,難以移植到其他地區(qū)。為了解決上述問題,Zhai等將非線性降維方法LE(laplacian eigenmaps)與DTW(dynamic time warping)度量相結合,提出了一種自動化的時間序列土地覆蓋分類方法——LE-DTW[19]。選擇LE降維算法的原因包含以下3個方面。第一,LE是一種非線性降維方法,當應用于高光譜遙感數(shù)據(jù)時已經被證明比線性降維方法效果更好[20-21]。第二,LE是一種局部流形學習方法。局部流形學習方法的優(yōu)點是通過構建近鄰圖可以保留原始數(shù)據(jù)的局部特征,與全局方法(例如,ISOMAP方法[22])相比,近鄰圖構建時更強調數(shù)據(jù)的自然聚類屬性[16]。第三,LE是一種基于圖理論的方法,降維只依賴于數(shù)據(jù)點間的相似性程度,因此與其他局部保留方法相比,更容易結合不同的相似性度量。LE-DTW方法不僅利用了時間序列影像中全部可用的數(shù)據(jù),而且不需要進行時間序列重構等人工預處理操作,就能完成高精度的土地覆蓋制圖。
然而,當將LE-DTW方法用于作物種植結構識別時,也存在著不足。這主要是因為LE-DTW方法對時間序列影像中的每一個時相數(shù)據(jù)都賦予了相同的權重。而識別作物種植結構主要依賴于作物生長的物候特征差異,這種物候特征差異往往只體現(xiàn)在作物生長的幾個關鍵時期。因此,要提升作物種植結構識別精度,需要充分利用作物生長季的關鍵物候特征。本研究為實現(xiàn)高精度、自動化的作物種植結構識別,提出一種基于時相加權改進的LE-DTW方法——LE-wDTW(LE-weighted DTW)。該方法可用于任意傳感器的時間序列數(shù)據(jù),本文以Landsat 8數(shù)據(jù)為例。
本文以美國中部的主要農業(yè)種植區(qū)伊利諾伊州為研究區(qū)(圖1)。該州屬溫帶氣候,80%的土地為農業(yè)用地,夏季炎熱,冬季多雪。其地理位置位于:36°58¢N—42°30¢N、87°30¢W—91°30¢W。年平均降水,北部為800~1 200 mm,南部為1 200~1 600 mm。北部作物生長期為160 d,南部為210 d,主要種植作物為玉米和大豆等。
圖1 研究區(qū)位置示意圖(2017年6月27日Landsat8數(shù)據(jù))
1.2.1 Landsat 8數(shù)據(jù)
本研究所用的Landsat 8 OLI(operational land imager)數(shù)據(jù)從美國地質勘探局網(wǎng)站下載(http:// earthexplorer.usgs.gov/)。Landsat 8的重訪周期是16 d,每年可獲取22或23景影像。本研究中,下載使用了條帶號為Path 23/Row 32對應區(qū)域的2017年4月—10月Landsat 8 OLI L1T全部13景影像,每景影像的獲取日期及云覆蓋比例如圖2所示,不同時相影像包含不同程度的云覆蓋現(xiàn)象,影像大小為7 686×7 880 pixels。本研究使用空間分辨率為30 m的反射率波段1-7(包括海岸、藍、綠、紅、近紅外、短波紅外1和短波紅外2波段)和2個云掩膜文件。波段9由于對水汽吸收較敏感,故沒有使用[23]。所有影像數(shù)據(jù)通過系統(tǒng)的幾何校正和輻射校正,采用UTM-WGS84投影坐標系。
圖2 研究區(qū)2017年影像的獲取日期及云覆蓋比例
1.2.2 驗證數(shù)據(jù)
本研究選擇由美國農業(yè)部國家農業(yè)統(tǒng)計服務中心發(fā)布的2017年CDL(Cropland Data Layer)數(shù)據(jù)作為參考驗證數(shù)據(jù),該數(shù)據(jù)可從CDL網(wǎng)站下載(http:// nassgeodata.gmu.edu/CropScape/)[24-26]。每年的CDL數(shù)據(jù)均采用中高分辨率遙感影像結合大量地面數(shù)據(jù)通過無參監(jiān)督分類方法來完成,該數(shù)據(jù)對于主要作物類型的分類精度高達95%,已在很多研究中被用作監(jiān)督分類方法的訓練和驗證數(shù)據(jù)[16, 27]。CDL數(shù)據(jù)的空間分辨率為30 m,定義了110個土地覆蓋及作物類型,研究區(qū)主要土地覆蓋及作物類型(覆蓋面積大于2%)如下:玉米占41.92%,大豆占35.06%,建設用地占8.77%,落葉林占6.1%,草地占5.57%。
LE降維算法[22]起源于圖譜理論,通過保留局部流形結構來尋找高維數(shù)據(jù)的低維表達。對于遙感影像而言,其波段數(shù)量就是每個像元所在的原始特征空間維度。特征空間中的流形結構可以用近鄰圖來表達,每個像元都是一個圖結點,將它與特征空間中距離(通常是歐氏距離)最近的個結點連接起來,這種連接表達了像元間的相似性程度。LE算法通過圖拉普拉斯矩陣計算其特征向量作為原始數(shù)據(jù)降維后的結果。
LE-DTW方法是在原始特征空間中,用DTW度量[28]代替歐氏距離來為每個樣本尋找其個最近鄰點。對于時間序列遙感影像,在原始特征空間中,如果某像元的某個時相維度數(shù)據(jù)是無效的(例如,被云覆蓋),那么在降維前構建時間序列輸入數(shù)據(jù)時直接剔除即可,將其他全部有效數(shù)據(jù)保留。這就使得所構建的時間序列數(shù)據(jù)是不等長的,而DTW度量可以尋找到2個不等長時間序列間的最優(yōu)彎曲路徑,從而衡量出2個不等長時間序列的相似性程度。
標準的DTW度量在尋找2個時間序列間的最優(yōu)彎曲路徑時,對每個時相都賦予相同的權重,而不考慮路徑中每一步所對應2個時間序列在時相上的差異。對于作物分類而言,所依賴的物候特征與時相有密切的關系,相同時相下的物候差異才是用來區(qū)別不同類型作物的主要特征。因此,在用DTW計算2個時間序列間路徑的最小累積距離時,如果路徑對應的兩個時相一致或相近時,應賦予更小的權重,而當路徑對應兩個時相距離較遠時,則應賦予更大的權重。據(jù)此,本文提出一種加權版的LE-DTW算法(LE-wDTW)。
在LE-wDTW算法中,用加權DTW(wDTW)度量代替原始DTW距離來為每個樣本尋找其個最近鄰點。設時間序列和的時相長度分別為和:
時間序列和可以按序構成一個′的路徑矩陣,矩陣的每個元素()對應于點t和s的排列。計算wDTW距離時,在′的路徑矩陣中,t與s的距離如下計算:
式中(t,s)代表t與s的時相間隔,是一個經驗常數(shù),其取值范圍為[0, +μ],為時間序列中點,即作物整個生育期覆蓋天數(shù)的一半,本研究區(qū)作物整個生育期約為190天,故應為95 d。
其中用來控制函數(shù)曲率(斜率),通過試驗發(fā)現(xiàn),不同的值對函數(shù)曲率的影響包含以下4種情況:1)當=0時,所有時相的權重值相等,此時,LE-wDTW即為LE-DTW;2)當=0.03左右時,權重與時相間隔成正比,即Logistic model接近線性模型;3)當=0.10左右時,不同時相間隔對應“S”型權重模型,不同的值代表不同的“S”型彎曲程度,這也是本研究主要采用的權重計算模型;4)當 >3時,權重模型接近二值模型,即前一半時相間隔權值一致,后一半時相間隔權值一致。本研究中,不同值的權重計算模型如圖3所示。
在對原始數(shù)據(jù)完成降維之后,可以將降維后的數(shù)據(jù)直接輸入任意分類器完成最終作物種植結構提取。為了驗證LE-wDTW方法的效果,進行了一組定量分類試驗。為了更好體現(xiàn)出作物物候特征,將時間序列數(shù)據(jù)按波段-時相進行排列,即同一波段的所有時相數(shù)據(jù)排列在一起。試驗共選擇3種數(shù)據(jù)處理方法進行對比,分別為TI(Temporal Interpolation)、LE-DTW和LE-wDTW方法。其中,TI法,是直接對原始時間序列數(shù)據(jù)進行插值而不進行數(shù)據(jù)降維操作,將被云覆蓋的無效數(shù)據(jù)用前后相近時相的有效數(shù)據(jù)來代替,然后直接輸入分類器完成分類。LE-DTW和LE-wDTW方法則直接將原始時間序列數(shù)據(jù)中的無效數(shù)據(jù)剔除,保留全部有效數(shù)據(jù)進行降維,將降維后的數(shù)據(jù)輸入分類器完成分類。本試驗采用隨機森林分類器[29],樹分類器數(shù)量設置為500。
圖3 不同經驗值a下的Logistic model權重(時間序列中點b=95)
2.3.1 分類方法對比
所有試驗均采用相同的參數(shù)設置,訓練和測試數(shù)據(jù)分別從2017CDL數(shù)據(jù)中獲取。從各個類別中隨機選擇1%的CDL像素作為訓練數(shù)據(jù),其余數(shù)據(jù)進行測試。LE-DTW和LE-wDTW有2個共同參數(shù)需要設置:一個是為每個像元選擇最近鄰的數(shù)量,本試驗采用“圖生長”策略來自適應選擇,無需人工設置[30-31];另一個參數(shù)是降維后保留的波段數(shù)量,本試驗中降維后所有方法均保留10個波段,事實上,保留的波段數(shù)量大于類別數(shù)(本試驗類別數(shù)為5)就可以確保保留了足夠的有效信息[16]。對于LE-wDTW方法中計算權重所需的參數(shù),通過預試驗發(fā)現(xiàn),當=0.1和=95天時,有最好的全局精度,故分類試驗中按此參數(shù)設置。最后,計算每種方法分類結果的混淆矩陣,用總體分類精度、各類別分類精度和Kappa系數(shù)評價各方法的表現(xiàn)。
2.3.2 訓練數(shù)據(jù)敏感性分析
此外,為了驗證LE-wDTW方法對不同比例訓練數(shù)據(jù)的敏感程度,隨機選擇0.1%、0.3%、0.5%、0.7%,0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%和10%的CDL像素作為訓練數(shù)據(jù)分別進行試驗。為了確保結果的可靠性,所有試驗重復10次。
LE-wDTW方法應用于研究區(qū)的分類結果(訓練樣本比例為1%)如圖4b所示,對于分類結果分別用定性和定量的方法對其進行評價。
圖4 研究區(qū)3種數(shù)據(jù)處理方法結合隨機森林分類器的分類結果
3.1.1 局部分類圖對比
由于研究區(qū)覆蓋范圍較大,為了更好地對比分類結果,選擇2個局部區(qū)域進行展示。從圖4c、4d和4e可以看到該局部區(qū)域內,3種方法對于2種主要作物玉米和大豆的分類情況。通過目視分析,顯然,TI方法的分類結果中,玉米和大豆之間存在著較多的錯分和漏分情況,“椒鹽現(xiàn)象”明顯。LE-DTW方法的分類結果比TI方法要好,“椒鹽現(xiàn)象”有所改善。效果最好的是LE-wDTW方法,玉米和大豆交叉種植的塊狀特征明顯,符合實際種植情況。
從圖4f、4g和4h的分類對比圖可以看出,該局部區(qū)域除了主要作物玉米和大豆外,還分布有建設用地、牧草地和落葉林。通過目視判讀發(fā)現(xiàn),TI方法對于2種主要作物與牧草地和落葉林的區(qū)分程度較差,甚至于將部分牧草地和落葉林劃分到了建設用地類別中,出現(xiàn)明顯錯誤。而LE-DTW方法對于作物與牧草地和落葉林的區(qū)分效果較好,但是對于牧草地與落葉林二者之間的分類結果不如LE-wDTW方法。
3.1.2 分類精度對比
3種方法應用于整個研究區(qū)的總體分類精度、Kappa系數(shù)及各個類別的生產者精度和用戶精度如表1所示。從表中可以看到,整體分類精度最高的是LE-DTW方法,比TI和LE-DTW方法分別提高了9.05個百分點和3.45個百分點。不僅如此,與TI和LE-DTW相比,LE-wDTW方法在各個單一類別的分類精度上也是最高的。對于2種主要作物玉米和大豆而言,LE-wDTW方法的生產者精度比TI方法和LE-DTW方法分別提升8.61個百分點和3.44個百分點,用戶精度分別提升了6.19個百分點和3.02個百分點。對于其他占比較小的土地覆蓋類型而言,LE-wDTW方法分類精度的提升更加明顯,例如,建設用地類別的生產者精度比TI方法提高了15.94個百分點,比LE-DTW方法提高了6.30個百分點;所有占比較小類別中提升最低的是落葉林類別,其生產者精度提升了8.04個百分點和4.79個百分點,用戶精度提升幅度與生產者精度類似。
表1 三種數(shù)據(jù)處理方法結合隨機森林分類的總體分類精度和Kappa系數(shù)
Note: PA, Producer’s accuracy; UA, User’s accuracy.
分類精度通常與訓練數(shù)據(jù)集大小成正比,通過仔細選擇訓練樣本可以在不損失監(jiān)督分類精度的前提下減小訓練數(shù)據(jù)集的大小。由于光譜降維技術在變換高維數(shù)據(jù)到低維空間的過程中,會最大化保留有用信息并且最小化噪聲,因此,一種理想的降維方法應該是使用較少的訓練數(shù)據(jù)就能完成較高的分類精度。
圖5展示了LE-DTW方法和LE-wDTW方法應用于Landsat時間序列數(shù)據(jù)時,選擇不同比例訓練樣本完成的整體分類精度情況。從圖5可以看到,LE-wDTW方法的整體分類精度均值始終高于LE-DTW方法。并且,當LE-DTW和LE-wDTW方法在訓練樣本比例分別達到3%和2%時,整體分類精度趨于穩(wěn)定,這一點上,LE-wDTW優(yōu)于LE-DTW。此外,每個訓練樣本比例分類試驗重復10次,通過其標準差可以看到,當訓練樣本比例高于1%時,2種方法的正負標準差均在1%以下,最大標準差出現(xiàn)在訓練樣本比例最低(0.1%)時,LE-DTW方法的負標準差為2.8%。結果表明,LE-wDTW方法應用于時間序列遙感影像的作物分類時,比LE-DTW方法表現(xiàn)更好。
圖5 不同比例訓練樣本的分類精度
本文提出了一種加權LE-DTW方法,稱為LE-wDTW,用于作物種植結構提取,并與時相插值法和原始LE-DTW法進行對比試驗。結果表明,2種基于非線性光譜降維的作物分類方法,其精度均高于未降維的時相插值法,這與以往的研究結果一致[16,19],可能的原因如下:1)時間序列數(shù)據(jù)存在數(shù)據(jù)冗余,降維技術可以有效避免“休斯現(xiàn)象”[32]。2)時相插值法并不能增加有效的數(shù)據(jù)信息,反而會因為這種“預測”而帶來新的誤差。3)衛(wèi)星影像時間序列數(shù)據(jù)存在內在的非線性特征,使用非線性降維方法可以在減少數(shù)據(jù)冗余的同時保留適合于分類的屬性特征。
與LE-DTW方法相比,LE-wDTW方法完成了更高的分類精度。這說明在充分利用時間序列遙感影像中全部有效數(shù)據(jù)的前提下,LE-wDTW方法更好地挖掘并使用了作物的物候特征。一方面,適合用于分類的物候特征應該是在相同時相下,不同作物生長狀態(tài)的差異特征,尋找這種差異特征往往需要依賴較多的人工干預,這意味著所建立的分類模型不僅難以自動化,而且也難以移植到其他地區(qū)。LE-wDTW方法是基于統(tǒng)計學理論結合機器學習方法而建立的自動化作物種植結構提取模型,使用wDTW度量可以更好地強化這種相同時相下的物候特征差異,該方法不需要人工干預,就可以完成高精度的作物分類制圖。另一方面,除了研究區(qū)主要作物玉米和大豆外,還有占比較小的落葉林、建設用地和牧草地等土地覆蓋類型,通過試驗可以發(fā)現(xiàn),對于這些占比較小的類型,LE-wDTW方法也獲得較高的精度,這說明該方法對于小樣本類別也有較好的適用性,這符合機器學習方法的特點。此外,算法對訓練樣本的敏感性試驗表明,LE-wDTW算法只需要較少的訓練樣本就能獲得穩(wěn)定的分類精度,這對于作物分類研究意義重大,因為獲取較多的訓練樣本是一項需要消耗大量人力和物力的工作。
本研究也存在一些不足之處,在今后研究中有待加以改進。LE-wDTW算法的復雜度較高,尤其是隨著空間維度的增加,計算量會迅速增長。因此,當將本文方法用于更大尺度研究,例如全球尺度作物分類時,如何提升計算效率是一個待解決的問題。事實上,這個問題存在于大部分的流形學習降維算法中,已經成為流形學習的一個研究方向。雖然已經有研究者提出多種解決方案,例如使用Landmark points策略[33],或者增強Graphics Processing Unit (GPU)的運算能力[34]等,但是如何與本文方法相結合,仍有待進一步研究。
本文以作物全生育期Landsat 8時間序列遙感影像為數(shù)據(jù)源,改進了基于流形學習的特征提取方法,形成了一種結合物候特征的時間序列光譜降維算法——LE-wDTW,結合隨機森林分類器,提取了美國伊利諾伊州主要作物的種植結構信息。
1)采用2種非線性光譜降維方法對研究區(qū)作物分類,取得了較高的分類精度,總體精度都優(yōu)于81.92%,其中LE-wDTW方法總體精度達到85.37%,比傳統(tǒng)的時相插值法提升9.05個百分點。這說明時間序列遙感數(shù)據(jù)存在著數(shù)據(jù)冗余,在進行分類前需要進行光譜降維處理。
2)LE-wDTW方法在度量時間序列數(shù)據(jù)點間的相似性時,對于時相上相近的物候特征賦予了不同權重,獲得了比賦予相同權重的LE-DTW方法更高的分類精度。這表明對于作物分類而言,相同時相的物候差異特征對于區(qū)分不同作物起著至關重要的作用。因此,LE-wDTW方法更適合于作物分類。
3)LE-wDTW方法不需要人工干預,只需要較少的訓練樣本,就可以獲得較高并且穩(wěn)定的分類精度,將其應用于不同尺度的作物分類有很大的潛力。
[1] United Nations. World Population Prospects: The 2017 Revision. Key Findings and Advance Tables[R]. 2017.
[2] Gong Peng, Wang Jie, Yu Le, et al. Finer resolution observation and monitoring of global land cover: First mapping results with Landsat TM and ETM+ data[J]. International Journal of Remote Sensing, 2013, 34(7): 2607-2654.
[3] 陳仲新,任建強,唐華俊,等. 農業(yè)遙感研究應用進展與展望[J]. 遙感學報,2016,20(5):748-767. Chen Zhongxin, Ren Jianqiang, Tang Huajun, et al. Progress and perspectives on agricultural remote sensing research and applications in China[J]. Journal of Remote Sensing, 2016, 20(5): 748-767. (in Chinese with English abstract)
[4] Maxwell A E, Warner T A, Fang F. Implementation of machine-learning classification in remote sensing: an applied review[J]. International Journal of Remote Sensing, 2018, 39(9): 2784-2817.
[5] Xiong J, ThenkabailP S, Gumma M K, et al. Automated cropland mapping of continental Africa using Google Earth Engine cloud computing[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 126: 225-244.
[6] Yan Li, Roy D P. Automated crop field extraction from multi-temporal Web Enabled Landsat Data[J]. Remote Sensing of Environment, 2014, 144: 42-64.
[7] 郝鵬宇,牛錚,王力,等. 基于歷史時序植被指數(shù)庫的多源數(shù)據(jù)作物面積自動提取方法[J]. 農業(yè)工程學報,2012,28(23):123-131. Hao Pengyu, Niu Zheng, Wang Li, et al. Multi-source automatic crop pattern mapping based on historical vegetation index profiles[J]. Transactions of the Chinese Society of Agricultral Engineering (Transactions of the CSAE), 2012,28(23): 123-131. (in Chinese with English abstract)
[8] Gómez C, White J C, WulderM A. Optical remotely sensed time series data for land cover classification: A review[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2016, 116: 55-72.
[9] Victor Maus, Gilberto Camara, Ricardo Cartaxo, et al. A time-weighted dynamic time warping method for land-use and land-cover mapping[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2016, 9(8): 3729-3739.
[10] Cornelius Senf, Pedro J Leit?o, Dirk Pflugmacher, et al. Mapping land cover in complex Mediterranean landscapes using Landsat: Improved classification accuracies from integrating multi-seasonal and synthetic imagery[J]. Remote Sensing of Environment, 2015, 156: 527-536.
[11] Hannes Müller, Philippe Rufin, Patrick Griffiths, et al. Mining dense Landsat time series for separating cropland and pasture in a heterogeneous Brazilian savanna landscape[J]. Remote Sensing of Environment, 2015, 156: 490-499.
[12] Fran?ois Waldner, Guadalupe Sepulcre Canto, Pierre Defourny. Automated annual cropland mapping using knowledge-based temporal features[J]. Isprs Journal of Photogrammetry & Remote Sensing, 2015, 110: 1-13.
[13] Andrew P Tewkesbury, Alexis J Comber, Nicholas J Tate, et al. A critical synthesis of remotely sensed optical image change detection techniques[J]. Remote Sensing of Environment, 2015, 160: 1-14.
[14] L?w F, Michel U, Dech S, et al. Impact of feature selection on the accuracy and spatial uncertainty of per-field crop classification using support vector machines[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 85: 102-119.
[15] Ludmila I Kuncheva, William J Faithfull. PCA feature extraction for change detection in multidimensional unlabeled data[J]. IEEE Transactions on Neural Networks and Learning Systems, 2014, 25(1): 69-80.
[16] Yan Li, Roy D P. Improved time series land cover classification by missing-observation-adaptive nonlinear dimensionality reduction[J]. Remote Sensing of Environment, 2015, 158: 478-491.
[17] Crystal Schaaf, Feng Gao, Alan H Strahler, et al. First operational BRDF, albedo nadir reflectance products from MODIS[J]. Remote Sensing of Environment, 2002, 83(1): 135-148.
[18] Ben Somers, Kenneth Cools, Stephanie Delalieux, et al. Nonlinear hyperspectral mixture analysis for tree cover estimates in orchards[J]. Remote Sensing of Environment, 2009, 113(6): 1183-1193.
[19] Zhai Yongguang, Qu Zhongyi, Hao Lei. Land cover classification using integrated spectral, temporal, and spatial features derived from remotely sensed images[J]. Remote Sensing, 2018, 10(3): 383.
[20] Bachmann C M, Ainsworth T L, Fusina R A. Exploiting manifold geometry in hyperspectral imagery[J]. IEEE Transactions on Geoscience & Remote Sensing, 2005, 43(3): 441-454.
[21] Zhang Liangpei, Zhang Lefei, Tao Dacheng, et al. Tensor discriminative locality alignment for hyperspectral image spectral–spatial feature extraction[J]. IEEE Transactions on Geoscience & Remote Sensing, 2012, 51(1): 242-256.
[22] Tenenbaum J B, Silva V De, Langford J C. A global geometric framework for nonlinear dimensionality reduction[J]. Science, 2000, 290(5500): 2319-2323.
[23] Roy D P, Wulder M A, Loveland T R, et al. Landsat-8: Science and product vision for terrestrial global change research[J]. Remote Sensing of Environment, 2014, 145(145): 154-172.
[24] ClaireBoryan, Yang Zhengwei, RickMueller, et al. Monitoring US agriculture: The US Department of Agriculture, National Agricultural Statistics Service, Cropland Data Layer Program[J]. Geocarto International, 2011, 26(5): 341-358.
[25] Hansen M C, Egorov Alexey, Potapov P V, et al. Monitoring conterminous United States (CONUS) land cover change with web-enabled Landsat data (WELD)[J]. Remote sensing of Environment, 2014, 140: 466-484.
[26] Han Weiguo, Yang Zhengwei, Di Liping, et al. CropScape: A Web service based application for exploring and disseminating US conterminous geospatial cropland data products for decision support[J]. Computers & Electronics in Agriculture, 2012, 84(11): 111-123.
[27] David Johnson. A 2010 map estimate of annually tilled cropland within the conterminous United States[J]. Agricultural Systems, 2013, 114(114): 95-105.
[28] Berndt D J. Using dynamic time warping to find patterns in time series[C]// in KDD Workshop, 1994:359-370.
[29] Leo Breiman. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[30] Zhai Yongguang, Zhang Lifu, Wang Nan, et al. A modified locality-preserving projection approach for hyperspectral image classification[J]. IEEE Geoscience & Remote Sensing Letters, 2017, 13(8): 1059-1063.
[31] 翟涌光. 綜合時空譜多維遙感特征的作物精細分類方法研究[D]. 北京:中國科學院大學,2017. Zhai Yongguang. Detailed Crop Classification using Integrated Spectral, Temporal and Spatial Features Derived from Remotely Sensed Images[D]. Beijing: University of Chinese Academy of Sciences, 2017. (in Chinese with English abstract)
[32] Gordon Hughes. On the mean accuracy of statistical pattern recognizers[J]. IEEE Transactions on Information Theory, 1968, 14(1): 55-63.
[33] Silva V D, Tenenbaum J B. Global versus local methods in nonlinear dimensionality reduction[C]// in International Conference on Neural Information Processing Systems, 2002: 721-728.
[34] Bachmann C M, Ainsworth T L, Fusina R A, et al. Manifold coordinate representations of hyperspectral imagery: Improvements in algorithm performance and computational efficiency[C]// in Geoscience and Remote Sensing Symposium, 2010: 4244-4247.
Crop classification based on nonlinear dimensionality reduction using time series remote sensing images
Zhai Yongguang1,2, Qu Zhongyi1※
(1.010018,; 2.100101,)
Compared with the traditional method of ground statistics, remote sensing technology has the unique advantages of high efficiency, fast speed and high precision. It is suitable for agricultural monitoring, especially the time series remote sensing data can provide spectral information covering the whole growing season of crops. At present, most of the crop classification methods based on time series remote sensing data need many expert knowledge and manual intervention, which are difficult to automate and transplant to other areas. The application of dimensionality reduction (DR) technique to time series remote sensing image analysis can solve this problem efficiently. The imaging process of remote sensing image will experience multiple scattering between different scene components. This scattering is influenced by many factors such as wavelength, observation angle, illumination condition, and three-dimensional structure of scene component. Therefore, the remote sensing image has inherent nonlinear characteristics, and the nonlinear DR technology is more suitable for remote sensing images. The nonlinear spectral DR method has been successfully applied to hyperspectral data and obtained better results than linear DR methods. However, the nonlinear DR method cannot make full use of the temporal information in time series remote sensing images. In this study, a nonlinear DR algorithm, Laplacian Eigenmaps (LE), is refined for crop classification in time series remote sensing images. This method emphasizes the phenological characteristics difference of different crop growing seasons. In the refined LE algorithm, the dynamic time warping (DTW) measurement with different weight value is used to calculate the similarity between the time series. If the two phases of the calculated path are consistent or close, a smaller weight should be given, and a greater weight should be given when the two phases correspond to the path are far away. In addition, the refined LE method can be applied to time series data with unequal length and reduce the preprocessing operation of time series data. Moreover, the proposed method is simple to run and only requires two input parameters. One is the midpoint of time series, and the other is the number of retained bands after DR. Both two parameters are easily to obtain. The refined LE algorithm is applied to the Landsat time series images of the whole growing season of crops in Illinois, USA. A series of classification experiments based on the training data provided by the United States Department of Agriculture National Agricultural Statistics Services Cropland Data Layer (CDL) are completed and compared with the traditional interpolation method without DR and the LE-DTW method proposed for land cover classification. The experimental results show that the refined LE DR method has completed a higher classification accuracy and per-class accuracy than other methods. And the overall classification accuracy of the proposed method reaches 85.37%, which is 9.05 and 3.45 percentage points higher than that of temporal interpolation (TI) method and LE-DTW method respectively. And the method can achieve a given degree of classification accuracy with only a small number of training samples. When the proportion of training samples is higher than 1%, the positive and negative standard deviations of the proposed method is below 1%. The overall classification accuracy of the proposed method tends to be stable when the proportion of training samples reaches 2%. The refined LE dimensionality reduction method is an automatic method and can be directly applied to other research areas without manual intervention. It provides an effective method for crop identification and extraction on different scales in the future.
remote sensing; data processing; crops; classification; nonlinear spectral dimensionality reduction; time series; dynamic time warping
10.11975/j.issn.1002-6819.2018.19.023
TP79
A
1002-6819(2018)-19-0177-07
2018-05-17
2018-07-21
內蒙古農業(yè)大學高層次人才科研啟動金項目(NDYBH2017-2);內蒙古自然科學基金項目(2018BS04001);“十三五”國家重點研發(fā)計劃項目(2016YFC0501301);國家自然科學基金項目(51779117)資助
翟涌光,內蒙古呼倫貝爾人,講師,博士,研究方向:農業(yè)遙感。Email: ychia@imau.edu.cn
屈忠義,內蒙古巴彥淖爾人,教授,博導,研究方向:區(qū)域灌溉排水。Email: quzhongyi@imau.edu.cn
翟涌光,屈忠義. 基于非線性降維時序遙感影像的作物分類[J]. 農業(yè)工程學報,2018,34(19):177-183. doi:10.11975/j.issn.1002-6819.2018.19.023 http://www.tcsae.org
Zhai Yongguang, Qu Zhongyi. Crop classification based on nonlinear dimensionality reduction using time series remote sensing images[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(19): 177-183. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2018.19.023 http://www.tcsae.org