趙搏華,王秀茹?,閻世煜,張羽飛,張 婷
(1.北京林業(yè)大學水土保持學院, 100083, 北京; 2.大連科技學院, 116052, 遼寧大連)
水土保持監(jiān)測的目的是為掌握生產(chǎn)建設項目建設過程中的水土流失程度、危害、發(fā)展規(guī)律及水土保持效果。近年來,無人機遙感影像進行自動分類技術越來越多地應用在水土保持監(jiān)測領域,而主流的自動分類方法是面向?qū)ο蠓诸惙?。不少學者們研究發(fā)現(xiàn),該方法與遙感數(shù)據(jù)結(jié)合可以滿足不同行業(yè)的測算需求。如王枚梅等[1]基于面向?qū)ο蠓椒ㄌ崛喐呱结樔~林的參數(shù),得到高效、可靠的無人機遙感影像分類結(jié)果。李夢華等[2]和唐磊[3]研究基于面向?qū)ο蠓诸悓μ萏镞b感影像自動提取,可以準確地獲得梯田及空間分布等相關信息。還有學者基于厘米級無人機影像應用面向?qū)ο蠓椒╗4],對黑土區(qū)的壟臺壟溝等線性水土保持措施進行自動識別,結(jié)果表明該方法基本可實現(xiàn)對黑土區(qū)水土保持措施的精準識別。同時也有學者對比不同的面向?qū)ο蠓诸惙椒ǖ膽?,如毛雙雙[5]研究高峰林場面向?qū)ο蠓诸惡蟮淖兓瘷z測,結(jié)果表明決策樹分類法優(yōu)于最鄰近分類法,精度更高。鄔亞娟等[6]研究Cart決策樹、C4.5決策樹、KNN、SVM 4種分類方法在干旱半干旱地區(qū)植被面向?qū)ο蟮姆诸惥?,結(jié)果表明基于決策樹的分類精度高于KNN、SVM算法。也有學者通過鄰近、K-最鄰近、決策樹、支持向量機和隨機森林5種方法提取凍土熱融滑塌邊界的性能和精度[7],得出SVM方法的Kappa系數(shù)高于其他4種分類方法,更適合無人機遙感影像凍土熱融滑塌邊界的提取。所以,研究不同面向?qū)ο蠓诸惙椒ǖ膽?,對遙感影像分類具有重要意義。目前,面向?qū)ο蠓诸惙ㄔ谒帘3执胧┲械膽弥饕性谥脖缓吞萏锏?,而在水土保持監(jiān)測中措施的應用較少,且通過比較多種方法,探索不同分類方法在水土保持監(jiān)測中措施分類效果的研究也較少。因此,筆者采用5種面向?qū)ο蟮姆诸惙椒▽ιa(chǎn)建設項目中水土保持措施參數(shù)提取,分析影像分類方法的精度,以期為高效率地開展水土保持監(jiān)測提供參考依據(jù),完善無人機在水土保持監(jiān)測中的應用體系。
2022年冬奧會延慶賽區(qū)雪車雪橇中心場地位于賽區(qū)核心區(qū)南區(qū)中部山脊之上,場地西側(cè)緊鄰西大莊科村,南側(cè)鄰改線后的松閆路,北靠山麓,東側(cè)隔山谷是延慶冬奧村。項目主要建設內(nèi)容包括場館設施、配套設施、賽道工程等。占地總面積18.69 hm2。目前主體工程基本竣工。
延慶區(qū)的地勢東高西低,中部凹陷形成山間盆地。區(qū)內(nèi)山脈海拔700~1 000 m。項目地處延慶區(qū)西北部,北部鄰海坨山主峰,最高海拔2 190 m,以中山峽谷地貌為主,屬暖溫帶大陸性季風氣候區(qū)。
筆者采用大疆精靈4無人機,搭載FC330鏡頭用來數(shù)據(jù)采集,影像分辨率為4 000×2 250,拍攝時間為2018年6月。航拍飛行高度為321 m,采用GPS/GLONASS雙模衛(wèi)星定位模塊[8],航向重疊度和旁向重疊度均為80%,共獲取正射影像125幅。采用光盤作為標記[9],在研究區(qū)內(nèi)布設控制點和檢查點。
研究主要采用Photoscan軟件[10],經(jīng)過初步處理、點云加密,后生成正射影像圖,為導入eCognition軟件進行處理提供數(shù)據(jù)支持。研究參與分類的波段有藍波段、綠波段、紅波段和近紅外波段4種。
經(jīng)過文獻查閱和野外勘測,根據(jù)研究區(qū)的水土保持措施的種類和分布特點,將研究區(qū)劃分為2個片區(qū),第一片區(qū)分為5類:植被、臨時苫蓋措施(裸土)、工程措施編織袋裝表土和擋墻、裸地及其他。第二片區(qū)分為6類:植被、臨時苫蓋措施(裸土)、臨時苫蓋措施(植被)、工程措施排水溝和框格護坡、裸地及其他。
本研究使用多尺度分割算法來實現(xiàn)影像分割。因為梁林林等[7]認為影像分割會對影像分類有一定的影響,故設置初始尺度為20,形狀因子為0.1,緊致度因子為0.5,通過尺度優(yōu)化工具ESP 2[11]進行初步尺度參數(shù)的選擇。仍存在分割不到位的現(xiàn)象,后結(jié)合目視解譯試驗確定分割尺度分別為92和56時,水土保持措施真實性更強,措施邊界更完整。
筆者選擇面向?qū)ο蠓诸惣夹g中常用的隸屬度函數(shù)、最鄰近、決策樹、支持向量機、隨機森林5種分類方法,并使用驗證樣本數(shù)據(jù)對分類結(jié)果進行評價。
參數(shù)選擇方面,隸屬度函數(shù)(membership function)分類需通過不斷調(diào)整類別范圍來確定某一地物的最優(yōu)閾值范圍,再判斷該地類的適用變化曲線[12]為準確的閾值。
最鄰近分類法(nearest neighbor, NN)是將每一個影像對象按照對應的對象特征尋找與其最鄰近的樣本匹配,最終完成分類的過程[13]。所以該方法需要在原始影像中為不同類型均勻地選擇具有典型特征信息的樣本。
Cart決策樹(classification and regression tree)是由 Breiman 等提出的一種決策樹構(gòu)建方法[14],本文結(jié)合相關文獻選用5作為第一片區(qū)depth值,0為第二片區(qū)depth值。
SVM分類法,綜合考慮本研究的樣本數(shù)量大小,采用線性核函數(shù)進行分類。C(懲罰系數(shù))是對誤差的寬容度,研究選擇懲罰系數(shù)為2。
隨機森林(random forest)分類方法由Breiman Leo與Adele Cutler于2001年提出的一種機器學習算法[15]。根據(jù)相關文獻結(jié)合研究區(qū)內(nèi)具體措施選擇決策樹的數(shù)量為1 000,分類特征總數(shù)為16。
根據(jù)提取的訓練樣本對象的光譜、紋理和空間特征指標[16]對樣本進行精確選擇。
采用總體精度、Kappa系數(shù)、生產(chǎn)者精度(Producer accuracy,PA),3個指標來定量評價5種分類方法的分類結(jié)果。其中,總體精度和Kappa系數(shù)(根據(jù)Kappa系數(shù)精度判別標準,0.6~0.8為分類精度較好,>0.8~1.0為分類精度極好)用于比較整體分類精度,生產(chǎn)者精度用于評價特定地類的分類精度[17]。
水土保持措施總體分類精度見表1,在第一片區(qū),水土保持措施較少,分布較集中時,SVM分類法效果最好,總體精度為86.13%。其他分類方法總體精度大小關系為:隸屬度函數(shù)(85.64%)>最鄰近分類法(85.43%)>Cart決策樹(84.43%)>隨機森林分類法(84.22%)。在第二片區(qū),水土保持措施較多,分布交錯時,SVM分類法效果也最好,其總體精度為62.34%。其他分類方法總體精度大小關系為:最鄰近分類法(61.59%)>隨機森林總體精度為(60.02%)>Cart決策樹分類法(59.90%)>隸屬度函數(shù)分類(58.84%)。從分類精度分析,第一片區(qū)高于第二片區(qū),而兩者的Kappa系數(shù)均>0.69,最高達到0.81。所以,5種方法在2個片區(qū)都得較好的分類效果。
表1 各分類法的總體精度和Kappa系數(shù)對比Tab.1 Comparison of overall accuracy and Kappa coefficient of each classification method
從表2對各水土保持措施精度對比分析可知,2個片區(qū)的植被分類效果都很好,而SVM分類法比其他4種分類法精度更高,生產(chǎn)者精度分別為96.00%和93.25%。第一片區(qū)的臨時苫蓋措施(裸土)分類效果較好的也是SVM分類法,生產(chǎn)者精度為80.0%;而第二片區(qū)的臨時苫蓋措施(裸土)分類結(jié)果較好的是最鄰近分類法,其生產(chǎn)者分類精度為73.94%。臨時苫蓋措施(植物)分類較好的是最鄰近分類法,生產(chǎn)者分類精度為76.23%。工程措施中,編織袋裝表土和排水溝分類精度較高的方法是SVM分類法,生產(chǎn)者精度分別為81.51%和70.34%;擋墻的5種分類方法分類效果差異較小,其中較高的生產(chǎn)者精度為71.42%;框格護坡分類精度較高的分類方法是最鄰近分類法,生產(chǎn)者分類精度為66.37%。
表2 各分類方法對水土保持措施的精度評價Tab.2 Accuracy evaluation of classification methods to soil and water conservation %
2個片區(qū)原始影像如圖1和圖2,5種分類方法分類結(jié)果如圖3和圖4所示。
圖1 第一片區(qū)原始影像Fig.1 Original image of the first area
圖2 第二片區(qū)原始影像Fig.2 Original image of the second area
圖3 第一片區(qū)分類方法分類結(jié)果圖Fig.3 Classification result graphs by classification methods for the first area
圖4 第二片區(qū)分類方法分類結(jié)果圖Fig.4 Classification result graphs by classification methods for the second area
第一片區(qū)的Kappa系數(shù)均在0.8左右,第二片區(qū)的Kappa系數(shù)均在0.7左右,5種方法的Kappa系數(shù)都>0.69,各方法都得到了較好的分類效果。其中,第一片區(qū)的總體精度均高于第二片區(qū)的總體精度??赡苡捎诘谝黄瑓^(qū)水土保持措施種類的光譜特征差異明顯,且措施面積比例大,易提取。而第二片區(qū)的多種水土保持措施交錯分布,且措施的特征信息差異較小,所以對分類精度有影響。其中,該片區(qū)的隸屬度函數(shù)、Cart決策樹和隨機森林分類法分類效果較差。可能因為框格護坡與排水溝的光譜特征較為相似,不易區(qū)分。且隸屬度函數(shù)的閾值范圍難確定,工作量較大,耗時長。所以使用隸屬度函數(shù)、Cart決策樹和隨機森林分類法方法時,較適用在措施種類少、措施光譜特征差異顯著的研究區(qū)。
2個片區(qū)中植被的分類效果顯著,生產(chǎn)者精度均>90%。其中精度較高的是SVM分類法,與林卉等[12]研究的植被分類結(jié)果相近??赡芤驗橹脖焕脷w一化植被指數(shù)和較多的樣本數(shù)量,可以高效完成植被的分類。在水土保持措施分布較集中時,臨時苫蓋措施(裸土)運用SVM分類法分類的效果良好;在水土保持措施種類多樣,分布錯雜時,最鄰近分類法的效果較好。臨時苫蓋措施(植物)里分類精度較高的方法是最鄰近分類法。工程措施中編織袋裝表土和排水溝分類時采用SVM分類法效果良好??蚋褡o坡分類時最鄰近分類法的精度較高。另外,擋墻的5種分類方法分類精度差異較小,建議分類時使用操作簡便,速度更快的最鄰近分類法。
綜上,SVM分類法在2個片區(qū)的Kappa系數(shù)分別為0.81和0.72,均高于其他4種方法。所以SVM方法更適合該研究區(qū)水土保持措施的分類。