陳巡 鐘鳳媛 劉雅鑫 鄭夢婷
摘? 要:在基于高光譜航空影像進(jìn)行單木樹冠分割和分類的過程中,需要選擇合理的技術(shù)方案對影像分割的結(jié)果進(jìn)行精度評價?;谑褂肁rcGIS中的空間數(shù)據(jù)處理工具和ModelBuilder建模工具進(jìn)行數(shù)據(jù)處理與分析運算,結(jié)合Jaccard相似系數(shù),計算影像分割得到的圖斑柵格數(shù)據(jù)與真實地面驗證數(shù)據(jù)的匹配度;基于ModelBuilder的方法整合了多個空間數(shù)據(jù)處理和統(tǒng)計分析工具,得出了Jaccard系數(shù),高效地完成了對影像分割結(jié)果的精度評價。
關(guān)鍵詞:Jaccard系數(shù);高分辨率遙感影像;影像分割;多邊形相似度;分割結(jié)果精度評價
中圖分類號:TP273.4? ? ? ? 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2021)02-0066-05
Abstract:In the process of single tree crown segmentation and classification based on hyperspectral aerial image,it is necessary to select a reasonable technical scheme to evaluate the accuracy of image segmentation results. Based on the spatial data processing tools in ArcGIS and ModelBuilder modeling tools for data processing and analysis,combined with Jaccard similarity coefficient,the matching degree of image segmentation and raster data and real ground verification data was calculated. The method based on ModelBuilder integrates multiple spatial data processing and statistical analysis tools,obtains the Jaccard coefficient,and efficiently completes the precision evaluation of image segmentation results.
Keywords:Jaccard coefficient;high resolution remote sensing image;image segmentation;polygon similarity;accuracy evaluation of segmentation results
0? 引? 言
傳統(tǒng)的森林資源調(diào)查和管理工作,主要通過實地調(diào)查及林相圖輔助等方法來完成,這種方式不僅消耗大量的人力和物力,而且更新困難、準(zhǔn)確率較低。遙感、地理信息系統(tǒng)和全球定位技術(shù)的出現(xiàn),為森林資源調(diào)查和森林參數(shù)的測定提供了更高效、更便捷、更準(zhǔn)確的研究方法。遙感分類在單木樹種識別中有突出的成效,其不僅具有完整的光譜信息,還包括了大量的紋理、形狀、位置等空間幾何信息,對于樹種區(qū)分提供了更高效、更精準(zhǔn)、更便捷的研究方法。
在對單木樹種進(jìn)行識別時,從影像中將單木樹冠分割出來是關(guān)鍵的一步。而且,單木樹冠分割精度情況會影響后續(xù)的樹種分類識別精度。國外學(xué)者Yasnoff等針對圖像分割提出相應(yīng)的評價方法和指標(biāo),是最早開始研究客觀評價方法的一批學(xué)者。20世紀(jì)90年代后,我國學(xué)者才開始陸續(xù)關(guān)注分割算法的性能評價?,F(xiàn)在,圖像質(zhì)量分割評價準(zhǔn)則分為三部分:基于邊緣的評價準(zhǔn)則、基于像素點對的評價準(zhǔn)則和基于區(qū)域的評價準(zhǔn)則,使得評價準(zhǔn)則更系統(tǒng)化。
單木樹冠分割結(jié)果為圖斑數(shù)據(jù),即幾何要素為多邊形要素,而且樹冠的邊緣具有動態(tài)性和模糊性,因此,基于區(qū)域的評價準(zhǔn)則符合單木樹冠分割的評價要求。同時,影像分割后得到的圖斑數(shù)據(jù)量往往十分巨大,高效準(zhǔn)確的完成精度計算十分重要?;诖?,本文使用ArcGIS中的空間數(shù)據(jù)處理工具和ModelBuilder建模工具,并用Jaccard相似系數(shù)作為標(biāo)準(zhǔn)對由高光譜影像進(jìn)行單木樹冠分割的圖斑數(shù)據(jù)進(jìn)行分割精度評價。
1? 研究方法
1.1? 數(shù)據(jù)介紹
使用遙感影像進(jìn)行樹冠分割的結(jié)果數(shù)據(jù)為柵格數(shù)據(jù),像元值為浮點型。不同的像元值表示不同的樹冠,實地調(diào)查數(shù)據(jù)為矢量多邊形數(shù)據(jù),數(shù)據(jù)格式為Shapefile,示例圖如圖1所示。取值均為整數(shù)編號,樹冠的數(shù)量取值范圍0~328。
1.2? 相似性計算方法
影像分割的結(jié)果為面狀數(shù)據(jù),評價結(jié)果精度需要對面狀圖斑與實地驗證數(shù)據(jù)的相似程度進(jìn)行比較。比較面狀數(shù)據(jù)相似程度時,常見的思路一種是對面要素的多邊形邊界進(jìn)行比較,另一種是對面要素重合的面積多少進(jìn)行比較。因為我們的研究對象是樹冠,精度的要求主要是位置和對應(yīng)的樹冠重合度,而對邊界的要求不是很高。這里考慮使用對面積重合度評價的方法。Jaccard相似系數(shù)就是一種很好的可以用于圖斑相似度評價的方法。以下是Jaccard相似系數(shù)的相關(guān)介紹:
Jaccard index,又稱為Jaccard相似系數(shù)(Jaccard similarity coefficient)用于比較有限樣本集之間的相似性與差異性。Jaccard系數(shù)值越大,樣本相似度越高。給定兩個集合A、B,Jaccard系數(shù)定義為A與B交集的大小和A與B并集的大小的比值,計算公式如式(1)所示:
當(dāng)集合A,B都為空時,J(A,B)定義為式(1)。
精度評價中使用的分割結(jié)果圖斑數(shù)據(jù)集和實地驗證數(shù)據(jù)集就相當(dāng)于是兩個不同的集合。通過計算分割結(jié)果圖斑數(shù)據(jù)和真實的地面驗證數(shù)據(jù)的交集和并集,可以將Jaccard系數(shù)計算出來,這個系數(shù)越接近于1,表明分割結(jié)果與真實數(shù)據(jù)相似度越高,也就是分割的單木樹冠精度越高。
1.3? 數(shù)據(jù)處理方法
利用ArcGIS地理信息系統(tǒng)平臺軟件,創(chuàng)建和使用地圖,根據(jù)項目需求對地理數(shù)據(jù)進(jìn)行相應(yīng)的管理和編輯,做到對地理信息的分析、共享和顯示處理。本次研究,利用ArcToolbox中處理柵格數(shù)據(jù)、矢量數(shù)據(jù)的工具,建立起圖斑相似度的ModelBuilder模型。ModelBuilder即模型構(gòu)建器,用來創(chuàng)建、編輯和管理模型的應(yīng)用程序,有助于構(gòu)造和執(zhí)行簡單工作流,能通過創(chuàng)建模型并將其共享為工具來提供擴(kuò)展ArcGIS功能的高級方法。ArcToolbox集成ArcGIS幾乎所有的數(shù)據(jù)管理和空間分析工具,能夠幫助我們更高效的處理數(shù)據(jù)。
為了批量的計算影像分割結(jié)果圖斑與實地調(diào)查的矢量多邊形的Jaccard相似系數(shù),高效完成圖斑數(shù)據(jù)精度評價,需要將ArcToolbox中的相關(guān)工具組織起來,在ModelBuilder中建立起數(shù)據(jù)處理和分析的工作流。在計算Jaccaard相似系數(shù)時,需要集合A(分類結(jié)果圖斑數(shù)據(jù))與集合B(實地調(diào)查的矢量多邊形數(shù)據(jù))的面積及其相交面積,最后通過Jaccard公式計算出Jaccard系數(shù)值,Jaccard系數(shù)值越大,則相似度越高。
1.3.1? 圖斑數(shù)據(jù)預(yù)處理
由于分類結(jié)果圖斑中的數(shù)據(jù)多數(shù)是柵格數(shù)據(jù),且數(shù)據(jù)類型為浮點型,在ArcGIS中不能直接進(jìn)行運算,所以我們需要通過一定步驟將柵格文件轉(zhuǎn)換為矢量文件。這一步驟需要用到ArcToolbox中的Copy Raster工具(柵格數(shù)據(jù)集副本),Raster to Polygon工具(將柵格數(shù)據(jù)轉(zhuǎn)為矢量多邊形要素類數(shù)據(jù)),F(xiàn)eature Class to Shapefile工具(將要素類轉(zhuǎn)為Shapefile格式文件,存在指定文件夾下,輸出文件夾),Select Data(Model Only Tools)工具(在數(shù)據(jù)容器內(nèi)選擇數(shù)據(jù))。
要想求得分類結(jié)果圖斑的面積,在新生成的矢量文件中,我們需要對其添加ID字段和面積字段。這一步驟需要用到Add Field工具(在屬性表中加入新字段),Calculate Field工具(計算屬性字段值)。
1.3.2? Jaccard系數(shù)值計算
對遙感影像數(shù)據(jù)預(yù)處理得到具有ID和面積字段的矢量文件。實地調(diào)查的矢量多邊形數(shù)據(jù)也具有ID和Area字段。因此,就可以對兩份文件求交集。需要用到的工具是Intersect工具(計算輸入要素的幾何相交部分)。但這里交集可能出現(xiàn)一個多邊形與多個多邊形有交集,我們計算時取主要的相交多邊形,也就是面積最大的多邊形,需要用到的工具是Summary Statistics工具(計算屬性表中字段統(tǒng)計值)。
遙感影像處理后的數(shù)據(jù)已知,實地調(diào)查矢量多邊形的數(shù)據(jù)已知,交集已知。接下來就是將三份文件的面積字段放到一起進(jìn)行計算。需要用到的工具是Join Field工具(建立兩個屬性表間連接,通過兩表的連接字段,將所連接表中的指定字段復(fù)制到主表中去),Add Field(在屬性表中加入Jaccard字段),Calculate Field(利用Jaccard公式計算Jaccard字段值)。最終可以得到圖形中各個矢量多邊形的Jaccard值,最后再把各個多邊形的Jaccard值求取平均值,最終得出的Jaccard值。Jaccard值越大,則遙感影像數(shù)據(jù)與實地調(diào)查矢量多邊形的相似性也越大。
2? 實驗實現(xiàn)和結(jié)果分析
實驗基于ArcGIS軟件進(jìn)行數(shù)據(jù)分析計算,技術(shù)流程圖如圖2所示。
首先,根據(jù)Jaccard相似系數(shù)定義,分析需要用到的數(shù)據(jù)處理步驟,然后將數(shù)據(jù)處理步驟對應(yīng)到ArcGIS軟件的工具箱的特定工具,在進(jìn)行運算時,根據(jù)每個步驟的輸入輸出數(shù)據(jù)要求進(jìn)行調(diào)整,加入中間數(shù)據(jù)處理和轉(zhuǎn)換步驟。最后,將各個步驟有序連接,建立起Jaccard相似系數(shù)計算模型,用ArcGIS里的ModelBuilder工具完成建模。
以本次研究為例,本次研究要用到兩個輸入數(shù)據(jù),分別是影像分割結(jié)果圖斑柵格數(shù)據(jù)和真實的地面驗證數(shù)據(jù)。由于分割結(jié)果圖斑數(shù)據(jù)為柵格數(shù)據(jù),首先要將其轉(zhuǎn)化成矢量數(shù)據(jù),并通過添加相應(yīng)的字段并計算其面積。然后將分割結(jié)果圖斑數(shù)據(jù)和真實的地面驗證數(shù)據(jù)相交,計算其相交數(shù)據(jù)。計算出圖斑的交集、并集,并對計算得出的結(jié)果進(jìn)行統(tǒng)計,就可以通過Jaccard公式計算其相似系數(shù)。下文對具體的操作流程進(jìn)行論述由于我們運用遙感技術(shù)得到的數(shù)據(jù)多數(shù)是柵格數(shù)據(jù),且數(shù)據(jù)類型為浮點型,在ArcGIS中要求柵格數(shù)據(jù)的數(shù)據(jù)類型為整型才能進(jìn)行運算,所以我們需要先對柵格數(shù)據(jù)的數(shù)據(jù)類型進(jìn)行轉(zhuǎn)換,這一步通過Copy Raster工具實現(xiàn)。如圖2所示,輸入影像分割結(jié)果圖斑數(shù)據(jù),即,最初的浮點型柵格數(shù)據(jù),運用Copy Raster工具得到像素類型改為整型,如無符號16位整型(16_BIT_UNSIGNED)的復(fù)制柵格數(shù)據(jù)集,然后將得到柵格數(shù)據(jù)利用Raster to Polygon工具柵格轉(zhuǎn)為面要素類,存放在默認(rèn)的文件地理數(shù)據(jù)庫中。處理步驟如圖3所示。
然后,我們需要進(jìn)行屬性數(shù)據(jù)表的字段添加和計算,數(shù)據(jù)文件類型就需要由上一步結(jié)果的地理數(shù)據(jù)庫的要素文件轉(zhuǎn)換為Shapefile文件類型。利用Feature Class To Shapefile(multiple)工具可以轉(zhuǎn)為Shapefile,處理步驟如圖4所示。
接下來,我們需要在屬性表中添加出接下來在運算需要用到的兩個屬性:ID和面積。我們要對上一步得到的Shapefile屬性表添加TreeGrowID字段,并給這個ID字段賦值為每個由柵格數(shù)據(jù)轉(zhuǎn)換而來的矢量圖斑的編號;添加tSh_Area字段,計算對應(yīng)圖斑的面積,如圖5所示。到此,我們就完成了由柵格數(shù)據(jù)轉(zhuǎn)化為矢量數(shù)據(jù)的所有步驟,得到了修改后的RasterT_treegro2.shp。
輸入實地調(diào)查的真實數(shù)據(jù)文件,其文件格式為Shapefile,與上述步驟得到的結(jié)果圖斑矢量數(shù)據(jù)求交集得到新的面要素類,得到文件Intersect_result面要素類,如圖6所示。
這里交集可能出現(xiàn)一個分割結(jié)果多邊形與多個實地調(diào)查多邊形數(shù)據(jù)有交集的情況,我們計算時取主要的相交多邊形,也就是相交面積最大的多邊形,所以以實地調(diào)查多邊形數(shù)據(jù)的ID為案例分組字段,以Shape_area為統(tǒng)計字段,以Max為統(tǒng)計類型,使用summary statistics工具,得到Intersect_Statistics面要素類,即與分割結(jié)果多邊形相交面積最大的多邊形,如圖7所示。
接下來,需要把實地調(diào)查數(shù)據(jù)、柵格數(shù)據(jù)轉(zhuǎn)換而來的矢量數(shù)據(jù)、數(shù)據(jù)交集的面積字段放到一起進(jìn)行計算,步驟如圖8所示。
通過表連接得到了具有完成運算所需要的三個屬性,分割結(jié)果多邊形的面積,實地調(diào)查圖斑的面積,相交最多的多邊形對應(yīng)的重疊面積?,F(xiàn)在計算Jaccard系數(shù)需要的輸入值都有了,可以計算Jaccard值,所以最后進(jìn)行Jaccard字段的添加和計算。得到數(shù)據(jù)如表1所示。
根據(jù)Jaccard值可以初步判斷分類結(jié)果多邊形和樣本多邊形的重疊程度。本例中因為是單木分割的結(jié)果集,Jaccard相似度主要在0.3左右,目前的數(shù)據(jù)和分類方法得到的單木分類結(jié)果還需要改進(jìn)。
3? 結(jié)? 論
本次研究利用ArcGIS軟件中ArcToolbox工具和Model-Builder建模工具建立圖斑Jaccard相似系數(shù)的計算模型,對比分析影像分割結(jié)果的圖斑柵格數(shù)據(jù)與真實地面驗證數(shù)據(jù)的匹配度。首先對數(shù)據(jù)進(jìn)行分析與處理,將分類結(jié)果的柵格圖斑轉(zhuǎn)化成含有面積字段并且可以進(jìn)一步在ArcGIS中運算的矢量文件。將地面驗證數(shù)據(jù)與由柵格圖斑得到的文件相交,然后將分割結(jié)果轉(zhuǎn)化得出的矢量多邊形,地面驗證數(shù)據(jù)與交集數(shù)據(jù)建立屬性表連接,利用Jaccard公式進(jìn)行計算。數(shù)據(jù)通過計算后,求出各個多邊形的Jaccard值,最后再把各個多邊形的Jaccard值求取平均值,最終得出Jaccard值。最終值反映了單木分割結(jié)果的平均情況。按照上述方法,可以初步判斷分類結(jié)果多邊形和樣本多邊形的重疊程度。此方法的提出,能夠準(zhǔn)確得出大量圖斑的相似度,能以批處理形式高效運算完成多幅數(shù)據(jù)的處理,對于單木樹冠區(qū)分提供了更高效、更精準(zhǔn)、更便捷的研究方法。
參考文獻(xiàn):
[1] 孫振峰,張曉麗,李霓雯.機載與星載高分遙感影像單木樹冠分割方法和適宜性對比 [J].北京林業(yè)大學(xué)學(xué)報,2019,41(11):66-75.
[2] 張雨朦,吳孔逸,岳建偉,等.基于F直方圖的圖斑幾何形狀相似性度量方法研究 [J].地理與地理信息科學(xué),2019,35(3):9-15+27.
[3] 周迪,施冬,徐豐.基于改進(jìn)Jaccard系數(shù)的分級統(tǒng)計地圖相似性比較 [J].科學(xué)技術(shù)創(chuàng)新,2020(11):61-62.
[4] 李曉麗.基于Voronoi劃分的區(qū)域化模糊聚類遙感影像分割 [J].測繪學(xué)報,2020,49(6):799.
[5] 張凝,馮躍文,張曉麗,等.結(jié)合航空影像紋理和光譜特征的單木冠幅提取 [J].北京林業(yè)大學(xué)學(xué)報,2015,37(3):13-19.
[6] 夏宇,朱欣焰.一種基于形狀特征的地理實體相似性查詢方法 [J].地理與地理信息科學(xué),2015,31(1):6-11.
[7] 田原,蔡華,鄔倫,等.基于局部相似的地籍宗地圖斑匹配方法 [J].地理與地理信息科學(xué),2011,27(5):25-28.
[8] 郝燕玲,唐文靜,趙玉新,等.基于空間相似性的面實體匹配算法研究 [J].測繪學(xué)報,2008(4):501-506.
[9] 吳靜,尹濤.多尺度空間關(guān)系相似性研究 [J].測繪科學(xué),2011,36(4):69-71.
[10] 沈利強,姜仁榮,王培法.一種高分辨率遙感圖像單木樹冠信息提取方法 [J].遙感信息,2017,32(3):142-148.
[11] 滕文秀,溫小榮,王妮,等.基于迭代H-minima改進(jìn)分水嶺算法的高分辨率遙感影像單木樹冠提取 [J].激光與光電子學(xué)進(jìn)展,2018,55(12):499-507.
[12] 董天陽,周棋正.基于形態(tài)Snake模型的遙感影像的單木樹冠檢測算法 [J].計算機科學(xué),2018,45(S2):269-273+291.
[13] 劉春燕.圖像分割評價方法研究 [D].西安:西安電子科技大學(xué),2011.
作者簡介:陳巡(2000—),女,漢族,四川瀘州人,本科在讀,研究方向:土地遙感;鐘鳳媛(1979—),女,漢族,重慶人,講師,碩士,研究方向:遙感和地理信息系統(tǒng)應(yīng)用;劉雅鑫(2000—),女,漢族,四川自貢人,本科在讀,研究方向:土地遙感;鄭夢婷(2000—),女,漢族,四川雅安人,本科在讀,研究方向:土地遙感。