孔令堯
(遼寧省自然資源事務(wù)服務(wù)中心,遼寧 沈陽 110034)
遙感技術(shù)是以電磁波理論為基礎(chǔ)的探測技術(shù),從20世紀60年代發(fā)展至今,隨著技術(shù)發(fā)展以及傳感器硬件設(shè)備的快速提升,遙感影像資料越來越豐富,無論從空間分辨率、時間分辨率,還是光譜分辨率都得到了很大程度地提高,已經(jīng)成了地表覆蓋信息提取的最有效手段[1]。由于高分五號高光譜數(shù)據(jù)正式投入使用的時間較短,國內(nèi)外研究人員對該數(shù)據(jù)發(fā)表的相關(guān)研究結(jié)論較少,因此加快開展針對高分五號高光譜數(shù)據(jù)的應(yīng)用研究,對掌握國產(chǎn)高光譜數(shù)據(jù)資源的自主知識產(chǎn)權(quán)具有重要意義。
高光譜遙感影像數(shù)據(jù)具有豐富的光譜信息,使其在地表覆蓋物提取分類中相對于多光譜數(shù)據(jù)具有先天的優(yōu)勢[2]。然而,也正是因為信息豐富的優(yōu)勢,同樣帶來了一些困擾,比如光譜數(shù)據(jù)量大、空間分辨率低、混合像元等,因此如何利用先進的數(shù)據(jù)處理技術(shù)手段處理高光譜數(shù)據(jù)的提取分類成為一大挑戰(zhàn)。
自高分五號正式投入使用以來,國內(nèi)外的相關(guān)研究都在積極開展,為了得到更好地提取與分類應(yīng)用效果,充分利用高分五號高光譜數(shù)據(jù)的優(yōu)勢,本次研究對原始影像進行了壞波段去除、輻射定標、壞線修復(fù)、大氣校正和幾何校正預(yù)處理工作,將預(yù)處理后的影像分別采用光譜角匹配法、支持向量機法和ENVINet5的深度學(xué)習(xí)模塊方法進行地表覆蓋信息提取分類,并通過相關(guān)指標進行評價。技術(shù)路線(如圖1所示)。本次所用的遙感專業(yè)處理軟件為ENVI5.5和ArcGIS10.2。
圖1 技術(shù)路線圖
為了使提取的地物更具有代表性,并考慮到高分五號高光譜數(shù)據(jù)30m的空間分辨率導(dǎo)致容易產(chǎn)生混合像元,本次研究選取確定了6類典型的主要地物作為標準參考樣本。使用ArcGIS手工繪制了清晰的6類地物:公路、居民地、林地、耕地、廠房、工業(yè)空地。導(dǎo)入到ENVI中作為標準參考樣本(如圖2(d)所示):
圖2 分類結(jié)果對比圖
2.2.1 算法原理
光譜角匹配法是利用地物反射的光譜曲線特征進行提取分類的方法,其原理是將全部波段作為空間向量,根據(jù)向量運算原理,以圖像端元中選取的端元波譜作為參考波譜,對兩者之間的向量夾角進行計算,兩者向量夾角的大小與相似度成反比,即光譜向量間夾角越小,表示相似度越高。
2.2.2 端元波譜的選取及分類后處理
選取的端元波譜越純粹,則光譜角匹配法分類的精度越高。初步完成分類后,要對相同類型的地物反射波譜進行合并處理,繪制平均波譜曲線。例如,三種不同顏色的工廠房頂需要進行波譜合并處理,提高分類精度。由于受到高光譜數(shù)據(jù)中的噪聲、混合像元等因素的影響,在高光譜遙感影像的分類過程中不可避免地經(jīng)常出現(xiàn)碎斑的情況。因此,需要將突兀的碎斑進行融合過渡處理或與周圍大面積圖斑合并,以便分類結(jié)果清晰,圖斑連續(xù),過渡自然。本次利用ENVI軟件中的Majority模塊對波段進行合并處理。
支持向量機分類法具有完善的數(shù)學(xué)理論,是一種基于統(tǒng)計特征的地表覆蓋分類方法,在一系列改進和擴展算法后,在模型識別、文本分類和人像識別等方面得到了廣泛應(yīng)用。
2.3.1 算法原理
支持向量機的核心理論是結(jié)構(gòu)風(fēng)險最小化為歸納原則[3],基于這個原則將數(shù)據(jù)映射到高維特征空間,在高維特征空間中構(gòu)造最優(yōu)分類超平面作為判決面,使得線性可分的兩類數(shù)據(jù)的間隔最大。
2.3.2 訓(xùn)練樣本選擇
支持向量機分裂的重點在于訓(xùn)練樣本的選擇和定義[4]。將預(yù)處理后的高光譜遙感影像,根據(jù)目視解譯的類別圖,均勻選擇各類型地物的訓(xùn)練樣本,并且對于同類型但不同屬性的地物需要分別選取樣本,將標準樣本作為驗證樣本,樣本數(shù)量(如表1所示):
表1 訓(xùn)練及驗證樣本數(shù)
2.4.1 模型簡介
隨著遙感數(shù)據(jù)分類領(lǐng)域的不斷發(fā)展,智能化的基于深度學(xué)習(xí)的分類方法得到越來越廣泛地關(guān)注,成為了遙感領(lǐng)域最熱門的研究方向。相較于傳統(tǒng)機器學(xué)習(xí)算法,深度學(xué)習(xí)算法能夠通過訓(xùn)練集來自動地挖掘數(shù)據(jù)的深度特征包括了光譜、紋理和統(tǒng)計特征,而不用通過特征工程來進行特征選擇,使得模型獲得更高的分類精度。目前,高光譜數(shù)據(jù)越來越多地被使用在地表覆蓋地物提取分類研究中,而熱門的深度學(xué)習(xí)方法必然會在高光譜分類中得到更多應(yīng)用。
2.4.2 ENVINet5模型參數(shù)
(1)迭代與訓(xùn)練量。模型分類的精度與模型的訓(xùn)練量密不可分,迭代次數(shù)、每批訓(xùn)練使用的切片和每次迭代訓(xùn)練切片數(shù)是決定訓(xùn)練量的主要參數(shù)。將全部數(shù)據(jù)導(dǎo)入模型進行一次訓(xùn)練的過程為迭代次數(shù),迭代次數(shù)少,模型達不到精度要求;迭代次數(shù)多,運算時間長,不僅浪費計算資源,也并不意味著就會有更高的模型精度[5]。一般會根據(jù)數(shù)據(jù)量,設(shè)置在16-32次之間。
(2)固定距離和模糊距離。固定距離的設(shè)置是用來對線狀特征或者點狀特征的大小進行擴展,從而能更加準確地提取目標的位置和數(shù)量。如果地物目標形狀復(fù)雜,繪制樣本時無法準確繪制特征邊線,可以添加固定距離,這樣可以更加完整地表達出真實對象。
模糊距離是在銳利的特征地物邊緣設(shè)置模糊距離,設(shè)置分為最大距離和最小距離,以便在模型訓(xùn)練的過程中在最大距離與最小距離間減少模糊,使模型聚焦于特征邊界上。
(3)分類權(quán)重和損失權(quán)重。設(shè)置分類權(quán)重參數(shù)是在模型自動從圖像中生成切片時,引入一種偏差。避免由于同等概率選擇切片時,完全由背景像素組成的情況發(fā)生。這種偏差值的引入,使得在模型選取切片時,特征像素被選取的概率增高。
損失權(quán)重可以用來判斷模型的訓(xùn)練情況。為了使模型對特征像素識別度更高,避免背景像素,可以通過設(shè)置損失權(quán)重參數(shù)來實現(xiàn)。在圖像中特征像素取樣不足時,也可以通過損失權(quán)重為每個像素添加權(quán)重。
2.4.3 執(zhí)行分類
采用最優(yōu)的、訓(xùn)練后的參數(shù)模型,對研究區(qū)域進行圖像分類。此處值得注意的是待分類圖像必須大于訓(xùn)練模型的切片大小。
通過光譜角匹配法、支持向量機法以及ENVINet5深度學(xué)習(xí)模塊對研究區(qū)域進行了地表覆蓋信息分類,現(xiàn)將從定性、定量和效率三個方面對分類結(jié)果進行分析評價。
精度評估是把握遙感產(chǎn)品質(zhì)量的關(guān)鍵環(huán)節(jié),是檢驗不同分類方法生產(chǎn)效果的重要手段。一般從定性和定量兩個方面去評估分類結(jié)果的精度。定性評價表示的是從分類結(jié)果的圖面上進行人為的觀察,并參照參考資料進行對比分析。定量評價表示的是通過相應(yīng)的指標對結(jié)果精度進行判斷,通常的評價指標有混淆矩陣和Kappa系數(shù)。
混淆矩陣的每一列表示一種真實地物類別,這一列中的數(shù)值即地表真實像元在此類別中的數(shù)量;每一行表示一種預(yù)測所分類別,這一行中的數(shù)值即預(yù)測該類像元在此類別中的數(shù)量。
總體分類精度(Overall Accuracy)是正確分類的像元總和占總像元數(shù)的比率。制圖精度又叫生產(chǎn)者精度(Produce Accuracy)是指分類結(jié)果將整個影像的像元正確分為某一類的像元數(shù)與該類真實像元總數(shù)(混淆矩陣中該類列的總和)的比率。用戶精度(User Accuracy)是指正確分到某一類的像元總數(shù)與分類結(jié)果中被分為該類的像元總數(shù)(混淆矩陣中該類型的總和)比率。
kappa系數(shù)同樣是一種衡量分類精度的指標,在交叉分類中較常使用,其取值范圍是[-1,+1],越接近1表示相似度越高,反之相似度越低。一般來說Kappa系數(shù)大于0.75即表示分類的一致性較好,小于0.4表示一致性較差。計算公式(1)所示:
公式(1)中,Pe是總體分類精度;假設(shè)n個類別,ai是第i類真實樣本的個數(shù);bi是第i類預(yù)測樣本的個數(shù)。
光譜角匹配法、支持向量機法和ENVINet5方法的研究區(qū)分類結(jié)果圖(如圖2所示):
通過對比觀察發(fā)現(xiàn),三種方法都能很好地對地表覆蓋物進行分類,也客觀地證明了本次研究方法的可行性。由于高分五號高光譜影像本身30m空間分辨率的限制,導(dǎo)致各類型土地覆蓋的邊界較為模糊,并且不可避免地會產(chǎn)生圖塊中存在碎斑的現(xiàn)象,但從整體來看,通過ENVINet5分類方法得出的結(jié)果要比光譜角分類法和支持向量機分類方法的整體內(nèi)部集聚性更強,圖中的碎斑情況更少。各個類別地物的分類也達到了很好的效果。(1)對于公路的分類結(jié)果,可以看出ENVINet5的分類結(jié)果直觀、清晰地表達出了線性的公路屬性特征。而光譜角匹配法和支持向量機法分類結(jié)果中,受到周圍像元影響較大,混合了居民地、工業(yè)空地以及部分植被等光譜特征;(2)對于工業(yè)用地和廠房的分類結(jié)果中,可以看出在邊界的判別上,光譜角匹配法要優(yōu)于支持向量機分類法和ENVINet5分類法。但在內(nèi)部集聚方面還是ENVINet5分類法效果更好;(3)對于居民地分類結(jié)果中,光譜角匹配法和支持向量機法產(chǎn)生的內(nèi)部碎斑較多,從分類樣本的參考多光譜影像中可以看出:碎斑是由多種居民房屋頂?shù)幕旌舷裨獙?dǎo)致的,影響了分類結(jié)果;(4)對于耕地和林地的分類結(jié)果中,可以看出光譜角匹配法對耕地中植被稀疏地塊存在錯分的情況。由于光譜角匹配法對光譜曲線較為敏感,因此在不同的植被種類和不同的生長期,都會產(chǎn)生影響。
本次研究分別以混淆矩陣和Kappa系數(shù)作為定量評價指標對三種分類結(jié)果進行評價。光譜角匹配法方法總體精度為82.14%,Kappa系數(shù)為0.768;支持向量機方法總體精度為92.4557%,Kappa系數(shù)為0.9024;ENVINet5方法的總體精度為94.6175%,Kappa系數(shù)為0.9306。從定量評價結(jié)果中可以明顯得出:ENVINet5分類效果最好,然后是支持向量機分類法,最后是光譜角分類法。
根據(jù)混淆矩陣對六種不同地類分別進行生產(chǎn)者精度、用戶精度和平均精度的計算。結(jié)果(如表2所示):
表2 三種方法各類別精度表
從表2中可以看出:三種方法對廠房分類的平均精度都高于94%,對居民地和林地分類的平均精度都超過了86%,表明分類結(jié)果較好。光譜角匹配法對于公路分類的平均精度很低,表明分類結(jié)果不理想,存在錯分現(xiàn)象。支持向量機法在工業(yè)空地和公路兩類地物的分類中平均精度都小于80%,表明存在分類效果不佳,存在錯分現(xiàn)象。ENVINet5分類方法對六類地物的平均分類精度都達到了95%以上,尤其是對于工業(yè)用地和公路這兩類容易受到周邊像元影像的小面積地物的分類中,生產(chǎn)者精度和用戶精度也都達到了90%以上,表明分類效果很好。因此,在六種典型地物的分類的過程中ENVINet5方法的分類精度要高于光譜角匹配法和支持向量機法。
運算效率的高低同樣是評價一種分類算法精度的重要指標。在執(zhí)行分類前,訓(xùn)練樣本的選取中,光譜角匹配法只需要準確選取目標地物的端元波譜即可保證精度。支持向量機法只需要保證一定數(shù)量的訓(xùn)練樣本數(shù)即可保證精度。而ENVINet5的訓(xùn)練樣本需要通過標簽創(chuàng)建,并且分別訓(xùn)練模型,工作量比較大,并且對計算機硬件要求也比較高。三類方法訓(xùn)練及分類所用時間對比(如表3所示):
表3 三類方法用時
本次研究利用ENVI軟件完成了高分五號高光譜影像預(yù)處理工作,并總結(jié)出了一套有效的處理方法。不僅剔除了無效波段提高了運算效率,而且減少了噪聲,提高了圖像的質(zhì)量,最終獲得了真實的地物反射率。在此基礎(chǔ)上利用基于波譜特征的光譜角匹配法、基于波譜統(tǒng)計特征的支持向量機法和基于深度學(xué)習(xí)框架的ENVINet5分類法對公路、居民地、林地、耕地、廠房和工業(yè)空地共六類典型地物進行了地表覆蓋地物特征提取,并進行了結(jié)果分析。最終結(jié)果表明:高分五號高光譜遙感影像在大面地物特征提取及分類中擁有著廣泛的應(yīng)用前景,對于推動高光譜影像在地理國情監(jiān)測項目中的應(yīng)用有一定的推廣作用。