刁淑娟, 劉春玲, 張濤, 賀鵬, 郭兆成, 涂杰楠
(1.中國地質圖書館,北京 100083; 2.中國國土資源航空物探遙感中心,北京 100083)
?
基于SVM的湖泊咸度等級遙感信息提取方法
——以內蒙古巴丹吉林沙漠為例
刁淑娟1, 劉春玲2, 張濤2, 賀鵬2, 郭兆成2, 涂杰楠2
(1.中國地質圖書館,北京 100083; 2.中國國土資源航空物探遙感中心,北京 100083)
以Landsat8 OLI圖像為信息源,在完成幾何糾正、配準及鑲嵌等圖像預處理的基礎上,對內蒙古巴丹吉林沙漠湖泊進行光譜信息提?。?結合實地采集的湖泊咸度等級樣本,分析湖泊咸度光譜特征及其遙感信息特征,提出了基于支持向量機(support vector machine,SVM)的咸度等級分類方法和咸度區(qū)劃分方案,實現(xiàn)了對巴丹吉林沙漠湖泊咸度等級遙感信息的提取。研究結果表明,該方法能有效地解決湖泊咸度樣本數(shù)量較少、樣本間光譜信息差異較小、采用常規(guī)分類方法難以取得較好效果情況下的湖泊咸度信息提取問題,有一定的推廣應用價值。
湖泊咸度等級; 信息提?。?支持向量機(SVM); 光譜分析; 巴丹吉林
內蒙古巴丹吉林沙漠以其獨特的風沙地貌和沙漠腹地深處形態(tài)各異的湖泊景觀聞名于世。據(jù)前人統(tǒng)計,在巴丹吉林沙漠現(xiàn)存的100多個湖泊中,常年有水的就超過70多個,這一現(xiàn)象實為罕見。沙漠內部的湖泊及周邊的濕地是牧民們種植及放牧依托的根本,從湖泊周邊淺井內獲取的地下水也是牧民們的主要飲用水,因此,查明該區(qū)的湖泊咸度非常必要。早在21世紀70年代末,我國學者已對該區(qū)現(xiàn)存內陸湖泊的分布、補給來源及地下水系統(tǒng)等特征做了大量研究[1-2],但對湖泊咸度的研究較少。
支持向量機(support vector machines,SVM)是一種基于統(tǒng)計學理論的監(jiān)督學習算法,即通過對偶優(yōu)化形式在高維特征空間中尋找最優(yōu)分類超平面,解決復雜數(shù)據(jù)的分類及回歸問題[3-4]。該算法已經(jīng)被廣泛應用于土地覆蓋遙感分類。Pal[5]提出非窮盡搜索與遺傳算法(genetic algorithms,GA)結合 SVM 的分類方法,并將其應用于土地覆蓋分類。Carrao 等[6]利用 SVM 分類方法對多光譜 MODIS 數(shù)據(jù)進行處理,解決了土地利用分類問題。Nemmour等[7]利用Landsat圖像進行城市變化監(jiān)測,試驗結果表明 SVM 方法的分類效果優(yōu)于神經(jīng)網(wǎng)絡方法。王朔琛[8]研究了基于半監(jiān)督SVM的圖像分類方法。李馳[9]完成了基于SVM的超分辨率圖像重建。筆者從上述研究得到啟示,考慮到研究區(qū)湖泊咸度樣本數(shù)量較少,且樣本間光譜信息差異較小,采用常規(guī)分類(如最大似然分類)方法難以取得較好效果,而SVM方法對小樣本高維數(shù)據(jù)分類具有優(yōu)勢,因此將其引入到湖泊咸度等級信息的提取中,探討該方法的可行性和實用性。
為全面了解巴丹吉林沙漠區(qū)內湖泊的分布及咸淡情況,摸清其資源潛力及潛在經(jīng)濟價值,促進當?shù)厣鐣c經(jīng)濟可持續(xù)發(fā)展,本文在1∶25萬水文地質遙感調查工作基礎上,通過引入SVM技術,成功實現(xiàn)了對該區(qū)湖泊咸度等級遙感信息的自動提取。
研究區(qū)巴丹吉林沙漠又稱巴丹扎蘭格沙漠,系中國第三大沙漠,位于中國北部阿拉善高原腹地。沙漠東南部以雅布賴山為界,西北與古日乃湖盆區(qū)相接,東依宗乃山,西靠古日乃湖,北連拐子湖,南臨合黎山和北大山,總面積約4.92萬km2[10]。地勢自東南向西北部緩緩傾斜降低,過黑河以西后又逐漸回升,其中吉訶德沙山是世界上最高的沙丘(圖1)。
巴丹吉林沙漠地區(qū)屬大陸性氣候,年均溫度為7~8℃,多年平均降水量由東南向西北部逐漸減少,東南部約為120 mm,西北部則不足40 mm。區(qū)內植被覆蓋度很低,且風沙頻繁,風力強勁。巴丹吉林沙漠雖然氣候極為干旱,但是其中的湖泊竟然多達100多個,面積多在0.1~1.0 km2之間,為全世界所罕見[11]。
以2014年7月17日獲取的覆蓋巴丹吉林沙漠Landsat8 OLI遙感圖像為數(shù)據(jù)源,進行了幾何糾正、配準及鑲嵌等圖像預處理。
研究區(qū)Landsat8數(shù)據(jù)預處理后,對湖泊光譜信息進行提取; 結合實地采集的湖泊咸度等級樣本,分析不同咸度等級湖泊水體的光譜特征; 然后采用SVM分類方法,提取巴丹吉林沙漠區(qū)內各個湖泊的咸度等級。其技術流程如圖2所示。
圖2 湖泊咸度等級遙感信息提取技術流程
2.1 湖泊樣本的光譜特征分析
為了得到巴丹吉林沙漠區(qū)內所有湖泊的咸度等級,通過查閱現(xiàn)有地質圖和檢索他人研究成果,結合實地考察,獲取了該區(qū)內37個湖泊樣本的實際含鹽度數(shù)據(jù)資料。將這些湖泊樣本的咸度分為4個等級(表1),各咸度等級樣本的空間分布如圖3所示。
表1 巴丹吉林沙漠湖泊的咸度分級
圖3 湖泊咸度等級樣本空間分布
以2014年7月17日獲取的Landsat8 OLI圖像為信息源,采集上述樣本的光譜曲線(圖4)。
圖4 樣本的光譜曲線
從圖4可以看出,不同咸度等級樣本的光譜曲線形態(tài)和變化趨勢是類似的,DN值隨波長的增大而減小。另外,隨著咸度等級降低,DN值整體有升高趨勢。從每個咸度等級的樣本中分別取出1個典型樣本,制做出4個典型樣本的光譜特征曲線(圖5)。
圖5 4個典型樣本的光譜曲線
從圖5可以看出,在同一個波段,隨著咸度等級降低,DN值逐漸增大。另外,相對于藍(B)和 綠(G)波段,紅(R)、近紅外(NIR)、短波紅外(SWIR1)和中紅外 (SWIR2)波段對咸度等級的區(qū)分度更高。因此,本文將紅、近紅外、短波紅外及中紅外波段組合起來,形成一個新的組合波段(記作:BR+BNIR+BSWIR1+BSWIR2)。不同咸度等級樣本的DN值見圖6。
從圖6可以看出,隨著咸度等級的增加,DN值明顯下降,且“咸度1”和“咸度2”與“咸度3”和“咸度4”之間有很高的區(qū)分度。
2.2 湖泊光譜特征提取
對于Landsat8 OLI衛(wèi)星數(shù)據(jù)來說,巴丹吉林沙漠的湖泊一般都包含了眾多的水體像元。選擇有代表性的水體像元代表各個湖泊的光譜信息,對湖泊咸度等級遙感分類十分重要。位于湖泊邊緣區(qū)域的水體深度較淺,容易受底部物質的影響。因此,本文以每個湖泊多邊形的重心為基準,提取重心位置像元的光譜信息,作為該湖泊的光譜特征。
所提取的光譜特征共有7個維度,包括Landsat8 OLI的第2―7波段,另外增加了組合波段(BR+BNIR+BSWIR1+BSWIR2)。
2.3 湖泊咸度等級SVM分類
本文采用LibSVM庫實現(xiàn)SVM分類。SVM分類需要設置一些參數(shù)。首先將原始的各個特征歸一化到[0, 1]范圍,以便輸入SVM; 然后選擇徑向基函數(shù)(radial basis function,RBF),在實際測試中,RBF核優(yōu)于線性核函數(shù)和多項式核函數(shù); 最后對參數(shù)C與參數(shù)γ采用交叉驗證方法進行優(yōu)化,選擇最佳的C與γ進行SVM的訓練與分類。
針對巴丹吉林沙漠東南部提取的122個湖泊,采用本文方法將湖泊咸度分為4個等級,其中,咸度等級為1的淡水湖有9個,咸度等級為2的微咸湖有10個,咸度等級為3的咸水湖有40個,咸度等級為4的鹽水湖有63個。咸度等級提取結果見圖7。
圖7 巴丹吉林湖泊咸度等級提取結果
從圖7可以看出,不同咸度級在空間分布上存在明顯的規(guī)律。根據(jù)不同咸度級湖泊在空間上的聚集關系,以NE走向的2條分界線將巴丹吉林沙漠東南部湖泊分成3個區(qū),從東南部向西北部,分別對應“低”、“中”、“高”3個咸度分區(qū)。其中,低咸度區(qū)以淡水湖泊(咸度級1級湖泊)及微咸水湖泊(咸度級2級湖泊)為主,中咸度區(qū)以咸水湖泊(咸度級3級湖泊)為主,高咸度區(qū)以鹽水湖泊(咸度級4級湖泊)為主。
為了驗證SVM法在湖泊咸度等級遙感信息提取中的準確性,對巴丹吉林沙漠內湖泊咸度遙感信息提取結果進行了野外驗證。因受實際條件所限,野外實際驗證點數(shù)為26個,驗證結果見圖8和表2。
圖8 巴丹吉林湖泊實測咸度等級空間分布
從圖8和表2可以看出,咸度等級為1級信息提取點與實測點相符,正確率為100%; 咸度等級為2級信息提取點與實測結果相符的為5個,其余2個實測點咸度等級為3級,準確率為71.43%; 咸度等級為3級的信息提取點與實測結果相符的為6個,剩余1個實測點的咸度等級為2級,準確率為85.71%; 咸度等級為4級的信息提取點與實測結果相符的為7個,剩余1個實測點的咸度等級為3級,準確率為87.50%。對比各咸度等級的信息提取結果與實測結果表明,總體正確率約為84.62%,利用遙感手段所提取的結果較為理想。
表2 湖泊咸度遙感信息提取與野外實地驗證結果對比
本文基于支持向量機(SVM)的方法,以Landsat8 OLI遙感圖像為數(shù)據(jù)源,成功提取了內蒙古巴丹吉林沙漠湖泊咸度等級遙感信息。從遙感調查成果可以看出,巴丹吉林沙漠東南部湖泊的咸度等級存在明顯的空間分異規(guī)律: 淡水(微咸水)主要分布于湖泊區(qū)的東南角; 從東南向西北方向,湖水咸度不斷增加。依據(jù)巴丹吉林沙漠湖泊咸度等級的空間聚集規(guī)律進行的咸度區(qū)劃分,可為沙漠湖泊地下水補給機制分析提供參考,對解決當?shù)厝?、畜飲水難題,促進當?shù)厣鐣c經(jīng)濟可持續(xù)發(fā)展均有極其重要的意義。
[1] 梁永平,趙春紅,唐春雷,等.北方巖溶區(qū)水文地質環(huán)境調查進展——以北京西山巖溶區(qū)為例[J].中國地質調查,2015,2(8):1-8. Liang Y P,Zhao C H,Tang C L,et al.Progress of hydrogeology and environmental geology survey in Karst Area of northern China:An example from karst area in western hills of Beijing[J].Geology Survey of China,2015,2(8):1-8.
[2] 蘇春田,潘曉東,李兆林,等.云南廣南巖溶區(qū)水文地質環(huán)境地質調查進展[J].中國地質調查,2015,2(8):9-16. Su C T,Pan X D,Li Z L,et al.Progress of hydrogeology and environment geology survey in Guangnan karst area,Yunnan province[J].Geology Survey of China,2015,2(8):9-16.
[3] Vapnik V N.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.
[4] Pal M,Mather P M.Support vector machines for classification in remote sensing[J].International Journal of Remote Sensing,2005,26(5):1007-1011.
[5] Pal M.Support vector machine-based feature selection for land cover classification:A case study with DAIS hyperspectral data[J].International Journal of Remote Sensing,2006,27(14):2877-2894.
[6] Carr?o H,Gon?alves P,Caetano M.Contribution of multispectral and multitemporal information from MODIS images to land cover classification[J].Remote Sensing of Environment,2008,112(3):986-997.
[7] Nemmour H,Chibani Y.Fuzzy neural network architecture for change detection in remotely sensed imagery[J].International Journal of Remote Sensing,2006,27(4):705-717.
[8] 王朔琛.基于半監(jiān)督支持向量機的圖像分類方法研究[D].西安:陜西師范大學,2015. Wang S C.Research on Image Classification Based on Semi Supervise Support Vector Machine[D].Xi’an:Shaanxi Normal University,2015.
[9] 李馳.基于支持向量機的超分辨率圖像重建[J].激光雜志,2016,37(1):138-141. Li C.Super resolution image reconstruction based on support vector machine[J].Laser Journal,2016,37(1):138-141.
[10]吳正.風沙地貌與治沙工程學[M].北京:科學出版社,2003. Wu Z.Control Engineering of Sand Physiognomy[M].Beijing:Science Press,2003.
[11]丁宏偉,王貴玲.巴丹吉林沙漠湖泊形成的機理分析[J].干旱區(qū)研究,2007,24(1):1-7. Ding H W,Wang G L.Study on the formation mechanism of the lakes in the Badain Juran desert[J].Arid Zone Research,2007,24(1):1-7.
(責任編輯: 劉心季)
Extraction of remote sensing information for lake salinity level based on SVM: A case from Badain Jaran desert in Inner Mongolia
DIAO Shujuan1, LIU Chunling2, ZHANG Tao2, HE Peng2, GUO Zhaocheng2, TU Jienan2
(1.NationalGeologicalLibraryofChina,Beijing100083,China; 2.ChinaAeroGeophysicalSurveyandRemoteSensingCenterforLandandResources,Beijing100083,China)
According to the problems of remote sensing information extraction in lake salinity level of Badain Jaran desert, the authors put forward a method based on support vector machine (SVM). In this paper, the authors adopted Landsat8 OLI remote sensing image as the data source, completed the image preprocessing such as geometric correction, image registration and mosaicking. With the help of the RS and GIS technology, the authors successfully extracted the information of lake salinity levels of the Badain Jaran desert. The results show that the proposed method can effectively solve the problems of less samples and the information extraction of lake salinity levels when the spectral information is confused, and hence has the reference value and can be promoted to other similar situations.
lake salinity levels;information extraction;support vector machine(SVM);spectral analysis;Badain Jaran
10.6046/gtzyyg.2016.04.18
刁淑娟,劉春玲,張濤,等.基于SVM的湖泊咸度等級遙感信息提取方法——以內蒙古巴丹吉林沙漠為例[J].國土資源遙感,2016,28(4):114-118.(Diao S J,Liu C L,Zhang T,et al.Extraction of remote sensing information for lake salinity level based on SVM:A case from Badain Jaran desert in Inner Mongolia[J].Remote Sensing for Land and Resources,2016,28(4):114-118.)
2015-10-16;
2015-12-12
中國地質調查局地質調查項目“巴丹吉林沙漠1∶25萬水文地質調查”(編號: 12120114018501)及“區(qū)域水文地質遙感調查技術要求(1∶50 000、1∶250 000)”(編號: 121200114029401)共同資助。
TP 79
A
1001-070X(2016)04-0114-05
刁淑娟(1965-),女,碩士,教授級高級工程師,長期從事遙感技術應用研究和期刊編輯出版工作。Email: zgdzdc_dsj@126.com。