劉 曉, 黃海軍, 孫榮濤, 張照錄, 宋明春, 董慧君
?
利用監(jiān)督分類快速提取分層設(shè)色圖件中數(shù)據(jù)的方法
劉 曉1, 黃海軍2, 孫榮濤1, 張照錄1, 宋明春3, 董慧君4
(1. 山東理工大學資源與環(huán)境工程學院, 山東淄博 255049; 2. 中國科學院海洋研究所, 海洋地質(zhì)與環(huán)境重點實驗室, 山東青島 266071; 3. 山東省地質(zhì)礦產(chǎn)勘查開發(fā)局, 山東濟南 250013; 4. 東營市勘察測繪院, 山東東營 257091)
為了快速將分層設(shè)色圖件中象元的顏色值轉(zhuǎn)化為具有實際意義的屬性標識或物理、化學參數(shù)值, 從而提取分層設(shè)色圖件中包含的數(shù)據(jù), 作者提出了根據(jù)不同顏色分量(RGB)構(gòu)建顏色特征空間, 基于最小距離監(jiān)督分類方法快速提取分層設(shè)色圖件中數(shù)據(jù)的方法。使用該方法對東半球海域海面水汽分布數(shù)據(jù)進行提取, 取得了良好的效果。該方法可以廣泛應(yīng)用于物理海洋、環(huán)境科學、地質(zhì)調(diào)查、地理信息系統(tǒng)建庫等多個行業(yè)領(lǐng)域的數(shù)據(jù)提取工作中。
監(jiān)督分類; 數(shù)據(jù)提取; 分層設(shè)色法; ENVI
1 研究背景
伴隨全球變化研究的開展及國際交流合作水平的提高, 國內(nèi)外許多機構(gòu)定期或不定期地發(fā)布海洋、氣象、環(huán)境等領(lǐng)域的監(jiān)測數(shù)據(jù)及研究成果[1-3]。這些監(jiān)測數(shù)據(jù)及研究成果對于科學研究、工程建設(shè)、環(huán)境保護等都有重要意義[4]。這些數(shù)據(jù)及成果, 有的以原始數(shù)據(jù)的形式發(fā)布, 有的以論文專著中圖件的形式發(fā)布, 有的則從建立的數(shù)據(jù)發(fā)布網(wǎng)站發(fā)布[5-7]。對于以圖像形式發(fā)布的數(shù)據(jù), 一般使用象元顏色代表某種屬性或參數(shù), 且使用的是圖像坐標系。在進行模型設(shè)計、分析處理時, 較難利用其中包含的數(shù)據(jù)信息。如何快速從這些圖像中快速提取有用數(shù)據(jù), 將圖像坐標系下象元顏色值轉(zhuǎn)換為地理坐標系或投影坐標系下屬性或物理、化學參數(shù)的值, 成為科學研究及工程實踐中經(jīng)常碰到的問題[8-9]。
對于圖像中用等值線法描述的數(shù)據(jù), 可以使用地理信息系統(tǒng)軟件進行半自動化屏幕跟蹤數(shù)字化, 然后根據(jù)等值線進行內(nèi)插即可完成數(shù)據(jù)的提取[10-11]。這種方法已經(jīng)非常成熟, 多數(shù)地理信息系統(tǒng)軟件都有相關(guān)功能, 作者不再贅述。另外有一些數(shù)據(jù)使用分層設(shè)色法(Hypsometric law)進行描述, 以某個色系中不同的顏色表示不同的數(shù)值大小。這些數(shù)據(jù)或者來自遙感衛(wèi)星監(jiān)測結(jié)果, 或者來自于海洋大氣模型模擬的結(jié)果, 通常使用Matlab、IDL、Fortran、C等語言編寫的程序進行繪制。這些數(shù)據(jù)中沒有明顯的等值線, 也很難分辨表示某一數(shù)據(jù)范圍的多邊形, 數(shù)據(jù)較為散亂, 很難用手工數(shù)字化的方法進行數(shù)據(jù)提取[12-13]。本研究提出一種使用監(jiān)督分類法快速提取分層設(shè)色圖像中原始數(shù)據(jù)的方法, 以該方法提取東半球海域海面水汽分布數(shù)據(jù), 獲得了良好的效果。
2 使用監(jiān)督分類法快速提取圖像中原始數(shù)據(jù)的原理
分層設(shè)色圖件通常是由軟件生成的, 通常包括反映分層信息的顏色以及輔助要素(如注記、空白、圖框)使用的顏色兩類。這些圖件一般采用柵格圖像格式存儲, 對于圖像中每個像元, 有對應(yīng)的紅、綠、藍3個色彩分量??梢越⑷S特征空間, 如圖1所示, 其、、軸分別對應(yīng)圖像的紅、綠、藍3個色彩分量。對于圖像中每種分層所對應(yīng)的顏色, 在該特征空間中為一個特征點。柵格圖像中的每個像元, 根據(jù)其R、G、B值都能在該特征空間中找到對應(yīng)的位置。計算該像元位置與每個分層對應(yīng)的特征點之間的距離, 該位置最靠近的特征點對應(yīng)的分層, 即是該像元所屬的分層[14]。對圖像中每個像元進行上述判別操作, 可以快提取圖像中各個分層的范圍。該操作在遙感圖像數(shù)字處理中稱為最小距離監(jiān)督分類法(supervised classification), 被廣泛用于遙感數(shù)據(jù)分類[15-16]。
3 數(shù)據(jù)來源及處理流程
3.1 圖件來源
本研究使用的圖像來自O(shè)SPO(The Office of Satellite and Product Operations)網(wǎng)站(http: //www.ospo. noaa.gov/)。OSPO是隸屬與NOAA的一個部門, 主要負責衛(wèi)星數(shù)據(jù)的處理及信息的發(fā)布。OSPO網(wǎng)站發(fā)布的數(shù)據(jù)中, 包括陸地、海洋、大氣多種產(chǎn)品。本研究中使用的是美國空軍, 美國海軍, 美國海洋大氣總署共同參與了SPP(Shared Processing Program共享處理程序)項目中得到的東半球海域海面水汽分布圖, 進行東半球海面水汽分布數(shù)據(jù)的提取。本研究中使用的原始圖像自http: //www.ospo.noaa.gov/data/spp/ ssmi/water_vapor.east.gif網(wǎng)址下載, 如圖2所示。
3.2 數(shù)據(jù)處理流程
ENVI (The Environment for Visualizing Images, ENVI)是由遙感領(lǐng)域的科學家采用交互式數(shù)據(jù)語言IDL(Interactive Data Language, IDL)開發(fā)的一套功能強大的遙感圖像處理軟件, 其功能覆蓋了圖像數(shù)據(jù)處理的幾乎所有功能[15]。ENVI不但允許用戶使用IDL語言對其特性和功能進行擴展或自定義, 甚至將C++和Java代碼集成到其工具中。本研究在ENVI4.8軟件中使用監(jiān)督分類法快速提取圖件中原始數(shù)據(jù), 其數(shù)據(jù)處理流程如圖3所示。
3.2.1 導入數(shù)據(jù)并采集控制點
由于ENVI軟件不支持直接打開GIF格式的圖像, 故首先將網(wǎng)站得到的GIF格式圖像保存為無壓縮的BMP格式的圖像文件, 在ENVI軟件中打開。注意不要保存為JPG格式, 該格式對圖像進行有損壓縮過程中, 會改變某些像元的顏色, 影響分類精度。對其坐標系統(tǒng)進行分析發(fā)現(xiàn), 該圖中經(jīng)緯線皆為直線且相互垂直, 相同間隔的經(jīng)緯線組成正方形網(wǎng)格, 故判斷其使用經(jīng)緯度坐標系, 其橫縱坐標軸為地理經(jīng)緯度。橫坐標范圍從東經(jīng)20°向東增大到180°, 縱坐標從南緯–80°向北越過赤道增加到北緯80°。根據(jù)以上信息, 在ENVI中使用“選擇地面控制點: 圖像配準到地圖(Select GCPs: Image to Map)”工具采集配準使用的控制點。由于配準過程中會對原始圖像進行重采樣, 進而影響監(jiān)督分類的精度, 故在此步驟中不進行糾正操作, 僅采集控制點并保存在文件中。
3.2.2 圖面內(nèi)容分析
圖中使用分層設(shè)色法表示海面水汽分布情況, 共劃分為20個等級, 除此之外還有陸地、注記及經(jīng)緯線、無數(shù)據(jù)區(qū)、圖像背景處對應(yīng)的顏色。使用“光標位置/值(Cursor Location / Value)”工具查看發(fā)現(xiàn)其中圖像背景、陸地及水汽濃度小于3.5處像元的RGB值相同, 其他各類像元RGB值各不相同。根據(jù)本次試驗數(shù)據(jù), 在監(jiān)督分類中共建立了22類樣本。
3.2.3 選擇監(jiān)督分類樣本
在“感興趣區(qū)工具(ROI Tool)”中建立樣本類, 并在顯示窗中采集樣本。由于圖例是表示不同等級水汽含量的標準, 且圖例大小合適, 類型單一, 較少受到其他像元的干擾, 故在采集樣本時優(yōu)先選擇在圖例處進行采集。采集樣本過程中, 在“感興趣區(qū)工具(ROI Tool)”中將每類樣本的名字更改為能反映含義的文字或數(shù)字, 并使用“保存感興趣區(qū)(Save ROIs)”工具保存為*.roi文件, 以方便后期處理。
3.2.4 最小距離法進行監(jiān)督分類
完成分類樣本采集后, 即可使用最小距離法進行監(jiān)督分類。分類結(jié)果存儲在與原圖像同樣大小的圖像文件中, 其柵格代碼及顏色對應(yīng)于建立的樣本文件。對比原圖與分類后的結(jié)果, 發(fā)現(xiàn)分類效果非常好, 主要原因是圖像中色彩類型較單一, 僅在在不同顏色交界處有少數(shù)像元顏色受到周圍像元的影響。
3.2.5 數(shù)據(jù)后處理
由于原圖像是由軟件對數(shù)據(jù)不同范圍賦以特定顏色生成的, 故原圖像中不存在遙感解譯種種常見的同物異色、混合像元、地形干擾等問題, 故不需要進行過多的后處理操作。確實有需要, 可以通過綜合運用“類別集群(Clump)”、“類別篩選(Sieve)”工具消除分類結(jié)果中的小斑塊。
3.2.6 糾正分類結(jié)果并導出數(shù)據(jù)
根據(jù)第一步保存的控制點文件, 使用“基于地面控制點糾正(Wrap from GCPs: Image to Map)”工具對分類結(jié)果圖像進行糾正。使用“根據(jù)感興趣區(qū)裁切(Subset Data via ROIs)”工具裁切掉圖名、圖例、比例尺、圖框等內(nèi)容, 僅保留有數(shù)據(jù)的區(qū)域。將數(shù)據(jù)另存為其他格式(如*.img), 完成數(shù)據(jù)提取工作。
3.2.7 提取結(jié)果精度評價
將上述操作提取到的結(jié)果數(shù)據(jù)保存為data.img文件并導入ArcGIS軟件。使用相同的控制點文件對未分類的原始圖像進行糾正, 將得到的數(shù)據(jù)另存為source.img。在ArcGIS軟件中, 使用“創(chuàng)建隨機點(Creat Random Points)”工具, 創(chuàng)建隨機點用以檢驗數(shù)據(jù)提取效果。根據(jù)本研究的實際情況, 此處創(chuàng)建了300個隨機點進行檢驗。使用“值提取至點(Extract Multi Value to Points)”工具, 分別提取隨機點所在位置處data.img、sourcg.img的RGB圖層的像元值, 并進行統(tǒng)計以判斷該點分類是否準確。
4 結(jié)果與結(jié)論
將本研究中提取到的數(shù)據(jù)在ArcGIS軟件中制圖,結(jié)果如下圖4所示[10]。該圖與原圖對比進行目視檢查可以看出, 數(shù)據(jù)提取效果非常好。在本次試驗中通過統(tǒng)計得出, 類別劃分正確的象元數(shù)占總象元數(shù)的92.3%。類別劃分錯誤主要來源于原始圖像中經(jīng)緯線的干擾, 占總錯誤數(shù)的69.6%, 這部分錯誤對于一般的建模及統(tǒng)計分析沒有影響。其他操作導致的錯誤, 僅占總錯誤數(shù)的30.4%, 占總象元數(shù)的2.33%。該提取結(jié)果完全能夠滿足一般工程應(yīng)用及科學研究的需要。
將提取得到的結(jié)果與原始圖件進行比較, 發(fā)現(xiàn)誤差產(chǎn)生的原因有以下幾點: (1)經(jīng)緯線、圖像邊框及數(shù)字標注線產(chǎn)生的干擾; (2)小斑塊消除運算過程中產(chǎn)生的誤差; (3)圖像保存為BMP格式及圖像配準過程中對原始圖像進行重采樣引入的誤差; (4)小斑塊合并帶來的誤差。
上述誤差僅在非常少量的局部地區(qū)對數(shù)據(jù)提取結(jié)果產(chǎn)生影響, 從整體來看, 本研究中提出的方法快捷方便, 能快速準確的從原始分層設(shè)色圖像中提取連續(xù)變化的數(shù)據(jù)信息。
本研究中根據(jù)監(jiān)督分類法原理, 建立基于RGB顏色分量的特征空間, 根據(jù)圖像中不同類型要素對應(yīng)的顏色, 使用最小距離法進行分類, 快速準確地提取了分層設(shè)色圖像中的原始數(shù)據(jù)。該方法提取數(shù)據(jù)操作簡便、速度快、準確性高, 解決了過去使用手工方法難以提取該種類型數(shù)據(jù)的問題。該方法具有廣闊的應(yīng)用前景, 可以廣泛應(yīng)用于物理海洋、環(huán)境科學、地質(zhì)調(diào)查、地理信息系統(tǒng)建庫等多個行業(yè)領(lǐng)域。
[1] 袁雪梅, 蔣永國, 郭忠文. 海洋數(shù)據(jù)信息共享平臺關(guān)鍵技術(shù)研究與實現(xiàn)[J]. 中國海洋大學學報(自然科學版), 2010, 40(12): 147-153. Yuan Xuemei, Jiang Yongguo, Guo Zhongwen. Design and implementation of marine data information sharing platform[J]. Periodical of Ocean University of China, 2010, 40(12): 147-153.
[2] 徐超, 李莎, 米浦春. 南海物理海洋數(shù)據(jù)的OPeNDAP服務(wù)實現(xiàn)[J]. 熱帶海洋學報, 2010, 29(4): 174-180. Xu Chao, Li Sha, Mi Puchun. OPeNDAP service based implementation of physical oceanographic data of the South China Sea[J]. Journal of Tropical Oceanography, 2010, 29(4): 174-180.
[3] 劉海行, 宋轉(zhuǎn)玲, 韓彬. 青島海洋資料共享服務(wù)系統(tǒng)的設(shè)計與實現(xiàn)[J]. 海洋科學進展, 2008, 26(3): 394- 400. Liu Haixing, Song Zhuanling, Han Bin. The design and realization of Qingdao oceanic data-sharing service system[J]. Advances in Marine Science, 2008, 26(3): 394-400.
[4] 楊峰, 杜云燕, 崔馬軍, 等. 海洋多源環(huán)境數(shù)據(jù)共享系統(tǒng)研究[J]. 測繪通報, 2011, 10: 35-37. Yang Feng, Du Yunyan, Cui Majun, et al. Study of multi-source marine environmental data sharing system[J]. Bulletin of Surveying and Mapping, 2011, 10: 35-37.
[5] 宋德瑞, 陶冠峰, 孫淑艷, 等. 海洋環(huán)境監(jiān)測業(yè)務(wù)共享平臺建設(shè)與實施[J]. 海洋環(huán)境科學, 2008, 27(S2): 114-116. Song Derui, Tao Guanfeng, Sun Shuyan, et al. Construction and implement of business share platform in marine environmental monitoring[J]. Marine Environmental Science, 2008, 27(S2): 114-116.
[6] Zhang Y, Wang J, Vorontsov A M, et al. Using a neural network approach and time series data from an international monitoring station in the Yellow Sea for modeling marine ecosystems[J]. Environ Monit Assess, 2014, 186(1): 515-524.
[7] O'Hara P D, Serra-Sogas N, Canessa R, et al. Estimating discharge rates of oily wastes and deterrence based on aerial surveillance data collected in western Canadian marine waters[J]. Mar Pollut Bull, 2013, 69(1-2): 157-164.
[8] 薛存金, 蘇奮振, 杜云艷. 海洋地理信息系統(tǒng)集成技術(shù)分析[J]. 海洋學報(中文版), 2008, 30(4): 56-62. Xue Cunjin, Su Fenzhen, Du Yunyan. Analysis of integration technology based on marine geographical information system[J]. Acta Oceanologica Sinica, 2008, 30(4): 56-62.
[9] 趙冬泉, 黨安榮, 陳吉寧. 監(jiān)督分類方法在圖片資料專題信息提取中的應(yīng)用研究[J]. 測繪通報, 2006, 11: 32-34. Zhao Dongquan, Dang Anrong , Chen Jining. A Study of application of supervised classification to thematic information extraction in image data[J]. Bulletin of Surveying and Mapping, 2006, 11: 32-34.
[10] 湯國安, 楊昕. ArcGIS地理信息系統(tǒng)空間分析實驗教程[M]. 北京: 科學出版社, 2012: 289-296. Tang Guoan, Yang Xin. ArcGIS geography information system spatial analysis experiment instructor[M]. Beijing: Science Press, 2012: 289-296.
[11] Hoenner X, Whiting S D, Hindell M A, et al. Enhancing the use of Argos satellite data for home range and long distance migration studies of marine animals[J]. PLoS One, 2012, 7(7): e40713.
[12] Giannakeas N, Fotiadis D I. Multichannel segmentation of cDNA microarray images using the Bayes classifier[J]. Conf Proc IEEE Eng Med Biol Soc, 2007: 3466- 3469.
[13] Claeys A, Cornelis A, Kerckaert I, et al. Fully automated measurements by light microscopy of tissue sections using a cellular array computer[J]. Gegenbaurs Morphol Jahrb, 1989, 135(1): 83-90.
[14] Baattrup-Pedersen A, Larsen S E, Riis T. From expert judgement to supervised classification: a new approach to assess ecological status in lowland streams[J]. Sci Total Environ, 2013, 447: 116-122.
[15] 鄧書斌. ENVI遙感圖像處理方法[M]. 北京: 科學出版社, 2010: 129-145. Deng Shubin. ENVI remote sensing image process method[M]. Beijing: Science Press, 2010: 129-145.
[16] 韓麗娟, 王鵬新, 王錦地, 等. 植被指數(shù)-地表溫度構(gòu)成的特征空間研究[J]. 中國科學(D輯: 地球科學), 2005, 35(4): 371-377. Han Lijuan, Wang Pengxin, Wang Jindi, et al. Research on surface temperature/NDVI index feature space[J]. Science In China Ser(D Earth Sciences), 2005, 35(4): 371-377.
Application of supervised classification method in the extraction of data from hypsometric law-based map
LIU Xiao1, HUANG Hai-jun2, SUN Rong-tao1, ZHANG Zhao-lu1, SONG Ming-chun3, DONG Hui-jun4
(1. College of Resource and Environmental Engineering, Shandong University of Technology, Zibo 255049, China; 2. Key Lab of Marine Geology and Environment, Institute of Oenology, Chinese Academy of Sciences, Qingdao 266071, China; 3. Exploration and Development Bureau of Geology and Mineral Resources of Shandong Province, Jinan 255013, China; 4. Dongying Exploration and Surveying Institute, Dongying 257091, China)Received:Nov. 3, 2014
Supervised classification method; data extraction; hypsometric law-based map; ENVI
In this article, a new method was designed to convert the RGB value of pixels in the hypsometric law-based map to its real property code, to convert it quickly to its physical/chemical parameters, and to extract spatial data from the hypsometric law-based map. The minimum distance supervised classification method was used to construct the feature class space based on the RGB component of the map image. This method also provided a good result when extracting water vapor concentration data in the Eastern Hemisphere and can thus be used widely in data extraction work in fields such as physical oceanology, environmental science, geological surveying, and GIS database construction.
P208.2; P285.3
A
1000-3096(2016)07-0110-05
10.11759//hykx20141103004
2014-11-03;
2015-02-28
國家自然科學基金項目(41006021, 41306190); 山東省自然科學基金項目(ZR2014DQ005); 泰山學者工程專項經(jīng)費資助
[Foundation: National Natural Science Foundation of China, No. 41006021, No. 41306190; Natural Science Foundation of Shandong Province, China, No.ZR2014DQ005; Taishan Scholars Program of Shandong Province]
劉曉(1981-), 男, 山東淄博人, 博士, 副教授, 主要從事現(xiàn)代海洋沉積環(huán)境研究, 電話: 15169225534, E-mail: liuxiaogis@sdut.edu.cn; 黃海軍, 通信作者, 研究員, 電話: 053282898524, E-mail: hjhuang@ qdio.ac.cn
(本文編輯: 譚雪靜)