許凱,周峻松,楊帆
(1.云南師范大學 旅游與地理科學學院,云南 昆明 650500; 2.云南省基礎地理信息中心,云南 昆明 650034)
地理國情監(jiān)測變化信息數(shù)據(jù)是基于地理國情監(jiān)測矢量成果提取的空間地理數(shù)據(jù),通過分析其變化量、變化頻率、變化趨勢等,充分發(fā)掘變化信息數(shù)據(jù)中豐富的地理信息和社會信息,獲取反映各類資源、環(huán)境、生態(tài)、經(jīng)濟要素的空間分布及發(fā)展變化規(guī)律的分析數(shù)據(jù),是實現(xiàn)國情監(jiān)測數(shù)據(jù)高效應用、輔助綜合決策和數(shù)據(jù)庫動態(tài)更新的重要手段。
地表的變化監(jiān)測與變化提取是學者研究的熱點,但相關研究主要集中在遙感影像變化提取上,容易受到影像分辨率、浮云和波段色彩的影響。地理國情變化信息數(shù)據(jù)是以經(jīng)過實地調(diào)查驗證的矢量數(shù)據(jù)為基礎,通過可視化方法表達和處理的成果,能準確概括地物實體最真實的變化情況,同時還包含了人文社會屬性,數(shù)據(jù)有較高的可應用性。在基于矢量數(shù)據(jù)的提取中,作業(yè)人員須與數(shù)據(jù)頻繁交互,要求數(shù)據(jù)問題能快速反饋至提取過程并優(yōu)化技術方法;然而,受提取方法和本底數(shù)據(jù)質(zhì)量的限制,目前能廣泛應用到生產(chǎn)實踐中的技術和成果還比較少。在提取變化數(shù)據(jù)的同時開展質(zhì)量控制是一種保證數(shù)據(jù)質(zhì)量的技術方法,它能將質(zhì)量問題消除在提取過程當中,是貫穿整個提取過程的核心工作[1]。
筆者結合近年來在地理國情監(jiān)測和地理信息數(shù)據(jù)處理工作中的經(jīng)驗,對省級地理國情監(jiān)測地表覆蓋變化數(shù)據(jù)和地理國情要素變化信息提取技術方法和質(zhì)量控制模式進行探討,提出基于空間位置和統(tǒng)計分析的變化信息提取方法,并以昆明市呈貢區(qū)為實驗區(qū)進行驗證,希望為今后更好地應用基礎性地理國情監(jiān)測數(shù)據(jù)提供參考。
地理國情監(jiān)測變化信息數(shù)據(jù)是在2期監(jiān)測矢量數(shù)據(jù)所反映的地表狀況比較之下發(fā)現(xiàn)變化,并輔以專題資料和行業(yè)資料,按照采集要求獲取的相關地理信息數(shù)據(jù),主要分為地表覆蓋變化數(shù)據(jù)和地理國情要素變化數(shù)據(jù)。地表覆蓋變化數(shù)據(jù)反映種植土地、林草覆蓋、房屋建筑(區(qū))、鐵路與道路、構筑物、人工堆掘地、荒漠與裸露地表和水域8大類地表覆蓋的類別、位置、范圍等的變化情況;國情要素變化數(shù)據(jù)反映道路、構筑物、地理單元和水域4大類要素位置、屬性的變化情況[2]。較地表覆蓋數(shù)據(jù)而言,國情要素數(shù)據(jù)的數(shù)據(jù)量更小、提取時間較短,但它圖層多,變化類型多,提取時須按多個實體類依次進行提取,對地理信息提取的正確識別有更嚴格的要求。
決策正確與否與一個國家、民族的前途、命運休戚相關。地理國情監(jiān)測變化信息數(shù)據(jù)可支撐區(qū)位條件、土地資源、水文狀況、基礎設施狀況等方面的地表變化情況分析,提出問題并幫助解決問題,為制定科學的發(fā)展規(guī)劃提供可靠的信息支持,為政府提升綜合決策水平提供客觀依據(jù)。近年來,資源環(huán)境惡化、土地利用不平衡等問題愈發(fā)嚴重,地理國情監(jiān)測變化信息數(shù)據(jù)在生態(tài)環(huán)境變化監(jiān)測、城鎮(zhèn)發(fā)展變化監(jiān)測等專題監(jiān)測中也發(fā)揮起越來越重要的作用。
地表覆蓋數(shù)據(jù)主要提取4類變化類型:1)原有圖斑在邊緣處發(fā)生的此消彼長的“空間變化”;2)在原有圖斑內(nèi)新產(chǎn)生的與周圍類型完全不一樣的圖斑的“新增變化”;3)原有圖斑在變化區(qū)域內(nèi)滅失的“滅失變化”;4)原有圖斑空間位置不變,但屬性發(fā)生變化的“屬性變化”。
國情要素數(shù)據(jù)提取3類變化類型:1)原有地理要素分布范圍和位置發(fā)生變化的“位置變化”;2)要素發(fā)生新增、滅失、部分改變的“新增、刪除變化”;3)空間位置不變,但其他屬性發(fā)生了變化的“屬性變化”。其中,新增、刪除和位置變化都屬于空間變化。
提取方法分為人工提取、人機交互提取和自動提取。在自動提取的基礎上,可按照空間變化和屬性變化規(guī)則針對變化不明顯的目標進行人工識別提取。由于數(shù)據(jù)還存在社會屬性,因此在劃定變化區(qū)和識別變化要素時須輔以疊加影像、行業(yè)資料等參考數(shù)據(jù)。
2.2.1 數(shù)據(jù)收集與整合
選取3 a內(nèi)時相合適、指導規(guī)范相同、數(shù)據(jù)質(zhì)量高的數(shù)據(jù)與資料,整合保留有效圖層。如2015—2017年基礎性地理國情監(jiān)測成果、專題地理國情監(jiān)測數(shù)據(jù)、基礎地理信息更新成果、行業(yè)資料等。
2.2.2 變化信息識別提取
地理國情監(jiān)測數(shù)據(jù)都具有空間屬性,利用空間分析、統(tǒng)計分析、疊加分析和拓撲分析對2期數(shù)據(jù)進行對比,識別出圖斑(要素)的變化部分并確立變化區(qū),依次從屬性變化、空間變化、空間和屬性同時變化3方面進行變化提取。
1)屬性變化。若是非點要素,則先將其轉為點作為連接要素,利用點與點、點與線、點與面的空間連接和拓撲檢查將連接要素和目標圖層匹配,確定2期數(shù)據(jù)圖斑、要素之間的空間位置對應關系,提取出空間位置相對應的圖斑(要素),再利用字段計算器對屬性字段進行對比,識別并提取出屬性內(nèi)容發(fā)生變化的圖斑(要素)。
2)空間變化。利用點與面的空間連接,分別提取前后2 a數(shù)據(jù)中空間位置未匹配的圖斑(要素),經(jīng)過拓撲檢查初步確定空間位置發(fā)生新增、滅失、位移的圖斑(要素),再依次分析相同特征屬性字段圖斑(要素)的分布和變化情況。
3)屬性和空間同時變化。識別既發(fā)生屬性變化又發(fā)生空間變化的圖斑(要素),再結合2 a的本底數(shù)據(jù)進行人工目視解譯,提取出屬性和空間都發(fā)生變化的圖斑(要素)。
2.2.3 變化信息篩查整合
將變化識別提取出的要素與2期本底數(shù)據(jù)疊加,再輔以行業(yè)資料和高分影像數(shù)據(jù),用特征屬性字段匯總分析的方法逐層對變化圖斑和要素進行關聯(lián)篩查。通常,一個屬性字段無法關聯(lián)所有要素,還須使用其他唯一特征屬性字段來關聯(lián)未關聯(lián)的要素。人工目視排查出提取錯誤的關聯(lián)要素并改正分類,將變化圖斑(要素)統(tǒng)一為第1年屬性在后1年之前的屬性格式,最終在ArcMap中整合為4類變化數(shù)據(jù)層,即屬性變化層、空間變化層(新增和滅失)、位置變化層和空間屬性變化層。
2.2.4 質(zhì)量檢查
質(zhì)量檢查是質(zhì)量控制中的重要步驟,也是提取過程中必不可少的一步。采用人工與軟件結合的方式對變化數(shù)據(jù)的屬性正確性、格式規(guī)范性和數(shù)據(jù)完整性進行檢查,查出問題后及時修正,并反饋到變化信息識別步驟,改進提取方案后重新提取(圖1)。
圖1 基礎性地理國情監(jiān)測變化信息提取流程
2.3.1 基于空間位置的變化識別
地理國情監(jiān)測數(shù)據(jù)存在拓撲關聯(lián)和屬性關聯(lián)兩種復雜的關聯(lián),一個圖斑要素變化時往往聯(lián)動2個以上的要素,并伴隨屬性的變化[3],若提取時無法準確獲取要素之間的關聯(lián),則易出現(xiàn)大面積提取錯誤?;诳臻g上有關聯(lián)的圖斑(要素)的空間連接和統(tǒng)計分析,可以精確定位發(fā)生變化的圖斑。提取時,基于代表中心建立2期要素點圖層的空間連接,通過空間疊置分析判斷圖斑、要素的對應關系并提取變化區(qū),之后用與變化區(qū)對應的圖斑(要素)數(shù)據(jù)進行編輯、修改、刪除,準確定位到發(fā)生聯(lián)動的要素,并將其提取出。
2.3.2 結合特征屬性的變化信息篩選
地理國情監(jiān)測數(shù)據(jù)嚴格按照規(guī)范采集并經(jīng)過外業(yè)調(diào)查,不同期同一要素層具有相同的數(shù)據(jù)結構、屬性字段?;贕IS技術結合統(tǒng)計分析的方法,準確、直觀地分析2個圖斑(要素)之間的聯(lián)系,從而精確篩選變化信息。提取時,以要素的多個特征屬性字段為基礎依次進行匯總分析,直到所有要素匹配上為止,再判斷要素的變化類型。這樣就能得到要素間屬性存在的關系,再結合空間位置的關聯(lián)判斷變化類型,篩選錯誤分類,實現(xiàn)數(shù)據(jù)真實變化情況的追溯。
云南省昆明市呈貢區(qū)位于滇東高原腹地,滇池東岸,全區(qū)面積510 km2,隨著呈貢大學城的建設和蔬菜、花卉產(chǎn)業(yè)的發(fā)展,呈貢區(qū)城鎮(zhèn)化水平不斷提高,社會經(jīng)濟發(fā)展迅速,地表變化明顯,數(shù)據(jù)庫更新要求高[4]。實驗數(shù)據(jù)為呈貢區(qū)2015—2017年3期的高分影像和地理國情監(jiān)測數(shù)據(jù),具體圖層包括構筑物(V_SFCP)、城鎮(zhèn)功能綜合單元(V_BUCP)、公路(V_LRDL)、水網(wǎng)(V_HYDL)、地表覆蓋分類(V_LCRA)等,數(shù)據(jù)采集時點分別為2015年6月、2016年6月和2017年6月。輔助參考數(shù)據(jù)有昆明市主城區(qū)及滇池流域監(jiān)測等項目成果數(shù)據(jù)、云南省基礎地理信息數(shù)據(jù)更新項目數(shù)據(jù)、《云南省主體功能區(qū)規(guī)劃》(2012—2020年)等。
3.2.1 變化信息識別
利用空間位置結合屬性字段的方法依次對2015—2016年和2016—2017年的實驗數(shù)據(jù)進行初步提取。以2015—2016年為例:空間位置連接上的點所對應的圖斑(要素)提取為“圖層名稱_SXBH”,添加“變化類型”字段并填寫“屬性變化”,再用字段計算器更新屬性字段,判斷具體屬性變化(表1、圖2)。提取空間位置未連接上的要素,合并為“空間變化”,包括新增、滅失和位移。識別時,2015年要素轉點并連接2016年相應的目標要素,提取2016年多出的部分,即為“2016年新增”;2016年要素轉點并連接2015年相應目標,提取2016年刪除部分,即為“2016年滅失”。以此類推。
表1 屬性字段計算變化項
3.2.2 變化信息整合
經(jīng)過初步提取后,準確定位特征屬性進行匯總分析,結合實體變化規(guī)律再次判斷、提取和整合。如對于“2017年新增”的實體,有可能是新增要素,也有可能是位置或形狀發(fā)生較大變化的伸縮型變化要素,對于“2017年滅失”的實體,有可能是滅失要素;也有可能是空間位置發(fā)生變化的要素:所以,“空間變化”的要素須結合空間位置判斷NAME、FEATID、EC等特征字段相同的記錄,提取位置發(fā)生變化的“位置變化”。最后,將所有變化圖層的屬性整合為“前一年屬性+后一年屬性”的格式,方便后期對比分析(圖3)。
變化圖斑提取準確度為正確提取變化圖斑數(shù)與發(fā)生變化圖斑總數(shù)之比,是反映提取效果的重要參數(shù)。2015—2016年地表覆蓋變化信息平均提取精度為99.5%,國情要素變化信息平均提取精度為94.9%(表2);2016—2017年地表覆蓋變化信息平均提取精度為99.8%,國情要素變化信息平均提取精度為96.4%(表3)??梢钥闯?,2016—2017年變化速率加快,變化圖斑增加明顯。結合影像和輔助資料分析,相應圖層的變化情況符合客觀實體變化規(guī)律,證實了實驗所采用的方法對地理國情監(jiān)測變化信息提取沒有明顯遺漏,變化要素提取準確率達96%以上,可以在基層數(shù)據(jù)生產(chǎn)中廣泛使用。
圖2 2015—2016年地表覆蓋變化信息提取結果
圖3 變化要素信息提取結果
表2 2015—2016年變化信息提取結果統(tǒng)計
表3 2016—2017年變化信息提取結果統(tǒng)計
變化信息數(shù)據(jù)的質(zhì)量指在實體空間位置、特征和時間的表達所能達到的準確性、一致性、完整性,三者統(tǒng)一的程度,以及數(shù)據(jù)后期參與應用的能力[2]。變化數(shù)據(jù)質(zhì)量控制分為過程質(zhì)量控制和成果質(zhì)量檢查,貫穿提取全程,在消除質(zhì)量問題的同時反饋并優(yōu)化提取技術方法(圖4)。
圖4 質(zhì)量控制貫穿提取全程
1)對軟、硬件進行調(diào)試,檢查提取人員組織、專業(yè)技術準備情況。檢查本底數(shù)據(jù)正確性及收集的專題地理信息成果和相關行業(yè)資料的完整性、合法性、權威性、現(xiàn)勢性、可靠性。
2)檢查輔助數(shù)據(jù)處理整合、變化信息識別提取等環(huán)節(jié)的規(guī)范性。結合本底數(shù)據(jù)、監(jiān)測期影像等檢查變化區(qū)域提取數(shù)據(jù)的正確性、更新充分性,以及與本底數(shù)據(jù)的拓撲一致性。
3)抽查提取過程中主要技術標準的實施情況。檢查提取內(nèi)容及記錄的完整性、質(zhì)量問題的修改與復查情況等。檢查初期成果數(shù)據(jù)內(nèi)容的完整性和數(shù)據(jù)組織、數(shù)據(jù)格式、數(shù)據(jù)屬性等,并選取實驗區(qū)驗證提取精度和正確性。
4)檢查提取成果的數(shù)據(jù)時點、數(shù)據(jù)完整性、屬性正確性、邏輯一致性、圖形質(zhì)量、附件質(zhì)量等項的正確性,出現(xiàn)問題及時修正、記錄。
總結提取過程中遇到的主要問題,結合相關規(guī)范、設計,深入分析提取過程,探討問題產(chǎn)生的主要原因。
4.2.1 要素對應關系問題
進行空間連接后,存在少部分沒有發(fā)生空間位置變化的圖斑(要素)被識別并提取為變化圖斑(要素)的情況。如V_LCRA層中,A圖斑2015年到2016年空間位置未發(fā)生變化,因節(jié)點數(shù)不同而被提取為變化圖斑。分析其原因,有要素空間節(jié)點存在差異、不同年份的數(shù)據(jù)存在采集規(guī)范不同等,反映出地理國情監(jiān)測數(shù)據(jù)采集指標及數(shù)據(jù)規(guī)定要求的復雜性。針對這一問題,應加強本底數(shù)據(jù)整合選取,在提取時加上屬性的關聯(lián)輔助識別,確保圖斑和要素關聯(lián)的正確性。
4.2.2 屬性偽變化問題
表現(xiàn)為屬性變化層中,因為某些屬性字段的描述差異,從而提取出空間位置和屬性含義均相同的圖斑(要素),但實質(zhì)上屬性是未發(fā)生變化的。如在相同空間位置,“NAME”字段中的2016年“A鎮(zhèn)完全小學”與2017年“A鎮(zhèn)完小”存在差異,而被提取成屬性變化。這反映出本底數(shù)據(jù)技術標準認識與理解存在問題,分析原因是本底數(shù)據(jù)采集時作業(yè)人員規(guī)范不統(tǒng)一或數(shù)據(jù)整合時沒有完全整合等。數(shù)據(jù)準備時要選擇質(zhì)量高的、可靠性高的數(shù)據(jù),提取時遇到類似情況應先參照影像、參考資料判斷是否為同一實體,再判斷變化類別。
4.2.3 屬性字段正確性問題
主要有提取結果屬性表結構錯誤或內(nèi)容不完整的情況,如變化圖層中屬性表中2 a屬性信息排序有誤,有的甚至還缺少上一年的屬性字段信息,缺乏對比性。如“2016—2017位置變化”層中不應存在2016年的要素,但需含有2016年的屬性。分析原因是作業(yè)人員對變化信息提取規(guī)則把握不好,提取不夠細致。針對這一問題,應加強整理篩選批處理過程中代碼細節(jié)的細化。作業(yè)人員也應增強技術標準的理解和執(zhí)行,準確提取變化信息。
地理國情信息數(shù)據(jù)含有豐富的關聯(lián)關系,可用于實現(xiàn)實體的有效連接,為變化信息提取和應用提供基礎。在處理數(shù)據(jù)的同時建立質(zhì)量控制體系,是保障數(shù)據(jù)質(zhì)量的前提[5-6]。針對地理國情監(jiān)測工作中變化信息無法被廣泛、準確提取的問題,制定了以空間位置定位和特征屬性字段分析相結合的提取模式,并加強了質(zhì)量控制。提取和控制實驗結果表明,此方法能廣泛地適應基層地理信息工作,克服
了傳統(tǒng)提取“一站到底”的模式,在提取過程中既優(yōu)化了方法,又保證了提取精度和數(shù)據(jù)質(zhì)量,能為各省市的地理國情監(jiān)測數(shù)據(jù)應用提供參考。如何保證變化信息提取成果的準確度,如何在生產(chǎn)實踐中快速地、最大限度地高效應用這些研究成果等,都需要進一步嘗試和實踐。下一步筆者會繼續(xù)完善實驗,改進技術方法,以期實現(xiàn)能應用在生產(chǎn)中的半自動化甚至算法自動化提取方法。