鄭繼武
摘 要:大圖斑錯誤在地理國情監(jiān)測中是一個十分嚴重的錯漏現(xiàn)象,對成果質(zhì)量一票否決。本文首先分析大圖斑錯誤及其產(chǎn)生的原因,其次,根據(jù)原因提出大圖斑整治新思路和流程,并分析大圖斑整治技術(shù)的實現(xiàn),最后分析大圖斑整治效果,以期為相關(guān)人員的研究提供借鑒。
關(guān)鍵詞:大圖斑;地理國情監(jiān)測;整治技術(shù)
中圖分類號:P283.1文獻標識碼:A文章編號:1003-5168(2021)07-0009-05
Discussion on Correction Technology of Fault in BigPatches in National Geographical Conditions
ZHENG Jiwu
(Henan Institute of Surveying and Mapping Engineering,Zhengzhou Henan 450003)
Abstract: Spot error is a very serious error and omission phenomenon in the monitoring of geographical conditions, which has a negative effect on the quality of the results. This paper first analyzed the big spot error and its causes. Secondly, according to the reasons, it put forward new ideas and processes of big spot rectification, analyzed the realization of big spot rectification technology, and finally analyzed the effect of big spot rectification, so as to provide reference for the research of relevant personnel.
Keywords: big patche;nationalgeographic conditions monitoring;correction technology
2013—2015年,我國進行了第一次全國地理國情普查。自2016年開始,按照國務(wù)院地理國情監(jiān)測工作常態(tài)化要求,逐年開展了基礎(chǔ)性地理國情監(jiān)測,成果已在多部門、多行業(yè)得到了應(yīng)用,在生態(tài)文明制度建設(shè)中發(fā)揮了重要作用[1]。地理國情監(jiān)測涉及數(shù)據(jù)類型眾多、數(shù)據(jù)源廣泛、數(shù)據(jù)量巨大,為保證分析和決策的及時性和可靠性,地理國情數(shù)據(jù)必須具備較強的現(xiàn)勢性[2]。大圖斑問題主要出現(xiàn)在數(shù)據(jù)生產(chǎn)這一環(huán)節(jié)。本文就基礎(chǔ)性地理國情監(jiān)測中大圖斑整治技術(shù)進行簡要探討。
1 大圖斑錯誤介紹
基礎(chǔ)性地理國情監(jiān)測中的地表覆蓋分類數(shù)據(jù)和地理國情要素數(shù)據(jù)是反映現(xiàn)實世界的基本數(shù)據(jù),可通過多種途徑獲得。其中,地表覆蓋分類數(shù)據(jù)反映地表自然營造物和人工建造物的自然屬性或狀況;地理國情要素數(shù)據(jù)則反映與社會經(jīng)濟生活密切相關(guān),具有較為穩(wěn)定的空間范圍或邊界,具有可以明確標識、有獨立監(jiān)測和統(tǒng)計分析意義的重要地物及其屬性[3]。在地表覆蓋分類數(shù)據(jù)中,圖斑是一個基本的技術(shù)用語,用來表達無縫連接、綿延不絕、相鄰各異的滿足分類要求和劃分條件的地塊。圖斑同地塊一樣,面積有大有小[4]。數(shù)據(jù)中需要用圖斑表示的不同分類地塊實地最小面積有所差別,比如,“種植土地(一級分類)”最小圖斑實地面積400 m2,“房屋建筑區(qū)(二級分類)”最小圖斑實地面積1 600 m2。數(shù)據(jù)生產(chǎn)中,分類圖斑容易出現(xiàn)錯誤,雖然不是普遍現(xiàn)象,但是大的錯誤是難以容忍的,因此,出現(xiàn)錯誤的圖斑大小需要有一個容忍度,突破這一容忍度的圖斑,就稱為大圖斑錯誤。容忍度一般以圖斑面積來表示,如8 000 m2。大圖斑錯誤一般一票否決,出現(xiàn)一處,就可以判定成果質(zhì)量存在嚴重錯漏。因此,避免大圖斑錯誤十分重要,成為成果合格必須跨越的一道門檻[5]。
2 大圖斑錯誤產(chǎn)生的原因
地表覆蓋分類數(shù)據(jù)生產(chǎn)環(huán)節(jié)由三道工序來完成,包括內(nèi)業(yè)變化信息采集、外業(yè)調(diào)查和內(nèi)業(yè)編輯整理。每一道工序操作的對象都與圖斑有關(guān),是對圖斑的直接變動。內(nèi)業(yè)變化信息采集時,存在著在原有圖斑內(nèi)產(chǎn)生與周圍類型完全不一樣的圖斑的新生型變化;原有相鄰圖斑在邊緣處發(fā)生此消彼長的伸縮變化,即伸縮型變化;消失圖斑,則是對圖斑的刪除,對周邊圖斑有所影響[6],包括合并的圖斑?,F(xiàn)在的外業(yè)調(diào)查不論使用圖紙,還是使用圖紙結(jié)合電子調(diào)查工具,或者純粹使用電子調(diào)查設(shè)備來進行,任何變動最終都是對圖斑的直接操作。內(nèi)業(yè)編輯整理也同樣對圖斑直接操作[7]。這一環(huán)節(jié)的每一工序都有可能存在圖斑錯誤,甚至大圖斑錯誤。大圖斑錯誤產(chǎn)生的原因有以下幾方面:①對分類內(nèi)容認識模糊,分類不準確;②圖斑邊界、地類都發(fā)生變化,只變動了邊界,沒有更改分類代碼;③圖斑做了不恰當?shù)暮喜?④較小圖斑分類代碼變化了,選擇時沒在意選中相鄰大圖斑做了更新;⑤監(jiān)測對水田、旱地、路面、硬化地表等地類的變?nèi)胱兂鲆髧栏癜盐?,水田、旱地、路面易于把握,硬化地表與干枯草地從影像上看,有時不易區(qū)分,作業(yè)人員有時會將二者換來換去,產(chǎn)生錯誤;⑥漏更新,包括粗心大意,變化圖斑未更新,以及不同分辨率、不同時相影像對比不充分,更新未到位。
3 大圖斑處理常用方法和不足
對于大圖斑的處理,一般采用以下兩種辦法:①全域瀏覽查看,逐圖斑審視對比,觀察更新到位情況,發(fā)現(xiàn)錯誤,更改錯誤;②利用軟件,將滿足一定面積的圖斑全部提取出來,一個一個察看,避免出現(xiàn)大圖斑錯誤[8]。
這兩種方法具有全面防控的優(yōu)點,但是,缺乏主次輕重,將對的、錯的一起考慮,沒有做到重點防范,浪費了不少寶貴的資源,而且效果也不是十分明顯,雖然檢查過了,但是大圖斑問題依然存在。這主要是因為工作人員在重復做事或工作量負荷超載時容易出現(xiàn)疲勞、粗心毛糙、思想麻痹等問題。
4 大圖斑整治新思路和流程
從大圖斑錯漏產(chǎn)生的原因來看,大多可歸結(jié)為作業(yè)行為導致的。所以,整治大圖斑錯漏,就需要觀察工作人員的哪些行為會產(chǎn)生重大影響。圖斑變化消失了,要刪除,是作業(yè)行為;相鄰圖斑變化了,分類趨于一致,需要合并,有作業(yè)行為;產(chǎn)生新的分類,需要更改分類代碼,也有作業(yè)行為;代碼更改時,本是一塊較小圖斑,因粗心大意,擊中相鄰大圖斑更改了分類代碼,同樣是作業(yè)行為。這些作業(yè)行為,不同于本底數(shù)據(jù)和正射影像的對比更新不到位、不同時相與不同分辨率影像比較判讀漏更新這類物理性錯漏,變化只能從影像看出,只要認真核對,下功夫校檢,就能對大圖斑錯漏做到基礎(chǔ)性防范。在全域瀏覽性檢查防范的基礎(chǔ)上,還要加強重點防范,以消除作業(yè)中工作人員的不恰當行為產(chǎn)生的大圖斑錯漏[9]。
存在大圖斑錯漏的數(shù)據(jù)是地表覆蓋分類數(shù)據(jù),分類數(shù)據(jù)只有一個分層,即LCRA圖層。這一圖層所盛載的數(shù)據(jù)涵蓋了現(xiàn)實世界的地表覆蓋的各種分類。
LCRA圖層的屬性信息包含地表覆蓋分類數(shù)據(jù)通用屬性項和專有屬性項。地理國情信息分類碼(CC碼)為通用屬性項,專有屬性項包括生產(chǎn)標記信息(Tag)和地物標注(Feature),這是自普查以來固有的。隨著監(jiān)測的開展,增加了通用屬性項ChangeType表達地表覆蓋分類變化信息。這些屬性項具有標識圖斑變化的信息,不具有唯一性,也可能存在錯誤,利用起來比較棘手。打開用于監(jiān)測的本底數(shù)據(jù)就會發(fā)現(xiàn),地表覆蓋分類數(shù)據(jù)的屬性項不僅僅包括這些,還包括其他的,如來自建庫階段賦值的通用屬性項[10]。這些屬性項在普查時期的采集階段不會有,但經(jīng)過建庫,隨后歷年進行的監(jiān)測數(shù)據(jù)就包含了。這些屬性項是:要素起始時間(ElemSTime)、要素終止時間(ElemETime)、分區(qū)代碼(AreaCode)和要素唯一標識碼(FEATID)。這些為便于數(shù)據(jù)管理設(shè)置的屬性項,在建庫階段賦值,采集階段不修改來自本底數(shù)據(jù)中已有的屬性值,對新增要素,這些屬性項不賦值或按規(guī)則賦缺省值。ElemSTime、ElemETime、AreaCode具有批量性,一對多或多對一,而FEATID則是一一對應(yīng),具有唯一性。對于監(jiān)測,新生要素或圖斑的FEATID應(yīng)為空或缺省值;伸縮變化的圖斑或要素,其FEATID繼承伸縮前的,與本底數(shù)據(jù)中發(fā)生伸縮變化的圖斑保持一致[11]。這就為大圖斑錯漏整治新思路提供了一個有力的技術(shù)支撐。這樣,與FEATID有關(guān)的情況存在的可能性如下:①新生類型圖斑,只更新數(shù)據(jù)中有FEATID,并為空值或缺省值;②伸縮變化的圖斑FEATID沒有變化;③圖斑刪除,本底數(shù)據(jù)中有FEATID,更新數(shù)據(jù)不存在;④圖斑合并,保留的圖斑有FEATID,合并掉的圖斑在本底數(shù)據(jù)中有FEATID。
這幾種情況均可輔以面積屬性,進行圖斑提取標示,達到控制大圖斑的目的。這時,面積取值即以大圖斑錯漏的面積限值為控制線,穩(wěn)妥起見,此值應(yīng)再略小一些,取80%即可。根據(jù)提取的圖斑的不同情況,進行重點核判、檢查,保留正確的,修正錯誤的,達到防止大圖斑錯漏的目的[12]。根據(jù)以上所述,程序流程如圖1所示。
5 大圖斑整治技術(shù)實現(xiàn)
從操作上來說,功能的實現(xiàn)主要在于使用“按屬性選擇”功能依據(jù)不同情況進行條件選擇,檢查選中圖斑的正確性[13]。這是一個多方面反復的過程,一是不同情況的重復,二是不同區(qū)域的重復。作業(yè)人員的理解能力和應(yīng)用水平有差異,重復之間會出現(xiàn)各種不同的問題,如字符不匹配、中英文混輸、不合乎語言規(guī)則等,都是影響使用的障礙。將技術(shù)流程工具化可以實現(xiàn)減少操作、避免不當能動性、快速利用結(jié)果等諸方面的效用[14]。
在Windows10系統(tǒng)下,使用ArcGIG10.2平臺,在Python2.7語言環(huán)境里,使用ArcPy站點包的函數(shù)或方法,通過腳本程序來實現(xiàn)技術(shù)流程的功能[15]。導入的模塊,需要os、sys、ArcPy等。os是Python標準庫中用于訪問操作系統(tǒng)的模塊,用于目錄操作。處理的數(shù)據(jù)中有漢字內(nèi)容,為防止運用默認的ASCII編碼出現(xiàn)問題,設(shè)置了“utf-8”編碼,需要使用sys模塊,通過重載和恢復,確保輸入和輸出的功能不受影響。ArcPy包含了許多地理處理函數(shù),腳本程序的對象又是地理信息數(shù)據(jù)[16],這樣,程序功能就是通過ArcPy實現(xiàn)的。
新生型變化圖斑的顯著特征是本底數(shù)據(jù)中不存在,監(jiān)測數(shù)據(jù)中新增的圖斑。這些圖斑的FEATID值與本底數(shù)據(jù)不同。本底數(shù)據(jù)中,F(xiàn)EATID是按照規(guī)則給定的唯一性編碼,而監(jiān)測數(shù)據(jù)中則是空值或默認值[17]。這樣就有兩種處理方法:一是直接在監(jiān)測數(shù)據(jù)中查詢FEATID為默認值的要素,但是這里有一個可能,默認值輸入有誤,就會出現(xiàn)漏選;二是在監(jiān)測數(shù)據(jù)中查詢本底數(shù)據(jù)中不存在的FEATID,即濾掉兩個數(shù)據(jù)都存在的數(shù)據(jù),那么,監(jiān)測數(shù)據(jù)中剩余的就是新增的數(shù)據(jù)。采用的ArcPy方法是數(shù)據(jù)管理工具(Management)中的“按屬性選擇”函數(shù)SelectLayerByAttribute選擇要素,且使用復制要素方法(CopyFeatures)將要素保存下來。
對于合并或刪除等消失類的圖斑,特征是這些圖斑在監(jiān)測數(shù)據(jù)中已被處理掉,不存在了,但是,它的蹤跡固定在本底數(shù)據(jù)中。因此,處理方法是在本底數(shù)據(jù)中查詢監(jiān)測數(shù)據(jù)中不存在的數(shù)據(jù)[18],其依據(jù)也是FEATID。使用ArcPy的數(shù)據(jù)管理工具,用“按屬性選擇”函數(shù)選擇滿足條件的要素,用復制要素方法將選中的要素保存下來。
伸縮型變化,F(xiàn)EATID沒有變化,只是面積發(fā)生變化,因此,可以根據(jù)FEATID將變化前后的數(shù)據(jù)進行連接,相互對應(yīng)上的是發(fā)生伸縮變化或沒有發(fā)生變化的,通過對面積屬性前后求差選擇,超過大圖斑錯漏面積控制的重點關(guān)注核查。這一過程使用了數(shù)據(jù)管理工具的幾個方法。首先數(shù)據(jù)連接方法,將本底數(shù)據(jù)和監(jiān)測數(shù)據(jù)按照字段FEATID進行掛接(AddJoin),使用“按屬性選擇”方法(SelectLayerByAttribute),根據(jù)圖斑控制面積進行篩選,之后,先移除(RemoveJoin)數(shù)據(jù)間的連接,縮減數(shù)據(jù)量,接著將選擇的數(shù)據(jù)以復制的方法(CopyFeatures)保存到磁盤中,這是版本數(shù)據(jù)中的伸縮變化圖斑。以此數(shù)據(jù)為基礎(chǔ),在本底數(shù)據(jù)中,以FEATID作為索引進行查詢,將對應(yīng)圖斑查找出來,作為本底數(shù)據(jù)在監(jiān)測中將變化的圖斑數(shù)據(jù)。通過Analysis工具的交集求反(SymDiff)功能將伸縮變化部位標示出來,將結(jié)果保存到磁盤中。
無論哪一種變化類型,使用選擇查詢功能時都要滿足圖層必須處于ArcMap內(nèi)容列表中的要求,首先需要打開這些要素圖層。這就需要用到ArcPy制圖模塊中的MapDocument方法,根據(jù)關(guān)鍵字“CURRENT”,引用當前已加載的地圖文檔;用ListDataFrames獲得地圖文檔的第一個數(shù)據(jù)框架,根據(jù)日常工作經(jīng)驗,一般是唯一的一個,缺省是“圖層”或“Layer”;配合使用Layer和AddLayer函數(shù)將磁盤要素圖層文件加載到內(nèi)容列表中。查詢時,圖層對象只能使用圖層名稱,不能是磁盤文件式樣,即不帶盤符、路徑等字符,這就需要采用os模塊里的path.basename方法獲得圖層名稱。查詢還需要構(gòu)建SQL語句,有關(guān)的內(nèi)容是FEATID、選擇類型、面積控制、邏輯運算、數(shù)值運算以及子查詢等,通過數(shù)據(jù)轉(zhuǎn)換、字符串連接等方法組成一個SQL語句字符串以供使用[19]。
這些就是技術(shù)實現(xiàn)的主要過程和使用方法,通過適當編排和正確使用內(nèi)部參數(shù),就形成一個完整的應(yīng)用腳本,來實現(xiàn)大圖斑錯漏對象的查詢撿取,明確需要處理的目標對象。
6 技術(shù)工具化
程序編制的目的是使用,因此需要將腳本程序工具化。在ArcMap中,新建工具箱之后添加腳本,按順序進行腳本名稱和標簽的命名及“始終在前臺運行”項的選擇、腳本文件的指向連接和“在進程中運行Python腳本”項選擇、參數(shù)的命名和數(shù)據(jù)類型設(shè)置等步驟。設(shè)置的參數(shù)見表1。
7 整治效果
地理國情監(jiān)測中,配備有專門的檢查軟件進行質(zhì)量控制,但在實際作業(yè)中,仍會出現(xiàn)大圖斑錯漏,防不勝防。全面濾查幾遍,也不能完全消除。這就需要在普遍檢查的基礎(chǔ)上,有針對性地對一些情況進行重點篩查。腳本程序就是為此編制的。工具化后使用,作業(yè)人員不必考慮代碼輸入問題,調(diào)用即可。圖2為程序啟動后輸入?yún)?shù)的對話框,在這里,需要輸入圖中所示的有關(guān)參數(shù),以便內(nèi)部變量獲取應(yīng)用或控制程序運行。運行結(jié)果保存了幾個文件,其中,uNv_LCRA為新生圖斑數(shù)據(jù),版本數(shù)據(jù)中有,本底數(shù)據(jù)中沒有;vNu_LCRA為刪除、合并圖斑數(shù)據(jù),本底數(shù)據(jù)中存在,版本數(shù)據(jù)中已經(jīng)不存在;u_v_symDiff為伸縮型變化圖斑變化部位的數(shù)據(jù),此數(shù)據(jù)是在版本數(shù)據(jù)伸縮變化圖斑和對應(yīng)的本底數(shù)據(jù)圖斑基礎(chǔ)上產(chǎn)生的,三者應(yīng)互為參考,以防意外。利用這幾個文件,按照標示的目標圖斑,針對變化情況,對象明確地反復對比,研判變化監(jiān)測是否符合要求,有效避免大圖斑錯漏,達到預期效果。某縣級測區(qū),通過程序篩檢和圖斑復核,發(fā)現(xiàn)有將0391更新成0710、0120更新為0310等大圖斑錯誤。前者為概念不清,草被尚枯,稍有踏痕,似像碾壓踩踏地表,但兩年期影像根本變化不明顯;后者為一小塊草地栽種了闊葉林,需要更新,操作時誤選旁邊旱地大圖斑進行更新,屬于工作不認真、粗枝大葉、錯誤操作造成的。
8 結(jié)語
本程序是在實際作業(yè)中根據(jù)大圖斑錯漏特點提出的一個應(yīng)對方案,目的是將各類圖斑表示出來,以供有關(guān)人員分析斷定。計算方法未采用嚴密公式,如圖斑面積,使用的是監(jiān)測數(shù)據(jù)規(guī)定的米、度單位的對照關(guān)系進行的簡易換算模式,而不是從地理坐標變換成投影坐標之后來實現(xiàn)。單從目的性而言,簡易的面積換算對于說明問題而言是可以滿足要求的,節(jié)省了代碼,沒有降低運行效率。
參考文獻:
[1]李德仁,眭海剛,單杰.論地理國情監(jiān)測的技術(shù)支撐[J].武漢大學學報·信息科學版,2012(5):505-512.
[2]李德仁,馬軍,邵振峰.論地理國情普查和監(jiān)測的創(chuàng)新[J].武漢大學學報·信息科學版,2018(1):1-9.
[3]李德仁,丁霖,邵振峰.關(guān)于地理國情監(jiān)測若干問題的思考[J].武漢大學學報·信息科學版,2016(2):143-147.
[4]史文中,陳鵬飛,張效康.地理國情監(jiān)測可靠性分析[J].測繪學報,2017(10):1620-1626.
[5]黎夏,李丹,劉小平.地理模擬優(yōu)化系統(tǒng)(GeoSOS)及其在地理國情分析中的應(yīng)用[J].測繪學報,2017(10):1598-1608.
[6]劉紀平,董春,亢曉琛,等.大數(shù)據(jù)時代的地理國情統(tǒng)計分析[J].武漢大學學報·信息科學版,2019(1):68-76,83.
[7]翁杰,郭慶勝,王曉妍,等.一種改進的圖斑合并算法[J].武漢大學學報·信息科學版,2012(9):1116-1119.
[8]郭慶勝,王曉妍,劉紀平.圖斑群合并的漸進式方法研究[J].武漢大學學報·信息科學版,2012(2):220-223.
[9]蔡曉斌,陳曉玲,王濤,等.基于圖斑空間關(guān)系的遙感專家分類方法研究[J].武漢大學學報·信息科學版,2006(4):321-324.
[10]李成名,殷勇,武鵬達,等.一種狹長圖斑分塊融解方法[J].武漢大學學報·信息科學版,2018(12):2259-2268.
[11]盧林,吳紀桃,柳重堪.圖斑數(shù)據(jù)自動概括中面向地理特征的層結(jié)構(gòu)選取[J].武漢大學學報·信息科學版,2006(2):156-159.
[12]史守正,石憶邵,趙偉.橢球面上圖斑面積計算方法的改進[J].武漢大學學報·信息科學版,2018(5):779-785.
[13]徐愛萍,邊馥苓.基于語義查詢樹的GIS中文查詢語句向SQL的轉(zhuǎn)換[J].武漢大學學報·信息科學版,2006(10):924-927.
[14]賈小斌.地圖綜合的智能體技術(shù):以土地利用圖斑綜合為例[J].測繪學報,2015(11):1296-1296.
[15]劉雄,李宇,陳剛.ArcPy支持下的線要素幾何自動接邊與屬性檢查[J].測繪通報,2016(8):114-117.
[16]陳俊勇.地理國情監(jiān)測的學習札記[J].測繪學報,2012(5):633-635.
[17]李維森.地理國情監(jiān)測與測繪地理信息事業(yè)的轉(zhuǎn)型升級[J].地理信息世界,2013(5):11-14.
[18]王家耀,謝明霞.地理國情與復雜系統(tǒng)[J].測繪學報,2016(1):1-8.
[19]贊德伯根.面向ArcGIS的Python腳本編程[M].李明巨,劉昱君,陶旸,等譯.人民郵電出版社,2014:24.