丁建勛,劉亞楠,張新長(zhǎng),楊文杰
(1. 珠海市測(cè)繪院,廣東 珠海 519015; 2. 中山大學(xué)地理科學(xué)與規(guī)劃學(xué)院,廣東 廣州 510275;3. 廣東省國(guó)土資源技術(shù)中心,廣東 廣州 510075)
?
OpenStreetMap數(shù)據(jù)下的空間數(shù)據(jù)更新方法
丁建勛1,劉亞楠1,張新長(zhǎng)2,楊文杰3
(1. 珠海市測(cè)繪院,廣東 珠海 519015; 2. 中山大學(xué)地理科學(xué)與規(guī)劃學(xué)院,廣東 廣州 510275;3. 廣東省國(guó)土資源技術(shù)中心,廣東 廣州 510075)
摘要:針對(duì)利用專業(yè)測(cè)繪數(shù)據(jù)對(duì)空間數(shù)據(jù)庫更新中存在的現(xiàn)勢(shì)性問題,提出了利用OpenStreetMaps數(shù)據(jù)對(duì)空間數(shù)據(jù)庫進(jìn)行更新的方法。闡述了基于OpenStreetMap數(shù)據(jù)的空間數(shù)據(jù)更新方法的關(guān)鍵理論與技術(shù),特別是OpenStreetMap數(shù)據(jù)與專業(yè)測(cè)繪數(shù)據(jù)的變化要素檢測(cè)算法:基于格網(wǎng)的匹配檢測(cè)算法和基于幾何量算的變化要素檢測(cè)。在此基礎(chǔ)上,利用珠海市的專業(yè)測(cè)繪數(shù)據(jù)與相應(yīng)區(qū)域的OpenStreetMap數(shù)據(jù)作為試驗(yàn)數(shù)據(jù),編程實(shí)現(xiàn)了基于OpenStreetMap的空間數(shù)據(jù)更新。
關(guān)鍵詞:OpenStreetMap;空間數(shù)據(jù);變化要素檢測(cè);數(shù)據(jù)更新
隨著網(wǎng)絡(luò)技術(shù)與GIS技術(shù)的快速發(fā)展,用戶對(duì)地理數(shù)據(jù)的現(xiàn)勢(shì)性要求越來越高[1]。如何保持空間數(shù)據(jù)的現(xiàn)勢(shì)性已經(jīng)成為目前GIS界面臨的重要課題,新興的自發(fā)地理信息(volunteeredgeographicinformation,VGI)為這個(gè)重要的課題提供了一個(gè)全新的解決思路。
VGI是地理信息數(shù)據(jù)獲取的一種全新方式,該數(shù)據(jù)由用戶進(jìn)行編輯提供,用戶既是數(shù)據(jù)的使用者,又是數(shù)據(jù)的提供者,即充分發(fā)揮公眾的參與性,填補(bǔ)了當(dāng)前地理數(shù)據(jù)采集的不足,同時(shí)其現(xiàn)實(shí)性高、細(xì)節(jié)豐富、獲取免費(fèi)。目前比較成功的VGI平臺(tái)有OpenStreetMap(OSM)、GoogleMapMarker、維基地圖[2],本文主要結(jié)合OSM數(shù)據(jù)進(jìn)行更新方法的研究。
一、關(guān)鍵技術(shù)分析
1. OSM數(shù)據(jù)預(yù)處理
為了使OSM數(shù)據(jù)與專業(yè)測(cè)繪數(shù)據(jù)的匹配最優(yōu)化,在進(jìn)行更新操作之前需要對(duì)OSM數(shù)據(jù)進(jìn)行預(yù)處理,通過分析OSM數(shù)據(jù)可以發(fā)現(xiàn)其具有以下特點(diǎn):
1)OSM數(shù)據(jù)中道路數(shù)據(jù)比較豐富,其他類型的數(shù)據(jù)信息量并不豐富。
2) 道路數(shù)據(jù)分為不同的等級(jí),包括一級(jí)道路、二級(jí)道路、居民地道路、高速公路、人行道等。
3)OSM數(shù)據(jù)中道路線不僅用單線表示,部分道路線還會(huì)用雙線表示。
4)OSM數(shù)據(jù)中通常一個(gè)要素代表一條道路,與專業(yè)測(cè)繪數(shù)據(jù)中差別比較大。
鑒于以上的數(shù)據(jù)特點(diǎn),OSM數(shù)據(jù)的預(yù)處理主要包括以下4個(gè)部分:①根據(jù)需要提取OSM中的有效數(shù)據(jù);②提取雙線道路數(shù)據(jù)的中心線;③減少OSM數(shù)據(jù)和專業(yè)測(cè)繪數(shù)據(jù)之間的幾何誤差;④對(duì)OSM數(shù)據(jù)節(jié)點(diǎn)分割,使OSM數(shù)據(jù)和專業(yè)測(cè)繪數(shù)據(jù)的匹配盡可能達(dá)到1∶1[3]。
2. 變化要素檢測(cè)
OSM數(shù)據(jù)與專業(yè)測(cè)繪數(shù)據(jù)的變化要素檢測(cè)是整個(gè)更新流程的核心部分,變化要素檢測(cè)算法要求能精確、快速地查找出OSM數(shù)據(jù)相對(duì)于數(shù)據(jù)庫中專業(yè)測(cè)繪數(shù)據(jù)的變化部分。
本節(jié)基于自發(fā)地理信息數(shù)據(jù)更新的特點(diǎn)提出了適用于自發(fā)地理信息數(shù)據(jù)更新的變化要素檢測(cè)方法,分別介紹了格網(wǎng)的劃分方法、利用線要素經(jīng)過的格網(wǎng)面積計(jì)算重疊度,以及根據(jù)重疊度的數(shù)值判斷要素的變化情況[4]。
(1) 格網(wǎng)的劃分
首先需要建立完全覆蓋OSM數(shù)據(jù)與專業(yè)測(cè)繪數(shù)據(jù)的格網(wǎng),建立格網(wǎng)的步驟如下:
1) 對(duì)比要進(jìn)行變化要素檢測(cè)的OSM數(shù)據(jù)與專業(yè)測(cè)繪數(shù)據(jù)的邊界范圍,選取范圍的標(biāo)準(zhǔn)如下
(1)
式中,c表示專業(yè)測(cè)繪數(shù)據(jù);p表示OSM數(shù)據(jù)。
2) 選定格網(wǎng)的范圍后,對(duì)數(shù)據(jù)范圍區(qū)域進(jìn)行劃分??紤]到區(qū)域連續(xù)性、一致性和完整性,根據(jù)OSM數(shù)據(jù)和專業(yè)測(cè)繪數(shù)據(jù)的大小將整個(gè)區(qū)域等分成若干相鄰的等正方形[5],等分成的小正方形的數(shù)量可用下式表示
(2)
式中,Xmax、Xmin分別表示數(shù)據(jù)范圍的X坐標(biāo)的最大值和最小值;Ymax、Ymin表示數(shù)據(jù)范圍Y坐標(biāo)的最大值和最小值;numX表示X軸方向格網(wǎng)的列數(shù);numY表示Y軸方向格網(wǎng)的行數(shù);width表示格網(wǎng)的寬度;height表示格網(wǎng)的高度。
(2) 線目標(biāo)格網(wǎng)索引幾何確定
本文采用的線要素經(jīng)過格網(wǎng)的集合與線要素的緩沖區(qū)具有圖形上的相似性,可以將格網(wǎng)面要素的集合當(dāng)作線要素的變異緩沖區(qū),而線要素經(jīng)過的格網(wǎng)的集合是與線要素相交的格網(wǎng)的集合,不需要重新建立線要素的緩沖區(qū)[6]。
設(shè)線要素的可用節(jié)點(diǎn)的幾何表示為{node1,node2,…,noden},與線要素相交的格網(wǎng)索引可表示為{Grid1,Grid2,…,Gridm},如圖1所示。
圖1 線要素相交格網(wǎng)集合
利用相交格網(wǎng)的方法比利用緩沖區(qū)的方法更適用于自發(fā)地理信息與專業(yè)測(cè)繪數(shù)據(jù)的變化檢測(cè)匹配,該方法能夠過濾變化較小的要素,因?yàn)楫?dāng)格網(wǎng)的邊長(zhǎng)設(shè)置一個(gè)合理的值時(shí),即使要素發(fā)生較小的變化,相交的格網(wǎng)仍然相同或僅有很小部分的差別??梢园l(fā)現(xiàn),由于道路數(shù)據(jù)發(fā)生了微小的改變,但OSM數(shù)據(jù)的相交格網(wǎng)僅發(fā)生了一個(gè)格網(wǎng)的變化,深色框中的格網(wǎng)消失,新增了淺色框中的格網(wǎng),如圖2所示。
圖2 較小變化的線要素相交格網(wǎng)集合
(3) 重疊度計(jì)算
變化區(qū)域的專業(yè)測(cè)繪數(shù)據(jù)要素集合為A{a1,a2,…,an},變化區(qū)域的OSM數(shù)據(jù)要素集合為B{b1,b2,…,bn}。本文利用雙向匹配檢測(cè)法對(duì)變化要素進(jìn)行匹配檢測(cè),首先利用專業(yè)測(cè)繪數(shù)據(jù)對(duì)OSM數(shù)據(jù)進(jìn)行搜索,檢測(cè)出專業(yè)測(cè)繪數(shù)據(jù)相對(duì)于OSM數(shù)據(jù)中刪除的變化類型要素;然后利用OSM數(shù)據(jù)對(duì)專業(yè)測(cè)繪數(shù)據(jù)進(jìn)行搜索,檢測(cè)出OSM數(shù)據(jù)相對(duì)于專業(yè)測(cè)繪數(shù)據(jù)要素新增、移動(dòng)、合并、分割等變化類型[7],見表1。
表1 搜索類型表
本文將要素的變化類型歸為兩類:新增和刪除。
進(jìn)行搜索匹配前,需建立一個(gè)臨時(shí)庫并新建一個(gè)要素類,變化檢測(cè)中變化的要素將存儲(chǔ)在臨時(shí)庫的變化要素類中,此變化要素類保留了專業(yè)測(cè)繪數(shù)據(jù)和OSM數(shù)據(jù)中的屬性字段,同時(shí)新建了兩個(gè)屬性字段,分別用來存放變化要素在專業(yè)測(cè)繪數(shù)據(jù)和OSM數(shù)據(jù)中的ID及要素變化類型。
利用專業(yè)測(cè)繪數(shù)據(jù)線要素的相交格網(wǎng)集合{Grid1,Grid2,…,Gridm}與OSM數(shù)據(jù)線要素的相交格網(wǎng)集合{grid1,grid2,…,gridn}作為操作對(duì)象。
首先利用專業(yè)測(cè)繪數(shù)據(jù)對(duì)OSM數(shù)據(jù)進(jìn)行搜索匹配,即遍歷專業(yè)測(cè)繪數(shù)據(jù)中的線要素,判斷OSM數(shù)據(jù)中是否有要素的相交格網(wǎng)集合與專業(yè)測(cè)繪數(shù)據(jù)中的相交格網(wǎng)集合相交。如果專業(yè)測(cè)繪數(shù)據(jù)的某個(gè)要素的相交格網(wǎng)集合與OSM數(shù)據(jù)中的所有要素的相交格網(wǎng)集合均沒有相交,則判定參考數(shù)據(jù)中的該要素已經(jīng)在匹配數(shù)據(jù)中刪除,將該要素存入臨時(shí)庫中并將該要素的操作類型賦值為“刪除”。
遍歷OSM數(shù)據(jù)中的線要素,獲得線要素的相交格網(wǎng)集合,判斷專業(yè)測(cè)繪數(shù)據(jù)中是否有要素的格網(wǎng)集合與其相交,如果專業(yè)測(cè)繪數(shù)據(jù)中不存在,則此要素為新增要素,將該要素存入臨時(shí)庫并將其操作類型賦值為“新增”;如果專業(yè)測(cè)繪數(shù)據(jù)中存在要素的格網(wǎng)集合與OSM數(shù)據(jù)中的要素的格網(wǎng)集合相交的要素,則需要計(jì)算數(shù)據(jù)之間要素的重疊度,重疊度的計(jì)算公式如下
S=Area[Grid(Ai)∩Grid(Bi)]/
Area[Grid(Ai)∪Grid(Bi)]
(3)
式中,S表示重疊度;Ai表示專業(yè)測(cè)繪數(shù)據(jù)中的要素;Bi表示OSM數(shù)據(jù)中的要素,此要素的格網(wǎng)集合與Ai的格網(wǎng)集合相交;Grid(Ai)表示專業(yè)測(cè)繪數(shù)據(jù)中要素Ai的相交格網(wǎng)集合;Grid(Bi)表示OSM數(shù)據(jù)中的要素Bi的相交格網(wǎng)索引;Area[Grid(Ai)∩Grid(Bi)]表示相交格網(wǎng)集合Grid(Ai)與Grid(Bi)的交集面積;Area[Grid(Ai)∪Grid(Bi)]表示相交格網(wǎng)集合Grid(Ai)與Grid(Bi)的并集面積。
在理想情況下,若專業(yè)測(cè)繪數(shù)據(jù)中的要素和OSM數(shù)據(jù)中的要素相比沒有發(fā)生變化或發(fā)生較微小變化時(shí),重疊度S應(yīng)等于1[8]。如果專業(yè)測(cè)繪數(shù)據(jù)中的要素相對(duì)于OSM數(shù)據(jù)中的要素中發(fā)生了小范圍的移動(dòng),則S的范圍在0~1之間(不包括0和1),但在實(shí)際工作中,由于數(shù)據(jù)精度等的原因,通常會(huì)有上下閾值。
重疊度S根據(jù)數(shù)據(jù)的特點(diǎn)可以分為以下的情況:
1) 重疊度S=0,說明OSM數(shù)據(jù)中的要素為新增的要素。
2) 重疊度0
3) 重疊度Q1
4) 重疊度Q2
5) 重疊度S=1,說明OSM數(shù)據(jù)中的要素與專業(yè)測(cè)繪數(shù)據(jù)中的要素完全匹配,并沒有發(fā)生任何變化。
當(dāng)檢測(cè)到要素發(fā)生變化時(shí),將專業(yè)測(cè)繪數(shù)據(jù)中的要素存入臨時(shí)庫,將操作類型賦值為“刪除”,然后將OSM數(shù)據(jù)中的要素存入臨時(shí)庫,在操作類型中標(biāo)注為“新增”。
3. 空間沖突檢測(cè)
在利用OSM數(shù)據(jù)對(duì)空間數(shù)據(jù)庫進(jìn)行更新時(shí),需要對(duì)更新后的道路線數(shù)據(jù)進(jìn)行空間沖突的檢測(cè)與處理,使最終的數(shù)據(jù)結(jié)果符合現(xiàn)實(shí)地理實(shí)體的表達(dá)。
(1) 沖突約束規(guī)則表達(dá)式
本文在研究空間沖突檢測(cè)方法的基礎(chǔ)上,結(jié)合空間完整性約束表達(dá)式,增加幾何約束規(guī)則和屬性約束規(guī)則,用約束集合的形式表示沖突規(guī)則的約束[9]。
rule={ID,F(xiàn)eaTureClass1,F(xiàn)eatureClass2,
TopoRule,GeoRule,AttriRule}
(4)
式中,ID表示沖突規(guī)則的編號(hào);FeaTureClass1和FeatureClass2表示規(guī)則約束的要素類;TopoRule表示拓?fù)錄_突約束規(guī)則;GeoRule表示幾何度量沖突約束規(guī)則;AttriRule表示屬性沖突約束規(guī)則。
(2) 沖突約束規(guī)則
根據(jù)數(shù)據(jù)間的特點(diǎn),制定了道路網(wǎng)常用的沖突規(guī)則約束。設(shè)更新后的道路線要素類為A,沖突檢查要素類為B,A中的要素集合可表示為{a1,a2,…,an},B的要素集合可表示為{b1,b2,…,bm}。
規(guī)則一:當(dāng)更新后的道路要素類中兩個(gè)道路線要素的交點(diǎn)多于閾值時(shí),判定為發(fā)生沖突的要素。
規(guī)則二:當(dāng)更新后的道路線要素類中兩個(gè)道路線的相鄰交點(diǎn)間的距離小于閾值時(shí),則判定為發(fā)生沖突的要素。
規(guī)則三:當(dāng)沖突檢測(cè)要素類為居民地面數(shù)據(jù)時(shí),若存在道路線要素穿過居民地要素,則判定為發(fā)生沖突的要素。
規(guī)則四:當(dāng)沖突檢測(cè)要素類為河流線數(shù)據(jù)時(shí),若存在道路線要素與河流線要素的夾角小于某個(gè)角度,則判定為發(fā)生沖突的要素[10]。
二、試驗(yàn)分析
本文選取珠海市某區(qū)域作為研究對(duì)象,試驗(yàn)數(shù)據(jù)分別為珠海小比例尺專業(yè)測(cè)繪數(shù)據(jù)和從網(wǎng)上獲取的OSM數(shù)據(jù),如圖3所示。
圖3
可以發(fā)現(xiàn),OSM數(shù)據(jù)相對(duì)于專業(yè)測(cè)繪數(shù)據(jù)有要素發(fā)生了變化:①道路線消失;②新增了若干條道路線;③部分OSM道路線形狀和專業(yè)測(cè)繪數(shù)據(jù)大致相同,但發(fā)生了少量偏移;④部分OSM數(shù)據(jù)相對(duì)于專業(yè)測(cè)繪數(shù)據(jù)形狀大致相同,部分細(xì)節(jié)有所差別。其中①、②屬于道路線新增和刪除,③、④屬于OSM中“偽更新”的要素?cái)?shù)據(jù);①、②屬于需要更新的變化要素,③、④屬于不需要更新的變化要素。
1. 基于格網(wǎng)的變化要素檢測(cè)結(jié)果
試驗(yàn)中首先利用基于緩沖區(qū)的變化要素檢測(cè)對(duì)要素進(jìn)行變化要素的檢測(cè)匹配,經(jīng)過處理的OSM數(shù)據(jù)仍然在細(xì)節(jié)方面與專業(yè)測(cè)繪數(shù)據(jù)有很大差別。而利用基于格網(wǎng)的變化要素檢測(cè),通過設(shè)置合適的格網(wǎng)大小,能去除變化檢測(cè)中較小變化的影響,去除結(jié)果如圖4所示。
圖4 基于格網(wǎng)的變化要素檢測(cè)
2. 基于幾何信息量的變化要素檢測(cè)結(jié)果
基于格網(wǎng)的初次匹配檢測(cè)能去除一部分細(xì)小變化影響,但不能去除所有的“偽更新”要素,通過幾何信息量算對(duì)初次匹配檢測(cè)的結(jié)果進(jìn)行再次匹配檢測(cè),檢測(cè)結(jié)果如圖5所示。
圖5 去除“偽更新”要素后的新增要素
三、結(jié)束語
本文在基于自發(fā)地理信息數(shù)據(jù)的空間數(shù)據(jù)更新方面進(jìn)行了相關(guān)的研究工作,提出了一些實(shí)現(xiàn)方法,設(shè)計(jì)了技術(shù)路線,并在自發(fā)地理信息數(shù)據(jù)和專業(yè)測(cè)繪數(shù)據(jù)變化檢測(cè)匹配中提出了相應(yīng)的方法,作了一些利用自發(fā)地理信息數(shù)據(jù)作為更新數(shù)據(jù)源更新空間數(shù)據(jù)庫的嘗試。然而,基于自發(fā)地理信息數(shù)據(jù)的空間數(shù)據(jù)更新仍然處于剛剛起步的階段,現(xiàn)階段的研究相對(duì)較少,因此,本文提出的方法難免出現(xiàn)一些問題,需要深入研究和進(jìn)一步完善。
參考文獻(xiàn):
[1]趙仁亮,陳軍.數(shù)字環(huán)境下的數(shù)據(jù)縮編更新方法[J]. 地理信息世界,2008(3):17-21.
[2]李德仁,錢新林.淺論自發(fā)地理信息的數(shù)據(jù)管理[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2010,35(4):379-383.
[3]HAKLAY M. How Good is Volunteered Geographical Information? A Comparative Study of OpenStreetMap and Ordnance Survey Datasets [J]. Environment and Planning B Planning and Design, 2010 (37): 682-703.
[4]田文文.基于自發(fā)地理信息的空間數(shù)據(jù)變化發(fā)現(xiàn)與更新方法研究[D].武漢:武漢大學(xué),2013.
[5]陳玉敏,龔健雅,史文中.多尺度道路網(wǎng)的距離匹配算法[J].測(cè)繪學(xué)報(bào),2007, 36(1):84-90.
[6]郭泰圣,張新長(zhǎng),梁志宇.神經(jīng)網(wǎng)絡(luò)決策樹的矢量數(shù)據(jù)變化信息快速識(shí)別方法[J].測(cè)繪學(xué)報(bào),2013,42(6):937-944.
[7]張新長(zhǎng),郭泰圣,唐鐵.一種自適應(yīng)的矢量數(shù)據(jù)增量更新方法研究[J].測(cè)繪學(xué)報(bào),2012,41(4):613-619.
[8]陳舒燕.基于OpenStreetMap的出行可達(dá)性分析與實(shí)現(xiàn)[D].上海:上海師范大學(xué),2010.
[9]羅國(guó)瑋,張新長(zhǎng),齊立新,等.矢量數(shù)據(jù)變化對(duì)象的快速定位與最優(yōu)組合匹配方法[J]. 測(cè)繪學(xué)報(bào),2014,43(12):1285-1292.
[10]宋振.線目標(biāo)空間沖突自動(dòng)檢測(cè)研究現(xiàn)狀[J].測(cè)繪,2009(6):246-248.
Research on Updating Spatial Data Combined with Open Street Map
DING Jianxun,LIU Yanan,ZHANG Xinchang,YANG Wenjie
收稿日期:2016-03-07
基金項(xiàng)目:國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目(41431178)
作者簡(jiǎn)介:丁建勛(1973—),男,高級(jí)工程師,主要研究方向?yàn)槌鞘袦y(cè)量新技術(shù)應(yīng)用與管理。E-mail:djxrr@126.com
中圖分類號(hào):P208
文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):0494-0911(2016)06-0094-04
引文格式: 丁建勛,劉亞楠,張新長(zhǎng),等.OpenStreetMap數(shù)據(jù)下的空間數(shù)據(jù)更新方法[J].測(cè)繪通報(bào),2016(6):94-97.DOI:10.13474/j.cnki.11-2246.2016.0199.