朱 琳,占 媛
(1.安徽省基礎(chǔ)測(cè)繪信息中心,安徽 合肥 230031)
安徽省地理信息公共服務(wù)平臺(tái)的建設(shè)目的是促進(jìn)地理信息資源的共享和高效利用,提高地理信息公共服務(wù)水平和能力。為進(jìn)一步提升地理信息公共服務(wù)平臺(tái)數(shù)據(jù)資源的豐富性,根據(jù)國(guó)家地理信息公共服務(wù)平臺(tái)建設(shè)要求以及國(guó)家基礎(chǔ)地理信息中心制定的《天地圖數(shù)據(jù)融合技術(shù)要求(2020)》,并針對(duì)本地的數(shù)據(jù)特點(diǎn),統(tǒng)籌利用各類測(cè)繪地理信息數(shù)據(jù)資源,進(jìn)行國(guó)家、省、市級(jí)節(jié)點(diǎn)的數(shù)據(jù)融合,通過(guò)數(shù)據(jù)融合,提高地理信息公共服務(wù)平臺(tái)數(shù)據(jù)的現(xiàn)勢(shì)性,豐富數(shù)據(jù)內(nèi)容,實(shí)現(xiàn)各級(jí)節(jié)點(diǎn)之間數(shù)據(jù)的優(yōu)勢(shì)互補(bǔ),充分發(fā)揮公共服務(wù)平臺(tái)分布式資源的節(jié)點(diǎn)作用,加強(qiáng)分布式資源節(jié)點(diǎn)的協(xié)同能力[1]。
數(shù)據(jù)融合是按照國(guó)家統(tǒng)一的數(shù)據(jù)模型和標(biāo)準(zhǔn),利用最新的國(guó)家主節(jié)點(diǎn)數(shù)據(jù)、省級(jí)節(jié)點(diǎn)數(shù)據(jù)作為數(shù)據(jù)源,進(jìn)行數(shù)據(jù)融合生產(chǎn),形成優(yōu)勢(shì)互補(bǔ)、現(xiàn)勢(shì)性高的地理信息公共服務(wù)平臺(tái)數(shù)據(jù)集[2]。數(shù)據(jù)融合的對(duì)象主要有矢量數(shù)據(jù)、地名地址與興趣點(diǎn)和影像數(shù)據(jù)三大類,其中矢量數(shù)據(jù)和地名地址與興趣點(diǎn)數(shù)據(jù)融合處理是整個(gè)工作的主要內(nèi)容和重點(diǎn),需要根據(jù)融合數(shù)據(jù)源的特點(diǎn),制定數(shù)據(jù)融合方案,對(duì)融合過(guò)程中的關(guān)鍵技術(shù)問(wèn)題進(jìn)行研究,并據(jù)此提出相應(yīng)的對(duì)策,提高融合工作的效率。
融合數(shù)據(jù)源主要包括國(guó)家主節(jié)點(diǎn)和省級(jí)節(jié)點(diǎn)兩類數(shù)據(jù),其中國(guó)家主節(jié)點(diǎn)數(shù)據(jù)為國(guó)家基礎(chǔ)地理信息中心下發(fā)的最新的主節(jié)點(diǎn)母庫(kù)數(shù)據(jù)和導(dǎo)航數(shù)據(jù),省級(jí)節(jié)點(diǎn)數(shù)據(jù)包括本年度更新的省級(jí)母庫(kù)數(shù)據(jù)、基礎(chǔ)測(cè)繪數(shù)據(jù)、地理國(guó)情數(shù)據(jù)、本地POI數(shù)據(jù)和影像數(shù)據(jù),具體數(shù)據(jù)情況如表1所示。
表1 融合數(shù)據(jù)源情況
主節(jié)點(diǎn)數(shù)據(jù)為主節(jié)點(diǎn)母庫(kù)數(shù)據(jù)和導(dǎo)航數(shù)據(jù),主節(jié)點(diǎn)母庫(kù)數(shù)據(jù)為2019年度融合成果數(shù)據(jù),現(xiàn)勢(shì)性為2019年,內(nèi)容包括道路、鐵路、水系、居民地、綠地、地理單元、基礎(chǔ)設(shè)施和POI等要素。導(dǎo)航數(shù)據(jù)現(xiàn)勢(shì)性為2020年,數(shù)據(jù)內(nèi)容主要包括水系、交通、居民地及設(shè)施、植被、地名和POI等要素。其中,主節(jié)點(diǎn)母庫(kù)數(shù)據(jù)中的地鐵要素現(xiàn)勢(shì)性好,且包含完整的省外接邊數(shù)據(jù)。導(dǎo)航數(shù)據(jù)中道路數(shù)據(jù)信息較為豐富,道路模型完整。
省級(jí)節(jié)點(diǎn)數(shù)據(jù)包括省級(jí)節(jié)點(diǎn)母庫(kù)數(shù)據(jù)、基礎(chǔ)測(cè)繪數(shù)據(jù)、地理國(guó)情監(jiān)測(cè)數(shù)據(jù)、本地維護(hù)POI數(shù)據(jù)、在線更新POI數(shù)據(jù)和影像數(shù)據(jù)。省級(jí)節(jié)點(diǎn)母庫(kù)數(shù)據(jù)主要包括矢量和POI兩大類數(shù)據(jù),矢量數(shù)據(jù)是在2019年度融合成果數(shù)據(jù)的基礎(chǔ)上,利用影像數(shù)據(jù)對(duì)城市主城區(qū)范圍進(jìn)行了更新,現(xiàn)勢(shì)性為2020年,數(shù)據(jù)內(nèi)容全面,精度較高。POI數(shù)據(jù)范圍為全省全覆蓋,現(xiàn)勢(shì)性為2020年。 基礎(chǔ)測(cè)繪數(shù)據(jù)現(xiàn)勢(shì)性為2019年,數(shù)據(jù)內(nèi)容主要包括水系、交通、居民地及設(shè)施、境界與政區(qū)、植被等要素,要素內(nèi)容詳細(xì),精度高。地理國(guó)情監(jiān)測(cè)數(shù)據(jù)現(xiàn)勢(shì)性為2019年,本次融合主要用到的是地理國(guó)情監(jiān)測(cè)數(shù)據(jù)中的地理單元要素;本地維護(hù)POI數(shù)據(jù)為我省根據(jù)自身數(shù)據(jù)情況選擇維護(hù)的政務(wù)類興趣點(diǎn),數(shù)據(jù)現(xiàn)勢(shì)性為2020年。 在線更新POI為利用公眾在互聯(lián)網(wǎng)上提供的聯(lián)動(dòng)更新數(shù)據(jù),經(jīng)過(guò)官方審核通過(guò)后作為更新的數(shù)據(jù)源。
數(shù)據(jù)融合時(shí),通過(guò)對(duì)參與融合的不同精度、不同模型地理數(shù)據(jù)進(jìn)行分析比對(duì),從中選取表達(dá)準(zhǔn)確、現(xiàn)勢(shì)性好、精度高、內(nèi)容全的要素進(jìn)行合并,并對(duì)合并后的結(jié)果進(jìn)行幾何拓?fù)?、空間關(guān)系與邏輯一致性處理,使融合后的地理信息數(shù)據(jù)在現(xiàn)勢(shì)性、準(zhǔn)確性、豐富性等方面達(dá)到最優(yōu)[3]。
根據(jù)數(shù)據(jù)源的分析情況,設(shè)計(jì)了合理的數(shù)據(jù)融合總體技術(shù)路線,如圖1所示。
圖1 數(shù)據(jù)融合總體技術(shù)路線圖
3.1.1 數(shù)據(jù)源選擇
矢量數(shù)據(jù)融合的數(shù)據(jù)源包括主節(jié)點(diǎn)母庫(kù)數(shù)據(jù)、導(dǎo)航數(shù)據(jù)、省級(jí)節(jié)點(diǎn)母庫(kù)數(shù)據(jù)、基礎(chǔ)測(cè)繪數(shù)據(jù)和地理國(guó)情監(jiān)測(cè)數(shù)據(jù),按照數(shù)據(jù)融合選取原則及數(shù)據(jù)源分析成果,對(duì)參與融合的數(shù)據(jù)進(jìn)行分類,確定好本底數(shù)據(jù)、新增數(shù)據(jù)和補(bǔ)充數(shù)據(jù)源[4]。具體數(shù)據(jù)源用途如表2所示。
表2 數(shù)據(jù)源用途
3.1.2 處理方法
按照融合的基本原則,對(duì)道路、鐵路、水系、居民地、地理單元、基礎(chǔ)設(shè)施進(jìn)行融合處理,數(shù)據(jù)處理過(guò)程中實(shí)時(shí)疊加高清影像作為參考,如圖2所示。
圖2 矢量數(shù)據(jù)融合流程圖
1)道路數(shù)據(jù)處理時(shí),以省級(jí)節(jié)點(diǎn)母庫(kù)數(shù)據(jù)中路網(wǎng)數(shù)據(jù)為本底,利用基礎(chǔ)測(cè)繪數(shù)據(jù)、導(dǎo)航數(shù)據(jù)與省級(jí)節(jié)點(diǎn)數(shù)據(jù)變化對(duì)比結(jié)果,依據(jù)現(xiàn)勢(shì)性、數(shù)據(jù)精確度、空間關(guān)系合理性等進(jìn)行融合處理[5]。
2)鐵路數(shù)據(jù)處理時(shí),以省級(jí)節(jié)點(diǎn)母庫(kù)數(shù)據(jù)為本底,導(dǎo)航數(shù)據(jù)、基礎(chǔ)測(cè)繪數(shù)據(jù)作為補(bǔ)充數(shù)據(jù)源進(jìn)行融合處理。
3)地鐵數(shù)據(jù)處理時(shí),以國(guó)家主節(jié)點(diǎn)母庫(kù)數(shù)據(jù)為本底,充分結(jié)合各類數(shù)據(jù)源,保持地鐵數(shù)據(jù)的信息完整。地鐵站點(diǎn)捕捉在地鐵線上,地鐵站點(diǎn)及出入口應(yīng)在地鐵面狀數(shù)據(jù)內(nèi)。
4)水系數(shù)據(jù)處理時(shí),對(duì)“新增”與“變化”數(shù)據(jù)進(jìn)行處理,并進(jìn)行屬性融合,融合時(shí)以省級(jí)母庫(kù)數(shù)據(jù)為本底,充分結(jié)合各類數(shù)據(jù)源,保持水系數(shù)據(jù)的信息完整,不應(yīng)出現(xiàn)河流在橋梁處斷開(kāi)、線狀河與面狀河不相接等情況[6]。
5)居民地?cái)?shù)據(jù)處理時(shí),對(duì)“新增”與“變化”數(shù)據(jù)進(jìn)行處理,并進(jìn)行屬性融合,融合時(shí)以省級(jí)母庫(kù)數(shù)據(jù)為本底,充分結(jié)合各類數(shù)據(jù)源,盡可能詳細(xì)地表示出單幢房屋或獨(dú)立構(gòu)建筑物等信息。
6)綠地?cái)?shù)據(jù)處理時(shí),以省級(jí)節(jié)點(diǎn)母庫(kù)數(shù)據(jù)為本底,對(duì)“新增”與“變化”的數(shù)據(jù)進(jìn)行處理,并進(jìn)行屬性融合,融合時(shí)以省級(jí)節(jié)點(diǎn)數(shù)據(jù)為本底,充分結(jié)合各類數(shù)據(jù)源,對(duì)城市綠地進(jìn)行融合處理。
7)地理單元數(shù)據(jù)處理時(shí),以國(guó)情監(jiān)測(cè)數(shù)據(jù)為本底,按照融合技術(shù)要求提取數(shù)據(jù)。
8)基礎(chǔ)設(shè)施數(shù)據(jù)的處理,以基礎(chǔ)測(cè)繪數(shù)據(jù)庫(kù)為本底,按照融合技術(shù)要求提取數(shù)據(jù)。
3.2.1 數(shù)據(jù)源選擇
地名地址與POI的數(shù)據(jù)源包括安徽省導(dǎo)航POI、安徽省導(dǎo)航DM、安徽省母庫(kù)、在線更新POI、省級(jí)本地維護(hù)POI和本底POI。按照數(shù)據(jù)融合選取原則及數(shù)據(jù)源分析成果,對(duì)參與融合的數(shù)據(jù)進(jìn)行分類,確定好本底數(shù)據(jù)、替換數(shù)據(jù)和補(bǔ)充數(shù)據(jù)源。具體數(shù)據(jù)源用途如表3所示。
表3 數(shù)據(jù)源用途
3.2.2 處理方法
1)數(shù)據(jù)一致性處理。根據(jù)《天地圖數(shù)據(jù)融合技術(shù)要求(2020)》要求,依據(jù)國(guó)家統(tǒng)一的數(shù)據(jù)模型和標(biāo)準(zhǔn),對(duì)融合數(shù)據(jù)源進(jìn)行一致性處理,使所有數(shù)據(jù)源的數(shù)據(jù)結(jié)構(gòu)滿足要求。
2)本地維護(hù)類別POI處理。首先選取省級(jí)本地維護(hù)、在線更新數(shù)據(jù)中的政務(wù)大類興趣點(diǎn)數(shù)據(jù)作為融合數(shù)據(jù)源,并對(duì)其進(jìn)行質(zhì)量檢查;然后以省級(jí)本地維護(hù)主數(shù)據(jù)源,在線更新數(shù)據(jù)為補(bǔ)充數(shù)據(jù),對(duì)本地維護(hù)選取類別的興趣點(diǎn)數(shù)據(jù)進(jìn)行融合;對(duì)數(shù)據(jù)進(jìn)行判重、去重處理;按照相關(guān)要求,對(duì)分類、簡(jiǎn)稱、品牌詞、重要度、標(biāo)簽等屬性進(jìn)行制作,最后進(jìn)行質(zhì)量檢查。
3)數(shù)據(jù)融合。首先選取國(guó)家下發(fā)安徽省母庫(kù)數(shù)據(jù)作為融合的本底數(shù)據(jù),將省級(jí)本地維護(hù)數(shù)據(jù)及在線更新POI數(shù)據(jù)整體替換至安徽省母庫(kù)數(shù)據(jù)中,然后將國(guó)家下發(fā)導(dǎo)航數(shù)據(jù)作為補(bǔ)充數(shù)據(jù)融合至更新后的安徽省母庫(kù)數(shù)據(jù)中;對(duì)數(shù)據(jù)進(jìn)行判重、去重處理,判重時(shí)優(yōu)先保留順序?yàn)椋涸诰€更新POI>省級(jí)本地維護(hù)數(shù)據(jù)>安徽省母庫(kù)>安徽省導(dǎo)航數(shù)據(jù)。按照相關(guān)要求,對(duì)數(shù)據(jù)的分類、簡(jiǎn)稱、品牌詞、重要度、標(biāo)簽等屬性進(jìn)行制作,最后進(jìn)行質(zhì)量檢查[7-10]。
數(shù)據(jù)融合是將選取的各類數(shù)據(jù)源進(jìn)行提取合并,在確定本底數(shù)據(jù)源后,需要將其他數(shù)據(jù)源與本底數(shù)據(jù)進(jìn)行針對(duì)性的變化量提取,關(guān)于數(shù)據(jù)比對(duì)問(wèn)題,由于全省的矢量數(shù)據(jù)條目數(shù)較多,如果只用人工方法進(jìn)行比對(duì)分析的話,工作效率低而且難度大。因此在作業(yè)過(guò)程中開(kāi)發(fā)了數(shù)據(jù)比對(duì)工具,利用工具加人工相結(jié)合的方法進(jìn)行變化量提取。
數(shù)據(jù)的變化量提取,主要是對(duì)比數(shù)據(jù)和待比較數(shù)據(jù)的位置和屬性,確定數(shù)據(jù)的變化情況,形成比對(duì)結(jié)果。比對(duì)過(guò)程中主要是通過(guò)同名字段確定同一對(duì)象的關(guān)聯(lián)關(guān)系,在10m的分析半徑內(nèi)確定同一對(duì)象是否發(fā)生位置變化,用待比較字段確定同一對(duì)象是否發(fā)生屬性變化,在比對(duì)結(jié)果中通過(guò)新增字段記錄變化信息。新增“屬性值變化”字段記錄變化后的屬性值,新增“屬性變化”字段記錄發(fā)生屬性變化的字段,新增“變化類型”字段記錄對(duì)象的變化類型。變化類型主要分為“新增”、“刪除”、“圖形變化”、“屬性變化”、“圖屬變化”和“未變化”6種。數(shù)據(jù)比對(duì)工具主要設(shè)置參數(shù)有原始數(shù)據(jù)、參考數(shù)據(jù)、結(jié)果存放、分析半徑、相似度閾值、同名字段和待比較字段等。
在進(jìn)行道路數(shù)據(jù)變化量的分析比對(duì)中,以省級(jí)節(jié)點(diǎn)母庫(kù)數(shù)據(jù)為本底,將最新的導(dǎo)航數(shù)據(jù)和基礎(chǔ)測(cè)繪數(shù)據(jù)分別與省級(jí)節(jié)點(diǎn)母庫(kù)數(shù)據(jù)進(jìn)行分析比對(duì),最后利用工具提取的變化量結(jié)果進(jìn)行數(shù)據(jù)融合。該工具能有效提高數(shù)據(jù)分析比對(duì)效率,在多源數(shù)據(jù)的融合處理工作中具有重要意義。
全省水系量眾多,水系的類型級(jí)別和面積又各不相同,水系顯示級(jí)別定級(jí)是為配圖表達(dá)專門(mén)定義的,主要作用是確定該水系在地圖上的哪一級(jí)別進(jìn)行顯示較為合理。天地圖數(shù)據(jù)融合技術(shù)要求里沒(méi)有具體說(shuō)明水系面顯示級(jí)別字段應(yīng)如何賦值,可能是因?yàn)槿珖?guó)各地的水系情況不盡相同,沒(méi)有做統(tǒng)一的賦值要求。
在水系顯示級(jí)別屬性賦值時(shí)按照天地圖配圖表達(dá)要求,同時(shí)參考省內(nèi)水系的實(shí)際情況和配圖表達(dá)效果,經(jīng)過(guò)多次實(shí)驗(yàn),確定了以面積為指標(biāo)因素的面積指標(biāo)賦值表,如表4所示。首先根據(jù)水系面積來(lái)填寫(xiě)水系顯示級(jí)別值,然后再綜合考慮收集到的水系的重要度信息和連通性因素來(lái)確定水系的最終顯示級(jí)別。
表4 水系顯示級(jí)別面積指標(biāo)
利用多源數(shù)據(jù)進(jìn)行融合后地名地址與興趣點(diǎn)數(shù)據(jù)可能會(huì)出現(xiàn)重復(fù)點(diǎn)的問(wèn)題,即在一定距離內(nèi)出現(xiàn)多個(gè)重復(fù)興趣點(diǎn),在興趣點(diǎn)判重問(wèn)題上,由于全省興趣點(diǎn)條目數(shù)達(dá)一百余萬(wàn)條,人工逐個(gè)檢查耗費(fèi)時(shí)間過(guò)長(zhǎng),工作效率低而且很容易出現(xiàn)遺漏錯(cuò)誤。因此為了提高興趣點(diǎn)判重的工作效率,針對(duì)數(shù)據(jù)的特點(diǎn)開(kāi)發(fā)了數(shù)據(jù)判重處理工具,主要方法是通過(guò)興趣點(diǎn)的名稱屬性和點(diǎn)與點(diǎn)之間的距離來(lái)判斷興趣點(diǎn)的相似度。判重時(shí)將距離設(shè)置在半徑100m內(nèi),然后通過(guò)工具計(jì)算出的相似度值來(lái)人工輔助進(jìn)行判重,相似度在96%以上的認(rèn)為是同名點(diǎn),直接去重。相似度在78%~96%之間的需要人工輔助進(jìn)行判重,若判斷為同名點(diǎn)則直接去重,否則將其作為新增點(diǎn)融合到本底數(shù)據(jù)中。
本文針對(duì)安徽省地理信息公共服務(wù)平臺(tái)融合數(shù)據(jù)源的特點(diǎn),制定了數(shù)據(jù)融合技術(shù)路線,重點(diǎn)闡述了矢量數(shù)據(jù)和地名地址與興趣點(diǎn)的融合方法,同時(shí)對(duì)數(shù)據(jù)融合過(guò)程中的關(guān)鍵技術(shù)進(jìn)行分析和研究,并據(jù)此提出了相應(yīng)的對(duì)策,提高了數(shù)據(jù)融合處理的工作效率,為我省今后開(kāi)展數(shù)據(jù)融合更新工作奠定了良好的技術(shù)基礎(chǔ)。通過(guò)數(shù)據(jù)融合,在提高數(shù)據(jù)現(xiàn)勢(shì)性的同時(shí),也豐富了數(shù)據(jù)的內(nèi)容,從而進(jìn)一步提高了安徽省地理信息公共服務(wù)平臺(tái)對(duì)外提供地理信息服務(wù)的能力。