国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多源異構(gòu)POI融合方法的省級(jí)地名地址數(shù)據(jù)庫建設(shè)及應(yīng)用

2019-09-18 03:58:30張景峰
中國(guó)科技縱橫 2019年14期
關(guān)鍵詞:數(shù)據(jù)融合

張景峰

摘 要:隨著數(shù)字城市建設(shè)逐步完成,形成了多源海量的POI數(shù)據(jù)資源,針對(duì)不同來源的POI在數(shù)據(jù)格式、坐標(biāo)參考、屬性結(jié)構(gòu)等方面的差異,綜合運(yùn)用ArcGIS、Geoway、4dConvert軟件,通過數(shù)據(jù)收集分析、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)預(yù)處理、數(shù)據(jù)核查、屬性賦值、數(shù)據(jù)入庫及元數(shù)據(jù)制作等生產(chǎn)環(huán)節(jié),利用ModelBuilder開發(fā)出了與生產(chǎn)相匹配的工具箱,多源異構(gòu)POI的融合方法,建設(shè)統(tǒng)一的、權(quán)威的、內(nèi)容規(guī)整、信息量豐富的省級(jí)地名地址數(shù)據(jù)庫,最后通過保密技術(shù)處理,發(fā)布使用,并持續(xù)更新。該數(shù)據(jù)庫建設(shè)完成后,為“天地圖”省級(jí)節(jié)點(diǎn)提供地名地址在線服務(wù)數(shù)據(jù)集,為數(shù)字城市政務(wù)版、公眾版服務(wù)平臺(tái)提供地名地址數(shù)據(jù)基礎(chǔ)。

關(guān)鍵詞:POI;多源異構(gòu);省級(jí)地名地址數(shù)據(jù)庫;數(shù)據(jù)融合

中圖分類號(hào):P208 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2019)14-0009-02

為滿足國(guó)家信息化建設(shè)中政府部門和社會(huì)公眾對(duì)地理信息在線服務(wù)的迫切需求,國(guó)家測(cè)繪地理信息局提出了構(gòu)建數(shù)字中國(guó)地理空間框架建設(shè)的戰(zhàn)略性決策。數(shù)字省區(qū)、數(shù)字城市、數(shù)字縣區(qū)是數(shù)字中國(guó)的有機(jī)組成部分;地名地址數(shù)據(jù)是對(duì)地名、地址信息的結(jié)構(gòu)化描述與空間化標(biāo)識(shí),其以坐標(biāo)點(diǎn)位的方式描述某一特定空間位置上自然或人文地理實(shí)體的專有名稱和屬性,是社會(huì)經(jīng)濟(jì)信息與地理空間信息通過地理編碼或地址匹配進(jìn)行掛接的媒介與橋梁。地名地址數(shù)據(jù)是數(shù)字省區(qū)、數(shù)字城市地理空間框架建設(shè)、數(shù)字縣區(qū)地理空間框架建設(shè)、“天地圖”省市級(jí)節(jié)點(diǎn)建設(shè)等項(xiàng)目的基礎(chǔ)數(shù)據(jù),是地理信息公共服務(wù)平臺(tái)數(shù)據(jù)的重要組成部分。本文結(jié)合筆者多年從事省級(jí)地名地址數(shù)據(jù)庫建設(shè)及更新的實(shí)踐,探索出一套基于ArcGIS的省級(jí)地名地址數(shù)據(jù)庫建設(shè)方法,為省級(jí)海量地名地址數(shù)據(jù)庫的建設(shè)及動(dòng)態(tài)維護(hù)更新提供了一種新的思路。

1 研究框架

本文研究的核心內(nèi)容為:資料收集完整后,運(yùn)用ArcGIS作業(yè)平臺(tái)對(duì)數(shù)據(jù)進(jìn)行分析,制定作業(yè)方案,實(shí)現(xiàn)多源數(shù)據(jù)的統(tǒng)一分類、統(tǒng)一屬性結(jié)構(gòu),并完成質(zhì)量檢查等,再將數(shù)據(jù)入庫,形成省地名地址數(shù)據(jù)庫成果。數(shù)據(jù)生產(chǎn)流程按其先后順序,可分為數(shù)據(jù)分析、坐標(biāo)轉(zhuǎn)換、數(shù)據(jù)提取、數(shù)據(jù)組織重構(gòu)、生僻字處理、數(shù)據(jù)核查、屬性項(xiàng)完善、入庫前檢查、數(shù)據(jù)入庫及元數(shù)據(jù)制作10個(gè)部分。具體生產(chǎn)流程如圖1所示。

2 研究?jī)?nèi)容

2.1 數(shù)據(jù)準(zhǔn)備

對(duì)獲取的大量的POI數(shù)據(jù)進(jìn)行預(yù)處理,處理的過程是首先進(jìn)行坐標(biāo)轉(zhuǎn)換,再利用ArcGIS ModelBuilder對(duì)數(shù)據(jù)進(jìn)行清洗,以保證用于融合的數(shù)據(jù)的質(zhì)量。主要包括以下內(nèi)容。

(1)對(duì)源數(shù)據(jù)進(jìn)行分析,通過自主開發(fā)的4dConvert進(jìn)行坐標(biāo)轉(zhuǎn)換,統(tǒng)一坐標(biāo)系;

(2)數(shù)據(jù)格式的統(tǒng)一,非漢字字符統(tǒng)一使用英文字符,并對(duì)特殊字符進(jìn)行刪除處理,處理屬字段中出現(xiàn)的分融符;

(3)政區(qū)實(shí)體處理,政區(qū)實(shí)體處理是地名點(diǎn)屬性賦值和數(shù)據(jù)劃分作業(yè)單元的基礎(chǔ),在鋪開作業(yè)前必須完成;

(4)數(shù)據(jù)提取,從多源導(dǎo)構(gòu)數(shù)據(jù)中提取地名地址數(shù)據(jù),數(shù)據(jù)提取要求:1)行政區(qū)域名提取注記數(shù)據(jù),包括注記點(diǎn)位置、名稱、分類代碼和政區(qū)編碼;2)街巷名提取注記數(shù)據(jù),包括注記點(diǎn)位置、名稱和分類代碼;3)小區(qū)名提取注記數(shù)據(jù),包括注記點(diǎn)位置、名稱和分類代碼;4)標(biāo)志物名和興趣點(diǎn)名提取注記數(shù)據(jù),包括注記點(diǎn)位置、名稱和分類代碼;5)門(樓)址名提取注記數(shù)據(jù),包括注記點(diǎn)位置、名稱和分類代碼。

2.2 數(shù)據(jù)預(yù)處理

(1)空值檢查,由于數(shù)據(jù)源的原因,許多地名點(diǎn)并沒有NAME屬性,而NAME屬性又為地名地址數(shù)據(jù)庫屬性的的必填字段,在對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換和分層處理前,需要對(duì)NAME屬性為空的點(diǎn)進(jìn)行刪除或?qū)Υ_有必要保留的地名點(diǎn)補(bǔ)充NAME屬性;

(2)數(shù)據(jù)分類的初步處理,數(shù)據(jù)在采集過程中有可能因?yàn)榉诸悩?biāo)準(zhǔn)不同而歸類到不同的地名類別中,所以為了對(duì)數(shù)據(jù)進(jìn)行正確的分類,需要對(duì)各個(gè)數(shù)據(jù)源的數(shù)據(jù)分別進(jìn)行分類的初步處理,通過對(duì)照數(shù)據(jù)源的分類代碼表及數(shù)據(jù)中實(shí)際所包含的地名點(diǎn)名稱進(jìn)行對(duì)照;

(3)代碼轉(zhuǎn)換和分層,將不同數(shù)據(jù)的地物類代碼轉(zhuǎn)換成標(biāo)準(zhǔn)的地名地址代碼

2.3 數(shù)據(jù)核查

以地級(jí)市為作業(yè)單元,參考省地圖院出版的相關(guān)圖件資料對(duì)地名進(jìn)行全面的檢查,并將歸類錯(cuò)誤的地名點(diǎn)修正到正確的類別中。在進(jìn)行POI融合過程中,首先通過Python腳本對(duì)要進(jìn)行同名點(diǎn)判別。根據(jù)相關(guān)文獻(xiàn)資料,采用文本名稱相似度、距離相似度、門址相似度3個(gè)指標(biāo)進(jìn)行判別,在判別過程中,根據(jù)不斷優(yōu)化和試驗(yàn),分別賦予0.5、0.3、0.2的權(quán)重可取得最好的判別效果。對(duì)于兩個(gè)POI對(duì)象,如果總體相似度大于0.8,則判定為疑似同名點(diǎn),并作標(biāo)記,采用人工交互處理方式最終判定,并在數(shù)據(jù)庫中進(jìn)行標(biāo)識(shí),其次,通過人工核對(duì)的方式,進(jìn)行判斷。具體流程圖2所示。

2.4 屬性項(xiàng)完善

所有地名點(diǎn)全部核查并修改完成后,就要對(duì)未賦值的字段按作業(yè)單元通過自主開發(fā)的《省地名地址生產(chǎn)工具箱》進(jìn)行賦值,如圖3所示。

2.5 涉密地名及興趣點(diǎn)刪除

按照《公開地圖內(nèi)容表示若干規(guī)定》及其補(bǔ)充規(guī)定的要求,對(duì)數(shù)據(jù)庫的涉密地名及興趣點(diǎn)數(shù)據(jù)運(yùn)用批處理工具進(jìn)行刪除,生成政務(wù)版和公眾版地名地址數(shù)據(jù)庫。

2.6 建立地名地址數(shù)據(jù)庫管理系統(tǒng)

地名地址數(shù)據(jù)庫管理系統(tǒng)旨在提供地名地址數(shù)據(jù)及相應(yīng)地理實(shí)體數(shù)據(jù)的組織、建庫、維護(hù)、更新、安全管理、數(shù)據(jù)發(fā)布和元數(shù)據(jù)發(fā)布等服務(wù)。因此地名地址數(shù)據(jù)庫管理系統(tǒng)主要實(shí)現(xiàn)地名地址數(shù)據(jù)及相應(yīng)地理實(shí)體數(shù)據(jù)的組織、入庫、維護(hù) 、更新、查詢檢索、瀏覽、定位、距離量算以及對(duì)入庫數(shù)據(jù)的數(shù)據(jù)格式轉(zhuǎn)換等功能。

2.7 基于ArcGIS Server及ModelBuilder的模塊化自動(dòng)更新維護(hù)

(1)首先制作ModelBuilder數(shù)據(jù)處理流程模板,主要將POI處理流程的各階段數(shù)據(jù)處理過程制作可執(zhí)行的腳本。

(2)對(duì)外源性數(shù)據(jù),通過腳本進(jìn)行自動(dòng)化處理并更新入庫。

3 結(jié)語

本文提出了一種基于多源異構(gòu)POI融合方法的省級(jí)地名地址數(shù)據(jù)庫建設(shè)及應(yīng)用方法。該方法通過對(duì)多源異構(gòu)POI空間位置、屬性信息進(jìn)行自動(dòng)化和人工交互比對(duì),確定POI數(shù)據(jù)間融合的機(jī)率和置信度,最終形成全省統(tǒng)一的、權(quán)威的、內(nèi)容規(guī)整、信息量豐富的地名地址數(shù)據(jù)庫,滿足數(shù)字省區(qū)、天地圖建設(shè)和日益增加的LBS的需要??傮w來說,該方法是一種比較實(shí)用、高效的方法,為多源POI資源的整合成為省級(jí)地名地址數(shù)據(jù)庫,作為基礎(chǔ)測(cè)繪數(shù)據(jù)的一部分,數(shù)據(jù)庫建設(shè)完成后通過全省統(tǒng)一發(fā)布和定期更新,為POI數(shù)據(jù)的有效利用、降低POI數(shù)據(jù)的重復(fù)生產(chǎn)提供了一種新的思路,本文成果應(yīng)用在天地圖省級(jí)節(jié)點(diǎn)在線服務(wù)地名地址數(shù)據(jù)集、數(shù)字縣區(qū)、一村一鎮(zhèn)一地圖等項(xiàng)目中,有效降低了建設(shè)成本,取得了顯著的經(jīng)濟(jì)效率和社會(huì)效益。

參考文獻(xiàn)

[1] 邵蕾.網(wǎng)絡(luò)POI數(shù)據(jù)增量更新技術(shù)研究[D].蘭州:蘭州交通大學(xué),2016.

[2] 高新院.基于空間位置信息的多源POI數(shù)據(jù)融合問題的研究[D].青島:中國(guó)海洋大學(xué),2013.

[3] 張巍,高新院,李瑞姍.空間位置信息的多源POI數(shù)據(jù)融合[J].中國(guó)海洋大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,44(7):111-116.

[4] 陳瑞.基于多源POI數(shù)據(jù)的匹配融合方法研究[D].蘭州:蘭州交通大學(xué),2014.

[5] 李瑞姍.基于自然語言處理的多源POI數(shù)據(jù)融合的研究[D].青島:中國(guó)海洋大學(xué),2013.

[6] 王婷婷.基于位置與屬性的多源POI數(shù)據(jù)融合的研究[D].青島:中國(guó)海洋大學(xué),2014.

[7] 曾李陽,齊華,譚明建,等.基于天地圖的POI數(shù)據(jù)采集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].測(cè)繪與空間地理信息,2016,39(3):55-58.

[8] 吳張峰,夏蘭芳.多源異構(gòu)POI融合方法及應(yīng)用[J].測(cè)繪通報(bào),2018(3):143-146.

猜你喜歡
數(shù)據(jù)融合
多傳感器數(shù)據(jù)融合技術(shù)在機(jī)房監(jiān)控系統(tǒng)中的應(yīng)用
《可靠性工程》課程教學(xué)的幾點(diǎn)思考
東方教育(2016年10期)2017-01-16 20:38:46
基于數(shù)據(jù)融合的家庭遠(yuǎn)程監(jiān)護(hù)系統(tǒng)研究
融合K—T和K—L數(shù)據(jù)的洽川濕地水體提取
船舶動(dòng)力定位中的數(shù)據(jù)融合技術(shù)文獻(xiàn)綜述
科技視界(2016年14期)2016-06-08 13:24:00
基于信源編碼的數(shù)據(jù)融合隱私保護(hù)技術(shù)
科技視界(2016年3期)2016-02-26 19:57:53
兩輪自平衡車實(shí)驗(yàn)平臺(tái)的設(shè)計(jì)
自由搜索的BPNN在WSNs數(shù)據(jù)融合中的應(yīng)用
一種基于數(shù)據(jù)融合的新的入侵檢測(cè)框架
多傳感器數(shù)據(jù)融合技術(shù)研究與展望
德化县| 长乐市| 富民县| 麻栗坡县| 普兰县| 浮梁县| 大庆市| 三原县| 三门县| 花莲县| 子长县| 同江市| 将乐县| 湘乡市| 四会市| 永德县| 泸水县| 万盛区| 航空| 新源县| 延庆县| 高雄市| 库尔勒市| 麟游县| 张掖市| 宝鸡市| 湖南省| 沧州市| 巧家县| 卢湾区| 靖西县| 土默特右旗| 定边县| 高尔夫| 涡阳县| 海南省| 徐水县| 沂南县| 新干县| 鹰潭市| 蒙城县|