国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

城市地理編碼的部門(mén)信息共享與應(yīng)用實(shí)踐

2014-12-11 05:56:58衛(wèi)啟云渠偉勇趙振盛
測(cè)繪通報(bào) 2014年10期
關(guān)鍵詞:太原市編碼

衛(wèi)啟云,渠偉勇,黃 鴻,趙振盛

(1.太原市基礎(chǔ)地理數(shù)據(jù)中心,山西太原030009;2.北京星球數(shù)碼(集團(tuán)),北京100190;3.太原市民政局,山西太原030002)

一、引 言

地理編碼又稱(chēng)地址匹配,是將自然語(yǔ)言描述的地址信息根據(jù)地址模型和編碼規(guī)則進(jìn)行智能語(yǔ)義解析,并通過(guò)與地名地址標(biāo)準(zhǔn)庫(kù)進(jìn)行匹配建立與之對(duì)應(yīng)的空間坐標(biāo)信息和地理編碼關(guān)聯(lián)的過(guò)程[1]。

20世紀(jì)60年代中期,美國(guó)為配合由美國(guó)國(guó)情情報(bào)局負(fù)責(zé)的人口普查,做了大量的關(guān)于地址編碼的工作,研究出了雙重獨(dú)立地圖編碼系統(tǒng)(dual independent map encoding,DIME)。80年代后期,美國(guó)國(guó)情普查局將DIME系統(tǒng)發(fā)展為T(mén)IGER(topologically integrated geographic encoding and referencing)系統(tǒng),作為地址編碼的參考系。TIGER在美國(guó)已經(jīng)成為一種公認(rèn)的標(biāo)準(zhǔn),影響力非常大。此外,加拿大也完成了國(guó)家級(jí)的地址編碼數(shù)據(jù)庫(kù)建設(shè);德國(guó)、以色列、澳大利亞等國(guó)家在很早之前也進(jìn)行了許多詳細(xì)的關(guān)于地址編碼技術(shù)的研究工作,并且都已投入了使用。

20世紀(jì)80年代,北京、上海、廣州、深圳等一些城市在地名地址匹配和定位技術(shù)方面開(kāi)發(fā)了一些相應(yīng)的軟件和應(yīng)用,但是沒(méi)有標(biāo)準(zhǔn)的地址編碼數(shù)據(jù)庫(kù),且基本上都是僅限于針對(duì)某個(gè)具體的應(yīng)用系統(tǒng)。

隨著太原市數(shù)字城市建設(shè)的不斷推進(jìn),以及政府對(duì)跨部門(mén)數(shù)據(jù)需求的增加,部門(mén)間數(shù)據(jù)共享成為一個(gè)迫切需要解決的問(wèn)題,人民群眾和各政府部門(mén)對(duì)地名地址數(shù)據(jù)的需求越來(lái)越大,地理編碼系統(tǒng)逐漸成為了豐富共享數(shù)據(jù)、推進(jìn)應(yīng)用的重要手段;而采用地理編碼,快速地將文本形態(tài)的業(yè)務(wù)數(shù)據(jù)空間化,推進(jìn)了GIS在業(yè)務(wù)部門(mén)中的應(yīng)用。本文以太原市地名地址數(shù)據(jù)采集與建庫(kù)項(xiàng)目建設(shè)為契機(jī),結(jié)合數(shù)字太原建設(shè)現(xiàn)狀,實(shí)踐地名地址標(biāo)準(zhǔn)庫(kù)建設(shè)和地理編碼,制定地名地址數(shù)據(jù)更新模式,并將建設(shè)成果在“數(shù)字太原”地理信息公共服務(wù)平臺(tái)、太原各政府部門(mén)應(yīng)用系統(tǒng)及移動(dòng)端上開(kāi)展了一些應(yīng)用,實(shí)現(xiàn)了多部門(mén)業(yè)務(wù)數(shù)據(jù)“落地”及跨部門(mén)數(shù)據(jù)的共享。

二、技術(shù)方案

1.總體技術(shù)架構(gòu)

總體技術(shù)架構(gòu)如圖1所示。

圖1 總體技術(shù)架構(gòu)圖

本研究將充分利用現(xiàn)有軟硬件與網(wǎng)絡(luò)環(huán)境,以現(xiàn)勢(shì)性較高的地形數(shù)據(jù)、影像數(shù)據(jù)、專(zhuān)題數(shù)據(jù)為基礎(chǔ),建設(shè)地名地址標(biāo)準(zhǔn)庫(kù)和地名地址專(zhuān)題庫(kù),形成核心數(shù)據(jù)層;借助工作流引擎、地址匹配引擎、GIS通用組件等,發(fā)布地址匹配、查詢統(tǒng)計(jì)、質(zhì)檢入庫(kù)等功能服務(wù),在“數(shù)字太原”平臺(tái)、應(yīng)用系統(tǒng)、移動(dòng)端開(kāi)展地名地址應(yīng)用。

2.技術(shù)路線

筆者采用ArcGIS+Oracle+.NET技術(shù)平臺(tái)進(jìn)行開(kāi)發(fā),搭建CS架構(gòu)地名地址管理系統(tǒng),搭建BS架構(gòu)的地址匹配引擎和地名服務(wù)發(fā)布系統(tǒng)。

3.關(guān)鍵技術(shù)

(1)基于規(guī)則庫(kù)和實(shí)時(shí)索引的地址匹配技術(shù)

地址分詞是與地址匹配相結(jié)合的過(guò)程,通用的地址一般由行政區(qū)劃和街道地址的詳細(xì)信息構(gòu)成,首先對(duì)整條地址字符串進(jìn)行過(guò)濾,分離出行政區(qū)劃和街道詳細(xì)地址兩部分信息,這就大大縮小了搜索范圍,也加快了搜索速度。對(duì)于街道地址的詳細(xì)信息,通過(guò)地址分詞技術(shù)可以將其分割成最小的地址要素,參考建立的地址匹配的規(guī)則庫(kù),搜索的范圍越來(lái)越小,當(dāng)滿足某一個(gè)規(guī)則時(shí),匹配即完成,這種算法達(dá)到了搜索范圍的彈性伸縮。

這種基于分詞方法的匹配技術(shù)具有一個(gè)明顯的弊端,即對(duì)于詞表中未登錄的詞難以進(jìn)行匹配和切分,同時(shí)在很多情況下由于前后漢字的特殊組合也容易出現(xiàn)錯(cuò)誤的切分。針對(duì)這種情況,可以在地址的規(guī)則庫(kù)中加入存儲(chǔ)常見(jiàn)地址別名、地址歷史名稱(chēng)、地址常見(jiàn)拼寫(xiě)錯(cuò)誤的規(guī)則庫(kù),在進(jìn)行地址分詞匹配之前,先進(jìn)行歧義、錯(cuò)誤、別名地址的匹配監(jiān)測(cè),將大大提高基于地址分詞匹配的精度。

為了應(yīng)用的快捷,地址匹配引擎啟動(dòng)后,會(huì)自動(dòng)關(guān)聯(lián)到地址數(shù)據(jù)并創(chuàng)建索引,整個(gè)過(guò)程只有毫秒級(jí)的延遲,不會(huì)對(duì)使用造成任何影響。地址數(shù)據(jù)更新后,只需更新地址匹配引擎的應(yīng)用實(shí)例,所有更新操作立即生效,實(shí)現(xiàn)更新即展現(xiàn)。

(2)地名地址與實(shí)體地理要素的空間相關(guān)性識(shí)別與關(guān)聯(lián)技術(shù)

太原市主城區(qū)地址詳細(xì)程度精確至建筑物,高密度的地名地址數(shù)據(jù)覆蓋為地名地址與建筑物的空間關(guān)聯(lián)奠定了數(shù)據(jù)基礎(chǔ)。通過(guò)對(duì)地名地址數(shù)據(jù)與建筑物數(shù)據(jù)內(nèi)在關(guān)聯(lián)性進(jìn)行剖析,對(duì)地名地址數(shù)據(jù)與對(duì)應(yīng)的地理空間圖形數(shù)據(jù)(如建筑物、行政區(qū)劃、道路等)進(jìn)行空間相關(guān)性識(shí)別與關(guān)聯(lián);利用地名地址數(shù)據(jù)和建筑物等數(shù)據(jù)各自的空間位置特性,建立起它們相互間的空間關(guān)聯(lián)關(guān)系。

(3)基于中間件技術(shù)的政務(wù)資源一體化交換入庫(kù)

地名地址數(shù)據(jù)要實(shí)現(xiàn)共享交換,務(wù)必要與平臺(tái)集成,各種服務(wù)資源都通過(guò)服務(wù)注冊(cè)的方式注冊(cè)到ESB服務(wù)總線?!皵?shù)字太原”平臺(tái)、移動(dòng)端及第三方系統(tǒng)可以通過(guò)服務(wù)總線檢索自己需要的服務(wù),并進(jìn)行調(diào)用,以支撐各自的應(yīng)用。

基于地名地址實(shí)現(xiàn)政務(wù)資源一體化規(guī)范體系建設(shè)及自動(dòng)化政務(wù)資源交換入庫(kù),以地名地址數(shù)據(jù)和地理編碼技術(shù)為紐帶,建立整個(gè)政務(wù)資源體系與空間信息的關(guān)聯(lián),也建立起政務(wù)資源數(shù)據(jù)間的關(guān)聯(lián),實(shí)現(xiàn)政務(wù)資源數(shù)據(jù)的一體化融合和自動(dòng)入庫(kù);同時(shí),利用地名地址的橋梁作用獲取社會(huì)經(jīng)濟(jì)的詳細(xì)信息,提供標(biāo)準(zhǔn)化的與空間位置信息相關(guān)聯(lián)的屬性數(shù)據(jù),更靈活、便捷地查詢、統(tǒng)計(jì)各種綜合應(yīng)用信息,為社會(huì)經(jīng)濟(jì)、文化、人口、環(huán)境變化、統(tǒng)計(jì)等相關(guān)領(lǐng)域的多源、多層次、多時(shí)空研究奠定基礎(chǔ),為社會(huì)經(jīng)濟(jì)快速發(fā)展提供決策支持。

三、技術(shù)實(shí)現(xiàn)

1.地名地址標(biāo)準(zhǔn)庫(kù)建設(shè)

地名地址標(biāo)準(zhǔn)庫(kù)是地理編碼的核心和關(guān)鍵,筆者參考國(guó)家標(biāo)準(zhǔn)、行業(yè)、地方及企業(yè)標(biāo)準(zhǔn)規(guī)范,結(jié)合太原市數(shù)據(jù)現(xiàn)狀,從現(xiàn)有可獲取的數(shù)據(jù)及外業(yè)采集數(shù)據(jù)中提取、整合、規(guī)整出地名地址數(shù)據(jù),并經(jīng)過(guò)數(shù)據(jù)質(zhì)檢,將數(shù)據(jù)入庫(kù)更新至地名地址標(biāo)準(zhǔn)庫(kù)。地名地址標(biāo)準(zhǔn)庫(kù)建設(shè)流程如圖2所示。

圖2 地名地址標(biāo)準(zhǔn)庫(kù)建設(shè)流程

地名地址標(biāo)準(zhǔn)庫(kù)共定義了涵蓋門(mén)樓址信息、地名信息、時(shí)態(tài)信息等內(nèi)容的34個(gè)字段。為了提高地址匹配和檢索的效率,在標(biāo)準(zhǔn)庫(kù)中將標(biāo)準(zhǔn)地址字段拆分成行政區(qū)劃、街路巷、門(mén)牌號(hào)、樓號(hào)、單元號(hào)、房間號(hào)等字段,并按照《數(shù)字城市地理空間信息公共平臺(tái)地名/地址分類(lèi)、描述及編碼規(guī)則》對(duì)地址進(jìn)行編碼。

2.地理編碼實(shí)現(xiàn)

地理編碼的實(shí)現(xiàn)是將需要匹配的地址字符串進(jìn)行拆分和標(biāo)準(zhǔn)化處理,然后用處理后的關(guān)鍵地址字段的值與地址編碼地址庫(kù)中數(shù)據(jù)對(duì)應(yīng)字段的屬性值進(jìn)行匹配,如果匹配成功,就將該數(shù)據(jù)的坐標(biāo)值賦給屬性表中的相應(yīng)記錄,從而實(shí)現(xiàn)對(duì)該記錄的地址匹配[2]。

在地名地址匹配的過(guò)程中,經(jīng)常需要對(duì)兩類(lèi)數(shù)據(jù)進(jìn)行匹配:一種是只包含地理實(shí)體位置描述信息、而沒(méi)有空間坐標(biāo)的地址數(shù)據(jù),如街道地址、郵政編碼、行政區(qū)劃等;另一種是已經(jīng)包含了相關(guān)地圖定位信息(空間坐標(biāo))的地理參考數(shù)據(jù)(如街道地圖數(shù)據(jù)、行政區(qū)劃地圖數(shù)據(jù)、郵政編碼地圖數(shù)據(jù)等),這些數(shù)據(jù)集合或數(shù)據(jù)庫(kù)在地址匹配過(guò)程中起空間參考的作用[3-4]。完成匹配后,給前者賦予地理空間坐標(biāo),是地理編碼實(shí)現(xiàn)中最核心的部分。

3.地名地址數(shù)據(jù)更新模式

地名地址數(shù)據(jù)的來(lái)源是多方面的,包括太原市公安局、太原市民政局等多個(gè)部門(mén),以及快遞公司及導(dǎo)航數(shù)據(jù)等。在更新機(jī)制上,建立太原市基礎(chǔ)地理數(shù)據(jù)中心與太原市民政局、太原市公安局等政府部門(mén)的協(xié)同管理,社會(huì)公眾參與維護(hù)的更新機(jī)制。數(shù)據(jù)中心管理人員通過(guò)地名地址數(shù)據(jù)庫(kù)管理系統(tǒng)對(duì)發(fā)生變更的地名地址數(shù)據(jù)進(jìn)行增加、修改、刪除;民政部門(mén)各級(jí)管理人員通過(guò)“數(shù)字太原”平臺(tái)提供的空間數(shù)據(jù)或非空間數(shù)據(jù)進(jìn)行上傳→地址匹配→地圖糾正,將更新信息推送至地名地址數(shù)據(jù)庫(kù)服務(wù)系統(tǒng),系統(tǒng)對(duì)重復(fù)數(shù)據(jù)進(jìn)行甄別及標(biāo)準(zhǔn)化處理后,進(jìn)行流程化更新;社會(huì)公眾可以通過(guò)“數(shù)字太原”平臺(tái)客戶端(互聯(lián)網(wǎng))提供的在線標(biāo)繪或地址糾錯(cuò),對(duì)轄區(qū)內(nèi)發(fā)生變更的地名地址數(shù)據(jù)進(jìn)行標(biāo)繪或糾錯(cuò)描述,并將更新信息發(fā)送給平臺(tái)管理員,管理員對(duì)變更信息進(jìn)行甄別及標(biāo)準(zhǔn)化處理,即進(jìn)行流程化更新。

建立地名地址數(shù)據(jù)常態(tài)化的多源協(xié)同收集與集中更新模式,有效地促進(jìn)了地名地址日常管理的質(zhì)態(tài),保障了地名地址數(shù)據(jù)的持續(xù)鮮活。

4.地名地址數(shù)據(jù)應(yīng)用

(1)地名地址數(shù)據(jù)成果與平臺(tái)無(wú)縫連接

地名地址數(shù)據(jù)是“數(shù)字太原”地理空間框架數(shù)據(jù)的重要組成部分,也是“數(shù)字太原”地理信息公共服務(wù)平臺(tái)數(shù)據(jù)擴(kuò)展的有力工具之一。太原地名地址建設(shè)成果與“數(shù)字太原”地理信息公共服務(wù)平臺(tái)的無(wú)縫集成,既完善了平臺(tái)的服務(wù)體系,也通過(guò)平臺(tái)擴(kuò)大了地名地址成果的應(yīng)用范圍,如圖3所示。借助平臺(tái)提供的服務(wù)共享與交換功能,各部門(mén)的業(yè)務(wù)系統(tǒng)可通過(guò)網(wǎng)絡(luò)獲取互聯(lián)網(wǎng)/局域網(wǎng)服務(wù)器端的數(shù)據(jù)服務(wù),在其業(yè)務(wù)系統(tǒng)中實(shí)現(xiàn)以地圖為中心的資源查詢展示功能。

圖3 地名地址數(shù)據(jù)在平臺(tái)端展示效果圖

(2)地名地址與實(shí)體地理要素空間關(guān)聯(lián)

經(jīng)過(guò)省測(cè)繪地理信息局、公安局、民政局等多部門(mén)的提供及外業(yè)地名地址的采集與核查工作,共匯集了太原主城區(qū)400 km228萬(wàn)余條地名地址數(shù)據(jù),地址詳細(xì)程度精確至建筑物。利用地名地址數(shù)據(jù)和建筑物等數(shù)據(jù)各自的空間位置特性,建立起它們相互間的空間關(guān)聯(lián)關(guān)系,就可以通過(guò)建筑物、行政區(qū)劃或道路等找到相關(guān)的地名地址信息,也可以根據(jù)地名地址信息找到其所在的建筑物、行政區(qū)劃或道路。圖4為地名地址數(shù)據(jù)與建筑物實(shí)體關(guān)聯(lián)效果示意圖。

圖4 地名地址與建筑物關(guān)聯(lián)示意圖

(3)部門(mén)業(yè)務(wù)數(shù)據(jù)“落地”及共享

地名地址標(biāo)準(zhǔn)庫(kù)建成后,通過(guò)地址匹配可實(shí)現(xiàn)衛(wèi)生局、教育局等部門(mén)業(yè)務(wù)數(shù)據(jù)的空間化,并對(duì)匹配結(jié)果進(jìn)行質(zhì)檢入庫(kù),形成地名地址數(shù)據(jù)資源;將這部分?jǐn)?shù)據(jù)以服務(wù)的形式發(fā)布至公共服務(wù)平臺(tái),在平臺(tái)上進(jìn)行展示和應(yīng)用;同時(shí),不同部門(mén)之間也可共享并交換專(zhuān)題數(shù)據(jù)服務(wù)。圖5為部門(mén)業(yè)務(wù)數(shù)據(jù)匹配效果。

圖5 部門(mén)業(yè)務(wù)數(shù)據(jù)匹配效果

四、結(jié)束語(yǔ)

地名地址數(shù)據(jù)庫(kù)作為數(shù)字城市的基礎(chǔ),在數(shù)字城市的地理空間框架建設(shè)中起著關(guān)鍵的作用,它既是一個(gè)技術(shù)問(wèn)題,又是一個(gè)標(biāo)準(zhǔn)化問(wèn)題。本文通過(guò)對(duì)太原市地名地址建設(shè)的實(shí)踐,總結(jié)了地名地址標(biāo)準(zhǔn)庫(kù)建設(shè)和地理編碼的主要技術(shù)流程、地名地址數(shù)據(jù)更新模式及地名地址建設(shè)的應(yīng)用成果。在以后的工作中,還需進(jìn)一步提高業(yè)務(wù)兼容性,加大地名地址數(shù)據(jù)應(yīng)用的宣傳與推廣力度,逐步實(shí)現(xiàn)太原市各政府委辦局、企事業(yè)單位的業(yè)務(wù)專(zhuān)題數(shù)據(jù)整合,促進(jìn)城市數(shù)字化、網(wǎng)絡(luò)化、智能化發(fā)展。

[1]唐潔.數(shù)字南昌地址編碼數(shù)據(jù)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)[D].撫州:東華理工大學(xué),2012.

[2]馬照亭,李志剛,孫偉,等.一種基于地址分詞的自動(dòng)地理編碼算法[J].測(cè)繪通報(bào),2011(2):59-62.

[3]程昌秀,于濱.一種基于規(guī)則的模糊中文地址分詞匹配方法[J].地理與地理信息科學(xué),2011,27(3):26-29.

[4]于濱.面向經(jīng)濟(jì)普查項(xiàng)目需求的模糊中文地址匹配方法研究[D].長(zhǎng)沙:中南大學(xué),2010.

猜你喜歡
太原市編碼
太原市61個(gè)村要建污水處理設(shè)施嚴(yán)禁直排入河
太原市園林綠化植物選擇及分析
基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達(dá)圖像配準(zhǔn)
太原市六家藥茶企業(yè)獲省級(jí)授權(quán)
《全元詩(shī)》未編碼疑難字考辨十五則
子帶編碼在圖像壓縮編碼中的應(yīng)用
電子制作(2019年22期)2020-01-14 03:16:24
Genome and healthcare
太原市第四實(shí)驗(yàn)小學(xué)
山西電教(2017年3期)2017-10-19 03:39:16
尼勒克县| 左云县| 咸丰县| 鄢陵县| 太仆寺旗| 视频| 东安县| 嘉兴市| 泸溪县| 威宁| 穆棱市| 治县。| 兴海县| 长海县| 丰镇市| 中超| 竹溪县| 莱芜市| 鄱阳县| 南汇区| 建平县| 威宁| 高雄县| 新宾| 十堰市| 偃师市| 鄂伦春自治旗| 塔河县| 文化| 靖安县| 安新县| 安阳市| 镇巴县| 朝阳县| 东兰县| 镶黄旗| 肥西县| 涟源市| 濮阳县| 津市市| 栾川县|