張 亮,覃俊華,王愛華,戴 騰,趙 鵬
(1.湖北省測繪工程院,湖北 武漢 430074;2.山東省國土測繪院,山東 濟(jì)南 250013)
基礎(chǔ)測繪成果對各行各業(yè)高質(zhì)量發(fā)展起到了基礎(chǔ)性、保障性和先導(dǎo)性作用[1],當(dāng)前基礎(chǔ)地理信息仍然以點(diǎn)、線、面等幾何圖元的方式組織存儲。隨著我國經(jīng)濟(jì)的發(fā)展,數(shù)據(jù)應(yīng)用的深入,這種組織方式的缺點(diǎn)逐漸暴露,即概念完整的地理實體如河流、道路等被分割成多個對象,難以提取和更新與之相關(guān)的經(jīng)濟(jì)、社會和人口信息;地理實體屬性在時間上的差異未能體現(xiàn);地理實體的關(guān)聯(lián)信息通過實時計算得到,空間分析效率低下;沒能實現(xiàn)對異構(gòu)數(shù)據(jù)源的關(guān)聯(lián)管理,不便于聯(lián)動更新。隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算、人工智能等技術(shù)的興起,地理信息數(shù)據(jù)應(yīng)用逐漸深入,亟待由傳統(tǒng)的基于幾何圖元方式組織向基于地理實體組織方式轉(zhuǎn)變。
國家測繪地理信息“十三五”規(guī)劃整體思路中也強(qiáng)調(diào),加快推進(jìn)基礎(chǔ)地理信息數(shù)據(jù)庫建設(shè)的轉(zhuǎn)型,逐步建立基于最詳細(xì)的地理實體的成果采集和管理模式[2]。因此,建設(shè)地理實體時空數(shù)據(jù)庫具有很強(qiáng)的現(xiàn)實意義。
國內(nèi)外學(xué)者從不同角度對地理實體展開了研究,美國聯(lián)邦地理數(shù)據(jù)委員會(FGDC)對地籍、行政管理單元、水系、交通四類標(biāo)準(zhǔn)數(shù)據(jù)采用了面向?qū)嶓w建模[3]。歐洲議會2007年通過建設(shè)歐盟空間信息基礎(chǔ)設(shè)施(INSPIRE)的決議后,推出了一系列盡可能地采用面向?qū)嶓w的數(shù)據(jù)建模的地理數(shù)據(jù)規(guī)范[4]。蔣捷[5]等提出將地理信息公服務(wù)平臺設(shè)計成面向?qū)ο髮嶓w;于天星[5]等設(shè)計了“三級空間”和“0~1位置變化序列”的地理實體時空位置的多粒度表達(dá)方法;張翼然[7]等研究了地理實體的空間組織與多態(tài)特征,以房屋建筑實體為例介紹了數(shù)據(jù)融合;閭國年[7]等整理了面向“智慧城市”建設(shè)的地理實體科學(xué)分類與編碼體系的構(gòu)建思路;趙云鵬[9]等從矢量空間數(shù)據(jù)表達(dá)視角對地理實體的語義信息進(jìn)行分析和描述,提出了基于多特征約束的語義相似性度量模型,并應(yīng)用于道路實體匹配。
這些研究分別從概念、分類、編碼、數(shù)據(jù)融合等多方面對地理實體進(jìn)行了闡述和總結(jié),本文基于面向?qū)ο笏枷?,設(shè)計了一種地理實體時空數(shù)據(jù)模型,探討了其在數(shù)據(jù)庫中的組織與存儲和具體構(gòu)建方法,為今后基于地理實體的新型基礎(chǔ)測繪地理實體數(shù)據(jù)生產(chǎn)奠定基礎(chǔ)。
針對傳統(tǒng)地理數(shù)據(jù)模型存在的問題,設(shè)計了基于地理實體的時空數(shù)據(jù)模型。地理實體的時空數(shù)據(jù)概念模型主要由三部分組成:空間信息、屬性信息、關(guān)聯(lián)信息,如圖1所示。
圖1 地理實體時空數(shù)據(jù)概念模型
空間信息描述地理實體的幾何特征和位置信息,以復(fù)合幾何類型或簡單幾何類型圖形來表示。復(fù)合幾何類型是簡單幾何類型的集合,簡單幾何類型通常為點(diǎn)、線、面、體中的一種。屬性信息用以描述地理實體的基本屬性,一般包括識別信息、特征信息、狀態(tài)信息、其他專題信息。關(guān)聯(lián)信息用以描述兩個地理實體間的聯(lián)系,此為傳統(tǒng)以圖元表示數(shù)據(jù)模型中缺失的部分,可包括時間關(guān)系、空間關(guān)系、語義關(guān)系、事件關(guān)系4個方面。
地理實體間的時間關(guān)系用來銜接同一地理位置的不同地理實體,可采用時間謂詞來描述,時間謂詞有“before”和“after”。
空間關(guān)系包括拓?fù)潢P(guān)系、方向關(guān)系和距離關(guān)系。拓?fù)潢P(guān)系包括相離、相接/鄰接、重疊/相交、包含等,距離關(guān)系包括遠(yuǎn)、相鄰、近等,可根據(jù)應(yīng)用需求進(jìn)行定義。方向關(guān)系有基本方向關(guān)系和組合方向關(guān)系兩類,基本方位關(guān)系分為東、南、西、北4個方位,組合方向關(guān)系為基本方向關(guān)系的組合,如東北、東南等。
語義關(guān)系主要包括繼承、依賴、組合、聚合等。繼承關(guān)系是為了指定地理實體的類別。依賴關(guān)系旨在把某些地理實體的相關(guān)屬性關(guān)聯(lián)到其他地理實體的屬性上,以實現(xiàn)數(shù)據(jù)的聯(lián)動更新,如某省級行政區(qū)劃的人口依賴于下轄市級行政區(qū)劃的人口,二者關(guān)聯(lián)可實現(xiàn)同步變化。組合關(guān)系描述地理實體和其組成部分的關(guān)系,一旦作為整體的地理實體不存在了,作為組成部分的地理實體也不復(fù)存在。聚合關(guān)系與組合關(guān)系的區(qū)別在于即使作為整體的地理實體不存在了,作為組成部分的地理實體仍然存在,例如一個街區(qū)由多個房屋組成,街區(qū)因合并等原因不存在了,但街區(qū)中房屋實體仍然存在。事件關(guān)系指2個實體之間因為某個事件產(chǎn)生了關(guān)聯(lián),如2個小區(qū)之間進(jìn)行了一次聯(lián)誼活動等。
基于以上地理實體數(shù)據(jù)模型描述,可采用關(guān)系數(shù)據(jù)庫,如PostgreSQL來組織和存儲,如圖2所示。數(shù)據(jù)庫中每類地理實體記錄了實體固有屬性、實體專有屬性、實體構(gòu)成圖元信息和實體間關(guān)聯(lián)關(guān)系。
圖2 地理實體數(shù)據(jù)庫結(jié)構(gòu)
為避免信息冗余,這些信息被分別存儲到“實體固有屬性表”、“實體專有屬性表”、“二/三維圖元表(一個或多個)”、“關(guān)聯(lián)關(guān)系表”等多個邏輯關(guān)聯(lián)的結(jié)構(gòu)化數(shù)據(jù)庫表中,各表間以地理實體編碼建立關(guān)聯(lián)。
實體固有屬性表記錄實體的固有屬性,字段固定不變;實體專有屬性表記錄實體的專有屬性,根據(jù)實體分類的不同,屬性字段各異。實際建庫中,針對每類實體,可將實體固有屬性表和實體專有屬性表合并為實體屬性表。
二/三維圖元表,指一個地理實體可能有一個或多個(點(diǎn)/線/面/體)圖元表達(dá)。
關(guān)聯(lián)關(guān)系表如表1所示,用來記錄2個實體之間的關(guān)系,建庫中不可能將任意實體間的所有關(guān)系一一描述,應(yīng)根據(jù)具體應(yīng)用需求進(jìn)行定制,選取通用常用的關(guān)聯(lián)關(guān)系進(jìn)行記錄,如道路的交匯關(guān)系等,并預(yù)留可擴(kuò)展空間,但實體間的組合或聚合關(guān)聯(lián)關(guān)系必須給出描述,記錄其構(gòu)成關(guān)系。
表1 關(guān)聯(lián)關(guān)系表
關(guān)聯(lián)類型(RELATIONTYPE)描述實體A與實體B之間關(guān)聯(lián)類型,0表示時間關(guān)聯(lián);1表示拓?fù)潢P(guān)聯(lián);2表示方向關(guān)聯(lián);3表示距離關(guān)聯(lián);4表示依賴關(guān)聯(lián);5表示組合關(guān)聯(lián);6表示聚合關(guān)聯(lián);7表示事件關(guān)聯(lián)。關(guān)聯(lián)關(guān)系(RELATION)填寫實體間關(guān)聯(lián)關(guān)系的謂詞表達(dá),關(guān)聯(lián)關(guān)系說明(INSTRUCTION)用于補(bǔ)充說明謂詞表達(dá)的關(guān)聯(lián)關(guān)系。
地理實體的關(guān)聯(lián)描述采用謂詞和被關(guān)聯(lián)的其他地理實體組成謂詞-實體對方法。規(guī)定關(guān)聯(lián)關(guān)系的名稱是以被描述的實體作為主體的,例如描述樓房A實體時,樓房A實體由房屋B實體構(gòu)成,關(guān)聯(lián)關(guān)系類型填“5”,關(guān)聯(lián)關(guān)系填“父實體”。
對于新采集的地理實體可遵循以上模型設(shè)計,直接采集入庫。對于已有傳統(tǒng)基礎(chǔ)地理信息成果數(shù)據(jù)則需要進(jìn)行數(shù)據(jù)處理和轉(zhuǎn)換后入庫。
對于傳統(tǒng)基礎(chǔ)地理信息成果數(shù)據(jù),需建立數(shù)據(jù)轉(zhuǎn)換映射表,數(shù)據(jù)過濾、數(shù)據(jù)分類后,按空間數(shù)據(jù)、屬性數(shù)據(jù)、關(guān)系數(shù)據(jù)等類別進(jìn)行統(tǒng)一歸類,以地理實體為基本粒度進(jìn)行提取,并進(jìn)行完整性檢查、拓?fù)錂z查、空間關(guān)系檢查,封裝成GeoJSON格式[10]數(shù)據(jù)作為中間成果,對GeoJSON數(shù)據(jù)進(jìn)行編輯處理后解析入庫,轉(zhuǎn)換入庫后可查看地理實體與圖元的組成關(guān)系。
地理實體數(shù)據(jù)庫是一種新型地理信息產(chǎn)品,較傳統(tǒng)的基礎(chǔ)測繪數(shù)據(jù)庫有著諸多的先天優(yōu)勢,通過全球唯一編碼、對象化處理和實體關(guān)聯(lián)融合,可以滿足智慧城市建設(shè)過程中跨尺度、跨區(qū)域、跨部門的多樣化應(yīng)用需求。本文設(shè)計了一種地理實體的時空數(shù)據(jù)模型,探索了地理實體在空間數(shù)據(jù)庫中的存儲,通過少量數(shù)據(jù)入庫實驗驗證了數(shù)據(jù)模型實現(xiàn)在技術(shù)上的可行性,但尚未以大量數(shù)據(jù)的實際應(yīng)用驗證模型的可靠性與實用性,仍需結(jié)合應(yīng)用實踐進(jìn)行優(yōu)化和改進(jìn)。同時,該模型設(shè)計尚未涵蓋常見的動態(tài)目標(biāo)和地理現(xiàn)象,語義部分描述也未能與機(jī)器學(xué)習(xí)和自然語言處理技術(shù)相結(jié)合,以實現(xiàn)GIS動態(tài)的學(xué)習(xí)與更新,尚不能動態(tài)描述時刻產(chǎn)生的海量時空信息對象的相互關(guān)系。這些都是今后需要繼續(xù)研究和逐步完善的方向,以使得地理實體產(chǎn)品得到更好的推廣和應(yīng)用。