趙紅艷
礦山系統(tǒng)空間數(shù)據(jù)倉庫建設(shè)初探
趙紅艷
(山西省煤炭資源地質(zhì)局,山西 太原 030045)
分析了礦山系統(tǒng)傳統(tǒng)數(shù)據(jù)存儲(chǔ)特點(diǎn),認(rèn)為傳統(tǒng)數(shù)據(jù)庫已無法滿足礦山管理應(yīng)用需求,數(shù)字礦山的建設(shè)急需建立一個(gè)方便存儲(chǔ)和提取的工具。礦山數(shù)據(jù)大多為空間數(shù)據(jù),因此,空間數(shù)據(jù)倉庫的建立能解決礦山數(shù)據(jù)的收集和存儲(chǔ)問題,實(shí)現(xiàn)多源數(shù)據(jù)的管理和分享,為決策部門提供詳實(shí)而準(zhǔn)確的數(shù)據(jù)。
空間數(shù)據(jù)倉庫;海量數(shù)據(jù);元數(shù)據(jù);源數(shù)據(jù);數(shù)據(jù)轉(zhuǎn)換工具建設(shè)
隨著社會(huì)信息化的推進(jìn),以及“數(shù)字地球”、“數(shù)字城市”的提出,“數(shù)字礦山”應(yīng)運(yùn)而生,數(shù)字礦山于2008年末被列為國家“863”計(jì)劃。我國的數(shù)字礦山建設(shè)剛剛起步,正處在快速發(fā)展階段。山西省是礦山大省,特別是煤礦企業(yè)達(dá)數(shù)百個(gè)。山西省“數(shù)字礦山”建設(shè)迫在眉睫,任重而道遠(yuǎn)。數(shù)字礦山是以計(jì)算機(jī)及其網(wǎng)絡(luò)為手段,把礦山的所有空間和有用屬性數(shù)據(jù)實(shí)現(xiàn)數(shù)字化存儲(chǔ)、傳輸、表述和深加工,應(yīng)用于各個(gè)生產(chǎn)環(huán)節(jié)與管理和決策之中,以達(dá)到生產(chǎn)方案優(yōu)化、管理高效和決策科學(xué)化的目的。而“數(shù)字礦山”終端一般由綜合信息平臺(tái)、信息應(yīng)用與分析系統(tǒng)等組成,信息服務(wù)與管理是“數(shù)字礦山”建設(shè)的本質(zhì),因此,“數(shù)字礦山”建設(shè)的核心是基礎(chǔ)數(shù)據(jù)的建設(shè)。如何收集與存儲(chǔ)這些歷史數(shù)據(jù),是應(yīng)該首先解決的問題??臻g數(shù)據(jù)倉庫理論、技術(shù)及產(chǎn)品已在許多領(lǐng)域取得較明顯的經(jīng)濟(jì)效益,尤其在美國,空間數(shù)據(jù)倉庫理論與技術(shù)已在許多領(lǐng)域取得實(shí)質(zhì)性應(yīng)用。將空間數(shù)據(jù)倉庫理論與技術(shù)引入我國是在20世紀(jì)90年代末期,北京大學(xué)遙感與地理信息系統(tǒng)研究所在空間數(shù)據(jù)倉庫學(xué)術(shù)方面做了不少工作,走在全國的前列。但是,山西省數(shù)字礦山正處在起步階段,急需建立一個(gè)符合山西省地方經(jīng)濟(jì)特色的空間`數(shù)據(jù)倉庫及其技術(shù)理論。
山西省許多礦山特別是煤礦系統(tǒng)還沒有建立空間數(shù)據(jù)倉庫,地理信息系統(tǒng)在煤礦系統(tǒng)的應(yīng)用與研究大多局限于數(shù)據(jù)采集、維護(hù)、查詢、綜合管理與分析上,這些研究與應(yīng)用大多基于物理上分散存儲(chǔ)、數(shù)據(jù)格式多樣的空間數(shù)據(jù)上,造成空間數(shù)據(jù)庫存儲(chǔ)的冗余量增大,而且無法對大量動(dòng)態(tài)的、新的空間數(shù)據(jù)信息進(jìn)行有效管理,無法滿足礦山的空間決策分析。需要集成這些異質(zhì)異構(gòu)的海量數(shù)據(jù),形成一個(gè)方便應(yīng)用系統(tǒng)獲取數(shù)據(jù)、統(tǒng)計(jì)分析的統(tǒng)一模式,滿足用戶對空間輔助決策分析任務(wù)的需求。傳統(tǒng)數(shù)據(jù)特點(diǎn)主要表現(xiàn)在以下幾個(gè)方面:
多年來,各礦山企業(yè)積累了大量地質(zhì)報(bào)告、圖件等不同的地理信息系統(tǒng)或其他信息系統(tǒng)中的應(yīng)用系統(tǒng)數(shù)據(jù),目前,這些數(shù)據(jù)存貯在不同的平臺(tái)和一般的數(shù)據(jù)庫中或大多以文件形式存儲(chǔ)于計(jì)算機(jī)上,這些歷史數(shù)據(jù)、多源異質(zhì)異構(gòu)數(shù)據(jù)、不一致的數(shù)據(jù)具有數(shù)據(jù)量大、形式多樣、來源豐富、結(jié)構(gòu)復(fù)雜等特點(diǎn),從而形成了各自的異質(zhì)異構(gòu)數(shù)據(jù)或數(shù)據(jù)庫系統(tǒng)。
1)建國以來,國家對山西煤炭資源進(jìn)行了全面的地質(zhì)勘察,留下了大量的地質(zhì)資料、測繪資料,這些資料是山西省國民經(jīng)濟(jì)建設(shè)的重要財(cái)富。這些寶貴資料自20世紀(jì)50年代以來均以紙張記載,這些紙質(zhì)材料經(jīng)過數(shù)字化后,留下很多相對零散的存放于計(jì)算機(jī)磁盤上的數(shù)據(jù)。2)多年來,大多單位各自生成的測繪數(shù)據(jù)庫分別由不同商品化軟件系統(tǒng)(如Mapinfo、Arc/Info、GeoMedia、MapGIS、GeoStar 等)進(jìn)行管理,形成了異質(zhì)異構(gòu)的多源數(shù)據(jù)。3)由于缺乏數(shù)據(jù)規(guī)范,各單位對同種數(shù)據(jù)存在精度不一致、標(biāo)準(zhǔn)不統(tǒng)一的問題。因此,面對這些海量數(shù)據(jù),需要建立一個(gè)能夠?yàn)閿?shù)字礦山服務(wù)的便于分析與決策的數(shù)據(jù)集,從而為高層決策提供全面的數(shù)據(jù)環(huán)境。
“數(shù)字礦山”是基于網(wǎng)絡(luò)的三維交互式地理信息系統(tǒng),功能豐富多樣。三維場景由航空、衛(wèi)星影像、地形高程數(shù)據(jù)及其他二維和三維信息融合而成。其功能主要有:三維地質(zhì)模型、三維礦床模型、地測數(shù)據(jù)處理、礦石品位估算、自動(dòng)采掘規(guī)劃、地質(zhì)數(shù)據(jù)快速測量分析、井下人員設(shè)備定位等,所涉及的數(shù)據(jù)主要有:煤礦基本信息、巷道信息、人員信息、各種地質(zhì)報(bào)告、矢量/柵格圖件、三維模型等。其中,三維模型建筑紋理復(fù)雜,形態(tài)各異,導(dǎo)致存儲(chǔ)數(shù)據(jù)量較大?!皵?shù)字礦山”不僅有地上數(shù)據(jù),還有地下數(shù)據(jù)。地上數(shù)據(jù)要求不僅能夠依據(jù)客戶端的視角高度和速度提供不同分辨率的影像,還要求能在基礎(chǔ)三維地形圖上適時(shí)查詢與分析。地下數(shù)據(jù)包括巷道信息及人員定位信息等,以達(dá)到適時(shí)查詢與分析。
目前,對于圖像數(shù)據(jù)的管理大都采用“表+實(shí)體”的方法,即圖像數(shù)據(jù)以文件形式存放于指定的計(jì)算機(jī)目錄下,在數(shù)據(jù)庫表中只反映圖像數(shù)據(jù)文件的存儲(chǔ)路徑;在網(wǎng)絡(luò)空間數(shù)據(jù)庫中,商用數(shù)據(jù)庫的實(shí)體關(guān)系模型和GIS的空間實(shí)體模型之間的映射關(guān)系通過“空間數(shù)據(jù)庫引擎”來完成。這種管理模式不僅給數(shù)據(jù)的維護(hù)增加了難度,給數(shù)據(jù)的安全帶來一定的隱患,同時(shí)也難以反映空間數(shù)據(jù)的復(fù)雜性,在數(shù)據(jù)元素間維持復(fù)雜的聯(lián)系。因此,要真正做到各類數(shù)據(jù)在數(shù)據(jù)庫中的安全管理,急需一個(gè)集成的海量數(shù)據(jù)有效管理的平臺(tái)。
空間數(shù)據(jù)倉庫是在普通空間數(shù)據(jù)庫的基礎(chǔ)上發(fā)展起來的,具備空間數(shù)據(jù)庫管理系統(tǒng)應(yīng)有的特點(diǎn)—海量特性:1)海量數(shù)據(jù)的存儲(chǔ)管理能力。礦山系統(tǒng)空間數(shù)據(jù)涉及領(lǐng)域較廣,而且隨著時(shí)間推移,各級空間數(shù)據(jù)中心所采集的各種類型空間數(shù)據(jù)呈海量增長的態(tài)勢,海量空間數(shù)據(jù)的存儲(chǔ)、管理是空間數(shù)據(jù)倉庫首先要解決的問題。2)海量數(shù)據(jù)的分析處理能力。海量數(shù)據(jù)的應(yīng)用大多是基于網(wǎng)絡(luò)的,數(shù)據(jù)的網(wǎng)絡(luò)傳輸、處理的速度很關(guān)鍵,同時(shí)要考慮多用戶并發(fā)訪問的調(diào)控等問題。因此,應(yīng)充分利用B/S、C/S的各自優(yōu)勢,相互補(bǔ)充的同時(shí),更要有強(qiáng)大的客戶端分析工具。3)海量數(shù)據(jù)的安全性。隨著用戶的增多,來自各個(gè)方面的各種安全隱患也會(huì)隨之而增加,WEBGIS需要有完備的網(wǎng)絡(luò)安全防范機(jī)制,除了防止系統(tǒng)受到侵害以外,還應(yīng)根據(jù)不同的用戶設(shè)置不同的權(quán)限。4)良好的數(shù)據(jù)備份保護(hù)性能,礦山系統(tǒng)是一個(gè)面向多領(lǐng)域多用戶的應(yīng)用和管理系統(tǒng),空間數(shù)據(jù)倉庫是一個(gè)綜合體,在不同領(lǐng)域的應(yīng)用過程中(如數(shù)據(jù)裁切等),很可能造成共享數(shù)據(jù)丟失。因此,系統(tǒng)數(shù)據(jù)要有良好的存儲(chǔ)備份機(jī)制,防止出現(xiàn)故障后系統(tǒng)修復(fù)困難。
現(xiàn)實(shí)世界的數(shù)據(jù)絕大多數(shù)都是具有空間性質(zhì)的,空間數(shù)據(jù)具有空間性、抽象性、多尺度與多時(shí)態(tài)性,在數(shù)據(jù)倉庫的基礎(chǔ)上,引入空間維的概念,根據(jù)決策主題從不同的GIS應(yīng)用系統(tǒng)中截取從瞬態(tài)、區(qū)段直到全球系統(tǒng)的不同規(guī)模的時(shí)空尺度上的信息來建立空間數(shù)據(jù)倉庫(SpatialData Warehouse,SDW)??臻g數(shù)據(jù)倉庫的建立難度和復(fù)雜性要比以事務(wù)型數(shù)據(jù)庫為主要內(nèi)容的數(shù)據(jù)倉庫更大,如何設(shè)計(jì)空間數(shù)據(jù)倉庫的多維數(shù)據(jù)模型以容納多源、多時(shí)態(tài)、不同比例尺的多尺度空間數(shù)據(jù)并滿足日常的數(shù)據(jù)分析任務(wù),分析工具和數(shù)據(jù)挖掘工具仍有待深入研究。
空間數(shù)據(jù)倉庫是在數(shù)據(jù)倉庫的基礎(chǔ)上引入空間維數(shù)據(jù),增加對空間數(shù)據(jù)的存儲(chǔ)、管理和分析能力,根據(jù)礦山主題從不同的GIS(地理信息系統(tǒng))中截取不同時(shí)空尺度上的信息,從而為生產(chǎn)及有關(guān)人員調(diào)動(dòng)安排提供信息服務(wù)。因此,空間數(shù)據(jù)倉庫不僅具有數(shù)據(jù)倉庫所具有的面向主題化的集成、數(shù)據(jù)的安全穩(wěn)定和隨時(shí)間變化等特點(diǎn),還具有海量數(shù)據(jù)存儲(chǔ)、時(shí)空數(shù)據(jù)的動(dòng)態(tài)性、多尺度等特點(diǎn)。是一種強(qiáng)大的網(wǎng)絡(luò)數(shù)據(jù)服務(wù)器技術(shù),能夠?qū)崟r(shí)傳輸三維地理地形數(shù)據(jù)集,其中流方式地形傳輸服務(wù)器能夠同時(shí)向數(shù)以千計(jì)的客戶傳送三維地形數(shù)據(jù)集。這種服務(wù)器傳送由ETL創(chuàng)建的測繪專業(yè)空間數(shù)據(jù)產(chǎn)品,如地形數(shù)據(jù)集或通過擴(kuò)展模塊傳輸原始格式的影像和高程數(shù)據(jù)并實(shí)時(shí)生成三維地形數(shù)據(jù)集,最終形成基于網(wǎng)絡(luò)的地理參考應(yīng)用程序。另外,基于空間數(shù)據(jù)產(chǎn)品,空間數(shù)據(jù)倉庫可從多維的角度進(jìn)行空間數(shù)據(jù)立方體分析和空間數(shù)據(jù)挖掘分析[1],提供綜合的多維的面向分析的空間輔助決策支持信息,滿足用戶空間決策分析的需求。
空間數(shù)據(jù)倉庫是存儲(chǔ)、管理空間數(shù)據(jù)的一種組織形式,其物理實(shí)質(zhì)仍是對數(shù)據(jù)的高效存儲(chǔ)系統(tǒng),由于使用目的不同,其存儲(chǔ)的數(shù)據(jù)在量和質(zhì)以及前端分析工具上與傳統(tǒng)GIS應(yīng)用系統(tǒng)有所不同??臻g數(shù)據(jù)倉庫按照功能劃分為以下幾部分:元數(shù)據(jù)、源數(shù)據(jù)、數(shù)據(jù)變換工具、空間數(shù)據(jù)倉庫、客戶端分析工具。其體系結(jié)構(gòu)示意圖見圖1:
圖1 空間數(shù)據(jù)倉庫體系結(jié)構(gòu)示意圖
如圖1所示,礦山系統(tǒng)留下的各種歷史資料等處于空間數(shù)據(jù)倉庫系統(tǒng)的最底層,應(yīng)用系統(tǒng)處于空間數(shù)據(jù)倉庫系統(tǒng)的最上層。它從基層各種數(shù)據(jù)庫系統(tǒng)抽取數(shù)據(jù),經(jīng)過空間數(shù)據(jù)倉庫的集成融合提交給應(yīng)用系統(tǒng)使用。因此,空間數(shù)據(jù)倉庫實(shí)際上就是一個(gè)多源數(shù)據(jù)的共享和處理機(jī)制。在該機(jī)制中,用戶通過空間數(shù)據(jù)倉庫這個(gè)統(tǒng)一的界面,訪問多個(gè)數(shù)據(jù)源數(shù)據(jù)庫系統(tǒng),最終獲取單個(gè)或集成的應(yīng)用數(shù)字產(chǎn)品。
2.2.1 元數(shù)據(jù)
元數(shù)據(jù)主要用于描述基礎(chǔ)地理數(shù)據(jù)庫有關(guān)的基本信息、數(shù)據(jù)日志信息、空間數(shù)據(jù)表示信息、參照系統(tǒng)信息、數(shù)據(jù)質(zhì)量信息、要素分層信息、發(fā)行信息和元數(shù)據(jù)參考信息等,元數(shù)據(jù)將對數(shù)據(jù)管理、空間數(shù)據(jù)建庫起重要的作用,是空間數(shù)據(jù)倉庫的重要組成部分。元數(shù)據(jù)的根本目的是描述源數(shù)據(jù)基本信息、空間數(shù)據(jù)倉庫主要內(nèi)容、數(shù)據(jù)變換及各種操作信息,促進(jìn)數(shù)據(jù)的高效利用,另一個(gè)目的是解釋數(shù)據(jù),方便用戶查詢、了解空間數(shù)據(jù)倉庫中的數(shù)據(jù)結(jié)構(gòu)。通過元數(shù)據(jù)[2]可以檢索、訪問數(shù)據(jù)庫,可以有效利用計(jì)算機(jī)的系統(tǒng)資源,可以對數(shù)據(jù)進(jìn)行加工處理等。
2.2.2 源數(shù)據(jù)
自從山西省進(jìn)行煤礦資源整合后,數(shù)字礦山項(xiàng)目面對的均為大型礦山,空間數(shù)據(jù)倉庫為了支持高層決策分析生成的單個(gè)/集成數(shù)字產(chǎn)品需要大量的數(shù)據(jù)。這些數(shù)據(jù)除了是來源于不同單位使用不同時(shí)間開發(fā)出的軟件或國際國內(nèi)商品化軟件生產(chǎn)的測繪數(shù)據(jù)外,另外還可以是高分辨率衛(wèi)星影像、航空像片、數(shù)字高程模型以及按照統(tǒng)一坐標(biāo)無縫拼接而成,可迅速建立基于真實(shí)影像的3維數(shù)字城市模型??傊?,礦山數(shù)據(jù)的來源豐富,類型為多樣式存儲(chǔ)或分布式存儲(chǔ)。這些異質(zhì)異構(gòu)的測繪數(shù)據(jù)及數(shù)字礦山新型數(shù)據(jù)為空間數(shù)據(jù)倉庫提供數(shù)據(jù)源。
2.2.3 數(shù)據(jù)變換工具
為了充分利用空間數(shù)據(jù)倉庫中的數(shù)據(jù),源數(shù)據(jù)必須經(jīng)過提煉、轉(zhuǎn)換、空間變換將不同數(shù)據(jù)格式,不同分辨率,不同大小的數(shù)據(jù)融合以最適宜的方式進(jìn)入空間數(shù)據(jù)倉庫,實(shí)現(xiàn)異構(gòu)數(shù)據(jù)源的相互操作及轉(zhuǎn)換。數(shù)據(jù)提煉主要指數(shù)據(jù)的優(yōu)化與抽取,如在保持?jǐn)?shù)據(jù)的完整性和相容性的前提下,對數(shù)據(jù)項(xiàng)整理重構(gòu)、去除冗余信息、同時(shí)補(bǔ)充不斷涌出的新數(shù)據(jù);數(shù)據(jù)轉(zhuǎn)換是指在數(shù)據(jù)提煉整合的基礎(chǔ)上,對新的動(dòng)態(tài)數(shù)據(jù)根據(jù)統(tǒng)一數(shù)據(jù)編碼和數(shù)據(jù)結(jié)構(gòu)對數(shù)據(jù)集進(jìn)行各種運(yùn)算以及語義轉(zhuǎn)換等;空間變換可以理解為對空間數(shù)據(jù)統(tǒng)一數(shù)據(jù)空間坐標(biāo)和比例尺,數(shù)據(jù)轉(zhuǎn)換工具對原始數(shù)據(jù)庫和目標(biāo)數(shù)據(jù)庫中相對應(yīng)的表里具有相同值域的同名數(shù)據(jù)字段能轉(zhuǎn)換,不同的數(shù)據(jù)字段也能轉(zhuǎn)換。對于某一具體的數(shù)據(jù)表,可以使用多個(gè)字段做任意組合的設(shè)定條件來轉(zhuǎn)換數(shù)據(jù),保證數(shù)據(jù)的一致性和完整性。例如,通過融合遙感影像、數(shù)字高程模型和地形數(shù)據(jù),創(chuàng)建具有精確坐標(biāo)的三維地形數(shù)據(jù)庫。
2.2.4 空間數(shù)據(jù)倉庫
數(shù)據(jù)共享是現(xiàn)代信息社會(huì)的一個(gè)基本的特點(diǎn),GIS數(shù)據(jù)的規(guī)范化和標(biāo)準(zhǔn)化直接影響到信息的共享,但是目前空間數(shù)據(jù)的標(biāo)準(zhǔn)化仍然存在不少問題,還缺乏統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范,缺乏地理信息的法規(guī),各部門間缺乏必要的聯(lián)系和協(xié)調(diào),對于科學(xué)的分類和統(tǒng)計(jì)缺乏嚴(yán)格的定義,建立的系統(tǒng)數(shù)據(jù)雜亂,難以相互利用,信息得不到有效地交流和共享,將來源不同的各種異質(zhì)異構(gòu)數(shù)據(jù)按統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范集成到一個(gè)數(shù)據(jù)庫中,有利于空間數(shù)據(jù)的高效存儲(chǔ),使得在桌面應(yīng)用程序中,用戶可以瀏覽分析空間數(shù)據(jù),并可以對其進(jìn)行編輯。也可以在上面添加二維或者三維的物體、瀏覽路徑、場景以及地理信息文件。也就是通過數(shù)字產(chǎn)品的融合使所創(chuàng)建的數(shù)據(jù)庫相連接,并且可以在網(wǎng)絡(luò)上發(fā)布。再通過服務(wù)器端軟件,允許用戶通過網(wǎng)絡(luò)來訪問地形數(shù)據(jù)庫及其他數(shù)據(jù)庫。
數(shù)字礦山是當(dāng)今采礦科學(xué)、信息科學(xué)、人工智能、計(jì)算機(jī)技術(shù)和3S技術(shù)發(fā)展高度結(jié)合的產(chǎn)物,它將深刻改變傳統(tǒng)的采礦生產(chǎn)活動(dòng)和人們的生活方式。數(shù)字礦山建設(shè)涵蓋內(nèi)容很多,基礎(chǔ)信息數(shù)字化是數(shù)字礦山解決方案的特點(diǎn)之一?!皵?shù)字礦山”基于地理信息系統(tǒng)而誕生,所涉及的數(shù)據(jù)必然是空間的,空間數(shù)據(jù)具有空間性、抽象性、多尺度與多時(shí)態(tài)性。它是一個(gè)基于網(wǎng)絡(luò)的三維交互式礦山綜合系統(tǒng),所涉及的數(shù)據(jù)必然是多樣的。不僅有礦山基礎(chǔ)數(shù)據(jù),還有大量地理空間數(shù)據(jù)。
數(shù)字礦山由于涉及權(quán)屬單位廣,數(shù)據(jù)多樣繁雜,數(shù)據(jù)庫和用戶功能集成化,對數(shù)據(jù)庫設(shè)計(jì)提出了更高的要求,許多早期的的空間數(shù)據(jù)庫設(shè)計(jì)過程強(qiáng)調(diào)的是數(shù)據(jù)庫的物理實(shí)現(xiàn),注重于數(shù)據(jù)記錄的存儲(chǔ)和存取方法,設(shè)計(jì)人員往往只考慮各系統(tǒng)各單位獨(dú)立功能的實(shí)現(xiàn),從而只考慮了少數(shù)幾個(gè)數(shù)據(jù)庫文件的組織,然后選擇適當(dāng)?shù)乃饕夹g(shù),以滿足實(shí)現(xiàn)功能和性能的需要,空間數(shù)據(jù)倉庫建設(shè)則對數(shù)據(jù)庫設(shè)計(jì)提出了更高的要求。
2.3.1 數(shù)字礦山空間數(shù)據(jù)的變換
開發(fā)數(shù)據(jù)轉(zhuǎn)換組件,能實(shí)現(xiàn)對各基層專業(yè)單位的格式進(jìn)行轉(zhuǎn)換、讀取和無縫管理;對于短期內(nèi)不會(huì)更新的數(shù)據(jù),將 shape 文件、ArcSDE、Oracle Spatial、SQL Server2008、PostGIS等空間數(shù)據(jù)要素進(jìn)行處理,生成靜態(tài)緩存;對于業(yè)務(wù)系統(tǒng)數(shù)據(jù)每天都在發(fā)生變更的數(shù)據(jù),將 ArcSDE、Oracle Spatial、SQL Server2008、PostGIS存儲(chǔ)的空間數(shù)據(jù)要素動(dòng)態(tài)更新,當(dāng)原始矢量數(shù)據(jù)更新之后,緩存能夠隨之更新。
2.3.2 數(shù)字礦山空間數(shù)據(jù)倉庫元數(shù)據(jù)管理
元數(shù)據(jù)通常用以記錄礦山常用知識及圖件等數(shù)據(jù)的形成規(guī)律等。系統(tǒng)的元數(shù)據(jù)管理[3]要點(diǎn)如下:參照國家現(xiàn)有的空間元數(shù)據(jù)標(biāo)準(zhǔn),建立山西數(shù)字煤礦空間元數(shù)據(jù)的結(jié)構(gòu)模式;設(shè)計(jì)實(shí)現(xiàn)空間元數(shù)據(jù)庫采集器、空間元數(shù)據(jù)服務(wù)器,實(shí)現(xiàn)空間元數(shù)據(jù)的輸入、發(fā)布、查詢等功能;設(shè)計(jì)空間元數(shù)據(jù)網(wǎng)關(guān),實(shí)現(xiàn)不同網(wǎng)絡(luò)協(xié)議的轉(zhuǎn)換、客戶訪問代理、服務(wù)器注冊管理以及網(wǎng)絡(luò)客戶管理等功能。
要對各種測繪數(shù)據(jù)庫實(shí)現(xiàn)數(shù)據(jù)變換以便按照統(tǒng)一標(biāo)準(zhǔn)對數(shù)據(jù)入庫和從空間數(shù)據(jù)倉庫中提取應(yīng)用數(shù)據(jù),就必須對來源廣泛的源數(shù)據(jù)進(jìn)行研究,建立空間數(shù)據(jù)倉庫元數(shù)據(jù)標(biāo)準(zhǔn)體系。
2.3.3 數(shù)字礦山多維空間分析
在圖1上層的應(yīng)用系統(tǒng)中,將不同分辨率、不同大小的數(shù)據(jù)進(jìn)行融合、投影變換,構(gòu)成一個(gè)公共的參考投影,通過疊加融合航片、衛(wèi)星影像、數(shù)字高程模型以及各種矢量地理數(shù)據(jù)(二維及三維信息),迅速方便地創(chuàng)建海量三維地形數(shù)據(jù)庫。這些海量三維地形數(shù)據(jù)庫加上時(shí)間信息,形成四維信息。用戶可以實(shí)時(shí)創(chuàng)建自定義的虛擬三維可視化場景,并進(jìn)行瀏覽、查詢和分析。空間數(shù)據(jù)變換工具能夠創(chuàng)建如同真實(shí)照片般的地理精準(zhǔn)的三維地球模型。它可以對數(shù)據(jù)以其本身格式的方式進(jìn)行融合來創(chuàng)建基于三維的地形模型,并提供給客戶端進(jìn)行數(shù)據(jù)層和其他內(nèi)容的疊加。
研究空間數(shù)據(jù)倉庫的存儲(chǔ)技術(shù),集成多源異構(gòu)測繪數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的有效管理。應(yīng)用層在一個(gè)空間數(shù)據(jù)倉庫的平臺(tái)上可單獨(dú)訪問任何一個(gè)數(shù)據(jù)庫系統(tǒng),并檢索得到單個(gè)的測繪數(shù)字產(chǎn)品,也可同時(shí)訪問若干個(gè)數(shù)據(jù)庫系統(tǒng)得到集成的測繪數(shù)字產(chǎn)品。由此可見,空間數(shù)據(jù)倉庫是個(gè)虛擬的數(shù)據(jù)倉庫,庫中并不存儲(chǔ)數(shù)據(jù)實(shí)體,而是存儲(chǔ)集成數(shù)據(jù)模型和元數(shù)據(jù)模型??偟膩碚f,空間數(shù)據(jù)倉庫可以解決傳統(tǒng)數(shù)據(jù)庫無法解決的問題,有效地實(shí)現(xiàn)空間數(shù)據(jù)的深層次分析和挖掘,提供更為實(shí)用的決策服務(wù)。當(dāng)前隨著經(jīng)濟(jì)的發(fā)展,空間數(shù)據(jù)倉庫被應(yīng)用到很多行業(yè)中并已有一定成果,它的發(fā)展可以有力地支持?jǐn)?shù)字礦山的建設(shè),其發(fā)展前景廣闊,但存在的問題仍相當(dāng)多,需進(jìn)行進(jìn)一步的完善和發(fā)展。
[1] 鄒逸江.空間數(shù)據(jù)立方體分析操作原理[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2004,29(9):822-825.
[2] 張 立,龔健雅.地理空間元數(shù)據(jù)管理的研究和實(shí)現(xiàn)[J].武漢測繪科技大學(xué)學(xué)報(bào),2000,25(2):127-130.
[3] 吳金華.空間數(shù)據(jù)倉庫的元數(shù)據(jù)研究[D].武漢:武漢大學(xué),2004.
The Primary Exploration of Constructing the Spatial Data Warehouse in Mining System
Zhao Hong-yan
The storage characteristics of traditional data in the mining system is analyzed.Traditional database is considered unable to meet the mine management application.The construction of the digital mine needs to be established,which is a convenient storage and extraction tools.Mine data mostly are for the spatial data,therefore,the establishment of the spatial data warehouse can solve the mine data collection and storage problem,realize the source data management and sharing and provide detailed and accurate data to decision -making departments.
Spatial data warehouse;Massive data;Metadata;Source data;Data transfer tool construction
TD1
A
1672-0652(2012)07-0049-04
2012-05-21
趙紅艷(1981—),女,山西五臺(tái)人,2005年畢業(yè)于太原師范學(xué)院,助理工程師,主要從事數(shù)字礦山研究工作(E -mail)gis200102@163.com