仇林遙,鄭作亞,周 彬,柳 罡,陸 洲
(中國電子科學(xué)研究院,北京 100041)
時空數(shù)據(jù)是地理信息技術(shù)應(yīng)用的信息承載,隨著對地觀測技術(shù)的快速發(fā)展以及各類傳感器的廣泛部署,連續(xù)獲取高時空分辨率、屬性信息、日益豐富的地理時空數(shù)據(jù)成為可能。災(zāi)害應(yīng)急管理、公共安全、智慧城市等典型行業(yè)應(yīng)用都離不開時空數(shù)據(jù)的支持[1]。隨著信息化技術(shù)的快速發(fā)展,時空數(shù)據(jù)在國土、減災(zāi)、農(nóng)業(yè)、城市管理中發(fā)揮的效益日益凸顯,與此同時,行業(yè)應(yīng)用對時空數(shù)據(jù)的獲取和應(yīng)用提出更高要求。如何快速對數(shù)據(jù)進(jìn)行有效的處理和自動分類管理,結(jié)合基礎(chǔ)地理數(shù)據(jù)和歷史案例數(shù)據(jù)及時獲取行業(yè)應(yīng)用所需的信息與知識、充分發(fā)揮時空數(shù)據(jù)的使用效能,對地理信息行業(yè)應(yīng)用具有極為重要的意義。
與既快又易的時空數(shù)據(jù)獲取能力形成鮮明對比的是信息的解析、存儲和管理能力低下[2],數(shù)據(jù)管理大多采用傳統(tǒng)簡單條目式索引管理方法,條目存儲的數(shù)據(jù)信息以基礎(chǔ)顯性屬性為主,較少地考慮和體現(xiàn)異構(gòu)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系以及數(shù)據(jù)本身的深層特征。數(shù)據(jù)檢索主要依靠“簡單元數(shù)據(jù)+人工經(jīng)驗”發(fā)現(xiàn)業(yè)務(wù)所需數(shù)據(jù)[3]。隨著接入實時數(shù)據(jù)的體量增大,僅僅依靠人工方法完成數(shù)據(jù)準(zhǔn)備工作變得越發(fā)耗時與低效,難以保證行業(yè)應(yīng)用業(yè)務(wù)輸出的產(chǎn)品保持較高的準(zhǔn)確性和時效性。一方面,大量獲取的數(shù)據(jù)被記錄和保存在數(shù)據(jù)庫中未被有效發(fā)現(xiàn)和利用,導(dǎo)致需要的信息不能及時提供,另一方面業(yè)務(wù)人員檢索的數(shù)據(jù)未必滿足需求,但又難以快速精準(zhǔn)地找到合適任務(wù)的數(shù)據(jù)集合,這種數(shù)據(jù)“既多又少”的矛盾日益突出[4]。因此,亟需研究和實現(xiàn)新的時空數(shù)據(jù)管理方法,提供異構(gòu)數(shù)據(jù)的智能化關(guān)聯(lián)服務(wù),面向各異的地理信息處理任務(wù)提供自動化的優(yōu)勢數(shù)據(jù)匯聚和推送,為地理信息應(yīng)用服務(wù)及時提供最為合適的數(shù)據(jù)集,提高業(yè)務(wù)運行和專題產(chǎn)品生產(chǎn)的效率。
對地觀測技術(shù)與傳感網(wǎng)技術(shù)的發(fā)展顯著促進(jìn)了時空信息獲取能力的提升,數(shù)據(jù)由單一固定數(shù)據(jù)源向多源異構(gòu)、高復(fù)雜度的趨勢發(fā)展[5]。尤其是地球觀測數(shù)據(jù)在體量和類型上均飛速增長,以高空間、時間和輻射分辨率為特征的新航天、航空以及地基遙感數(shù)據(jù)廣泛接受及應(yīng)用[6]。本文從時空數(shù)據(jù)整合、關(guān)聯(lián)模型、信息匯聚于服務(wù)的角度出發(fā),綜述當(dāng)前研究現(xiàn)狀和問題。
數(shù)據(jù)整合是把不同來源、結(jié)構(gòu)、格式和特征的數(shù)據(jù)進(jìn)行一體化表達(dá)、管理和查詢檢索,實現(xiàn)異構(gòu)數(shù)據(jù)資源的有效集成,為用戶提供統(tǒng)一的數(shù)據(jù)視圖[7]。地理時空數(shù)據(jù)來源廣泛、類型多樣,在數(shù)據(jù)結(jié)構(gòu)和語義方面存在顯著差異[8],數(shù)據(jù)整合對多源異構(gòu)數(shù)據(jù)進(jìn)行統(tǒng)一管理,為應(yīng)急減災(zāi)、公共安全響應(yīng)、智慧城市等行業(yè)應(yīng)用提供數(shù)據(jù)支持。近年來,地理時空數(shù)據(jù)體量、異構(gòu)性和復(fù)雜度上有顯著增加,給數(shù)據(jù)整合管理帶來巨大挑戰(zhàn)[9]。本文對地理時空數(shù)據(jù)整合劃分為信息系統(tǒng)管理方式、統(tǒng)一數(shù)據(jù)交換方式和基于本體語義網(wǎng)技術(shù)的方式進(jìn)行綜述。
(1)信息系統(tǒng)管理方式
地理時空數(shù)據(jù)基于信息系統(tǒng)管理方式的時空數(shù)據(jù)建成方法形成于上世紀(jì)80年代后期地學(xué)與計算機(jī)學(xué)科交叉,計算機(jī)領(lǐng)域的元數(shù)據(jù)描述方法被用于表達(dá)地理空間信息。該方法將業(yè)務(wù)需求和數(shù)據(jù)存儲緊密聯(lián)系,針對每一條觀測數(shù)據(jù)建立獨立的元數(shù)據(jù)描述,以編目的形式進(jìn)行存儲管理。此階段的信息管理系統(tǒng)主要面向獨立部門的固定數(shù)據(jù)源,數(shù)據(jù)庫的數(shù)據(jù)類型單一。隨著地理信息系統(tǒng)發(fā)展,帶有時空索引的空間數(shù)據(jù)庫引擎逐漸成為主要平臺,例如ESRI公司的ArcSDE[10]、Oracle公司的Oracle Spatial[11]以及加州大學(xué)伯克利分校的PostgredSQL & PostGIS產(chǎn)品[12],通過將空間索引與傳統(tǒng)E-R索引組合,向關(guān)系數(shù)據(jù)庫提供空間計算與查詢的接口,大大提升信息統(tǒng)計和評估能力,并廣泛應(yīng)用與空間信息專題產(chǎn)品制作[13]。雖然信息系統(tǒng)支持行業(yè)應(yīng)用的能力有所提升,但系統(tǒng)的擴(kuò)展性和管理對象是受信息產(chǎn)品和業(yè)務(wù)需求嚴(yán)格限制的,地理信息系統(tǒng)所管理的數(shù)據(jù)依然有限,只能提供簡單固定的分析統(tǒng)計功能。隨著對地觀測等技術(shù)的發(fā)展,行業(yè)應(yīng)用周期內(nèi)獲取數(shù)據(jù)的類型和數(shù)量均顯著增加,信息系統(tǒng)不僅需要實現(xiàn)具體的業(yè)務(wù)能力,同時具備海量數(shù)據(jù)存儲和發(fā)布共享的能力。從數(shù)據(jù)類型的角度看,地理時空數(shù)據(jù)也不僅僅限于條目記錄,數(shù)據(jù)形式更多元化,例如柵格數(shù)據(jù)、矢量數(shù)據(jù)、三維模型、文本、多媒體等,加之?dāng)?shù)據(jù)體量的增加使得傳統(tǒng)基于SQL存儲與查詢檢索的數(shù)據(jù)庫設(shè)計難以滿足多源異構(gòu)數(shù)據(jù)的業(yè)務(wù)應(yīng)用需求[13]。逐漸出現(xiàn)了以MongoDB、Redis等為代表的非關(guān)系型分布式數(shù)據(jù)庫,配合開源空間數(shù)據(jù)服務(wù)引擎(如GeoServer),信息系統(tǒng)實現(xiàn)了地理時空信息發(fā)布與共享以及在線分析制圖等功能[14]。盡管利用空間數(shù)據(jù)管理引擎對時空數(shù)據(jù)(如點位數(shù)據(jù)、道路數(shù)據(jù)等)和行業(yè)業(yè)務(wù)數(shù)據(jù)(如專題圖片、報表等)統(tǒng)一存儲并支持一定程度的空間信息關(guān)聯(lián)查詢[15],但是由于缺少統(tǒng)一的語義描述,導(dǎo)致冉管理系統(tǒng)的標(biāo)準(zhǔn)不一,數(shù)據(jù)的共享和集成困難;數(shù)據(jù)之間缺乏聯(lián)系,難以自動實現(xiàn)地理時空數(shù)據(jù)的關(guān)聯(lián)分析。
(2)統(tǒng)一數(shù)據(jù)交換方式
統(tǒng)一交換格式利用面向?qū)ο蟮确椒▽⒈磉_(dá)、描述各異的數(shù)據(jù)向標(biāo)準(zhǔn)化的稱謂進(jìn)行映射轉(zhuǎn)換,并提供數(shù)據(jù)交換和互操作方法。數(shù)據(jù)字典是實現(xiàn)異構(gòu)數(shù)據(jù)相互轉(zhuǎn)換的有效途徑,有利于數(shù)據(jù)集成與共享[16],通過記錄數(shù)據(jù)之間的互操作和關(guān)系表達(dá)提供基本的數(shù)據(jù)關(guān)聯(lián)查詢和分析。但是,在數(shù)據(jù)轉(zhuǎn)換過程中,數(shù)據(jù)映射關(guān)系表達(dá)簡單,語義描述有限,缺少層次化的高級描述,數(shù)據(jù)的檢索和查詢?nèi)匀灰蕾嚾斯そ?jīng)驗,針對復(fù)雜地理處理任務(wù),海量數(shù)據(jù)自動檢索和篩選的顆粒度較低,難以根據(jù)任務(wù)需求實現(xiàn)精準(zhǔn)的檢索結(jié)果。
(3)基于語義的管理方式
空間數(shù)據(jù)的語義描述方法已廣泛應(yīng)用于行業(yè)數(shù)據(jù)管理領(lǐng)域,其目標(biāo)是解決多源數(shù)據(jù)的語義多樣性對數(shù)據(jù)存儲與管理產(chǎn)生的不利影響,實現(xiàn)異構(gòu)數(shù)據(jù)之間的語義互操作[17]。鏈接開放數(shù)據(jù)(LOD, Linked Open Data)是建立多源數(shù)據(jù)及關(guān)系描述的方法之一,利用語義網(wǎng)對時空數(shù)據(jù)進(jìn)行組織,采用RDF等描述語言構(gòu)建標(biāo)準(zhǔn)的、可交換的統(tǒng)一數(shù)據(jù)格式,依據(jù)行業(yè)領(lǐng)域的知識對數(shù)據(jù)進(jìn)行語義標(biāo)注,顯式地表達(dá)數(shù)據(jù)和管理對象的關(guān)聯(lián)關(guān)系[18]。例如在災(zāi)害管理領(lǐng)域,通過LOD方法可將關(guān)聯(lián)關(guān)系轉(zhuǎn)換為計算機(jī)“理解”的信息,支持行業(yè)知識的自主推理和挖掘[19]。語義約束模型也是時空數(shù)據(jù)語義描述的常用方法,根據(jù)經(jīng)驗知識將地理時空大數(shù)據(jù)管理與服務(wù)過程中的對象劃分為若干個層級,在每個層級定義對象的要素組成和不同對象之間的關(guān)系,在多個層級建立語義約束關(guān)系[20]。在此基礎(chǔ)上,將統(tǒng)一對象的要素、關(guān)系、操作等抽象為一個實體,通過本體描述方法對任務(wù)、事件、數(shù)據(jù)之間的關(guān)系進(jìn)行形式化描述,支持地理信息智能檢索[21]。相比語義約束模型,本體描述具有更強(qiáng)的語義完整性,支持從數(shù)據(jù)定義和組成到數(shù)據(jù)操作的統(tǒng)一描述,更有利于計算機(jī)自動發(fā)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)關(guān)系[22]。
基于信息系統(tǒng)管理模式和交換模式的時空數(shù)據(jù)整合方法將行業(yè)數(shù)據(jù)作為空間數(shù)據(jù)進(jìn)行處理,由于缺乏時空數(shù)據(jù)的語義關(guān)聯(lián)描述,數(shù)據(jù)關(guān)系分析能力弱,難以支持面向地理時空大數(shù)據(jù)的有效信息自動檢索;盡管語義約束模型和本體描述方法為信息的自動檢索提供了有效途徑,但是語義知識在關(guān)聯(lián)關(guān)系層面的表達(dá)能力單一,特別是針對任務(wù)和數(shù)據(jù)的關(guān)系描述過于簡單。因此,當(dāng)前時空數(shù)據(jù)整合方法難以支持針對特定應(yīng)急任務(wù)需求的有效數(shù)據(jù)自動發(fā)現(xiàn)與匯聚。
面向任務(wù)時效性、準(zhǔn)確性的需求,定義和建立有效的地理時空數(shù)據(jù)關(guān)聯(lián)關(guān)系是從異構(gòu)地理時空給數(shù)據(jù)中快速、準(zhǔn)確發(fā)現(xiàn)優(yōu)勢信息的關(guān)鍵和前提。時空數(shù)據(jù)關(guān)聯(lián)模型被用于災(zāi)害應(yīng)急、智慧城市等行業(yè),用于發(fā)現(xiàn)以后數(shù)據(jù)的潛在聯(lián)系以及輔助分析管理對象的時空分布特征,進(jìn)一步可支持地理對象監(jiān)測與預(yù)報預(yù)警。關(guān)聯(lián)模型可分為語義約束的描述模型和計算統(tǒng)計驅(qū)動的數(shù)值型模型。
(1)描述型模型
語義約束的描述型關(guān)聯(lián)模型主要從概念層面建立不同對象之間的關(guān)系。其中,基于本體的關(guān)系表達(dá)中,對象之間的關(guān)系則描述為part of、instance of和attribute of,分別表示整體與部分的關(guān)系、繼承關(guān)系、實例化和屬性關(guān)系[23];決策樹分析的關(guān)聯(lián)模型通過定義父子、兄弟等節(jié)點之間的操作(如剪枝、嫁接等)實現(xiàn)事物節(jié)點的關(guān)系構(gòu)建[24];面向時空特征的關(guān)聯(lián)模型以九交模型為基礎(chǔ),結(jié)合時態(tài)概念,提出包含拓?fù)洹⒎较?、距離、點線面空間交互關(guān)系和時態(tài)的時空謂詞邏輯,實現(xiàn)對對象時空關(guān)系的描述[25]。
(2)數(shù)值型模型
基于計算統(tǒng)計的數(shù)值型關(guān)聯(lián)模型對關(guān)聯(lián)關(guān)系進(jìn)行量化描述,常見方法包括:構(gòu)造面向時間的語義網(wǎng)絡(luò)二維矩陣,利用jaccard、Salton等悉數(shù)計算節(jié)點之間的語義相似度,統(tǒng)計計算時間共同發(fā)生的概率[26]?;叶汝P(guān)聯(lián)分析通過算法將關(guān)聯(lián)度歸一化到0到1之間,得到反映和描述因素間關(guān)聯(lián)大小的量。關(guān)聯(lián)度越大代表因素之間的相對變化態(tài)勢(如變化程度、速率和方向等)越接近,反之則相差越遠(yuǎn),灰度關(guān)聯(lián)方法常用于例如災(zāi)害和公共安全等應(yīng)急評估。上述兩類方法統(tǒng)稱為相關(guān)性函數(shù)計算方法,由于其具有簡單和歸一化特點而被普遍應(yīng)用;另外基于關(guān)聯(lián)規(guī)則的數(shù)值型關(guān)聯(lián)模型可以從應(yīng)用領(lǐng)域挖掘有效的先驗知識,這列算法通常由時空數(shù)據(jù)事務(wù)化算法和事務(wù)表挖掘算法組合而成,前者的作用是根據(jù)挖掘目標(biāo)數(shù)據(jù)構(gòu)建一個時空事務(wù)表,后者的作用是對這個事務(wù)表進(jìn)行挖掘,從中提取頻繁項集和關(guān)聯(lián)規(guī)則,常見的關(guān)聯(lián)規(guī)則構(gòu)建方法有Apriori及擴(kuò)展算法[27]、FP-樹頻集算法[28]等。
基于語義描述的關(guān)聯(lián)模型多用于布爾型關(guān)聯(lián)關(guān)系判斷,量化分析數(shù)據(jù)對任務(wù)的滿足度能力有限?;谟嬎憬y(tǒng)計的數(shù)值型關(guān)聯(lián)關(guān)系模型所采用的關(guān)聯(lián)規(guī)則主要是對數(shù)據(jù)之間的先驗知識進(jìn)行表達(dá),缺少在任務(wù)和數(shù)據(jù)之間建立聯(lián)系;此外,大規(guī)模時空數(shù)據(jù)集的關(guān)聯(lián)規(guī)則構(gòu)建效率下降顯著,難以滿足地理時空數(shù)據(jù)關(guān)聯(lián)分析的時效性需求。
信息聚合是從大數(shù)據(jù)中萃取信息的前沿技術(shù),圍繞某一主題,把極度分散、高度相關(guān)、前后依存的信息碎片迅速、及時地整合成完整的、具有參考價值的知識信息?;ヂ?lián)網(wǎng)技術(shù)的發(fā)展促進(jìn)了地理空間信息服務(wù)的快速發(fā)展,也為地理信息管理提供了豐富的在線資源?,F(xiàn)有的信息匯聚方法主要是以行業(yè)業(yè)務(wù)為對象,在線檢索、加載、應(yīng)用網(wǎng)絡(luò)地理空間信息服務(wù),結(jié)合本地客戶端的模型組建功能,完成地理相關(guān)行業(yè)分析任務(wù)。開放地理空間信息聯(lián)盟OGC(Open GIS Consortium)是地球空間信息領(lǐng)域重要的國際標(biāo)準(zhǔn)化組織,制定了一系列標(biāo)準(zhǔn)規(guī)范促進(jìn)空間信息的共享與互操作。例如,數(shù)字地圖服務(wù)WMS(Web Map Service)于2000年被OGC制定并作為標(biāo)準(zhǔn)協(xié)議用于互聯(lián)網(wǎng)的具有空間參考的數(shù)據(jù)服務(wù),作為全球范圍內(nèi)的基礎(chǔ)影像數(shù)據(jù)資源被廣泛應(yīng)用于應(yīng)急任務(wù)。此外,網(wǎng)絡(luò)處理服務(wù)WPS(Web Processing Service)以標(biāo)準(zhǔn)化的方式在互聯(lián)網(wǎng)上共享信息處理資源[29]。該功能提供了標(biāo)準(zhǔn)的模型封裝標(biāo)準(zhǔn),為更多的環(huán)境監(jiān)測、模擬、分析和評估模型的封裝提供接口,促進(jìn)了計算資源的共享與互操作[30]。
上述空間信息匯聚主要以遙感地圖服務(wù)為主,對空間范圍、空間參考、要素屬性等服務(wù)資源特征進(jìn)行描述。在簡易信息匯聚RSS(Really Simple Syndication)編碼的基礎(chǔ)上對數(shù)據(jù)的坐標(biāo)和空間參考等特征要素進(jìn)行標(biāo)注,將地圖信息與其他互聯(lián)網(wǎng)信息進(jìn)行關(guān)聯(lián),通過空間分析模型挖掘互聯(lián)網(wǎng)信息的地理要素特征幫助用戶從海量信息中迅速找到真正需要的信息[31]。
現(xiàn)有信息匯聚主要通過直接和組合模式接入空間信息服務(wù)的形式實現(xiàn)。直接模型基于已有的遙感信息,根據(jù)任務(wù)需求,通過網(wǎng)絡(luò)地圖、網(wǎng)絡(luò)要素和網(wǎng)絡(luò)覆蓋服務(wù)直接將數(shù)據(jù)分發(fā)給用戶。通過搜索和發(fā)現(xiàn)滿足任務(wù)需求的遙感信息,聚焦數(shù)據(jù)服務(wù)、傳輸服務(wù)協(xié)同完成地理信息處理與分析任務(wù)。諸如SpaceGRID[32]、GEON[33]、G-POD[34]、OKGIS[35]等項目采用面向技術(shù),通過網(wǎng)格等技術(shù)實現(xiàn)地球觀測數(shù)據(jù)的按需檢索與服務(wù)推送,提高了地理時空數(shù)據(jù)管理的可交互性,滿足用戶方便獲取數(shù)據(jù)。直接模式下提供共享的數(shù)據(jù)比較單一,功能簡單,匯聚的信息互相獨立。
組合模式基于已有的地理時空信息,根據(jù)任務(wù)需求和處理環(huán)境,動態(tài)組合數(shù)據(jù)服務(wù)、處理服務(wù)和傳輸服務(wù)等生成聚焦服務(wù),經(jīng)過數(shù)據(jù)組合加工得到滿足任務(wù)需求的產(chǎn)品信息。通過服務(wù)自組織方法匯聚廣域分布的小顆粒處理服務(wù)、數(shù)據(jù)服務(wù)和傳輸服務(wù),協(xié)同完成更大的復(fù)雜任務(wù)。服務(wù)組合為滿足多環(huán)節(jié)協(xié)同作業(yè)的任務(wù)需求提供了一種解決途徑,通過將若干個獨立的服務(wù)按照一定的規(guī)則進(jìn)行組合形成服務(wù)鏈[36]。當(dāng)前服務(wù)鏈構(gòu)建方法主要分為兩類,即服務(wù)組合的工作流方法和地理本體知識驅(qū)動的服務(wù)鏈。服務(wù)組合的工作流方法主要是通過對不同服務(wù)增加語義支持,利用人工或自動的方法將多個服務(wù)的調(diào)用流程進(jìn)行排序和組合。其中通過手動建立多個WMS、WFS和WPS組合的工作流方法[37]以及面向信息管理的OWS(OGC Web Service)服務(wù)多選方案[38],支持業(yè)務(wù)人員根據(jù)任務(wù)需求對標(biāo)準(zhǔn)OWS服務(wù)進(jìn)行組合;此外,ACE-GIS項目為服務(wù)組合提供了語義互操作、標(biāo)準(zhǔn)集成和服務(wù)互操作等方法[39];SWING項目在為減少語義描述的負(fù)責(zé)行并增加服務(wù)調(diào)用靈活性而提出基于語義Web的空間信息服務(wù)技術(shù),支持面向服務(wù)組合和調(diào)用的推理能力[40]。該類方法主要從服務(wù)的角度滿足任務(wù)需求,較少地考慮服務(wù)綁定數(shù)據(jù)對任務(wù)的影響。此外,服務(wù)組合方法依賴空間信息基礎(chǔ)設(shè)施的目錄索引,通過元數(shù)據(jù)關(guān)鍵字或空間過濾等方法查找合適的服務(wù)源,由于缺乏統(tǒng)一的描述方法,不同系統(tǒng)的語義表述存在歧義,引起服務(wù)查詢的準(zhǔn)確度降低,導(dǎo)致復(fù)雜服務(wù)鏈執(zhí)行結(jié)果的可靠性難以保證[41]。
地理本體驅(qū)動的服務(wù)鏈方法通過構(gòu)建地理本體來表達(dá)地理空間信息領(lǐng)域的概念、知識,使用元數(shù)據(jù)追蹤等方法實現(xiàn)自動或半自動的服務(wù)鏈組建[42]。此類方法根據(jù)既定的規(guī)則從一定程度實現(xiàn)了地理時空信息的自動發(fā)現(xiàn)與服務(wù)鏈組合,但應(yīng)用多是面向以地理空間信息處理為主的地學(xué)分析建模任務(wù),相比更為復(fù)雜的地理分析任務(wù),該方法僅能參與局部任務(wù)環(huán)節(jié),難以覆蓋整個任務(wù)流。
當(dāng)前時空數(shù)據(jù)匯聚方法主要針對地圖數(shù)據(jù)、較少考慮面向應(yīng)用行業(yè)的數(shù)據(jù)的異構(gòu)性,在一定程度上解決了異構(gòu)數(shù)據(jù)的共享以及任務(wù)協(xié)同的需求,但缺乏任務(wù)和數(shù)據(jù)的統(tǒng)一描述,難以滿足例如災(zāi)害、公共安全等應(yīng)急階段多源數(shù)據(jù)的使用需求,特別是針對任務(wù)隨事態(tài)發(fā)展具有緊迫性、突變性和不確定性的特點,通用信息匯聚難以根據(jù)環(huán)境變化信息等影響因素自動感知和準(zhǔn)確匹配時空數(shù)據(jù)與服務(wù)。匯聚數(shù)據(jù)的特征描述以地理空間屬性為主、缺乏針對不同任務(wù)需求的多樣性特征表達(dá),匯聚結(jié)果難以反映任務(wù)的實際需求;基于字段標(biāo)注的時空數(shù)據(jù)特征描述以地理空間屬性為主、缺乏針對不同任務(wù)需求的多樣性特征表達(dá),匯聚結(jié)果難以反映任務(wù)的實際需求;基于字段標(biāo)注的時空數(shù)據(jù)特征描述智能刻畫數(shù)據(jù)之間的基本關(guān)系,缺少深度語義關(guān)聯(lián)表達(dá),盡管為時空數(shù)據(jù)的匯聚和檢索提供了查詢依據(jù),但缺乏自動匯聚的基礎(chǔ)和機(jī)制,依然難以解決應(yīng)急任務(wù)數(shù)據(jù)準(zhǔn)備與任務(wù)編排高度依賴人工交互的問題。
面向天地一體化信息網(wǎng)絡(luò)、傳感網(wǎng)絡(luò)等泛在時空數(shù)據(jù)的實時接入,現(xiàn)有空間信息服務(wù)存在的局限日益明顯:由于地理分析處理任務(wù)和時空數(shù)據(jù)之間缺乏深度語義關(guān)聯(lián)導(dǎo)致地理時空信息服務(wù)從龐大繁雜的實時接入數(shù)據(jù)和歷史數(shù)據(jù)中為特定任務(wù)提供最需要數(shù)據(jù)的能力受到限制,而時空數(shù)據(jù)應(yīng)用對信息接入后的處理分析的時效性、精準(zhǔn)性提出更高的要求,現(xiàn)有基于人工經(jīng)驗的手動檢索難以處理信息應(yīng)急階段驟增的數(shù)據(jù)規(guī)模,嚴(yán)重制約數(shù)據(jù)的應(yīng)用效能。隨著人工智能技術(shù)的發(fā)展,基于知識圖譜的信息關(guān)聯(lián)方法和用戶偏好自學(xué)習(xí)的數(shù)據(jù)自組織與檢索方法將是數(shù)據(jù)關(guān)聯(lián)與聚焦服務(wù)的發(fā)展方向之一,面向任務(wù)需求并開展用戶行為分析,自主匯聚相關(guān)性較高的優(yōu)勢數(shù)據(jù)開展處理與分析,降低數(shù)據(jù)檢索對人工操作的以來,從而提升時空數(shù)據(jù)業(yè)務(wù)應(yīng)用的自主性和智能化水平。