国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

航運(yùn)關(guān)聯(lián)數(shù)據(jù)的發(fā)布及查詢應(yīng)用研究

2018-10-23 11:40:06官維
價(jià)值工程 2018年33期

官維

摘要:為了有效解決航運(yùn)數(shù)據(jù)存在的碎片化現(xiàn)象以發(fā)揮航運(yùn)數(shù)據(jù)的潛在價(jià)值,本文構(gòu)建了航運(yùn)關(guān)聯(lián)數(shù)據(jù)并使用Fuseki平臺(tái)進(jìn)行發(fā)布,通過(guò)SPARQL1.1的查詢擴(kuò)展實(shí)現(xiàn)了跨不同數(shù)據(jù)端口的聯(lián)合查詢。研究結(jié)果表明:關(guān)聯(lián)數(shù)據(jù)能有效實(shí)現(xiàn)航運(yùn)數(shù)據(jù)的語(yǔ)義化組織與關(guān)聯(lián)化集成,進(jìn)而實(shí)現(xiàn)航運(yùn)數(shù)據(jù)的“一站式”查詢應(yīng)用。

Abstract: In order to effectively solve the fragmentation phenomenon of shipping data and play its potential value, this paper constructs the shipping linked data and publishes it using the Fuseki platform. Federated queries across different data ports are implemented through query expansion of SPARQL1.1. The result shows that linked data can effectively realize the semantic organization and linked integration of shipping data, in turn, the one-stop query application of which is realized.

關(guān)鍵詞:航運(yùn)關(guān)聯(lián)數(shù)據(jù);關(guān)聯(lián)數(shù)據(jù)發(fā)布;聯(lián)合查詢

Key words: maritime linked data;publication of linked data;federated queries

中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2018)33-0206-02

0 引言

航運(yùn)作為影響國(guó)民經(jīng)濟(jì)的重要因素之一,已經(jīng)受到各國(guó)政府的高度重視與廣泛關(guān)注。而航運(yùn)信息是指所有與航運(yùn)活動(dòng)有關(guān)的信息,它覆蓋的范圍很廣,既包括航線、船舶等基礎(chǔ)性信息,也包括航運(yùn)事故、航運(yùn)交易等事務(wù)性信息。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,航運(yùn)信息已呈現(xiàn)出爆炸式的發(fā)展態(tài)勢(shì),大量的航運(yùn)信息以分散、異構(gòu)的形式分布于不同的數(shù)據(jù)存儲(chǔ)介質(zhì)中,導(dǎo)致不同的航運(yùn)數(shù)據(jù)間難以實(shí)現(xiàn)信息的共享與互操作,極大地影響了航運(yùn)數(shù)據(jù)價(jià)值的發(fā)揮。

關(guān)聯(lián)數(shù)據(jù)作為一種新興的互聯(lián)網(wǎng)技術(shù),強(qiáng)調(diào)在開放的網(wǎng)絡(luò)環(huán)境中,通過(guò)建立不同結(jié)構(gòu)化數(shù)據(jù)間的語(yǔ)義鏈接,實(shí)現(xiàn)分散異構(gòu)數(shù)據(jù)的互訪與共享。由于這一優(yōu)勢(shì),關(guān)聯(lián)數(shù)據(jù)已經(jīng)在很多領(lǐng)域中得到了關(guān)注與應(yīng)用,探索以關(guān)聯(lián)數(shù)據(jù)的形式發(fā)布領(lǐng)域數(shù)據(jù)已經(jīng)成為一個(gè)重要的研究?jī)?nèi)容:陳德容分析了關(guān)聯(lián)數(shù)據(jù)技術(shù)在圖書館數(shù)據(jù)發(fā)布中的優(yōu)勢(shì)、使用原則、數(shù)據(jù)保障等問(wèn)題,進(jìn)而指出關(guān)聯(lián)數(shù)據(jù)能夠推動(dòng)圖書館信息的傳播和復(fù)用并促進(jìn)圖書館新舊系統(tǒng)的更替及數(shù)據(jù)格局的變更[1];趙龍文等提出一種基于關(guān)聯(lián)數(shù)據(jù)的遞進(jìn)式政府?dāng)?shù)據(jù)開放模式,在此基礎(chǔ)上給出一種四層結(jié)構(gòu)的技術(shù)框架,為相關(guān)的研究與實(shí)現(xiàn)提供了借鑒與參考[2];牛永骎等以圖書情報(bào)領(lǐng)域?yàn)槔?,基于D2R軟件發(fā)布了領(lǐng)域?qū)W者關(guān)聯(lián)數(shù)據(jù)集,它區(qū)別于傳統(tǒng)的機(jī)構(gòu)知識(shí)庫(kù),以更開放、關(guān)聯(lián)和共享的方式聚集一切相關(guān)的信息資源[3];祝帆帆等基于D2R工具將與中國(guó)十大傳世名畫相關(guān)的館藏?cái)?shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù),進(jìn)而發(fā)現(xiàn)關(guān)聯(lián)數(shù)據(jù)能有效實(shí)現(xiàn)館藏資源的整合并解決數(shù)據(jù)異構(gòu)的問(wèn)題[4]。

作為傳統(tǒng)行業(yè)之一的航運(yùn)業(yè)經(jīng)過(guò)多年的發(fā)展已經(jīng)建立了各類面向不同數(shù)據(jù)處理需求的航運(yùn)信息系統(tǒng),這些系統(tǒng)因建立的時(shí)間、采用的方案各不相同,使得彼此間無(wú)法實(shí)現(xiàn)信息交換,航運(yùn)信息的“碎片化”現(xiàn)象十分嚴(yán)重,而關(guān)聯(lián)數(shù)據(jù)技術(shù)的發(fā)展及其在具體領(lǐng)域的廣泛應(yīng)用為解決這一問(wèn)題提供了一種可行的思路和有效的方案。

因此,本文立足于解決現(xiàn)存的航運(yùn)數(shù)據(jù)“碎片化”問(wèn)題,將關(guān)聯(lián)數(shù)據(jù)技術(shù)引入航運(yùn)領(lǐng)域,探索航運(yùn)關(guān)聯(lián)數(shù)據(jù)的發(fā)布方法,并建立面向航運(yùn)關(guān)聯(lián)數(shù)據(jù)的SPARQL聯(lián)合查詢應(yīng)用,以更有效的數(shù)據(jù)組織形式及應(yīng)用方式重構(gòu)及利用航運(yùn)數(shù)據(jù),進(jìn)而最大限度地發(fā)揮航運(yùn)數(shù)據(jù)的潛在價(jià)值。

1 航運(yùn)本體的構(gòu)建

本體是對(duì)與領(lǐng)域相關(guān)且共享程度高的概念與知識(shí)的形式化、規(guī)范化說(shuō)明。在關(guān)聯(lián)數(shù)據(jù)的背景下,本體可看作是一套具有強(qiáng)語(yǔ)義性的規(guī)范詞匯表。航運(yùn)本體的構(gòu)建為原始航運(yùn)數(shù)據(jù)的RDF化提供了語(yǔ)義標(biāo)注的工具,是航運(yùn)關(guān)聯(lián)數(shù)據(jù)發(fā)布的基礎(chǔ)。

①類的定義。通過(guò)對(duì)航運(yùn)領(lǐng)域概念的分析與提取,得到的類包括:船舶、船公司、航次、港口、地點(diǎn)、船舶類型和人。每個(gè)類可以定義其子類,如船員為人的子類等。

②屬性的定義。定義每個(gè)類的屬性,以表征個(gè)體實(shí)例的性質(zhì)。以船舶類為例,它的屬性包括:船舶名稱、建造年份、總噸、凈噸、船長(zhǎng)度、船寬等。

③關(guān)系的定義。定義類的關(guān)系,以描述類之間存在的語(yǔ)義關(guān)聯(lián)。以船舶類為例,它的關(guān)系包括:注冊(cè)港口、所屬公司、船舶類型、船長(zhǎng)等。

④本體的形式化描述 為了滿足機(jī)器對(duì)于本體的理解和處理,需要采用序列化格式對(duì)本體進(jìn)行形式化編碼。以船舶類為例,給出船舶本體OWL序列化的部分結(jié)果如下:

2 航運(yùn)關(guān)聯(lián)數(shù)據(jù)的發(fā)布

本節(jié)詳細(xì)介紹航運(yùn)關(guān)聯(lián)數(shù)據(jù)發(fā)布的具體實(shí)現(xiàn)過(guò)程,為后續(xù)實(shí)現(xiàn)SPARQL聯(lián)合查詢提供可供使用的航運(yùn)關(guān)聯(lián)數(shù)據(jù)集。

①原始數(shù)據(jù)采集。從與航運(yùn)相關(guān)的網(wǎng)站上采集原始的航運(yùn)數(shù)據(jù),包括:從中遠(yuǎn)集裝箱運(yùn)輸網(wǎng)站上采集航次信息、從中國(guó)海事服務(wù)網(wǎng)采集港口信息、從中國(guó)港口網(wǎng)采集船舶數(shù)據(jù)等。部分航運(yùn)信息如下:

航次:014W、船名:COSCO_BELGIUM、承運(yùn)人:COSCO、預(yù)計(jì)離港日:2015-11-10、預(yù)計(jì)到港日:2015-11-13、航程:3天。

②數(shù)據(jù)語(yǔ)義標(biāo)注。使用構(gòu)建的航運(yùn)本體,遵循RDF三元組模型,對(duì)原始的航運(yùn)數(shù)據(jù)進(jìn)行語(yǔ)義標(biāo)注,使數(shù)據(jù)以機(jī)器可讀的形式表示與存儲(chǔ)。另外,將URI路徑http://mtlop.dlmu.edu.cn簡(jiǎn)記為mtopl:,上述原始數(shù)據(jù)中船舶實(shí)例的語(yǔ)義標(biāo)注結(jié)果如下:

③關(guān)聯(lián)鏈接構(gòu)建。關(guān)聯(lián)數(shù)據(jù)的最大價(jià)值在于構(gòu)建模式級(jí)或?qū)嵗?jí)的鏈接,而實(shí)例型的鏈接是最普遍、最重要的一類鏈接。對(duì)于航運(yùn)關(guān)聯(lián)數(shù)據(jù),將構(gòu)建數(shù)據(jù)集的內(nèi)部鏈接與數(shù)據(jù)集間的外部鏈接。其中,內(nèi)部鏈接包括將航次實(shí)例、船舶實(shí)例、港口實(shí)例、航運(yùn)公司實(shí)例等彼此互聯(lián),以實(shí)現(xiàn)航運(yùn)數(shù)據(jù)集內(nèi)部數(shù)據(jù)的集聚;外部鏈接主要將航運(yùn)數(shù)據(jù)集與包括DBPedia、Geonames和DSS在內(nèi)的其它數(shù)據(jù)進(jìn)行關(guān)聯(lián),以擴(kuò)展航運(yùn)數(shù)據(jù)集的空間范圍。以航運(yùn)數(shù)據(jù)集中的“大連港”為例,將其與DBPedia數(shù)據(jù)集中有關(guān)大連的實(shí)例進(jìn)行關(guān)聯(lián),結(jié)果如下:

④關(guān)聯(lián)數(shù)據(jù)發(fā)布。為了保證航運(yùn)關(guān)聯(lián)數(shù)據(jù)的可訪問(wèn)性,需要采用三元組存儲(chǔ)器將航運(yùn)RDF數(shù)據(jù)進(jìn)行發(fā)布,并對(duì)外提供可供訪問(wèn)的SPARQL查詢端口。本文使用Fuseki工具,該工具是基于HTTP的SPARQL查詢服務(wù)器。下載并配置后,以服務(wù)的形式運(yùn)行Fuseki,通過(guò)在瀏覽器中輸入網(wǎng)址http://127.0.0.1:3030/即可訪問(wèn)主界面。

將保存航運(yùn)實(shí)例數(shù)據(jù)的RDF文件上傳至Fuseki服務(wù)器中,可通過(guò)Fuseki專門提供的查詢端口編寫SPARQL查詢語(yǔ)言獲取滿足特定需求的航運(yùn)信息。

3 SPARQL聯(lián)合查詢的應(yīng)用實(shí)例

現(xiàn)有SPARQL只能用于查詢孤立終端中的數(shù)據(jù),不支持跨不同端口的聯(lián)合查詢。在實(shí)際的查詢應(yīng)用中,跨多個(gè)描述數(shù)據(jù)集的聯(lián)合查詢將會(huì)為用戶提供更加全面、豐富的信息資源。SPARQL1.1規(guī)范的擴(kuò)展通過(guò)引入SERVICE運(yùn)算符可支持分布式數(shù)據(jù)端口的聯(lián)合查詢。因此,本文在構(gòu)建并發(fā)布航運(yùn)關(guān)聯(lián)數(shù)據(jù)集的基礎(chǔ)上,借助SPARQL1.1規(guī)范的擴(kuò)展,實(shí)現(xiàn)航運(yùn)關(guān)聯(lián)數(shù)據(jù)的SPARQL聯(lián)合查詢應(yīng)用實(shí)例,示例代碼如下:

在執(zhí)行查詢時(shí),首先會(huì)在http://127.0.0.1:3030/query中查詢屬性“港口名稱”取值為'大連港'的資源r,而后通過(guò)owl:sameAs獲取此資源在DBpedia數(shù)據(jù)集中對(duì)應(yīng)的URI并賦值給變量rsameas,最后在另一個(gè)SPARQL端口http://DBpedia-live.openlinksw.com/sparql?timeout=2000中查詢?cè)撡Y源的屬性和屬性值,從而實(shí)現(xiàn)跨多個(gè)端口的SPARQL聯(lián)合查詢,最終獲取了關(guān)于同一資源的更多信息。

4 結(jié)論

本文構(gòu)建并發(fā)布了航運(yùn)關(guān)聯(lián)數(shù)據(jù),在此基礎(chǔ)上實(shí)現(xiàn)了SPARQL聯(lián)合查詢。本文的研究結(jié)果表明:關(guān)聯(lián)數(shù)據(jù)通過(guò)簡(jiǎn)單、直接的鏈接機(jī)制實(shí)現(xiàn)了航運(yùn)數(shù)據(jù)的語(yǔ)義化組織及數(shù)據(jù)集內(nèi)外的無(wú)縫集成,能有效解決航運(yùn)數(shù)據(jù)的“碎片化”現(xiàn)象,本文的下一步工作在于實(shí)現(xiàn)航運(yùn)數(shù)據(jù)的可視化聚合。

參考文獻(xiàn):

[1]陳德容.基于關(guān)聯(lián)數(shù)據(jù)的圖書館數(shù)據(jù)發(fā)布及數(shù)據(jù)服務(wù)[J]. 圖書館工作與研究,2015(2):25-27.

[2]趙龍文,莫荔媛,潘卓齊.基于關(guān)聯(lián)數(shù)據(jù)的政府?dāng)?shù)據(jù)開放實(shí)現(xiàn)方法研究[J].情報(bào)資料工作,2016(6).

[3]牛永骎,常娥.基于D2R發(fā)布學(xué)者關(guān)聯(lián)數(shù)據(jù)集探究-以圖書情報(bào)領(lǐng)域?yàn)槔齕J].圖書情報(bào)工作,2017,61(19):13-21.

[4]祝帆帆,高勁松,梁艷琪.館藏文物資源關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建與發(fā)布——以中國(guó)十大繪畫為例[J].圖書館理論與實(shí)踐,2018(4).

烟台市| 陈巴尔虎旗| 哈尔滨市| 大竹县| 道孚县| 曲水县| 康保县| 新源县| 南木林县| 东安县| 武夷山市| 方山县| 油尖旺区| 阳江市| 锡林浩特市| 桃园县| 翼城县| 内江市| 白朗县| 额尔古纳市| 林芝县| 密云县| 德安县| 博白县| 大理市| 犍为县| 靖江市| 敦化市| 马山县| 浠水县| 华容县| 遂溪县| 乐陵市| 滨海县| 彭阳县| 合川市| 滁州市| 元氏县| 淮北市| 台前县| 民丰县|