韓 潔 (德州學(xué)院圖書館 山東 德州 253023)
本體是一種可以在語義和知識(shí)層次上描述信息系統(tǒng)的概念模型建模工具。本體建模完全可以以傳統(tǒng)的知識(shí)組織體系為基礎(chǔ),利用已有的知識(shí)成果,吸取其中的概念、詞匯,將傳統(tǒng)知識(shí)轉(zhuǎn)化為新型的知識(shí)組織體系。《中國分類主題詞表》是圖書情報(bào)領(lǐng)域依據(jù)國際標(biāo)準(zhǔn)制定的一個(gè)術(shù)語控制工具,它選詞多、范圍廣,很適合建立大型的本體。本文以《中國分類主題詞表》為母體,以O(shè)WL(Web Ontology Language,網(wǎng)絡(luò)本體語言)對(duì)《中國分類主題詞表》轉(zhuǎn)換本體進(jìn)行形象化描述,構(gòu)建基于OWL的知識(shí)組織體系。
OWL是W3C(World Wide Web Consortium,萬維網(wǎng)聯(lián)盟)開發(fā)的一種網(wǎng)絡(luò)本體語言,用來對(duì)本體進(jìn)行語義描述,是W3C推薦的語義互聯(lián)網(wǎng)中本體描述語言的標(biāo)準(zhǔn)。OWL語言具有優(yōu)良的定義語法和語義、高效率的推理支持、充分的表達(dá)能力和表達(dá)的方便性[1],可以將設(shè)計(jì)知識(shí)術(shù)語間的語義信息與關(guān)系精準(zhǔn)地表達(dá)出來。
OWL約束公理是對(duì)概念所包含的各種約束和限制條件進(jìn)行詳盡的描述,是OWL類公理的核心部分。OWL約束公理可分為基數(shù)約束和值約束兩種。基數(shù)約束包括以下3種:①owl:minCardinality:指被約束屬性的取值范圍最少應(yīng)取owl:minCardinality所指定的數(shù)目的不同值。用符號(hào)“≥”表示。②owl:maxCardinality:指被約束屬性的取值范圍內(nèi)最多能取owl:maxCardinality所指定的數(shù)目的不同值。用符號(hào)“≤”表示。③owl:cardinality:指認(rèn)定被約束屬性的取值基數(shù),可以使用一組取值一致的owl:minCardinality和owl:maxCardinality來取代。用符號(hào)“=”表示。值約束包括以下3種:①owl:allValuesFrom: 用符號(hào)表示,相當(dāng)于邏輯中的全稱量詞。每一個(gè)有指定屬性的類別實(shí)例,其屬性的值必須是由owl:allValuesFrom從句指定的類的實(shí)例。取值可以為空。②owl:hasValue:用符號(hào)“ ”表示。被約束屬性的取值范圍內(nèi)至少有一個(gè)是owl:hasValue所規(guī)定的值或者與所規(guī)定的值語義相當(dāng)。取值不能為空。③owl:someValuesFrom:用符表示,相當(dāng)于邏輯中的存在量詞。約束屬性的取值范圍內(nèi)至少有一個(gè)是owl:someValuesFrom所規(guī)定的類別的實(shí)例。取值不可為空。
《中國分類主題詞表》的本體建構(gòu)應(yīng)依照兩條標(biāo)準(zhǔn):一是以詞語為中心類(Class),以類號(hào)為類的屬性(Property)值,以便與敘詞表和自然語言系統(tǒng)實(shí)現(xiàn)互操作,這是本體或語義網(wǎng)的關(guān)鍵目標(biāo),這樣做的好處是可以在語義環(huán)境中實(shí)現(xiàn)多個(gè)敘詞表、分類表的語義集成[2];二是以《中國分類主題詞表》主表的詞語間關(guān)系作為本體處理的重點(diǎn),以同一、等級(jí)等詞語間關(guān)系作為本體處理的基本關(guān)系,這樣做的好處是方便與一般語言關(guān)系的處理方法保持統(tǒng)一。
建立一個(gè)“中國分類主題詞表本體”,這個(gè)本體把《中國分類主題詞表》的一級(jí)類(基本大類)根據(jù)情況設(shè)為Top Class (最高類)、Group Class (類組,即幾個(gè)并列概念共有一個(gè)類號(hào),如《中國分類主題詞表》的G類)、Double Scheme Class (雙表類,即用雙表列類的大類,如《中國分類主題詞表》的法律類);二、三級(jí)類根據(jù)情況分別設(shè)置Subject Class (學(xué)科類,指可以成為“XX學(xué)”或分支學(xué)科的類)或Main Class (主類,指非學(xué)科性的知識(shí)部門);三級(jí)以下類采用Concept Class(概念類,即概念及其體系類目)。類間關(guān)系描述采用rdfs:subClassOf、owl:equivalentClass、owl:unionOf、owl:intersectionOf等OWL語句進(jìn)行描述[3]。本文采用的方案如表1所示。
表1 《中國分類主題詞表》主表的類框架及其OWL描述
表2 《中國分類主題詞表》附表的類型及類本體關(guān)系
《中國分類主題詞表》附表 (Appendix Scheme)應(yīng)作為一般的概念表進(jìn)行處理,即地區(qū)、民族和時(shí)代都要以語詞為中心,再用值域號(hào)碼作為其復(fù)分屬性值。也就是說,我們可以采用一般的時(shí)代、國家作為本體的類別,然后用OWL 的定義域(Domain)定義該類應(yīng)該在哪個(gè)附表內(nèi),用值域( Range)定義該大類的復(fù)分號(hào)。例如,英國的復(fù)分號(hào)是“565”,據(jù)上述分析可知其定義域是“CLC;WorldDistrictList”,其值域是“CLC-WorldDistrict SchemeCode; 565”。 當(dāng)主表與附表聯(lián)合起來使用時(shí),我們可以將此看作是主表概念和附表概念的交叉組配,用<o(jì)wl:intersectionOf>語句進(jìn)行兩概念的組配和類號(hào)組合[4]。其基本結(jié)構(gòu)見表 2。
《中國分類主題詞表》的類間關(guān)系主要有等級(jí)關(guān)系、并列關(guān)系、同一關(guān)系和相關(guān)關(guān)系。
3.1.1 等級(jí)關(guān)系的OWL描述
《中國分類主題詞表》中類目之間的等級(jí)關(guān)系在本體中表現(xiàn)為“父類—子類”關(guān)系,用“A rdfs:subClassOf B”表示。OWL描述如下:
3.1.2 并列關(guān)系的OWL描述
3.1.3 同一關(guān)系的OWL描述
《中國分類主題詞表》中類目之間的同一關(guān)系在本體中表現(xiàn)為交替關(guān)系,用“hasAlternativeClass”表示。OWL描述如下:
3.1.4 相關(guān)關(guān)系的OWL描述
《中國分類主題詞表》中類目之間的相關(guān)關(guān)系在本體中表現(xiàn)為交叉關(guān)系,用“owl:intersectionOf”表示。OWL描述如下:
《中國分類主題詞表》附表主要包括總論復(fù)分表、世界地區(qū)表、中國地區(qū)表、國際時(shí)代表、中國時(shí)代表、世界種族與民族表、中國民族表、通用時(shí)間和地點(diǎn)表等。筆者以世界地區(qū)表中上位類“南美洲”、下位類“巴西”為例,描述類目關(guān)系如下:
本文選用Proté gé 3.2來構(gòu)建《中國分類主題詞表》中旅游領(lǐng)域本體。
旅游要求有服務(wù)提供機(jī)構(gòu)進(jìn)行支撐。流程類服務(wù)包括訂票服務(wù)、租車服務(wù)、訂旅館服務(wù)和導(dǎo)游服務(wù)4個(gè)子類。根據(jù)服務(wù)流程規(guī)定,網(wǎng)絡(luò)上應(yīng)有旅游公司、旅館和交通運(yùn)輸公司的信息。根據(jù)所選擇交通工具的差異,交通運(yùn)輸公司應(yīng)有子類:航空公司、火車站點(diǎn)、出租車公司和公交公司等。而旅館按星級(jí)可劃為:普通旅店和星級(jí)賓館(包括一至五星級(jí))。人作為旅游中信息交互的主體,在服務(wù)流程中主要包括導(dǎo)游和游客。因此,旅游領(lǐng)域本體應(yīng)有自然人及其子類導(dǎo)游和游客。根據(jù)旅游服務(wù),交通工具主要有:飛機(jī)、火車、出租車、公交車。景區(qū)主要分為自然景觀和人文景觀。其中,天象景觀、水文景觀和地文景觀屬于自然景觀;而文物古跡、革命活動(dòng)地、民風(fēng)民俗、宗教建筑等歸類于人文景觀。地點(diǎn)包括出發(fā)地和目的地,按地區(qū)行政區(qū)劃包括國家、省、城市(見下頁表3)。
人通過姓名、年齡、電話、E-mail等屬性進(jìn)行描述,同樣的,服務(wù)機(jī)構(gòu)也具有相應(yīng)屬性,并也可通過單位名、單位地址、電話、E-mail等屬性進(jìn)行描述。導(dǎo)游引導(dǎo)游客,即游客被導(dǎo)游引導(dǎo),故用“引導(dǎo)”、“被引導(dǎo)”關(guān)聯(lián)導(dǎo)游和游客,“引導(dǎo)”與“被引導(dǎo)”為互逆關(guān)系,因此設(shè)定“引導(dǎo)”的Facets為InverseOf,“被引導(dǎo)”的Facets也為InverseOf[5],其部分OWL描述如下:
表3 旅游領(lǐng)域類本體層次結(jié)構(gòu)表
[1]Petrinja E.A Provenance Data Management System for Improving the Product Modeling Process[J].Automation in Construction,2006(4):485-497.
[2]中國科學(xué)技術(shù)信息研究所.國內(nèi)外詞系統(tǒng)發(fā)展情況調(diào)研報(bào)告[R].北京:中國科學(xué)技術(shù)信息研究所,2007:5-6.
[3]段榮婷.基于簡(jiǎn)約知識(shí)組織系統(tǒng)的《中國檔案主題詞表》語義網(wǎng)絡(luò)化應(yīng)用研究[J].現(xiàn)代圖書情報(bào)技術(shù),2010(10):33-42.
[4]Assem M, Menken M R, Shreiber G,et al.A Method for Converting Thesauri to RDF / OWL[EB/OL].[2013-02-01].http://link.springer.com/chapter/10.1007/978-3-540-30475-3_3#page-1.
[5]陳彥萍.基于OWL的旅游領(lǐng)域本體的構(gòu)建[J].西安郵電學(xué)院學(xué)報(bào),2011(1):78-82.