賈君枝
(山西大學(xué)經(jīng)濟(jì)與管理學(xué)院,太原 030006)
基于ISO 25964的詞表互操作實(shí)現(xiàn)探析*
賈君枝
(山西大學(xué)經(jīng)濟(jì)與管理學(xué)院,太原 030006)
詞表互操作是語義層面實(shí)現(xiàn)跨庫、跨語言、跨平臺檢索的必經(jīng)途徑。隨著網(wǎng)絡(luò)知識組織工具的應(yīng)用普及,不同類型詞表間的映射將是互操作實(shí)現(xiàn)最有效的方法。當(dāng)前,ISO 25964是保證詞表間映射流程規(guī)范化管理、提高映射質(zhì)量的重要標(biāo)準(zhǔn)。本文重點(diǎn)分析梳理該標(biāo)準(zhǔn)的核心內(nèi)容,進(jìn)一步探討詞表間互操作實(shí)現(xiàn)步驟及語義化描述,從而為各機(jī)構(gòu)開展互操作項(xiàng)目提供指導(dǎo)及建議,并對其詞表互操作實(shí)現(xiàn)的語義表述提供范例。
ISO 25964;互操作;詞表;敘詞表
1997年,網(wǎng)絡(luò)知識組織系統(tǒng)(Networked Knowledge Organization Systems,NKOS)被首次提出,旨在發(fā)展適應(yīng)網(wǎng)絡(luò)知識組織系統(tǒng)的數(shù)據(jù)模型,在傳統(tǒng)信息組織工具(如同義詞表、分類表、敘詞表)的基礎(chǔ)上,出現(xiàn)了新型網(wǎng)絡(luò)知識組織工具(如概念地圖、本體、分眾分類法、術(shù)語表)。在一定意義上,這些網(wǎng)絡(luò)知識組織工具都可統(tǒng)稱為詞表,以概念為描述對象,共同描述概念間的關(guān)系,而概念的外化形式實(shí)為詞匯。由于不同詞表構(gòu)建角度及方式不同,所涉及的語種、涵蓋領(lǐng)域存在差異,應(yīng)用這些詞表描述網(wǎng)絡(luò)資源形成的標(biāo)引及檢索結(jié)果也有所差異,使得用戶采用不同的檢索方式獲取所需資源。隨著數(shù)據(jù)庫集成應(yīng)用與發(fā)展,出現(xiàn)了跨庫、跨語言、跨領(lǐng)域的操作,由于不同數(shù)據(jù)庫采用的標(biāo)引詞表不同,所以會頻繁地涉及不同詞表間互操作的問題。目前,解決不同詞表互操作實(shí)現(xiàn)的最有效方法是實(shí)現(xiàn)詞表間的映射,即在兩個(gè)或多個(gè)詞表間建立詞匯對應(yīng),使詞表所標(biāo)引的結(jié)果間也相應(yīng)地建立對應(yīng)。比如,聯(lián)合國糧農(nóng)組織開展的AGROVOC項(xiàng)目[1]、美國國立醫(yī)學(xué)圖書館開展的UMLS Metathesaurus項(xiàng)目[2]、聯(lián)合國信息系統(tǒng)委員會開展的High Level Thesaurus Project項(xiàng)目[3]都屬于綜合領(lǐng)域多語言、多類型詞表的互操作項(xiàng)目,但由于映射機(jī)構(gòu)人員素質(zhì)、詞表間的差異度、映射的嚴(yán)格性等各種主客觀條件的差異,導(dǎo)致映射的質(zhì)量與結(jié)果不同。
因此,為提高映射質(zhì)量,確保映射流程的規(guī)范化管理,國外一些機(jī)構(gòu)開始制訂詞表的互操作標(biāo)準(zhǔn)。美國國家標(biāo)準(zhǔn)協(xié)會/美國國家標(biāo)準(zhǔn)信息協(xié)會發(fā)布Z39.19-2005定義了互操作的需求、影響互操作的因素、單語言受控詞表映射成其他語言、查詢、索引所采用的互操作方法[4];英國編制BS 8723-4:2007等標(biāo)準(zhǔn)均對詞表互操作中方法與模型的選擇、過程的實(shí)施、具體問題的應(yīng)對等與詞表互操作有關(guān)的內(nèi)容做出規(guī)范指導(dǎo)[5]。國際標(biāo)準(zhǔn)ISO 25964是國際標(biāo)準(zhǔn)化組織于2007年4月以N458文件的形式發(fā)布的敘詞表國際標(biāo)準(zhǔn)修訂項(xiàng)目計(jì)劃。該計(jì)劃將《單語種敘詞表編制準(zhǔn)則》(ISO 2788)和《多語種敘詞表的編制規(guī)則》(ISO 5964)進(jìn)行更新擴(kuò)展形成ISO 25964。ISO 25964包含兩部分,第一部分定義敘詞表編制標(biāo)準(zhǔn)[6],第二部分闡述敘詞表與其他詞表的互操作,對不同敘詞表間、敘詞表和其他類型詞表間建立映射及維護(hù)提供建議,為詞表間互操作實(shí)踐提供參考依據(jù)[7]。該互操作標(biāo)準(zhǔn)更強(qiáng)調(diào)詞表間概念層面的互操作,即語義匹配問題,而不是簡單的語詞形式匹配。
本文旨在分析ISO 25964-2的基礎(chǔ)上,梳理其核心內(nèi)容,探討詞表間互操作的實(shí)現(xiàn)步驟,從而為各機(jī)構(gòu)開展互操作項(xiàng)目提供指導(dǎo)及建議,并對詞表互操作實(shí)現(xiàn)的語義表述提供范例。
隨著詞表類型多樣化發(fā)展,互操作的難度也在增加。詞表間的互操作需要在明確各類型詞表特點(diǎn)的基礎(chǔ)上,以專業(yè)領(lǐng)域?qū)<覟楹诵?,按照既定的?guī)范步驟實(shí)施映射?,F(xiàn)將其總結(jié)為五大步驟:明確映射目標(biāo)、確定映射對象、選擇映射模型、確定映射類型、實(shí)施映射。
2.1 明確映射目標(biāo)
詞表間互操作目的是將一種詞表的表達(dá)式轉(zhuǎn)換成另外一種或幾種詞表的對應(yīng)表達(dá)式[7]。從語義交流角度看,通過設(shè)置此類交流渠道,信息發(fā)送方和接收者能理解彼此交換、共享的信息含義,機(jī)器間也可以準(zhǔn)確地解釋及交換信息。
確立明確的映射目標(biāo),是互操作實(shí)現(xiàn)的首要步驟。不同的映射目標(biāo)會造成映射模型及類型的差異,映射目標(biāo)取決于映射結(jié)果的最終去向,屬于用戶需求導(dǎo)向。從當(dāng)前的詞表映射實(shí)踐看,映射目標(biāo)具體分為三方面。
(1)生成新詞表。為提高詞表領(lǐng)域的覆蓋范圍,發(fā)揮不同詞表間的互補(bǔ)性,通過互操作方式建立新詞表,該詞表與多源詞表建立概念對應(yīng),使新詞表在未來信息資源處理環(huán)境中發(fā)揮重要作用。如美國國立醫(yī)學(xué)圖書館創(chuàng)建的一體化醫(yī)學(xué)語言系統(tǒng)項(xiàng)目(Unified Medical Language System,UMLS)中的超級敘詞表,由來自40多個(gè)生物醫(yī)學(xué)受控詞表、術(shù)語表、分類表、專家系統(tǒng)中的詞匯、詞典及工具性詞表構(gòu)成,其通過概念屬性的方式注明每個(gè)概念的來源詞表,實(shí)則建立了與來源詞表的映射關(guān)系。我國的《中分表》即為《中國圖書館分類法》與《漢語主題詞表》的相互映射表,該表為標(biāo)引人員同時(shí)進(jìn)行分類、主題標(biāo)引提供便利。
(2)用于數(shù)據(jù)收割。由于不同數(shù)據(jù)庫或系統(tǒng)平臺采用的標(biāo)引詞表、元數(shù)據(jù)格式不同,導(dǎo)致元數(shù)據(jù)記錄差異較大。數(shù)據(jù)收割需要從不同的數(shù)據(jù)庫或系統(tǒng)平臺自動(dòng)、持續(xù)地獲取數(shù)據(jù),并在此基礎(chǔ)上提供應(yīng)用服務(wù)。數(shù)據(jù)收割過程中需建立統(tǒng)一的元數(shù)據(jù)格式,將來源庫數(shù)據(jù)與本地元數(shù)據(jù)建立映射關(guān)系,實(shí)現(xiàn)數(shù)據(jù)表達(dá)的一致性。歐洲圖書館采用此方式收割上千家成員館的數(shù)據(jù),將編碼檔案著錄標(biāo)準(zhǔn)、都柏林核心元素集、機(jī)讀目錄、元數(shù)據(jù)對象描述模型等標(biāo)準(zhǔn)與概念參考模型(CIDOC CRM)建立映射[8]。
(3)用于聯(lián)邦檢索。聯(lián)邦檢索是同時(shí)從不同數(shù)據(jù)源檢索數(shù)據(jù),并將檢索結(jié)果整合后實(shí)時(shí)提交給用戶,以實(shí)現(xiàn)基于提問的跨庫/系統(tǒng)檢索。最關(guān)鍵的問題是聯(lián)邦檢索系統(tǒng)需要處理數(shù)據(jù)源之間的異構(gòu),主要體現(xiàn)在使用專用詞匯的共享和交流上,即語義層面的異構(gòu),這將涉及用戶檢索提問與不同數(shù)據(jù)源匹配、數(shù)據(jù)源本身所采用的描述性詞表差異的問題。因此,需要將聯(lián)邦檢索系統(tǒng)的中心詞表與各數(shù)據(jù)源的詞表建立映射,或者將各數(shù)據(jù)源的詞表間建立映射,用于將用戶檢索提問式轉(zhuǎn)換成各數(shù)據(jù)源需要的表達(dá)形式。
2.2 確定映射對象
確定映射對象包含三方面內(nèi)容,明確來源詞表和目標(biāo)詞表、映射方向、映射的范圍和數(shù)量。
當(dāng)前映射對象實(shí)際為詞表,根據(jù)映射方向不同,分為來源詞表和目標(biāo)詞表。來源詞表作為起始點(diǎn)詞表,需要在目標(biāo)詞表找到對應(yīng)語詞。
映射方向分為單向映射和雙向映射,雙向映射的工作量較大。對一些應(yīng)用而言,如來源詞表的用戶要檢索目標(biāo)詞表標(biāo)引的資源,只需建立單向映射,通常采用箭頭指向表示映射方向,單箭頭表示單向,雙箭頭表示雙向,由來源詞表指向目標(biāo)詞表,確立一個(gè)方向的映射后,再進(jìn)行反方向映射已有的映射可以作為參考借鑒,但不能完全借鑒,需要進(jìn)一步鑒別。
在上述基礎(chǔ)上明確映射的范圍及數(shù)量。映射的范圍分為全部映射和選擇式映射。全部映射即將來源詞表的詞匯盡可能在目標(biāo)詞表中找到對應(yīng)語詞。選擇式映射即部分映射,根據(jù)應(yīng)用需要對來源詞表的部分詞匯建立映射,若來源詞表與目標(biāo)詞表間差異較大,僅需在重疊領(lǐng)域建立映射;若僅為處理索引/目錄數(shù)據(jù)庫的數(shù)據(jù),則只需對應(yīng)用到目標(biāo)數(shù)據(jù)庫的部分詞匯集建立映射。若僅將中文書目數(shù)據(jù)庫的中圖分類號與國會圖書館分類號建立對應(yīng),由于缺乏來源詞表概念間明確的語義關(guān)系,映射質(zhì)量會受到影響。一旦映射范圍確定,映射工作量的大小也隨之確定。詞表的規(guī)模越大,復(fù)雜度越高,映射的工作量越大,映射難度也隨之增加。映射的數(shù)量決定是否有必要為每個(gè)概念建立多個(gè)映射。通常情況下,有精確匹配的概念不需做多個(gè)映射;在沒有精確匹配的條件下,為概念建立多個(gè)映射,即建立非精確、上下位及相關(guān)映射,對后期的應(yīng)用有重要的參考價(jià)值,對擴(kuò)充查詢詞、標(biāo)引詞集合有很大的幫助。
2.3 選擇映射模型
映射模型定義了映射采用的方法及其管理模式,通常取決于映射的目標(biāo)及其條件。ISO 25964將映射模型劃分為三種類型:結(jié)構(gòu)統(tǒng)一模型、直接連接模型、中心結(jié)構(gòu)模型。兩詞表間映射相對簡單,以直接連接模型為主,兩個(gè)以上詞表間映射需考慮映射結(jié)構(gòu)的選擇。
(1)結(jié)構(gòu)統(tǒng)一模型,適用于所映射的詞表具有完全相同的結(jié)構(gòu),僅存在表達(dá)語言、符號及其編碼模式上的差異。如《漢語主題詞表》中文版與《漢語主題詞表》英文版,《漢語主題詞表》MARC格式與《漢語主題詞表》SKOS形式都屬于此類結(jié)構(gòu)模型。相比其他模型而言,該模型結(jié)構(gòu)操作簡單,僅是一種語言/符號系統(tǒng)表達(dá)形式的詞表轉(zhuǎn)換成另外一種語言/符號表達(dá)系統(tǒng),映射類型單一,屬于精確匹配類型,適用于跨語言檢索或不同操作平臺的使用。
(2)直接連接模型,適用于所映射的詞表結(jié)構(gòu)差異化較大的情況(符合詞表多樣性條件),強(qiáng)調(diào)詞表間兩兩對應(yīng)的關(guān)系。對于相同或者不同類型的詞表,逐一對詞表的概念進(jìn)行分析,建立與對應(yīng)詞表的映射關(guān)系。如《中國圖書館分類法》與《杜威十進(jìn)分類法》(Dewey Decimal Classification,DDC)的映射屬于相同類型詞表的映射,LCSH與DDC的映射屬于不同類型詞表的映射。該模型結(jié)構(gòu)是映射模型中最常用的,適用于2個(gè)或3個(gè)詞表間的對應(yīng),映射工作量較大,維護(hù)成本高。
(3)中心結(jié)構(gòu)模型,適用于所處理的詞表數(shù)量多,覆蓋領(lǐng)域廣且類型復(fù)雜的互操作情況。該模型將一個(gè)詞表作為中心表,其他詞表作為衛(wèi)星表,建立中心表與衛(wèi)星表間概念映射。相比直接連接模型,其優(yōu)點(diǎn)在于:以中心表作為中介或者橋梁,將兩個(gè)完全不同的詞表建立間接映射,避免差異度極大的詞表映射情況出現(xiàn)。因?yàn)樵~表間映射數(shù)量減少,相應(yīng)也減少映射的工作量。但同時(shí)存在局限性:對中心表的要求較高,中心表的概念集合需滿足一定的覆蓋度與專指度,應(yīng)盡可能包含所有衛(wèi)星表的概念。如缺乏符合條件的中心表,可構(gòu)建一個(gè)新詞表;各衛(wèi)星表間為間接映射,“衛(wèi)星表1”通過中心表建立與“衛(wèi)星表2”的映射,形成的連續(xù)映射結(jié)果質(zhì)量較低;如連接的相關(guān)映射類型會無限放大關(guān)聯(lián)范圍,最終可能得到相關(guān)映射,但事實(shí)上是無關(guān)聯(lián)的。
2.4 確定映射類型
映射類型指定義兩個(gè)詞表之間、概念之間的映射關(guān)系。映射類型應(yīng)依據(jù)映射目標(biāo)及詞表類型對應(yīng)擇取,比如本體與本體的映射類型通常多于傳統(tǒng)分類表、敘詞表的映射類型,在于其本身的語義關(guān)系較豐富。當(dāng)前,常用的映射類型主要與敘詞表內(nèi)部概念關(guān)系一致,有等同映射、等級映射、相關(guān)映射,等同映射是三種映射中最常用的類型。通常以相關(guān)度大小確定映射類型的選擇順序,首選等同映射,其次是等級映射,最后為相關(guān)映射。為提高映射精確度,每一種類型還可進(jìn)行細(xì)分。
(1)等同映射。來源詞表與目標(biāo)詞表的概念范圍相同時(shí),建立等同映射,通常采用EQ(equivalence)表示。根據(jù)目標(biāo)詞表概念組合程度主要分為簡單等同和復(fù)合等同。簡單等同僅與目標(biāo)詞表中一個(gè)概念建立對應(yīng)關(guān)系,復(fù)合等同則與目標(biāo)詞表的多個(gè)概念的組合形式建立對應(yīng)關(guān)系,交叉復(fù)合等同是與兩個(gè)概念的交集建立對應(yīng)關(guān)系,并列復(fù)合等同則是與兩個(gè)概念的并集建立對應(yīng)關(guān)系。另外,當(dāng)目標(biāo)詞表的概念不足以完全表示來源詞表的概念時(shí),則需增加其他限定詞表(如復(fù)分表)共同表示,這種情況也屬于復(fù)合等同。除此之外,根據(jù)詞表間概念的相似程度,等同映射還可分為精確等同、非精確等同及部分等同。精確等同表示兩個(gè)概念范圍完全相等,可以彼此替代使用。由于詞表間差異較大,非精確等同占比較高,部分等同相對判斷難度較大,因此以建立等級映射為優(yōu)先考慮。
(2)等級映射。來源詞表與目標(biāo)詞表的概念范圍具有包含關(guān)系,建立等級映射。從下位到上位的等級映射通常采用NM(narrower mapping)表示,從上位到下位的等級映射采用BM(broader mapping)表示。根據(jù)概念間語義含義差別,可進(jìn)一步細(xì)分為屬種關(guān)系、實(shí)例關(guān)系、整體和部分關(guān)系[9]。屬種關(guān)系表示類與子類的關(guān)系,采用NMG/BMG表示,類是具有相同特點(diǎn)的個(gè)體集合,通過類與子類的關(guān)系創(chuàng)建類的層次結(jié)構(gòu),通常表現(xiàn)為大小范疇間的關(guān)系,如學(xué)生與中學(xué)生;實(shí)例關(guān)系表示類與成員的關(guān)系,采用NMI/BMI表示,成員通常對應(yīng)現(xiàn)實(shí)世界中存在的具體個(gè)體;整體和部分關(guān)系是一個(gè)實(shí)體對象由許多部件(部分)構(gòu)成,實(shí)體所屬的整體對象與實(shí)體部分對象間的關(guān)系,采用NMP/BMP表示,如手與指頭。嚴(yán)格區(qū)分后的等級映射能提高映射數(shù)據(jù)的質(zhì)量,無論應(yīng)用于標(biāo)引或查詢擴(kuò)展,都可在一定程度上提高查準(zhǔn)率。
(3)相關(guān)映射。來源詞表與目標(biāo)詞表的概念范圍具有部分重疊,有一定語義程度的關(guān)聯(lián),建立相關(guān)映射,通常采用RT(related mapping)表示。與其他映射類型相比,相關(guān)映射的語義關(guān)聯(lián)程度最弱,其相關(guān)性不易把握,需依賴具體應(yīng)用環(huán)境進(jìn)行判斷,如用戶的興趣、系統(tǒng)檢索相關(guān)文獻(xiàn)的能力與數(shù)量等。因此在實(shí)際互操作項(xiàng)目中,應(yīng)根據(jù)實(shí)際情況對相關(guān)性進(jìn)行明確界定,防止將語義關(guān)聯(lián)性較弱的概念納入映射集合,增加標(biāo)引和檢索的噪音數(shù)據(jù)。
2.5 實(shí)施映射
映射項(xiàng)的識別,關(guān)鍵在于明確概念的內(nèi)涵與外延。單從詞匯的外在表達(dá)形式并不能識別詞匯本身的真正含義,詞匯表中的詞匯有明確的上下文環(huán)境,因此在判斷對應(yīng)概念時(shí),需檢查其相應(yīng)的語義關(guān)系,通過詞表內(nèi)部概念的等級關(guān)系、等同關(guān)系、相關(guān)關(guān)系,及注釋判定其內(nèi)在含義,并在此基礎(chǔ)上完成映射。如果是雙向映射,需先完成一個(gè)方向的系統(tǒng)映射,再實(shí)施反方向映射,通常情況下,已完成的映射結(jié)果可被進(jìn)一步使用;尤其是等同映射,具有可逆性,其在反方向映射中同樣有效;但其他類型映射,需做進(jìn)一步審核才可使用。
映射的完成,通常采用人工映射(專家)和自動(dòng)映射(計(jì)算機(jī))兩種方法實(shí)現(xiàn)。人工映射的準(zhǔn)確率較高,需要專家熟悉詞表的結(jié)構(gòu)及專業(yè)詞匯,涉及工作量較大;計(jì)算機(jī)自動(dòng)映射效率高,采用概念匹配或共現(xiàn)映射的方式,形成候選映射集并進(jìn)行排序輸出,但相對準(zhǔn)確率低,需要專家對映射結(jié)果進(jìn)行審核。
映射完成后需將映射詞表的數(shù)據(jù)存入管理系統(tǒng),存儲映射的基本信息包括來源詞表、目標(biāo)詞表、映射結(jié)果表、映射的注釋信息等;此外,還需定期對映射數(shù)據(jù)進(jìn)行維護(hù),及時(shí)修訂映射數(shù)據(jù),如果來源詞表、目標(biāo)詞表發(fā)生變化,應(yīng)及時(shí)對數(shù)據(jù)進(jìn)行修改,確保映射數(shù)據(jù)的質(zhì)量。
為適應(yīng)語義網(wǎng)的要求,盡可能采用簡單知識組織系統(tǒng)表示映射結(jié)果數(shù)據(jù)。SKOS定義了一個(gè)通用數(shù)據(jù)模型,能將數(shù)據(jù)表示為機(jī)器可讀數(shù)據(jù),用于計(jì)算機(jī)應(yīng)用軟件間的數(shù)據(jù)交換和以機(jī)器可讀的格式實(shí)現(xiàn)網(wǎng)絡(luò)發(fā)布。負(fù)責(zé)ISO 25964的機(jī)構(gòu)ISO TC46/SC9/WG8工作組發(fā)布《ISO 25964與SKOS/SKOS-XL模型的對應(yīng)》,以適應(yīng)ISO 25964-1所定義的UML模型[10]。
SKOS映射關(guān)系屬性包括skos:closeMatch、skos: exactMatch、skos:broadMatch、skos:narrowMatch和skos:relatedMatch[11]。這些屬性用于聲明不同概念體系中SKOS概念間的映射鏈接,分別對應(yīng)不同的映射類型。skos:exactMatch對應(yīng)等同映射;skos:broadMatch和skos:narrowMatch對應(yīng)兩概念間的等級映射;skos: relatedMatch屬性對應(yīng)兩概念間的相關(guān)映射;skos: closeMatch表示兩個(gè)概念相似,對應(yīng)非精確等同。為充分表達(dá)兩個(gè)概念的重合程度,還定義majorMatch、minorMatch屬性,分別表示重合較大及重合范圍較小兩種情況;將概念作為類,允許概念類之間進(jìn)行集合的交并補(bǔ)運(yùn)算,以表達(dá)復(fù)合等同的情況。SKOS語義表示中,需先定義來源詞表、目標(biāo)詞表,再確定來源詞表中的被映射詞匯,對其基本信息(如詞匯名、類名、優(yōu)選詞、非優(yōu)選詞等)進(jìn)行描述,最后描述與目標(biāo)詞表所對應(yīng)詞匯。如將DDC中類號“363.34”與LCSH中敘詞“Pollution”建立等同映射,與“Natural disasters”建立下位映射,SKOS表示如下。
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#"
xmlns:map="http://www.w3.org/2004/02/skos/mapping#"
<skos:Concept rdf:about="#363.34">
<skos:prefLabel xml:lang="zxx">363.34</skos:prefLabel>
<skos:altLabel xml:lang="en">Disasters</skos:altLabel>
<skos:inScheme rdf:resource="http://hiltm2m.cdlr.strath.ac.uk/hiltm2m/schemes/DDC.xml"/>
<map:exactMatch>
<skos:Concept rdf:about="#sh 85038303"/>
</map:exactMatch>
<map:narrowMatch>
<skos:Concept rdf:about="#sh 85090214"/>
</map:narrowMatch>
</skos:Concept>
<skos:Concept rdf:about="#sh 85038303">
<skos:prefLabel xml:lang="en">Disasters</skos:prefLabel>
<skos:inScheme rdf:resource="http://hiltm2m.cdlr.strath.ac.uk/hiltm2m/schemes/LCSH.xml"/>
</skos:Concept>
<skos:Concept rdf:about="#sh 85090214">
<skos:prefLabel xml:lang="en">Natural disasters</skos:prefLabel>
<skos:inScheme rdf:resource="http://hiltm2m.cdlr.strath.ac.uk/hiltm2m/schemes/LCSH.xml"/>
</skos:Concept>
</rdf:RDF>
隨著網(wǎng)絡(luò)資源異構(gòu)性增加,詞表互操作是當(dāng)前網(wǎng)絡(luò)資源檢索面臨的重要問題。ISO 25964對推動(dòng)詞表互操作實(shí)踐具有重要作用。目前,我國基于ISO 25964正在制訂適合中國的標(biāo)準(zhǔn),以期提高中文詞表間的映射質(zhì)量,并實(shí)現(xiàn)與國外詞表的互聯(lián)互通。本文分析梳理ISO 25964的核心內(nèi)容,進(jìn)一步探討詞表間互操作實(shí)現(xiàn)步驟及語義化描述,旨在為各機(jī)構(gòu)開展互操作項(xiàng)目提供指導(dǎo)及建議,對其詞表互操作實(shí)現(xiàn)的語義表述提供范例。由于互操作本身是一項(xiàng)智力勞動(dòng),需要各方面力量的投入,為提高效率,如何充分利用技術(shù)能力實(shí)現(xiàn)計(jì)算機(jī)自動(dòng)映射將是未來研究的關(guān)鍵問題。
[1] AIMS.AGROVOC Multilingual agricultural thesaurus[EB/OL].(2016-07) [2016-09-07].http://aims.fao.org/vest-registry/vocabularies/agrovocmultilingual-agricultural-thesaurus.
[2] U.S.National Library of Medicine. Unified Medical Language System (UMLS)[EB/OL].[2016-07-02].https://www.nlm.nih.gov/research/umls/.
[3] University of Strathclyde Glasgow.Subject-based interoperability:issues from the high level thesaurus(HILT)project[EB/OL].(2007-01-15) [2016-07-10].http://strathprints.strath.ac.uk/2315/.
[4] NISO.ANSI/NISO Z39.19-2005(R2010)guidelines for the construction, format, and management of monolingual controlled vocabularies[EB/OL].(2010-05-13)[2016-07-20].http://www.niso.org/apps/group_public/project/details.php?project_id=46.
[5] BS 8723-4:2007 Structured vocabularies for information retrieval.Guide. Interoperability between vocabularies[EB/OL].[2016-07-23].http://www. standardscentre.co.uk/bs/BS-8723-4-2007/.
[6] ISO.ISO 25964-1:2011 Information and documentation-Thesauri and interoperability with other vocabularies Part 1:Thesauri for information retrieval[EB/OL].(2011-08-15)[2016-03-20].http://www.iso.org/iso/catalogue_detail.htm?csnumber=53657.
[7] ISO.ISO 25964-2:2013 Information and documentation-Thesauri and interoperability with other vocabularies Part 2:Interoperability with other vocabularies[EB/OL].(2013-03-04)[2016-03-20].http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=53658.
[8] OLENSKY M. Semantic interoperability in Europeana.An examination of CIDOC CRM in digital cultural heritage documentation[J/OL].TCDL Bulletin,2010,6(2).[2016-09-01].http://www.ieee-tcdl.org/Bulletin/v6n2/Olensky/olensky.html.
[9] ALEXIEV V,ISAAC A,LINDENTHAL J.On the composition of ISO 25964 hierarchical relations (BTG, BTP, BTI)[J].International Journal on Digital Libraries,2016,17(1):39-48.
[10] NISO.ISO 25964-the international standard for thesauri and interoperability with other vocabularies[EB/OL].[2016-07-02].http://www.niso.org/schemas/iso25964/.
[11] W3C.SKOS mapping vocabulary specification[EB/OL].[2016-04-02]. https://www.w3.org/2004/02/skos/mapping/spec/2004-11-11.html.
《科技報(bào)告體系構(gòu)建研究》
為推進(jìn)我國科技報(bào)告制度建設(shè),強(qiáng)化科技報(bào)告資源共享服務(wù),賀德方研究員率領(lǐng)中國科學(xué)技術(shù)信息研究所科技報(bào)告研究團(tuán)隊(duì),進(jìn)行了國家社會科學(xué)基金重點(diǎn)項(xiàng)目“中國科技報(bào)告資源體系構(gòu)建”(11ATQ006)研究,并對20多年來中國科學(xué)技術(shù)信息研究所相關(guān)研究和實(shí)踐進(jìn)行了歸納、凝練、整理和補(bǔ)充,最終形成了《科技報(bào)告體系構(gòu)建研究》一書。
本書作為國家社會科學(xué)基金重點(diǎn)項(xiàng)目的主要研究成果,總結(jié)了科技報(bào)告產(chǎn)生發(fā)展的管理歷程、凝練了科技報(bào)告制度的建設(shè)路徑、制訂了科技報(bào)告資源的整合方案,提出了科技報(bào)告體系的構(gòu)建模式,歸納了科技報(bào)告實(shí)踐的操作過程。本書對各級科技計(jì)劃管理人員強(qiáng)化科技計(jì)劃項(xiàng)目過程管理具有借鑒作用,對科研人員撰寫高質(zhì)量科技報(bào)告具有指導(dǎo)作用,對各類科研機(jī)構(gòu)做好科技報(bào)告呈交、推進(jìn)科技項(xiàng)目的規(guī)范管理和機(jī)構(gòu)知識庫建設(shè)具有參考價(jià)值,對圖書信息機(jī)構(gòu)做好科技報(bào)告深層次加工和收藏利用具有引導(dǎo)作用,也可供高校信息管理、科技政策與管理等專業(yè)研究生學(xué)習(xí)參考。
《科技報(bào)告體系構(gòu)建研究》于2014年12月由科學(xué)技術(shù)文獻(xiàn)出版社出版,定價(jià)78.00元。
The Realization of Interoperability across Vocabularies Based on ISO 25964
JIA JunZhi
(School of Economics and Management, Shanxi University, Taiyuan 030006, China)
s: Interoperability across vocabularies is necessary to realize information retrieval across database, languages, and systems. Mapping among vocabularies is an efficient way of interoperability with the application of network knowledge organization. The standards of ISO 25964 play an important role in guaranteeing the formal management of mapping procedures and improving the quality of mapping.The paper emphasizes on analyzing the core content of standard and discusses the realization steps of interoperability and semantic description.It will give reference and advice of projects of interoperability and provide paradigms for semantic description of interoperability across vocabularies.
ISO 25964; Interoperability; Vocabularies; Thesaurus
G254
10.3772/j.issn.1673-2286.2016.12.002
賈君枝,女,1972年生,山西大學(xué)經(jīng)濟(jì)與管理學(xué)院教授,博士生導(dǎo)師,研究方向:信息組織,E-mail:junzhij@163.com。
2016-09-07)
* 本研究得到山西省高校基金項(xiàng)目“131”領(lǐng)軍人才工程“敘詞表與其他詞表的互操作標(biāo)準(zhǔn)”(編號:2015052002)和山西省高等學(xué)校中青年拔尖創(chuàng)新人才項(xiàng)目(編號:2016052002 )資助。