国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

資源描述標準的國際最新進展及對我國資源描述工作的影響

2021-02-14 03:52:26宋文
數(shù)字圖書館論壇 2021年11期
關(guān)鍵詞:著錄規(guī)則編目書目

宋文

(1. 中國科學(xué)院文獻情報中心,北京 100190;2. 中國科學(xué)院大學(xué),北京 100049)

20世紀90年代開始,隨著數(shù)字資源的發(fā)展,國際編目界開始對延續(xù)了半個世紀的國際編目規(guī)則進行系統(tǒng)性的反思和研究,其標志性的研究成果是1998年國際圖書館協(xié)會聯(lián)合會(International Federation of Library Associations and Institutions,IFLA)發(fā)布的《書目記錄的功能需求》(Functional Requirements for Bibliographic Records,F(xiàn)RBR)。隨著2010年《資源描述與檢索》(Resource Description and Access,RDA)和2011年《國際標準書目著錄(統(tǒng)一版)》(International Standard Bibliographic Description.Consolidated Edition,ISBD統(tǒng)一版)的發(fā)布,文獻編目領(lǐng)域醞釀已久的翻天覆地的變化開始顯露。從文獻著錄向全資源譜系的資源描述,從書目數(shù)據(jù)的MARC格式向基于RDF資源描述框架和W3C知識表示語言的關(guān)聯(lián)數(shù)據(jù)及語義描述發(fā)展,是國際資源描述領(lǐng)域當前正在實施和努力推進的工作。

1 資源描述標準的國際發(fā)展概述

在圖書館的傳統(tǒng)上,把資源描述稱為編目或著錄,把資源描述標準稱為編目標準、編目條例、編目規(guī)則或著錄規(guī)則。國際編目標準發(fā)展大致經(jīng)歷了3個階段:編目規(guī)則的萌芽階段(19世紀40年代至20世紀50年代)、國際編目標準的形成和自動化階段(20世紀60年代至90年代)、數(shù)字化和語義化的資源描述階段(20世紀90年代末至今)。

1.1 編目規(guī)則的萌芽階段

雖然最早的圖書館目錄可以追溯到公元前7世紀的美索不達米亞的圖書館目錄[1],但真正意義上的編目規(guī)則出現(xiàn)在1841年。

1841年,大英博物館圖書館部(the British Museum Library),大英圖書館(the British Library)的前身[2],制定了國際上第一個編目規(guī)則《目錄編輯規(guī)則》(Rules for the Compilation of the Catalogue)[3],該編目規(guī)則制定了91條建立圖書館目錄的規(guī)則,因此它又稱為“91 Rules”[4]。

1883年美國圖書館學(xué)會(American Library Association,ALA)發(fā)布了《簡明著者和題名目錄規(guī)則》(Condensed Rules for an Author and Title Catalog)[5]。1893年英國圖書館學(xué)會(Library Association,LA)對“91 Rules”進行修訂,發(fā)布了《大英博物館、博德利圖書館、英國圖書館學(xué)會編目規(guī)則》(Cataloguing Rules of the British Museum,of the Bodleian Library,of the LibraryAssociation)。

隨著1901年美國國會圖書館發(fā)行卡片目錄,對統(tǒng)一編目規(guī)則的呼聲越來越強烈。美國圖書館學(xué)會與英國圖書館學(xué)會合作,協(xié)調(diào)兩國的編目規(guī)則,于1908年制定了第一個國際性的編目規(guī)則《編目規(guī)則:著者和題名款目》(Catalog Rules:Author and Title Entries)。該規(guī)則分北美版(American Edition)和大英版(British Edition),兩個版本的內(nèi)容基本一致[6]。該編目規(guī)則很快被美國和英國及其他英語國家的圖書館采納。

1.2 國際編目標準的形成和自動化階段

1.2.1 國際編目規(guī)則的標準化

《編目規(guī)則:著者和題名款目》主要被英語國家所采納,它還不是一個國際著錄標準。隨著20世紀開始集中化的書目服務(wù)網(wǎng)絡(luò)的增長,以及各國家圖書館之間書目交換的發(fā)展,催生了國際統(tǒng)一編目規(guī)則的發(fā)展。

IFLA在1961年召開國際編目專家會議,會議采納了美國編目專家Seymour Lubetzky向大會提出的工作報告和他的“不僅要有規(guī)則,而且要有原則”的指導(dǎo)思想。會議制訂并通過了“原則聲明”(《巴黎原則聲明》),該聲明包括:目錄的職能和結(jié)構(gòu);款目的種類、使用和功能;統(tǒng)一題名;著者標目、書名標目;個人名稱的款目詞等,從而形成一個完整的編目原則體系?!栋屠柙瓌t聲明》成為各國制定編目規(guī)則的一致遵守的基本原則。從那時起,世界范圍內(nèi)發(fā)展的大多數(shù)編目規(guī)則嚴格或至少在很大程度上遵守了這些原則[7]?!栋屠柙瓌t聲明》為建立統(tǒng)一的國際編目標準奠定了基礎(chǔ)。

在《巴黎原則聲明》基礎(chǔ)上,美國圖書館學(xué)會和英國圖書館學(xué)會以及美國國會圖書館、加拿大圖書館合作制定了Anglo-American Cataloguing Rules(AACR),即《英美編目條例》第一版。AACR于1967年正式出版[8],仍然分為北美版和大英版。

1967年AACR出版后,IFLA編目委員會于1969年在哥本哈根組織了一次國際編目專家會議。這導(dǎo)致了ISBD的發(fā)展。ISBD是實現(xiàn)國際統(tǒng)一書目控制的里程碑事件。ISBD專著著錄規(guī)則ISBD(M)發(fā)布于1974年,標志著書目著錄規(guī)則走向國際標準化的開始。隨后,IFLA編目委員會又陸續(xù)制定了ISBD(G)、ISBD(CM)、ISBD(ER)等8個系列的國際標準書目著錄規(guī)則。

1974年3月,美國圖書館學(xué)會在芝加哥總部舉行了一次三國會議,由英美編目條例的3個制定國家各派一名代表參加。會議成立了AACR聯(lián)合修訂委員會(Joint Steering Committee for Revision of AACR,JSC),并完成AACR第二版項目的規(guī)劃[9]。1978年AACR2第一版正式出版。

《巴黎原則聲明》、ISBDs和AACR2是編目領(lǐng)域的里程碑事件,這些國際編目標準主導(dǎo)國際標準的書目著錄和書目數(shù)據(jù)交換長達半個世紀之久。

1.2.2 計算機可讀目錄的發(fā)展

書目數(shù)據(jù)的標準化,為機讀目錄的發(fā)展提供了基礎(chǔ)保障。機讀目錄的發(fā)展又對書目數(shù)據(jù)的標準化提出了更高的要求。

20世紀60年代,計算機應(yīng)用開始進入圖書館領(lǐng)域。1965—1966年,美國國會圖書館啟動計算機可讀目錄(Machine-Readable Cataloging,MARC)試點項目MARC pilot project[10]。該項目的成果是全球第一個機讀目錄格式MARC I,經(jīng)過改進后稱為MARC II。因為MARC II是美國國會圖書館研制的,所以后來稱MARC II為LCMARC(the Library of Congress MARC)。LCMARC是一個標記系統(tǒng),通過定義標記書目著錄各元素的字段和子字段標識符,使計算機可理解和處理書目信息。LCMARC的產(chǎn)生標志著圖書館從卡片目錄時代向自動化時代的轉(zhuǎn)變。LCMARC修訂后的第二版改名為USMARC(United States MARC),成為美國國家標準。1999年,美國國會圖書館和加拿大國家圖書館將USMARC和CAN/MARC(Canada MARC)進行合并,將新的MARC命名為MARC21,成為面向21世紀的機讀目錄格式。

在USMARC發(fā)展的同時,英國國家書目委員會啟動BNBMARC(the British National Bibliography Machine Readable Cataloguing)項目,其成果是英國機讀目錄格式UKMARC(United Kingdom MARC)。20世紀70年代,國際上有20多個MARC,并且這一數(shù)字還在不斷增長。

由于各國定義的MARC在內(nèi)容表達、結(jié)構(gòu)和字段定義等方面都有很大差異,為達到國際范圍的書目信息共享和交換,IFLA提出一個解決方案,即定義一個中間MARC,如果20多種MARC間需要進行數(shù)據(jù)交換,那么只需每種MARC都編制與中間MARC的轉(zhuǎn)換程序,便可達到與任何MARC進行數(shù)據(jù)交換的目的。1977年,IFLA發(fā)布UNIMARC(Universal MARC)后,其作用不僅是作為一個中間橋,很多國家都基于UNIMARC來制定本國的MARC格式[11]。

中國機讀目錄格式(China MARC,CNMARC)是依據(jù)UNIMARC制定的,1990年中國國家圖書館首次發(fā)布中國機讀目錄格式。CNMARC的發(fā)布為推動我國圖書館卡片目錄轉(zhuǎn)換成計算機可讀目錄發(fā)揮了巨大作用[12]。

1.3 數(shù)字化和語義化的資源描述階段

20世紀90年代初,網(wǎng)絡(luò)信息資源和各種類型的數(shù)字資源迅猛增加,對數(shù)字資源和網(wǎng)絡(luò)信息資源的組織和描述的研究也迅速增加。

1994年,萬維網(wǎng)的發(fā)明者Tim Berners-Lee創(chuàng)立萬維網(wǎng)聯(lián)盟(the World Wide Web Consortium,W3C)。W3C的目標是通過制定協(xié)議、標準和指南,領(lǐng)導(dǎo)萬維網(wǎng)的發(fā)展[13]。1996年,W3C發(fā)布XML草案,XML成為了萬維網(wǎng)結(jié)構(gòu)化信息的基石。2001年,Tim Berners-Lee在《科學(xué)美國人》(Scientific American)上發(fā)表了論文Semantic Web。萬維網(wǎng)向語義網(wǎng)發(fā)展由此拉開序幕。2002年,W3C發(fā)布RDF(Resource Description Frame)草案和OWL(Web Ontology Language)草案。這些標準都已經(jīng)成為語義網(wǎng)核心的資源描述和組織標準。

1995年,在美國國家超級計算機應(yīng)用中心(the National Center for Supercomputing Applications,NCSA)和聯(lián)機計算機圖書館中心(Online Computer Library Center,OCLC)聯(lián)合舉辦的研討會上,與會專家討論并提出了“Dublin Core元數(shù)據(jù)”。Dublin Core元數(shù)據(jù)是一組基于Web資源的核心語義集,用于對Web資源進行描述和分類,以方便檢索。

當Web社區(qū)網(wǎng)絡(luò)資源的組織技術(shù)和方法演進時,圖書館社區(qū)也面臨數(shù)字資源數(shù)量的快速增長,以及新的文獻類型快速出現(xiàn)的挑戰(zhàn)。傳統(tǒng)的編目標準已經(jīng)無法應(yīng)付這種挑戰(zhàn)。在這個形勢下,1990年IFLA召開了書目記錄研討會,會議的成果是成立一個研究小組,對書目記錄的功能及需求進行全面研究。該小組的研究報告FRBR于1998年發(fā)布[14]。FRBR徹底改變了人們對編目的傳統(tǒng)認識。它構(gòu)建了高層實體關(guān)系模型,使人們對圖書館編目涉及的實體和實體之間的邏輯關(guān)系有了清晰的認識。FRBR成為國際編目領(lǐng)域的里程碑文獻,指導(dǎo)新一代的編目標準的開發(fā)。

按照FRBR的成果,IFLA編目委員會和JSC開始研制全新的資源描述標準。2010年,RDA發(fā)布,2011年ISBD統(tǒng)一版發(fā)布。

RDA完全采用了FRBR的實體關(guān)系模型構(gòu)建資源描述標準。RDA包括10個部分,第1~4部分是FRBR和IFLA后來發(fā)布的FRAD(Functional Requirements for Authority Data)模型中的作品、內(nèi)容表達、個人、團體等實體的描述。第5~10部分是這些實體之間的關(guān)系描述??梢钥闯?,今后的資源描述中,關(guān)系描述已經(jīng)成為資源描述的主要內(nèi)容,與語義網(wǎng)時代的關(guān)聯(lián)數(shù)據(jù)達成高度一致。

ISBD統(tǒng)一版稍微保守一點,因為IFLA作為一個國際標準需要考慮到不同國家的不同發(fā)展水平。ISBD統(tǒng)一版將已經(jīng)發(fā)布的ISBDs 8個分冊的著錄規(guī)則統(tǒng)一到一個版本中,建立了統(tǒng)一的資源描述標準,今后各種類型的資源描述在一個標準的指導(dǎo)下進行。這也可以說是一個非常大的成果。

2 我國文獻著錄國家標準的歷史和現(xiàn)狀

我國文獻著錄標準的制定是在全國信息與文獻標準化技術(shù)委員會(以下簡稱“文標會”)的領(lǐng)導(dǎo)下,具體由識別與描述分技術(shù)委員會負責。

中國文獻著錄國家標準是在修改采納ISBDs系列標準的基礎(chǔ)上研制的。1983年,我國第一部文獻著錄標準《文獻著錄總則》發(fā)布。到1987年,我國共研制了《文獻著錄總則》(1983年)、《普通圖書著錄規(guī)則》(1985年)、《連續(xù)出版物著錄規(guī)則》(1985年)、《非書資料著錄規(guī)則》(1985年)、《古籍著錄規(guī)則》(1987年)、《地圖資料著錄規(guī)則》(1986年)6個文獻著錄國家標準。

在文獻著錄系列標準發(fā)布10年后,文標會識別與描述分技術(shù)委員會在2007年召開分技術(shù)委員會會議,就我國文獻著錄規(guī)則發(fā)展方向的問題進行討論。委員們看到國際標準正在發(fā)生的變化,但由于ISBD統(tǒng)一版和RDA還在研制中,而我國的文獻著錄標準已經(jīng)到了需要重新修訂的時候。會議決定,密切跟蹤國際標準的進展,我國仍然按分冊對系列文獻著錄規(guī)則進行修訂。這次修訂或新制定了如下8個標準即《文獻著錄 第1部分:總則》(GB/T 3792.1—2009)、《普通圖書著錄規(guī)則》(GB/T 3792.2—2006)、《文獻著錄 第3部分:連續(xù)性資源》(GB/T 3792.3—2009)、《文獻著錄 第4部分:非書資料》(GB/T 3792.4—2009)、《測繪制圖資料著錄規(guī)則》(GB/T 3792.6—2005)、《古籍著錄規(guī)則》(GB/T 3792.7—2008)、《文獻著錄 第9部分:電子資源》(GB/T 3792.9—2009)、《信息資源的內(nèi)容形式和媒體類型標識》(GB/T 3469—2013)。

2012年,文標會組織召開我國文獻著錄規(guī)則發(fā)展的第2次討論,全國主要圖書館的編目專家參加了研討會。會議決定啟動我國統(tǒng)一的文獻著錄規(guī)則的研制,并將新的標準定名為《資源描述》。

2013年,《資源描述》項目獲得國家標準化委員會批準并正式啟動。因為《資源描述》將各種類型資源描述規(guī)則集中在一個標準中,文標會組建了有史以來最強大的標準研制組,考慮到各種類型圖書館的需要,研制組成員來自不同類型、不同地區(qū)的圖書館,同時也吸收特殊資源類型的專家,如古籍專家參與到標準研制中。

《資源描述》國家標準2016年完成報批稿并提交到國家標準化委員會,2021年正式發(fā)布。《資源描述》標準是在對上述8個分冊標準進行合并和修改的基礎(chǔ)上制定的,因此《資源描述》標準替代了上述8個標準。《資源描述》標準依據(jù)ISBD統(tǒng)一版,并參考RDA的載體描述部分,將上述8個著錄規(guī)則合并成一個統(tǒng)一的標準,并在原來的資源類型基礎(chǔ)上,增加了學(xué)位論文、拓片、手稿、樂譜等資源?!顿Y源描述》標準是一個面向各種類型資源的通用資源描述標準[15]。

3 資源描述領(lǐng)域的國際最新進展

3.1 書目模型的研究

書目模型是書目數(shù)據(jù)涉及的實體及其關(guān)系的高層語義模型。書目模型提供人們對書目數(shù)據(jù)邏輯結(jié)構(gòu)的認識,基于書目模型制定資源描述標準,使得書目數(shù)據(jù)具有語義表達能力,促進用戶的資源發(fā)現(xiàn)。書目模型也促進圖書館書目數(shù)據(jù)與其他領(lǐng)域信息的互操作,促進書目數(shù)據(jù)成為語義網(wǎng)信息的有機組成部分。

3.1.1 FRBRoo模型

FR家族包括3個模型:FRBR(1998年)、FRAD(2009年,F(xiàn)unctional Requirements for Authority Data)、FRSAD(2011年,F(xiàn)unctional Requirements for Subject Authority Data),這3個模型用實體關(guān)系分析法,分別構(gòu)建了書目數(shù)據(jù)模型、規(guī)范數(shù)據(jù)模型和主題數(shù)據(jù)模型。

CIDOC CRM(Comité International de Documentation [International Committee on Documentation] Conceptual Reference Model)是博物館領(lǐng)域信息的概念參考模型。它由國際博物館委員會(International Council of Museums,ICOM)的國際文獻委員會(CIDOC)研制,2006年CIDOC CRM被采納為國際標準。

2003年,IFLA編目委員會的FRBR評估組與CIDOC CRM SIG(CIDOC CRM Special Interest Group)合作,開始構(gòu)建一個面向?qū)ο蟮?、與CIDOC CRM兼容的FRBR擴展模型FRBRoo(Object-Oriented Formulation of FRBR)。FRBRoo 2.4版于2016年成為IFLA正式標準。

FRBRoo借用了CIDOC CRM模型的結(jié)構(gòu),包括CIDOC CRM的建模方法、屬性和類,與FR家族模型的類和屬性通過對齊、匹配等方法進行融合。

由于篇幅所限,無法把FRBRoo與FR家族所有的改變一一列舉。本文僅以FRBR的兼容性改變?yōu)槔?,以窺一斑。

FRBRoo與FRBR的最大不同是引入了時間實體(temporal entities)。時間實體在CIDOC CRM模型中發(fā)揮中央核心作用。FRBRoo時間實體的兩個類是F27 Work Conception和F28 Expression Creation。時間類在FRBRoo中被定義為CIDOC CRM的時間類:E65 Creation、E12 Production、E7 Activity和E13 Attribute Assignment的子類。

圖1中,F(xiàn)27 Work Conception和F28 Expression Creation是FRBRoo中的兩個時間類,F(xiàn)1 Work、F2 Expression和F4 Manifestation Singleton是來自FRBR模型的類,E39 Actor、E52 Time-Span和E53 Place是來自CIDOC CRM的類。FRBRoo模型用F27 Work Conception和F28 Expression Creation兩個時間類,將E39 Actor、E52 Time-Span和E53 Place與F1 Work、F2 Expression和F4 Manifestation Singleton關(guān)聯(lián)起來[16]。

圖1 作品和時間概念模型

3.1.2 IFLA LRM模型

由于FR家族的3個模型(FRBR、FRAD和FRSAD)分別由不同的小組研制。雖然這3個模型都是在實體-關(guān)系建模框架下創(chuàng)建的,但不可避免地,它們對共同問題采用了不同的視角和不同的解決方案。這3個模型都是書目系統(tǒng)中必須采納的模型,因此有必要將FR家族的3個模型合并為一個統(tǒng)一的模型,以達到共同的理解[17]。LRM(Library Reference Model)由FRBR評估組負責研制,初版發(fā)布于2017年。

LRM模型不是簡單地將FR家族3個模型的合并。研制組從最初的用戶任務(wù)出發(fā),審視書目數(shù)據(jù)中的實體、關(guān)系和屬性。LRM仍然采用實體關(guān)系法,構(gòu)建了一個一般化的高層書目信息邏輯結(jié)構(gòu)。

LRM提供了擴展機制,允許在實際應(yīng)用時對實體、關(guān)系和屬性進行擴展,也允許LRM與其他領(lǐng)域本體進行對齊映射。

由于篇幅關(guān)系,F(xiàn)RBR、FRAD、FRSAD的概念模型請分別參見IFLA發(fā)布的3個報告:Functional Requirements for Bibliographic Records,F(xiàn)unctional Requirements for Authority Data,F(xiàn)unctional Requirements for Subject Authority Data。

LRM將FRBR、FRAD和FRSAD的模型整合后的高層模型如圖2所示[18]。

圖2 IFLA LRM高層概念模型

從FR家族模型與LRM模型對比可以看出,LRM模型引入了3個實體“Res”“Agent”和“Time-span”,“Res”是頂級實體,也稱為頂級類。LRM繼承了FRBR模型的10個實體(Work、Expression、Manifestation、Item、Person、Corporate Body、Concept、Object、Event、Place)中的7個,沒有繼承FRBR中的“Concept””Event”和“Object”,其中FRBR中的“Corporate Body”改稱為“Collecitve Agent”。LRM繼承了FRSAD的“Nomen”,并將“Nomen”應(yīng)用擴大到可以指稱所有實體的名稱。LRM模型用“isA”關(guān)系構(gòu)建這些實體的等級關(guān)系如表1所示。

表1 IFLA LRM模型實體等級關(guān)系

LRM模型沒有保留FRBR和FRSAD中的關(guān)于主題的實體“Concept”和“Thema”。雖然主題屬于知識組織領(lǐng)域,但在書目模型中保留“Concept”或“Thema”實體,便于書目實體與知識組織概念模型關(guān)聯(lián)是非常重要的。

3.1.3 LRMoo模型

繼FRBRoo模型和LRM模型之后,IFLA啟動了LRMoo模型研究。LRMoo模型旨在構(gòu)建與博物館領(lǐng)域信息模型CIDOC CRM相兼容的書目信息模型,以促進兩個領(lǐng)域的互操作。LRMoo模型目前正在研制中,筆者認為LRMoo模型將取代FRBRoo模型。

3.1.4 BIBFRAME模型

BIBFRMAE模型是美國國會圖書館書目框架計劃的基礎(chǔ)成果。BIBFRAME是一個基于Web和關(guān)聯(lián)數(shù)據(jù)技術(shù)的網(wǎng)絡(luò)世界的書目信息本體模型。BIBFRAME2.0于2016年發(fā)布[19],BIBFRAME高層概念模型見圖3。

圖3 BIBFRAME 2.0高層概念框架

BIBFRAME2.0的核心類是“Work”“Instance”“Item”。

BIBFRAME2.0的“Work”合并了FRBR組1的“Work”和“Expression”。這是一個非常絕美的合并。在FRBR組1實體中,“Work”和“Expression”都是抽象實體,在書目實踐中,編目員很難區(qū)分“Work”和“Expression”,把這兩個抽象實體合并為一個,并沒有給用戶使用帶來太大不便,但它大大簡化了從描述、組織到服務(wù)的整個書目信息流。

BIBFRAME2.0中的“Instance”與FRBR的“Manifestation”實體的含義相同,但實體名稱稍作改變,使用者更容易理解。

BIBFRAME中一部作品可能“關(guān)于”一個或多個概念。這樣一個概念被稱為作品的一個“subject”??赡艿摹皊ubject”包括FRBR中的實體Object、Place、Event、Topics、Agent、Work、Expression、Manifestation、Item,還增加了Temporal Expressions。

這些改動,使得BIBFRAME2.0成為一個結(jié)構(gòu)清晰、容易理解的概念模型,最重要的是BIBFRAME的簡潔結(jié)構(gòu),使得在書目數(shù)據(jù)中的應(yīng)用變得更加簡單,易于實施,對于促進書目數(shù)據(jù)結(jié)構(gòu)化、關(guān)聯(lián)化的轉(zhuǎn)變是非常重要的。

3.2 資源描述標準和書目模型的關(guān)聯(lián)數(shù)據(jù)表示

3.2.1 關(guān)聯(lián)數(shù)據(jù)表示的意義和方法

對資源描述標準和模型中的實體、關(guān)系、屬性、元素以及屬性值等術(shù)語按照W3C RDF標準進行表示,使其能夠作為開放關(guān)聯(lián)數(shù)據(jù)(Linked Open Data,LOD)使用,使得圖書館社區(qū)定義的術(shù)語成為被更廣泛的語義網(wǎng)社區(qū)接受、能被機器理解的語義數(shù)據(jù),并增強語義Web書目工具和服務(wù)的開發(fā)?;谫Y源描述標準進行編目的圖書館,也能夠以LOD形式發(fā)布它們的書目數(shù)據(jù)。書目關(guān)聯(lián)數(shù)據(jù)發(fā)布能夠促進書目數(shù)據(jù)的互操作,促進語義Web中書目數(shù)據(jù)的重用和檢索。

資源描述標準和模型中的實體在RDF中表示為類(Class),關(guān)系、屬性和元素在RDF中表示為屬性(Property)。所有經(jīng)RDF表示的類和屬性術(shù)語的集合稱為術(shù)語表(Vocabulary)。

每個術(shù)語的定義包括命名空間的定義、給每個術(shù)語賦予一個統(tǒng)一資源標識符URI和一個標簽(Label)、術(shù)語的自然語言的定義、類的上下等級結(jié)構(gòu)、屬性的定義域和值域等。RDF定義的結(jié)果一般按如下4種方法表示:①表格式;②N-Triples表示;③RDF/XML;④JSON-LD(JSON的關(guān)聯(lián)數(shù)據(jù)表示)。其中第1種表格形式供人閱讀,后面3種表示方法都是用于發(fā)布和機器閱讀。

3.2.2 國際資源描述標準和模型的RDF表示

目前IFLA和RSC都對其資源描述標準和書目模型進行了RDF關(guān)聯(lián)數(shù)據(jù)表示。

3.2.2.1 ISBD和書目模型的術(shù)語表

IFLA對其制定的ISBD統(tǒng)一版和模型進行了RDF關(guān)聯(lián)數(shù)據(jù)定義,已經(jīng)定義的術(shù)語表如下。

(1)書目模型的術(shù)語表:①The FR家族術(shù)語表,包括FRBR模型術(shù)語表、FRAD模型術(shù)語表、FRSAD模型術(shù)語表;②FRBRoo術(shù)語表;③LRM模型術(shù)語表。

(2)ISBD統(tǒng)一版術(shù)語表:ISBD element(ISBD元素術(shù)語表)、ISBD Value Vocabularies(ISBD值術(shù)語表)。ISBD值術(shù)語表又包括ISBD Content Form(ISBD內(nèi)容形式值術(shù)語表)、ISBD Content Form Qualified Base(ISBD內(nèi)容形式限制詞術(shù)語表)和ISBD Media Type(ISBD媒介類型術(shù)語表)。

2016年,ISBD關(guān)聯(lián)數(shù)據(jù)研究組發(fā)布了《ISBD作為關(guān)聯(lián)數(shù)據(jù)應(yīng)用指南》(Guidelines for Use of ISBD as Linked Data,以下簡稱《指南》)?!吨改稀凡皇窃丶?,《指南》主要針對書目數(shù)據(jù)的應(yīng)用開發(fā)者,指導(dǎo)應(yīng)用開發(fā)人員如何使用ISBD的命名空間,如何應(yīng)用RDF定義的元素、元素映射和對齊,將ISBD數(shù)據(jù)暴露在關(guān)聯(lián)數(shù)據(jù)環(huán)境下?!吨改稀窞闀繑?shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù)提供了規(guī)范性的指導(dǎo)[20]。

3.2.2.2 RDA和BIBFRAME模型的術(shù)語表

RDA元素的關(guān)聯(lián)數(shù)據(jù)表示發(fā)布在一個專門的網(wǎng)站RDA Registry[21]。RDA Registry定義了基于RDF和語義Web標準的RDA元素和元素值。

RDA元素定義包括Classes(類)、RDA Entity properties(RDA實體屬性)、Work properties(作品屬性)、Expression properties(內(nèi)容表達屬性)、Manifestation properties(載體表現(xiàn)屬性)、Item properties(單件屬性)、Agent properties(代理屬性)、Nomen properties(名稱屬性)、Place properties(地點屬性)、Time-span properties(時間屬性)、Unconstrained properties(非必備屬性,表示該屬性來自RDA,但不是IFLA LRM模型的屬性、LRM語義不是必備的屬性)共11個術(shù)語表的RDF表示。

RDA屬性值的RDF定義包括RDA Aspect Ratio Designation(RDA長寬比率)、RDA Bibliographic Format(RDA書目格式)、RDA Carrier Extent Unit(RDA資源數(shù)量和單位)等共46個值術(shù)語表的RDF表示。

BIBFRAME項目對BIBFRAME模型術(shù)語表(BIBFRAME vocabulary)[22]進行定義。定義的術(shù)語包括類、類的屬性。定義的術(shù)語用圖表格式和RDF文檔兩種方式表示。

3.3 術(shù)語表的互操作

當前國際資源描述標準兩大體系是IFLA制定的ISBD統(tǒng)一版和RSC制定的RDA。兩個體系都各自有書目模型,也都定義了RDF關(guān)聯(lián)數(shù)據(jù)的術(shù)語表。兩個體系的互操作尤其重要,可以提供用不同標準制作的書目數(shù)據(jù)之間的重用、轉(zhuǎn)換、整合檢索以及其他語義互操作。同時,圖書館社區(qū)的書目數(shù)據(jù)與相關(guān)信息,如出版信息互操作,能夠促進圖書館社區(qū)與其他語義Web社區(qū)的關(guān)聯(lián)、集成和其他語義互操作。

術(shù)語互操作是書目數(shù)據(jù)互操作的基礎(chǔ)。術(shù)語互操作一般通過兩個術(shù)語表的映射、鏈接、對齊來實現(xiàn)。IFLA、RSC、LC等機構(gòu)合作,發(fā)布了各標準之間的類和屬性術(shù)語表、值術(shù)語表的對齊、映射表。由于各種標準術(shù)語之間的映射表數(shù)量非常多,本文列舉如下。

①Alignment of ISBD element set with FRBR element set(ISBD元素集與FRBR元素集的對齊,最后報告2016年完成)[23]。②Alignment of the ISBD element set with RDA element set(ISBD元素集與RDA元素集的對齊,3.1版完成于2015年)[24]。③Map from ISBD properties to unconstrained RDA properties(ISBD屬性與RDA非必備屬性的映射)[25]。④Map from unconstrained RDA properties to unconstrained ISBD properties(從RDA非必備屬性到ISBD非必備屬性的映射)[26]。⑤Mapping from ISBD to IFLA LRM(從ISBD到IFLA LRM模型的映射)[27]。

3.4 BIBFRAME書目數(shù)據(jù)轉(zhuǎn)換項目

在RDA發(fā)布的2010年,美國國會圖書館發(fā)起了BIBFRAME項目。BIBFRAME項目的目的是建設(shè)面向基于未來關(guān)聯(lián)數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境下的書目數(shù)據(jù)的描述框架,是圖書館使用了半個多世紀的MARC數(shù)據(jù)的替代格式。BIBFRAME重點放在書目數(shù)據(jù)與更廣泛的信息社區(qū)進行整合并參與到其中的未來趨勢,同時也兼顧圖書館社區(qū)書目數(shù)據(jù)交換以節(jié)約編目成本的需要。BIBFRAME項目需要為MARC書目數(shù)據(jù)轉(zhuǎn)換到BIBFRAME數(shù)據(jù)設(shè)計轉(zhuǎn)換路徑、轉(zhuǎn)換規(guī)則、轉(zhuǎn)換工具,并進行實施試驗。BIBFRAME項目已經(jīng)完成BIBFRAME模型和BIBFRAME術(shù)語表的關(guān)聯(lián)數(shù)據(jù)定義。

美國國會圖書館目前正在進行BIBFRAME2.0應(yīng)用的試驗。為進行試點應(yīng)用,BIBFRAME項目制定了《MARC書目數(shù)據(jù)轉(zhuǎn)換規(guī)范》(MARC Bibliographic Conversion Specifications)、《MARC名稱規(guī)范數(shù)據(jù)轉(zhuǎn)換規(guī)范》(MARC Title Authority Conversion Specifications)。這兩個轉(zhuǎn)換規(guī)范是將MARC數(shù)據(jù)轉(zhuǎn)換為BIBFRAME數(shù)據(jù)的基礎(chǔ)規(guī)則。

基于轉(zhuǎn)換規(guī)則,項目開發(fā)了XSLT轉(zhuǎn)換程序?qū)嵤腗ARC的XML表示向BIBFRAME轉(zhuǎn)換和從BIBFRAME向MARC的XML轉(zhuǎn)換。

項目又開發(fā)了查看器(viewer),查看器以雙屏顯示的方式,供人對MARC格式和BIBFRAME格式的數(shù)據(jù)進行對比,以檢驗轉(zhuǎn)換結(jié)果。

美國和歐洲的許多圖書館參與了BIBFRAME項目和BIBFRAME的應(yīng)用試點?;谠诿绹鴩鴷D書館的試點應(yīng)用,BIBFRAME項目全方位地測試和研究MARC數(shù)據(jù)向BIBFRAME轉(zhuǎn)換中面臨的問題,并對BIBFRAME模型和術(shù)語定義進行不斷地改進,以使其更符合實際需要。試點應(yīng)用也測試了用BIBFRAME進行編目的效率等相關(guān)問題。

2021年,美國國會圖書館更是將BIBFRAME應(yīng)用試驗擴大到國會圖書館的所有編目員。這意味著要擴大BIBFRAME和MARC的轉(zhuǎn)換測試,同時在實用環(huán)境中測試基于這兩種格式的圖書館系統(tǒng)的能力[28]。

4 對我國資源描述工作的思考

國際資源描述標準和資源描述工作正在發(fā)生巨變,我國的資源描述工作正站在從傳統(tǒng)編目向基于語義網(wǎng)開放的資源描述轉(zhuǎn)變的關(guān)鍵點。我們面臨的挑戰(zhàn)主要包括四方面:一是人才隊伍建設(shè),二是標準規(guī)范研制,三是MARC數(shù)據(jù)向關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)換,四是業(yè)務(wù)模式轉(zhuǎn)變。每個方面的挑戰(zhàn)都是極其巨大的。

4.1 人才隊伍建設(shè)

應(yīng)對資源描述領(lǐng)域的變革與發(fā)展,促進我國資源描述快步跟上國際發(fā)展的步伐,人才隊伍建設(shè)是重中之重。

在人才隊伍建設(shè)中,領(lǐng)域領(lǐng)軍人才的發(fā)現(xiàn)和培養(yǎng)又是最關(guān)鍵的。能夠推動這個行業(yè)發(fā)展的領(lǐng)軍人才應(yīng)該是復(fù)合型人才,具有豐富的資源描述經(jīng)驗,了解并掌握現(xiàn)代語義網(wǎng)信息和知識組織技術(shù),有研究能力,跟蹤國際發(fā)展趨勢,推動我國新的標準體系的研究和開發(fā),并能夠為推動各自圖書館業(yè)務(wù)模式轉(zhuǎn)型和工作流的重組提出建議、規(guī)劃。

面對新的標準、新的數(shù)據(jù)要求、新的業(yè)務(wù)模式,各單位需要培養(yǎng)一支核心的資源描述業(yè)務(wù)骨干隊伍。他們能理解語義網(wǎng)環(huán)境下書目數(shù)據(jù)的新要求,能夠組織實施各圖書館業(yè)務(wù)轉(zhuǎn)型,按照新的資源描述需要,促進書目數(shù)據(jù)在語義網(wǎng)環(huán)境下的開放服務(wù)。

4.2 標準規(guī)范研制

我國的文獻著錄規(guī)則一直是以ISBDs系列標準為依據(jù),結(jié)合我國文獻資源的特點制定的。雖然國際上一直有ISBDs和AACR2兩大系列標準。但AACR2也是參考ISBDs研制的,在處理傳統(tǒng)圖書館文獻描述方面,兩者并沒有本質(zhì)的差別。

然而,當前國際資源描述標準出現(xiàn)了復(fù)雜的局面。ISBDs系列標準合并為一個統(tǒng)一版的ISBD,是FRBR模型中的載體表現(xiàn)層的描述規(guī)則。而RDA包括FRBR和FRAD模型中的作品、內(nèi)容表達、載體表現(xiàn)、單件、個人和團體的描述規(guī)則和這些實體之間的關(guān)系描述規(guī)則。

兩個標準已經(jīng)有相當大的不同。IFLA研制的標準被認為是等同的國際標準,允許和鼓勵各國采納。RDA不是國際標準,也不是美國國家標準,按商業(yè)機制運作,已經(jīng)有非常多的國家采用,已經(jīng)成為事實上的國際標準。我國一些圖書館的西文文獻描述已經(jīng)采納RDA標準。未來IFLA標準會如何發(fā)展,我國的標準該如何選擇方向,這是我們面臨的艱難選擇。

在國家標準開發(fā)方面,我們還面臨一個標準開發(fā)機制的問題。標準的競爭已經(jīng)成為技術(shù)的競爭,在大數(shù)據(jù)環(huán)境下,是數(shù)據(jù)優(yōu)勢的競爭。我們看到W3C和RSC開發(fā)的標準,它們已經(jīng)不再申請成為ISO標準,甚至也不爭取成為美國國家標準。它們研制的標準立刻在網(wǎng)上發(fā)布。由于標準的先進性和快速滿足需求,這些標準的更新相當快。另外,目前國際標準的更新周期已經(jīng)是無極更新。RDA標準直接發(fā)布為網(wǎng)絡(luò)工具,2~4個月就有更新發(fā)布。W3C的標準也是根據(jù)需要隨時發(fā)布新的版本。在標準開發(fā)機制方面,RDA建立了用發(fā)行收入支持標準研發(fā)的良性循環(huán)機制。

而我國的標準研制周期非常長,從申報項目,到批準,然后是研制,最后標準審批、出版,這個周期需要幾年。標準發(fā)布后,按國標委規(guī)定,5年后才可以申請更新。另外,每個標準研制項目的經(jīng)費非常少,在一定程度上也影響了標準研制人員的積極性。

面對這些復(fù)雜的環(huán)境和嚴峻的挑戰(zhàn),需要在標準的研制機制上作出創(chuàng)新和變革。

(1)先研究,再制定標準。要建立圖書館間的合作研究機制,國家圖書館的地位和實力,當之無愧是標準研究和制定方面的“領(lǐng)頭羊”。而文標會不僅應(yīng)該支持標準的研制,更應(yīng)該支持標準的前期研究。在國家圖書館、文標會的帶領(lǐng)下,聯(lián)合CALIS等多館力量,開展研究、進行數(shù)據(jù)實驗,測試各種標準對中文資源的適應(yīng)性。標準規(guī)范的研制是在合作研究的基礎(chǔ)上自然產(chǎn)生的成果。

(2)先制定標準、推廣應(yīng)用,再申請成為國家或行業(yè)標準。國家圖書館、CALIS、文標會在中國圖書館領(lǐng)域享有非常高的權(quán)威和認可度。如國家圖書館制定的《中國文獻編目規(guī)則》[29]雖然不是國家標準,但被大多數(shù)圖書館作為編目標準采用。所以,今后在我國資源描述標準的制定上,可以在文標會、國家圖書館或CALIS的牽頭下,聯(lián)合國內(nèi)主要圖書館先制定標準,推廣應(yīng)用,再申請成為國家標準。轉(zhuǎn)變先申請成為國家標準再應(yīng)用的模式。

(3)建立類似RSC這樣的聯(lián)合修訂委員會,負責我國資源描述相關(guān)標準的制定,并建立標準的出版發(fā)行收入支持標準研發(fā)的機制,促進標準開發(fā)與應(yīng)用的良性循環(huán)和持續(xù)維護更新。

4.3 MARC書目數(shù)據(jù)向關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)換

經(jīng)歷半個多世紀,圖書館積累了大量的MARC數(shù)據(jù),如國家圖書館聯(lián)合編目中心數(shù)據(jù)庫的書目數(shù)據(jù)超過2 000萬條,CALIS聯(lián)合目錄數(shù)據(jù)庫記錄超過800萬條。將MARC數(shù)據(jù)轉(zhuǎn)換為基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的新的書目格式,面臨的任務(wù)和困難比美國國會圖書館BIBFRAME項目的更重、更大。因為中國的機讀目錄格式采用了兩種格式。西文文獻采用MARC21格式,中文文獻采用CNMARC格式,兩種格式并用,轉(zhuǎn)換映射的難度和系統(tǒng)開發(fā)的難度都成倍增加。MARC數(shù)據(jù)的不規(guī)范、字段缺失,將是轉(zhuǎn)換中會遇到的非常大的困難。

我國西文文獻的MARC數(shù)據(jù)轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù)格式,可以借用美國國會圖書館BIBFRAME的研究成果和今后BIBFRAME實施轉(zhuǎn)換后的數(shù)據(jù)共享。但中文文獻的CNMARC格式數(shù)據(jù)轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù),沒有可借鑒的經(jīng)驗和工具。因此,需要國內(nèi)圖書館的合作,需要一些編目實力強的圖書館(如國家圖書館、CALIS聯(lián)合編目中心等)牽頭。在國家圖書館等的牽頭下,聯(lián)合多個圖書館實施這個世紀性轉(zhuǎn)換任務(wù),也會避免各館各自轉(zhuǎn)換造成的人員、財力和時間的浪費,避免低水平的重復(fù)工作。

4.4 業(yè)務(wù)工作流和服務(wù)模式轉(zhuǎn)變

未來的資源描述不僅僅是簡單的描述標準的變化,新的資源描述標準是為了開創(chuàng)新的服務(wù)。由標準應(yīng)用引發(fā)的業(yè)務(wù)工作流和服務(wù)模式變化將是巨大的。雖然這個變化才剛剛開始,國際上還沒有一家圖書館已經(jīng)完成這一轉(zhuǎn)變,但我們根據(jù)已經(jīng)大量涌現(xiàn)的語義Web的新型服務(wù)以及在圖書館社區(qū)的許多研究和探索項目,我們可以對未來的業(yè)務(wù)工作流和服務(wù)模式做些不太離譜的推斷和設(shè)想。

4.4.1 資源描述方面

目前即使在一個圖書館內(nèi),各種資源的描述都有各自的規(guī)則,數(shù)據(jù)存儲在各自的數(shù)據(jù)庫中,都有自己的服務(wù)系統(tǒng),在圖書館主頁上鏈接各個服務(wù)。有些圖書館開發(fā)了整合檢索,但是效果一直不是很好。未來圖書館內(nèi)的一個個“信息孤島”將被打破,基于全資源譜系的高層書目模型、基于全資源譜系的統(tǒng)一描述規(guī)則和一致的機器表示語言,將各種資源的描述和組織統(tǒng)一起來,圖書館內(nèi)部的業(yè)務(wù)工作流、各部門之間的合作模式都相應(yīng)會有調(diào)整。

未來的資源描述重點是在知識組織,而不是簡單的屬性描述。知識組織包括關(guān)聯(lián)、主題深度揭示、分析描述、多層次描述等。未來的描述也需要站在語義網(wǎng)大數(shù)據(jù)環(huán)境下,考慮與外部語義信息資源的關(guān)聯(lián)。

未來的描述將更多依靠語義工具,簡單重復(fù)的工作交給AI完成,人的智力用在機器無法完成的,需要人的經(jīng)驗、判斷的任務(wù)上。

4.4.2 服務(wù)方面

圖書館的整合服務(wù)將實現(xiàn),而且這個整合服務(wù)是基于語義大數(shù)據(jù)的服務(wù),也許圖書館會出現(xiàn)像Google知識圖譜或比它更先進的語義服務(wù)。

圖書館的數(shù)據(jù)將以開放關(guān)聯(lián)數(shù)據(jù)的形式發(fā)布到互聯(lián)網(wǎng),也許會發(fā)布到Wikidata、Wikipedia,或獨立的圖書館語義數(shù)據(jù)庫中,供網(wǎng)絡(luò)語義搜索引擎和語義工具使用圖書館的數(shù)據(jù),這些工具幫助用戶發(fā)現(xiàn)資源后,又會將用戶引導(dǎo)到圖書館來使用圖書館的服務(wù)。

猜你喜歡
著錄規(guī)則編目書目
著錄格式執(zhí)行GB/T7714-2015《參考文獻著錄規(guī)則》
著錄格式執(zhí)行GB/T7714-2015《參考文獻著錄規(guī)則》
推薦書目《初春之城》
都市人(2022年3期)2022-04-27 00:44:57
國家圖書館藏四種古籍編目志疑
天一閣文叢(2020年0期)2020-11-05 08:28:36
參考文獻著錄規(guī)則
粵劇編目整理之回顧與展望
戲曲研究(2017年3期)2018-01-23 02:51:01
新舊版參考文獻著錄規(guī)則比較分析
出版與印刷(2016年4期)2016-12-20 07:48:12
圖書館編目業(yè)務(wù)外包發(fā)展探討
河南科技(2014年22期)2014-02-27 14:18:37
本刊郵購書目
圖書在版編目(CIP)數(shù)據(jù)
全國新書目(2009年8期)2009-05-22 11:31:16
泾源县| 巨野县| 翁源县| 贞丰县| 永定县| 清水河县| 当雄县| 长葛市| 安平县| 茶陵县| 磐安县| 兴仁县| 广德县| 潮州市| 华亭县| 隆尧县| 北宁市| 漯河市| 邹平县| 东阿县| 富顺县| 德格县| 贵阳市| 元谋县| 赤水市| 秭归县| 金华市| 古交市| 开江县| 安达市| 镇雄县| 弋阳县| 扎鲁特旗| 剑阁县| 新平| 嘉兴市| 营山县| 屯昌县| 夏河县| 科技| 聂荣县|