歐陽寧 趙莉 朱華
摘 要 以文檔為中心的MARC,或簡單地將MARC字段映射為XML已經(jīng)無法滿足網(wǎng)絡時代書目數(shù)據(jù)功能需求。SchemaBibEx為網(wǎng)絡書目資源描述規(guī)范,和書目框架格式BIBFRAME的互補為圖書館書目數(shù)據(jù)資源Web化提供了切入點,兩者的聯(lián)合是網(wǎng)絡數(shù)據(jù)時代書目數(shù)據(jù)模型研究的方向。論文通過對映射表的設(shè)計、核心模型的對比及書目數(shù)據(jù)描述的分析,對SchemaBibEx模型進行研究,并通過與BIBFRAME的對比,討論兩者的聯(lián)合。
關(guān)鍵詞 SchemaBibEx BIBFRAME FRBR 書目數(shù)據(jù)
分類號 G254.1
DOI 10.16810/j.cnki.1672-514X.2020.09.008
Research on SchemaBibEx Model and the Comparative Study With BIBFRAME
Ouyang Ning, Zhao Li, Zhu Hua
Abstract Document design of MARC or the simple mapping of Marc to XML have been unable to meet the functional requirements of bibliographic data in the Internet era. The complementarity of SchemaBibEx and BIBFRAME provides a starting point for library bibliographic data to enter the web. The combination of the two is the direction of bibliographic data model in the network data era. In this paper, the SchemaBibEx model is studied through the design of the mapping table, the comparison of the core model, and the analysis of the bibliographic data description, and the association of the two is discussed through the comparison with BIBFRAME.
Keywords SchemaBibEx. BIBFRAME. FRBR. Bibliographic data.
0 引言
MARC具有五十多年的歷史,在書目記錄及數(shù)據(jù)存儲方面的貢獻是不可估量的。進入二十一世紀以來,隨著網(wǎng)絡環(huán)境的變化,信息對象越來越細小,從記錄逐步發(fā)展為數(shù)據(jù)。圖書情報界的相關(guān)學者一直在探索改進或試圖設(shè)計一種能滿足網(wǎng)絡時代書目數(shù)據(jù)功能需求的書目格式來取代MARC[1],主要研究聚焦三個方面:一是內(nèi)容描述規(guī)則方面,如IFLA(International Federation of Library Associations and Institutions)提出的書目記錄功能需求模型(Functional Requirements for Bibliographic Records,簡稱 FRBR);二是書目的模型及結(jié)構(gòu)方面,如美國國會圖書館(Library of Congress)
提出的以本體及關(guān)聯(lián)數(shù)據(jù)技術(shù)為基礎(chǔ)的書目框架(Bibliographic Framework,簡稱 BIBFRAME)[2]、大英圖書館(British Library)的BNB(British National Biblioraphy)[3]等;三是網(wǎng)絡資源描述規(guī)范,如OCLC(Online ComputerLibrary Center)擴展schema.org的BiblioGraph.net(BGN)及SchemaBibEx。
FRBR概念模型是一個實體關(guān)系模型,定義了書目實體、屬性及它們之間的關(guān)系[4],通常用于圖書館數(shù)據(jù)建模工作,本文對FRBR就不再贅述。關(guān)聯(lián)數(shù)據(jù)模型BIBFRAME是目前全球圖書情報界討論最多的,其使用鏈接數(shù)據(jù)技術(shù)和資源描述框架作為實現(xiàn)語言,開發(fā)的初衷是試圖作為圖書館成為大規(guī)模Web數(shù)據(jù)的切入點。BIBFRAME是MARC在向互聯(lián)網(wǎng)靠攏,是以關(guān)聯(lián)數(shù)據(jù)方式取代MARC,以便更好融入網(wǎng)絡,目前已完成了雙向映射和轉(zhuǎn)換。但是目前BIBFRAME過于“以圖書館為中心”,難以被網(wǎng)絡所利用。Schema.org作為一個結(jié)構(gòu)化數(shù)據(jù)規(guī)范領(lǐng)域的公共網(wǎng)絡,幾乎能夠描述所有類別的主題內(nèi)容資源。但Schema.org最初設(shè)計不是專門針對圖書館的書目資源,缺少適用于FRBR的第一組概念(WEMI)的定義[1]。作為Schema.org的具體領(lǐng)域應用,SchemaBibEx被設(shè)計為可用于圖書館在網(wǎng)絡上發(fā)布書目資源的語義數(shù)據(jù),希望可作為語義時代的書目數(shù)據(jù)格式使用。
SchemaBibEx和BIBFRAME的互補為圖書館書目數(shù)據(jù)資源Web化提供了可能,兩者的聯(lián)合是網(wǎng)絡數(shù)據(jù)時代書目數(shù)據(jù)模型研究的方向。OCLC早已開始尋求BIBFRAME和SchemaBibEx的合作關(guān)系,2013年發(fā)表了“BIBFRAME和Schema.org書目擴展模型的關(guān)系”工作論文[5]1。國內(nèi)的學者對于SchemaBibEx討論的較少,選擇中國知網(wǎng)期刊全文數(shù)據(jù)庫(CNKI)作為數(shù)據(jù)來源,以“主題”為檢索途徑,主題詞“SchemaBibEx”,截至2019年12月31日,檢索出的中文文獻只有1篇,即張雪松等2016年發(fā)表的《網(wǎng)絡書目資源描述規(guī)范 SchemaBibEx及其應用》一文[6]1-9。本文首先通過FRBR核心元素,設(shè)計SchemaBibEx與BIBFRAME詞匯的映射表,并進行比較;然后研究SchemaBibEx的核心模型,并與BIBFRAME核心模型對比討論;最后通過分析規(guī)范數(shù)據(jù),對如何使用SchemaBibEx標記BIBFRAME語句提出建議。
1 映射表設(shè)計
單一通用詞匯表難以覆蓋全部領(lǐng)域的多樣性和豐富細節(jié),Karen Coyle在博客里曾指出,從FRBR第一組實體(即WEMI的四層結(jié)構(gòu))角度出發(fā),F(xiàn)RBR、BIBFRAME和Schema.org之間的相互映射是非常困難的[7]2-3。作為 Schema.org的擴展版,SchemaBibEx的術(shù)語詞表是以Schema.org為基礎(chǔ)的。但與獨立開發(fā)的BIBFRAME詞表不同,Schema.org詞匯原本就不正式,而且OCLC以Scheme.org作為基本詞表,融入圖書館書目擴展,牽頭的W3C SchemaBibEx小組進展緩慢受阻,所以除部分詞匯擴展被采納外,大多數(shù)還處于草案狀態(tài)[8]。本文以FRBR核心元素為橋梁,建立BIBFRAME2.0和Schema.org詞表中對應的類與屬性之間的簡單映射,如表1所示。
從表1可以看出,BIBFRAME和Schema.org的詞匯有重疊、有互補。兩者的區(qū)別在于,Schema.org的屬性更隨意,并不嚴格遵守FRBR規(guī)則與層級,覆蓋范圍較廣但是較淺;BIBFRAME則代表了一組小得多的類和屬性,不是隨意地附加在單獨的命名空間中,覆蓋范圍較窄但是較深。例如:(1)題名字段在Schema.org中使用“name”,但在BIBFRAME中必須使用“title”。(2)ISBN在BIBFRAME中可以找到,被作為載體表現(xiàn)標識符處理;而在Schema.org中,因已鏈接到相關(guān)的載體,包含了ISBN,因此沒有特指的類。(3)BIBFRAME詞匯表設(shè)計策略充分體現(xiàn)FRBR第一組概念(WEMI),而SchemaBibEx卻認為不需要定義和維護內(nèi)容類型和載體的詞匯。
由上可知,Schema.org可以隨時對同一資源本體同時引用不同的規(guī)范文檔,比BIBFRAME更適合于搜索引擎,是搜索引擎兼容了圖書館書目;但是對于書目數(shù)據(jù)資源,BIBFRAME更專業(yè)。正如理查德·沃利斯接受采訪時曾說:“您永遠不會使用Schema.org作為專業(yè)領(lǐng)域詞匯表。對于Marc數(shù)據(jù)中的細節(jié),它不夠深度和豐富。它的作用是幫助搜索引擎,以搜索引擎能夠理解和使用的方式標記書目數(shù)據(jù)?!盵11]
所以作為Schema.org的擴展,SchemaBibEx在詞匯表的設(shè)計上開始打磨細節(jié),拓展專業(yè)知識領(lǐng)域的深度[12]。隨著SchemaBibEx向書目數(shù)據(jù)領(lǐng)域的靠近,BIBFRAME與SchemaBibEx詞匯表的互補應該是完全可行的。例如,雖未正式發(fā)表,SchemaBibEx的詞匯中也提出了hasInstance和isInstanceOf屬性[5]11,它們的語義類似于具有相同名稱的BIBFRAME屬性,將進一步鏈接到BIBFRAME和FRBR體系結(jié)構(gòu)和概念[7]4。
2 核心模型研究
實體模型描述了結(jié)構(gòu)模型、實體類型的概念、屬性和鏈接。對于書目數(shù)據(jù)格式,層次結(jié)構(gòu)是實現(xiàn)書目數(shù)據(jù)實體模型的基本要求。簡單地說,SchemaBibEx具有以下功能:(1)SchemaBibEx衍生于Schema.org的W3C標準,使用URI標識所有的書目資源實體、概念、示例、規(guī)范數(shù)據(jù)應用程序集成等,使得本地書目資源真正成為網(wǎng)絡資源,用戶能獲得更滿意的搜索結(jié)果和更好的Web體驗;(2)SchemaBibEx模型的開放集成和兼容性將最大化有效集成現(xiàn)有標準,即以最大限度地納入現(xiàn)有標準和成果;(3)SchemaBibEx在結(jié)構(gòu)化數(shù)據(jù)規(guī)范領(lǐng)域,幾乎能夠描述所有類別的主題內(nèi)容資源 [7]6-7。SchemaBibEx模型不需要使用搜索引擎來支持標記類型,就能提高搜索結(jié)果的質(zhì)量,其核心模型如圖1所示。
FRBR、BIBFRAME和SchemaBibEx的核心模型關(guān)系如圖2所示。
SchemaBibEx和BIBFRAME描述相同的資源類型時,都明確區(qū)分了內(nèi)容表達和載體形式,良好地實現(xiàn)了載體表現(xiàn)和單件,但仍無法嚴格區(qū)分FRBR中“作品”與“內(nèi)容表達”這兩個概念[13]。但這兩個模型因有不同的目標,定義了不同的建模優(yōu)先級。例如:(1)work和instance在BIBFRAME中都被定義,而SchemaBibEx只定義了work。(2)bf:hasInstance是由schema:CreativeWork和schema:ProductModel共同定義的。(3)BIBFRAME定義了責任者實體,而SchemaBibEx沒有。(4)BIBFRAME定義了注釋實體,而SchemaBibEx沒有。
從實體模型可以看出,BIBFRAME和SchemaBibEx的互補存在很大的可能性。例如,關(guān)鍵概念可以在SchemaBibEx中表達,但是所需的細節(jié)可用BIBFRAME中定義的相關(guān)標準來表達。SchemaBibEx模型將受益于BIBFRAME對圖書館書目數(shù)據(jù)資源更詳細的描述,而BIBFRAME模型可以通過SchemaBibEx來提高搜索引擎中圖書館資源的可見性。展望未來,最理想的模型應是BIBFRAME與SchemaBibEx的開發(fā)與合作,從通用搜索引擎中最大程度地增加圖書館資源的可見性。
3 書目數(shù)據(jù)描述
關(guān)于SchemaBibEx的書目數(shù)據(jù)編碼示例,張雪松等在《網(wǎng)絡書目資源描述規(guī)范SchemaBibEx 及其應用》一文中已作詳細討論[6]6-7,本文不再詳述。BIBFRAME和SchemaBibEx因具有高層次的相似性,至少對于簡單的資源描述、屬性的定義已基本相同,包括題名、責任者、出版商、地點、主題、類型、日期等。而OCLC工作論文中假設(shè)的混合描述模型,即如何在SchemaBibEx的描述中顯式地定義BIBFRAME概念,如圖3所示。
第一個 rdf: description 塊是BIBFRAME編碼,第二個 rdf: description 塊是對應的SchemaBibEx描述,它們在結(jié)構(gòu)上是相同的。BIBFRAME中的isInstanceof負責鏈接資源,與SchemaBibEx中的schemap: isinstanceof屬性一致,都是描述同一作品不同層次實體之間的關(guān)系。第三個 rdf: description 塊中,因為“圖像小說”概念超出SchemaBibEx的標記范圍,而BIBFRAME中此概念定義的較好,因此rdf:type語句兩者都引用了。
由上所述,我們得出幾點結(jié)論:(1)鑒于BIBFRAME和SchemaBibEx定義的相似性,如果SchemaBibEx能很準確地定義概念,是否不需要在BIBFRAME中再重新定義。隨著時代的發(fā)展,SchemaBibEx標記的BIBFRAME語句應越來越多。兩者的引用和互換,更好地控制了數(shù)據(jù)中概念的鏈接,能為書目數(shù)據(jù)添加額外的標簽,來幫助搜索引擎或者其它應用更好地理解。(2)兩個模型中相同概念的URI 指向同一對象,兩個模型中的書目描述在統(tǒng)一的標準下可以相互轉(zhuǎn)換而不丟失信息。至少在描述相同資源時,這兩種模型均可以在信息損失極少的情況下自動轉(zhuǎn)換為另一種模型[14]。隨著開發(fā)的深入,這兩個模型彼此都有可能受益于對方模型技術(shù)的提高或是應用環(huán)境的提升,如能協(xié)同開發(fā)這兩個模型,可以避免重復開發(fā)。
4 結(jié)語
大數(shù)據(jù)時代,圖書館如何使館藏書目資源融入當今的網(wǎng)絡社會,實現(xiàn)全面的共知共享;書目數(shù)據(jù)如何跳出圖書館的象牙塔,真正成為Web 數(shù)據(jù),是我們當今迫切需要研究解決的問題。SchemaBibEx側(cè)重于廣泛檢索,今后會成為網(wǎng)絡用戶的書目數(shù)據(jù)格式;而BIBFRAME面向圖書館的書目信息資源,側(cè)重對資源的詳實著錄,深度揭示實體間的關(guān)系,能深入細節(jié)地描述,使書目資源置身于豐富的上下文環(huán)境之中。王興蘭在《BIBFRAME 的理論及應用研究》一文中提到BIBFRAM的短期(理論研究)、中期(機構(gòu)參與測試)、長期(全面用于Web網(wǎng)絡)目標[15]。我們可以設(shè)想一個新的、動態(tài)的網(wǎng)絡環(huán)境,用戶可以通過搜索引擎搜索以SchemaBibEx標記的書目數(shù)據(jù)進入圖書館網(wǎng)站,再通過BIBFRAME格式的書目數(shù)據(jù)深入關(guān)聯(lián)數(shù)據(jù)環(huán)境,使圖書館成為未來網(wǎng)絡數(shù)據(jù)中心和應用服務中心[6]8。BIBFRAME和SchemaBibEx也應該進一步地聯(lián)合與開發(fā),也意味著作為世界性的圖書館組織,美國國會圖書館與OCLC需要克服困難,進行聯(lián)合開發(fā)。因為,兩者的聯(lián)合不是簡單的加法,而是分別做減法后的相加,如何減,如何落地值得我們進一步的關(guān)注和研究。
參考文獻:
劉煒, 夏翠娟. 書目數(shù)據(jù)新格式BIBFRAME及其應用[J]. 大學圖書館學報, 2014(1):5-13.
周小萍. CNMARC與BIBFRAME的映射及轉(zhuǎn)換研究[J]. 圖書館雜志, 2018(8):21-29.
王萍,黃新平. 基于關(guān)聯(lián)開放數(shù)據(jù)的數(shù)字文化資源語義融合方法研究:歐洲數(shù)字圖書館案例分析[J].圖書情報工作, 2016(6):29-37.
馬澄宇. 書目記錄的功能需求及其影響分析[J]. 圖書館工作與研究, 2010(11):64-66.
GODBY C J. The relationship between BIBFRAME and the Schema.org “Bib Extensions” model a working?paper [EB/OL].(2013-11-26) [2019-12-15]. http://www.
oclc.org/content/dam/research/publications/library/2013/2013-05.pdf.
張雪松,談海蓉,姚湘中. 網(wǎng)絡書目資源描述規(guī)范SchemaBibEx及其應用[J]. 圖書館雜志,2016,35(5):59-67.
JANGRA R. SchemaBibEx: an initiative for networkedbibliographic resource description[J]. Social Science Electronic Publishing, 2018(3):1-16.
Schema Bib Extend Community Group. SchemaBibEx.vocabulary proposals[EB/OL]. (2014-05-01)[2020-01-12]. http: //www. w3. org/community/schemabibex/wiki/Vocabulary_Proposals.
周小萍. 從CNMARC到BIBFRAME:中文書目數(shù)據(jù)的富語義化研究[J]. 情報資料工作, 2018(3):99-104.
SENIOR A. Bringing it all together: mapping continuing resources vocabularies for linked data discovery[J]. The Serials Librarian, 2018, 74(1-4): 94-101.
ZAINO J. The future of libraries, linked data and Schema. org extensions [EB/OL]. (2014-03-17)[2020-02-26]. http://semanticweb.com/thefuture-of-libraries-linked-data-and-schema-orgextensions_b35315.
ADAMICH T. BIBFRAME Take 3: SchemaBibEx, OCLC WorldCat, and Search Optimization[J]. Technicalities,Sep,2013,33(5):9.
GODBY C J. The relationship between BIBFRAME and OCLCs linked-data model of bibliographic description: a working paper [EB/OL]. (2014-03-26)[2020-03-05]. http: //www. oclc. org/content/dam/research/publications/library/2013/2013-05. pdf.
宋琳琳,莊玉芳. OCLC 的關(guān)聯(lián)書目數(shù)據(jù)模型及其與BIBFRAME的兼容性[J]. 圖書館論壇, 2020(1):1-15.
王興蘭. BIBFRAME 的理論及應用研究[J]. 現(xiàn)代情報, 2016,36(1):90-95.
歐陽寧 中國藥科大學圖書與信息中心館員。 江蘇南京,210009。
趙 莉 中國藥科大學圖書與信息中心館員。 江蘇南京,210009。
朱 華 中國藥科大學圖書與信息中心主任、副研究館員。 江蘇南京,210009。
(收稿日期:2020-06-12 編校:曹曉文,謝艷秋)