,
圖書館一直承載著保存和展示人類文化遺產(chǎn)、傳承和推廣思想智慧結(jié)晶、挖掘和開發(fā)信息資源、組織和參與社會(huì)教育等使命和職責(zé)。古往今來(lái)的圖書館以雄厚的知識(shí)和技術(shù)儲(chǔ)備為前提,擁有使用最先進(jìn)的科技手段以實(shí)現(xiàn)規(guī)模經(jīng)濟(jì)的悠久歷史[1]和豐富的經(jīng)驗(yàn)。圖書館是目錄檢索的發(fā)源地,從卡片編目發(fā)展到計(jì)算機(jī)時(shí)代的機(jī)讀目錄,圖書資源得到有效分類和整理。
1966年,MARC(Machine-Readable Cataloging,機(jī)讀編目格式標(biāo)準(zhǔn))記錄格式誕生于美國(guó);1973年, MARCⅡ被ISO((International Organization for Standardization, 國(guó)際標(biāo)準(zhǔn)化組織)審定為國(guó)際通用標(biāo)準(zhǔn)。由于其規(guī)范性和通用性受到全世界推崇和應(yīng)用,極大地提高了編目效率。
但隨著時(shí)代的變遷,圖書館存儲(chǔ)內(nèi)容日趨豐富和多樣,加之管理互聯(lián)網(wǎng)數(shù)據(jù)的新需求,被定義為不定長(zhǎng)字段的緊湊型格式只能提供給圖書館的OPAC服務(wù)的MARC結(jié)構(gòu),已經(jīng)阻礙了元素分隔以及在關(guān)聯(lián)數(shù)據(jù)環(huán)境中使用URL的能力,無(wú)法適應(yīng)網(wǎng)絡(luò)時(shí)代和圖書館2.0的要求。美國(guó)國(guó)會(huì)圖書館和OCLC(Online Computer Library Center,聯(lián)機(jī)計(jì)算機(jī)圖書館中心)都宣布,將于2016年停止對(duì)MARC格式的支持[2],這就意味著MARC不得不退出書目控制的歷史舞臺(tái)。尋找MARC數(shù)據(jù)的后繼者的任務(wù)迫在眉睫。
面對(duì)互聯(lián)網(wǎng)信息空間的資源需求,英國(guó)國(guó)家圖書館、加拿大圖書館和檔案館、美國(guó)國(guó)會(huì)圖書館等聯(lián)合發(fā)起,潛心制定和搭建了包括DCMI( Dublin Core Metadata Initiative,都柏林核心元數(shù)據(jù))、MODS(Metadata Object Description Schema,元數(shù)據(jù)對(duì)象描述模型)、BIBO(Bibliographic ontology,書目本體)、語(yǔ)義網(wǎng)領(lǐng)域、巴黎原則、基于ONIX(Online Information Exchange,在線信息交換)標(biāo)準(zhǔn)的載體術(shù)語(yǔ)和RDA(Resource Description & Access, 資源描述與檢索)標(biāo)準(zhǔn)在內(nèi)的各類數(shù)據(jù)原則、書目標(biāo)準(zhǔn)和標(biāo)準(zhǔn)平臺(tái)[3]。這些原則和標(biāo)準(zhǔn),成為書目框架計(jì)劃BIBFRAME(The Bibligraphic Framework Initiative)的理論基礎(chǔ),為構(gòu)建MARC格式通往互聯(lián)網(wǎng)世界的橋梁提供了支點(diǎn)。
BIBFRAME是美國(guó)國(guó)會(huì)圖書館和來(lái)自Zepheira的小組合作開發(fā)的,也被稱為書目數(shù)據(jù)格式。作為目前MARC格式超越者的有力候選,意在取代MARC成為語(yǔ)義網(wǎng)應(yīng)用中新一代書目數(shù)據(jù)編碼格式。
為闡明BIBFRAME的體系結(jié)構(gòu),必須從RDA談起。RDA是以AACR2(Anglo-American Cataloguing Rules,英美編目條例第二版)為基礎(chǔ),建立在IFLA(International Federation of Library Associations and Institutions ,國(guó)際圖聯(lián))提出的FRBR(Functional Requirements of Bibliographic Records,書目記錄的功能需求)和FRAD(Functional Requirements for Authority Data,規(guī)范數(shù)據(jù)的功能需求)概念模型以及ICP(International Cataloguing Principles,國(guó)際編目原則聲明)基礎(chǔ)之上的一種新的編目?jī)?nèi)容標(biāo)準(zhǔn),它具體規(guī)定了文獻(xiàn)編目工作的著錄內(nèi)容;而BIBFRAME實(shí)體包括作品、實(shí)例、規(guī)范和注釋,相當(dāng)于建立在RDA內(nèi)容標(biāo)準(zhǔn)之上并與RDA標(biāo)準(zhǔn)兼容的書目數(shù)據(jù)格式[4]。
RDA和BIBFRAME都在剛剛起步階段,其內(nèi)涵和外延還處于不斷變化的狀態(tài)。BIBFRAME的提出,意在將圖書館的現(xiàn)存海量數(shù)據(jù)完美表現(xiàn)為關(guān)聯(lián)WEB數(shù)據(jù)格式[5],并且能夠定義和表達(dá)網(wǎng)絡(luò)數(shù)據(jù),使數(shù)字圖書館在工業(yè)革命4.0的物聯(lián)網(wǎng)世界中得到生存和發(fā)展。
為避免成千上萬(wàn)的編目員重復(fù)描述相同的資源,達(dá)到“一次編制,無(wú)限通用”的設(shè)計(jì)宗旨,數(shù)據(jù)模型和格式必須保持相當(dāng)長(zhǎng)時(shí)間的穩(wěn)定性,且數(shù)據(jù)格式在網(wǎng)絡(luò)系統(tǒng)中具有可識(shí)別性。也就是說(shuō),BIBFRAME格式需要具備共享性、標(biāo)準(zhǔn)性、穩(wěn)定性和低成本的設(shè)計(jì)屬性。BIBFRAME格式被設(shè)計(jì)為融入和參與到更廣泛信息社會(huì)中,也同時(shí)服務(wù)于其使用群體(圖書館以及類似存儲(chǔ)機(jī)構(gòu))的明確需求,決定了歸屬性、唯一性和關(guān)聯(lián)性是它的3個(gè)基本要素[6]。歸屬性明確區(qū)分概念性內(nèi)容和它的物理表現(xiàn)(如作品和實(shí)例),唯一性致力于明確識(shí)別信息實(shí)體(如規(guī)范),關(guān)聯(lián)性具備表達(dá)各實(shí)體間相互關(guān)系和相互作用的能力。
當(dāng)用戶使用百度、谷歌等搜索引擎或是微信、Facebook等社交網(wǎng)絡(luò)查找信息時(shí),圖書館的資源入口甚至是發(fā)現(xiàn)系統(tǒng)也被拋在腦后,圖書館無(wú)形中成為一個(gè)信息孤島。而BIBFRAME模型就是為了打開圖書館通往互聯(lián)網(wǎng)世界的一把鑰匙,把傳統(tǒng)編目數(shù)據(jù)融入網(wǎng)絡(luò)元數(shù)據(jù),通過(guò)圖書館的介入,幫助用戶快速得到更準(zhǔn)確更可靠的答案。
BIBFRAME的模型主要有以下幾種[6]。
創(chuàng)作性作品(Creative Work):反映編目資源概念實(shí)質(zhì)的資源,不同于FRBR/RDA中的作品,相當(dāng)于其實(shí)體中的作品(Work)和內(nèi)容表達(dá)(Expression)。
實(shí)例(Instance):反映作品的個(gè)例的物理載體表現(xiàn)的資源,相當(dāng)于FRBR/RDA中的載體表現(xiàn)。一個(gè)作品可以對(duì)應(yīng)多個(gè)實(shí)例,但一個(gè)實(shí)例只能對(duì)應(yīng)一個(gè)作品,而且每個(gè)實(shí)例都可以用URI標(biāo)識(shí)。
規(guī)范(Authority):反映關(guān)鍵規(guī)范概念的資源,這種關(guān)鍵概念定義了作品和實(shí)例所反映的關(guān)系,規(guī)范資源包括人物、地點(diǎn)、主題和機(jī)構(gòu)等。提供一個(gè)輕量級(jí)的抽象層,使Web級(jí)的規(guī)范控制更為有效。
注釋(Annotaion):提供更多關(guān)于BIBFRAME作品、實(shí)例或規(guī)范的描述信息,為作品提供評(píng)論、目錄、摘要等信息,可以為實(shí)例提供封面、館藏等信息,為名稱規(guī)范提供作者的傳記信息等。此外,還可以提供管理性元數(shù)據(jù)。
由美國(guó)國(guó)會(huì)圖書館和來(lái)自Zepheira的小組合作開發(fā)出一套運(yùn)用RDF(Resource Description Framework,資源描述框架,一種用于描述Web資源的標(biāo)記語(yǔ)言)編制的BIBFRAME詞匯表[7]。此詞匯表原來(lái)發(fā)布在美國(guó)國(guó)會(huì)圖書館的下屬網(wǎng)址http://loc.gov/bibframe/vocab/ 中,后來(lái)又轉(zhuǎn)移到 http://bibframe.org/vocab/的統(tǒng)一網(wǎng)址下。從現(xiàn)在進(jìn)行中的BIBFRAME開發(fā)來(lái)看,不再像DCMI那樣嚴(yán)格控制元素和術(shù)語(yǔ)的數(shù)量,而是根據(jù)實(shí)際需要,經(jīng)過(guò)一定的內(nèi)部討論流程,隨時(shí)發(fā)布和修訂詞匯表。
目前詞匯的主要來(lái)源是MARC、FRBR、RDA、DC和VAR等相關(guān)業(yè)界的元數(shù)據(jù)規(guī)范,包括實(shí)體類、屬性和資源類型取值。截至2014年12月,該網(wǎng)站發(fā)布相關(guān)詞匯200余條,每個(gè)詞表都用URI標(biāo)識(shí)并賦予標(biāo)簽,并歡迎元數(shù)據(jù)工作者增加、修改和補(bǔ)充詞匯。
BIBFRAME初步發(fā)布了以下12種創(chuàng)造性作品的資源類型:語(yǔ)言資料和地圖(Language material,Cartography),數(shù)據(jù)集(Data set),樂譜、舞譜(Notated Music,Notated Movement),音頻資料(Audio Dodument),靜態(tài)圖像(Still Image),動(dòng)態(tài)圖像(Moving Image),三維物體(Three Dimensional Object),軟件與多媒體(Software & Multimedia),混合資料(Mixed Material)資源集合(Collection),手稿(Manuscript),觸覺資料(Tactile)[8]。
BIBFRAME模型對(duì)資源類型的定義既具備科學(xué)性和嚴(yán)謹(jǐn)性,又具備實(shí)用性和兼容性,應(yīng)用的時(shí)候可以任意組合,基本能夠從概念層面覆蓋現(xiàn)存的圖書館及相關(guān)存儲(chǔ)機(jī)構(gòu)的常用資源對(duì)象,比RDA中利用內(nèi)容類型、載體類型和媒體類型三方面組合的定義方式更加簡(jiǎn)便易行,更加容易推廣和實(shí)踐。
自從2011年5月美國(guó)國(guó)會(huì)圖書館正式宣布與以語(yǔ)義技術(shù)起家 的Zepheira公司合作開發(fā)BIBFRAME以來(lái),BIBFRAME書目數(shù)據(jù)新格式日漸清晰,可以預(yù)見到數(shù)字圖書館的嶄新時(shí)代即將到來(lái)。由于BIBFRAME的內(nèi)容涉及10余年來(lái)互聯(lián)網(wǎng)和圖書館領(lǐng)域的多項(xiàng)前沿技術(shù),而且中文資源近乎為零,研究門檻很高。
本文通過(guò)對(duì)BIBFRAME這種書目數(shù)據(jù)新格式的研究背景、體系結(jié)構(gòu)、屬性和內(nèi)容的具體描述,為讀者初步了解和掌握BIBFRAME書目格式打下良好的基礎(chǔ),也為圖書館員及其他數(shù)據(jù)工作者參與開發(fā)和實(shí)踐BIBFRAME提供一些參考。
中華醫(yī)學(xué)圖書情報(bào)雜志2015年3期