国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

書目數(shù)據(jù)新格式BIBFRAME及其應(yīng)用

2014-04-01 13:53劉煒夏翠娟

劉煒 夏翠娟

摘要:MARC格式被認(rèn)為是目前制約圖書館數(shù)據(jù)開放利用的最大障礙,已經(jīng)不適合當(dāng)前的編目環(huán)境?;跁靠刂频臍v史和當(dāng)前背景及需求,通過剖析新的書目框架格式BIBFRAME的關(guān)聯(lián)數(shù)據(jù)模型、需求與用例、工具與服務(wù),分析其開放性、語義化、向后兼容性等特點(diǎn),提出其在應(yīng)用上將遇到技術(shù)門檻過高、與FRBR/RDA等已有標(biāo)準(zhǔn)的融合與沖突、與Shema.org的競(jìng)爭(zhēng)與合作關(guān)系等問題。BIBFRAME不僅是MARC的替代品,還將為圖書館數(shù)據(jù)融入更廣闊的互聯(lián)網(wǎng)環(huán)境帶來巨大的潛力和可能性。

關(guān)鍵詞:MARC 書目框架 語義網(wǎng) 關(guān)聯(lián)數(shù)據(jù)

書目數(shù)據(jù)是圖書館進(jìn)行書目控制的重要基礎(chǔ),是揭示館藏、開展服務(wù)的主要工具,也是傳統(tǒng)圖書館對(duì)于知識(shí)進(jìn)行組織和整序的最有價(jià)值的貢獻(xiàn)。數(shù)字時(shí)代的書目數(shù)據(jù)雖然只是圖書館類型豐富的元數(shù)據(jù)中的一種,但它肩負(fù)著將紙媒帶人數(shù)字時(shí)代的重任,同時(shí)又是出版物得以傳播利用的重要橋梁,因此其重要性并沒有降低。當(dāng)前最大的問題是如何將書目數(shù)據(jù)開放成真正的萬維網(wǎng)上的數(shù)據(jù)?這其實(shí)并不是系統(tǒng)實(shí)現(xiàn)問題,而是書目數(shù)據(jù)格式問題。由于語義技術(shù)的發(fā)展,人們才真正明白,MARC格式是當(dāng)前制約圖書館數(shù)據(jù)開放利用的最大障礙,網(wǎng)絡(luò)時(shí)代呼喚新的書目數(shù)據(jù)格式。

1 背景和歷史

MARC格式設(shè)計(jì)于上世紀(jì)60年代末。當(dāng)時(shí)計(jì)算資源極其匱乏,計(jì)算機(jī)速度慢,存儲(chǔ)介質(zhì)昂貴,以磁帶這種順序存取介質(zhì)為主,因此MARC記錄格式(即2709格式)被設(shè)計(jì)為不定長字段的緊湊型格式,以記錄為單元,每條記錄代表一個(gè)編目單位。MARC最初的設(shè)計(jì)目的是為了打印目錄卡片,后來有條件的圖書館逐漸開放了檢索終端,發(fā)展為后來的標(biāo)準(zhǔn)OPAC服務(wù)。由于磁帶格式只能順序檢索而無法隨機(jī)存取,因此在格式中設(shè)計(jì)了很多機(jī)器識(shí)別碼、記錄及字段子字段標(biāo)識(shí),以便能通過倒排索引而迅速定位檢索。后來雖然隨機(jī)存儲(chǔ)介質(zhì)(磁盤)和關(guān)系型數(shù)據(jù)庫技術(shù)得到普及,但2709格式依然作為MARC記錄的交換格式,圖書館的MARC記錄雖然都可以通過萬維網(wǎng)查詢,但除了按照客戶機(jī)/服務(wù)器時(shí)代研發(fā)的Z39.50標(biāo)準(zhǔn)開放API接口之外,基本沒有其它互操作方式,MARC數(shù)據(jù)一直被牢牢地圈養(yǎng)在每個(gè)圖書館的OPAC范圍內(nèi),缺乏方便地生成一個(gè)國家或地區(qū)的總書目或聯(lián)合目錄的技術(shù)和能力,更不用說開放給整個(gè)社會(huì)各相關(guān)行業(yè)使用。

當(dāng)今的信息服務(wù)業(yè)有這樣一個(gè)趨勢(shì):凡是互聯(lián)網(wǎng)上不存在的,基本上是可以被忽略的。圖書館作為一種向大眾傳播知識(shí)的社會(huì)機(jī)構(gòu),如果遭到大眾的忽略,就無法充分實(shí)現(xiàn)其職能,因而也無法實(shí)現(xiàn)其價(jià)值。自MARC產(chǎn)生到現(xiàn)在已經(jīng)過去了半個(gè)世紀(jì),隨著技術(shù)的發(fā)展、信息大環(huán)境的改變,讀者利用圖書館資源的對(duì)象和方式也發(fā)生了巨大的改變。MARC格式的種種局限在網(wǎng)絡(luò)時(shí)代越來越成為一個(gè)絆腳石,越來越阻礙圖書館行業(yè)成為一個(gè)與其地位相稱的網(wǎng)絡(luò)存在:首先,互聯(lián)網(wǎng)讓計(jì)算機(jī)不再是簡(jiǎn)單的數(shù)據(jù)處理工具,而成為全球信息空間的一個(gè)個(gè)節(jié)點(diǎn),書目控制不再局限于某一臺(tái)機(jī)器、某一個(gè)系統(tǒng)、某一家機(jī)構(gòu),而需要在圖書館以外的網(wǎng)絡(luò)空間進(jìn)行傳輸和交換,MARC因其領(lǐng)域上的封閉性已無法滿足這種需求。其次,圖書館要保存和處理的資源不僅限于傳統(tǒng)的印本圖書,還包括諸如電子文獻(xiàn)、網(wǎng)頁、圖像、多媒體等復(fù)雜的資源類型,而MARC是為印本圖書設(shè)計(jì)的,雖然曾在網(wǎng)絡(luò)資源的描述上做過一定的努力(856字段),但效果并不理想。

都柏林核心元數(shù)據(jù)組織(DCMI)很早就看到了MARC對(duì)網(wǎng)絡(luò)應(yīng)用的不適應(yīng),從上世紀(jì)90年代中期開始發(fā)起了一輪新型元數(shù)據(jù)研發(fā)風(fēng)暴,試圖為MARC等傳統(tǒng)的文獻(xiàn)描述方式找到替代者。都柏林元數(shù)據(jù)核心集、術(shù)語詞表、抽象模型及應(yīng)用綱要等都是DCMI為網(wǎng)絡(luò)時(shí)代書目控制做出的重要貢獻(xiàn)。對(duì)于圖書館元數(shù)據(jù),DCMI很早就提出一套名為“圖書館應(yīng)用綱要”的元數(shù)據(jù)方案,試圖實(shí)現(xiàn)類似MARC的描述功能,但這個(gè)方案只是一個(gè)屬性元素集合,相對(duì)于MARC這種既包含豐富得多的屬性元素集、又含有著錄和語法編碼規(guī)則的“復(fù)合型”標(biāo)準(zhǔn)來說,遠(yuǎn)不能滿足實(shí)際需要,因而一直缺乏大型圖書館的支持而始終停留于草案階段,未能成為DCMI的推薦規(guī)范。在數(shù)據(jù)編碼方式上,MARC雖然號(hào)稱“機(jī)讀”,但是其各種內(nèi)部格式只是被計(jì)算機(jī)讀取,而無法被機(jī)器“理解”。DCMI嘗試引入RDF/XML作為語義描述規(guī)范,但由于圖書館通行的編目規(guī)則(AACR2)是和MARC配套的,無法直接采用RDF編碼,而且語義技術(shù)的實(shí)用化也有一個(gè)過程,當(dāng)時(shí)還不足以支持大規(guī)模的應(yīng)用,因此MARC的地位長期以來難以撼動(dòng)。

國際圖聯(lián)1998年出版了《書目記錄的功能需求》(FRBR)報(bào)告12],提出與書目描述相關(guān)的三類實(shí)體、屬性及其相互之間的關(guān)系,指出傳統(tǒng)的MARC無法滿足報(bào)告中提出的這種層次化的、全網(wǎng)域的“查找、標(biāo)識(shí)、搜索和獲?。‵ISO)”四方面的需求。隨著以兼容過去并實(shí)現(xiàn)FRBR為目標(biāo)的RDA編目規(guī)則的出臺(tái),美國國會(huì)圖書館對(duì)MARC21進(jìn)行了大量擴(kuò)展,人們對(duì)MARC格式的不滿達(dá)到了一個(gè)頂點(diǎn)。

呼吁以新的書目格式取代MARC的呼聲早已有之,進(jìn)入新千年之后更是不絕于耳。加州大學(xué)數(shù)字圖書館項(xiàng)目前經(jīng)理、現(xiàn)任OCLC高級(jí)項(xiàng)目主管Roy Tennant在2002年公開喊出MARC Must Die(MARC必須死)。但它為什么還死不了呢?最主要的原因是一直沒有一種能夠滿足網(wǎng)絡(luò)時(shí)代書目數(shù)據(jù)功能需求的書目格式來取代它。

美國國會(huì)圖書館2006年12月成立了未來書目控制項(xiàng)目組,2008年1月提交最終報(bào)告On the Record,表明將書目控制向萬維網(wǎng)推進(jìn)的積極態(tài)度,引發(fā)巨大爭(zhēng)論。OCLC領(lǐng)導(dǎo)了WaC的Schema書目擴(kuò)展社區(qū)的研究工作,通過對(duì)一種由Google、Yahoo和微軟等提出的Schema.org編碼推薦規(guī)范進(jìn)行擴(kuò)展,在其WorldCat中嘗試基于Schema.org的書目格式,實(shí)現(xiàn)基于FRBR的RDA編目數(shù)據(jù)的網(wǎng)絡(luò)化。所有這些探索都指向一個(gè)目標(biāo):直接用萬維網(wǎng)原生的技術(shù)——即以URI、HTTP、HTML/XML為代表的技術(shù)來處理和發(fā)布信息。

沈丘县| 安乡县| 曲周县| 霍林郭勒市| 铜陵市| 伽师县| 贺兰县| 龙海市| 清远市| 玉山县| 白银市| 阜新市| 佛坪县| 巩义市| 威海市| 江门市| 晋宁县| 班玛县| 原平市| 花莲县| 正定县| 麟游县| 白银市| 福海县| 武乡县| 伊金霍洛旗| 全椒县| 万年县| 嘉峪关市| 南京市| 化隆| 青川县| 镇平县| 弥渡县| 九龙县| 宽甸| 扶沟县| 贺兰县| 西贡区| 玉龙| 伊吾县|