賈延霞 楊 慧(清華大學圖書館 北京 100084)
目前,各圖書館電子資源的擁有量急速增長,一些圖書館的電子資源采購經(jīng)費已經(jīng)超過印刷型資源的采購經(jīng)費,電子資源已經(jīng)成為非常重要的館藏資源。電子資源數(shù)量龐大、增長速度快,利用數(shù)據(jù)庫商免費或有償提供的MARC(Machine-Readable Cataloging,機器可讀目錄)數(shù)據(jù)是快速完成電子資源編目的重要途徑。清華大學圖書館在開展電子資源編目的過程中,采用了中外多個數(shù)據(jù)庫商提供的MARC數(shù)據(jù)。本文以清華大學圖書館的實踐為例,討論電子資源編目中利用數(shù)據(jù)庫商提供的MARC數(shù)據(jù)可能存在的問題及利用策略,以期為同行合理利用MARC數(shù)據(jù)提供參考。
2011年,筆者在一項關于電子資源編目實踐的調(diào)研中發(fā)現(xiàn),大多數(shù)圖書館會利用數(shù)據(jù)庫商提供的MARC數(shù)據(jù)對電子期刊和電子圖書進行編目,以加快電子資源編目速度、節(jié)約編目成本。在筆者調(diào)查的14家已經(jīng)開展電子資源編目的國內(nèi)圖書館中,有12家利用了數(shù)據(jù)庫商提供的MARC數(shù)據(jù)。筆者在調(diào)查中了解到,哥倫比亞大學圖書館、香港中文大學圖書館[1]購買了Serials Solutions公司的服務,由Serials Solutions 公司提供電子期刊的MARC數(shù)據(jù)并定期更新維護。一份對美國研究型圖書館電子資源編目實踐的調(diào)研顯示,接近48%的圖書館表示會購買數(shù)據(jù)庫商提供的電子資源書目記錄[2]。從上述分析來看,利用數(shù)據(jù)庫商提供的MARC數(shù)據(jù)是電子資源編目的主要方法之一,有助于圖書館快速完成大量電子資源的編目工作。
清華大學圖書館先后利用過Springer、MyiLibrary、NetLibrary、Safari、Ebrary、Wiley、Eighteenth Century Collections Online(十八世紀作品在線)等多個西文電子圖書數(shù)據(jù)庫商以及超星電子圖書和書生之家電子圖書等中文數(shù)據(jù)庫商所提供的MARC數(shù)據(jù)。在利用這些MARC數(shù)據(jù)的過程中,筆者發(fā)現(xiàn)有一些問題值得注意。
數(shù)據(jù)庫商提供的MARC數(shù)據(jù)極大地方便了圖書館,但并不是所有MARC數(shù)據(jù)的質(zhì)量都能令圖書館滿意。就筆者利用電子圖書MARC數(shù)據(jù)的過程來看,國外數(shù)據(jù)庫商提供的西文電子資源的MARC數(shù)據(jù)質(zhì)量較好,但國內(nèi)數(shù)據(jù)庫商提供的中文圖書的MARC數(shù)據(jù)質(zhì)量參差不齊。對照MARC著錄規(guī)則筆者發(fā)現(xiàn),中外數(shù)據(jù)庫商提供的MARC數(shù)據(jù)均存在不規(guī)范的問題。數(shù)據(jù)庫商提供的電子資源MARC數(shù)據(jù)的質(zhì)量問題主要表現(xiàn)在以下兩個方面。
2.1.1 著錄字段不齊全
有些數(shù)據(jù)庫商提供的MARC數(shù)據(jù)中缺乏完整的電子資源特征字段或子字段。例如,ProQuest學位論文全文數(shù)據(jù)庫的MARC數(shù)據(jù)中,245字段缺少“$h[electronic resource]”及$c子字段;IG Publishing數(shù)據(jù)庫的電子圖書MARC數(shù)據(jù)普遍缺少006、007字段;書生之家電子圖書的MARC數(shù)據(jù)中,200字段缺少“$b電子資源”。此外,數(shù)據(jù)庫商提供的MARC數(shù)據(jù)中普遍缺少電子資源附注說明字段,如西文電子資源的MARC數(shù)據(jù)中普遍缺少500字段(題名來源附注)、538字段(系統(tǒng)細節(jié)附注);中文電子圖書的MARC數(shù)據(jù)中則普遍缺少135字段(電子資源編碼數(shù)據(jù))、325字段(復制品附注)、337字段(系統(tǒng)要求細節(jié)附注)等。
有的電子資源MARC數(shù)據(jù)雖然具有電子資源特征字段或子字段,但缺少其他應具備的字段或子字段。例如,IG Publishing電子圖書的一些MARC數(shù)據(jù)中缺少必備的字段,如100字段(個人名稱)、111字段(會議名稱)等。國內(nèi)很多圖書館訂閱了超星電子圖書,其數(shù)據(jù)庫商提供的MARC數(shù)據(jù)中有不少是簡編記錄,有的甚至連最基本的責任者檢索點字段都不具備,如有的數(shù)據(jù)僅有010字段、135字段、200字段、210字段、215字段、690字段、856字段。
2.1.2 著錄字段不規(guī)范
有些電子資源的MARC數(shù)據(jù)中,已著錄的部分字段或子字段不符合著錄規(guī)范,與相應的印刷型資源的著錄形式不一致。例如,在一些西文電子圖書的245字段(題名說明)和中文電子圖書的200字段(題名與責任說明)中,不區(qū)分正題名與其他題名或分輯題名等,全部著錄在245$a或200$a子字段中;不區(qū)分首要責任者和次要責任者,均著錄在200$f子字段中。ProQuest學位論文全文數(shù)據(jù)庫的MARC數(shù)據(jù)中,部分數(shù)據(jù)的100字段和245字段全部是大寫字母。
著錄不規(guī)范有很多弊病,不利于數(shù)據(jù)交換,不利于讀者查詢和辨識信息,不利于書目數(shù)據(jù)庫整體的質(zhì)量控制工作,也不利于館員進行數(shù)據(jù)查重。
同一種電子資源同時存在于多個數(shù)據(jù)庫中,這種情況在電子期刊中尤為多見,圖書館必須考慮該如何處理這種情況。例如,同一種電子圖書在超星電子圖書、書生之家電子圖書及阿帕比電子圖書3個數(shù)據(jù)庫中都有記錄,同一種電子期刊在EBSCO、Gale和ProQuest的數(shù)據(jù)庫平臺中都有所收錄,圖書館要決定為這些電子圖書或電子期刊建立一條書目記錄還是多條書目記錄。這就要求圖書館制定本館的電子資源編目政策以方便編目員處理實際問題。
在MARC數(shù)據(jù)中,856字段中的$u子字段是電子資源的鏈接地址,可使讀者通過OPAC(Online Public Access Catalogue,聯(lián)機公共目錄查詢)直接鏈接到電子資源的內(nèi)容。OPAC中鏈接顯示的文字則由856字段中的$z子字段的文字決定。而數(shù)據(jù)庫商提供的856$z子字段中的內(nèi)容或形式各不相同,有些根本沒有856$z子字段,這樣使讀者在OPAC中看到的鏈接文字要么內(nèi)容表現(xiàn)各異,要么僅是抽象的URL地址。清華大學圖書館的參考咨詢館員曾向編目員提出建議:電子資源鏈接地址應能提供有關來源數(shù)據(jù)庫的信息,以方便讀者進一步了解數(shù)據(jù)庫??梢姡绾吻逦卦贠PAC中展示電子資源的鏈接信息是值得編目員注意的問題。對856$z子字段公共附注的文字做規(guī)范化處理,有利于讀者更清晰地了解電子資源的來源等信息。
為了規(guī)范電子資源編目工作,各圖書館應該結合實際情況制訂本館的電子資源編目政策,如制訂編目流程、編目規(guī)范、編目數(shù)據(jù)修改要求等。尤其對于資源同時有電子版和印刷版以及各個數(shù)據(jù)庫含有同一種電子資源的情況,圖書館必須確定是建立1條書目記錄還是多條書目記錄。這兩種方法各有優(yōu)缺點:建1條書目記錄符合FRBR(Functional Requirements for Bibliographic Records,書目記錄功能需求)對書目功能的需求,能夠節(jié)約館藏空間[3],但維護856字段中的多個URL比較困難;將1種資源的電子版和印刷版以及不同數(shù)據(jù)庫中的每種資源單獨建立書目記錄,可直接批量灌裝書目數(shù)據(jù),新建及后期維護更新都比較簡單,但會帶來數(shù)據(jù)冗余、重復的問題。各館需要依據(jù)本館的實際情況制訂本地政策,用于指導本館的電子資源編目工作。清華大學圖書館對1種資源的電子版和印刷版采取分別建立書目記錄的方式;對不同數(shù)據(jù)庫含有的同一種電子圖書的情況,采取建立多條書目記錄的方式;對不同數(shù)據(jù)庫含有的同一種電子期刊的情況,則只建立1條書目記錄,其856$u子字段中的URL指向期刊導航中該期刊的地址。
筆者通過關于電子資源編目實踐的調(diào)研發(fā)現(xiàn),在利用數(shù)據(jù)庫商數(shù)據(jù)的12家國內(nèi)圖書館中,有2家圖書館沒有對數(shù)據(jù)庫商的數(shù)據(jù)做任何修改,直接加以利用,有10家圖書館表示需要做適當?shù)男薷摹=Y合電子資源編目實踐經(jīng)驗,筆者認為,圖書館拿到數(shù)據(jù)庫商提供的MARC數(shù)據(jù)之后,首先應對數(shù)據(jù)質(zhì)量進行分析,記錄所有不規(guī)范或缺失的字段或子字段,記錄其數(shù)據(jù)質(zhì)量的特點,以便為合理利用、適當修改提供依據(jù)。
對不同數(shù)據(jù)庫商提供的MARC數(shù)據(jù)需要制訂不同的修改方案。有的數(shù)據(jù)庫商提供的MARC數(shù)據(jù)不需要修改直接便可利用,如數(shù)據(jù)庫商提供的是OCLC(Online Computer Library Center,聯(lián)機計算機圖書館中心)的記錄;有的數(shù)據(jù)庫商提供的MARC數(shù)據(jù)則需要進行必要的字段修改再加以利用。修改的主要目的是使得字段規(guī)范,與著錄規(guī)則盡量一致。一般來說,需要修改或完善的字段主要有重要的檢索點字段,如CNMARC(China Machine-Readable Catalogue,中國機讀目錄)中的200字段、7--字段;電子資源特征字段和子字段,如MARC21中的5--字段、CNMARC中的3--字段;編碼字段,如MARC21中的006、007字段,CNMARC中的135字段等。此外,需要修改的還有856$z子字段的公共附注,以給讀者提供更清晰的指引。例如,清華大學圖書館將西文電子圖書的856$z子字段的問題統(tǒng)一修改為“Connect to the book via XXX”,其中XXX與圖書館主頁上介紹的數(shù)據(jù)庫名稱一致,這樣使讀者很清楚現(xiàn)在訪問的是哪些數(shù)據(jù)庫資源,而且也在無形中向讀者介紹了該數(shù)據(jù)庫的有關信息。
制訂數(shù)據(jù)修改方案后,對于存在共性問題的書目記錄(如缺少的電子資源特征字段或子字段、修改856$z子字段的公共附注等)可以盡量利用批處理軟件加快數(shù)據(jù)處理速度;對于無法批處理的書目記錄,則需要逐一修改。清華大學圖書館利用了冠景公司開發(fā)的marcpro工具軟件,對MARC數(shù)據(jù)進行修改,解決了電子資源書目數(shù)據(jù)中大部分的問題。但有些數(shù)據(jù)庫商提供的MARC數(shù)據(jù)存在著錄錯誤、重要字段和子字段著錄不齊全等嚴重質(zhì)量問題,這就需要編目員逐一核對后修改完善。為了保證數(shù)據(jù)質(zhì)量、滿足讀者的查詢需求、提高查詢的準確性,編目員應當仔細審核數(shù)據(jù)庫商提供的MARC數(shù)據(jù),進行必要的批量規(guī)范化修改甚至逐條完善,補充完整的檢索點信息、電子資源特征字段及子字段。
有些數(shù)據(jù)庫的內(nèi)容不斷更新,需要圖書館積極主動地獲取更新數(shù)據(jù)并實施更新維護操作。例如,定期到數(shù)據(jù)下載網(wǎng)站查看是否有最新的數(shù)據(jù),對于數(shù)據(jù)庫商反饋的需要刪除的資源核實確認后及時刪除。
為了方便對電子資源書目數(shù)據(jù)的更新維護,圖書館應在建立書目數(shù)據(jù)時注意保留資源的控制號或唯一標識號等信息,這樣在更新時可以較為方便地與書目數(shù)據(jù)庫中已有的數(shù)據(jù)比對并批量刪除已過期的書目記錄。
清華大學圖書館先后利用過中外多家數(shù)據(jù)庫商提供的電子資源MARC數(shù)據(jù)。充分利用這些數(shù)據(jù)在OPAC中揭示電子資源,是加快電子資源編目速度、提高電子資源可見度和利用率的重要途徑。編目員分析審核數(shù)據(jù)質(zhì)量、制訂必要的修改方案對于提高書目數(shù)據(jù)的質(zhì)量有重要意義。各圖書館應結合本館實際,制訂合理的利用方案,以促進本館電子資源編目工作的開展,優(yōu)化電子資源服務。圖書館也可以嘗試積極與數(shù)據(jù)庫商溝通,對MARC數(shù)據(jù)提出修改完善的意見和建議,以期從源頭上提高數(shù)據(jù)質(zhì)量。
[1]張寶珍,吳玉珍,林柔云. 香港中文大學圖書館電子資源管理的挑戰(zhàn)與對策[J].大學圖書館學報, 2008 (6):68-74.
[2]Chen X T, Colgan L, Greene C, et al. E-Resource Cataloging Practices: A Survey of Academic Libraries and Consortia[J]. The Serials Librarian,2004 (1-2): 153-179.
[3]邱 萍.網(wǎng)絡電子期刊編目的難點及對策[J].圖書館建設,2011(7):34-37.