倪道敏?鄭佳盈
摘 要 論文介紹了上海圖書館外文文獻(xiàn)資源獲取及編目情況,以上海圖書館外文文獻(xiàn)不同來源的數(shù)據(jù)為分析對象,著重分析基于OCLC平臺的數(shù)據(jù)情況,并結(jié)合OCLC平臺使用情況及工作流程提出了對未來編目工作的展望和思考。
關(guān)鍵詞 上海圖書館 OCLC 外文文獻(xiàn) 西文數(shù)據(jù) 編目工作
分類號 G254.3
DOI 10.16810/j.cnki.1672-514X.2018.08.004
上海圖書館(上??茖W(xué)技術(shù)情報研究所,簡稱上圖) 是綜合性研究型公共圖書館和行業(yè)情報中心,外文文獻(xiàn)采集在其文獻(xiàn)資源建設(shè)中占有相當(dāng)大的比重。上圖外文文獻(xiàn)的編目和揭示依托于OCLC平臺,是OCLC國內(nèi)最早的管理性會員單位。本文通過介紹上海圖書館近年開展的外文編目業(yè)務(wù)情況,分享外文編目經(jīng)驗與成效,以期為同行提供借鑒參考。
1 2017年度上海圖書館外文文獻(xiàn)資源總體情況
1.1 外文專業(yè)圖書采購
上圖外文文獻(xiàn)資源以學(xué)術(shù)類圖書為主,內(nèi)容涵蓋人文、社科、自然科學(xué)以及工程技術(shù)等各學(xué)科領(lǐng)域。語種包括英、日、德、法、俄、韓及西班牙語。2017年,共采購各類外文學(xué)術(shù)資源28 309種,其中外文圖書27 399種、外文視聽資料910種。
1.2 獲贈圖書和國際交換圖書情況
國際交換和國際贈書是上圖館藏建設(shè)的一部分,上圖與世界各國、各地區(qū)的六十多家圖書館長年保持著交換合作關(guān)系。2017年度,上圖共收到交換、贈送的圖書4525冊。
1.3 大眾類圖書采購情況
為了滿足普通讀者對外文圖書的閱讀需求,自2014年起,上圖嘗試外文大眾類圖書的館藏建設(shè),并且收到了良好的成效,采購圖書深受廣大讀者喜愛,借閱率逐年提高。2017年度,共采購大眾類外文圖書2050種,其中英文圖書1739種、日文圖書311種。
1.4 電子圖書采購情況
2017年度,上圖主要采購5家出版社的外文電子圖書,總量達(dá)11 884種,具體如表1所示。除此之外,上圖一般還采購ProQuest、EBSCO、易閱通和一些國外出版社出版的電子圖書。
2 2017年度上海圖書館外文文獻(xiàn)編目工作
2.1 外文文獻(xiàn)編目情況統(tǒng)計分析
2017年上圖Horizon流通系統(tǒng)共收錄西文數(shù)據(jù)44 982條。從圖書來源看,可分為:本館采購、交換贈送、中心館數(shù)據(jù)、回溯數(shù)據(jù)。其中,本館采購又可分為紙本書和電子書兩類,中心館數(shù)據(jù)是指上圖為上海市各區(qū)圖書館、街鎮(zhèn)圖書館編制的數(shù)據(jù),回溯數(shù)據(jù)是指長期未編的圖書數(shù)據(jù),具體分析見表2、圖1。從數(shù)據(jù)來源看,可分為OCLC下載數(shù)據(jù)、自編數(shù)據(jù)和外來數(shù)據(jù)三類,具體分布見表3。本館采購的紙本和電子比重達(dá)到了76.31%。在全年度收錄數(shù)據(jù)中利用OCLC平臺下載的數(shù)據(jù)達(dá)到了61.09%,其中本館采購的紙本書并且利用OCLC下載數(shù)據(jù)的比重達(dá)到了54.42%。
外來數(shù)據(jù)主要用于外文電子書,這些數(shù)據(jù)一般由出版社隨書配置,編目工作主要是進(jìn)行分類法修改,不考慮外來數(shù)據(jù)的影響,上圖2017年度總計編目29 568條(見表4),其中通過OCLC平臺下載編目27 480條,約占總數(shù)的92.94%;自建數(shù)據(jù)2088條,占總數(shù)的7.06%。其中本館采購(紙本書) 的自建數(shù)據(jù)占總自建數(shù)據(jù)的97%,主要由小語種圖書(大部分為韓語圖書,另有法語、德語、西班牙語等)、西文無數(shù)據(jù)圖書、視聽資料組成。在本館編目數(shù)據(jù)中95%為學(xué)術(shù)類數(shù)據(jù),5%為大眾類數(shù)據(jù)。
2.2 基于OCLC的外文編目數(shù)據(jù)修改情況
從編目方式看,上圖下載數(shù)據(jù)中92.5%的下載數(shù)據(jù)用RDA編目。即使有如此高比例的RDA下載數(shù)據(jù),但仍然要進(jìn)行數(shù)據(jù)修改。數(shù)據(jù)的修改是依據(jù)《上海圖書館西文文獻(xiàn)RDA編目細(xì)則》。該細(xì)則類似《RDA本地政策聲明》,數(shù)據(jù)修改嚴(yán)格依照《資源描述與檢索 (RDA)》 《MARC21書目數(shù)據(jù)格式》 《中國圖書館分類法》 《美國國會圖書館標(biāo)題表》 《杜威分類法》 等規(guī)范進(jìn)行。外文文獻(xiàn)編目部門定期參閱“RDA TOOLKIT”、美國國會圖書館編目相關(guān)政策及OCLC編目字段的更新情況,并結(jié)合編目實際對編目細(xì)則進(jìn)行更新。
數(shù)據(jù)的修改主要是三個方面。一是修改客觀著錄內(nèi)容與文獻(xiàn)本身描述不相符的地方,主要是責(zé)任者遺漏、題名項叢書項混淆、載體描述項(插圖、表格、頁碼)遺漏、ISSN號遺漏等。二是修改與上圖編目細(xì)則有出入的方面,主要是責(zé)任者著錄數(shù)量、RDA特征字段(336-338) 部分子字段的遺漏,504內(nèi)容附注遺漏,名稱、主題規(guī)范的使用與控制等。三是對下載數(shù)據(jù)添加中圖分類、索書號及上圖本地特征化字段。
上圖編目數(shù)據(jù)中仍有少量數(shù)據(jù)為原編數(shù)據(jù)。原編數(shù)據(jù)主要分為兩類:一類是在OCLC有相似數(shù)據(jù),但與上圖編目要求差異太大,可用度不高,不能認(rèn)定是否相同載體表現(xiàn)或基于編目效率暫不考慮對OCLC記錄進(jìn)行升級的,這類數(shù)據(jù)主要常見于IEEE及相關(guān)會議錄數(shù)據(jù)、SPIE資料以及重印版的系列叢書;另一類是OCLC上無數(shù)據(jù),主要是印度、德國等非英美出版社的圖書,以及英美國家中比較小眾的藝術(shù)類文獻(xiàn)。
3 OCLC-WorldCat平臺利用及工作流程概述
OCLC書目記錄達(dá)到4.1億條、總館藏記錄26億多條,覆蓋491種語言,向全球的圖書館、信息中心及其用戶提供各種信息服務(wù),通過存取世界各地的信息來降低獲取信息的成本。OCLC也是促進(jìn)國際標(biāo)準(zhǔn)不斷發(fā)展的合作機(jī)構(gòu),尤其是在合作編目、資源共享、聯(lián)機(jī)參考服務(wù)和館際互借等方面做出了卓著的成績。
3.1 上圖西文數(shù)據(jù)及OCLC使用情況
上圖1996年加入OCLC,成為國內(nèi)最早參與OCLC合作組織的成員單位,主要利用OCLC平臺進(jìn)行西文數(shù)據(jù)的下載和上傳工作。西文語種主要指英語、法語、德語、西班牙語、俄語等。目前,上圖西文數(shù)據(jù)編制采用套錄下載與原編相結(jié)合的方式。其中套錄數(shù)據(jù)的數(shù)據(jù)源來自O(shè)CLC WorldCat數(shù)據(jù)庫,突破了原本逐條編制數(shù)據(jù)的困境?,F(xiàn)在西文數(shù)據(jù)每月下載量達(dá)到2000余條,并利用平臺優(yōu)勢對相關(guān)字段做規(guī)范控制。
近年來,編目事業(yè)有了很大的發(fā)展,從傳統(tǒng)的文獻(xiàn)編目轉(zhuǎn)型為資源的描述,RDA對整個機(jī)讀格式目錄進(jìn)行了重新定義。OCLC作為行業(yè)引領(lǐng)者,其平臺的RDA數(shù)據(jù)在近幾年也呈井噴式增長。針對這一情況,上圖及時調(diào)整了編目工作策略,對RDA的推行進(jìn)行了調(diào)研和分析,后于2012年成立RDA工作小組,啟動RDA應(yīng)用推廣研究項目,對RDA編目實現(xiàn)方式、RDA編目員培訓(xùn)工作及RDA編目測試階段的工作進(jìn)行了探索及研究,為RDA的應(yīng)用打下了基礎(chǔ)。目前,上圖對新舊數(shù)據(jù)編目格式的界定為:對于2014年以前編制的西文數(shù)據(jù)仍保留AACR2編目格式,2014年以后新編制的英文數(shù)據(jù)采用RDA編目格式。目前,上圖外文文獻(xiàn)編目中,英、法、德、西班牙、俄、韓語圖書的下載與原編數(shù)據(jù)均采用RDA格式?,F(xiàn)已有少量西文圖書原編紀(jì)錄上傳到OCLC WorldCat數(shù)據(jù)庫,由OCLC總部質(zhì)量控制部門審校,反饋情況良好。
除中文圖書和國內(nèi)出版的西文圖書采用RDA編目格式外,上圖仍保留境外書目數(shù)據(jù)業(yè)務(wù),以服務(wù)國外圖書館文獻(xiàn)數(shù)據(jù)需求??紤]到境外數(shù)據(jù)的特點(diǎn),上圖將早年以CNMARC編目的圖書批量轉(zhuǎn)變?yōu)閁SMARC數(shù)據(jù)而對于境外數(shù)據(jù)的編制,參考上圖西文圖書RDA編目細(xì)則,以MARC21為基本格式,以新羅馬化拼音為主要編目字符,并通過880連接字段將拼音和漢字字段相連接而構(gòu)成。依據(jù)OCLC互惠互利、共同發(fā)展的原則,上圖也積極向OCLC World Cat 提供優(yōu)質(zhì)境外原編數(shù)據(jù),2017全年上傳2800余種全字段RDA格式數(shù)據(jù),通過貢獻(xiàn)知識內(nèi)容和共享資源共建OCLC數(shù)據(jù)平臺。
3.2 上圖西文數(shù)據(jù)OCLC套錄下載工作流程
目前,上圖西文數(shù)據(jù)下載套錄工作按以下步驟進(jìn)行(流程見圖2)。(1) 新建一個本地數(shù)據(jù)目錄,并將新下載的數(shù)據(jù)保存在此目錄中。(2) 通過ISBN在OCLC的檢索框中進(jìn)行檢索,未檢索到的記錄可以通過題名、著者等其他途徑檢索。(3) 對于單條檢索結(jié)果,如果數(shù)據(jù)的基本字段完整,則直接套錄下載進(jìn)入數(shù)據(jù)修改操作。對于多條檢索結(jié)果,根據(jù)數(shù)據(jù)揭示的載體形態(tài)、收藏數(shù)據(jù)的館藏數(shù)及First Search平臺顯示的數(shù)據(jù)質(zhì)量情況綜合選取質(zhì)量較高的數(shù)據(jù)進(jìn)行數(shù)據(jù)修改。(4) 對選取的下載數(shù)據(jù)進(jìn)行修改。由于OCLC數(shù)據(jù)為全球聯(lián)盟的數(shù)據(jù),成員館提供的數(shù)據(jù)質(zhì)量差異較大。為保證編目質(zhì)量,保持上圖編目特色,編目時需特別注意RDA編目特征字段及USMARC標(biāo)準(zhǔn)格式的修改。套錄編目遵循照實著錄原則,不受下載記錄的影響,逐一與所編文獻(xiàn)核對,對不符合之處做出修改,使之符合所編文獻(xiàn)的客觀狀況。同時,根據(jù)上圖西文數(shù)據(jù)編目細(xì)則要求對RDA特征字段及上圖本地化館藏字段進(jìn)行標(biāo)準(zhǔn)化。(5) 對會議名、作者名、主題詞等內(nèi)容做好規(guī)范控制工作。OCLC重視規(guī)范化與標(biāo)準(zhǔn)化的建設(shè),除了提供依據(jù) USMARC 標(biāo)準(zhǔn)數(shù)據(jù)格式和 RDA 標(biāo)準(zhǔn)著錄格式加工并提供書目數(shù)據(jù)外,還聯(lián)機(jī)提供規(guī)范文檔,以實現(xiàn)規(guī)范控制及數(shù)據(jù)庫質(zhì)量有效控制。(6) 保存修改內(nèi)容,進(jìn)入下一條數(shù)據(jù)編目。(7) 按批次完成整個目錄下載編目,并對目錄數(shù)據(jù)進(jìn)行本地館藏化操作。(8) 移交審校人員進(jìn)行數(shù)據(jù)審校工作。
3.3 利用First Search WorldCat輔助檢索
OCLC First Search Service 是一個通過 Web 訪問的, 與Z39. 50協(xié)議兼容的聯(lián)機(jī)檢索與參考服務(wù)系統(tǒng)。目前,F(xiàn)irst Search 實現(xiàn)了多個數(shù)據(jù)庫的完全整合, 增強(qiáng)了聯(lián)合編目數(shù)據(jù)庫 WorldCat 的館藏信息, 實現(xiàn)了各庫間的聯(lián)機(jī)全文共享。
上圖西文編目工作也通過First Search的WorldCat數(shù)據(jù)庫進(jìn)行檢索。目前查看檢索數(shù)據(jù)的主要目的是判別數(shù)據(jù)質(zhì)量??紤]到OCLC-connexion數(shù)據(jù)庫的檢索及下載的計費(fèi)模式,為避免查看多條數(shù)據(jù)進(jìn)行數(shù)據(jù)比較而帶來的額外費(fèi)用,上圖編目員均通過First Search平臺進(jìn)行數(shù)據(jù)查看及選擇,特別對于小語種數(shù)據(jù)的挑選及查看有很大的幫助。借助于First Search平臺,上圖通過OCLC套錄的數(shù)據(jù)精度更高,套錄編目數(shù)據(jù)更加規(guī)范化、標(biāo)準(zhǔn)化。
4 編目工作的思考
4.1 編目工作的困境與發(fā)展
一方面,許多高校圖書館和公共圖書館正在減少編目人員編制,采用業(yè)務(wù)外包的方式,把編目工作整體外包給書商或承包商,但是,外部數(shù)據(jù)來源五花八門,總體質(zhì)量不高。特別是外文數(shù)據(jù)編目工作存在編目人員業(yè)務(wù)能力差、流動性強(qiáng),下載渠道亂,編目機(jī)制不完善,審校力量不強(qiáng)等問題,嚴(yán)重影響了編目數(shù)據(jù)的質(zhì)量。另一方面,作為編目工作一部分的規(guī)范數(shù)據(jù)正越來越被圖書館所重視。此外,國際編目規(guī)則正出現(xiàn)重大變化,以資源描述與檢索為內(nèi)容的新標(biāo)準(zhǔn)正在替代原有被大家普遍采用的英美編目條例, RDA的采用會使圖書館界的書目更易被互聯(lián)網(wǎng)所接納,使數(shù)據(jù)所反映的實體與關(guān)系層次分明、概念清晰,使系統(tǒng)能更有效地對書目進(jìn)行發(fā)現(xiàn)、關(guān)聯(lián)和開放。
4.2 編目工作應(yīng)當(dāng)有一定的投入
目前,許多圖書館的編目數(shù)據(jù)多為下載套錄,數(shù)據(jù)的成本很低。有些編目館員認(rèn)為,編目數(shù)據(jù)即使下載不到也會等到,不需花力氣原編。但編目數(shù)據(jù)審核與校對是需要時間成本和人力成本的,在目前技術(shù)條件下,還不能通過人工智能的方法加以取代,必須逐條輸入和校對,因此一條符合要求的原編編目數(shù)據(jù)制作還需要較高的人力成本。
4.3 編目數(shù)據(jù)的共建共享問題
OCLC聯(lián)機(jī)計算機(jī)圖書館中心是全球最大的聯(lián)機(jī)編目中心,而在我國,CALIS(中國高等教育文獻(xiàn)保障系統(tǒng))、國家圖書館聯(lián)合編目中心、上海圖書館聯(lián)合編目中心是我國三大書目數(shù)據(jù)共享平臺。
CALIS和國家圖書館聯(lián)合編目中心是國家級的書目數(shù)據(jù)中心,分別擁有巨量的館藏數(shù)據(jù)和書目數(shù)據(jù),為不同的用戶提供服務(wù)。上海市文獻(xiàn)聯(lián)合編目中心歸屬上海文獻(xiàn)資源共建共享辦公室,由上海圖書館采編中心具體負(fù)責(zé)運(yùn)行的區(qū)域性文獻(xiàn)聯(lián)合目錄中心和文獻(xiàn)編目中心。這些重要的文獻(xiàn)編目數(shù)據(jù)共享平臺各有特色,但是由于歷史原因,平臺之間的數(shù)據(jù)交換、共享不夠暢通,成員用戶在利用各家資源時投入較多人力進(jìn)行數(shù)據(jù)修改??傮w來看,各平臺均存在共享有余、共建不足的問題,理念和機(jī)制也需要進(jìn)一步改進(jìn)。
4.4 編目標(biāo)準(zhǔn)、規(guī)范、要求須統(tǒng)一
目前,我國的編目標(biāo)準(zhǔn)各不相同,尤其在外文編目MARC標(biāo)準(zhǔn)的采用上,有些圖書館采用CNMARC進(jìn)行外文文獻(xiàn)編目,有些采用MARC21。而在內(nèi)容標(biāo)準(zhǔn)方面,少數(shù)圖書館已完全與國際接軌,外文文獻(xiàn)利用RDA工具套件且完全采用RDA規(guī)則編目,但大部分圖書館仍然采用混合方式,即保留下載RDA記錄的同時,原編仍采用AACR2標(biāo)準(zhǔn)。還有圖書館仍采用AACR2進(jìn)行數(shù)據(jù)編制。另外,聯(lián)編系統(tǒng)之間對數(shù)據(jù)編制要求也不統(tǒng)一,例如CALIS、國圖、上圖編制的外文數(shù)據(jù)都有差異。上述因素使平臺間的數(shù)據(jù)共享與交換難度加大,極大阻礙了我國編目事業(yè)的發(fā)展。因此,編目標(biāo)準(zhǔn)的制定亟需加以統(tǒng)一。