原小玲
?
數(shù)據(jù)制作視角下的書目數(shù)據(jù)分析*
原小玲
(太原科技大學(xué)圖書館,太原 030024)
本文從數(shù)據(jù)制作流程角度入手,發(fā)現(xiàn)中文圖書書目數(shù)據(jù)在完整性、準(zhǔn)確性與可共享性上都存在問題。通過對數(shù)據(jù)制作流程的分析,從數(shù)據(jù)制作視角對這些問題的成因進(jìn)行歸納,進(jìn)而提出建立以圖書在版編目數(shù)據(jù)為源頭的全國統(tǒng)一書目數(shù)據(jù),并在出版社及圖書下游環(huán)節(jié)間建立數(shù)據(jù)通道,重視名稱規(guī)范庫建設(shè)與推廣使用等對策,以期對因數(shù)據(jù)制作流程產(chǎn)生的數(shù)據(jù)問題的改進(jìn)有所裨益。
中文圖書;書目數(shù)據(jù);數(shù)據(jù)質(zhì)量
書目數(shù)據(jù)在揭示圖書信息、進(jìn)行文獻(xiàn)組織、幫助用戶檢索圖書、實現(xiàn)資源共享與圖書聚類分析等方面有不可替代的作用。截至2018年8月,國家圖書館的全國圖書館聯(lián)合編目中心擁有中文書目數(shù)據(jù)超過1?300萬條[1];截至2018年3月,中國高等教育文獻(xiàn)保障系統(tǒng)(China Academic Library & Information System,CALIS)聯(lián)合目錄中心網(wǎng)站顯示,其數(shù)據(jù)庫中的中文數(shù)據(jù)已有413萬多條[2]。書目數(shù)據(jù)的質(zhì)量很大程度上取決于數(shù)據(jù)制作過程中各參與主體的表現(xiàn)。目前的書目數(shù)據(jù)制作由圖書在版編目數(shù)據(jù)(Cataloguing in Publication,CIP)中心、公共圖書館系統(tǒng)、高校圖書館系統(tǒng)3大主體完成,依據(jù)不同標(biāo)準(zhǔn)生成數(shù)據(jù)的結(jié)構(gòu),詳略等均有不同。分析其數(shù)據(jù)制作流程,發(fā)現(xiàn)其中的問題與不足,整合資源,在數(shù)據(jù)制作環(huán)節(jié)建立全國統(tǒng)一的書目數(shù)據(jù),各使用方再根據(jù)實際對其進(jìn)行減法操作與少量修改,并增加館藏等個性化信息,以適應(yīng)自身管理需求與館際數(shù)據(jù)交換需要。這樣既有利于數(shù)據(jù)交換與共享,又可以極大地節(jié)約社會成本,還能真實反應(yīng)出版量與圖書館入藏量的關(guān)系。
數(shù)據(jù)制作就是以圖書為加工對象,根據(jù)一定的規(guī)則,對圖書的形式與內(nèi)容特征進(jìn)行揭示,生成書目數(shù)據(jù)的過程。從數(shù)據(jù)制作主體及其產(chǎn)品來看,中文圖書書目數(shù)據(jù)目前由2個環(huán)節(jié)的3個主要主體制作,并使用各自標(biāo)準(zhǔn),制作流程也有所區(qū)別。
CIP數(shù)據(jù)制作流程是在出版社發(fā)稿付排前,由責(zé)任編輯按《圖書在版編目工作手冊》要求,填寫“圖書在版編目工作單”,將工作單提交版本圖書館,版本圖書館采用《圖書在版編目》數(shù)據(jù)標(biāo)準(zhǔn),編制CIP數(shù)據(jù),標(biāo)引中圖分類號與主題詞,并分配給該CIP數(shù)據(jù)一個審定號,加工成CIP數(shù)據(jù)標(biāo)準(zhǔn)格式后返回出版社,出版社將其印制于圖書版權(quán)頁?!秷D書在版編目》數(shù)據(jù)標(biāo)準(zhǔn)與《普通圖書著錄規(guī)則》國家標(biāo)準(zhǔn)保持一致,但不采用任何國際標(biāo)準(zhǔn)。
圖書進(jìn)入流通環(huán)節(jié)后,各圖書館為組織文獻(xiàn)與服務(wù)用戶制作圖書編目數(shù)據(jù)。編目數(shù)據(jù)是由各館分類編目人員共同完成。他們依據(jù)到館圖書的外在特征與內(nèi)容特征,對圖書進(jìn)行全面揭示,并依編目標(biāo)準(zhǔn)對著錄與標(biāo)引項進(jìn)行規(guī)范。按照編目規(guī)則生成MARC數(shù)據(jù)后,發(fā)布于本館OPAC系統(tǒng),供資產(chǎn)管理與用戶檢索所用。國家圖書館與CALIS分別建立有聯(lián)編中心,各成員館可以將數(shù)據(jù)上傳,經(jīng)中心審核后,如為重復(fù)數(shù)據(jù),只增加館藏項;如無重復(fù)數(shù)據(jù),則列為新增數(shù)據(jù),后續(xù)提交該數(shù)據(jù)的館只增加館藏項。為保證數(shù)據(jù)質(zhì)量,各聯(lián)編中心都給有權(quán)限的成員修改數(shù)據(jù)的權(quán)限,以不斷完善數(shù)據(jù)。但以國家圖書館為代表的公共圖書館采用《中國文獻(xiàn)編目規(guī)則》(以下稱“國圖標(biāo)準(zhǔn)”),以CALIS為代表的高校與研究型圖書館采用《CALIS中文圖書編目規(guī)則》(以下稱“CALIS標(biāo)準(zhǔn)”),這兩個標(biāo)準(zhǔn)都遵循國際書目標(biāo)準(zhǔn)ISBD制定,但有細(xì)微差別。
由于同一種書由3個部門依據(jù)不同標(biāo)準(zhǔn)生成書目數(shù)據(jù),造成數(shù)據(jù)數(shù)量遠(yuǎn)超過圖書種數(shù)的現(xiàn)狀。而且數(shù)據(jù)的制作標(biāo)準(zhǔn)不同,生成結(jié)構(gòu)與詳略程度都不同的數(shù)據(jù),雖然滿足不同需求,但其冗余使基于數(shù)據(jù)的服務(wù)缺乏精準(zhǔn)性。
書目數(shù)據(jù)完整性指數(shù)據(jù)對圖書信息揭示的全面性,具體指規(guī)定的可見信息源上的項目著錄完整,標(biāo)引的信息內(nèi)容揭示角度全面,以及其他相關(guān)信息盡可能揭示完備。目前使用的3種書目數(shù)據(jù)在完整性上有不同程度的欠缺。
(1)CIP數(shù)據(jù)完整性要求低。圖書生產(chǎn)環(huán)節(jié)的CIP數(shù)據(jù),由圖書形式與內(nèi)容生產(chǎn)者參與,最有條件做到數(shù)據(jù)完整。但其最大問題恰是描述項目過于簡單。傳統(tǒng)的CIP書目詳細(xì)信息中有正題名、ISBN、版次、印次、價格、開本、裝幀、分類號、主題詞、內(nèi)容提要等項,但缺失責(zé)任者項,且正文語種項為空,書內(nèi)圖表信息也不予揭示。尤其是責(zé)任者項與語種項缺失,對于下游環(huán)節(jié)來說,該書目數(shù)據(jù)的實用價值降低很多。《中國出版物在線信息交換圖書產(chǎn)品信息格式規(guī)范》(CNOIX)標(biāo)準(zhǔn)為有效傳遞圖書產(chǎn)品信息到產(chǎn)業(yè)鏈各環(huán)節(jié),對包括圖書內(nèi)容、出版、營銷等有關(guān)信息在內(nèi)的圖書產(chǎn)品交易信息的XML格式做了具體要求,項目較傳統(tǒng)CIP更詳細(xì)。但對于產(chǎn)品價格、語種、貨幣、制造國及套書信息等書目數(shù)據(jù)中的重要信息,該標(biāo)準(zhǔn)規(guī)定為可選而非必選[3],導(dǎo)致數(shù)據(jù)在完整性上與傳統(tǒng)CIP數(shù)據(jù)要求相比,仍然沒有突破性提升。
(2)不同層級編目數(shù)據(jù)完整性不同。編目數(shù)據(jù)的完整性問題體現(xiàn)在它們對書目記錄級次的區(qū)分上。根據(jù)書目信息或內(nèi)容標(biāo)識的完整程度,國圖數(shù)據(jù)將書目記錄分為4個等級,即完全級與次級1~次級3。其中,完全級為最完整的MARC記錄,編制記錄時與編目實體核對過;次級1為完整記錄,但未核實文獻(xiàn)實體;次級2指CIP記錄,它通常是不完整的;次級3為不完整編目的記錄,且書目發(fā)行機(jī)構(gòu)一般不對其進(jìn)行升級。CALIS數(shù)據(jù)在國圖分級基礎(chǔ)上增加定義了次級4,通常指采訪級簡編記錄[4]。從完全級到次級1~次級4的書目記錄,其詳細(xì)程度逐級降低,也就表明數(shù)據(jù)的完整性逐級降低。編目數(shù)據(jù)的完整性問題在對必備字段的規(guī)定上也有體現(xiàn)。國圖標(biāo)準(zhǔn)與CALIS標(biāo)準(zhǔn)對字段必備性要求不同,總體上CALIS標(biāo)準(zhǔn)較國圖標(biāo)準(zhǔn)更為全面、嚴(yán)格。國圖標(biāo)準(zhǔn)中推薦與選擇使用的字段,在CALIS標(biāo)準(zhǔn)中是有且必備,而非完全的自由選擇使用。對字段使用的不同要求,造成數(shù)據(jù)詳略程度不同。數(shù)據(jù)級次越低,其完整性就越差。
不論是CIP數(shù)據(jù)還是編目數(shù)據(jù),都是對實體圖書的描述與揭示。數(shù)據(jù)準(zhǔn)確一是體現(xiàn)在對圖書外在信息的準(zhǔn)確著錄,“有書在手”才能真正做到著錄準(zhǔn)確;二是體現(xiàn)在對圖書內(nèi)容的準(zhǔn)確分析與標(biāo)引,對圖書內(nèi)容了解才能保證分析與標(biāo)引的準(zhǔn)確。
由CIP數(shù)據(jù)制作流程可見,出版社只是向出版總署提交一份工作單,既未附帶其他校樣,也未由圖書作者幫助標(biāo)引相關(guān)主題詞[5],因而CIP數(shù)據(jù)分類與主題標(biāo)引都很難準(zhǔn)確,“目前CIP數(shù)據(jù)的準(zhǔn)確性離社會各界的要求尚有一定的差距”[6],是圖書館界對其詬病最多的一個方面。
國圖數(shù)據(jù)與CALIS數(shù)據(jù)實行成員館共建共享,可以做到數(shù)據(jù)制作時“有書在手”,相對CIP數(shù)據(jù)而言,準(zhǔn)確性要高。尤其是完全級數(shù)據(jù),要求與編目實體進(jìn)行核對。但其他次級數(shù)據(jù)不要求與編目實體進(jìn)行核對,當(dāng)不與編目實體進(jìn)行核對時,數(shù)據(jù)準(zhǔn)確性是沒有保障的。在CALIS與國圖的數(shù)據(jù)中,不乏此類錯誤。2017年全國圖書館聯(lián)合編目中心工作會議上,國圖聯(lián)編中心就其數(shù)據(jù)質(zhì)量所做的報告中提到,中心數(shù)據(jù)有4項問題還很突出。①數(shù)據(jù)硬傷。包括數(shù)據(jù)中錯字、漏字,外文題名著錄錯誤,字段、子字段、指示符錯誤,相關(guān)字段信息差異,以及尺寸、頁數(shù)、裝幀、書號、標(biāo)點(diǎn)符號等著錄錯誤。②選取圖書題名的問題上沒有統(tǒng)一認(rèn)識、統(tǒng)一標(biāo)準(zhǔn),不但直接影響圖書內(nèi)容的準(zhǔn)確揭示,還會給用戶查詢帶來不便,甚至誤導(dǎo)讀者。③對于同一套書或同一種書,如果選擇不同的著錄方式會產(chǎn)生大量重復(fù)數(shù)據(jù),造成數(shù)據(jù)庫混亂,浪費(fèi)人力、物力,更嚴(yán)重的是誤導(dǎo)使用者,給使用者帶來困惑,這也是一直存在于聯(lián)編數(shù)據(jù)庫中最凸顯的問題。④數(shù)據(jù)庫中已有的編目成果存在被盲目復(fù)制拷貝的現(xiàn)象。如果數(shù)據(jù)庫中出現(xiàn)一條錯誤數(shù)據(jù),隨之會出現(xiàn)若干條同樣的錯誤數(shù)據(jù)[7]。除第3項外均為準(zhǔn)確性問題。
另外,雖然圖書館界對CIP數(shù)據(jù)的準(zhǔn)確性詬病較多,但又經(jīng)常直接沿用CIP數(shù)據(jù)的分類標(biāo)引結(jié)果,也會造成數(shù)據(jù)不準(zhǔn)確。如《煤制天然氣》的摘要中明確“本書是煤化工領(lǐng)域關(guān)于煤制天然氣的學(xué)術(shù)著作”,CALIS數(shù)據(jù)未與編目實體核對,直接沿用了其CIP分類號入F407.9(工業(yè)部門經(jīng)濟(jì)之建筑、水利工程),顯然是不恰當(dāng)?shù)摹?/p>
根據(jù)世界書目控制有關(guān)原則,“國家書目機(jī)構(gòu)有責(zé)任建立本國著者(個人和團(tuán)體)的權(quán)威形式,并建立本國著者(個人和團(tuán)體)的權(quán)威清單”[8]。在我國,國家圖書館聯(lián)合編目中心,CALIS聯(lián)機(jī)合作編目中心,臺灣地區(qū)的漢學(xué)研究中心,香港特別行政區(qū)的大學(xué)圖書館協(xié)作咨詢委員會都開展了名稱規(guī)范工作。國家圖書館和CALIS的規(guī)范庫數(shù)據(jù)總量均超過130萬條,臺灣地區(qū)的漢學(xué)研究中心大約有70萬條,香港特別行政區(qū)的大學(xué)圖書館協(xié)作咨詢委員會超過20萬條。但在規(guī)則層面差別較大,尤其在名稱附加方面做法各異[9]。以對“魯迅”的規(guī)范為例(見表1),可以看到各家的詳略程度不同。國家圖書館最簡略;臺灣地區(qū)的漢學(xué)研究中心則最詳細(xì),區(qū)分度更高。
名稱規(guī)范庫的建設(shè)和推廣應(yīng)用,對于用戶檢索效果影響很大,尤其是對檢全率的影響更大。據(jù)筆者的不完全了解,高校圖書館在業(yè)務(wù)系統(tǒng)中使用名稱規(guī)范的很少,尤其是一些地方類二本及以下層次的高校幾乎完全沒有使用。目前來看,名稱規(guī)范庫的普及推廣還任重道遠(yuǎn)。國家圖書館與CALIS成員館對其名稱規(guī)范庫的使用情況并不樂觀,一方面是成員館對數(shù)據(jù)的專業(yè)要求有待提高;另一方面,編目外包也對名稱規(guī)范工作的正規(guī)化有影響。如何在編目外包時加強(qiáng)對數(shù)據(jù)加工商的名稱規(guī)范要求,還需進(jìn)一步探討。
(1)CIP數(shù)據(jù)格式與編目數(shù)據(jù)完全不共享。數(shù)據(jù)的共享性由數(shù)據(jù)的標(biāo)準(zhǔn)化程度決定,數(shù)據(jù)標(biāo)準(zhǔn)化程度越高,共享性越高。CIP數(shù)據(jù)、國圖數(shù)據(jù)、CALIS數(shù)據(jù)采用不同格式,著錄與標(biāo)引項目也不同。傳統(tǒng)CIP數(shù)據(jù)格式,用戶只能查詢?yōu)g覽不能下載。2014年實施的CNOIX規(guī)定了圖書產(chǎn)品信息的XML技術(shù)規(guī)則、格式規(guī)范和代碼表等,著錄與標(biāo)引字段較傳統(tǒng)CIP數(shù)據(jù)格式下要更全面。但不論是傳統(tǒng)格式還是數(shù)字格式,CIP數(shù)據(jù)格式與下游環(huán)節(jié)目前采用的MARC數(shù)據(jù)格式完全不同,沒有提供數(shù)據(jù)生產(chǎn)方與流通各相關(guān)方的數(shù)據(jù)交換渠道,圖書產(chǎn)業(yè)鏈上下游共享數(shù)據(jù)的目標(biāo)仍未達(dá)成。也就是圖書流通環(huán)節(jié)的兩種數(shù)據(jù)與CIP數(shù)據(jù)均不具備繼承性。
(2)國圖數(shù)據(jù)與CALIS數(shù)據(jù)間沒有直接的數(shù)據(jù)交換與交流。流通環(huán)節(jié)的國圖數(shù)據(jù)標(biāo)準(zhǔn)與CALIS數(shù)據(jù)標(biāo)準(zhǔn)都以ISBD為依據(jù),且都有改進(jìn)。國圖標(biāo)準(zhǔn)更強(qiáng)調(diào)中國特色,CALIS標(biāo)準(zhǔn)更注重接近國際標(biāo)準(zhǔn)。不論這兩種不同的傾向有怎樣深厚的淵源,都造成依據(jù)它們生成的書目數(shù)據(jù)不利于共享與交換的現(xiàn)實局面。具體而言,二者在字段必備性上要求不同,在各字段的著錄標(biāo)引要求上也存在差異,這些造成流通環(huán)節(jié)書目數(shù)據(jù)的共享性差。
(3)數(shù)據(jù)的國際交換與共享問題。CIP數(shù)據(jù)標(biāo)準(zhǔn)與《普通圖書著錄規(guī)則》國家標(biāo)準(zhǔn)保持一致,不采用任何國際標(biāo)準(zhǔn),基本沒有國際共享的可通用性。新的XML標(biāo)準(zhǔn)有望實現(xiàn)國際共享,但其在國內(nèi)出版界仍未推行,對于國際共享仍很遙遠(yuǎn)。編目數(shù)據(jù)按ISBD制定規(guī)則,其國際共享可能性更高。就目前來看,國圖數(shù)據(jù)沒有與國際合作的協(xié)議,CALIS有協(xié)議但數(shù)據(jù)交換并不頻繁。
圖書全產(chǎn)業(yè)鏈上書目數(shù)據(jù)質(zhì)量問題形成的主要原因,在于數(shù)據(jù)制作流程上各環(huán)節(jié)銜接不暢。CIP數(shù)據(jù)由版本圖書館制作,編目數(shù)據(jù)由圖書流通環(huán)節(jié)的兩大圖書館系統(tǒng)分別制定編目細(xì)則進(jìn)行,且相互間沒有正式的數(shù)據(jù)交換渠道。
從數(shù)據(jù)制作流程可以看出,數(shù)據(jù)制作各環(huán)節(jié)都缺少嚴(yán)格的質(zhì)量監(jiān)控。
(1)CIP書目數(shù)據(jù)制作的缺點(diǎn)。生成于圖書發(fā)行環(huán)節(jié)前,CIP數(shù)據(jù)制作受限于出版社提供的信息,這些信息既無作者參與,也沒有專業(yè)的編目人員參與。版本圖書館編目人員只能根據(jù)這些信息給出CIP數(shù)據(jù)。既無核校流程,也無核??赡?,更沒有數(shù)據(jù)質(zhì)量審核。CIP數(shù)據(jù)本身對數(shù)據(jù)的完整性要求低,因此數(shù)據(jù)的準(zhǔn)確性與完整性均不能滿足用戶使用需求。
(2)編目數(shù)據(jù)制作的缺點(diǎn)。由于參與編目數(shù)據(jù)制作人員多,對圖書內(nèi)容理解的不同,以及各館編目時“從舊從錯”傳統(tǒng)等因素影響,同一種書可以有多條編目數(shù)據(jù)。另外由于各聯(lián)編中心對于同一種書的編目數(shù)據(jù)設(shè)置了不同的詳略等級,所以同一種書可以有不同詳略等級的多條數(shù)據(jù),這就更增加了同一種書多條編目數(shù)據(jù)的情況。幾千個圖書館編制的上千萬條書目記錄,實際反映的中文圖書只有100多萬種[5]。而國圖數(shù)據(jù)與CALIS數(shù)據(jù)實行系統(tǒng)內(nèi)共建共享,即由系統(tǒng)內(nèi)有資質(zhì)的編目員上傳數(shù)據(jù),然后由中心人員按不同情況進(jìn)行抽查式審核而非全部審核。
不同標(biāo)準(zhǔn)存在于不同書目數(shù)據(jù)的制作環(huán)節(jié),造成社會資源浪費(fèi)。當(dāng)前在圖書生產(chǎn)環(huán)節(jié)采用CIP標(biāo)準(zhǔn)制作書目數(shù)據(jù),在流通環(huán)節(jié)又采用2個標(biāo)準(zhǔn)制作書目數(shù)據(jù)。而流通環(huán)節(jié)這2個標(biāo)準(zhǔn),對于CIP數(shù)據(jù)的依賴性都不高,進(jìn)一步造成3個標(biāo)準(zhǔn)各行其是的現(xiàn)狀。CIP數(shù)據(jù)、國圖數(shù)據(jù)、CALIS數(shù)據(jù)各自為政,浪費(fèi)了大量的社會資源,數(shù)據(jù)質(zhì)量參差不齊。對此,應(yīng)該謀求將3個數(shù)據(jù)整合起來的途徑,并協(xié)調(diào)數(shù)據(jù)建設(shè)與使用各方的利益,保障數(shù)據(jù)建設(shè)方權(quán)益,促進(jìn)數(shù)據(jù)生產(chǎn)與使用的良性運(yùn)行。
遵循一種圖書應(yīng)該只有一條權(quán)威且全面的標(biāo)準(zhǔn)書目數(shù)據(jù)的原則,應(yīng)將現(xiàn)有的3個數(shù)據(jù)制作主體及其使用的標(biāo)準(zhǔn)進(jìn)行整合,保證完整級數(shù)據(jù)的唯一性。
(1)平衡各方利益,推行書目數(shù)據(jù)共建共享。對于全部由版本圖書館完成數(shù)據(jù)制作中力量不足的實際問題,可以借鑒現(xiàn)行編目數(shù)據(jù)的共建共享思路,進(jìn)行各方權(quán)益協(xié)調(diào),實現(xiàn)數(shù)據(jù)建設(shè)的共建共享。①對數(shù)據(jù)實行有償使用。具體來說,作為目前CIP數(shù)據(jù)制作的主力機(jī)構(gòu),成為一級數(shù)據(jù)中心,版本圖書館應(yīng)角色轉(zhuǎn)換為書目數(shù)據(jù)的管理機(jī)構(gòu)。②在機(jī)構(gòu)內(nèi)建立數(shù)據(jù)建設(shè)聯(lián)盟。聯(lián)盟內(nèi)按各館特色,將書目數(shù)據(jù)制作任務(wù)進(jìn)行分配,由專業(yè)的館來做專業(yè)的書目數(shù)據(jù)。在制度上,可以增加出版社的呈繳本冊數(shù),其中一本歸數(shù)據(jù)制作承擔(dān)機(jī)構(gòu);在數(shù)據(jù)的使用上,對參與書目制作的機(jī)構(gòu)有優(yōu)惠使用規(guī)定。這樣,才能既發(fā)揮現(xiàn)有編目人才優(yōu)勢,解決數(shù)據(jù)制作中的實際問題;又能通過聯(lián)盟力量,保障數(shù)據(jù)質(zhì)量;還可以通過有償使用,保障數(shù)據(jù)良性使用。
(2)改進(jìn)數(shù)據(jù)制作,使數(shù)據(jù)上下游一體化。國家新聞出版廣電總局規(guī)定,現(xiàn)有CIP依據(jù)《普通圖書著錄規(guī)則》《文獻(xiàn)敘詞標(biāo)引規(guī)則》《中國圖書館圖書分類法》和《漢語主題詞表》對圖書進(jìn)行著錄、分類標(biāo)引、主題標(biāo)引[10]。實際工作中,由中國版本圖書館承擔(dān)的數(shù)據(jù)制作在分類與主題標(biāo)引上嚴(yán)格遵循這一要求,但由于“手中無書”,僅根據(jù)出版社提交的工作單制作數(shù)據(jù),顯然不能做到完整、準(zhǔn)確。為保證圖書付印時版權(quán)頁數(shù)據(jù)準(zhǔn)確,又保證使數(shù)據(jù)實現(xiàn)上下游一體化,出版應(yīng)在提交工作單時請作者對內(nèi)容提要項把關(guān),提供該書的自由主題詞,并在申請制作數(shù)據(jù)時提交預(yù)印本。這樣數(shù)據(jù)制作人員“有書在手”,有作者對內(nèi)容提要與圖書主題的認(rèn)可,就可以對圖書做更完整、準(zhǔn)確的揭示。數(shù)據(jù)應(yīng)盡可能做成完整級數(shù)據(jù),方便下游使用者根據(jù)需要做減法而不是加法,這樣可以最大程度地保證數(shù)據(jù)的標(biāo)準(zhǔn)化,有利于數(shù)據(jù)交換。
目前,CIP數(shù)據(jù)發(fā)布在中國版本圖書館主頁能以CIP核字號查詢,但傳統(tǒng)CIP發(fā)布后只提供打印格式與書目詳細(xì)2種閱覽格式,不提供數(shù)據(jù)下載。其館藏資源查詢只能對上一年1月1日至當(dāng)前日期的數(shù)據(jù)進(jìn)行查詢[11]。2014年起實施的CNOIX標(biāo)準(zhǔn),將傳統(tǒng)CIP表達(dá)升級為XML格式,且項目更豐富,在打通上下游數(shù)據(jù)共享環(huán)節(jié)上邁出了一大步。
構(gòu)建一級數(shù)據(jù)中心與各二級數(shù)據(jù)中心(指為行業(yè)資源交流與管理為主要職能的國圖聯(lián)合目錄中心、CALIS聯(lián)合目錄中心)之間以及數(shù)據(jù)中心與書商的數(shù)據(jù)傳送通道是經(jīng)濟(jì)高效的數(shù)據(jù)共享方式。數(shù)據(jù)中心將已發(fā)行圖書的數(shù)據(jù)向國圖聯(lián)合目錄中心、CALIS聯(lián)合目錄中心開放,各圖書館從各自所屬的聯(lián)合目錄中心下載書目數(shù)據(jù),進(jìn)行個性化處理,導(dǎo)入OPAC系統(tǒng),方便本館資源管理與用戶檢索。各館在下載數(shù)據(jù)的同時,提交本館館藏信息,即可在聯(lián)合目錄中心體現(xiàn)。這樣,既保證了數(shù)據(jù)統(tǒng)一性,也不影響各聯(lián)合目錄中心的資源共享。數(shù)據(jù)中心同時將待發(fā)行圖書書目信息向書商開放,書商可為用戶提供更準(zhǔn)確的訂購依據(jù)。
國圖聯(lián)合目錄中心、CALIS聯(lián)合目錄中心從一級數(shù)據(jù)中心下載數(shù)據(jù)的費(fèi)用實行中心先行支付,再與成員館約定結(jié)算的方式進(jìn)行。書商下載數(shù)據(jù)直接與一級數(shù)據(jù)中心結(jié)算。一級數(shù)據(jù)中心將收到的數(shù)據(jù)下載費(fèi)與出版社按約定結(jié)算。這樣,出版發(fā)行部門、書目控制部門都能從數(shù)據(jù)中獲益,有利于提高數(shù)據(jù)質(zhì)量。
從世界范圍的實踐來看,為全部著者建立規(guī)范形式的趨勢并不樂觀。這個狀況的形成,一是理論上存在必要性爭議,二是現(xiàn)實中存在可能性障礙。理論上的必要性爭議主要是指對于所有著者建立規(guī)范名稱的現(xiàn)實意義是否足夠大;現(xiàn)實中存在的可能性障礙是區(qū)分難度與成本太大,而使用價值太小。
從源頭統(tǒng)一制作書目數(shù)據(jù)、構(gòu)建現(xiàn)有3個數(shù)據(jù)中心及其他各相關(guān)方數(shù)據(jù)通道實現(xiàn)的基礎(chǔ)上,名稱規(guī)范工作的現(xiàn)實意義與使用價值得到了增強(qiáng)。統(tǒng)一規(guī)則,通過共建共享的機(jī)制建設(shè)名稱規(guī)范庫,并將名稱規(guī)范文檔與書目文檔建立連接,形成規(guī)范系統(tǒng),將進(jìn)一步提高標(biāo)準(zhǔn)化書目數(shù)據(jù)的檢索效率。在統(tǒng)一規(guī)則下整合現(xiàn)有規(guī)范成果是最可行的方法。名稱規(guī)范庫建設(shè)中,可通過利用維基百科條目的豐富信息來補(bǔ)充完善當(dāng)前中文名稱規(guī)范文檔附加信息不足、名稱難以準(zhǔn)確區(qū)分的問題[11],可通過實現(xiàn)“海峽兩岸暨香港”在中文名稱規(guī)范方面的合作[12],謀求中文名稱規(guī)范文檔與虛擬國際規(guī)范文檔的共享[13]途徑,逐步完善名稱規(guī)范庫。
[1] 王洋. 全國圖書館聯(lián)合編目中心2017—2018年度工作報告[EB/OL].[2018-09-23]. http://olcc.nlc.cn/index.php/page/document.html.
[2] 全國圖書館聯(lián)合編目中心[EB/OL].[2018-05-03]. http://olcc.nlc.cn/index.php/page/document.html.
[3] 中華人民共和國國家質(zhì)量監(jiān)督檢驗檢疫總局,中國國家標(biāo)準(zhǔn)化管理委員會. 中國出版物在線信息交換圖書產(chǎn)品信息格式:GB/T 30330—2013[S]. 北京:中國標(biāo)準(zhǔn)出版社,2014.
[4] CALIS中文圖書編目業(yè)務(wù)培訓(xùn)教材[Z]. 北京:CALIS聯(lián)機(jī)合作編目中心,2011.
[5] 陳源蒸. 中文圖書ECIP與自動編目手冊[M]. 北京:書目文獻(xiàn)出版社,2003:26
[6] 關(guān)于繼續(xù)加強(qiáng)CIP工作,進(jìn)一步提高數(shù)據(jù)質(zhì)量的函[EB/OL].(2011-04-02)[2018-10-01]. https://www.capub.cn/zbbm/xgwj/04/1124.shtml.
[7] 劉小玲. 數(shù)據(jù)質(zhì)量分析報告[EB/OL].[2018-06-21]. http://olcc.nlc.cn/index.php/page/document.html.
[8] ANDERSON D. Universal Bibliogaphic Control;A Long Term Policy,a Plan for Action[M]. Pullach/MUnchen:Ver-lag Dokumentation,1974:47.
[9] 王彥僑,王廣平. 中文名稱規(guī)范數(shù)據(jù)的維護(hù)與整合[J]. 圖書館雜志,2017,37(2):56-59.
[10] 為什么要指定CIP數(shù)據(jù)的專門制作單位?[EB/OL].[2018-04-29]. https://www.capub.cn/zbbm/ywjd/04/1126.shtml.
[11] 中國版本圖書館(中央宣傳部出版物數(shù)據(jù)中心)[EB/OL].[2018-04-29]. https://www.capub.cn/sjjs/index.shtml.
[12] 賈君枝,薛秋紅. 中文人名名稱規(guī)范檔與維基百科的鏈接[J]. 圖書情報工作,2015,59(16):129-134.
[13] 賈君枝,石燕青. 中文名稱規(guī)范文檔與虛擬國際規(guī)范文檔的共享問題研究[J]. 中國圖書館黨學(xué)報,2014(6):83-92.
Bibliographic Data Analysis from the Perspective of Data Production
YUAN XiaoLing
( Library of Taiyuan Science and Technology University, Taiyuan 030024, China )
There are problems in the data completeness, accuracy and accessibility of Chinese book bibliographic data. The main reason for this is that different standards are used by multiple agencies. To establish a nationwide unified bibliographic data based on CIP, to establish data channels between publishing houses and downstream, and to pay attention to the construction and promotion of the name specification base, can not only make easier for data exchange and sharing, but also can greatly save social costs. It can also truly reflect the relationship between the volume of publications and the library’s collections.
Chinese Book; Bibliographic Data; Data Quality
G254
10.3772/j.issn.1673-2286.2018.11.005
(2018-10-14)
原小玲,女,1972年生,碩士研究生,副研究館員,研究方向:信息組織與社會信息化,E-mail:TYYUAN9333@163.com。
*本研究得到國家社會科學(xué)基金重點(diǎn)項目“基于關(guān)聯(lián)數(shù)據(jù)的中文名稱規(guī)范檔語義描述及數(shù)據(jù)聚合研究”(編號:15ATQ004)資助。