孫明
吉林鐵道職業(yè)技術(shù)學(xué)院于2013年8月搬遷到新校區(qū),原來(lái)東、西兩個(gè)校區(qū)圖書館隨之合并為一個(gè)圖書館,對(duì)兩個(gè)校區(qū)的書目數(shù)據(jù)進(jìn)行整合、歸并是兩個(gè)圖書館合并過(guò)程中的一項(xiàng)重要工作,也是圖書館實(shí)現(xiàn)自動(dòng)化、網(wǎng)絡(luò)化的重要前提和保證。2014年5月,我館書目數(shù)據(jù)庫(kù)成功合并,實(shí)現(xiàn)“一卡通”大流通借閱,充分發(fā)揮了圖書館的功能,為教學(xué)、科研的快速發(fā)展提供了較好的保障。本文以我校兩校區(qū)圖書館書目數(shù)據(jù)庫(kù)合并為例,對(duì)圖書館書目數(shù)據(jù)庫(kù)整合工作做一簡(jiǎn)析。
一、目前書目數(shù)據(jù)的實(shí)際情況
我館原來(lái)使用北京丹誠(chéng)軟件有限責(zé)任公司Data-Trans
-1000圖書館集成系統(tǒng),目前的書目數(shù)據(jù)經(jīng)過(guò)仔細(xì)對(duì)比分析,狀況如下:目前東校區(qū)數(shù)據(jù)40908條,西校區(qū)數(shù)71296條;分編曾經(jīng)使用過(guò)《中圖法》第三、第四、第五版;著錄項(xiàng)不是很完整,早期的數(shù)據(jù)有缺少主題的情況;索書號(hào)有極少一部分相同的;同一本書有不同的分類號(hào),數(shù)量不多;東校區(qū)數(shù)據(jù)條碼號(hào)重復(fù)一共6910條,已經(jīng)修改完成;有少部分?jǐn)?shù)據(jù)存在財(cái)產(chǎn)號(hào)和條碼號(hào)相同問(wèn)題;有少部分?jǐn)?shù)據(jù),索書號(hào)相同,但是書是不同的;還有的數(shù)據(jù),書是相同的,但是索書號(hào)不一致。學(xué)院圖書館經(jīng)過(guò)近三十年的發(fā)展,書目數(shù)據(jù)最終形成經(jīng)過(guò)多個(gè)發(fā)展階段,這里面的書目數(shù)據(jù)包含圖書館編目人員自己做的數(shù)據(jù),同時(shí)也包含外包工作人員的編目數(shù)據(jù),合并后編目數(shù)據(jù)的質(zhì)量對(duì)于圖書館文獻(xiàn)資源建設(shè)意義重大,直接影響到圖書館的信息服務(wù)能力,書目數(shù)據(jù)清理與合并是圖書館自動(dòng)化編目工作的組成部分,也是書目數(shù)據(jù)庫(kù)建設(shè)必須面對(duì)的問(wèn)題之一。
二、書目數(shù)據(jù)不規(guī)范的原因分析
造成書目數(shù)據(jù)重復(fù)的原因復(fù)雜多樣,主要有以下幾點(diǎn):(1)當(dāng)需要將原來(lái)不同書目格式、不同系統(tǒng)、不同運(yùn)行方式的數(shù)據(jù)庫(kù)整合成為一個(gè)新的文獻(xiàn)系統(tǒng)服務(wù)平臺(tái)時(shí),原始書目數(shù)據(jù)的合并必然伴隨著一定數(shù)量的重復(fù)數(shù)據(jù)產(chǎn)生,書目數(shù)據(jù)整合與清理的需求也就隨之產(chǎn)生。(2)在建立聯(lián)合目錄數(shù)據(jù)庫(kù)中,尤其是初裝來(lái)自不同校區(qū)的書目數(shù)據(jù)時(shí),一定會(huì)產(chǎn)生與第一種情況相似的狀況。如果聯(lián)合目錄的數(shù)據(jù)生成單 位為性質(zhì)相同的機(jī)構(gòu)且為多家時(shí),則重復(fù)數(shù)據(jù)的情況會(huì)更為嚴(yán)重,迫切需要對(duì)書目數(shù)據(jù)進(jìn)行清理和合并。(3)編目人員操作失誤造成重復(fù)記錄的產(chǎn)生,例如查重工作不到位、打字輸入錯(cuò)誤、操作規(guī)則或者標(biāo)準(zhǔn)不一致 (如輸入狀態(tài)全角與半角之分)、工作粗心大意不認(rèn)真細(xì)致等原因。這類情況在聯(lián)機(jī)合作編目中非常常見(jiàn),相當(dāng)多的重復(fù)記錄是因?yàn)檫@種情況造成的。(4)在編目工作的實(shí)際工作中,不同的編目工作人員對(duì)編目規(guī)則和標(biāo)準(zhǔn)的理解存在正常的差異,勢(shì)必造成在書目著錄理解上的不一致而出現(xiàn)重復(fù)記錄。最常見(jiàn)的現(xiàn)象是不同的編目人員做同種書的原始編目,經(jīng)常會(huì)有不同的著錄內(nèi)容。這種情況在聯(lián)機(jī)合作編目中更為突出。(5)一個(gè)圖書館內(nèi),采訪訂購(gòu)數(shù)據(jù)與分類編目數(shù)據(jù)、外來(lái)數(shù)據(jù)源數(shù)據(jù)與本地系統(tǒng)數(shù)據(jù)都會(huì)因各種原因造成不一致,由于原來(lái)采用的圖書管理軟件功能模塊與圖書館業(yè)務(wù)結(jié)合不是十分緊密,軟件系統(tǒng)對(duì)于有些工作的流程和順序控制不是十分嚴(yán)格。例如采訪、編目工作流程設(shè)計(jì)不甚合理、各工作環(huán)節(jié)銜接處理不當(dāng)、數(shù)據(jù)審校不嚴(yán)密等情況而出現(xiàn)重復(fù)和垃圾數(shù)據(jù)。實(shí)際上,產(chǎn)生重復(fù)記錄和垃圾數(shù)據(jù)的原因遠(yuǎn)不止上述幾種情況,只是這幾種較為常見(jiàn)而已。由于書目數(shù)據(jù)合并最后的需求各不相同,合并的方法也因此而異。
三、書目數(shù)據(jù)合并的主要方法及采取的措施
(1)徹底法。即以藏書量多、數(shù)據(jù)質(zhì)量較高的一個(gè)圖書館為基本館,這個(gè)數(shù)據(jù)保持不動(dòng),對(duì)其它館的書進(jìn)行重新加工,包括書目數(shù)據(jù)的歸并、修改、增加,重貼圖書書標(biāo)、條碼,重新排架等。這種方法適合于合并各館中有一個(gè)可作為中心館的大館,而其他館的數(shù)據(jù)量均較少的情況。這樣做的好處是所有編目規(guī)則均以中心館為基準(zhǔn),技術(shù)實(shí)現(xiàn)上較簡(jiǎn)單,合并后無(wú)重復(fù)數(shù)據(jù),便于統(tǒng)一管理、調(diào)配。缺點(diǎn)是工作量偏大,要進(jìn)行大量重復(fù)性的回溯建庫(kù)工作,在短時(shí)間內(nèi)難以完成合并工作,因此很多合并的高校圖書館并未采用這種做法。(2)權(quán)宜法。將合并前的圖書及數(shù)據(jù)保持不動(dòng),尋找一條能直接合并數(shù)據(jù)而不影響編目、流通、檢索等各項(xiàng)業(yè)務(wù)功能使用的捷徑。這種方法的優(yōu)點(diǎn)是能避免二次回溯建庫(kù)帶來(lái)的一系列的繁雜工作,節(jié)省大量的人力物力,既能在較短時(shí)間內(nèi)完成合并任務(wù),又能較好地滿足實(shí)際工作的需要。合并后待時(shí)機(jī)成熟可對(duì)舊數(shù)據(jù)進(jìn)行適當(dāng)?shù)恼?,或者長(zhǎng)期維持現(xiàn)狀,若干年后等舊書被逐步剔除,館藏書目也就自然過(guò)渡到以合并后的新數(shù)據(jù)為主。缺點(diǎn)是存在一定的重復(fù)數(shù)據(jù),書目統(tǒng)計(jì)會(huì)出現(xiàn)一些問(wèn)題,技術(shù)上有一定難度,并且在數(shù)據(jù)合并過(guò)程中要解決所遇到的各種問(wèn)題。根據(jù)我院圖書館書目數(shù)據(jù)的實(shí)際情況,在新舊圖書管理系統(tǒng)切換之前,主要采取了如下一些措施:(1)提前催還圖書,盡量保證圖書全部在館,為判別書目重復(fù)記錄做好準(zhǔn)備。(2)新、舊圖書管理系統(tǒng)同時(shí)運(yùn)行一段時(shí)間。這樣做一方面是為了發(fā)現(xiàn)書目數(shù)據(jù)問(wèn)題后,在處理的過(guò)程中能夠有所參考,原有服務(wù)器數(shù)據(jù)的書目數(shù)據(jù)備份是解決這個(gè)問(wèn)題的重要保證,另外一方面也是為了保證圖書借還的暢通。(3)修改重復(fù)書目記錄。在運(yùn)行新的圖書管理系統(tǒng)之前,對(duì)判斷為重復(fù)的書目記錄進(jìn)行修改。為了確保合并后各項(xiàng)業(yè)務(wù)工作的順利開(kāi)展,更好地實(shí)現(xiàn)合并后圖書館資源的規(guī)范統(tǒng)一,必須統(tǒng)一系統(tǒng)軟件。系統(tǒng)的選擇主要應(yīng)考慮以下幾個(gè)方面:①先進(jìn)性(包括使用的數(shù)據(jù)庫(kù)平臺(tái)、操作系統(tǒng)、開(kāi)發(fā)工具及編程語(yǔ)言等);②成熟性(系統(tǒng)的運(yùn)行穩(wěn)定性);④升級(jí)與售后服務(wù);③允許的并發(fā)用戶數(shù);⑤多數(shù)圖書館使用后的反饋情況;⑥經(jīng)濟(jì)性。綜合考慮以上各個(gè)因素,我館最后選用“匯文文獻(xiàn)信息服務(wù)系統(tǒng)”,采取了多種措施相結(jié)合的方法,實(shí)現(xiàn)了數(shù)據(jù)庫(kù)的成功合并和新系統(tǒng)的穩(wěn)定運(yùn)行。
書目數(shù)據(jù)記錄的整理與歸并是一個(gè)繁雜的系統(tǒng)工程,需要統(tǒng)籌計(jì)劃和周密安排,涉及圖書館多個(gè)部門的業(yè)務(wù)范圍,遠(yuǎn)非一個(gè)編目部門能夠獨(dú)立解決,這項(xiàng)工作尤其需要計(jì)算機(jī)自動(dòng)化技術(shù)部門密切配合,才能順利完成。