胡建峰
(衢州市圖書館,浙江 衢州 324000)
〔作者信息〕胡建峰,男,信息技術(shù)部副主任,館員。
地方文獻(xiàn)數(shù)據(jù)庫是圖書館為科研、生產(chǎn)活動(dòng)提供信息服務(wù)的重要情報(bào)源,它匯集了特定地方的政治經(jīng)濟(jì)、文化教育、歷史地理等各方面的文獻(xiàn)資料,向讀者提供地方文獻(xiàn)的全文信息或檢索線索。近年來,各地方圖書館都在積極開展地方文獻(xiàn)數(shù)據(jù)庫的建設(shè)工作,衢州市有關(guān)部門和圖書界的同仁們都十分重視,市圖書館、各縣圖書館等都在這方面做了不少的工作。但是,由于各個(gè)單位在文獻(xiàn)收集和管理上各自為政,缺乏宏觀調(diào)控,造成衢州地方文獻(xiàn)在建設(shè)上還缺乏整體性和規(guī)劃性,在利用上不能實(shí)現(xiàn)資源共享,在文獻(xiàn)的管理和揭示上更是缺乏規(guī)范性和系統(tǒng)性。為此,建立以網(wǎng)絡(luò)為基礎(chǔ)條件的地方文獻(xiàn)數(shù)據(jù)庫,為挖掘和利用地方文獻(xiàn)資源提供一個(gè)共建共享的大平臺(tái),對(duì)于推動(dòng)衢州經(jīng)濟(jì)文化建設(shè)和對(duì)外開放都具有積極的意義,也是衢州圖書信息服務(wù)科研工作中的一項(xiàng)基礎(chǔ)工程。
幾年來,衢州市圖書館充分利用報(bào)紙、廣播、電視等媒體,廣泛宣傳圖書館地方文獻(xiàn)工作的重要意義和地方文獻(xiàn)呈繳本制度。注意發(fā)揮地緣優(yōu)勢(shì),廣泛向全國各地衢州籍專家學(xué)者寄發(fā)征集函。與此同時(shí),又注意加強(qiáng)與各級(jí)黨史辦、方志辦、地名辦、政協(xié)文史委、統(tǒng)計(jì)局、社科聯(lián)、文聯(lián)、科協(xié)等有關(guān)部門的溝通交流,努力構(gòu)建文獻(xiàn)征集網(wǎng)絡(luò)。
據(jù)統(tǒng)計(jì),市館地方文獻(xiàn)藏有 8613種,14326冊(cè)。其中,各種地方志、專業(yè)志 115種 232冊(cè),地方年鑒 37種 72冊(cè),地方黨史、組織史 95種 219冊(cè),地方史料 197種、451冊(cè),府、縣古地圖 30幅。通過重點(diǎn)征集與長期掛鉤征集相結(jié)合,收集各種報(bào)刊 76種 823冊(cè);通過服務(wù)征集與追蹤征集結(jié)合,從《四庫全書》中查找復(fù)制宋代程俱的《北山小集》40卷、《麟臺(tái)故事》5卷;元代吾丘衍的《周秦刻石釋音》、《學(xué)古編》、《閑居錄》各 1卷,以及《竹素山房詩集》3卷;衢州歷代名人中,衢籍作者的傳世佳作錄入《四庫全書》的有 43人,61種 594卷。通過剪報(bào)輯錄的《三衢兒女》專題人物 225位,為衢州名人專題數(shù)據(jù)庫的建立奠定了基礎(chǔ)。
通過抽樣調(diào)查的方式對(duì)部分文獻(xiàn)收藏單位進(jìn)行地方文獻(xiàn)收藏情況調(diào)研,基本情況歸納為以下幾個(gè)方面:
衢州地方文獻(xiàn)的蘊(yùn)藏量非常豐富,但收集工作呈分散性和多樣性。如開化縣圖書館歷來非常重視地方文獻(xiàn)工作,但是只針對(duì)開化境內(nèi)的文獻(xiàn)收藏,而衢州市圖書館主要負(fù)責(zé)對(duì)全市文獻(xiàn)的收藏,部門之間的重復(fù)工作造成了資源浪費(fèi);另外,圖書館、檔案館、地方志辦公室等多家之間缺少主動(dòng)合作和有效的管理機(jī)制,出現(xiàn)有些文獻(xiàn)缺藏的狀況,使得整個(gè)地區(qū)的文獻(xiàn)建設(shè)缺乏完整性和系統(tǒng)性。
一方面是因?yàn)閷?duì)地方文獻(xiàn)的收集范圍在概念上缺乏統(tǒng)一的認(rèn)識(shí),另一方面各收藏部門受自身人力、物力和技術(shù)條件的限制,對(duì)一部分學(xué)術(shù)研究型的文獻(xiàn)的收集,衢州地區(qū)幾乎處于空白狀態(tài)。如發(fā)表在學(xué)術(shù)期刊上的學(xué)術(shù)論文、專業(yè)性學(xué)術(shù)會(huì)議論文和一些特種文獻(xiàn)。而這些文獻(xiàn)能在很大程度上反映出本地區(qū)的經(jīng)濟(jì)、科技和文化的發(fā)展,對(duì)地方建設(shè)有很重要的指導(dǎo)意義。
首先,地方文獻(xiàn)的各個(gè)收藏部門基本上采用手工為主的低層次的加工處理方法,作為信息產(chǎn)品只能在局部范圍內(nèi)利用;其次,對(duì)文獻(xiàn)開發(fā)的隨意性較普遍,而且,文獻(xiàn)著錄不規(guī)范、標(biāo)準(zhǔn)不統(tǒng)一,難以適應(yīng)數(shù)字化和網(wǎng)絡(luò)化發(fā)展的需求,使得地方文獻(xiàn)無法實(shí)現(xiàn)網(wǎng)絡(luò)化的共享;再者,整個(gè)衢州地區(qū)地方文獻(xiàn)收藏單位因功能和職責(zé)不同,給利用帶來很大的不便。如文保部門主要是以保存為目的,一般不作為信息提供需求者使用,同時(shí)從文物保護(hù)的角度考慮還要盡量降低使用頻率。盡管如此,這部分文獻(xiàn)會(huì)因保存時(shí)間過長而逐漸毀壞。
數(shù)據(jù)庫建設(shè)是運(yùn)用高速發(fā)展的計(jì)算機(jī)、網(wǎng)絡(luò)、影像描述技術(shù),把存放在庫房里的各種地方文獻(xiàn)變?yōu)楸阌诖娣偶安榭吹碾娮游墨I(xiàn),并存入大型數(shù)據(jù)庫,建立網(wǎng)絡(luò)圖像管理系統(tǒng)。目的是提供豐富的信息資源實(shí)現(xiàn)資源共享,尤其是在網(wǎng)絡(luò)環(huán)境下必須要求擁有完善的、結(jié)構(gòu)合理的檢索功能體系。根據(jù)地方文獻(xiàn)數(shù)據(jù)庫建設(shè)的要求,信息存儲(chǔ)一般需要具有以下特點(diǎn):
①系統(tǒng)能完全兼容CDS/ISIS、ISTIC/ISIS、QuickIMS的數(shù)據(jù)及其功能;
②界面標(biāo)準(zhǔn)化,和其它數(shù)據(jù)庫產(chǎn)品在界面上保持風(fēng)格一致,提供數(shù)據(jù)庫桌面管理工具的全部數(shù)據(jù)維護(hù)管理功能;
③用戶可在本地建立自己的 R M S數(shù)據(jù)庫,包括數(shù)據(jù)庫的定義、數(shù)據(jù)維護(hù)(可定制數(shù)據(jù)維護(hù)格式)、索引維護(hù)、檢索、排序、分類和統(tǒng)計(jì)報(bào)表等;支持用戶自定義報(bào)表、統(tǒng)計(jì)分析、分類檢索、邏輯子庫等功能;
④可完成MARC、ISO-2709、XML等格式的數(shù)據(jù)交換功能, 可將任意格式的關(guān)系數(shù)據(jù)庫導(dǎo)入本系統(tǒng);
⑤支持基于字典的標(biāo)準(zhǔn)數(shù)據(jù)維護(hù)和記錄間的數(shù)據(jù)復(fù)制和拷貝,在系統(tǒng)數(shù)據(jù)維護(hù)方面,支持?jǐn)?shù)據(jù)字段的缺省值維護(hù),支持表格式維護(hù)和用戶自定義格式維護(hù),簡單易用;
⑥全面支持子字段、重復(fù)字段和外部文件、多媒體等對(duì)象數(shù)據(jù)處理;支持基于詞表的自動(dòng)標(biāo)引,支持大小寫敏感標(biāo)引和檢索;支持字段檢索、自然語言搜索等全文內(nèi)容的搜索和結(jié)果排序輸出;
⑦可同時(shí)管理本地的遠(yuǎn)程授權(quán)資源庫;系統(tǒng)支持?jǐn)?shù)據(jù)庫的基于日志的數(shù)據(jù)備份與恢復(fù)功能。
2.2.1 信息資源目錄體系的建設(shè)
為了便于信息資源的采集、處理和利用,必須對(duì)浩瀚的信息進(jìn)行合理的分類,目錄體系是在合理的信息分級(jí)、分類基礎(chǔ)上,將所有業(yè)務(wù)工作所需的信息資源編制一個(gè)統(tǒng)一的目錄。通過目錄服務(wù)使信息資源的使用者、維護(hù)者方便地按照目錄和索引的導(dǎo)航進(jìn)行工作。信息資源目錄體系是全面整合信息資源的先決條件,也為未來的統(tǒng)一信息服務(wù)平臺(tái)的建設(shè)奠定基礎(chǔ)。
2.2.2 建設(shè)信息資源數(shù)據(jù)庫平臺(tái)
全面整合信息資源采集渠道、信息內(nèi)容,建設(shè)圖書館信息資源特色數(shù)據(jù)庫平臺(tái)。將現(xiàn)有的地方特色文獻(xiàn)進(jìn)行數(shù)字化加工,形成可以直接利用的電子文獻(xiàn),并借助平臺(tái)的便捷性為讀者提供資源的查詢利用。
2.2.3 建設(shè)統(tǒng)一信息服務(wù)平臺(tái)
整合各種信息資源和業(yè)務(wù)模塊,建設(shè)具有先進(jìn)水平的集信息采集、存儲(chǔ)和服務(wù)于一體的多功能平臺(tái),能夠全天候及時(shí)地為讀者提供信息服務(wù)。
2.2.4 安全保障體系建設(shè)
建立信息安全保障體系框架,逐步完善信息安全管理體制;加強(qiáng)對(duì)信息采集、整合、加工、分析工作的監(jiān)督和審計(jì),保證信息資源的真實(shí)、完整、有效;建設(shè)信息安全分級(jí)體系,滿足不同類型工作人員的不同信息需求;采用身份認(rèn)證、訪問控制、防火墻、數(shù)據(jù)備份等安全防護(hù)技術(shù)措施,確保信息資源和系統(tǒng)安全。
特色數(shù)據(jù)庫系統(tǒng)應(yīng)用平臺(tái)框架分為五層,自下而上分別是:基礎(chǔ)設(shè)施層、系統(tǒng)軟件層、應(yīng)用軟件層、數(shù)據(jù)庫資源層、用戶服務(wù)層。
基礎(chǔ)設(shè)施層:主要由計(jì)算機(jī)、網(wǎng)絡(luò)、存儲(chǔ)系統(tǒng)等組成,是系統(tǒng)運(yùn)行的硬件環(huán)境。
系統(tǒng)軟件層:主要由操作系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)等系統(tǒng)軟件組成。
應(yīng)用軟件層:是管理特色數(shù)據(jù)庫系統(tǒng)工作平臺(tái),主要包括資源加工、資源管理、資源利用、信息檢索、用戶服務(wù)等子系統(tǒng)。
數(shù)據(jù)庫資源層:按信息來源包含 3類數(shù)據(jù)庫:互聯(lián)網(wǎng)數(shù)據(jù)庫、業(yè)務(wù)信息庫、工作資料庫。
用戶服務(wù)層:主要包含導(dǎo)航檢索、跨庫檢索、數(shù)據(jù)挖掘、信息發(fā)布等內(nèi)容。
對(duì)于開展圖書館文獻(xiàn)資料數(shù)字化研究,擬出一條適合的技術(shù)流程,為全面實(shí)現(xiàn)文獻(xiàn)資料管理
掃描子系統(tǒng)的主要流程如圖 1所示:的信息化奠定基礎(chǔ),能有效地整合圖書館各部門的信息資源,使之成為有序的、管理簡便并且完善的資料庫。
數(shù)字加工處理系統(tǒng)可劃分為掃描子系統(tǒng)和標(biāo)引子系統(tǒng)。具體加工流程如下:①把所有紙質(zhì)文獻(xiàn)資料通過掃描形成電子圖像文件,保存一套原始的數(shù)字圖像文件;②對(duì)古籍的電子圖像文件進(jìn)行全文 O C R識(shí)別,形成全文文本數(shù)據(jù),并和圖像文件一起生成雙層 pdf格式文件;③對(duì)期刊的圖像進(jìn)行標(biāo)引取得各自的元數(shù)據(jù),轉(zhuǎn)換成 X M L文件;④將圖像文件、元數(shù)據(jù)及全文文本數(shù)據(jù)整合形成電子文獻(xiàn)資源庫。
圖 1 掃描子系統(tǒng)的流程圖
標(biāo)引子系統(tǒng)的主要流程如圖 2所示:
圖 2 標(biāo)引子系統(tǒng)的流程圖
〔1〕周文.地方文獻(xiàn)數(shù)據(jù)庫的建設(shè)的實(shí)踐與思考[J].內(nèi)蒙古科技與經(jīng)濟(jì),2009(5):152-153
〔2〕尤維玲.我國圖書館的地方文獻(xiàn)工作研究[J].黑龍江科技信息,2008(22):116
〔3〕江濤.淺談我館地方文獻(xiàn)資源建設(shè)[J].貴圖學(xué)刊,2008(2):71-72
〔4〕周欣娟.構(gòu)建萍鄉(xiāng)地區(qū)地方文獻(xiàn)數(shù)據(jù)庫的思考[J].萍鄉(xiāng)高等專科學(xué)校學(xué)報(bào),2003(3)
〔5〕董志珍.關(guān)于衢州圖書館地方文獻(xiàn)工作的思考.圖書館研究與工作,2008(2):69-72