史建忠
摘 要:本文以內(nèi)蒙古財經(jīng)大學(xué)圖書館館藏紙質(zhì)文獻(xiàn)數(shù)字化為例闡述了圖書館館藏紙質(zhì)文獻(xiàn)數(shù)字化的意義,數(shù)字化過程中應(yīng)注意的問題以及數(shù)字化后對本館所將帶來的影響。
關(guān)鍵詞:圖書館;館藏文獻(xiàn);文獻(xiàn)數(shù)字化
館藏紙質(zhì)文獻(xiàn)數(shù)字化是我校圖書館內(nèi)涵改造的一個項目,作為整個項目的具體實施人員,筆者對圖書館館藏數(shù)字化建設(shè)提出了幾點自己的看法。
1 圖書館館藏文獻(xiàn)數(shù)字化的意義
數(shù)字圖書館就是以數(shù)字形式存儲和處理信息的圖書館。館藏文獻(xiàn)數(shù)字化一般有兩個含義:一是圖書館從外部通過電子圖書的購買、網(wǎng)絡(luò)資源的下載等方式獲取數(shù)字化文獻(xiàn)或信息,增強(qiáng)館藏數(shù)字化程度;二是在圖書館內(nèi)部將非數(shù)字化館藏文獻(xiàn)數(shù)字化。在傳統(tǒng)的圖書館中,文獻(xiàn)形式主要是印刷品,工作人員對這些文獻(xiàn)很少加工甚至不做加工,而在數(shù)字圖書館中,館藏文獻(xiàn)通過數(shù)字化這種深度加工,形成了更為有序的信息資源,使文獻(xiàn)的資源價值更加顯著和突出。
1.1 有利于保護(hù)館藏文獻(xiàn)
通過館藏文獻(xiàn)的數(shù)字化可以降低原件丟失和損壞的風(fēng)險。也可以擴(kuò)大原始文獻(xiàn)的利用范圍。
1.2 有利于提高文獻(xiàn)的利用率
館藏文獻(xiàn)數(shù)字化可以滿足用對文獻(xiàn)的多種需求。館藏文獻(xiàn)數(shù)字化后對用戶的存取最為有利,它允許用戶對某些文獻(xiàn)或文獻(xiàn)的某些章節(jié)進(jìn)行快速閱讀,按需瀏覽并保持隨機(jī)存?。凰试S用戶自己查找、檢索、研究與處理資料;它能滿足用戶共享資源與及時存取資料。
1.3 有利于圖書館和用戶的研究工作
圖書館既是一個信息服務(wù)場所,也是一個科學(xué)研究的重要地方。而館藏文獻(xiàn)的數(shù)字化可以產(chǎn)生較原件可靠而功能性更強(qiáng)的數(shù)字資料,這樣就有利于圖書館和用戶從事文獻(xiàn)研究或科學(xué)研究,從而擴(kuò)大研究對象和研究范圍。
1.4 有利于圖書館的科學(xué)管理
館藏文獻(xiàn)數(shù)字化可以提升圖書館的科學(xué)管理的效率和水平,為讀者和用戶提供更好的信息服務(wù)。館藏文獻(xiàn)數(shù)字化拷貝可以支持傳統(tǒng)圖書館的多種需求,為開展特色服務(wù)創(chuàng)造條件;圖書館既能夠用較低的費(fèi)用和風(fēng)險對館藏文獻(xiàn)進(jìn)行拷貝,也可以更有效地開展館際互借等活動。
2 圖書館館藏紙質(zhì)文獻(xiàn)數(shù)字化的基本技術(shù)
2.1 錄入技術(shù)
這是最常見的館藏文獻(xiàn)數(shù)字化的方法和技術(shù),即通過各種錄入方式將書刊轉(zhuǎn)化為文本后,用HTML語言編輯上網(wǎng)。文本格式主要有PDF、TXT、DOC、RTF、WDL、CHM和HTML格式等。
2.2 掃描技術(shù)
這是最常用用的能夠快速將大量印刷型資料數(shù)字化的技術(shù),是目前國內(nèi)圖書館館藏文獻(xiàn)數(shù)字經(jīng)的主要來源。掃描技術(shù)具有節(jié)省空間和便于網(wǎng)絡(luò)傳送的優(yōu)點,但制作速度慢,成本比較高。
2.3 壓縮技術(shù)
館藏數(shù)字化文獻(xiàn)通常以壓縮形式存儲,特別是對于所需存儲空間巨大的圖像文件、視頻和音頻動態(tài)文件,壓縮技術(shù)顯得尤為重要。通用的圖像壓縮標(biāo)準(zhǔn)和格式包括CCITT G4-TIFF、JPEG和JPEG2000等。
2.4 光學(xué)字符識別(OCR)技術(shù)
利用計算機(jī)軟件把掃描的圖像文獻(xiàn)轉(zhuǎn)換成字符文本的一種信息傳述,即將一份文獻(xiàn)的數(shù)字圖輸入計算機(jī),計算機(jī)取出每個文字和圖像,并將其轉(zhuǎn)換為文字編碼,從而將傳統(tǒng)文獻(xiàn)轉(zhuǎn)換為數(shù)字文本文件。轉(zhuǎn)換成文本文件的最大好處是能夠全文檢索,否則只能通過對圖像文件進(jìn)行標(biāo)引達(dá)到檢索的目的,標(biāo)引工作往往需要專門的人員甚至專家進(jìn)行。
3 館藏文獻(xiàn)數(shù)字化中對著作權(quán)需要注意的兩點問題
3.1 文獻(xiàn)數(shù)字化的著者的版權(quán)問題
中華人民共和國2010年(最新)頒布實施的著作權(quán)法第四十八條第一款規(guī)定“未經(jīng)著作權(quán)人許可,復(fù)制、發(fā)行、表演、放映、廣播、匯編、通過信息網(wǎng)絡(luò)向公眾傳播其作品的,本法另有規(guī)定的除外”。我們與提供電子圖書和數(shù)字加工的公司簽訂合同時明確提出,由對方解決版權(quán)問題,如果出現(xiàn)了版權(quán)糾紛由對方完全解決。
3.2 合理的使用法律賦予圖書館文獻(xiàn)數(shù)字的權(quán)利
2013年最新修訂的《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》第七條規(guī)定“圖書館、檔案館、紀(jì)念館、博物館、美術(shù)館等可以不經(jīng)著作權(quán)人許可,通過信息網(wǎng)絡(luò)向本館館舍內(nèi)服務(wù)對象提供本館收藏的合法出版的數(shù)字作品和依法為陳列或者保存版本的需要以數(shù)字化形式復(fù)制的作品,不向其支付報酬,但不得直接或者間接獲得經(jīng)濟(jì)利益。當(dāng)事人另有約定的除外。前款規(guī)定的為陳列或者保存版本需要以數(shù)字化形式復(fù)制的作品,應(yīng)當(dāng)是已經(jīng)損毀或者瀕臨損毀、丟失或者失竊,或者其存儲格式已經(jīng)過時,并且在市場上無法購買或者只能以明顯高于標(biāo)定的價格購買的作品?!庇纱丝梢姡瑘D書館可以合理的利用法律賦予的權(quán)利,在一定范圍內(nèi),是可以數(shù)字化已經(jīng)購買的文獻(xiàn)的。而且,筆者認(rèn)為文獻(xiàn)被數(shù)字化后的目的是為了師生的教學(xué)和科研使用,是可以使用的。
4 選擇數(shù)據(jù)商與圖書館合作的模式及幾點優(yōu)勢
我校圖書館在項目具實施過程中是采用數(shù)據(jù)商外包的模式,這樣的模式有以下幾點優(yōu)勢。
4.1 圖書保護(hù)優(yōu)勢
現(xiàn)在與我校圖書館合作的超星公司有二十年的加工歷程,并有非常豐富的圖書保護(hù)經(jīng)驗。在圖書加工過程,將在書籍掃描前予以檢查,并根據(jù)圖書的具體規(guī)格與形式采取拆裝或不拆裝的掃描方法,有效的減少了圖書在加工過程中產(chǎn)生的損傷。同時,每一個掃描人員都經(jīng)過專業(yè)的培訓(xùn),防止圖書在加工過程中受到損傷。
4.2 數(shù)據(jù)質(zhì)量優(yōu)勢
冷光源掃描,保證館藏數(shù)據(jù)的原版原貌;完善的圖像處理流程,對掃描數(shù)據(jù)中存在的污漬、偏斜、黑色邊框等進(jìn)行處理,保證圖像的清晰度;多重檢查工序,保證圖書在順序、大小、整齊度上均達(dá)到統(tǒng)一標(biāo)準(zhǔn)。
4.3 過硬技術(shù)優(yōu)勢
掃描數(shù)據(jù)采用標(biāo)準(zhǔn)PDG格式;在保證數(shù)據(jù)質(zhì)量的同時,通過壓縮的方式減小數(shù)據(jù)的存儲容量,使網(wǎng)絡(luò)數(shù)據(jù)的傳輸速度,閱覽體驗都能夠達(dá)到較高的水平;同時提供一套電子書管理和發(fā)布平臺,方便圖書館管理和使用。
5 數(shù)據(jù)商在紙質(zhì)文獻(xiàn)數(shù)字化中的執(zhí)行的相關(guān)標(biāo)準(zhǔn)
5.1 總體標(biāo)準(zhǔn)
符合國家標(biāo)準(zhǔn)《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》。確保在掃描過程中不對文獻(xiàn)原件造成二次損傷。保證文獻(xiàn)掃描圖像與原件一致、整潔、清晰。
5.2 元數(shù)據(jù)著錄標(biāo)準(zhǔn)
依據(jù)CNmarc規(guī)范,元數(shù)據(jù)內(nèi)容包含題名、責(zé)任者、出版單位、日期、ISBN(ISSN)號、中圖分類號、頁數(shù)、定價、版次、開本、主題詞(關(guān)鍵詞)等要素。要求元數(shù)據(jù)信息與掃描數(shù)據(jù)信息正確對應(yīng),無錯亂現(xiàn)象。
5.3 掃描標(biāo)準(zhǔn)
支持對文獻(xiàn)資源進(jìn)行不拆裝掃描。可以拆裝的圖書,遵循盡可能保持文獻(xiàn)原貌的原則,對掃描后的文獻(xiàn)進(jìn)行裝訂。掃描圖像要求完整、整潔、無歪斜、無黑邊、瀏覽及打印清晰。根據(jù)文獻(xiàn)情況,采用最為可靠的掃描設(shè)備和掃描方式完成文獻(xiàn)掃描,避免紙張褶皺、撕裂、破損等情況的發(fā)生。掃描圖像無缺頁、多頁、壓頁現(xiàn)象
6 我校圖書館中文圖書數(shù)字化后的成果
我校的館藏文獻(xiàn)數(shù)字化后的“成果”,是以兩個數(shù)據(jù)庫平臺呈現(xiàn)的,一個是數(shù)據(jù)商本身出售的以前加工好的電子圖書,另一個是與我館書目查重沒有的數(shù)字化的,后來單獨(dú)數(shù)字化的一個平臺。數(shù)據(jù)供應(yīng)商可以將兩個平臺的電子圖書建立索引這后,利用檢索引擎“讀秀”就以完成一站式檢索。
截止2012年底,圖書館有中文圖書22.9萬種,114萬冊,2014年5月數(shù)據(jù)庫公司已經(jīng)對館藏中文紙質(zhì)圖書完成了數(shù)字化安裝。實際完成數(shù)字化的圖書有215278種(其中與超星公司以前購買的電子圖書對比上的有111352種,與書生公司對比上的有2523種,超星公司本次數(shù)字化安裝的圖書有101403種),有14145種未完成數(shù)字化,具體原因如表1分析所示。
7 我校圖書館圖書數(shù)字化的優(yōu)勢
圖書館館藏數(shù)字化可以降低購書成本、增加購書的品種。以我校圖書館2014年紙質(zhì)圖書支出情況為例:2014年購買新書約8000種,16000冊(每種圖書兩個復(fù)本),合計碼洋約79萬元。如果按往年的采購計劃(每種圖書4個復(fù)本),本年度的圖書購置款將是158萬元。而將圖書數(shù)字化的成本是每本平均90元(每頁0.3元×300頁),全年數(shù)字化費(fèi)用是72萬元,加上以上的紙質(zhì)圖書款,合計151萬元,有形成本可節(jié)省7萬元。另外,同樣的經(jīng)費(fèi)購置的圖書品種是往年的兩倍。
可以有效的解決我校老師在開設(shè)選修課時幾個班,上百甚至幾班學(xué)生集中到圖書館“搶借書”,無功而返的尷尬。學(xué)生可以在已數(shù)字化的圖書中任意下載,不受復(fù)本的限制。并可以選擇重要的章節(jié)打印出來。
一些線裝書,孤本,善本。在數(shù)字化后,師生可以不受讀者級別的限制在線或是下載閱讀。
將紙質(zhì)圖書的MARC數(shù)據(jù)的相應(yīng)字段錄入數(shù)字化后的電子圖書的鏈接地址。這樣師生在查詢館藏紙質(zhì)圖書的同時也就可以知道電子圖書的所在,為借閱電子圖書節(jié)省了時間。
8 結(jié)束語
館藏文獻(xiàn)的數(shù)字化是我校圖書館自2012年內(nèi)涵改造的一個項目,于2014年上半年完成了第一階段的任務(wù)。隨著我校圖書館每年的藏書品種的增加,數(shù)字化的工作是一個連續(xù)的過程。以后不僅是中文圖書,還會涉及到外文圖書和非紙質(zhì)文獻(xiàn)等。作為圖書館的一員,筆者會繼續(xù)對這項工作進(jìn)行研究并做出自己的貢獻(xiàn)。
參考文獻(xiàn)
[1] 王淑云. 淺析圖書館文獻(xiàn)數(shù)字化的法律保護(hù)[J]. 中國科技信息 ,2010 (20):175-176.
[2] 陳潔薇,陳錦波. 圖書館館藏文獻(xiàn)全文數(shù)字化建設(shè)探究[J]. 高校圖書館工作,2012(1):65-67.