趙丹丹
摘要:圖書館作為信息資源的收集、整理、存貯和交流的中心,要改變以往的工作模式,能夠在任何空間、任何時間,準確、快捷地為任何用戶提供所需信息,需要圖書館將自己的信息資源數(shù)字化,由于各圖書館資金有限,不得不對數(shù)字化內容進行選擇。
關鍵詞:圖書館 數(shù)字化 原則
1 保護知識產(chǎn)權
館藏資源的產(chǎn)權狀態(tài)識別與數(shù)字化項目實施和數(shù)字資源發(fā)布所在的國家地區(qū)有關,每個國家都有自己的知識產(chǎn)權保護法律。學者針對圖書館信息資源數(shù)字化項目制訂了產(chǎn)權狀態(tài)識別模型,目前數(shù)字化項目中保護產(chǎn)權的主要技術有:對每個數(shù)字圖像添加可視水印或版權戳;給每個數(shù)字圖像添加不可視水印,這種水印標志可以用來證實數(shù)字圖像的版權身份,也可用來跟蹤這個數(shù)字圖像在因特網(wǎng)上的傳播軌跡;對數(shù)字圖像加密,并僅把密鑰發(fā)送給注冊用戶,這種方法會限制公共存取;將公共瀏覽的圖像限制在低分辨率;將公共存取限制在截取數(shù)字圖像的一小部分之中,這種方法在一些項目中應用得非常成功;將圖像的瀏覽權僅限定在一些注冊或被授權的用戶。
2 選取最有價值的知識文獻
影響原始信息資源的知識價值因素有很多,但主要包括資源的唯一性、相關價值、對相關主題領域理解的重要性、對相關主題領域覆蓋的廣度和深度、實用性和準確度、特定主題領域中其他載體記錄質量差的信息內容、具有強化項目實施的歷史價值以及數(shù)字化產(chǎn)品潛在的長期價值等。另外,文獻知識價值也可能包括管理價值、藝術價值、證據(jù)價值和市場價值,文獻知識價值的判斷具有很大程度的主觀性。圖書館不同,對文獻知識價值的判斷也不相同,在國內,每個高校的圖書館都有自己的基本館情,他們都積極對館內自己認為有特色的東西進行數(shù)字化。
3 選取適宜于數(shù)字化的文獻
在數(shù)字化內容選擇過程中,需要考慮的與原始文獻存在狀態(tài)相關的問題有:原始文獻的存在狀態(tài)是否有利于數(shù)字化?其內容是否能被目前的數(shù)字化技術完全和充分地抓取?物理材質和形狀是否會對數(shù)字化過程構成障礙?是否有保存良好的替代品(如縮微膠片)?最常見的物理材質有一般紙張、牛皮紙、草紙、微縮膠片、光學材料、三維物體、玻璃器皿、記錄音頻的盒帶光盤和磁帶、視頻等。不同物理材質的文獻需要不同的技術進行數(shù)字化,比如,一般紙張可以采用數(shù)字掃描,但三維物體只能采用數(shù)碼拍照。存在狀態(tài)對其內容的充分抓取也有重大影響,比如,一般紙張中內容的抓取要比草紙充分得多,甚至,有些物理材質的內容數(shù)字化目前還難以實施。所以,只能選擇那些當前技術條件下適合于數(shù)字化的載體材質館藏資源,載體的物理尺寸也是影響內容選擇的一個重要因素。
4 提高利用率
用戶利用的本質就是館藏文獻的利用率,從理論上講,圖書館信息資源數(shù)字化項目應把有限的資金用在利用率高的資源的數(shù)字化上,但一些問題需特別關注:其一是要對利用率高的文獻的原因進行分析,如果主要用戶群體分布在本地,且類似文獻又不存在,這類文獻的利用率自然可能高,但數(shù)字化后發(fā)布在網(wǎng)絡上,其利用率如何就比較難以判斷,因為這時的用戶就不僅局限于本地了。其二是文獻的利用率有時與文獻的知識價值并不一致,有些具有高知識價值的文獻由于存放地點和圖書館存取方針的限制或目錄的不完整等因素,可能導致利用率偏低,其三是利用率也會與文獻的物理狀態(tài)有關,一些文獻的物理狀態(tài)限制了用戶對其的訪問,比如易碎載體的文獻、古舊的手稿等。其四是在多館合作數(shù)字化項目中,一些大部頭的系列文獻分散在各成員單位,對這些文獻的訪問率可能較低,但數(shù)字化后可以形成完整的虛擬館藏,其訪問率可能就會提高。其五是一些技術因素不應該成為阻止一些文獻數(shù)字化的原因,
5 從技術條件上考慮可行性
數(shù)字化內容選擇將受現(xiàn)有技術條件的限制,我們在選擇數(shù)字化內容的時候必須要考慮現(xiàn)在的技術是不是能夠順利地把這個內容數(shù)字化??紤]的主要因素有:數(shù)字化過程中對原始資料識別技術方面的問題,會導致數(shù)字技術生成的文獻數(shù)字版與原始文獻包含信息相比出錯率很大;數(shù)字資源顯示在用戶終端的質量;圖書館支持的現(xiàn)行平臺和網(wǎng)絡環(huán)境對數(shù)字資源的存取能力;數(shù)字資源網(wǎng)絡傳播速度的合理性;對未來用戶使用先進設備的預測,以免日后需重新掃描;搜索引擎對圖書館數(shù)字資源的索引能力。另外,還要考慮一些特殊資源數(shù)字化的技術可行性,如,需要超高分辨率的文獻資源、顏色至關重要的原始資源、超大尺寸的資源、三維形態(tài)的資源以及易讀性很差的資源載體等。
6 對文獻資源進行保存
為了保存的需要,數(shù)字化內容選擇的原則之一是安全數(shù)字化(safedigitiza2tion),包括原始信息資源的狀態(tài)允許被完全數(shù)字化;數(shù)字化實施過程需要搬運原始資源時,其狀態(tài)適合于搬運;盡可能掃描原始資源的替代品(如照片),從而減少對原始資源的損傷;數(shù)字化的產(chǎn)品必須建檔,并制訂由于時間和技術變化等因素導致的長期維護策略。數(shù)字保存的另一層含義是保護易碎載體的原始資源,數(shù)字資源的本身就是原始資源的新版本,可以代替原始資源供用戶訪問,并由此減少對原始文獻的操作從而使其得到保護。如對古籍來說,由于它極其容易被損壞,從這個原則上來講它是應該拿來數(shù)字化的,但在數(shù)字化過程中,特別要注意不要將這些珍貴的圖書損壞,這也將
對數(shù)字化帶來很多麻煩。
7 以經(jīng)濟效益為出發(fā)點
館藏文獻的數(shù)字化成本受眾多因素影響。分辨率越高的圖像所需的成本也越高,彩色圖像的成本要比黑白圖像的成本高,數(shù)字化生成純文本文件有助于全文檢索,且占用較少的存儲空間,但需要OCR識別,并需要大量的人工校對,如果生成帶標記的文本文件 (如XML文件),雖然有助于各種分析乃至納入數(shù)據(jù)庫管理,但成本必然增加。成本也取決于數(shù)字化過程,比如,單頁掃描比裝訂在一起掃描成本要低,保存狀態(tài)良好的資源掃描要比保存狀態(tài)差的資源掃描所需成本要低,因為后者需要更多的人工處理。從效益角度看,受益最大的是用戶。另外,數(shù)字化也便于圖書館管理人員對館藏資源的管理,并能更高效地提供服務,盡可能提高成本效益是數(shù)字化內容選擇的宗旨。實現(xiàn)相同功能而采用不同方法的成本會有所不同,比如,數(shù)字化生成文本文件與生成圖像文件,后者加入元數(shù)據(jù)與圖像文件鏈接,兩種方法得到的效果可能差不多,但很明顯后者的成本要低些。另外,規(guī)模很大的項目單件數(shù)字化成本要低,長期保存的費用也會降低。
圖書館在進行數(shù)字化內容選擇的時候,只有滿足了以上的原則,數(shù)字化才有價值,才能給圖書館和讀者都帶來好處。