金淑紅
摘 要:隨著網(wǎng)絡技術的不斷發(fā)展,檔案管理也發(fā)生了很大的變化,實現(xiàn)了檔案數(shù)字化發(fā)展和數(shù)字檔案的網(wǎng)絡化應用,這樣能夠更好對一些珍貴的檔案原件進行管理,同時也能更好的實現(xiàn)檔案數(shù)字化技術的發(fā)展,這樣能夠更好的對檔案信息進行保管。
關鍵詞:數(shù)字化;掃描;信息存儲
信息時代的來臨,檔案信息資源在社會主義現(xiàn)代化建設過程中發(fā)揮了非常重要的作用。檔案在人們的生活和工作中具有很大的影響意義,這樣檔案的作用和價值才能得到更好的體現(xiàn)。現(xiàn)在,人們在生活和工作中,要對檔案歷史信息進行更好的保護,這樣在進行使用的時候才能更好的保證得到很好的利用。檔案數(shù)字化是檔案信息化建設過程中非常重要的基礎工作,同時在進行檔案管理過程中要對計算機技術進行很好的利用,這樣才能在工作流程方面更加的合理,同時也能更好的將原始的資料進行高效、準確的進行處理,將其轉(zhuǎn)變成為數(shù)字檔案。如何將原始資料變成為數(shù)字檔案也是檔案工作者和技術開發(fā)人員要進行研究的問題。在日常的檔案管理中,已經(jīng)形成了非常規(guī)范的管理方法,同時對檔案的保護和保密工作也是非常重視的,這樣能夠更好的提高檔案查詢的效率,同時,在社會發(fā)展過程中也能更好的對檔案資源進行使用。為了更好對檔案進行管理,實施檔案數(shù)字化發(fā)展非常重要,建立一套數(shù)字化檔案管理信息系統(tǒng)能夠更好的解決檔案管理過程中數(shù)字化建設問題。在檔案工作中,對工作經(jīng)驗進行總結,能夠更好的從檔案業(yè)務能力方面和技術方案方面更好的解決檔案數(shù)字化發(fā)展和數(shù)據(jù)存儲方案的解決。
1 檔案數(shù)宇化業(yè)務過程模型
檔案數(shù)字化是一項非常復雜的系統(tǒng)工程,在進行處理的時候要對電子檔案信息進行獲取,同時在信息處理、信息儲存和信息發(fā)布和利用方面都要進行很好的發(fā)展。電子檔案信息在獲取的時候可以通過很多的渠道來進行實現(xiàn)。在技能型信息獲取的時候,可以對紙質(zhì)的檔案進行掃描加工,也可以對磁帶和磁盤中儲存的檔案進行數(shù)字化轉(zhuǎn)換,這樣能夠更好的將采集到的數(shù)據(jù)信息更好的轉(zhuǎn)化成為數(shù)字化形式。無論采取何種形式對技術參數(shù)進行處理都要有專業(yè)的設備和文件儲存方式,要保證儲存介質(zhì)的安全性,同時要保證信息能夠更好的進行處理。在檔案信息化處理過程中,數(shù)字化解決方案是核心的功能,其中包含著檔案信息的編目、標引、圖像文件處理以及圖像識別處理,這樣能夠更好的對檔案目標信息進行關聯(lián)。在這個過程中,系統(tǒng)中每個功能模塊都要借助軟件開發(fā)平臺進行建設,同時要對用戶的操作環(huán)境的控制。檔案信息儲存的安全非常重要,因此,在整個系統(tǒng)中一定要保證信息的安全,同時要保證系統(tǒng)能夠更好的運行支撐。在這個環(huán)節(jié)中,系統(tǒng)的儲存量是有一定的要求,在安全管理方面也有一定的基本要求,同時也要對訪問的速度進行控制,對儲存的設備也是有一定的要求。各種電子檔案信息在儲存和訪問方式也要進行選擇,這樣能夠更好的對檔案信息的儲存方式進行決定。在檔案信息利用中,檔案數(shù)字化發(fā)展是必然趨勢,同時在這個環(huán)節(jié)中要對查詢和利用的平臺進行建設,這樣能夠更好的對網(wǎng)絡中出現(xiàn)的信息進行保證,同時也能更好的保證人們在生活和工作中對網(wǎng)絡中存在的信息進行使用。網(wǎng)絡中存在的信息具有很好的共享性,這也是檔案信息的重要價值和作用。在對檔案進行保管的時候,對其隱私性也有要求,這樣才能更好保證信息的安全。
2 檔案數(shù)字化主要技術指標的選擇
紙質(zhì)檔案實現(xiàn)數(shù)字化的過程要使用數(shù)字化掃描技術、圖文編輯、圖像格式和圖像儲存技術進行發(fā)展,這樣能夠更好的對相關的技術和參數(shù)進行選擇。對紙質(zhì)檔案進行數(shù)字化能夠更好的實現(xiàn)掃描加工,同時也能更好地對信息質(zhì)量進行檢查,同時對出現(xiàn)的污染問題也能進行更好的處理,這樣更好的實現(xiàn)檔案文件的信息關聯(lián)。
2.1 掃描技術參數(shù)選擇
在對紙質(zhì)檔案進行掃描的時候,要采用標準的編程接口,這樣能夠更好的應用編程程序?qū)Ω鞣N掃描儀器進行控制,同時也要實現(xiàn)自動圖像壓縮儲存。在這個過程中,有不同的掃描方式,可以支持不同的幅面和顏色,也能夠?qū)Σ噬珗D像進行處理。在掃描過程中,要對分辨率進行必要的設置,要根據(jù)實際的業(yè)務進行靈活的設置,同時,也要滿足網(wǎng)絡化的查詢利用,對具體參數(shù)的掃描分析清晰度和質(zhì)量因素進行綜合選擇,因此,在進行掃描的時候可以提高掃描分辨率。
2.2 OCR識別技術
OCR技術可用于檔案標引信息識別和全文信息識別。在理想的測試條件下,其主要技術指標如下:識別字體:識別宋體、仿宋、楷體、黑體、魏碑、隸書、圓體、行楷、行書等近百種字體。識別功能:支持印刷文稿、純英文、中英文混排、較工整的手寫文稿等多種類型。對印刷材料的識別率達98%以上。識別速度:在普通配置的計算機上印刷體漢字達120字/秒以上。要求圖像分辨率:一般不低于300DPI。由于大量實際檔案的紙張、字體和測試樣例往往存在較大差距,因此OCR在實際應用中自動識別的準確度和穩(wěn)定性會有較大的折扣,這使我們不得不遺憾地面臨艱苦而繁瑣的人工校對和補錄工作。
2.3 圖像文件密級定義技術
為了在較細粒度上實現(xiàn)對電子檔案圖像信息的安全訪問與控制,可通過采用頁定級或頁內(nèi)區(qū)域定級,即指定某頁或頁內(nèi)某區(qū)域的保密級別。保密級別可分為公開級、國內(nèi)級、內(nèi)部級、秘密級、機密級、絕密級等等。頁定級與頁內(nèi)區(qū)域定級之后,通過用戶角色授權,便可實現(xiàn)精細的數(shù)據(jù)訪問控制和權限管理。
2.4 多媒體音像檔案數(shù)字化技術參數(shù)
多媒體音像檔案數(shù)字化,就是將錄音、錄像等各種形式的多媒體原文資料通過音頻、視頻轉(zhuǎn)換設備進行轉(zhuǎn)換、識別,壓縮,生成標準格式的電子文件,并編目以及建立標引信息的過程。
2.5 條碼技術
文檔數(shù)字化加工的全過程,采用條形碼技術進行跟蹤管理是非常有效的手段之一。通過采用條碼可以實現(xiàn)下述自動化處理:在檔案整理工序中加貼表示不同意義的條碼,可以實現(xiàn)案卷號、檔案分類等關鍵標引信息的自動識別。檔案移交過程中,可利用條碼自動進行檔案的逐卷核對;檔案盤點時,通過條碼掃描槍或無線數(shù)據(jù)采集器進行條碼掃描,可實現(xiàn)庫房檔案數(shù)量的精確統(tǒng)計,同時還可以實現(xiàn)庫房實物檔案與計算機中存儲的檔案信息的核對。在檔案的借閱管理工作中,可應用條碼進行自動化的出入庫管理。
2.6數(shù)字檔案信息的存儲
數(shù)字化后的數(shù)字檔案信息包括檔案目錄信息和圖像原文信息兩大類,為了實現(xiàn)網(wǎng)絡化利用,檔案的目錄數(shù)據(jù)庫必須采用支撐網(wǎng)絡化系統(tǒng)運行的數(shù)據(jù)庫,而數(shù)字化后的電子圖像文件的存儲則可以選擇文件存儲方式或數(shù)據(jù)庫存儲方式任何一種存儲方式,如果選用數(shù)據(jù)庫存儲,則要求數(shù)據(jù)庫服務器的存儲容量足夠大,如果選用文件存儲,則應考慮存儲在文件服務器上文件的存儲規(guī)則和命名規(guī)則,以方便實現(xiàn)圖像文件與數(shù)據(jù)庫的檢索。
3 結束語
在檔案工作中,檔案數(shù)字化是非常新的一項內(nèi)容,因此,在建設過程中無法避免的會遇到一些新問題和新情況。數(shù)字化檔案信息在壓縮和儲存關鍵技術方面要進行更好的發(fā)展,這樣才能更好地保證數(shù)字化檔案信息的安全,同時在保密技術方面也要進行很好的發(fā)展,這樣才能更好的保證數(shù)字化檔案信息能夠更好的實現(xiàn)訪問方式和安全控制。數(shù)字化檔案在進行建設的過程中要面臨著很多的問題,對出現(xiàn)的問題進行解決才能更好的促進檔案工作得到更好的發(fā)展,在檔案管理水平方面得到提高。
參考文獻
[1]張晶晶.數(shù)字檔案存儲介質(zhì)及格式研究[D].蘇州大學,2009.
[2]劉祥麟.數(shù)字檔案存儲介質(zhì)的發(fā)展[J].湖南檔案,2007.