肖鍵敏
摘 要:隨著科學技術的發(fā)展,我們所處的信息化時代,決定了檔案管理工作也正在向電子化、網(wǎng)絡化方面邁進。信息技術為檔案管理提供了便利,也帶來了一定的困難和挑戰(zhàn)。本文將從學校的角度出發(fā),解析學校檔案管理在網(wǎng)絡環(huán)境下存在的問題,探討OCR技術如何有效加速實現(xiàn)紙質(zhì)文檔電子化,思考學校檔案的電子化管理的方法,從而提高學校檔案的利用率,讓學校檔案資料發(fā)揮其應有的作用。
關鍵詞:檔案信息;電子化;OCR技術
1 檔案信息電子化基本現(xiàn)狀
1)缺乏通用性信息管理功能的檔案軟件。目前,多數(shù)基層檔案館(室)對計算機的應用單一,開發(fā)功能簡單,使現(xiàn)代化設備不能盡其用,檔案部門各自開發(fā)的軟件不能互用,這制約了檔案信息電子化的進程。
2)標準化、規(guī)范化工作有待提高。檔案信息管理電子化的前提是基礎工作的規(guī)范化和標準化。但由于多種原因,目前檔案業(yè)務基礎差,案卷質(zhì)量不高,特別是各類檔案的著錄細則相容性不強,系統(tǒng)軟件移植性差;檔案自動化工作尚無統(tǒng)一標準。
3)檔案信息管理人員素質(zhì)尚需提高。實現(xiàn)檔案信息電子化,要求管理人員有較高的知識層次和先進技術水平,不能僅僅滿足于一般的計算機操作。目前,許多檔案部門缺乏現(xiàn)代高技術人才,其中檔案、信息處理復合型人才就更奇缺,大部分檔案人員現(xiàn)代技術水平偏低。盡管引進了現(xiàn)代化設備,仍不能充分發(fā)揮作用,就談不上檔案信息電子化了。
2 檔案信息化建設的風險識別
檔案信息化在給人們帶來方便快捷的同時,也給人們帶來了不少擔憂:1)信息安全問題,2)知識產(chǎn)權問題。這些問題的產(chǎn)生,在一定程度上阻礙了檔案信息化工作的順利進展。目前,用于解決上述問題的對策除了技術以外,也有很多學者呼吁應盡快出臺關于檔案信息化的法規(guī)、政策和標準。但問題是,技術本身就是一把雙刃劍。問題主要不在于技術,而在于人性。我們看到,復制技術既可用于信息共享,也可用于侵犯他人知識產(chǎn)權;過濾技術既可用于自律,也可用于搜集他人的隱私信息;加密技術既可用于信息安全防范,也可被恐怖分子和極端民族主義分子用于秘密通信,從事破壞和顛覆國家政權的犯罪活動。
1)數(shù)字檔案信息對計算機設備的依賴性。數(shù)字檔案信息從傳輸、存儲到顯示都是通過計算機實現(xiàn)的,計算機是生成數(shù)字檔案信息的前提和基礎,離開了計算機的軟硬件條件,人工不可能將數(shù)字檔案信息存儲到存儲介質(zhì)上,也不可能識別存儲在存儲介質(zhì)上的數(shù)字檔案信息。因此數(shù)字檔案信息對計算機及其相關設備具有絕對的依賴性。
2)數(shù)字檔案信息的不安全性。除了數(shù)字檔案信息對計算機設備的極強依賴性之外,處在系統(tǒng)網(wǎng)絡中的數(shù)字檔案信息表現(xiàn)出的不安全性十分明顯。網(wǎng)絡安全的薄弱性是不可忽視的。計算機網(wǎng)絡系統(tǒng)并不安全,有時會出現(xiàn)某些隱患,從而使數(shù)字檔案信息化為烏有。另外計算機病毒的威脅、黑客攻擊、誤操作、信息失真等因素都會造成數(shù)字檔案信息丟失的問題,帶來難以估量的損失。這些都意味著確保數(shù)字檔案信息的保密性、完整性、真實性和可用性極富挑戰(zhàn)意義。
3)數(shù)字檔案信息對標準的依賴性。在數(shù)字檔案信息的形成與管理中使用標準,有助于數(shù)字檔案信息在存取與保存時的完整性。標準的使用不僅有利于數(shù)字檔案信息的科學管理,同時,遵守與使用標準還便于數(shù)字檔案信息隨技術的發(fā)展在新、舊數(shù)字平臺間轉換,這將直接降低保存數(shù)字檔案信息的費用。因為,隨著技術的發(fā)展,數(shù)字檔案信息在新、舊數(shù)字平臺間的轉換是通過不同的標準與規(guī)范進行的,如果數(shù)字檔案信息按標準進行管理,就會降低數(shù)據(jù)格式變換的頻率。格式變換、數(shù)據(jù)遷移的頻率降低,所需的費用自然就降低了。
同時,數(shù)字檔案信息還存在數(shù)據(jù)的巨大性、存儲格式的多樣性等特點。
3 OCR技術有效加速實現(xiàn)紙質(zhì)文檔電子化
偶然在網(wǎng)上找了一篇實用文檔,想要復制保存下來,結果卻發(fā)現(xiàn)網(wǎng)頁進行了限制,面對密密麻麻的文字信息,難道要一個字一個字的敲上去嗎?如果沒有OCR,大概會有不少人這么干。
OCR是一種將圖像中的文字轉換成可編輯的文本格式的技術,簡單來說,將你無法復制保存的文檔拍下來,通過文檔識別軟件進行識別,獲得可編輯可保存的電子文檔。
3.1 OCR技術有效加速實現(xiàn)紙質(zhì)文檔電子化
云脈文檔識別內(nèi)置成熟的OCR技術,加速實現(xiàn)紙質(zhì)文檔電子化。相比一個字一個字的錄入,這種批量識別存儲的方法不僅提高了紙質(zhì)文件信息電子化速度,更是提高了檔案錄入的準確性。
紙質(zhì)文檔管理系統(tǒng)的投入,不僅可以優(yōu)化電子化工作流程提升員工工作效率,更有效減少電子化過程中所造成的人力、物力的浪費。
3.2 紙質(zhì)文檔管理助力檔案資源價值發(fā)揮
建立電子檔案乃大勢所趨,不說當代信息依托互聯(lián)網(wǎng)傳播,就從信息保存角度來講,和書柜、紙箱之類的存儲容器相比,云盤存儲更現(xiàn)代也更安全。
紙質(zhì)文件受存儲媒介和存儲環(huán)境影響,容易出現(xiàn)蛀蟲、焚毀、損壞、字跡模糊等問題,收發(fā)不易,保存困難,查閱更是不便,文檔利用率低,根本無法充分發(fā)揮檔案資源應有的價值。
云脈紙質(zhì)文檔管理系統(tǒng)可以將識別文件和識別結果保存在云端,同時內(nèi)置關鍵字檢索功能,用戶可以通過文件名、關鍵字、日期等方式快速查詢到相關文件,相比較起在扎堆的文件堆里找一份資料,現(xiàn)代化式的檢索方法更得年輕一代的認可。
3.3 及時更新文件動態(tài)設置權限安全分享
文檔電子化為了更好地實現(xiàn)信息存儲和利用。在云脈紙質(zhì)文檔管理系統(tǒng)中檢索到的文件可以通過在線傳送、設置瀏覽權限等方式進行分享。傳統(tǒng)的紙質(zhì)檔案更新不便,不能及時反映當前情況,而通過建設數(shù)字化檔案,能夠快速及時地更新檔案資料,讓相關人員隨時了解動態(tài)。
目前云脈紙質(zhì)文檔管理系統(tǒng)被廣泛應用于企事業(yè)單位大量紙質(zhì)材料的電子化管理,如檔案局、圖書館、政府機構、金融保險等領域。為現(xiàn)代無紙化辦公提供高效服務,推進文件信息電子化。
4 解決好電子文件歸檔工作才能真正實現(xiàn)檔案電子化
電子文件歸檔方式和途徑的選擇。紙質(zhì)檔案的載體較為穩(wěn)定安全,而電子文件的載體穩(wěn)定性差,易損壞,因此歸檔方式的選擇至關重要。經(jīng)實踐檢驗,利用磁盤,脫機采集數(shù)據(jù)的介質(zhì)移交方式容易造成數(shù)據(jù)丟失。如遇質(zhì)量較差的磁盤,會影響文件的可讀性。為防止數(shù)據(jù)丟失需制作多份備份盤存檔,這不僅加大了工作量,也增加了存貯磁盤的數(shù)量,簡便而安全的方式是采用網(wǎng)絡移交歸檔,并利用光盤存貯。
無論利用何種途徑歸檔,必須由電子文件形成單位按統(tǒng)一格式編目整理后,傳輸給檔案部門,不能由檔案部門自行從網(wǎng)上下載,以保證電子文件形成部門對其數(shù)據(jù)的真實性、準確性負責。檔案部門接收的電子文件一律應存入光盤,最好不用磁盤存貯。
5 結束語
隨著電子網(wǎng)絡技術的不斷發(fā)展,學校檔案電子化管理必將產(chǎn)生新的問題,尋求新的思路。因此,作為檔案管理者,要不斷加強自身業(yè)務學習,與時俱進,在應用中發(fā)現(xiàn)問題,在思考中解決問題,將學校檔案電子化管理推向新的高度。
參考文獻
[1]紀鐵利.有關檔案電子化管理的幾點思考[J].計算機光盤軟件與應用,2012.
[2]于柏云.淺議信息時代的檔案電子化管理[J].蘭臺世界,2012.
[3]趙戈.信息時代的檔案電子化管理初探[J].北京檔案,2010.