国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

漢字識別技術在檔案管理工作中的應用探討

2015-10-21 18:19:09金娟
華人時刊·中旬刊 2015年7期
關鍵詞:檔案管理應用工作

金娟

【摘要】檔案管理工作是一項重要的工作任務。雖然當前在我國檔案管理工作中,大多應用了現代計算機技術,以現代化的手段進行管理,但仍然存在檔案丟失等一些不足需要檔案管理工作者引起關注。漢字識別技術的應用,可以提高檔案管理工作的靈活性,使檔案得到更方便與完善的保管。以下,本文就漢字識別技術在檔案管理中的應用進行了簡單介紹,并對其應用進行了具體的分析。

【關鍵詞】漢字識別技術;檔案管理;工作;應用

中圖分類號:G25文獻標識碼A文章編號1006-0278(2015)07-157-01

漢字識別技術有很多的優(yōu)勢,除了可以為檔案管理增加數據源之外,還可以為檔案管理提供新型的檔案錄入方式,雖然漢字識別技術的錄入方式還有很多改進的地方,但是經過一段時間的發(fā)展,會有突破,使其在錄入方式方面,為檔案管理提供幫助。相關人員應該加大對這種技術錄入方式的開發(fā),為檔案管理的錄入工作提供更多的途徑,提高檔案管理錄入工作的效率。

一、漢字識別技術在檔案管理工作中應用的必要性

檔案管理工作已經進入到現代管理的階段,大部門檔案管理部門都已經實現了電子化管理,但是要想檔案管理工作進展更加順利,還需要應用更多的技術,漢字識別技術就是其中之一,該技術的應用十分必要,眾所周知我國檔案管理工作涉及到的文字主要是漢字,如果利用漢字識別技術,勢必會提高檔案管理的效率與質量,其應用的必要性主要體現在以下兩方面:

(一)增加了數據源

漢字識別技術沒有應用之前,紙質檔案中一般情況下都是固定的信息,其檢索難度非常大,但是利用這種技術之后,固定的信息就更容易檢索,為文本管理增加了更多數據源,也就更有利于檢索。有很多檔案紀律了黨和國家的重要情況,可以說這些檔案最研究我國黨和國家的發(fā)展有著非常重要的作用,但是這些檔案一般情況下都是固定信息,如果沒有建立相應的文本數據庫,很多的紙質檔案因為長期的保存可能會流失,這對研究歷史有非常大的消極影響。為了降低這種情況,有些部門開始采取掃描的方式,將所有重要的方案都進入掃描進計算機中,這種方式雖然起到一定的效果,但是檢索十分困難,降低了其利用率。因此使用漢字識別技術十分關鍵。雖然現代辦公設備幾乎都實現了自動化,但是從檔案管理工作方面來說,還有很多檔案依然沒有文本,流失的現象依然存在,但是漢字識別技術的應用就可以避免這種現象,因為固定信息通過這種技術就可以變成活信息,這樣檢索起來比較方便。

(二)增添了檔案數據錄入方式

檔案管理進入現代化以來,錄入方式只有簡單的一種,那就是鍵盤錄入。雖然鍵盤錄入方式越來越多,而且越來越簡單,但是這種簡易的方式,也會檔案錄入工作帶來了困難,因為如果不會錄入速度比較慢,或者是錄入人員電腦操作不夠靈活,都會影響錄入效率,而且在錄入的過程中,還要完全的掌握相關原則以及要領,否則就會出現差錯。因為檔案管理工作人員大部分年齡都比較大,對電腦操作本身就不熟悉,所以即使是最簡單的鍵盤錄入方式,對他們來說也有一定的難度。但是漢字識別技術就可以緩解這一問題,它可以利用拖拉的方式就可以將需要的檔案的相關目錄等信息直接拽到需要的數據庫中,非常簡單。但是因為這種的方式還有很多不成熟的地方,比如在拖拉時,需要掃描來配合,其耗費的時間也比較長,但是這種新方式,經過不斷地發(fā)展其錄入效果也有效的提高。

二、漢字識別技術在檔案管理工作中的應用

漢字識別技術應用在檔案管理工作中有一定的必要性,盡管在錄入方式上,顯現的效果還不明顯的,但是只要在增加數據源方面,其作用十分明顯,其具體的應用如下:

(一)方便閱讀者與檔案管理工作

利用者閱讀紙質檔案的內容之后,對其所需要的內容進行掃描和漢字識別,或打印出統(tǒng)一格式的利用摘錄,或直接提供文本拷貝。這種利用方式的優(yōu)點主要有:方便用戶,可減少信息利用過程中的重復勞動;不給檔案人員增加建庫的工作負擔;節(jié)省建庫所需的經費開支。其缺點主要有不能為全文檢索提供數據,實現深層次開發(fā)檔案信息資源的目的存在對同一檔案內容重復進行掃描和漢字識別的可能性。

(二)輸入檔案目錄

這是加快檔案目錄信息數據庫建設的一條新路,能夠使更多的人員從事輸入工作,但輸入速度不甚理想,而且成本費用相對較高。

(三)掃描、保存圖像并提供利用,只針對利用者需要的圖像內容進行漢字識別等利用服務

這種方式必須在已有文件目錄的前提下使用。其優(yōu)點主要有:具有提供原件和提高信息利用效率的雙重優(yōu)勢;檔案人員不承擔漢字識別后生成的文本數據的維護工作。其缺點主要有:同第一種利用方式的缺點。漢字識別技術要求圖像的光學分辨率較高,一般為3000dpi,而一般圖像的分辨率僅為150dpi,因此所需的存儲空間較大,約是一般圖像的2.3倍,那么,所需的存儲成本也要高得多。這種高代價的圖像存儲僅用來滿足用戶利用識別的需要似乎有點得不償失。因此低分辨率的圖像也能進行漢字識別,只是識別率相對較低而已。我們也曾做過對比實驗,同一頁印刷質量良好的B5紙型文件約500字,以300dpi進行掃描,識別率為100%;以150dpi進行掃描,識別率為99.4%(誤識3字)。這對于一般用戶而言無所謂的。

(四)建立文本數據庫

這種方式也應在已有文件目錄的條件下使用。其優(yōu)點主要有:節(jié)省存儲空間和存儲成本。仍以一頁B5型紙約500漢字的文件為例,以文本方式存儲約需1000字節(jié);以圖像方式存儲約需25000字節(jié)。因此,同量漢字的文本方式存儲比圖像方式存儲成本低得多。為全文檢索提供數據,能夠實現深層次開發(fā)利用檔案信息資源的目的。

其缺點主要有:建立文本數據庫的工作量較大;不能滿足用戶閱讀檔案原件的需求;由于沒有圖像隨時提供依據,不便于對文本數據的準確性進行核實。這是充分發(fā)揮OCR軟件功能,深層次開發(fā)利用檔案信息資源的應用方式。但工程量較大,人力、資金需求較多,建庫周期較長。

(五)其他應用程序

首先,輸入目錄、建立文本數據庫,其次,保存圖像、建立文本件數據,最后,輸入目錄、保存圖像并建立文本數據庫。

三、結束語

綜上所述,可知漢字識別技術在檔案管理工作中的應用非常重要,無論是在數據源方面,還是錄入方式方面,都有積極的意義。也正是因為如此,國家以及相關部門都非常重視對其開發(fā),以此希望能夠為檔案管理工作的發(fā)展提供更多的途徑,但是有些檔案管理人員對此并不重視,相關部門沒有使用該技術的動力,所以一直沿用傳統(tǒng)的方式,尤其是老工作者,對新興事物比較排斥,所以應該提高工作人員使用這種技術的意識。

參考文獻:

[1]王紅梅.我省林業(yè)科技檔案管理的歷史跨越[J].甘肅科技,2005(1).

猜你喜歡
檔案管理應用工作
檔案管理中的電子檔案管理
檔案管理與企業(yè)內部控制關系的思考
消費導刊(2017年24期)2018-01-31 01:29:20
不工作,爽飛了?
桃之夭夭B(2017年8期)2017-10-25 14:53:20
GM(1,1)白化微分優(yōu)化方程預測模型建模過程應用分析
科技視界(2016年20期)2016-09-29 12:03:12
煤礦井下坑道鉆機人機工程學應用分析
科技視界(2016年20期)2016-09-29 11:47:01
氣體分離提純應用變壓吸附技術的分析
科技視界(2016年20期)2016-09-29 11:02:20
會計與統(tǒng)計的比較研究
我要出艙工作
再說還有工作忙
兒童繪本(2015年6期)2015-05-25 17:55:54
選工作
舞阳县| 芒康县| 兴安盟| 宝鸡市| 聂荣县| 阳信县| 南和县| 饶平县| 调兵山市| 明水县| 高要市| 临潭县| 株洲市| 康保县| 海阳市| 仁寿县| 奎屯市| 巴林左旗| 海南省| 临高县| 名山县| 屏山县| 米脂县| 庆阳市| 灵丘县| 顺义区| 文化| 门头沟区| 策勒县| 台北市| 合川市| 镇江市| 富川| 长沙市| 博湖县| 衡山县| 景谷| 林西县| 龙岩市| 岐山县| 方正县|