文/談進球 譚鈞鴻 郭子山
傳統(tǒng)的實驗室合同評審資料管理主要是依靠人工管理。例如對于合同評審資料的信息錄入和保存工序,需要錄入人員將全部或部分合同評審資料信息錄入到計算機系統(tǒng)中分配檢驗任務,非常費工費時,而且容易產(chǎn)生信息錄入錯誤,導致檢驗結果無效的風險。依據(jù)實驗室管理要求,合同評審資料作為原始記錄的一部分需要保存一定期限,在存儲的過程中需要人工排序、標記以便后續(xù)查閱與歸還。此管理過程也需花費大量人力與時間、管理難度大。紙質(zhì)版資料經(jīng)過長時間存儲后也會產(chǎn)生破損,導致資料缺失。
而標準信息化管理模式作為一種新型的技術機構管理模式,能夠有效解決傳統(tǒng)的紙質(zhì)管理模式當中存在的問題,實現(xiàn)標準化統(tǒng)一管理,從而提高技術機構的管理質(zhì)量和管理水平,使技術機構的工作更加科學、公正、及時、可靠[1]。通過研制與建立一種新型的基于OCR技術的實驗室合同評審資料信息化管理方法,能有效地解決傳統(tǒng)的實驗室合同評審資料管理所存在的問題。
因此,轉換為電子文檔系統(tǒng)存儲是當前合同評審資料儲存的重要方向。目前將紙質(zhì)版文件資料數(shù)字化的普遍技術有縮微技術、掃描技術。合同評審資料的紙張品種較多,包含復印紙、印刷紙和不規(guī)則大小附件紙張,部分紙質(zhì)申請表含有布樣和訂書釘?shù)雀郊???s微技術是將文獻、工程圖紙以圖片等信息縮攝到縮微膠片上,并加以保存和利用??s微技術以膠片為信息載體,采用感光攝影原理,是目前一種比較成熟的文獻資料全文真跡存貯技術[2]。具有保存時間長和法律效力等特點,但是成本高、操作復雜,不適用于實驗室紙質(zhì)合同評審資料電子存檔。掃描技術分為普通掃描和高速掃描,普通掃描是通過掃描儀對紙質(zhì)申請表進行掃描,速度較慢并且繁瑣,另外由于紙質(zhì)申請表存在紙張褶皺、紙張大小品種不一以及含有布樣、訂書釘?shù)任锲罚浅H菀卓ㄔ趻呙鑳x的擦紙輪上,導致?lián)p壞設備。所以掃描技術也不適合紙質(zhì)申請表電子存檔。高拍儀是近年來研制的新產(chǎn)品,也稱速影儀或速拍儀。具有折疊式的超便捷設計,體積只有普通掃描儀的1/10,紙質(zhì)版協(xié)議書只需放置在掃描區(qū)域,無需過機就能在一秒鐘內(nèi)完成高速掃描,并具有OCR文字和條形碼識別功能。與此同時還具有拍照、錄像、復印、網(wǎng)絡無紙傳真、制作電子書等眾多功能。高拍儀的上述特征能滿足紙質(zhì)申請表電子存檔的需求。
所謂OCR(Optical Character Recognition光學字符識別)技術,是指利用電子設備(例如高拍儀)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程。采用OCR技術實現(xiàn)實驗室合同評審資料管理與傳統(tǒng)合同評審資料人工管理相比,優(yōu)勢首先在于操作簡便高效、降低差錯率、節(jié)約人工成本,同時也適用于實驗室其他原始記錄資料管理,具備適用范圍廣和推廣性強等特點,是當前實驗室科學高效管理的方向。
基于OCR技術的實驗室合同評審資料信息化管理的實現(xiàn)離不開條形碼識別技術、光學字符識別(OCR)技術、高拍儀技術和計算機軟件系統(tǒng)的運用。其中硬件包括條形碼打印機、標簽紙、高拍儀、計算機,硬件系統(tǒng)結構如圖1所示:
圖1 硬件裝置圖
資料合同評審前需預先使用條形碼打印機在標簽紙上打印出需要使用的條形碼。條形碼上面的信息是由九位數(shù)的流水號組成、每個條形碼的信息是唯一的。合同評審時,需把條形碼粘貼到樣品袋上面,與此同時為了解決相應的合同評審資料經(jīng)過掃描后、保存時能自動以條形碼信息命名文件的需求,將受理的報告編號由單一編號設計成上下兩個相同的子母樣品編號條碼[3],如圖2所示。母編號貼在樣品袋上,子編號貼在對應申請表上。粘貼在紙質(zhì)申請單上面的子編號條形碼的使用,為高拍儀自動識別申請表上報告編號提供了基礎,并作為該份合同評審資料的唯一識別碼流轉、保存。
圖2 條形碼標簽設計
具有高速掃描功能、條形碼自動識別與命名功能、光學字符識別(OCR)功能的高拍儀對紙質(zhì)版合同評審資料進行高速掃描、對條形碼自動識別及命名。計算機則負責控制高拍儀工作,運行相關操作系統(tǒng)。
軟件系統(tǒng)包括高拍儀合同評審資料信息自動識別系統(tǒng);高拍儀合同評審資料掃描、文件名識別系統(tǒng);計算機電子文檔導入和查詢系統(tǒng)。
信息自動識別系統(tǒng)主要是通過高拍儀的OCR文字識別技術對印刷體的合同評審資料進行文字識別,將其上面的信息轉換為電子文本格式,以便將信息導入相應的系統(tǒng)中;
掃描、文件名識別系統(tǒng)則是將紙質(zhì)版資料通過高拍儀轉換為電子版圖片格式并能識別資料上的條形碼以此命名文件名;
電子文檔導入和查詢系統(tǒng)負責將已經(jīng)處理好的合同評審資料電子文檔導入到相應的系統(tǒng)當中,并能按條件查詢。
本系統(tǒng)主要利用高拍儀光學字符識別(OCR)技術自動識別合同評審資料上的字體,形成電子文檔,達到實際應用要求。系統(tǒng)實施流程如圖3所示;系統(tǒng)操作界面圖如圖4所示。
圖4 高拍儀合同評審資料信息自動識別系統(tǒng)操作界面及識別效果圖
具體的操作流程是首先將合同評審資料放置在高拍儀指定的掃描區(qū)域,通過自動識別系統(tǒng)對需要識別部位進行框選、不需識別部位進行剔除,然后對框選部位進行OCR文字識別,若紙質(zhì)版申請表掃描出來的圖片質(zhì)量好、圖片清晰、不需識別部位剔除完整、識別率高則可形成電子文檔,否則需重新調(diào)整紙質(zhì)版申請表的位置及高拍儀的參數(shù),重新對紙質(zhì)版申請表進行OCR文字識別。從而將識別出來的信息轉換到相應系統(tǒng)當中,替代了傳統(tǒng)的通過人工逐字逐句地錄入到系統(tǒng)當中,實現(xiàn)了實驗室合同評審資料從人工管理到信息化管理的轉化。
掃描、文件名識別系統(tǒng)主要負責將紙質(zhì)版合同評審資料轉換為電子版格式,并與此同時能自動識別資料上的樣品條形碼,以識別的條形碼信息來命名文件存儲在指定文件夾中。系統(tǒng)實施流程如圖5所示;系統(tǒng)操作界面如圖6所示。
圖5 高拍儀合同評審資料掃描、文件名識別系統(tǒng)流程圖
圖6 高拍儀合同評審資料掃描、文件名識別系統(tǒng)操作界面圖
4.2.1 掃描功能
高拍儀的技術是近年來研制的新產(chǎn)品,也稱速影儀或速拍儀。具有折疊式的超便捷設計,體積只有普通掃描儀的1/10,能在一秒鐘完成高速掃描,將紙質(zhì)版資料轉換為電子文檔,滿足我們的需求。
4.2.2 條形碼識別及自動命名文件名功能
運用高拍儀的條形碼識別技術實現(xiàn)了對合同評審資料掃描的同時,對該份文件上的樣品編碼進行識別。若在掃描的過程中存在無法掃描的情況,系統(tǒng)會相應地提醒,提示該條形碼無法識別需重新掃描;另外對于同一份合同評審資料存在兩個或者多個連續(xù)的條形碼的時候,系統(tǒng)會以連號的格式進行識別。將識別的樣品編號命名電子文檔文件名,單個樣品編號條形碼直接命名,兩個或多個連號樣品編號條形碼命名中間加間隔號“-”,從而解決了一份合同評審資料要拆分成多份報告書的情況。
4.2.3 自動合成功能
掃描到含有附件的紙質(zhì)版申請表,可以自動合成到已掃描的電子文檔中,從而解決了合同評審資料有多頁資料的情況。
4.2.4 保存及計數(shù)功能
對于已掃描的合同評審資料電子文檔放到指定文件夾中保存,以便電子文檔導入和查詢系統(tǒng)對電子文檔進行上傳操作,并且可以現(xiàn)場對已掃描的文件進行計數(shù),核對紙質(zhì)版申請表掃描數(shù)量是否正確。
電子文檔導入和查詢系統(tǒng)主要負責將經(jīng)過識別的電子文檔導入系統(tǒng)數(shù)據(jù)庫中,并且可以根據(jù)相應的信息查詢導入的信息。系統(tǒng)實施流程如圖7所示;系統(tǒng)操作界面如圖8所示。
4.3.1 導入功能
根據(jù)預先設置導入的文件夾路徑,系統(tǒng)從該文件夾中抓取已掃描并命名好的合同評審資料電子文檔,并批量導入數(shù)據(jù)庫中,快速便捷。有效地提高了工作效率。
圖7 計算機電子文檔導入和查詢系統(tǒng)流程圖
圖8 計算機電子文檔導入和查詢系統(tǒng)操作界面圖
4.3.2 自動識別功能
按合同評審資料電子文檔文件名導入數(shù)據(jù)庫,系統(tǒng)自動辨別單個或者連號的電子文檔文件名并以此為導入數(shù)據(jù)庫后該文件的文件名;從而改變了需要人工輸入報告編號與掃描后的合同評審資料建立一一對應的操作方法。此功能的完善有效地解決了合同評審資料存儲慢且勞動強度高的問題,讓合同評審資料快速準確地保存。
4.3.3 提醒、人工糾正及保存功能
當保存的文件名出現(xiàn)錯誤的時候,系統(tǒng)能做出提醒,并進行手動更改。對于沒問題的掃描資料進行保存。此功能保證了紙質(zhì)版合同評審資料在存儲的過程中出現(xiàn)問題時,能及時有效地發(fā)現(xiàn)并解決問題,從而為合同評審資料能有效快速地存儲提供保障。
基于OCR技術的實驗室合同評審資料信息化管理的應用研究,實現(xiàn)了實驗室合同評審資料信息化管理的目的,優(yōu)化了整個工作流程,從而達到資源共享和節(jié)能環(huán)保的效果,有利于紙質(zhì)實驗室合同評審資料長久保存,并對提高工作效率、減少差錯,有著非常重要的實用意義。具體效果如下:
(1)優(yōu)化流程。紙質(zhì)申請表經(jīng)過電子存檔后直接存儲并自動形成打包單號。大大改善了傳統(tǒng)管理辦法的不足,并省去了按紙質(zhì)申請表編號排序及分類工序,提高工作效率。
(2)資源共享、節(jié)能環(huán)保。查閱者可以通過系統(tǒng)隨時查閱紙質(zhì)申請表電子文檔,不受時間、地點和數(shù)量的限制,節(jié)約查詢時間。
(3)長久保存。紙質(zhì)申請表比較薄,經(jīng)過排序、查詢等工序,保存時間過長,往往不堪重負,出現(xiàn)損毀現(xiàn)象,紙質(zhì)申請表形成電子文檔可以實現(xiàn)長久保存。
(4)提高工作效率、減少差錯。各個流程中由人工錄入的信息優(yōu)化為系統(tǒng)自動識別,實現(xiàn)信息化管理。