文/中國(guó)電子科技集團(tuán)公司第五十一研究所 沈玉瑾
二〇〇〇年,我國(guó)制定了《全國(guó)檔案事業(yè)發(fā)展“十五”計(jì)劃》,在“工作任務(wù)—檔案的信息化建設(shè)”中明確提出:“加快現(xiàn)有檔案的數(shù)字化進(jìn)程。在北京、天津、遼寧、上海、陜西、青島等地開展檔案工作應(yīng)用數(shù)字化和網(wǎng)絡(luò)化技術(shù)的試點(diǎn)?!蓖荒甑摹度珖?guó)檔案信息化建設(shè)實(shí)施綱要》中又明確提出:“積極推進(jìn)檔案數(shù)字化進(jìn)程,加強(qiáng)對(duì)珍貴、重要檔案的保護(hù),提高檔案利用的效率和水平?!眹?guó)家檔案局新修訂的《紙質(zhì)檔案數(shù)字化規(guī)范》(DA/T31-2017)也于2018年1月1日起頒布實(shí)施。
(一)紙質(zhì)檔案數(shù)字化的定義。紙質(zhì)檔案數(shù)字化(digitization of paper-based records)是采用掃描儀等數(shù)碼設(shè)備對(duì)紙質(zhì)檔案進(jìn)行數(shù)字化加工處理,使其轉(zhuǎn)化為可以存儲(chǔ)在磁帶、磁盤、光盤等載體上的數(shù)字圖像,并且按照紙質(zhì)檔案所存在的內(nèi)在聯(lián)系,建立起目錄數(shù)據(jù)與數(shù)字圖像關(guān)聯(lián)關(guān)系的處理過(guò)程。
(二)紙質(zhì)檔案數(shù)字化的主要步驟。紙質(zhì)檔案數(shù)字化主要包括:紙質(zhì)檔案的出庫(kù)、紙質(zhì)檔案數(shù)字化的預(yù)處理、建立目錄數(shù)據(jù)庫(kù)、紙質(zhì)檔案的數(shù)字化加工、圖像處理、數(shù)據(jù)掛接、驗(yàn)收與移交入庫(kù)。
(一)實(shí)現(xiàn)檔案信息的共享,提供便捷服務(wù)。檔案的信息化建設(shè)是現(xiàn)代檔案管理的重要任務(wù)之一,以數(shù)字化的形式存儲(chǔ),利用計(jì)算機(jī)系統(tǒng)進(jìn)行管理,以網(wǎng)絡(luò)化的形式互相聯(lián)系,形成一個(gè)有序的檔案信息結(jié)構(gòu)庫(kù),實(shí)現(xiàn)檔案資源的信息在線利用,使可以公開的檔案資源得到共享。運(yùn)用數(shù)字化、信息化技術(shù),把檔案變成有用的信息資源,迅速、快捷地為利用者提供服務(wù),是檔案數(shù)字化最根本的目的。
(二)作為紙質(zhì)檔案的數(shù)字副本起憑證作用。紙質(zhì)檔案通過(guò)數(shù)字化的過(guò)程成為紙質(zhì)檔案的數(shù)字副本。紙質(zhì)檔案數(shù)字副本主要用于重要檔案異質(zhì)備份及網(wǎng)絡(luò)化查檔利用,其作用是代替檔案原件為利用者提供憑證,這對(duì)紙質(zhì)檔案數(shù)字副本的憑證效力提出了較高要求。
1.紙質(zhì)檔案數(shù)字化加工場(chǎng)地的選擇,應(yīng)方便紙質(zhì)檔案的搬移,如:出庫(kù)和入庫(kù)。2.掃描儀選擇對(duì)數(shù)字化圖像質(zhì)量的影響很大,掃描設(shè)備的合理選用非常重要。所以,需要重點(diǎn)分析掃描設(shè)備的掃描速度、寬度、厚度、色彩、光學(xué)分辨率等。紙質(zhì)檔案一般都是由多種幅面的紙張組成,因此數(shù)字化加工應(yīng)當(dāng)根據(jù)紙質(zhì)檔案的實(shí)際情況、數(shù)字化目的和數(shù)字化規(guī)模、計(jì)算機(jī)網(wǎng)絡(luò)及存儲(chǔ)條件等選擇相應(yīng)設(shè)備,并進(jìn)行相關(guān)參數(shù)的設(shè)定。除配備一般的掃描儀外,對(duì)底圖圖紙應(yīng)配備大幅面的掃描儀,對(duì)于極其珍貴的不可拆紙質(zhì)檔案建議配備非接觸掃描的書刊掃描儀。盡可能采用對(duì)紙質(zhì)檔案實(shí)體破壞性最小的數(shù)碼設(shè)備進(jìn)行數(shù)字化處理,并按相關(guān)設(shè)備的使用率進(jìn)行定期維護(hù)、保養(yǎng)。
(一)建立紙質(zhì)檔案數(shù)字化的工作機(jī)構(gòu)。建立紙質(zhì)數(shù)字化工作組織,對(duì)數(shù)字化工作進(jìn)行統(tǒng)籌規(guī)劃、協(xié)調(diào)管理、組織實(shí)施、監(jiān)督檢查等,便于紙質(zhì)檔案數(shù)字化工作的順利開展。為今后科學(xué)、規(guī)范開展數(shù)字化工作提供組織保障。
(二)制定紙質(zhì)檔案數(shù)字化過(guò)程所需的規(guī)章制度與程序。檔案包含很多重要的資料,有的會(huì)涉及國(guó)家秘密、企業(yè)的商業(yè)秘密等,出于對(duì)企業(yè)信息安全和國(guó)家秘密安全的考慮,對(duì)紙質(zhì)檔案數(shù)字化加工過(guò)程中應(yīng)建立紙質(zhì)檔案數(shù)字化安全保密制度,制定紙質(zhì)檔案數(shù)字化加工過(guò)程管理、紙質(zhì)檔案實(shí)體交接程序、紙質(zhì)檔案數(shù)字化成果驗(yàn)收與交接、存儲(chǔ)介質(zhì)管理、檔案實(shí)體保護(hù)等操作規(guī)程或規(guī)章制度,采取必要的保密管理措施。
(三)紙質(zhì)檔案數(shù)字化過(guò)程的安全保密管理。1.制定紙質(zhì)檔案數(shù)字化加工場(chǎng)所的管理制度,對(duì)數(shù)字化加工場(chǎng)所的人員進(jìn)行嚴(yán)格控制,出入時(shí)進(jìn)行人員登記和身份認(rèn)證,嚴(yán)禁無(wú)關(guān)人員進(jìn)入數(shù)字化加工場(chǎng)所;數(shù)字化加工人員應(yīng)參加保密教育,簽訂保密協(xié)議和個(gè)人保密承諾書。2.紙質(zhì)檔案數(shù)字化加工場(chǎng)所需安裝防盜報(bào)警裝置、視頻監(jiān)控和電子門禁系統(tǒng)。并配備性能良好,數(shù)量足夠的滅火器材,安裝防火、防煙報(bào)警裝置;嚴(yán)禁拍照,禁止帶入具有攝錄功能的電子產(chǎn)品,如:錄像機(jī)、照相機(jī)、手機(jī)等。3.根據(jù)紙質(zhì)檔案數(shù)字化計(jì)劃,嚴(yán)格按照檔案管理制度控制檔案的出、入庫(kù),按文件目錄逐件清點(diǎn)、檢查,辦理交接手續(xù)。認(rèn)真填寫檔案交接登記表,登記所需掃描檔案的件數(shù)、頁(yè)數(shù)等,掃描完成后,按目錄順序放回檔案盒內(nèi)?;謴?fù)時(shí)應(yīng)注意檔案的排列順序,做到準(zhǔn)確不錯(cuò)位無(wú)遺漏。
(一)專業(yè)化修復(fù)。為確保數(shù)字化加工圖像質(zhì)量,應(yīng)對(duì)粘連、破損、殘缺、褶皺等的檔案進(jìn)行專業(yè)化修復(fù)。數(shù)字化圖像加工人員依據(jù)目錄信息以及數(shù)字化規(guī)范、細(xì)則等,對(duì)檔案進(jìn)行順序掃描,形成PDF、JPEG或TIFF等通用格式圖像,并進(jìn)一步命名核對(duì)。
(二)針對(duì)不同的檔案采用不同的模式進(jìn)行掃描。對(duì)于頁(yè)面中有紅頭、印章或有插圖、照片、多色彩文字等的檔案,運(yùn)用彩色模式進(jìn)行掃描;對(duì)不帶插圖、字跡清晰、黑白兩色的檔案,采用黑白模式進(jìn)行掃描;但對(duì)于字跡清晰度差或帶有插圖,頁(yè)面為黑白兩色的檔案,采用灰度模式掃描。
(三)掃描分辨率參數(shù)大小的設(shè)置。原則上以掃描后的圖像是否清晰、是否完整及不影響圖像的使用效果為準(zhǔn)。采用彩色、灰度、黑白等不同模式進(jìn)行掃描時(shí),其分辨率應(yīng)不小于200dpi。對(duì)于文字偏小、密集度高、清晰度較差等或者需要高精度仿真復(fù)制的,應(yīng)將分辨率提高以滿足需求。
(四)對(duì)圖像清晰度、偏斜度、失真度等進(jìn)行自查。發(fā)現(xiàn)不符合圖像質(zhì)量要求的,應(yīng)對(duì)圖像重新進(jìn)行處理。對(duì)偏斜、方向不正確的圖像進(jìn)行旋轉(zhuǎn)、糾偏等還原處理,以適應(yīng)閱讀習(xí)慣;對(duì)圖像頁(yè)面中出現(xiàn)的雜質(zhì)等進(jìn)行去污處理,但不能改變檔案原貌。
(五)減小存儲(chǔ)容量。圖像的存儲(chǔ)在保證圖像清晰可讀的情況下,盡量以減小存儲(chǔ)容量為準(zhǔn)則。一般來(lái)說(shuō),紙質(zhì)的文字文檔采用PDF格式,圖紙采用JPEG格式。
(六)數(shù)字化圖像質(zhì)量檢查。數(shù)字化圖像質(zhì)量的檢查是紙質(zhì)檔案數(shù)字化過(guò)程質(zhì)量控制的核心,必須嚴(yán)格按照質(zhì)量規(guī)范和技術(shù)標(biāo)準(zhǔn),對(duì)數(shù)字化圖像質(zhì)量進(jìn)行系統(tǒng)的、全面的、有步驟的檢查、監(jiān)督。為保證數(shù)字化質(zhì)量,制定合理、有效的分級(jí)、分步質(zhì)檢程序。在項(xiàng)目加工過(guò)程中,按照數(shù)字化加工要求,采取100%原檔與數(shù)字化圖像進(jìn)行比對(duì),對(duì)數(shù)字圖像清晰、失真度、圖像旋轉(zhuǎn)、拼接、糾偏等每一個(gè)項(xiàng)目進(jìn)行檢查、比對(duì),檢查圖像信息的準(zhǔn)確性及完整性。對(duì)不符合圖像質(zhì)量要求的重新進(jìn)行掃描處理。
(七)紙質(zhì)檔案數(shù)字化的驗(yàn)收采用計(jì)算機(jī)自動(dòng)預(yù)檢和人工檢驗(yàn)相結(jié)合的方式。1.計(jì)算機(jī)自動(dòng)預(yù)檢。預(yù)先定義掃描處理單據(jù),建立表格識(shí)別模塊、表格登錄模塊,將掃描得到的圖像通過(guò)OCR識(shí)別技術(shù)對(duì)目錄、圖像、掛接、載體4大類項(xiàng)目進(jìn)行100%的機(jī)檢。例如:目錄中字段的格式、數(shù)字化參數(shù)等是否符合規(guī)范。檢驗(yàn)合格率應(yīng)達(dá)到100%。2.人工抽檢。抽取比例5%-20%的案卷,(自動(dòng)預(yù)檢報(bào)告生成的問(wèn)題案卷和隨機(jī)抽取案卷)與紙質(zhì)檔案進(jìn)行比對(duì),確保抽檢數(shù)據(jù)覆蓋范圍及抽檢效果。3.復(fù)檢。根據(jù)檢測(cè)報(bào)告對(duì)發(fā)現(xiàn)的問(wèn)題逐一改正,并提交整改清單,驗(yàn)收人員對(duì)照整改清單逐條進(jìn)行對(duì)比復(fù)檢。
紙質(zhì)檔案數(shù)字化是企業(yè)實(shí)現(xiàn)檔案信息化管理一個(gè)重要的過(guò)程,加工過(guò)程管理需要一個(gè)完整而有序的保障體系。將企業(yè)檔案數(shù)字化建設(shè)推向更高的層次,為企業(yè)數(shù)字檔案館的建設(shè)提供強(qiáng)有力的保障,推動(dòng)檔案信息服務(wù)工作更加規(guī)范、更加安全、更加便捷、更加有效。