国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

《紙質(zhì)檔案數(shù)字化規(guī)范》(DA/T 31—2017)要點解讀及內(nèi)容分析

2020-07-28 04:42楊千
北京檔案 2020年7期
關(guān)鍵詞:紙質(zhì)檔案行業(yè)標準數(shù)字化

楊千

摘要:國家檔案局頒布的《紙質(zhì)檔案數(shù)字化規(guī)范》(DA/T 31—2017)是為適應(yīng)數(shù)字化技術(shù)水平顯著提升、管理要素日漸復(fù)雜和檔案保護需求迫切的新形勢而制定的。它具有系統(tǒng)性、科學(xué)性和適時性的特點。本文通過對比前一版本及聯(lián)系相關(guān)標準,對其結(jié)構(gòu)和主要內(nèi)容進行了分析和解讀,并指出其存在術(shù)語和定義數(shù)量不足、質(zhì)量有待提升,部分條目集中度不夠和部分標題與內(nèi)容不對應(yīng)等不足。

關(guān)鍵詞:紙質(zhì)檔案 數(shù)字化 管理 行業(yè)標準

我國自20世紀末就開始了紙質(zhì)檔案的數(shù)字化工作,從試點探索到漸成體系,各類標準規(guī)范在這一過程中發(fā)揮了關(guān)鍵作用,2005年發(fā)布的《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》(DA/T 31—2005)[1](以下簡稱“2005年《規(guī)范》”)便是其中最為重要的一部。然而,十多年過去了,我國的數(shù)字化環(huán)境發(fā)生了重大變化。技術(shù)手段方面,數(shù)字設(shè)備、存儲條件、網(wǎng)絡(luò)等都已完成數(shù)輪更新?lián)Q代;管理要求方面,由于紙質(zhì)檔案數(shù)字化所涉及的要素和環(huán)節(jié)日益復(fù)雜,全程管理和精細化管理成為必須;政策環(huán)境方面,“保障檔案實體和原件安全”在2014年的《關(guān)于加強和改進新形勢下檔案工作的意見》中被特別強調(diào)。面對新形勢,2005年《規(guī)范》已難以滿足紙質(zhì)檔案數(shù)字化的現(xiàn)實要求。因此,經(jīng)全面調(diào)研和科學(xué)組織,國家檔案局于2017年8月2日發(fā)布了新的《紙質(zhì)檔案數(shù)字化規(guī)范》(DA/T 31—2017)[2](以下簡稱《規(guī)范》),代替2005年《規(guī)范》。本文分析了《規(guī)范》結(jié)構(gòu)內(nèi)容方面的特點,并對其不足之處提出了改進意見。

一、《規(guī)范》的結(jié)構(gòu)變化

在2005年《規(guī)范》的基礎(chǔ)上,《規(guī)范》對結(jié)構(gòu)進行了部分調(diào)整,主要表現(xiàn)在以下方面:

第一,增加了較大幅面的組織與管理部分的內(nèi)容,從機構(gòu)及人員、基礎(chǔ)設(shè)施到檔案數(shù)字化外包均有所覆蓋,而原先零散的管理與組織要求則得以整合。此外,附錄部分還增加了“紙質(zhì)檔案數(shù)字化流程示例”“紙質(zhì)檔案數(shù)字化前處理工作單”等參考性圖表,進一步規(guī)范了紙質(zhì)檔案數(shù)字化工作。

第二,刪除了“數(shù)據(jù)備份”和“數(shù)字化成果管理”兩章內(nèi)容,使規(guī)范更加聚焦數(shù)字化工作本身。

第三,調(diào)整了章節(jié)間的次序,使規(guī)范的邏輯線索更為明晰,數(shù)字化流程間的銜接更為合理。如“目錄數(shù)據(jù)庫建立”從原來的“檔案掃描”后提前到了“數(shù)字化前處理”后。

第四,跨章節(jié)合并同類內(nèi)容。例如,原本獨立成章的“圖像存儲”部分,在《規(guī)范》中被整合到第9章“檔案掃描”,成為其中的一節(jié),這樣的調(diào)整使《規(guī)范》內(nèi)容更緊湊。具體變化可見下表。

二、《規(guī)范》的特點

《規(guī)范》是國家檔案局根據(jù)實踐環(huán)境的變化及紙質(zhì)檔案數(shù)字化工作的現(xiàn)實要求做出的相應(yīng)調(diào)整,從其主要內(nèi)容來看,具有系統(tǒng)性、科學(xué)性和適時性的特點。

(一)系統(tǒng)性。與2005年《規(guī)范》相比,新《規(guī)范》的顯著變化是其標題由“紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范”修改為“紙質(zhì)檔案數(shù)字化規(guī)范”,去掉了“技術(shù)”一詞,并將組織與管理部分單列為一章,完善了數(shù)字化工作中管理的相關(guān)要求,這些改動體現(xiàn)了國家檔案局對紙質(zhì)檔案數(shù)字化工作系統(tǒng)性建設(shè)的重視。在紙質(zhì)檔案數(shù)字化工作早期,更多單純強調(diào)檔案載體和信息的轉(zhuǎn)換與遷移,且由于經(jīng)驗不足,摸索前行,因而當時所制定的標準技術(shù)色彩濃厚,將紙質(zhì)檔案數(shù)字化工作簡單化。隨著實踐的發(fā)展,數(shù)字化所涉及的各要素和環(huán)節(jié)等都日益復(fù)雜,尤其是數(shù)字化外包工作的興盛,使得對數(shù)字化工作的整體與全流程管理成為新的關(guān)注點。一方面,紙質(zhì)檔案數(shù)字化工作包含人員、設(shè)備、網(wǎng)絡(luò)等諸多內(nèi)容,欲使這些內(nèi)容高效融合在一起并協(xié)調(diào)運作,離不開精細化的管理;另一方面,檔案部門在與外包公司合作的過程中,也需要通過管理來保障檔案的完整與安全。管理部分的加入,提升了《規(guī)范》內(nèi)容的系統(tǒng)性。

(二)科學(xué)性。《規(guī)范》的科學(xué)性主要體現(xiàn)在其對檔案管理理念的吸收方面。一是尊重檔案的內(nèi)在有機聯(lián)系性?!兑?guī)范》在定義“紙質(zhì)檔案數(shù)字化”時指出,數(shù)字化過程還包括“按照紙質(zhì)檔案的內(nèi)在聯(lián)系,建立起目錄數(shù)據(jù)與數(shù)字圖像關(guān)聯(lián)關(guān)系的處理過程”。此外,還提出“數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計應(yīng)特別注意保持檔案的內(nèi)在聯(lián)系,有利于紙質(zhì)檔案數(shù)字化成果的管理與利用”。保持文件間的有機聯(lián)系不僅能使之排列有序、檢索高效,還能夠最大程度上確保檔案信息的完整性,體現(xiàn)出整個活動的全貌,從而更好地發(fā)揮其價值[3]。將模擬態(tài)的檔案轉(zhuǎn)化成數(shù)字態(tài),其內(nèi)在聯(lián)系也需借助數(shù)字手段加以維系。二是注重保證檔案的原始面貌及活動記錄的原始性?!兑?guī)范》要求“紙質(zhì)檔案在數(shù)字化處理過程中不得去除檔案頁面原有的紙張蛻變斑點、水漬、污點、裝訂孔等痕跡”,在于盡可能使數(shù)字化檔案保持紙質(zhì)原貌?!兑?guī)范》還提出紙質(zhì)檔案數(shù)字化過程中形成的各類元數(shù)據(jù)與相關(guān)文件應(yīng)妥善保存,不僅為紙質(zhì)檔案數(shù)字化提供了背景信息,也為后期溯源留存了依據(jù)。

(三)適時性?!兑?guī)范》是為響應(yīng)信息化發(fā)展和紙質(zhì)檔案數(shù)字化實踐變化而出臺的,因而具有很強的適時性。一方面,隨著存儲能力的迅速提升,以往對紙質(zhì)檔案數(shù)字化形成較多限制的存儲容量和存儲費用如今已不再是最大的難點。因而《規(guī)范》去掉了“縮小圖像文件的容量,節(jié)省存儲”等相關(guān)內(nèi)容,與此同時,還要求數(shù)字化應(yīng)盡量保留原件上的信息,采用彩色掃描,提升圖像分辨率等。另一方面,技術(shù)及設(shè)備及人為活動具有的不穩(wěn)定性給檔案安全帶來了隱患,對此,《規(guī)范》在數(shù)字化工作的各個環(huán)節(jié)均強調(diào)檔案實體安全的重要性。此外,與外包公司合作成了檔案部門進行檔案數(shù)字化的普遍選擇?!兑?guī)范》關(guān)聯(lián)參考《文獻檔案資料數(shù)字化工作導(dǎo)則》(GB/T 20530—2006)和《檔案數(shù)字化外包安全管理規(guī)范》(檔辦法〔2014〕7號),對檔案數(shù)字化外包提出了相應(yīng)的要求。

三、《規(guī)范》主要內(nèi)容解讀

《規(guī)范》共有13章和2個資料性附錄,正文包括:范圍、規(guī)范性引用文件、術(shù)語和定義、總則、組織與管理、檔案出庫、數(shù)字化前處理,目錄數(shù)據(jù)庫建立、檔案掃描、圖像處理、數(shù)據(jù)掛接、數(shù)字化成果驗收與移交、檔案歸還入庫。附錄包括:附錄A《紙質(zhì)檔案數(shù)字化流程示例》(1張流程圖)、附錄B《紙質(zhì)檔案數(shù)字化登記表示例》(共8個表格)。

(一)《規(guī)范》的適用范圍?!兑?guī)范》的工作范圍是:規(guī)定了紙質(zhì)檔案數(shù)字化技術(shù)和管理要求。說明《規(guī)范》融合了數(shù)字化技術(shù)與管理兩項內(nèi)容?!兑?guī)范》適用于采用掃描設(shè)備對紙質(zhì)檔案進行數(shù)字化加工過程的管理?!兑?guī)范》并沒有指明特定的適用對象,只要是進行紙質(zhì)檔案數(shù)字化操作,無論是檔案部門自主數(shù)字化,還是將數(shù)字化外包,均可參照《規(guī)范》的相關(guān)內(nèi)容執(zhí)行。

(二)術(shù)語和定義。較之2005年《規(guī)范》,新《規(guī)范》的術(shù)語和定義有所精簡,由原先的9個縮減到4個,刪除了“黑白二值圖像”“連續(xù)色調(diào)靜態(tài)圖像”“失真度”“可懂度”“圖像壓縮”5個單純技術(shù)類的術(shù)語,保留了“數(shù)字化”“數(shù)字圖像”“紙質(zhì)檔案數(shù)字化”和“分辨率”4個必要的術(shù)語。

《規(guī)范》對“數(shù)字化”的定義是“利用計算機技術(shù)將模擬信號轉(zhuǎn)換為數(shù)字信號的處理過程”,簡潔明了,一方面說明了數(shù)字化是一個轉(zhuǎn)換過程,另一方面表明了轉(zhuǎn)換前后的本質(zhì)差別,即從模擬信號到數(shù)字信號。國際標準Electronic document management—Design and operation of an information system for the pres? ervation of electronic documents—Specifications(ISO 14641—2018)對數(shù)字化的定義是:將模擬文件(紙張、縮微格式、膠片、模擬音頻或視聽磁帶)轉(zhuǎn)換為數(shù)字格式,以便保存或處理[4]??梢园l(fā)現(xiàn),《規(guī)范》所使用“模擬信號”“數(shù)字信號”相較“模擬文件”和“數(shù)字格式”具有更大的包容性。

《規(guī)范》將“紙質(zhì)檔案數(shù)字化”定義為:采用掃描儀等設(shè)備對紙質(zhì)檔案進行數(shù)字化加工,使其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上的數(shù)字圖像,并按照紙質(zhì)檔案的內(nèi)在聯(lián)系,建立起目錄數(shù)據(jù)與數(shù)字圖像關(guān)聯(lián)關(guān)系的處理過程。該定義明確了數(shù)字化所需使用的主要設(shè)備為掃描儀,因技術(shù)發(fā)展較快,新型設(shè)備也層出不窮,所以只選取典型代表加以說明;與2005年《規(guī)范》不同的是,《規(guī)范》強調(diào)所建立的目錄數(shù)據(jù)需按照紙質(zhì)檔案的內(nèi)在聯(lián)系與數(shù)字圖像形成關(guān)聯(lián)關(guān)系,將紙質(zhì)檔案所蘊含的有機聯(lián)系在數(shù)字環(huán)境下也同步呈現(xiàn)。

《規(guī)范》對“數(shù)字圖像”的定義是:表示實物圖像的整數(shù)陣列。一個二維或更高維的采樣并量化的函數(shù),由相同位數(shù)的連續(xù)圖像產(chǎn)生。與數(shù)字圖像密切聯(lián)系的術(shù)語“分辨率”則被闡釋為:單位長度內(nèi)圖像包含的點數(shù)或像素數(shù),一般用每英寸點數(shù)(dpi)表示。

(三)總則。總則首先明確了紙質(zhì)檔案數(shù)字化工作開展的依據(jù):各單位應(yīng)根據(jù)檔案的珍貴程度、開放程度、利用率、亟待搶救程度、數(shù)字化資金情況等因素,統(tǒng)籌規(guī)劃,科學(xué)開展紙質(zhì)檔案數(shù)字化工作。這表明紙質(zhì)檔案數(shù)字化工作的進行需要協(xié)調(diào)諸多影響因素。在我國,不同地域、不同級別的檔案館發(fā)展水平并不一致,所能承擔(dān)的數(shù)字化任務(wù)也有所差別,因而,各檔案館應(yīng)根據(jù)自己的實際情況來開展數(shù)字化工作,對珍貴的、亟待搶救的和利用率高的開放檔案優(yōu)先進行數(shù)字化。當然,還必須以單位資金水平為前提,不能盲目進行。同時,紙質(zhì)檔案數(shù)字化是一項系統(tǒng)工作,須統(tǒng)籌規(guī)劃、科學(xué)開展,以避免草率決定,威脅檔案原件的安全,影響數(shù)字化成果質(zhì)量。

總則明確了紙質(zhì)檔案數(shù)字化的基本環(huán)節(jié),包括:數(shù)字化前處理、目錄數(shù)據(jù)庫建立、檔案掃描、圖像處理、數(shù)據(jù)掛接、數(shù)字化成果驗收和移交等。

總則強調(diào),應(yīng)確保紙質(zhì)檔案數(shù)字化成果質(zhì)量,包括兩個方面的內(nèi)容。其一,遵循檔案管理的客觀規(guī)律,真實反映檔案內(nèi)容,最大限度地展現(xiàn)檔案原貌。其二,在紙質(zhì)檔案數(shù)字化過程中,用保存數(shù)字化項目信息、技術(shù)環(huán)境、各類數(shù)字化技術(shù)參數(shù)等方面的元數(shù)據(jù)。元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),它記錄著技術(shù)與管理活動的背景信息,將數(shù)字化過程中的元數(shù)據(jù)系統(tǒng)保存有助于后期對數(shù)字化成果的管理、分析和利用。

檔案的安全問題也是紙質(zhì)檔案數(shù)字化的重要關(guān)切。一方面,應(yīng)加強紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全管理,確保檔案實體和檔案信息的安全;另一方面,在加工涉密檔案時,應(yīng)按照涉密檔案相關(guān)保密要求開展工作。

(四)組織與管理。組織與管理部分的加入是《規(guī)范》的一個亮點,它不僅反映了日益復(fù)雜的數(shù)字化環(huán)境所提出的現(xiàn)實要求,也反映了標準制定部門思維的轉(zhuǎn)變,即摒棄將紙質(zhì)檔案數(shù)字化工作視為簡單的技術(shù)工作,而將系統(tǒng)科學(xué)的組織與管理理念融入其中。該部分主要對機構(gòu)及人員、基礎(chǔ)設(shè)施、工作方案、管理制度、工作流程控制、工作文件管理和檔案數(shù)字化外包7個部分做了細致規(guī)定。

1.機構(gòu)、人員及設(shè)施?!兑?guī)范》指出,應(yīng)建立紙質(zhì)檔案數(shù)字化工作組織,負責(zé)數(shù)字化工作從統(tǒng)籌規(guī)劃、協(xié)調(diào)管理到成果驗收的整個活動流程,以保證數(shù)字化工作的順利開展。組織的高效運作離不開具有相應(yīng)能力的工作人員,其中既包括本單位人員,也包括外聘人員。對工作人員不僅要規(guī)范管理,還應(yīng)加強審核。職責(zé)分工上,具備較高調(diào)查研究水平和組織與領(lǐng)導(dǎo)能力的管理人員負責(zé)前期考察活動,數(shù)字化方案制定,數(shù)字化工作組織等內(nèi)容;技術(shù)人員主要負責(zé)數(shù)字化相關(guān)標準規(guī)范的落實及各環(huán)節(jié)技術(shù)支持;操作人員則專注于具體的實施過程,保質(zhì)保量。

數(shù)字化工作需在配備一定設(shè)施設(shè)備的場地中進行,場地的布局需合理,并有利于數(shù)字化一整套流程的展開。為保證檔案實體的安全,場地應(yīng)防火、防水、防有害生物、防盜報警,并提供視頻監(jiān)控。紙質(zhì)檔案數(shù)字化的設(shè)施設(shè)備則應(yīng)足夠先進、安全,以滿足數(shù)字化工作的需要。

2.工作方案與管理制度。科學(xué)合理的工作方案是紙質(zhì)檔案數(shù)字化得以順利進行,并達到預(yù)期目標的保障。首先,應(yīng)對數(shù)字化條件展開充分調(diào)研。其次,要明確數(shù)字化工作應(yīng)包括的具體內(nèi)容,《規(guī)范》指出數(shù)字化工作方案應(yīng)包括數(shù)字化對象、工作目標、工作內(nèi)容、數(shù)字化技術(shù)方法和主要技術(shù)指標、進度安排、安全管理措施等。工作方案要盡可能全面且詳細,充分考慮到可能發(fā)生的情況及相應(yīng)的解決辦法。再次,工作方案確定前應(yīng)進行專家論證,以確保其科學(xué)、規(guī)范、合理。最后,工作方案應(yīng)經(jīng)審批后嚴格執(zhí)行,并與數(shù)字化的過程文件一并保存。

管理制度是工作方案有效施行的重要依托,因此,必須具備科學(xué)化和規(guī)范化的特征。紙質(zhì)檔案數(shù)字化管理制度應(yīng)包括崗位管理、人員管理、場地管理、設(shè)備管理、數(shù)據(jù)管理、檔案實體管理等。實體管理是檔案數(shù)字化最基礎(chǔ)的內(nèi)容,而數(shù)據(jù)管理則應(yīng)以全程管理為指導(dǎo)思想。

3.工作流程控制與文件管理。《規(guī)范》規(guī)定,應(yīng)依據(jù)相關(guān)法律法規(guī)和各類技術(shù)標準,制定相關(guān)的工作流程和各環(huán)節(jié)操作規(guī)范等,對數(shù)字化全過程進行有效控制,并實現(xiàn)全流程的安全管理?!兑?guī)范》強調(diào):應(yīng)建立完善的問題反饋機制,對各環(huán)節(jié)中產(chǎn)生的問題進行及時反饋與修正。數(shù)字化不僅關(guān)乎檔案實體安全,其成品的質(zhì)量高低還直接決定后期開發(fā)、利用的效果,而數(shù)字化工作的各個流程又是環(huán)環(huán)相扣的,因此有必要對其中的諸節(jié)點都進行管控。

對于紙質(zhì)檔案數(shù)字化工作中產(chǎn)生的各類文件,包括紙質(zhì)檔案數(shù)字化工作方案、紙質(zhì)檔案數(shù)字化移交成果清單、招投標文件、保密協(xié)議等,應(yīng)加強管理,并明確其整理、歸檔、移交等管理要求。過程文件是數(shù)字化工作的完整記錄,對其進行規(guī)范管理一方面有助于發(fā)現(xiàn)數(shù)字化過程中產(chǎn)生的問題,能夠及時溯源,同時也能總結(jié)成功經(jīng)驗;另一方面,對于數(shù)字化外包而言,過程文件則能幫助發(fā)包單位理清權(quán)責(zé),有效規(guī)避風(fēng)險。

4.檔案數(shù)字化外包。由于有專門的檔案數(shù)字化外包管理規(guī)范,因此《規(guī)范》在外包方面著墨并不多?!兑?guī)范》指出:如需數(shù)字化工作外包,應(yīng)全方面審查加工企業(yè)的資質(zhì),根據(jù)GB/T 20530—2006的要求評估其技術(shù)能力,從規(guī)章制度等各方面考察其管理能力,同時,還需審查其保密資質(zhì)?!兑?guī)范》強調(diào),在項目實施過程中,要在各個層面執(zhí)行嚴格的安全管理要求??梢姡x擇外包單位時必須十分謹慎,并嚴格按照相關(guān)規(guī)定的要求進行篩查,同時,檔案實體安全問題在外包工作中更為突出,需要引起足夠的重視。

數(shù)字化外包涉及不同單位與部門的協(xié)同合作,一方面要保證發(fā)包方的需求得以明確表達且被準確接收;另一方面,對整個數(shù)字化過程及成果需嚴格監(jiān)控。因此,《規(guī)范》建議,檔案部門應(yīng)指派專人參與紙質(zhì)檔案數(shù)字化外包業(yè)務(wù)的監(jiān)督、指導(dǎo),完成質(zhì)量監(jiān)控、進度監(jiān)控、投資監(jiān)控、安全監(jiān)控和協(xié)調(diào)溝通等方面的工作。

(五)檔案出庫及數(shù)字化前處理。檔案出庫需履行嚴格的手續(xù),《規(guī)范》規(guī)定:檔案保管部門應(yīng)按照數(shù)字化工作方案對數(shù)字化對象進行調(diào)取,并提交檔案出庫申請,經(jīng)相關(guān)責(zé)任人批準后,嚴格按照檔案庫房管理規(guī)定辦理出庫手續(xù),并與數(shù)字化部門共同清點無誤后,對檔案進行交接出庫。同時,在數(shù)字化過程中,應(yīng)對紙質(zhì)檔案的領(lǐng)取與歸還進行嚴格管理,確保紙質(zhì)檔案安全。

數(shù)字化前處理包括確定掃描頁、編制頁號、目錄數(shù)據(jù)準備、拆除裝訂和技術(shù)修復(fù)五個部分。2005年《規(guī)范》在5.3中規(guī)定:按要求把同一案卷中的掃描件和非掃描件區(qū)分開,普發(fā)性文件區(qū)分的原則是:無關(guān)和重份的文件要剔除,有正式件的文件可不掃描原稿,即“選擇性掃描”。而《規(guī)范》則指出:原則上應(yīng)將確定為數(shù)字化對象的紙質(zhì)檔案全部掃描,不宜進行挑掃。檔案是不斷生長著的有機體,反映一份文件生成、修改過程的底稿、草稿等也同樣重要,它們與正式件密不可分。在數(shù)字化早期,出于存儲能力和資金水平的考量,建議選擇性掃描,而經(jīng)過長時間的發(fā)展,前期的限制性因素已經(jīng)弱化,為了保證數(shù)字檔案內(nèi)容的完整性和連續(xù)性,更好地為社會公眾提供利用,建議將確定為數(shù)字化對象的紙質(zhì)檔案全部掃描無疑是更符合現(xiàn)實要求的。

《規(guī)范》規(guī)定,應(yīng)根據(jù)檔案原件的實際情況進行頁號的編制,并且不能對檔案長期保存造成影響。在目錄數(shù)據(jù)準備方面,應(yīng)按照目錄數(shù)據(jù)庫建立時制定的數(shù)據(jù)規(guī)則,對照檔案原件內(nèi)容,規(guī)范檔案中的目錄內(nèi)容。拆除裝訂與技術(shù)修復(fù)都強調(diào)應(yīng)保護檔案不受損害,并通過各種方式保持或記錄檔案原貌。

(六)目錄數(shù)據(jù)庫建立與數(shù)據(jù)掛接。目前,我國各級檔案館都在進行檔案數(shù)字化工作,而不同地區(qū)或級別的檔案館所采取的數(shù)據(jù)格式可能有所差別,這極易造成檔案信息交流障礙。為保證檔案資源整合的順利進行,《規(guī)范》提出應(yīng)選擇可轉(zhuǎn)換為通用數(shù)據(jù)格式的目錄數(shù)據(jù)庫,以便于數(shù)據(jù)交換。同時,數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計應(yīng)特別注意保持檔案的內(nèi)在聯(lián)系,以有利于紙質(zhì)檔案數(shù)字化成果的管理和利用,這一要求也同樣出現(xiàn)在目錄數(shù)據(jù)與圖像數(shù)據(jù)的關(guān)聯(lián)上。在數(shù)據(jù)的準確性方面,《規(guī)范》也作了相應(yīng)的規(guī)定:將紙質(zhì)檔案數(shù)字化前處理工作中對紙質(zhì)檔案目錄進行修改、補充的結(jié)果錄入數(shù)據(jù)庫,形成準確、完整的目錄數(shù)據(jù)。數(shù)據(jù)錄入完成后,還應(yīng)采用人工與計算機自動校對結(jié)合的方式,確保目錄數(shù)據(jù)的質(zhì)量。同樣,對掛接結(jié)果也應(yīng)逐條檢查,以保持目錄數(shù)據(jù)與圖像數(shù)據(jù)對應(yīng)的準確性。

(七)檔案掃描與圖像處理。在檔案掃描的整體要求方面,《規(guī)范》指出:應(yīng)根據(jù)紙質(zhì)檔案原件實際情況、數(shù)字化目的與規(guī)模等選擇相應(yīng)的掃描設(shè)備,進行相關(guān)參數(shù)的設(shè)置和調(diào)整,以保證掃描后的數(shù)字圖像清晰、完整、不失真,圖像效果最接近檔案原貌。在掃描設(shè)備的選取上,《規(guī)范》并未做硬性規(guī)定,具體操作時可根據(jù)需要進行選擇,但總體上要注意對檔案實體的保護,并盡可能保持檔案原貌。

在掃描色彩模式的選擇上,2005年《規(guī)范》提出“頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進行掃描”。這說明當時采用彩色掃描的檔案是非常有限的,大部分以黑白二值模式或灰度模式進行掃描。而《規(guī)范》則提出:為最大限度保留檔案原件信息,便于多種方式的利用,宜全部采用彩色模式進行掃描。以彩色掃描模式作為主導(dǎo)一方面反映了目前掃描技術(shù)和效率的提升,另一方面也反映了檔案部門對數(shù)字檔案利用效果的重視。

在掃描分辨率方面,總體上應(yīng)保證掃描后圖像清晰、完整,并綜合考慮數(shù)字圖像后期利用方式等因素。具體而言,2005年《規(guī)范》指出:采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般建議選擇大于或等于100dpi。而在《規(guī)范》中,這一基準數(shù)字被提高到了200dpi,同時建議:如文字偏小、密度、清晰度較差時,建議掃描分辨率不小于300dpi。需要進行COM輸出的檔案,掃描分辨率建議不小于300dpi;需進行高精度仿真復(fù)制的檔案,掃描分辨率建議不小于600dpi。一定范圍內(nèi),分辨率的大小決定了數(shù)字檔案顯示清晰度的高低,隨著高分辨率屏幕在計算機和智能手機中的普及,精度較小的掃描件將難以在高性能設(shè)備上清晰顯示,并且出于盡可能展現(xiàn)實體檔案原始面貌的考慮,相應(yīng)提升掃描分辨率也是十分必要的。

由于存儲技術(shù)的迅速發(fā)展以及存儲容量的大幅提升,《規(guī)范》在存儲格式的規(guī)定上刪除了2005年《規(guī)范》于8.1.1中提出的“盡量減少存儲容量為準則”的要求,不再強調(diào)節(jié)約存儲容量。為便于數(shù)字檔案利用,《規(guī)范》建議:紙質(zhì)檔案數(shù)字化圖像利用時,也可從網(wǎng)絡(luò)瀏覽速度、易操作性等方面綜合考慮,將圖像轉(zhuǎn)換為OFD、PDF等其他格式。同時,同一批檔案應(yīng)采用相同的存儲格式。在圖像命名方面,應(yīng)靈活組合檔號和流水號,以保證唯一性、準確性、連續(xù)性和整體性。

數(shù)字化產(chǎn)生的數(shù)字圖像需要進行一定的調(diào)整才能便于利用,《規(guī)范》從圖像拼接、旋轉(zhuǎn)及糾偏、裁邊、去污和圖像質(zhì)量檢查五個方面進行了規(guī)定。對分幅掃描形成的多幅數(shù)字圖像,應(yīng)進行拼接處理,合并為一個完整的圖像,并保證整幅圖像無明顯拼接痕跡。對不符合閱讀方向的數(shù)字圖像應(yīng)進行旋轉(zhuǎn)還原。如有必須可進行裁邊。若要去除掃描過程中產(chǎn)生的污點、污線、黑邊等雜質(zhì),應(yīng)遵循展現(xiàn)檔案原貌的原則,處理過程中不得去除檔案頁面緣由的紙張蛻變斑點、水漬、污點、裝訂孔等痕跡,即只處理數(shù)字化過程中形成的雜質(zhì),保留檔案的原有樣貌。

(八)數(shù)字化成果驗收、移交及檔案歸還入庫。《規(guī)范》對數(shù)字化成果驗收分為驗收方式、驗收內(nèi)容、驗收指標、驗收結(jié)論和移交五個部分。驗收方式方面,應(yīng)成立專門的驗收組,采用計算機自動檢驗與人工檢驗相結(jié)合的方式。驗收內(nèi)容包括對數(shù)字圖像、目錄數(shù)據(jù)、元數(shù)據(jù)、數(shù)字化過程中產(chǎn)生的工作文件及存儲載體等,概括而言,目錄數(shù)據(jù)、元數(shù)據(jù)、數(shù)據(jù)掛接和工作文件應(yīng)保證其準確性、完整性和規(guī)范性;數(shù)字圖像則還應(yīng)注重圖像質(zhì)量,載體則需重視其可用性和有無病毒等。

驗收指標方面,《規(guī)范》進行了較大幅度的調(diào)整,2005年《規(guī)范》的11.1.2要求:一個全宗的檔案,數(shù)據(jù)驗收時抽檢的比率不得低于5%,《規(guī)范》則要求:能夠采用計算機自動檢驗的項目應(yīng)采用計算機自動檢驗的方式進行100%檢驗,只有無法機檢,必須人工檢驗的項目,才要求抽檢比率不低于5%。可見,《規(guī)范》所要求的抽檢比例有了相當大的提升。在合格率方面,2005年《規(guī)范》指出:一個全宗的檔案,數(shù)字化轉(zhuǎn)換質(zhì)量抽檢的合格率達到95%以上(含95%)時,予以驗收通過?!兑?guī)范》則要求機檢合格率需為100%,其他內(nèi)容的抽檢合格率不低于95%。綜合來看,《規(guī)范》的驗收標準更為嚴格。

驗收未通過應(yīng)視情況返工或修改,之后重新檢驗。驗收完成后經(jīng)驗收組成員簽字,還應(yīng)經(jīng)相關(guān)領(lǐng)導(dǎo)審核簽字。數(shù)字化完成后需將檔案歸還入庫,此時應(yīng)注意保持檔案原貌,做到安全、準確無遺漏,并按相關(guān)要求進行清點,履行入庫手續(xù)。

四、《規(guī)范》存在的不足與改進意見

從上述分析可知,《規(guī)范》實現(xiàn)了技術(shù)指導(dǎo)與管理要求的有效結(jié)合,更加強調(diào)保護檔案實體安全、保持檔案原貌和維護數(shù)字檔案間的有機聯(lián)系,表現(xiàn)出相當?shù)倪M步性。但仍不可避免地存在需要探討和完善的問題,這些問題概括起來主要包括以下幾個方面。

(一)術(shù)語和定義數(shù)量不足、質(zhì)量有待提升

《規(guī)范》在“術(shù)語和定義”部分僅界定了4個術(shù)語,雖然減少了5個純技術(shù)術(shù)語,顯得簡潔明了,但對于紙質(zhì)檔案數(shù)字化這一系統(tǒng)活動而言,則存在核心術(shù)語不足的問題,需視情況增加。如《規(guī)范》中強調(diào)要加以保存和科學(xué)管理的“過程元數(shù)據(jù)”。實際上,這一術(shù)語在《信息與文獻文件管理過程文件元數(shù)據(jù)第1部分:原則》(GB/T 26163.1—2010)[5]中有十分詳細的界定。又如,在《規(guī)范》中出現(xiàn)頻率較高的“目錄數(shù)據(jù)庫”也須加以解釋。

部分術(shù)語質(zhì)量不高體現(xiàn)在兩方面。一是定義的完整性不足。例如,《規(guī)范》對“數(shù)字化”的定義是“利用計算機技術(shù)將模擬信號轉(zhuǎn)換為數(shù)字信號的處理過程”。類似的術(shù)語是《文獻檔案資料工作數(shù)字化工作導(dǎo)則》(GB/T 20530—2006)[6]中的“數(shù)字化工作digitize pro? cessing”,其定義為:按科學(xué)的方法分門別類地以電子格式加工、處理、存儲文獻檔案資料,并能對這些信息資源進行高效的插入、刪除、修改、檢索、提供訪問接口和信息保護等操作的過程。該定義的特別之處在于強調(diào)了數(shù)字化是一個連續(xù)、系統(tǒng)的工作。結(jié)合兩個定義,可將“數(shù)字化”的定義調(diào)整為“利用計算機技術(shù)將模擬信號轉(zhuǎn)換為數(shù)字信號的加工、處理與存儲過程”。二是定義的穩(wěn)定性欠缺?!兑?guī)范》將“紙質(zhì)檔案數(shù)字化”定義為:采用掃描儀等設(shè)備對紙質(zhì)檔案進行數(shù)字化加工,使其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上的數(shù)字圖像,并按照紙質(zhì)檔案的內(nèi)在聯(lián)系,建立起目錄數(shù)據(jù)與數(shù)字圖像關(guān)聯(lián)關(guān)系的處理過程。按照目前的主流數(shù)字化方式,紙質(zhì)檔案數(shù)字化成果為數(shù)字圖像,但隨著技術(shù)手段和內(nèi)容水平的提升,全文數(shù)字化也將逐步實現(xiàn),其生成物為數(shù)字文本。因而,僅使用“數(shù)字圖像”容易因時代的發(fā)展而形成局限,難以成為一個穩(wěn)定的定義。故建議將定義調(diào)整為:采用掃描儀等設(shè)備對紙質(zhì)檔案進行數(shù)字化加工,使其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上的數(shù)字圖像或數(shù)字文本,并按照紙質(zhì)檔案的內(nèi)在聯(lián)系,建立起目錄數(shù)據(jù)與數(shù)字圖像或數(shù)字文本關(guān)聯(lián)關(guān)系的處理過程。

(二)部分條目集中度不夠

條目集中度不夠是指本應(yīng)屬于同一規(guī)范內(nèi)容的條目被分散在不同的地方,這種分散不利于使用者全面掌握相關(guān)內(nèi)容并對其形成整體認知。例如,“目錄數(shù)據(jù)”相關(guān)的條目在7.1目錄數(shù)據(jù)準備和第8章“目錄數(shù)據(jù)庫建立”中均有所表述。又如,5.5工作流程控制與5.4管理制度并列出現(xiàn),盡管是為了突出“全過程管理”這一理念,但仔細分析可發(fā)現(xiàn),該條內(nèi)容實際上是“流程管理”,可歸入5.4.2中,以“流程管理制度”加以解釋。同樣,雖然對檔案實體的安全管理貫穿始終,但“安全管理制度”并未單獨列出。

(三)部分標題與內(nèi)容不對應(yīng)

標題與內(nèi)容不對應(yīng)存在兩方面的情況。一是標題的擬定不準確。例如5.1的標題為“機構(gòu)及人員”,但在具體內(nèi)容中對“機構(gòu)”卻解釋為“紙質(zhì)檔案數(shù)字化工作組織”,這樣命名可能是為了避免和第5章的標題“組織與管理”重復(fù),但并不準確,建議修改為“工作組織與人員”。二是內(nèi)容不屬于標題界定的范圍。例如9.2的標題為“掃描設(shè)備”,但其中9.2.3:對于極其珍貴且不規(guī)則的檔案,為方便直觀顯示原件大小,可采用標板、標尺等方式標識原件大小等信息。該條目實際上屬于“掃描方式”,放在9.2下并不合適,應(yīng)加以調(diào)整。

參考文獻:

[1]國家檔案局.紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范: DA/ T 31—2005(已廢止)[S].北京:國家檔案局, 2005.

[2]國家檔案局.紙質(zhì)檔案數(shù)字化規(guī)范: DA/T 31—2017[S].北京:國家檔案局, 2017.

[3]王英瑋等.檔案管理學(xué)(第4版)[M].北京:中國人民大學(xué)出版社, 2015.

[4] Electronic document management—Design and operation of an information system for the preservation of electronic documents—Specifications: ISO 14641—2018 [S].2018

[5]中國國家標準化管理委員會.信息與文獻文件管理過程文件元數(shù)據(jù)第1部分:原則: GB/T 26163.1—2010 [S].北京:中國標準出版社, 2011.

[6]中國國家標準化管理委員會.文獻檔案資料工作數(shù)字化工作導(dǎo)則: GB/T 20530—2006 [S].北京:中國標準出版社, 2006.

作者單位:中國人民大學(xué)信息資源管理學(xué)院

猜你喜歡
紙質(zhì)檔案行業(yè)標準數(shù)字化
家紡業(yè)亟待數(shù)字化賦能
近期發(fā)布的相關(guān)行業(yè)標準(2020年3月01日)摘選
高中數(shù)學(xué)“一對一”數(shù)字化學(xué)習(xí)實踐探索
高中數(shù)學(xué)“一對一”數(shù)字化學(xué)習(xí)實踐探索
電子檔案和紙質(zhì)檔案的整合利用與共存發(fā)展
紙質(zhì)檔案管理對檔案安全的影響及對策研究
數(shù)字化制勝
關(guān)于《腹腔鏡用穿刺器》行業(yè)標準的若干思考
16項新的涂料行業(yè)標準將于6月1日起正式實施
釩鈦磁鐵礦行業(yè)標準將制定