耿志杰 程明宵
[摘要]數(shù)字檔案長期保存是信息化背景下檔案部門的長期艱巨使命,涉及技術(shù)、管理等諸多領(lǐng)域,是一個龐大的系統(tǒng)工程。針對已識別或潛在的各種風(fēng)險,檔案部門在制定技術(shù)策略時將會面臨技術(shù)復(fù)雜性和系統(tǒng)性難題,需要在宏觀上進(jìn)行科學(xué)規(guī)劃。論文對數(shù)字檔案長期保存技術(shù)策略規(guī)劃的要求、內(nèi)容、管理三個方面進(jìn)行研究,以期對檔案部門實踐有所幫助。
[關(guān)鍵詞]數(shù)字檔案長期保存技術(shù)策略規(guī)劃
[分類號]G276
Research on Long-term Preservation Technical Strategy Planning of Digital Archives
Geng Zhijie,Cheng Mingxiao
(School of Library Information and Archives of Shanghai University, Shanghai, 200444)
Abstract: The long-term preservation of digital archives is a long-term arduous mission of the archival departments under the informatization-based background. It involves a large number of fields such as technology and management and is a huge system project. For the identified or potential risks, the archival departments will face technical complexity and systemic problems when formulating its technical strategies. The archival departments need to be planned scientifically in macroscopic view. This paper researches the requirements, content and management of digital archives long-term preservation technology strategy planning, in order to help the practice of the archival departments.
Keywords: Digital Archives; Long-term Preservation; Technical Strategy; Planning
現(xiàn)代信息技術(shù)在給檔案工作帶來巨大歷史變革的同時,也對數(shù)字檔案的真實性、完整性、可用性帶來了嚴(yán)峻挑戰(zhàn),數(shù)字檔案長期保存是檔案部門需要面對的長期艱巨使命。目前檔案界對長期保存策略進(jìn)行了大量理論研究和實踐探索,涉及技術(shù)、管理、政策法律等多領(lǐng)域。在技術(shù)策略方面,國家檔案局2010年制定的《數(shù)字檔案館建設(shè)指南》中,將長期保存技術(shù)策略概括為“包括存儲格式的選擇,檢測、備份和遷移等技術(shù)方法的采用等?!?/p>
“數(shù)字檔案長期保存利用機制復(fù)雜,涉及數(shù)據(jù)攝入……等多個領(lǐng)域,覆蓋多方面技術(shù),構(gòu)成一個復(fù)雜的技術(shù)體系?!盵1]在國內(nèi)多家檔案館調(diào)研過程中發(fā)現(xiàn),目前很多檔案館已經(jīng)制定并實施了一些長期保存技術(shù)策略,但是這些技術(shù)策略往往只是針對局部問題,例如只是在存儲環(huán)節(jié)制定了格式、元數(shù)據(jù)方案等應(yīng)對策略,缺乏系統(tǒng)性和長期規(guī)劃,難以滿足長期保存的需要。面對技術(shù)復(fù)雜性和系統(tǒng)性難題,檔案部門在制定長期保存技術(shù)策略時,需要在宏觀上進(jìn)行科學(xué)規(guī)劃。
1長期保存技術(shù)策略規(guī)劃的要求
1.1可行性
檔案部門制定的長期保存技術(shù)策略,不能好高騖遠(yuǎn)、脫離實際,需要綜合考慮三方面因素。
(1)需要充分考慮本館實際情況和信息技術(shù)發(fā)展趨勢,技術(shù)策略不僅要滿足館藏所有數(shù)字檔案類型和長期保存需求,而且要充分考慮技術(shù)發(fā)展帶來的潛在風(fēng)險。
(2)需要借鑒國內(nèi)外相關(guān)領(lǐng)域的成熟經(jīng)驗,合理選擇長期保存技術(shù)策略,例如在數(shù)據(jù)格式選擇方面,國家暫未制定標(biāo)準(zhǔn)的,應(yīng)盡量選擇開放或主流格式,這樣可以減少技術(shù)發(fā)展帶來的風(fēng)險。
(3)需要符合國家檔案局制定的行業(yè)標(biāo)準(zhǔn),例如《文書類電子文件元數(shù)據(jù)方案》(DA/T46-2009)、《版式電子文件長期保存格式需求》(DA/T47-2009)、《基于XML的電子文件封裝規(guī)范》(DA/T48-2009)等,當(dāng)技術(shù)發(fā)展升級時,可以依靠國家實力來解決問題,減少因本館技術(shù)實力不足而帶來的風(fēng)險。
1.2有效性
檔案部門制定的長期保存技術(shù)策略必須確保有效、可靠,并以書面形式明確。
(1)需要充分考慮長期保存過程中可能存在的各種風(fēng)險因素,確保制定的技術(shù)策略在可預(yù)測范圍內(nèi)有效,并能在必要時提供證明材料,例如數(shù)據(jù)格式遷移記錄等。
(2)需要考慮技術(shù)策略實施過程中所有涉及的業(yè)務(wù)流程和執(zhí)行部門,以確保各項技術(shù)策略能得到有效執(zhí)行。再完美的技術(shù)策略如果不能被有效執(zhí)行,也只是一紙空文。
2.3可變性
長期保存中使用的各種技術(shù)策略,不僅會受到技術(shù)發(fā)展趨勢的影響,還會受到因技術(shù)發(fā)展而變化的法規(guī)政策、國家標(biāo)準(zhǔn)等方面的影響,充滿了各種未知風(fēng)險。因此所制定的長期保存技術(shù)策略,必須能隨著外部環(huán)境的改變而進(jìn)行必要的升級,同時在升級過程中,不能對數(shù)字檔案的真實性、完整性、可用性造成影響,即在升級的同時實現(xiàn)“向下兼容”。
2長期保存技術(shù)策略規(guī)劃的內(nèi)容
2.1確定主要技術(shù)方法
(1)在數(shù)字檔案資源建設(shè)環(huán)節(jié),采用驗證、格式轉(zhuǎn)換等技術(shù)方法,確保需要長期保存的數(shù)字檔案可信、規(guī)范。
維護(hù)檔案的原始憑證性是檔案工作的核心,確保數(shù)字檔案資源的可信性是長期保存的基礎(chǔ),例如電子文件歸檔中,“在維護(hù)電子文件真實性、完整性、有效性、安全性的基礎(chǔ)上,將具有檔案價值的文件移交給檔案部門,以便于今后的有效保管和長久利用?!盵2]如果數(shù)字檔案的真實性、完整性得不到保障,則長期保存工作就是徒勞的。在數(shù)字檔案資源建設(shè)環(huán)節(jié),檔案部門應(yīng)盡量減少人為主觀因素影響,采用多種技術(shù)方法,如CA證書、元數(shù)據(jù)審核、信息安全檢查等,確保數(shù)字檔案資源的質(zhì)量,形成可信數(shù)字檔案資源。
對于可信數(shù)字檔案資源,應(yīng)結(jié)合行業(yè)標(biāo)準(zhǔn)和各檔案館實際情況,針對不同的數(shù)字檔案類型確定相應(yīng)的長期保存格式,這一過程中可采用數(shù)據(jù)格式驗證、批量轉(zhuǎn)換等技術(shù)方法,確??尚艛?shù)字檔案資源的規(guī)范性。
(2)采用封裝技術(shù),形成用于長期保存的數(shù)字檔案信息包(AIP),這一環(huán)節(jié)中要重點注意元數(shù)據(jù)方案選擇、信息包制作、信息包命名三個方面。
“元數(shù)據(jù)是電子檔案的重要組成部分,其管理方法、管理水平將直接影響電子檔案長期保存的真實性和憑證性。”[3]因此在長期保存元數(shù)據(jù)方案選擇中,應(yīng)該參考行業(yè)標(biāo)準(zhǔn)《文書類電子文件元數(shù)據(jù)方案》(DA/T46-2009),需要注意的是,“這部標(biāo)準(zhǔn)主要是針對文書類電子文件,而其他類型例如圖像、音頻、視頻類電子文件元數(shù)據(jù)標(biāo)準(zhǔn)缺乏,因此可以借鑒國際上主流標(biāo)準(zhǔn)?!盵4]
按照行業(yè)標(biāo)準(zhǔn)《基于XML的電子文件封裝規(guī)范》(DA/T48-2009)封裝形成數(shù)字檔案信息包,信息包應(yīng)包含數(shù)據(jù)文件、元數(shù)據(jù)、封裝描述信息等,可以被系統(tǒng)識別和管理,并確保數(shù)據(jù)文件與元數(shù)據(jù)永久關(guān)聯(lián)。在封裝過程中,對一般數(shù)字檔案可采用物理封裝,對難以封裝的音、視頻類數(shù)字檔案可采用邏輯封裝。
在對信息包命名過程中,需要采用規(guī)范的命名方法,確保命名的唯一性和長期性,同時系統(tǒng)能夠通過命名對信息包進(jìn)行識別、定位和管理。
(3)采用多重技術(shù),保障數(shù)字檔案長期安全存儲?!耙獙崿F(xiàn)數(shù)字檔案長期、有效的保存,主要應(yīng)解決好兩個基本矛盾:一是數(shù)字檔案長期保存的需求與載體脆弱性的矛盾;二是數(shù)字檔案保存的長期性與過快的技術(shù)淘汰的矛盾?!盵5]長期安全存儲過程周期長、未知風(fēng)險多,需要綜合采用多重技術(shù),以應(yīng)對各種未知風(fēng)險。
針對載體脆弱性難題,檔案部門應(yīng)該科學(xué)規(guī)劃和選擇存儲介質(zhì),并采取相應(yīng)的安全管理技術(shù),如磁盤陣列的電源穩(wěn)定控制、磁帶的防磁場管理等,同時應(yīng)根據(jù)數(shù)字檔案的重要程度,采用分級存儲技術(shù)。針對過快的軟硬件技術(shù)淘汰難題,目前可以根據(jù)具體情況采用數(shù)據(jù)拷貝、遷移、仿真、再生等技術(shù)。
異地、異質(zhì)備份技術(shù)是保障數(shù)字檔案長期安全存儲的有效方法,調(diào)研過程中發(fā)現(xiàn),目前很多檔案館在異質(zhì)備份上做得較好,但是在異地備份方面,不符合國家檔案局的相關(guān)規(guī)定。另外,還需要重點關(guān)注對異地備份的日常管理維護(hù),以及啟用備份的流程設(shè)計和配套監(jiān)控技術(shù)。
2.2建立長效監(jiān)控體系
(1)數(shù)字檔案常規(guī)檢測。常規(guī)檢測是指對長期保存中的載體和信息包進(jìn)行檢測,以保證數(shù)字檔案的完整性和可用性。在檢測過程中,需要科學(xué)設(shè)定檢測周期和抽樣比例,并確保檢測過程不會對數(shù)字檔案造成損傷。當(dāng)實施載體、格式、系統(tǒng)遷移等技術(shù)策略后,需要進(jìn)行全面檢測,以防止在技術(shù)策略實施過程中數(shù)字檔案信息包被修改或丟失。
(2)對技術(shù)環(huán)境進(jìn)行監(jiān)控。長期保存技術(shù)策略必須與特定階段的軟硬件技術(shù)、行業(yè)標(biāo)準(zhǔn)等技術(shù)環(huán)境相適應(yīng),當(dāng)技術(shù)環(huán)境發(fā)生重大變化時,就需要啟用應(yīng)對技術(shù)策略。因此,檔案部門需要加強對技術(shù)環(huán)境進(jìn)行監(jiān)控,以研判啟用預(yù)先制定技術(shù)策略的條件和時機。例如存儲格式方面,當(dāng)主流格式發(fā)生重大變化,或者國家檔案局對長期保存格式進(jìn)行調(diào)整時,就需要啟用格式遷移技術(shù)進(jìn)行批量轉(zhuǎn)換,所以檔案部門需要對數(shù)據(jù)格式技術(shù)發(fā)展、行業(yè)標(biāo)準(zhǔn)進(jìn)行監(jiān)控,為預(yù)定技術(shù)策略的啟用提供決策依據(jù),目前格式監(jiān)控環(huán)節(jié)可以使用DROID工具,“DROID可以評估該文件使用格式的過時風(fēng)險,推薦采用遷移行動”。[6]
技術(shù)環(huán)境監(jiān)控中,還需要重點對技術(shù)發(fā)展趨勢和新興技術(shù)進(jìn)行跟蹤,不僅可以對目前所采用技術(shù)是否會被淘汰進(jìn)行預(yù)警,也可以對將新技術(shù)應(yīng)用到長期保存領(lǐng)域進(jìn)行預(yù)研。例如在存儲載體發(fā)展方面,光盤存儲是否會被歷史淘汰,應(yīng)該引起檔案部門的關(guān)注;再如近期興起的區(qū)塊鏈技術(shù),在數(shù)據(jù)存儲安全性方面具有很好的應(yīng)用前景,是否可以將其應(yīng)用到數(shù)字檔案長期保存領(lǐng)域,檔案部門可以進(jìn)行跟蹤和預(yù)研。
2.3制定風(fēng)險評估制度和災(zāi)難應(yīng)急預(yù)案
(1)制定風(fēng)險評估制度。數(shù)字檔案長期保存工作的實質(zhì),就是通過識別可能對數(shù)字檔案真實性、完整性、可用性造成威脅的各種風(fēng)險因素,并制定應(yīng)對策略的過程,因此對各種風(fēng)險因素的識別是整個長期保存工作的起點。
目前檔案部門需要注意新技術(shù)應(yīng)用帶來的風(fēng)險,是否可以將某種新技術(shù)應(yīng)用到長期保存中,例如前文所述的區(qū)塊鏈技術(shù),需要進(jìn)行充分的風(fēng)險評估,這一過程不僅要考慮技術(shù)方面的風(fēng)險,還需要充分考慮新技術(shù)帶來的標(biāo)準(zhǔn)、管理等方面的風(fēng)險。對于已確定使用某種新技術(shù),例如系統(tǒng)升級,需要對具體實施流程進(jìn)行風(fēng)險評估,確保新技術(shù)替換過程中不會對數(shù)字檔案產(chǎn)生影響。
(2)制定災(zāi)難應(yīng)急預(yù)案。目前制定的遷移、仿真、再生等技術(shù)策略,其指導(dǎo)思想是在數(shù)字檔案真實性、完整性、可用性被實質(zhì)破壞之前所采用的預(yù)防性技術(shù),可歸為長期保存中“防”的范疇。而在長期保存過程中,不可避免會面臨很多突發(fā)災(zāi)難,例如自然災(zāi)害、軟硬件故障、人為操作錯誤等,會對數(shù)字檔案造成實質(zhì)破壞,此時檔案部門需要啟動應(yīng)急預(yù)案,例如備份啟用、數(shù)據(jù)恢復(fù)技術(shù)等,盡可能將損失減少到最小。應(yīng)急預(yù)案可歸為長期保存中“治”的范疇,“‘防和‘治都是數(shù)字檔案保護(hù)不可缺少的手段”。[7]在這一方面,青島市檔案館制定的《青島市數(shù)字檔案館應(yīng)急預(yù)案》,對自然災(zāi)害、系統(tǒng)崩潰等情況下數(shù)字檔案搶救進(jìn)行了詳細(xì)設(shè)計,值得借鑒。
3長期保存技術(shù)策略規(guī)劃的管理
3.1以書面形式明確既定技術(shù)策略
檔案部門在確定長期保存技術(shù)策略的基礎(chǔ)上,需要將既定技術(shù)策略中的各項實施流程及配套措施以書面形式明確,以保障技術(shù)策略的執(zhí)行。這一過程中,檔案部門的技術(shù)實力應(yīng)能支持技術(shù)策略的實施,必要時可借助第三方機構(gòu),例如新技術(shù)風(fēng)險評估等;應(yīng)明確技術(shù)策略具體實施流程和業(yè)務(wù)環(huán)節(jié),對每個業(yè)務(wù)節(jié)點要有明確的業(yè)務(wù)描述和技術(shù)指標(biāo);應(yīng)建立配套的責(zé)任體系,明確各責(zé)任主體的職責(zé)和協(xié)作,“如果主體不明、責(zé)任不清,則長期保存工作難以落到實處,電子文件將面臨失存失控的風(fēng)險?!盵8]
3.2及時更新長期保存技術(shù)策略
根據(jù)長期保存技術(shù)策略可變性的要求,各項技術(shù)策略需要與特定階段的外部環(huán)境相適應(yīng)。當(dāng)外部環(huán)境發(fā)生變化時,以及技術(shù)發(fā)展帶來新風(fēng)險時,需要及時對技術(shù)策略做出調(diào)整,確保長期保存技術(shù)策略在不同的歷史階段都能保持“活力”。
4結(jié)語
數(shù)字檔案長期保存技術(shù)策略,需要從全局視角進(jìn)行科學(xué)規(guī)劃,以保證技術(shù)策略的可行性、有效性和可變性。檔案部門在技術(shù)策略規(guī)劃和實施過程中,應(yīng)以保障數(shù)字檔案真實性、完整性、可用性為出發(fā)點,根據(jù)長期保存中可能面臨的各種風(fēng)險,確定應(yīng)對的技術(shù)方法,建立技術(shù)監(jiān)控體系、風(fēng)險評估制度和災(zāi)難應(yīng)急預(yù)案,并確保技術(shù)策略的落實和更新。數(shù)字檔案長期保存是一個龐大的系統(tǒng)工程,技術(shù)策略只是其中的一部分,技術(shù)策略的實施需要組織管理、人員機構(gòu)、財政保障等方面的支持,相關(guān)內(nèi)容需要在后續(xù)研究中繼續(xù)深入細(xì)化。
*本文系國家社科青年項目“數(shù)字檔案安全及長期保存策略研究”(13CTQ050)階段性成果。
參考文獻(xiàn)
[1]趙豪邁.數(shù)字檔案長期保存研究[M].西安:陜西師范大學(xué)出版總社, 2015:5.
[2]金波,丁華東.電子文件管理學(xué)[M].上海:上海大學(xué)出版社, 2015:155.
[3]陶水龍,田雷.電子檔案元數(shù)據(jù)管理方案策略研究[J].檔案學(xué)研究, 2016(2): 89-92.
[4]程妍妍,李園園.我國數(shù)字檔案館標(biāo)準(zhǔn)規(guī)范體系研究[J].檔案學(xué)通訊, 2014(6): 53-57.
[5]王芳.數(shù)字檔案館學(xué)[M].北京:中國人民大學(xué)出版社, 2010:285.
[6]錢毅.基于長期保存視角的電子檔案格式管理研究[J].檔案學(xué)通訊, 2016(6): 52-57.
[7]唐躍進(jìn).數(shù)字檔案災(zāi)難防治研究[J].檔案學(xué)通訊, 2014(3):12-14.
[8]屠躍明,張夢霞.電子文件(檔案)長期保存責(zé)任體系構(gòu)建研究[J].檔案學(xué)研究, 2016(1):101-106.