耿志杰 凌桂萍
摘? 要:在分析數(shù)字檔案長期保存系統(tǒng)功能要求的基礎(chǔ)上,對三款檔案管理軟件產(chǎn)品的長期保存系統(tǒng)功能進行調(diào)查,重點分析這三款軟件產(chǎn)品在封裝功能、遷移功能、身份及權(quán)限控制方面存在的不足,并從檔案部門提高長期保存意識和軟件廠商完善系統(tǒng)功能設(shè)計兩方面,提出改進策略。
關(guān)鍵詞:數(shù)字檔案長期保存;檔案管理軟件產(chǎn)品;系統(tǒng)功能
Abstract: On the basis of analyzing the functional requirements of the long-term preservation system of digital Archives, the functions of long-term preservation system of the three software products of archival management were investigated, and the three software products were analyzed in terms of the shortcomings of package function, migration function, identity and authority control. Propose strategies on improving the awareness of long-term preservation from archival departments and the functional design of the system from software vendors.
Keywords: Long-term preservation of digital Archives;Software products of Archival management; system function
檔案部門在開展數(shù)字檔案長期保存工作中,很多技術(shù)策略需要依靠功能完善的信息系統(tǒng),系統(tǒng)功能直接決定了長期保存工作的成效。目前很多基層檔案部門直接從市場上購買檔案管理軟件產(chǎn)品,這些軟件產(chǎn)品的相關(guān)系統(tǒng)功能是否完善,對長期保存工作影響重大。
數(shù)字檔案管理系統(tǒng)在滿足收集、整理、存儲、利用等一般功能的基礎(chǔ)上,在長期保存方面,應(yīng)注重完善以下功能。
1.1 確保形成可信數(shù)字檔案資源。無論是傳統(tǒng)形式還是數(shù)字形式的檔案,維護其原始憑證性是整個檔案工作的核心?!霸诰S護電子文件真實性、完整性、有效性、安全性的基礎(chǔ)上,將具有檔案價值的文件移交給檔案部門,以便于今后的有效保管和長久利用?!?[1]收集工作是檔案管理流程的起點,如果在源頭上不能保證數(shù)字檔案的真實性、完整性和可用性,則后續(xù)所有工作都將是徒勞的。
數(shù)字檔案管理系統(tǒng)在收集環(huán)節(jié),系統(tǒng)功能上應(yīng)具備完善的檢測功能,例如采用CA證書、時間戳、元數(shù)據(jù)審核、信息安全檢查等技術(shù)方法,確保數(shù)字檔案的真實性、完整性和可用性,即確保形成可信數(shù)字檔案資源,為后續(xù)長期保存工作提供數(shù)字資源對象。
1.2 支持元數(shù)據(jù)自動獲取、管理。元數(shù)據(jù)在數(shù)字檔案長期保存中意義重大,是數(shù)字檔案管理和長期保存工作的重要基礎(chǔ)技術(shù)之一。“元數(shù)據(jù)是電子檔案的重要組成部分,其管理方法、管理水平將直接影響電子檔案長期保存的真實性和憑證性?!盵2]檔案部門在元數(shù)據(jù)獲取、管理過程中,一方面應(yīng)參照國家標(biāo)準(zhǔn),例如《文書類電子文件元數(shù)據(jù)方案》(DA/T46-2009)等,制定符合本部門的元數(shù)據(jù)方案;另一方面針對海量數(shù)字檔案資源,在元數(shù)據(jù)方案執(zhí)行過程中,系統(tǒng)功能應(yīng)支持元數(shù)據(jù)自動獲取、管理,減少人為因素的不利影響。
元數(shù)據(jù)貫穿數(shù)字檔案管理的全部流程,需要在系統(tǒng)總體架構(gòu)設(shè)計時進行科學(xué)規(guī)劃,系統(tǒng)功能上應(yīng)實現(xiàn)對元數(shù)據(jù)的自動獲取和管理,具體包括:
(1)系統(tǒng)應(yīng)能夠?qū)崿F(xiàn)絕大部分元數(shù)據(jù)的自動獲取?!霸獢?shù)據(jù)自動獲取是指根據(jù)電子文件格式標(biāo)準(zhǔn)所描述的數(shù)據(jù)標(biāo)簽及其起始位置,從電子檔案內(nèi)部或其擴展屬性中提取元數(shù)據(jù)值?!盵3]具體包括電子文件歸檔過程中的元數(shù)據(jù),以及后期封裝、存儲、檢測、遷移等過程中形成的元數(shù)據(jù)。
(2)在數(shù)字檔案接收和后期管理過程中,對于一些需要人工錄入的元數(shù)據(jù),例如數(shù)字檔案內(nèi)容描述元數(shù)據(jù)等,系統(tǒng)應(yīng)能夠提供元數(shù)據(jù)字典等技術(shù)輔助實現(xiàn)糾錯功能,盡量減少人為因素的不利影響。
(3)在數(shù)字檔案長期保存過程中,如果發(fā)生元數(shù)據(jù)方案調(diào)整等情況,系統(tǒng)也應(yīng)該具備自動調(diào)整、修改、記錄等功能。
1.3 具備完善的封裝功能。《數(shù)字檔案館建設(shè)指南》中管理功能部分要求,“對檔案內(nèi)容數(shù)據(jù)及其元數(shù)據(jù)等相關(guān)信息建立持久聯(lián)系,形成長期保存檔案數(shù)據(jù)包和利用數(shù)據(jù)包”,對于需要長期保存的數(shù)字檔案,應(yīng)該以封裝數(shù)據(jù)包的形式進行存儲?!胺庋b是指利用標(biāo)準(zhǔn)的、與軟硬件無關(guān)的XML語言將電子文件與其元數(shù)據(jù)按照規(guī)范結(jié)構(gòu)封裝在一個數(shù)據(jù)包中,以維護電子文件與其元數(shù)據(jù)的完整性,并保障兩者之間的可靠聯(lián)系,實現(xiàn)電子文件自包含、自描述和自證明,封裝包的信息組織結(jié)構(gòu)符合ISO 14721:2003定義的檔案信息包(AIP)模型?!盵4]
為形成長期保存數(shù)字檔案信息包(AIP),檔案管理系統(tǒng)應(yīng)具備完善的封裝功能,根據(jù)《基于XML的電子文件封裝規(guī)范》(DA/T 48-2009)的要求,除完成基本的物理封裝和邏輯封裝外,還需包括以下功能:
(1)標(biāo)識符自動生成、自解析并保證其唯一性。“大量來源不同、主題各異的檔案信息包,對檔案信息有效組織、數(shù)據(jù)庫日常維護、檔案信息包遷移備份、數(shù)字檔案提供利用提出了更高要求?!盵5]檔案管理系統(tǒng)通過標(biāo)識符對這些AIP進行有效管理,系統(tǒng)應(yīng)具備標(biāo)識符自動生成、自解析并保證其唯一性的功能。自動生成,即系統(tǒng)自動對每個AIP賦予一個標(biāo)識符,該標(biāo)識符可以通過一些元數(shù)據(jù)組成,或者“元數(shù)據(jù)+系統(tǒng)自動賦予的某類符號”組成,或者由管理員按照一定規(guī)則自定義后批量生成。自解析,即系統(tǒng)的標(biāo)識符解析服務(wù)模塊能幫助理解標(biāo)識符的結(jié)構(gòu),規(guī)定每個字段或字符的含義及特征,并根據(jù)需要更新該解析服務(wù)模塊。唯一性,即一個AIP只有一個標(biāo)識符,一個標(biāo)識符只能對應(yīng)一個AIP。
(2)保持唯一標(biāo)識符與AIP的可靠聯(lián)系。AIP在長期保存過程中,可能會發(fā)生備份、遷移等操作,只有始終保持唯一標(biāo)識符與AIP的一一對應(yīng)關(guān)系,才能保證每個AIP的可控性,進而保證數(shù)字檔案的真實性、完整性和可用性。
(3)支持封裝規(guī)則和元數(shù)據(jù)方案的調(diào)整。當(dāng)封裝規(guī)則和元數(shù)據(jù)方案發(fā)生調(diào)整時,可以批量對原AIP進行相應(yīng)調(diào)整,即確保封裝操作的可逆性。
(4)封裝日志管理及長期保存。封裝日志是跟蹤封裝操作的記錄,保證封裝日志的獨立性、完整性和抗更改性,是跟蹤每次封裝操作的有效憑證。同時系統(tǒng)應(yīng)將封裝日志與AIP分離存儲,以防止兩者被同時修改。
1.4 確保靜態(tài)存儲數(shù)字檔案的有效管理。在數(shù)字檔案存儲過程中,系統(tǒng)應(yīng)具備完善的管理功能,對存儲的數(shù)字檔案進行綜合維護,以確保其真實性、完整性和可用性?!峨娮訖n案管理系統(tǒng)基本功能規(guī)定》第22條規(guī)定,“系統(tǒng)應(yīng)具備對電子檔案存儲狀況的監(jiān)控和警告功能,對存儲介質(zhì)的不穩(wěn)定、存儲空間不足、電子檔案非授權(quán)訪問和系統(tǒng)響應(yīng)超時等情況發(fā)出警告,跟蹤和記錄警告事項處理過程”;第23條規(guī)定,“系統(tǒng)應(yīng)具備對電子檔案真實性、完整性、可用性和安全性等檢查功能”?;谏鲜鲆?guī)定并結(jié)合長期保存需要,系統(tǒng)在存儲管理中應(yīng)具備以下功能:
(1)操作人員身份管理及權(quán)限控制。系統(tǒng)對能夠接觸和操作長期保存數(shù)據(jù)庫的人員身份及其權(quán)限進行嚴(yán)格控制,防止非授權(quán)訪問和越權(quán)操作。
(2)數(shù)據(jù)檢測。系統(tǒng)一方面需要定期對存儲的AIP進行檢測,例如采用循環(huán)冗余校驗、MD5值等方法,對數(shù)字檔案的完整性進行檢測,確保長期保存的有效性;另一方面,當(dāng)進行遷移等操作后,需要進行全面檢測,以防止AIP被修改或發(fā)生丟失。
(3)載體管理。系統(tǒng)需要對數(shù)據(jù)庫磁盤陣列的運行和容量進行監(jiān)控,同時也需要對脫機存儲載體的保存情況進行監(jiān)控,如出現(xiàn)問題應(yīng)及時反饋。
(4)日志管理、審計。系統(tǒng)整體的運行情況對數(shù)字檔案長期保存影響很大,因此需要對系統(tǒng)運行日志進行有效管理,并定期進行審計,及時發(fā)現(xiàn)其中威脅長期保存的風(fēng)險因素。
1.5 遷移功能。檔案管理系統(tǒng)應(yīng)重點完善格式遷移和系統(tǒng)遷移功能。
(1)格式遷移?!坝捎陔娮訖n案保管期限很長,甚至是永久保存,就產(chǎn)生了在長時期內(nèi)對類型眾多的格式進行必要管理的需要,以保證電子檔案可讀性,防止格式過時等基本風(fēng)險?!盵6]當(dāng)數(shù)字檔案原存儲格式不能滿足長期保存需要時,系統(tǒng)應(yīng)能將舊存儲格式批量轉(zhuǎn)換為指定格式,同時自動獲取遷移元數(shù)據(jù),并生成遷移日志。
(2)系統(tǒng)遷移。系統(tǒng)遷移是指從舊的計算機軟硬件環(huán)境遷移到新的環(huán)境,這是信息技術(shù)發(fā)展的必然且較頻繁。從長期保存角度考慮,檔案管理系統(tǒng)在系統(tǒng)遷移中必須保證AIP的穩(wěn)定。首先,應(yīng)避免在系統(tǒng)遷移過程中發(fā)生數(shù)據(jù)丟失;其次,系統(tǒng)從低版本向高版本遷移過程中,必須保證高版本系統(tǒng)的向下兼容性,即確保系統(tǒng)遷移后AIP仍能被正常操作和使用。
根據(jù)上述對長期保存系統(tǒng)功能要求的分析,本文對市面上的三款檔案管理軟件產(chǎn)品進行了調(diào)查。在對一些基層檔案部門調(diào)研中發(fā)現(xiàn),他們目前對數(shù)字檔案管理的認識和需求較低,總體上就是“收進來、管起來、能利用”。因此,他們選用的這三款檔案管理軟件產(chǎn)品都是圍繞基本業(yè)務(wù)流程展開的,重點是解決數(shù)字檔案的收集、整理、管理、簡單存儲和檢索利用。
三款軟件都設(shè)計有檢測功能,在接收環(huán)節(jié)能夠?qū)?shù)字檔案的真實性、完整性和可用性進行檢測,總體上能夠保證形成可信數(shù)字檔案資源;同時在存儲過程中也能夠?qū)?shù)字檔案進行相關(guān)檢測,基本能滿足長期保存的需要。元數(shù)據(jù)方面,三款軟件都具備部分自動并輔以半自動和人工方式獲取元數(shù)據(jù),能實現(xiàn)元數(shù)據(jù)自動管理,可以基本滿足長期保存的需要。另外在載體管理、日志管理和審計方面都有相應(yīng)的功能設(shè)計。但是在封裝、遷移功能方面,還存在一些問題。
2.1 封裝功能存在缺陷。(1)難以實現(xiàn)標(biāo)識符的自動生成、自解析并保證其唯一性。某款軟件封裝功能中以數(shù)字簽名作為標(biāo)識符,通過自動賦予每個AIP不同數(shù)字簽名的機制保證其唯一性,但該機制缺乏解析服務(wù)功能,無法實現(xiàn)自解析,可能會導(dǎo)致出現(xiàn)無法通過該類標(biāo)識符準(zhǔn)確判別AIP的問題,其封裝功能不完善。另兩款軟件則無明確的機制和技術(shù)方案以實現(xiàn)標(biāo)識符的自動生成、自解析并保證其唯一性。
(2)難以保證唯一標(biāo)識符與AIP的可靠聯(lián)系。上述某款軟件將數(shù)字簽名作為唯一標(biāo)識符的方案,因為其沒有解析服務(wù)機制能夠說明該標(biāo)識符是否由數(shù)字檔案的某些元數(shù)據(jù)組成,組成規(guī)則如何,AIP存放地址或格式變更后如何依然能保證一一對應(yīng)關(guān)系,難以保證唯一標(biāo)識符與AIP的可靠聯(lián)系。同樣,另兩款軟件在標(biāo)識符解析服務(wù)功能上存在缺陷導(dǎo)致無法保證標(biāo)識符的唯一性,進而也難以保證唯一標(biāo)識符與AIP的可靠聯(lián)系。
(3)無明確方案支持封裝規(guī)則和元數(shù)據(jù)方案的調(diào)整。對于已封裝的AIP存在解封并重新封裝的可能,軟件的封裝功能應(yīng)支持封裝規(guī)則和元數(shù)據(jù)方案的調(diào)整。調(diào)查發(fā)現(xiàn)三款軟件在這一方面均無明確的機制和技術(shù)方案提供支持,封裝功能存在缺陷,同時也會對長期保存中的格式遷移等工作產(chǎn)生影響。
2.2 遷移功能存在缺陷。(1)在格式遷移方面,三款軟件都有相應(yīng)的設(shè)計,但存在格式轉(zhuǎn)換成本高、遷移過程相關(guān)數(shù)據(jù)管理難度大等問題。某款軟件在系統(tǒng)內(nèi)部設(shè)計有格式轉(zhuǎn)換功能,其中包含有上百種常見的文件格式,可以實現(xiàn)這些格式之間的轉(zhuǎn)換,這種設(shè)計會存在一些問題:首先,對于需要大批量進行格式轉(zhuǎn)換時,該款軟件難以滿足實際需要;其次,如果該軟件的版本沒有及時更新,就有可能出現(xiàn)未包含最新格式的情況,如果此時需要轉(zhuǎn)換到這些新格式就會出現(xiàn)問題,需要檔案部門及時采購最新版本。某款軟件在系統(tǒng)外部另有一套格式轉(zhuǎn)換軟件且功能比較強大,可以滿足批量轉(zhuǎn)換的需要,但這樣的設(shè)計也會存在一些問題:首先,格式轉(zhuǎn)換軟件需要另外采購,會增加檔案部門的成本;其次,由于管理系統(tǒng)軟件與格式轉(zhuǎn)換軟件相互獨立,對遷移元數(shù)據(jù)、遷移日志的管理和保存會產(chǎn)生不利影響。
(2)在系統(tǒng)遷移方面,存在數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)庫結(jié)構(gòu)跨廠商不兼容難題。檔案部門如果一直使用同一款軟件,當(dāng)該款軟件版本升級時,一般會保證高版本的向下兼容性,只要檔案部門持續(xù)采購,就可以保證原存儲數(shù)字檔案的正常操作,即使出現(xiàn)個別問題,軟件廠商也可以幫助解決。但是當(dāng)檔案部門由于各種原因而更換其他廠商的軟件時,不同款軟件之間的兼容性就會存在很多問題,特別是對原存儲數(shù)字檔案是否能保證正常操作會存在很大風(fēng)險,進而影響數(shù)字檔案的長期保存。對此,本文訪談了某款軟件的銷售技術(shù)顧問,他表示如果選用他們的軟件,他們會幫助解決上述問題,并“謹慎”地表示一般是可以解決的,但后期如果再選擇其他廠商,他們將不再負責(zé)。由于檔案部門保存的數(shù)字檔案種類繁多、形式各異,特別是一些異構(gòu)數(shù)據(jù)以及不同軟件形成的各種數(shù)據(jù)結(jié)構(gòu)缺陷,對于更換其他廠商的軟件時,是否能絕對保證原存儲數(shù)字檔案的正常操作,將存在很多未知風(fēng)險。
2.3人員身份及權(quán)限控制設(shè)計仍需提高?!稊?shù)字檔案館建設(shè)指南》中存儲架構(gòu)選擇部分要求:“適當(dāng)選擇采用單一應(yīng)用平臺,配備數(shù)據(jù)庫服務(wù)器、文件存儲器、備份服務(wù)器、備份軟件等構(gòu)成的存儲服務(wù)平臺?!倍壳笆苡布l件制約,很多檔案部門在存儲基礎(chǔ)設(shè)施上無法達到這樣的要求,在調(diào)研中還發(fā)現(xiàn)有些檔案部門存儲與提供利用的數(shù)字檔案共用一套服務(wù)器系統(tǒng),會對長期保存的數(shù)字檔案造成嚴(yán)重的安全隱患,這就對系統(tǒng)的安全性提出了更高的要求。三款軟件在操作人員身份及權(quán)限控制方面,都是采取用戶名加密碼登錄的簡單認證及基于用戶身份的權(quán)限控制技術(shù),甚至有的軟件在登錄界面上還有“記住用戶名”“記住密碼”的選項,整體安全性水平存在隱患,三款軟件在身份識別、權(quán)限界定、角色定位方面仍需提高。
上述檔案管理軟件產(chǎn)品在長期保存功能上存在的問題,不能簡單地看成是軟件廠商在技術(shù)設(shè)計上存在不足。某款軟件的銷售技術(shù)顧問表示,針對上述很多問題,他們在技術(shù)上是完全可以實現(xiàn)的,關(guān)鍵在于檔案部門采購中是否提出明確的功能需求。因此對這些問題的解決,需要檔案部門和軟件廠商協(xié)同努力,其中最重要的是檔案部門的長期保存意識。
3.1 檔案部門提高長期保存意識。調(diào)研中發(fā)現(xiàn)一些基層檔案部門在長期保存的認識上存在問題。有些檔案部門的工作重點集中在數(shù)字檔案的收、管、用上,對長期保存工作不重視,甚至有工作人員表示那是他退休以后的事情;有些檔案部門也認識到長期保存問題,知道封裝、遷移等技術(shù)方法,但是在很多技術(shù)細節(jié)上了解不夠深入或存在偏差;有些檔案部門工作人員表示,在軟件采購前期的洽談中,他們提出了一些長期保存功能需求,但是由于沒有采購的決定權(quán),最終導(dǎo)致軟件在長期保存功能上沒有滿足他們的要求。
檔案部門必須認識到數(shù)字檔案長期保存的重要性和各種潛在風(fēng)險因素,結(jié)合館藏數(shù)字檔案資源的特點和長期保存需求,才能制定科學(xué)的長期保存技術(shù)規(guī)劃,進而才能明確軟件系統(tǒng)功能需求。在目前買方市場的背景下,軟件廠商在很多技術(shù)方面是可以實現(xiàn)檔案部門需求的。
3.2 軟件廠商規(guī)范、完善檔案管理軟件產(chǎn)品功能設(shè)計。(1)針對上述系統(tǒng)遷移中存在的問題,每款檔案管理軟件產(chǎn)品都應(yīng)該有自己的特色,很難要求它們彼此間都有良好的兼容性,但是在一些基礎(chǔ)技術(shù)方面,這些軟件都應(yīng)該共同遵循,這樣可以減小系統(tǒng)遷移帶來的兼容性風(fēng)險。在封裝功能方面,都應(yīng)該遵循《基于XML的電子文件封裝規(guī)范》(DA/T 48-2009)的規(guī)定;在遷移、備份等功能方面,都應(yīng)該遵循《電子文件歸檔與電子檔案管理規(guī)范》(GB/T 18894-2016)的規(guī)定;在元數(shù)據(jù)方面,都應(yīng)該遵循《文書類電子文件元數(shù)據(jù)方案》(DA/T 46-2009)、《照片類電子檔案元數(shù)據(jù)方案》(DA/T 54-2014)、《錄音錄像類電子檔案元數(shù)據(jù)方案》(DA/T 63-2017)的規(guī)定;在數(shù)據(jù)格式方面,都應(yīng)該遵循《版式電子文件長期保存格式需求》(DA/T47-2009)的規(guī)定。
(2)在格式遷移、載體管理、操作人員身份管理等功能方面,軟件廠商應(yīng)該盡可能完善相關(guān)功能設(shè)計,提高長期保存系統(tǒng)功能水平。同時應(yīng)該與檔案部門保持溝通,一方面可以向檔案部門宣傳長期保存相關(guān)技術(shù),提高自身產(chǎn)品的亮點;另一方面也可以避免檔案部門提出不切實際的技術(shù)要求。
(3)在調(diào)查中發(fā)現(xiàn),有些軟件是將各個功能模塊封裝后,以“標(biāo)準(zhǔn)化”產(chǎn)品向檔案部門銷售的,這樣不利于檔案部門在長期保存功能上提出個性化需求。在功能模塊組織、添加設(shè)計上應(yīng)該更加靈活,實現(xiàn)按照檔案部門需求的個性化定制服務(wù)。
數(shù)字檔案長期保存工作依托于功能完善的管理系統(tǒng),對于軟件產(chǎn)品的選購,一方面檔案部門需要在認識上予以重視,詳細了解相關(guān)技術(shù)細節(jié),明確系統(tǒng)功能需求;另一方面軟件廠商在長期保存功能設(shè)計上應(yīng)更加完善。只有檔案部門和軟件廠商協(xié)同努力,才能更好地開展數(shù)字檔案長期保存工作。另外,由于作者水平有限,以及所調(diào)查軟件產(chǎn)品的版本問題,本文不出現(xiàn)三款軟件產(chǎn)品的具體品牌,如果對軟件產(chǎn)品系統(tǒng)功能認識存在偏差,深表歉意。
參考文獻:
[1]金波,丁華東.電子文件管理學(xué)[M].上海:上海大學(xué)出版社,2015:155.
[2]陶水龍,田雷.電子檔案元數(shù)據(jù)管理方案策略研究[J].檔案學(xué)研究,2016(2):89-92.
[3]毛海帆.電子檔案元數(shù)據(jù)方案設(shè)計與應(yīng)用探究[J].檔案學(xué)研究,2010(1):74-78.
[4]國家檔案局.DA/T 48-2009 基于XML的電子文件封裝規(guī)范[S].2009.
[5]祝清松.國內(nèi)外數(shù)字對象唯一標(biāo)識符應(yīng)用現(xiàn)狀述評[J].情報科學(xué),2012(8):1254-1257.
[6]錢毅.基于長期保存視角的電子檔案格式管理研究[J].檔案學(xué)通訊,2016(6):52-57.
(作者單位:上海大學(xué)圖書情報檔案系? 來稿日期:2019-04-17)