楊帆 王強(qiáng)
摘 要?本文介紹了中石油在建設(shè)數(shù)字檔案長(zhǎng)期保存系統(tǒng)、設(shè)計(jì)數(shù)字檔案長(zhǎng)期保存數(shù)據(jù)架構(gòu)、制定數(shù)字檔案長(zhǎng)期保存管理規(guī)范、采取多種形式的數(shù)字檔案存儲(chǔ)方式、實(shí)施數(shù)字檔案?jìng)浞菖c容災(zāi)策略等方面的做法,結(jié)合存在的問(wèn)題,總結(jié)了構(gòu)建數(shù)字檔案長(zhǎng)期保存框架體系的五點(diǎn)啟示:一是全面遵循OAIS參考模型設(shè)計(jì)可持續(xù)框架;二是建設(shè)適用的數(shù)字檔案長(zhǎng)期保存系統(tǒng);三是建設(shè)基于認(rèn)證的數(shù)字檔案長(zhǎng)期保存管理體系;四是合理選擇長(zhǎng)期保存工具與技術(shù)策略;五是打造企業(yè)數(shù)字檔案長(zhǎng)期保存共贏生態(tài)。
關(guān)鍵詞 數(shù)字檔案 長(zhǎng)期保存 中石油
中圖分類號(hào) G273.2 文獻(xiàn)標(biāo)識(shí)碼 A 收稿日期 2020-05-26
★作者簡(jiǎn)介:楊帆,中油國(guó)際管道公司文檔管理主管;王強(qiáng),中國(guó)石油檔案館副研究館員,中國(guó)人民大學(xué)電子文件管理研究中心研究員。
Abstract? This paper introduces CNPC's practices of digital archives in the construction of long-term preservation system, the design of long-term preservation data architecture, the formulation of long-term preservation management specifications, the adoption of multiple storage methods, the implementation of backup and disaster recovery strategies. In view of the existing problems, the paper summarizes five implications of building a long-term preservation framework system of digital archives: The first is to fully follow the OAIS reference model to design a sustainable framework; the second is to build a suitable long-term preservation system for digital archives; the third is to build a certification based long-term preservation management system for digital archives; the fourth is to reasonably select long-term preservation tools and technical strategies; and the fifth is to create a win-win ecology for long-term preservation of enterprise digital archives.
Keyword? digital archives; long-term preservation; CNPC
企業(yè)檔案是企業(yè)的重要信息資源和知識(shí)資產(chǎn),隨著企業(yè)信息化和檔案信息化的深入推進(jìn),數(shù)字檔案日益成為檔案管理的主要對(duì)象并成為企業(yè)數(shù)據(jù)資產(chǎn)的重要內(nèi)容,數(shù)字檔案長(zhǎng)期保存是持續(xù)維護(hù)和開(kāi)發(fā)數(shù)字檔案資源與資產(chǎn)價(jià)值的基礎(chǔ)。因而,如何通過(guò)數(shù)字檔案保存維護(hù)數(shù)字對(duì)象的長(zhǎng)期可獲取與可用成為重要議題。
于國(guó)家層面,我國(guó)的數(shù)字檔案館與數(shù)字檔案室戰(zhàn)略從基礎(chǔ)設(shè)施、管理系統(tǒng)到實(shí)施方案正探索持續(xù)推進(jìn)的整體框架,美國(guó)的ERA、加拿大的數(shù)字可信倉(cāng)儲(chǔ)、澳大利亞的數(shù)字連續(xù)性政策均從不同方面探討數(shù)字檔案長(zhǎng)期保存在國(guó)家層面的布局和政府部門中的落實(shí)。然而,對(duì)于企業(yè)這類重要社會(huì)組織機(jī)構(gòu)而言,如何立足其性質(zhì)與職能展開(kāi)數(shù)字檔案保存缺乏較多元與代表性的實(shí)踐參照。這同樣體現(xiàn)在國(guó)內(nèi)外的理論研究中。較具國(guó)際影響力的跨國(guó)項(xiàng)目InterPARES從理論基礎(chǔ)、原則與方法、具體方案探討電子文件與檔案的長(zhǎng)久保存要義。我國(guó)近年來(lái)除明確數(shù)字檔案以及電子文件以真實(shí)性、可信性為主的概念外,一方面,從保存格式、元數(shù)據(jù)模型、保管技術(shù)如區(qū)塊鏈等方面研究具體的戰(zhàn)略、策略、標(biāo)準(zhǔn)、方案[1][2][3][4]等;另一方面,明確檔案數(shù)據(jù)化的趨勢(shì),提出面臨的挑戰(zhàn)與應(yīng)對(duì)設(shè)想[5]。這些研究同樣更多立足于政府機(jī)構(gòu)或公共檔案館的范疇中,缺少企業(yè)數(shù)字檔案長(zhǎng)期保存實(shí)踐數(shù)據(jù)與理論框架,對(duì)于企業(yè)如何開(kāi)展數(shù)字檔案長(zhǎng)期保存缺失系統(tǒng)和具有實(shí)踐論證的指導(dǎo)。
因之,本文將以中石油數(shù)字檔案長(zhǎng)期保存實(shí)踐為案例,對(duì)具體行動(dòng)及其進(jìn)展予以全面說(shuō)明,結(jié)合理論框架呈現(xiàn)更具應(yīng)用價(jià)值的策略,以期為企業(yè)主體乃至更普遍的數(shù)字檔案長(zhǎng)期保存提供參照。
一、中石油數(shù)字檔案長(zhǎng)期保存多元維度解析
1.建設(shè)數(shù)字檔案長(zhǎng)期保存系統(tǒng)。中石油檔案管理系統(tǒng)基于OAIS(Open Archival Information System,開(kāi)放檔案信息系統(tǒng))參考模型建設(shè),業(yè)務(wù)功能包括收集整理、檔案管理、長(zhǎng)期保存、開(kāi)發(fā)利用、管理支撐五大模塊112項(xiàng)功能。長(zhǎng)期保存模塊是檔案管理系統(tǒng)核心模塊之一,主要實(shí)現(xiàn)電子檔案的長(zhǎng)久保存,包括電子文件格式管理、元數(shù)據(jù)封裝、數(shù)據(jù)包維護(hù)、“四性”檢查等功能。功能描述如下:電子文件格式管理,按照國(guó)家和中石油電子文件格式規(guī)范要求,在線維護(hù)系統(tǒng)管理的電子文件格式規(guī)則,并可自動(dòng)完成每種格式的電子文件數(shù)量、占用大小、平均大小等數(shù)據(jù)統(tǒng)計(jì);電子檔案存儲(chǔ)格式轉(zhuǎn)換與信息組織,通過(guò)對(duì)電子檔案存儲(chǔ)格式的轉(zhuǎn)換,將存入系統(tǒng)的電子檔案轉(zhuǎn)換為符合長(zhǎng)期保存要求的存儲(chǔ)格式;電子檔案長(zhǎng)期保存,采用遷移、封裝、檢測(cè)等方式保障數(shù)字檔案信息的長(zhǎng)期保管;對(duì)非通用格式電子檔案閱讀所需要的原始軟硬件在系統(tǒng)中進(jìn)行標(biāo)識(shí);元數(shù)據(jù)封裝,支持在線對(duì)電子檔案設(shè)置元數(shù)據(jù)及數(shù)據(jù)長(zhǎng)久保存封裝規(guī)則,根據(jù)規(guī)則自動(dòng)進(jìn)行數(shù)據(jù)封裝;數(shù)據(jù)包維護(hù),支持通過(guò)數(shù)據(jù)包管理功能查看電子文件和電子檔案相關(guān)數(shù)據(jù)封裝后情況;備份,支持軟件系統(tǒng)、數(shù)據(jù)庫(kù)和電子檔案?jìng)浞荩鶕?jù)數(shù)據(jù)重要程度選擇在線、離線等不同備份方式;“四性”檢查,支持針對(duì)電子文件和電子檔案來(lái)源、內(nèi)容是否被篡改,信息構(gòu)成是否完整,元數(shù)據(jù)和特殊軟硬件是否完整,是否具備信息可識(shí)別性、存儲(chǔ)系統(tǒng)可靠性、載體完好和兼容性等涉及“真實(shí)性、完整性、可靠性、可用性”的指標(biāo)項(xiàng)進(jìn)行在線監(jiān)測(cè)和維護(hù)。
2.設(shè)計(jì)數(shù)字檔案長(zhǎng)期保存數(shù)據(jù)架構(gòu)。數(shù)據(jù)架構(gòu)參照OAIS參考模型進(jìn)行設(shè)計(jì)。根據(jù)業(yè)務(wù)應(yīng)用場(chǎng)景對(duì)檔案業(yè)務(wù)數(shù)據(jù)進(jìn)行分庫(kù)管理,并結(jié)合分布式存儲(chǔ)技術(shù)對(duì)數(shù)據(jù)內(nèi)容進(jìn)行存儲(chǔ),在功能、性能兩方面滿足業(yè)務(wù)發(fā)展需要。
從業(yè)務(wù)與信息系統(tǒng)自動(dòng)歸檔或歸檔人員手工上傳的電子文件對(duì)應(yīng)OAIS中SIP數(shù)據(jù)包,其電子文件和關(guān)聯(lián)的背景信息除以原始文件形式保存在數(shù)字檔案館系統(tǒng)外,還將背景信息中的結(jié)構(gòu)化數(shù)據(jù)保存在數(shù)字檔案館數(shù)據(jù)庫(kù)中,以方便查找利用。歸檔辦結(jié)的檔案中,對(duì)于有長(zhǎng)久保存價(jià)值的(如保管期限為30年及以上的)電子文件,數(shù)字檔案館系統(tǒng)自主定制了專業(yè)數(shù)據(jù)包,對(duì)應(yīng)OAIS中的AIP數(shù)據(jù)包。該數(shù)據(jù)包在檔案辦結(jié)穩(wěn)定后,由后臺(tái)打包服務(wù)自動(dòng)完成長(zhǎng)久保存數(shù)據(jù)包封裝工作,并保存在一套獨(dú)立的存儲(chǔ)中。用戶借閱的電子文件,對(duì)應(yīng)OAIS中的DIP數(shù)據(jù)包,在用戶進(jìn)行借閱時(shí),系統(tǒng)自動(dòng)生成帶權(quán)限保護(hù)的加密壓縮數(shù)據(jù)包,每個(gè)借閱者都有其獨(dú)立副本,只能通過(guò)系統(tǒng)自主開(kāi)發(fā)的文件保護(hù)客戶端由授權(quán)用戶打開(kāi)利用。
3.制定數(shù)字檔案長(zhǎng)期保存管理規(guī)范。一是歸檔電子文件元數(shù)據(jù)規(guī)范。保存元數(shù)據(jù)是電子檔案長(zhǎng)期保存重要技術(shù)保障措施之一,中國(guó)石油從集團(tuán)公司層面制定了企業(yè)標(biāo)準(zhǔn)《歸檔電子文件元數(shù)據(jù)規(guī)范》(QS/Y10542—2018)。該標(biāo)準(zhǔn)定義了文件實(shí)體元數(shù)據(jù)(文件本身屬性內(nèi)容)、業(yè)務(wù)實(shí)體元數(shù)據(jù)(處理文件過(guò)程中的業(yè)務(wù)狀態(tài)、行為)和實(shí)體關(guān)系元數(shù)據(jù)(實(shí)體關(guān)系類型、關(guān)系及表述等)三個(gè)域,規(guī)定了歸檔電子文件元數(shù)據(jù)的元素、結(jié)構(gòu)、表述方法和封裝,以滿足數(shù)字檔案長(zhǎng)期保存的需要。針對(duì)每類電子文件明確元數(shù)據(jù)項(xiàng),如電子會(huì)計(jì)檔案元數(shù)據(jù)共81項(xiàng),其中文件實(shí)體元數(shù)據(jù)71項(xiàng)、業(yè)務(wù)實(shí)體元數(shù)據(jù)6項(xiàng)、實(shí)體關(guān)系元數(shù)據(jù)4項(xiàng)。電子合同檔案元數(shù)據(jù)共93項(xiàng),其中文件實(shí)體元數(shù)據(jù)83項(xiàng)、業(yè)務(wù)實(shí)體元數(shù)據(jù)6項(xiàng)、實(shí)體關(guān)系元數(shù)據(jù)4項(xiàng)。二是歸檔電子文件格式規(guī)范。中石油從集團(tuán)公司層面制定了企業(yè)標(biāo)準(zhǔn)《歸檔電子文件格式規(guī)范》,規(guī)定了歸檔電子文件長(zhǎng)期保存格式應(yīng)具有的特征和選擇原則,定義了純文本文件、格式化文本文件、版式文件、圖像文件、矢量圖形文件、音頻文件、視頻文件的歸檔電子文件的長(zhǎng)期保存格式,同時(shí)定義了可提供保護(hù)的電子文件格式共7類,包括25種,如版式文件采用PDF格式、XPS格式、OFD格式,純文本文件采用TXT格式、XML格式。
4.采取多種形式的數(shù)字檔案存儲(chǔ)方式。在數(shù)據(jù)保存方式上,檔案管理系統(tǒng)中所有檔案條目數(shù)據(jù)均保存在結(jié)構(gòu)化數(shù)據(jù)庫(kù)中,對(duì)應(yīng)的電子文件保存在以NAS作為底層存儲(chǔ)的分布式文件存儲(chǔ)中,該保存方式結(jié)構(gòu)公開(kāi),無(wú)技術(shù)偏好性,后期可隨時(shí)更換底層的NAS存儲(chǔ)以使用其他技術(shù)。以上數(shù)據(jù)均為方便在線利用進(jìn)行保存。對(duì)于具備長(zhǎng)久保存價(jià)值的電子文件及其相應(yīng)的元數(shù)據(jù),設(shè)計(jì)了一套以ZIP壓縮包為封裝載體,以分級(jí)文件夾進(jìn)行電子文件組織,以XML文件為結(jié)構(gòu)化數(shù)據(jù)組織的數(shù)據(jù)包封裝方案。數(shù)據(jù)包中存儲(chǔ)的XML文件保留了檔案形成過(guò)程中產(chǎn)生的各類審批信息、源頭信息和簽名信息等。每份檔案一個(gè)數(shù)據(jù)包,每個(gè)數(shù)據(jù)包均采用公開(kāi)方式進(jìn)行封裝,沒(méi)有加密操作,以確保長(zhǎng)久保存數(shù)據(jù)脫離檔案管理系統(tǒng)也可進(jìn)行利用。長(zhǎng)久保存數(shù)據(jù)包可定期存儲(chǔ)在磁帶庫(kù)或不可覆蓋的光盤介質(zhì)中,并將介質(zhì)進(jìn)行登記與離線保存,防止數(shù)據(jù)被篡改。未來(lái)如在線系統(tǒng)中保存的檔案數(shù)據(jù)丟失,或與長(zhǎng)久保存數(shù)據(jù)包中的數(shù)據(jù)出現(xiàn)不一致時(shí),均以長(zhǎng)久保存數(shù)據(jù)包中的數(shù)據(jù)為準(zhǔn)。在硬件存儲(chǔ)方式上,檔案管理系統(tǒng)計(jì)算資源與存儲(chǔ)資源全部由中石油云計(jì)算平臺(tái)提供,其中結(jié)構(gòu)化數(shù)據(jù)底層存儲(chǔ)采用SAN存儲(chǔ)區(qū)域網(wǎng)絡(luò)(Storage Area Network),非結(jié)構(gòu)化數(shù)據(jù)采用NAS網(wǎng)絡(luò)連接存儲(chǔ)(Network-Attached Storage),備份數(shù)據(jù)采用磁帶庫(kù)方式保存。
5.實(shí)施數(shù)字檔案?jìng)浞菖c容災(zāi)策略。數(shù)據(jù)庫(kù)備份策略:每周一至周六進(jìn)行差異備份,周日進(jìn)行全量備份。每天每隔三小時(shí)整點(diǎn)進(jìn)行事務(wù)日志備份。每日對(duì)數(shù)據(jù)庫(kù)備份完后對(duì)備份文件再次進(jìn)行磁帶庫(kù)自動(dòng)備份。每月30日在測(cè)試環(huán)境進(jìn)行備份可用性恢復(fù)測(cè)試。電子文件備份策略:生產(chǎn)環(huán)境每日變化的電子文件數(shù)據(jù),相關(guān)服務(wù)自動(dòng)進(jìn)行復(fù)制,復(fù)制至單獨(dú)磁盤,并對(duì)磁盤文件每天進(jìn)行磁帶庫(kù)備份。如出現(xiàn)需要恢復(fù)電子文件的情況,根據(jù)當(dāng)日備份文件進(jìn)行恢復(fù)。系統(tǒng)容災(zāi)策略:檔案管理系統(tǒng)生產(chǎn)環(huán)境部署在北京數(shù)據(jù)中心,異地災(zāi)備環(huán)境規(guī)劃在新疆?dāng)?shù)據(jù)中心,兩個(gè)數(shù)據(jù)中心間具備萬(wàn)兆光纖進(jìn)行數(shù)據(jù)傳輸與同步。中石油通過(guò)建設(shè)數(shù)字檔案長(zhǎng)期保存系統(tǒng)、設(shè)計(jì)數(shù)字檔案長(zhǎng)期保存數(shù)據(jù)架構(gòu)、制定數(shù)字檔案長(zhǎng)期保存管理規(guī)范、采取多種形式的數(shù)字檔案存儲(chǔ)方式、實(shí)施數(shù)字檔案?jìng)浞菖c容災(zāi)策略等措施,基本實(shí)現(xiàn)數(shù)字檔案的安全保管和長(zhǎng)期可用。
二、中石油數(shù)字檔案長(zhǎng)期保存主要問(wèn)題
通過(guò)選擇數(shù)字保存能力成熟度模型(DPCMM)進(jìn)行評(píng)價(jià),中石油數(shù)字檔案長(zhǎng)期保存主要存在以下問(wèn)題。一是沒(méi)有系統(tǒng)化的數(shù)字檔案長(zhǎng)期保存框架。主要體現(xiàn)在OAIS的核心要素缺失——偏宏觀管理活動(dòng)而非檔案業(yè)務(wù)活動(dòng)的行政管理和保存規(guī)劃模塊的功能并沒(méi)有納入到檔案管理系統(tǒng)建設(shè)中,說(shuō)明業(yè)務(wù)和系統(tǒng)在整體建設(shè)與規(guī)劃中缺少對(duì)于OAIS體系性的認(rèn)識(shí)。二是缺乏數(shù)字檔案長(zhǎng)期保存體系認(rèn)證意識(shí)。中石油尚且處于數(shù)字對(duì)象管理的功能建設(shè)階段,并沒(méi)有實(shí)施任何功能認(rèn)證。三是數(shù)字檔案長(zhǎng)期保存技術(shù)與工具體系不完備。中石油在開(kāi)展檔案長(zhǎng)期保存活動(dòng)時(shí),運(yùn)用了數(shù)字對(duì)象封裝技術(shù)、“四性”檢測(cè)等校驗(yàn)技術(shù)、災(zāi)難備份與恢復(fù)技術(shù)和安全風(fēng)險(xiǎn)管理等。以數(shù)字封裝為例,中石油目前使用的是常規(guī)的ZIP壓縮工具,直接將內(nèi)容信息與元數(shù)據(jù)進(jìn)行壓縮打包,而沒(méi)有做任何XML格式封裝處理。對(duì)照基于OAIS的數(shù)字保存技術(shù)工具與服務(wù)體系,如在接收功能方面,缺少數(shù)字對(duì)象封裝技術(shù)、完整性校驗(yàn)技術(shù)。以上問(wèn)題是很多企業(yè)開(kāi)展數(shù)字檔案長(zhǎng)期保存時(shí)容易忽視的問(wèn)題,應(yīng)引起重視。
三、數(shù)字檔案長(zhǎng)期保存策略
1.框架指引:全面遵循OAIS參考模型設(shè)計(jì)可持續(xù)框架。OAIS(開(kāi)放檔案信息系統(tǒng))(ISO 14721:2012)作為國(guó)際公認(rèn)的數(shù)字信息長(zhǎng)期保存標(biāo)準(zhǔn),為數(shù)字檔案長(zhǎng)期保存提供了一個(gè)基本的框架,它所提出的信息模型對(duì)于制訂長(zhǎng)期保存元數(shù)據(jù)方案和指導(dǎo)數(shù)據(jù)封裝具有重要的參考價(jià)值。此外,OAIS還針對(duì)數(shù)字信息的特點(diǎn)及生命運(yùn)動(dòng)規(guī)律,提供了包含六個(gè)基本功能模塊的功能模型,為企業(yè)數(shù)字檔案長(zhǎng)期保存系統(tǒng)框架的構(gòu)建提供了科學(xué)指導(dǎo)。值得注意的是,OAIS參考模型針對(duì)不同的應(yīng)用對(duì)象,有著不同的具體實(shí)現(xiàn),而且OAIS所提出的理論設(shè)想并不都具有絕對(duì)可行性,需要加以靈活應(yīng)用。
2.系統(tǒng)保障:建設(shè)適用的數(shù)字檔案長(zhǎng)期保存系統(tǒng)。建設(shè)數(shù)字檔案長(zhǎng)期保存系統(tǒng)是實(shí)現(xiàn)數(shù)字檔案長(zhǎng)期保存的重要載體。數(shù)字檔案長(zhǎng)期保存系統(tǒng)的開(kāi)發(fā)和建構(gòu),可基于《信息與文件—文件管理—第一部分:總則》(ISO 15489)的概念模型,也可參考OAIS參考模型提供的系統(tǒng)架構(gòu)。ISO 15489作為整個(gè)文件與檔案管理領(lǐng)域公認(rèn)的奠基標(biāo)準(zhǔn),其確立的一系列概念與管理原則在各個(gè)長(zhǎng)期保存標(biāo)準(zhǔn)中也得到了廣泛繼承和發(fā)展。OAIS參考模型是建設(shè)可信數(shù)字資源保存庫(kù)的基本參照和重要指南。很多檔案館、圖書館及出版機(jī)構(gòu)等應(yīng)用OAIS構(gòu)建了數(shù)字信息長(zhǎng)期保存系統(tǒng),如美國(guó)國(guó)家檔案館以O(shè)AIS為參照,開(kāi)發(fā)了著名的數(shù)字檔案館(ERA)項(xiàng)目;歐洲NEDLIB項(xiàng)目以O(shè)AIS的功能模塊為參照,構(gòu)建了電子出版物版本系統(tǒng)(DSEP)。在參照OAIS功能模型時(shí),一些企業(yè)常常忽視行政管理功能的建設(shè),行政管理功能通常包括制定標(biāo)準(zhǔn)和政策、管理系統(tǒng)配置、審查提交、商定提交協(xié)議等,在整個(gè)OAIS系統(tǒng)中扮演著宏觀組織、控制和協(xié)調(diào)的重要角色,與其他五個(gè)功能實(shí)體保持聯(lián)系和互動(dòng)。另外,它還具有檔案信息更新、物理存取控制、激活需求和客戶服務(wù)等多項(xiàng)業(yè)務(wù)功能。因此,企業(yè)在參照OAIS功能模型建設(shè)數(shù)字檔案長(zhǎng)期保存系統(tǒng)時(shí),應(yīng)格外重注行政管理功能的建設(shè)。
3.體系作戰(zhàn):建設(shè)基于認(rèn)證的數(shù)字檔案長(zhǎng)期保存管理體系。健全的管理體系是數(shù)字檔案長(zhǎng)期保存的重要保障。企業(yè)可遵循《可信數(shù)字倉(cāng)儲(chǔ)審計(jì)與認(rèn)證:標(biāo)準(zhǔn)與審計(jì)表》(TRAC)國(guó)際標(biāo)準(zhǔn),建立可信可認(rèn)證的長(zhǎng)期保存技術(shù)與管理體系?;緝?nèi)容可從三個(gè)基本層次展開(kāi),即組織基礎(chǔ)建設(shè)、數(shù)字對(duì)象管理、技術(shù)基礎(chǔ)設(shè)施及安全保障,在每一個(gè)層次又可進(jìn)一步展開(kāi)和細(xì)分,形成具有可操作性的二級(jí)和三級(jí)指標(biāo)。同時(shí),可參考國(guó)家檔案局在2017年發(fā)布的《企業(yè)數(shù)字檔案館(室)建設(shè)指南》,以其基本要求為指導(dǎo),健全管理體系。
4.技術(shù)支撐:合理選擇長(zhǎng)期保存工具與技術(shù)策略。企業(yè)應(yīng)重視以下方面技術(shù)應(yīng)用。一是格式管理技術(shù)。我國(guó)檔案行業(yè)標(biāo)準(zhǔn)《版式電子文件長(zhǎng)期保存格式需求》(DA/T47—2009)作出了明確規(guī)定:支持真實(shí)性、格式透明、不綁定軟硬件、格式自包含、格式自描述、固定顯示、持續(xù)可解釋、持續(xù)可用、可轉(zhuǎn)換、易存儲(chǔ)?!峨娮游募w檔與電子檔案管理規(guī)范》(GB/T 18894—2016),規(guī)定了不同類型文件的格式要求。企業(yè)在實(shí)施格式管理策略時(shí),應(yīng)在已有標(biāo)準(zhǔn)和實(shí)踐基礎(chǔ)上,開(kāi)展格式注冊(cè)管理,明確規(guī)定所接收的歸檔文件格式類型、非標(biāo)準(zhǔn)格式轉(zhuǎn)化為標(biāo)準(zhǔn)格式的流程和技術(shù)要求,以及格式轉(zhuǎn)換的質(zhì)量控制。由于格式本身處于動(dòng)態(tài)變化之中,加之電子檔案本身覆蓋的業(yè)務(wù)范圍廣泛,信息類型多樣,因此企業(yè)宜定期發(fā)布數(shù)字檔案長(zhǎng)期保存格式推薦指南。二是遷移技術(shù)。遷移技術(shù)是數(shù)字保存領(lǐng)域應(yīng)用最為普遍且相對(duì)成熟的技術(shù)策略。目前,主要有物理遷移(存儲(chǔ)介質(zhì)遷移)和邏輯遷移(文件格式遷移)兩種方式,企業(yè)需要結(jié)合自身情況制定合理的遷移管理策略。另外,由于目前還有大量非標(biāo)準(zhǔn)格式的電子文件存在,數(shù)據(jù)格式尚處在自我發(fā)展階段,缺乏必要的整合,軟件系統(tǒng)也是類似情況,因而建立遷移管理中心,集中應(yīng)對(duì)舊有信息的遷移工作,在成本控制、技術(shù)保障方面很有優(yōu)勢(shì),便于對(duì)類似數(shù)據(jù)庫(kù)系統(tǒng)、多媒體信息、地理信息系統(tǒng)等復(fù)雜文件的遷移提供服務(wù)。三是封裝技術(shù)。封裝技術(shù)通過(guò)將元數(shù)據(jù)和內(nèi)容直接關(guān)聯(lián)打包為一體的形式,實(shí)現(xiàn)數(shù)字檔案自包含、自描述和自證明,成為數(shù)字檔案安全管理較為有效的一種技術(shù)手段。目前,較典型的幾種封裝結(jié)構(gòu)或模型有VEO(VERS Encapsulation Object)封裝包、METS(Metadata Encoding and Transmission Standard,數(shù)據(jù)編碼和傳輸格式)封裝、XML封裝。我國(guó)制定了行業(yè)標(biāo)準(zhǔn)《基于XML的電子文件封裝規(guī)范》(DA/T 48—2009),《電子檔案移交與接收辦法》規(guī)定“一般采用基于XML的封裝方式組織檔案數(shù)據(jù)”。四是面向未來(lái)搭建長(zhǎng)期保存工具與服務(wù)體系。目前,相關(guān)機(jī)構(gòu)開(kāi)發(fā)出檔案接收、檔案存儲(chǔ)與數(shù)據(jù)管理、檔案存取、保存規(guī)劃等方面各類軟件工具并提供有關(guān)支持服務(wù)。企業(yè)可選擇性引進(jìn)使用,面對(duì)眾多的軟件工具,有必要建立長(zhǎng)期保存工具統(tǒng)一管理模塊,開(kāi)展工具的注冊(cè)和備案管理。
5.協(xié)同治理:打造企業(yè)數(shù)字檔案長(zhǎng)期保存共贏生態(tài)。數(shù)字檔案長(zhǎng)期保存是一項(xiàng)系統(tǒng)工程,從企業(yè)內(nèi)部看,涉及檔案部門、業(yè)務(wù)部門、數(shù)據(jù)管理部門等多個(gè)主體;從企業(yè)外部看,涉及國(guó)家檔案行政管理部門、社會(huì)研究機(jī)構(gòu)、各類相關(guān)企業(yè)等。因此,建立各參與主體間的良性互動(dòng)機(jī)制,打造企業(yè)數(shù)字檔案長(zhǎng)期保存共贏生態(tài),是企業(yè)數(shù)字檔案長(zhǎng)期保存可持續(xù)發(fā)展的有效途徑。可從以下方面開(kāi)展合作:一是數(shù)字檔案資源長(zhǎng)期保存合作體系的構(gòu)建、政策的制定。二是數(shù)字檔案長(zhǎng)期保存前后端業(yè)務(wù)活動(dòng)的協(xié)調(diào),特別是提前介入數(shù)字檔案的產(chǎn)生、流轉(zhuǎn)過(guò)程,參與業(yè)務(wù)信息系統(tǒng)的設(shè)計(jì)。三是數(shù)字檔案長(zhǎng)期保存標(biāo)準(zhǔn)規(guī)范的制訂。為保證數(shù)字檔案長(zhǎng)期保存業(yè)務(wù)標(biāo)準(zhǔn)的適用性,文件形成部門、檔案部門、技術(shù)部門、利用者、政府等多方主體應(yīng)共同參與,在進(jìn)行充分調(diào)查的基礎(chǔ)上制定數(shù)字檔案長(zhǎng)期保存標(biāo)準(zhǔn)與規(guī)范。四是技術(shù)研發(fā)。開(kāi)發(fā)具有國(guó)產(chǎn)自有知識(shí)產(chǎn)權(quán)的管理軟件和硬件。
參考文獻(xiàn)
[1]祁天嬌. 美國(guó)數(shù)字檔案資源長(zhǎng)期保存戰(zhàn)略的分析與啟示[J]. 檔案學(xué)研究,2019(1):108-113.
[2]錢毅. 基于OAIS 的數(shù)字檔案資源長(zhǎng)期保存認(rèn)證策略研究[J]. 檔案學(xué)研究,2018(4):72-77.
[3]肖秋會(huì),高婷. 電子文件長(zhǎng)期保存格式標(biāo)準(zhǔn)研究[J]. 信息資源管理學(xué)報(bào),2017(2):71-76.
[4]劉越男,楊建梁. 面向電子文件保存的統(tǒng)一元數(shù)據(jù)模型的構(gòu)建[J]. 中國(guó)圖書館學(xué)報(bào),2017(2):66-79.
[5]錢毅. 數(shù)據(jù)態(tài)環(huán)境中數(shù)字檔案對(duì)象保存問(wèn)題與策略分析[J]. 檔案學(xué)通訊,2019(4):40-47.