王兵,張曉路
(1.海軍計(jì)算技術(shù)研究所,北京 100841;2.海軍檔案館,北京 100841)
基于OAIS的數(shù)字檔案管理系統(tǒng)架構(gòu)研究
王兵1,張曉路2
(1.海軍計(jì)算技術(shù)研究所,北京 100841;2.海軍檔案館,北京 100841)
管理利用好數(shù)字檔案信息資源是業(yè)內(nèi)探討的重要問題之一。介紹OASI概念模型,給出一個(gè)數(shù)字檔案管理系統(tǒng)的系統(tǒng)結(jié)構(gòu),提出系統(tǒng)構(gòu)建需處理好的關(guān)鍵環(huán)節(jié),并對數(shù)字檔案管理系統(tǒng)建設(shè)進(jìn)行展望。
數(shù)字檔案;系統(tǒng)架構(gòu);OASI模型
隨著信息技術(shù)的迅速發(fā)展,人們管理利用數(shù)字信息的能力不斷提升,檔案信息是現(xiàn)代社會信息資源的重要組成部分,如何科學(xué)構(gòu)建數(shù)字檔案管理系統(tǒng),管理利用好檔案信息資源已成為業(yè)內(nèi)探討的重要問題。美國空間數(shù)據(jù)系統(tǒng)咨詢委員會(The Consultative Committee for Space Data Systems簡稱CCSDS)開發(fā)的“開放性檔案信息系統(tǒng)參考模型”(OASI A Reference Model for an Open Archival information System)于2002年1月通過審核,正式成為國際標(biāo)準(zhǔn)(ISO 14721)。此模型適用于所有長期保存數(shù)字資源并提供利用服務(wù)的系統(tǒng)和組織,因而被包括政府部門和數(shù)字圖書檔案館在內(nèi)的很多組織所采用,并獲得廣泛認(rèn)可。它為數(shù)字檔案信息保存提供了一個(gè)可供遵循的模式和框架,值得認(rèn)真研究借鑒,從而開發(fā)建設(shè)適合我們工作實(shí)際的數(shù)字檔案管理系統(tǒng)。
OAIS認(rèn)為,OAIS系統(tǒng)是一個(gè)介于生產(chǎn)者、消費(fèi)者和管理者之間的存檔系統(tǒng),圍繞OAIS進(jìn)行檔案信息存儲、管理和利用。OAIS中定義了六個(gè)功能實(shí)體和三種信息包,OAIS模型定義的六個(gè)基本功能包括:
(1)攝入(Ingest)功能。從信息生產(chǎn)者那里接收信息,對內(nèi)容進(jìn)行審核,以便所提交信息能夠在檔案系統(tǒng)中進(jìn)行存儲和管理。
(2)檔案存儲(Archival Storage)功能。提供存儲、維護(hù)和檢索服務(wù),從Ingest功能接收信息,將其存儲到永久存儲系統(tǒng)之中,管理存儲的組織結(jié)構(gòu),并為Access功能提供檔案提取支撐。
(3)數(shù)據(jù)管理(Data Management)功能。生成、維護(hù)和存取那些標(biāo)識并記錄檔案的描述信息以及對檔案系統(tǒng)進(jìn)行管理的管理數(shù)據(jù)。數(shù)據(jù)管理的功能包括管理檔案數(shù)據(jù)庫、執(zhí)行數(shù)據(jù)庫更新、對管理數(shù)據(jù)提供查詢功能等。
(4)系統(tǒng)管理(Administration)功能。對整體的檔案系統(tǒng)進(jìn)行管理,與信息生產(chǎn)者商定提交協(xié)議,對系統(tǒng)的軟件環(huán)境進(jìn)行配置和管理。
(5)保存規(guī)劃(Preservation Planning)功能。監(jiān)測OAIS的環(huán)境,提供相關(guān)計(jì)劃和策略以確保在OAIS中存儲的信息在長期保存之后,仍然能夠被相應(yīng)的目標(biāo)用戶所訪問。
(6)存?。ˋccess)功能。支持消費(fèi)者可以判定、了解、定位以及存取存在OAIS中的信息,讓消費(fèi)者可以請求接收信息產(chǎn)品。
OAIS提出了信息包(Information Packge)概念來說明檔案生產(chǎn)者的一個(gè)OAIS提交過程和OAIS向檔案消費(fèi)者的分發(fā)過程。一個(gè)信息包包括內(nèi)容信息和保存描述信息兩部分內(nèi)容,OAIS對提交給它的信息包、它所存儲的信息包、以及它分發(fā)給其他消費(fèi)者的信息包進(jìn)行區(qū)分,分別將這些信息包稱為提交信息包(SIP)、存檔信息包(AIP)和分發(fā)信息包(DIP)。
OAIS參考模型是對數(shù)字檔案系統(tǒng)相關(guān)的環(huán)境、功能模塊以及信息對象邏輯上的概念描述,模型中并沒有涉及系統(tǒng)的體系結(jié)構(gòu)、存儲過程、數(shù)據(jù)庫設(shè)計(jì)、處理平臺等具體設(shè)計(jì)。該參考模型可以作為構(gòu)建實(shí)際系統(tǒng)的一個(gè)理論基礎(chǔ),不同的組織可以根據(jù)自身業(yè)務(wù)的特點(diǎn)和具體要求建設(shè)自己的數(shù)字檔案管理系統(tǒng)。
數(shù)字檔案管理系統(tǒng)的系統(tǒng)結(jié)構(gòu)設(shè)計(jì)一定要適合業(yè)務(wù)工作的實(shí)際情況,不必和OAIS功能模型完全對應(yīng)。根據(jù)當(dāng)前數(shù)字檔案管理工作實(shí)際情況,現(xiàn)對數(shù)字檔案管理系統(tǒng)的系統(tǒng)結(jié)構(gòu)設(shè)計(jì)如圖1所示。
圖1 數(shù)字檔案管理系統(tǒng)的系統(tǒng)結(jié)構(gòu)
立檔單位、個(gè)人或組織將可以通過線上或線下提交數(shù)字檔案信息,系統(tǒng)進(jìn)行必要的安全防護(hù)處理后,進(jìn)行檔案信息的接收審核業(yè)務(wù),對接收的內(nèi)容進(jìn)行檢查、整理,分別形成不同類別的檔案信息,經(jīng)整理、立卷歸檔,生成檔案的主要信息元素(包括檔案檔號、檔案館代號、實(shí)體存放位置等)存入檔案數(shù)據(jù)庫。對于已經(jīng)存在的檔案數(shù)據(jù)文件,可開發(fā)專用的軟件轉(zhuǎn)換工具將其轉(zhuǎn)入數(shù)字檔案系統(tǒng)中。
數(shù)字檔案管理主要完成對數(shù)據(jù)庫中的檔案數(shù)據(jù)進(jìn)行各種管理操作,如生成存儲信息包、進(jìn)行信息的整理歸類、進(jìn)行檔案數(shù)據(jù)的長期保存、接收與利用崗位通過業(yè)務(wù)流程控制進(jìn)行信息的審批交互等工作。存儲管理是對檔案信息載體、庫房實(shí)體檔案進(jìn)行管理維護(hù),如維護(hù)庫房、排架、層、列等實(shí)體對象,在系統(tǒng)中對庫房實(shí)體的內(nèi)容信息進(jìn)行增、刪、改、查等具體操作。系統(tǒng)管理實(shí)現(xiàn)系統(tǒng)自身必要的管理功能,包括用戶管理、系統(tǒng)配置管理、設(shè)備管理等。
系統(tǒng)按照檔案利用控制流程,提供數(shù)字檔案的利用服務(wù)(線上或線下)。檔案利用者可通過在線檔案查詢(關(guān)鍵詞檢索、綜合業(yè)務(wù)查詢、全文檢索),查詢到需要的檔案后,申請獲得瀏覽或下載數(shù)字檔案原文權(quán)限,通過檔案管理人員審批通過后,即可進(jìn)行原文的瀏覽或下載操作。
圍繞數(shù)字檔案管理系統(tǒng),可根據(jù)需要開發(fā)一些獨(dú)立的業(yè)務(wù)工作軟件,如:檔案著錄、接收/移交系統(tǒng)、檔案利用登記審核系統(tǒng)、檔案庫房監(jiān)控管理系統(tǒng)等。這些軟件需要注意解決好數(shù)據(jù)庫的安全訪問和信息輸入輸出的格式轉(zhuǎn)換,以增強(qiáng)系統(tǒng)可擴(kuò)展性和部置靈活性,幫助提高業(yè)務(wù)工作效率。
(1)數(shù)字檔案信息包的結(jié)構(gòu)定義和處理
數(shù)字檔案信息包的結(jié)構(gòu)定義和處理是檔案資源管理的核心問題,OAIS信息模型為數(shù)字檔案管理提供了數(shù)據(jù)對象的元數(shù)據(jù)模型,信息包基本結(jié)構(gòu)包括內(nèi)容信息、保存描述信息、封裝信息和描述信息等部分,并將數(shù)據(jù)信息包分成提交信息包(SIP)、分發(fā)信息包(DIP)、存檔信息包(AIP)等三類。進(jìn)行管理系統(tǒng)設(shè)計(jì)時(shí),可參照OAIS的數(shù)據(jù)模型,設(shè)計(jì)符合規(guī)范的檔案信息包結(jié)構(gòu),確定具體封裝方式,按照實(shí)際檔案業(yè)務(wù)流轉(zhuǎn)過程設(shè)計(jì)內(nèi)部數(shù)據(jù)包的轉(zhuǎn)換處理流程。數(shù)字檔案信息包處理方法是否科學(xué)合理,是決定數(shù)字檔案管理系統(tǒng)設(shè)計(jì)成敗的重要因素。
(2)數(shù)據(jù)存儲管理
基于OAIS的檔案管理要實(shí)現(xiàn)數(shù)字信息的長期存儲,必需解決以下技術(shù)環(huán)節(jié):數(shù)字檔案的完整性和真實(shí)性鑒別、檔案數(shù)據(jù)格式轉(zhuǎn)換與數(shù)據(jù)遷移、檔案數(shù)據(jù)庫邏輯視圖設(shè)計(jì)、數(shù)字信息和物理載體的存儲管理、庫房與設(shè)備數(shù)據(jù)管理維護(hù)等。OAIS較為全面地闡述了對于數(shù)字信息長久保存的管理策略,強(qiáng)調(diào)信息遷移至不同的介質(zhì)和軟件環(huán)境中要保證其可用性,提出了更新(Refreshment)、復(fù)制(Replication)、重組(Repacking)、轉(zhuǎn)換(Transformation)等四種遷移方式。在進(jìn)行數(shù)字檔案管理系統(tǒng)設(shè)計(jì)時(shí),要在考慮需求、成本和介質(zhì)等因素的基礎(chǔ)上進(jìn)行預(yù)先的設(shè)計(jì)和安排。
(3)安全訪問(利用)技術(shù)
數(shù)字檔案管理系統(tǒng)運(yùn)行的安全、穩(wěn)定是提供檔案利用服務(wù)的前提,必需從線上、線下兩方面規(guī)劃好系統(tǒng)的安全防護(hù)。從網(wǎng)絡(luò)安全方面,要綜合利用防火墻、入侵檢測、網(wǎng)絡(luò)監(jiān)控、信息審計(jì)、通信加密、安全掃描、災(zāi)難恢復(fù)等技術(shù),提升系統(tǒng)的抗網(wǎng)絡(luò)攻擊能力。另外在抓好系統(tǒng)軟硬件建設(shè)的基礎(chǔ)上,加強(qiáng)系統(tǒng)的安全管理、組織管理、人員管理,防止因?yàn)楣芾砩系乃尚敢约皩Π踩珕栴}的錯(cuò)誤認(rèn)識而造成的安全威脅和漏洞。
數(shù)字檔案管理系統(tǒng)建設(shè)涉及到較為復(fù)雜的處理流程控制和信息處理技術(shù),需要從管理和技術(shù)兩方面綜合考慮和策劃,才能克服建設(shè)實(shí)踐中出現(xiàn)的各種問題,設(shè)計(jì)開發(fā)出適合自身需求的數(shù)字檔案管理系統(tǒng)。我國對OAIS模型的研究起步較晚,對數(shù)字檔案管理系統(tǒng)建設(shè)的研究和投入不多,規(guī)范化、標(biāo)準(zhǔn)化程度較低,制約了數(shù)字檔案管理與利用業(yè)務(wù)的開展,需要檔案工作人員解放思想觀念,積極學(xué)習(xí)借鑒國內(nèi)外先進(jìn)的標(biāo)準(zhǔn)和相關(guān)經(jīng)驗(yàn),結(jié)合工作實(shí)際,科學(xué)、穩(wěn)妥地完成好數(shù)字檔案系統(tǒng)的建設(shè)任務(wù)。
[1]CCSDS.A Reference Model for an Open Archival Information System,ISO 14721,2002.
[2]李麗潔.在線文檔中心:雙軌制背景下的電子文件管理模式[J].檔案學(xué)研究,2015.
[3]郭偉.數(shù)字檔案館頂層架構(gòu)參考模型設(shè)計(jì)[J].檔案學(xué)研究,2015.
Research on Digital Archive System Framework Based on OAIS
WANG Bing1,ZHANG Xiao-lu2
(1.Naval Institute of Computing Technology,Beijing 100841;2.Naval Archives,Beijing 100841)
The management of digital archive is one of the most popular fields of investigation in archives.Presents a framework of a digital archive system and key issues for the construction of digital archives,illustrates the development and prosperity of archive management.
Digital Archive;System Framework;OASI Model
1007-1423(2017)10-0078-03
10.3969/j.issn.1007-1423.2017.10.021
王兵(1966-),男,高工,本科,研究方向?yàn)橛?jì)算機(jī)技術(shù)應(yīng)用
2017-01-04
2017-03-26