程妍妍
摘要:從提高數(shù)字檔案館建設(shè)質(zhì)量和效率出發(fā),提出基于服務(wù)的數(shù)字檔案館系統(tǒng)功能架構(gòu)理念,分析其基本思路和實施,明確并建立我國數(shù)字檔案館系統(tǒng)的核心服務(wù)框架及標(biāo)準(zhǔn)化需求。
關(guān)鍵詞:數(shù)字檔案館;服務(wù);功能結(jié)構(gòu)
Abstract: To promote the quality and efficiency of our digital archives, the paper puts forward service—based functional architecture concept as well as its basic ideas and implementation. It also establishes core services framework and standard requirements of our digital archive system.
Keywords:Digital archive;Services;Functional structure
數(shù)字檔案館建設(shè)是檔案事業(yè)發(fā)展“十二五”規(guī)劃的重要內(nèi)容,其建設(shè)水平體現(xiàn)國家信息化發(fā)展綜合實力。本文提出基于服務(wù)的數(shù)字檔案館系統(tǒng)功能架構(gòu),從國家層面統(tǒng)一全國數(shù)字檔案館系統(tǒng)功能結(jié)構(gòu),提升我國數(shù)字檔案館建設(shè)質(zhì)量和效率。
1 基于服務(wù)的數(shù)字檔案館系統(tǒng)功能架構(gòu)提出
本文中服務(wù)(service)一詞,來源于信息技術(shù)領(lǐng)域定義,指“系統(tǒng)中的一組功能”[1],即系統(tǒng)中具有通用性、共享性、可分布式實施的功能[2]?;诜?wù)的數(shù)字檔案館系統(tǒng)功能架構(gòu)指數(shù)字檔案館系統(tǒng)可以由各種服務(wù)組成,完成其功能?;诜?wù)架構(gòu)是一種全新的數(shù)字檔案館建設(shè)理念,2011年,歐盟《文件系統(tǒng)模塊化需求》[3]標(biāo)準(zhǔn)中,首次提出采用該理念設(shè)計文件管理系統(tǒng),而美國ERA數(shù)字檔案館在實踐中采用該理念進行系統(tǒng)架構(gòu)[4],在其下屬的兩個數(shù)字檔案館實例(Base和EOP)間共享了系統(tǒng)管理、網(wǎng)絡(luò)、幫助、數(shù)據(jù)管理四個服務(wù),并計劃未來再增加長久保存和公共利用服務(wù),并進一步擴大服務(wù)應(yīng)用范圍至下屬所有實例館中。該理念的優(yōu)勢在于:
1.1推動數(shù)字檔案館系統(tǒng)功能集成與共享。國家將所有數(shù)字檔案館的通用功能提取出來,做成服務(wù)的形式,對其功能需求、接口等頒布標(biāo)準(zhǔn)化實施方案。各館無需自行研制,減少私有化功能實施,確保所有數(shù)字檔案館系統(tǒng)主要功能的一致性,提升其集成和共享能力。
1.2提高數(shù)字檔案館系統(tǒng)建設(shè)效率。服務(wù)可分布式實施,通過電子政務(wù)網(wǎng)、互聯(lián)網(wǎng)在多個數(shù)字檔案館之間共享。建設(shè)數(shù)字檔案館系統(tǒng)無需“白手起家”,只需選擇接入或調(diào)用外部提供的服務(wù)即可,減輕數(shù)字檔案館經(jīng)費和技術(shù)負(fù)擔(dān),實現(xiàn)高效率建館,同時,也可最大化資源使用,減少重復(fù)建設(shè)。
2 基于服務(wù)的數(shù)字檔案館系統(tǒng)功能架構(gòu)的基本思路
構(gòu)建我國數(shù)字檔案館系統(tǒng)基于服務(wù)的功能架構(gòu),主要包括建立服務(wù)框架和明確其標(biāo)準(zhǔn)化需求。
2.1建立服務(wù)框架。我國數(shù)字檔案館系統(tǒng)服務(wù)框架,如圖1所示:
圖1所示六種服務(wù)滿足以下兩個條件,即:
(1)通用性:這六種服務(wù)是我國所有數(shù)字檔案館系統(tǒng)(包括不同級次和類型,如省、市、區(qū)縣級、高校、企業(yè)數(shù)字檔案館等)都必須具備的功能;
(2)共享性:這六種服務(wù)可在多個數(shù)字檔案館系統(tǒng)之間共享,不能共享的功能不納入到框架中,例如檔案存儲功能不能外部共享,因此不屬于服務(wù)。
2.2服務(wù)的標(biāo)準(zhǔn)化需求
2.2.1用戶分組服務(wù)。該服務(wù)對數(shù)字檔案館系統(tǒng)所有用戶進行管理及分組,并區(qū)分其訪問、利用、管理權(quán)限,例如,清華紫光數(shù)字檔案館系統(tǒng)使用的用戶與角色管理服務(wù)[5]。主要功能需求包括:①應(yīng)當(dāng)保留用戶及分組歷史信息,因其包含數(shù)字檔案館的重要人員及授權(quán),可以為其可靠性提供證明,即使刪除,也應(yīng)留有“存證”;②應(yīng)記錄服務(wù)元數(shù)據(jù),包括創(chuàng)建時間戳、組標(biāo)識符、組及用戶名稱、說明、更新時間等;③應(yīng)提供對特定時間的用戶及組、元數(shù)據(jù)的查詢等功能。
2.2.2封裝服務(wù)。該服務(wù)對數(shù)字檔案館系統(tǒng)中電子檔案和其元數(shù)據(jù)“打包”形成一個整體進行管理,確保電子檔案真實性和長久保存。如果不封裝,文件和元數(shù)據(jù)很容易由于分開保管而造成丟失,例如,美國佛羅里達(dá)州數(shù)字檔案館[6]、澳大利亞維多利亞州數(shù)字檔案館[7]、我國安徽省電子文件中心[8]等都采用封裝服務(wù)。主要功能需求包括:①移交封裝;②存儲封裝;③分發(fā)封裝;④封裝工具更新;⑤解封裝;⑥封裝文件導(dǎo)出至XML文件;⑦封裝包認(rèn)證;⑧封裝包簽名;⑨封裝包更新等功能。
2.2.3元數(shù)據(jù)服務(wù)。該服務(wù)對數(shù)字檔案館系統(tǒng)元數(shù)據(jù)進行記錄。主要功能需求包括:①記錄檔案元數(shù)據(jù):包括檔案唯一標(biāo)識、主題、形成時間、相關(guān)檔案等;②記錄人員元數(shù)據(jù):包括人員身份標(biāo)識、崗位職責(zé)、聯(lián)系方式、責(zé)任關(guān)系等;③記錄業(yè)務(wù)元數(shù)據(jù):包括業(yè)務(wù)標(biāo)識、業(yè)務(wù)說明、業(yè)務(wù)類型、時間、相關(guān)業(yè)務(wù)等;④記錄系統(tǒng)本身運行元數(shù)據(jù):包括系統(tǒng)備份和恢復(fù)元數(shù)據(jù)、登錄日志元數(shù)據(jù)等。
2.2.4處置服務(wù)。該服務(wù)依據(jù)數(shù)字檔案館系統(tǒng)處置協(xié)議(保管期限表)進行檔案生命周期控制,例如,自動化移交、銷毀等。美國ERA數(shù)字檔案館使用該服務(wù)控制檔案從移交到銷毀的所有流程。主要功能需求包括:①處置協(xié)議的模板生成;②處置協(xié)議管理維護;③處置協(xié)議元數(shù)據(jù)生成,包括處置協(xié)議名稱、說明、法規(guī)、范圍等;④指定時間提醒授權(quán)用戶執(zhí)行處置協(xié)議相關(guān)條款;⑤允許授權(quán)用戶瀏覽和審查待處置的所有檔案等功能。
2.2.5長久保存服務(wù)。該服務(wù)對數(shù)字檔案館系統(tǒng)中檔案進行長期保存及維護,采取預(yù)防性措施防止檔案“過時”。主要功能需求包括:①長久保存流程控制,例如,長久保存評估、自動或人工實施、審計跟蹤、完整性驗證等;②不同格式電子檔案的采集和接收;③捕獲采集檔案的重要特征元數(shù)據(jù);④定義組成電子檔案的多份計算機文檔的關(guān)系;⑤對采集檔案進行格式轉(zhuǎn)化;⑥存儲長久保存活動的輸出及結(jié)果等功能。
2.2.6檢索和報告服務(wù)。該服務(wù)對數(shù)字檔案館系統(tǒng)中檔案查詢并顯示。該服務(wù)通常以瀏覽式和檢索式功能呈現(xiàn)。瀏覽式即用戶可以從全宗瀏覽至類別、案卷、文件,或以專題類目形式瀏覽,而檢索式指用戶可以通過查詢框形式檢索特定文件。主要功能需求包括:①從元數(shù)據(jù)字段查詢檔案,有能力的館可以增加全文檢索;②為用戶保存其檢索查詢式,便于重用;③確保檢索的一致性和完整性,即同一用戶多次執(zhí)行同一檢索查詢時,應(yīng)該得到相同的結(jié)果;④檢索結(jié)果展現(xiàn),至少應(yīng)當(dāng)返回檔案及其元數(shù)據(jù)的詳細(xì)信息,并且,不應(yīng)返回對該用戶來說不具有訪問權(quán)限的結(jié)果等功能。
3 基于服務(wù)的數(shù)字檔案館系統(tǒng)功能架構(gòu)的實施
3.1基本原則。基于服務(wù)的數(shù)字檔案館系統(tǒng)功能架構(gòu)在實施時應(yīng)遵循以下原則:
3.1.1需求牽引原則。服務(wù)的功能設(shè)計應(yīng)當(dāng)以需求標(biāo)準(zhǔn)為綱。由國家集思廣益,頒布統(tǒng)一的服務(wù)功能需求及建設(shè)方案,使市場(軟件開發(fā)商)或各數(shù)字檔案館建設(shè)有“據(jù)”可依,研制符合國家一致標(biāo)準(zhǔn)的服務(wù)軟件或平臺。
3.1.2有效反饋原則。服務(wù)的功能完善應(yīng)當(dāng)根據(jù)反饋結(jié)果不斷改進。先期將研究開發(fā)較為成熟的服務(wù)以共享服務(wù)形式提供給試點數(shù)字檔案館使用,并不斷收集反饋,完善服務(wù)功能,并逐步擴大共享范圍。
3.1.3靈活多樣原則。服務(wù)的實施應(yīng)因地制宜,靈活多樣。根據(jù)具體環(huán)境,既可以實現(xiàn)一個館及其下屬單位之間(例如,數(shù)字檔案館和立檔單位之間系統(tǒng))的服務(wù)共享,也可以在一個區(qū)域內(nèi)(例如,省級數(shù)字檔案館和市級、區(qū)縣級數(shù)字檔案館系統(tǒng)之間、綜合性數(shù)字檔案館和專業(yè)數(shù)字檔案館系統(tǒng)之間)實施服務(wù)共享,甚至是全國范圍內(nèi)數(shù)字檔案館系統(tǒng)服務(wù)共享。
3.1.4合理配置原則。服務(wù)的資源可以根據(jù)數(shù)字檔案館的綜合實力進行合理分配。圖1所示的六種服務(wù)既可以集中由具備先進技術(shù)、充足人員隊伍的大型數(shù)字檔案館提供,其他中小型數(shù)字檔案館通過網(wǎng)絡(luò)調(diào)用或直接安裝使用;或者,將六種服務(wù)分擔(dān)給各數(shù)字檔案館,各館負(fù)責(zé)其中的某一項服務(wù)維護(包括更新、在線安裝等),而其他館調(diào)用其服務(wù)即可。
3.2應(yīng)用實例。圖1所示的六種服務(wù)實施有多種方式,本文僅舉其中一種實例進行說明,如圖2所示:
圖2 基于服務(wù)的數(shù)字檔案館系統(tǒng)功能架構(gòu)應(yīng)用實例
該應(yīng)用實例展示了多個數(shù)字檔案館ABC通過網(wǎng)絡(luò)共享六種服務(wù)。其重點是:
(1)這六種服務(wù),可能由其中任何一個數(shù)字檔案館負(fù)責(zé)開發(fā)和維護,例如,可能是數(shù)字檔案館A,其他數(shù)字檔案館通過網(wǎng)絡(luò)共享服務(wù)功能。
(2)這六種服務(wù),可能由其中多家數(shù)字檔案館分擔(dān)負(fù)責(zé),例如,數(shù)字檔案館A負(fù)責(zé)用戶及分組服務(wù)、封裝服務(wù);數(shù)字檔案館B負(fù)責(zé)元數(shù)據(jù)服務(wù)、處置服務(wù)等。
(3)服務(wù)一旦更新,例如,由數(shù)字檔案館C負(fù)責(zé)維護的長久保存服務(wù)提供了新的遷移工具,所有其他館同步更新,及時獲取新功能。
(4)由于數(shù)字檔案館ABC同時共享一個檢索和報告服務(wù),因此,可以為用戶(例如,大眾)提供一致的檢索界面和接口,實現(xiàn)跨館藏檢索。
(5)服務(wù)具有廣泛的適用性,例如,長久保存服務(wù)可以適用于所有電子文件的長久保存,而無論文件是來自數(shù)字檔案館A、B或C。
(6)共享服務(wù)由外部提供及維護,數(shù)字檔案館ABC只需集中精力研發(fā)特色功能。
4 結(jié)語
基于服務(wù)的數(shù)字檔案館功能架構(gòu),其本質(zhì)是實現(xiàn)以下轉(zhuǎn)變:①由“點”及“面”的轉(zhuǎn)變:該理念不僅僅關(guān)注于單個數(shù)字檔案館功能結(jié)構(gòu)的獨立性設(shè)計,而是側(cè)重于從群體數(shù)字檔案館的角度,提煉其功能結(jié)構(gòu)的共性;②由“下”至“上”的轉(zhuǎn)變:該理念改變傳統(tǒng)數(shù)字檔案館結(jié)構(gòu)建設(shè)各自為政的理念,而是上升到國家層面,對全國數(shù)字檔案館功能結(jié)構(gòu)進行統(tǒng)一規(guī)劃和服務(wù)資源的有效分配布局;③由“全”到“精”的轉(zhuǎn)變:該理念不再強調(diào)每一個數(shù)字檔案館建設(shè)都必須自主實現(xiàn)大而全的所有復(fù)雜功能結(jié)構(gòu),而是轉(zhuǎn)變到挑選共享服務(wù)、精研發(fā)特色功能的結(jié)構(gòu)建設(shè)思路上來。該理念實質(zhì)上是對數(shù)字檔案館功能結(jié)構(gòu)的統(tǒng)一整合,以推翻壁壘,實現(xiàn)更大范圍的集成和資源共享。因此,我國數(shù)字檔案館建設(shè)應(yīng)當(dāng)轉(zhuǎn)變思路,積極探索和研究該理念的理論與實踐。
注:本文系國家社會科學(xué)基金青年項目“中國數(shù)字檔案館的基本結(jié)構(gòu)與運行機制研究”(項目編號:11CTQ033)的研究成果之一。
參考文獻(xiàn):
[1] O'Reilly.SOA in Practice[EB/OL].[2012—8—30].http://www.soa—in—practice.com/soa—glossary.html.
[2] DZone.A Definition of Services[EB/OL].[2012—8—30].http://www.manageability.org/blog/stuff/what—is—a—web—service.
[3] DLM Forum. Modular Requirements for Records Systems: Volume 1 Core Services Version 1.1 & Plug—in Modules [EB/OL]. [2012—07—11].http://moreq2010.eu/pdf/MoReq2010—Core+Plugin (v1—0).pdf.
[4]Ken Thibodeau.NARAs Electronic Records Archives Status and Plans [EB/OL]. [2012—07—11].http://www.archives.gov/era/pdf/thibodeau—041709.pdf.
[5]清華紫光股份有限公司.清華紫光數(shù)字檔案館系統(tǒng)[EB/OL]. [2012—07—11].http://www.topoint.com.cn/html/chanpin/oa/2004/07/102830.html.
[6] Florida Digital Archive. New version of FDA SIP Specification is available [EB/OL]. [2012—07—11].http://fclaweb.fcla.edu/fda.
[7] Victorian Electronic Records Project. Victorian Electronic Records Strategy [EB/OL]. [2012—07—11].http://www.prov.vic.gov.au/vers/vers/strategy.asp.
[8]黃玉明等.安徽省電子文件中心設(shè)計與建設(shè)[J].中國檔案,2009(8):13~15.
(作者單位:南京政治學(xué)院上海校區(qū)軍事信息管理系來稿日期:2012—08—18)