王飛
近年來,隨著信息技術(shù)的迅猛發(fā)展,國家對檔案館的信息化建設(shè)越來越重視,各省、市對數(shù)字檔案館建設(shè)提出了新的要求,也在持續(xù)加大支持力度。國家檔案局發(fā)布的《數(shù)字檔案館建設(shè)指南》中數(shù)字檔案館的定義是指各級各類檔案館為適應(yīng)信息社會日益增長的對檔案信息資源管理、利用需求,運用現(xiàn)代信息、技術(shù)對數(shù)字檔案信息進行采集、加工、存儲、管理,并通過各種網(wǎng)絡(luò)平臺提供公共檔案信息服務(wù)和共享利用的檔案信息集成管理系統(tǒng)??梢哉f,數(shù)字檔案館建設(shè)就是一項系統(tǒng)工程,無論頂層設(shè)計規(guī)劃系統(tǒng)架構(gòu),還是集約型開發(fā)建設(shè),都要統(tǒng)籌考慮與其他部門之間的系統(tǒng)交互和接口問題,因此研究數(shù)字檔案館系統(tǒng)架構(gòu),做好整體設(shè)計,是建設(shè)數(shù)字檔案館的重要一環(huán)。
一、數(shù)字檔案館系統(tǒng)架構(gòu)現(xiàn)狀和特點
目前,各省市都在建設(shè)或者建成數(shù)字檔案館,僅就數(shù)字檔案館系統(tǒng)而言,大多數(shù)數(shù)字檔案館系統(tǒng)架構(gòu)中數(shù)據(jù)庫構(gòu)成還是以館藏檔案數(shù)字化內(nèi)容為主,以接收電子檔案的增量數(shù)據(jù)為輔。系統(tǒng)支撐硬件和網(wǎng)絡(luò)設(shè)備以國外產(chǎn)品為主,國內(nèi)自主可控產(chǎn)品為輔。系統(tǒng)運行網(wǎng)絡(luò)以局域網(wǎng)為主,以政務(wù)網(wǎng)和互聯(lián)網(wǎng)提供檔案業(yè)務(wù)服務(wù)為輔??梢娔壳暗臄?shù)字檔案管理系統(tǒng)的特點,主要還是體現(xiàn)在提升檔案館自身檔案業(yè)務(wù)管理信息化水平和館藏檔案資源管理和利用效率方面,而在對外實現(xiàn)檔案信息資源互聯(lián)互通,服務(wù)電子政務(wù)發(fā)展等方面的作用相對較弱。因此為了推動各部門做好電子檔案規(guī)范化管理,提升電子政務(wù)能力,把數(shù)字檔案館建設(shè)放在打通數(shù)字政府最后一環(huán)的重要位置。為了建設(shè)檔案信息資源共享服務(wù)平臺,推動檔案數(shù)字資源跨區(qū)域、跨部門共享利用。為了建設(shè)自主可控的數(shù)字檔案館系統(tǒng),確保檔案信息系統(tǒng)絕對安全,都需要對數(shù)字檔案館系統(tǒng)架構(gòu)進行研究,提出切實可行的數(shù)字檔案館系統(tǒng)架構(gòu)解決方案。
二、數(shù)字檔案館系統(tǒng)架構(gòu)的發(fā)展趨勢
一是數(shù)據(jù)結(jié)構(gòu)越來越復(fù)雜。從數(shù)據(jù)庫構(gòu)成來看,數(shù)字檔案館的數(shù)據(jù)構(gòu)成是以數(shù)字化檔案信息為核心的信息資源庫,除了接收進館的電子檔案外,還有館藏實體檔案的數(shù)字化成果,即通過數(shù)字化掃描轉(zhuǎn)變?yōu)橛嬎銠C可識別和處理的數(shù)字信息。從數(shù)據(jù)庫類型看,有關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫,如電子檔案的目錄和元數(shù)據(jù)都屬于結(jié)構(gòu)化數(shù)據(jù),適用于關(guān)系型數(shù)據(jù)庫,而電子檔案和傳統(tǒng)載體檔案數(shù)字化副本等內(nèi)容數(shù)據(jù)屬于非結(jié)構(gòu)化數(shù)據(jù),適用于非關(guān)系型數(shù)據(jù)庫,而這兩者在檔案數(shù)據(jù)存儲和管理可形成互補,形成統(tǒng)一的關(guān)系型數(shù)據(jù)庫和文檔型非關(guān)系數(shù)據(jù)庫組成的數(shù)據(jù)庫系統(tǒng)。從數(shù)字檔案種類看,數(shù)字檔案館系統(tǒng)管理的數(shù)據(jù)類型越來越多,包括文檔、網(wǎng)頁、音頻、視頻、圖像、社交媒體數(shù)據(jù)、郵件等各種類型的數(shù)字檔案。
二是信息結(jié)構(gòu)標(biāo)準(zhǔn)越來越統(tǒng)一。統(tǒng)一標(biāo)準(zhǔn)的信息結(jié)構(gòu)是數(shù)字檔案信息交換和共享的前提條件。在數(shù)字檔案館系統(tǒng)建設(shè)中,需采取統(tǒng)一的標(biāo)準(zhǔn)規(guī)范來保障數(shù)字檔案格式的一致性,只有做到信息結(jié)構(gòu)標(biāo)準(zhǔn)統(tǒng)一,才能打通電子文件從生成、運轉(zhuǎn)、歸檔、進館整個鏈條,形成電子文件成閉環(huán)管理,才能管理好電子檔案,為建設(shè)數(shù)字政府服好務(wù),打通數(shù)字政府建設(shè)最后一環(huán);也才能為建設(shè)互聯(lián)互通的檔案信息共享平臺,實現(xiàn)數(shù)字檔案信息的共享利用做準(zhǔn)備。
三是網(wǎng)絡(luò)架構(gòu)層次越來越豐富。數(shù)字檔案館系統(tǒng)是以實現(xiàn)資源共享和網(wǎng)絡(luò)化信息服務(wù)而建立起來的信息集成系統(tǒng),在檔案接收和利用服務(wù)中可借助計算機和網(wǎng)絡(luò)系統(tǒng)突破時空限制實現(xiàn)檔案信息的傳遞。因此數(shù)字檔案館系統(tǒng)按照服務(wù)的對象和數(shù)據(jù)的開放程度,需要在局域網(wǎng)、政務(wù)外網(wǎng)、政務(wù)內(nèi)網(wǎng)、互聯(lián)網(wǎng)等四個網(wǎng)絡(luò)進行部署。其中,局域網(wǎng)是數(shù)字檔案館的核心,所有數(shù)字資源匯聚于此形成檔案資源總庫,提供“收管存用”四大功能。政務(wù)外網(wǎng)主要服務(wù)電子政務(wù),是實現(xiàn)檔案信息互聯(lián)互通的主要通道,虛擬檔案室為省直各單位提供電子檔案管理服務(wù),歸檔中心為政務(wù)服務(wù)及審批事項電子檔案提供實時在線歸檔和單套制管理服務(wù),以及為立檔單位提供開放檔案查詢利用和檔案移交接收等服務(wù)。政務(wù)內(nèi)網(wǎng)比較簡單,提供涉密檔案移交接收和管理利用功能。互聯(lián)網(wǎng)提供公開檔案查詢、展覽和向社會檔案征集等功能。
三、數(shù)字檔案館系統(tǒng)架構(gòu)和功能解析
數(shù)字檔案館建設(shè)一般包括基礎(chǔ)設(shè)施建設(shè)、應(yīng)用系統(tǒng)建設(shè)、信息資源建設(shè)、標(biāo)準(zhǔn)規(guī)范建設(shè)、保障體系建設(shè)等內(nèi)容。根據(jù)數(shù)字檔案館建設(shè)內(nèi)容和信息化項目系統(tǒng)架構(gòu)特點,數(shù)字檔案館系統(tǒng)架構(gòu)一般應(yīng)由基礎(chǔ)層、數(shù)據(jù)層、平臺層、應(yīng)用層、接入層以及標(biāo)準(zhǔn)規(guī)范和安全運行保障體系等七部分內(nèi)容組成。其中基礎(chǔ)層是整個數(shù)字檔案館系統(tǒng)運行的環(huán)境和基礎(chǔ),主要是服務(wù)器、存儲和各網(wǎng)絡(luò)環(huán)境中的交換和安全設(shè)備的設(shè)計規(guī)劃;數(shù)據(jù)層是數(shù)字檔案館數(shù)字檔案信息的存儲、交換和共享方面數(shù)據(jù)庫的設(shè)計規(guī)劃;平臺層是系統(tǒng)開發(fā)和運行所需要的中間件和通用軟件的設(shè)計規(guī)劃;應(yīng)用層是系統(tǒng)開發(fā)需要實現(xiàn)具體功能需求的設(shè)計和規(guī)劃;接入層是系統(tǒng)將來需要接入和使用的所有用戶的計劃安排;標(biāo)準(zhǔn)規(guī)范體系和安全運行保障體系是系統(tǒng)能夠研發(fā)成功和正常運行的基礎(chǔ)和保障。具體如下:
(一)基礎(chǔ)層
基礎(chǔ)層是數(shù)字檔案館系統(tǒng)架構(gòu)中所有應(yīng)用系統(tǒng)正常穩(wěn)定運行的支撐平臺,包括機房、供電系統(tǒng)、消防系統(tǒng)、安防系統(tǒng)、溫濕度控制系統(tǒng)等設(shè)施,信息存儲計算所需設(shè)備包括主機、儲存、備份等設(shè)備,以及配套的操作系統(tǒng)和數(shù)據(jù)庫基礎(chǔ)軟件系統(tǒng)和網(wǎng)絡(luò)通訊所需設(shè)備包括局域網(wǎng)、政務(wù)外網(wǎng)、政務(wù)內(nèi)網(wǎng)、互聯(lián)網(wǎng)等網(wǎng)絡(luò)所需交換機、防火墻、入侵檢測、安全審計等網(wǎng)絡(luò)安全設(shè)施等。另外,數(shù)字檔案館建設(shè)采購設(shè)備一般要符合信創(chuàng)要求,采用自主可控產(chǎn)品,主要線路需采用光纖鋪設(shè),關(guān)鍵網(wǎng)絡(luò)設(shè)備冗余,網(wǎng)絡(luò)系統(tǒng)建設(shè)包括核心交換區(qū)、數(shù)據(jù)中心區(qū)、用戶接入?yún)^(qū),安全需采用等保三級等。
(二)數(shù)據(jù)層
數(shù)據(jù)層即各種類型的檔案信息資源庫,是數(shù)字檔案館系統(tǒng)架構(gòu)的核心,所有數(shù)據(jù)均在此匯聚、管理、存儲、交互、轉(zhuǎn)換。信息資源數(shù)據(jù)庫的建設(shè),不僅為檔案館自身數(shù)字檔案館系統(tǒng)提供數(shù)據(jù)支持,還可為其他部門提供數(shù)據(jù)共享服務(wù)。根據(jù)檔案部門信息資源的類型和用途,可建立檔案資源總庫、檔案接收庫、檔案利用庫、檔案專題庫、數(shù)字化加工庫、長期保存庫等數(shù)據(jù)庫。管理的數(shù)據(jù)包括文檔、網(wǎng)頁、音頻、視頻、圖像、社交媒體數(shù)據(jù)、郵件等各種類型的文件。數(shù)字檔案館系統(tǒng)架構(gòu)需要數(shù)據(jù)層在政務(wù)外網(wǎng)、政務(wù)內(nèi)網(wǎng)和局域網(wǎng)等多個網(wǎng)絡(luò)部署,因此數(shù)據(jù)庫設(shè)計根據(jù)需求,分別在不同網(wǎng)域進行設(shè)計,具體如下:
政務(wù)外網(wǎng):政務(wù)外網(wǎng)接收庫、政務(wù)外網(wǎng)利用庫、館際共享庫、政務(wù)服務(wù)網(wǎng)歸檔庫。
政務(wù)內(nèi)網(wǎng):政務(wù)內(nèi)網(wǎng)接收庫、政務(wù)內(nèi)網(wǎng)利用庫。
局域網(wǎng):檔案資源總庫、館藏檔案利用庫、檔案離線接收庫、檔案數(shù)字化加工庫、長期保存庫。
為了確保數(shù)據(jù)安全,數(shù)字檔案館系統(tǒng)架構(gòu)中各個數(shù)據(jù)庫之間的數(shù)據(jù)交換方式有所不同,如:局域網(wǎng)和政務(wù)外網(wǎng)是物理隔離,為了確保安全,數(shù)據(jù)交換需要手工擺渡,互聯(lián)網(wǎng)和政務(wù)外網(wǎng)是邏輯隔離,通過數(shù)據(jù)交換平臺實現(xiàn)數(shù)據(jù)交換等。
具體如圖所示:
(三)平臺層
平臺層指基礎(chǔ)和通用的平臺和工具軟件,包括基礎(chǔ)組件平臺、系統(tǒng)管理平臺、報表自定義平臺和系統(tǒng)配置平臺等應(yīng)用基礎(chǔ)平臺,以及文件格式轉(zhuǎn)換工具、電子文件檢測工具、通用格式瀏覽工具等工具軟件,包括中間件、智能OCR、全文檢索系統(tǒng)、辦公軟件、檢索軟件等,這些架構(gòu)在平臺上的應(yīng)用系統(tǒng)一方面可以大大縮短開發(fā)周期,降低系統(tǒng)建設(shè)風(fēng)險,另一方面可以大大提升系統(tǒng)的性能和穩(wěn)定性。
(四)應(yīng)用層
應(yīng)用層是數(shù)字檔案系統(tǒng)架構(gòu)最核心部分,這里將實現(xiàn)數(shù)字檔案館系統(tǒng)所有技術(shù)應(yīng)用,匯聚了所有數(shù)字檔案館具體的應(yīng)用系統(tǒng),是解決數(shù)字檔案館具體問題的關(guān)鍵環(huán)節(jié)。應(yīng)用層包括電子檔案移交接收系統(tǒng)、電子檔案管理系統(tǒng)、電子檔案利用系統(tǒng)、電子檔案長期保存系統(tǒng)等應(yīng)用模塊,值得注意的是實際上應(yīng)用層的系統(tǒng)架構(gòu)需要在局域網(wǎng)、政務(wù)外網(wǎng)、政務(wù)內(nèi)網(wǎng)和互聯(lián)網(wǎng)等四個網(wǎng)完成,具體如下:
1.局域網(wǎng)域。主要為檔案館內(nèi)部提供數(shù)字檔案資源的“收、管、存、用”等數(shù)字檔案館的核心功能,是傳統(tǒng)數(shù)字檔案館的建設(shè)核心,支持開展數(shù)字檔案離線接收、檔案輔助鑒定、檔案編研開發(fā)、檔案數(shù)字化、檔案查詢利用、數(shù)據(jù)安全備份恢復(fù)等工作。主要應(yīng)用系統(tǒng)包括:檔案接收系統(tǒng)、檔案管理系統(tǒng)、電子檔案長期保存系統(tǒng)、檔案利用服務(wù)系統(tǒng)、檔案數(shù)字化系統(tǒng)、虛擬庫房管理系統(tǒng)等。
2.政務(wù)外網(wǎng)域。主要為各立檔單位提供虛擬檔案室服務(wù),為政務(wù)服務(wù)網(wǎng)提供政務(wù)服務(wù)事項電子文件歸檔服務(wù),為各檔案館之間提供館際共享等服務(wù),是對外實現(xiàn)電子檔案互聯(lián)互通和信息共享的核心區(qū)域。主要應(yīng)用系統(tǒng)包括:虛擬檔案室系統(tǒng)、政務(wù)服務(wù)網(wǎng)歸檔中心系統(tǒng)、電子檔案移交接收系統(tǒng)、立檔單位查詢利用系統(tǒng)、館際共享利用系統(tǒng)等。
3.政務(wù)內(nèi)網(wǎng)域。主要為各立檔單位提供涉密數(shù)字檔案信息的接收、保管和利用等服務(wù),是數(shù)字檔案館系統(tǒng)涉密電子檔案數(shù)據(jù)傳輸?shù)闹匾緩?。主要?yīng)用系統(tǒng)包括虛擬檔案室系統(tǒng)、電子檔案移交接收系統(tǒng)、立檔單位查詢利用系統(tǒng)等。
4.互聯(lián)網(wǎng)域。主要為社會公眾提供公開檔案信息查詢、檔案征集、檔案展示等服務(wù),是數(shù)字檔案館系統(tǒng)公開檔案提供征集、利用和展示的窗口。主要應(yīng)用系統(tǒng)包括手機查檔系統(tǒng)、互聯(lián)網(wǎng)信息采集系統(tǒng)、檔案展示系統(tǒng)和檔案征集系統(tǒng)等。
(五)接入層
接入層是指數(shù)字檔案館系統(tǒng)服務(wù)的用戶和對象總和。數(shù)字檔案館的系統(tǒng)將通過接入層向檔案館內(nèi)部工作人員、立檔單位人員、社會公眾提供服務(wù),角色包括領(lǐng)導(dǎo)、檔案管理員、利用人員、系統(tǒng)管理員等,并在權(quán)限允許的前提下實現(xiàn)相關(guān)的數(shù)據(jù)訪問和應(yīng)用操作功能。
(六)標(biāo)準(zhǔn)規(guī)范體系
數(shù)字檔案館系統(tǒng)建設(shè),還需要建立一套與之相適應(yīng)的標(biāo)準(zhǔn)規(guī)范和運行保障體系,為數(shù)字檔案館系統(tǒng)正常運行作保障。這是數(shù)字檔案館系統(tǒng)實現(xiàn)各級各部門電子檔案的互聯(lián)互通和數(shù)據(jù)交換的基礎(chǔ),只有制定相關(guān)的技術(shù)規(guī)范,才能將數(shù)字檔案館的服務(wù)前移,實現(xiàn)電子檔案前端控制,通過數(shù)字檔案館電子檔案移交接收的規(guī)范性,倒逼各部門電子檔案歸檔的規(guī)范化,最終實現(xiàn)電子檔案生成、運轉(zhuǎn)、歸檔、進館全過程規(guī)范化管理。實現(xiàn)以上目的,要研究制定的標(biāo)準(zhǔn)和規(guī)范內(nèi)容:
1.OA辦公系統(tǒng)歸檔模塊技術(shù)規(guī)范。用于解決立檔單位OA辦公系統(tǒng)中電子文件歸檔難題,確保電子政務(wù)中電子檔案的生成、運轉(zhuǎn)和歸檔等過程都實現(xiàn)規(guī)范化,對電子檔案進行前端控制。
2.政務(wù)服務(wù)類電子文件歸檔技術(shù)規(guī)范。研究制定政務(wù)服務(wù)類電子文件歸檔技術(shù)規(guī)范,為政務(wù)服務(wù)事項電子文件歸檔建立具體可行的標(biāo)準(zhǔn)規(guī)范,為實現(xiàn)政府服務(wù)類電子檔案單套制管理提供技術(shù)支撐。
3.電子檔案歸檔和管理技術(shù)規(guī)范。通過數(shù)字檔案館虛擬檔案室子系統(tǒng)的開發(fā)設(shè)計,制定各單位檔案室電子檔案管理方面的具體可行的技術(shù)規(guī)范,確保電子檔案移交前的規(guī)范性。
4.電子檔案移交與接收技術(shù)規(guī)范。按照國家電子檔案移交接收相關(guān)標(biāo)準(zhǔn)規(guī)范,從技術(shù)和可行性方面進行深入研究,制定具體可行的電子檔案移交接收方面的標(biāo)準(zhǔn)要求,把好電子檔案入口關(guān)。
5.檔案數(shù)字化技術(shù)規(guī)范。數(shù)字檔案資源建設(shè)是數(shù)字檔案館系統(tǒng)建設(shè)的重要內(nèi)容,為了確保檔案數(shù)字化的質(zhì)量,要根據(jù)國家標(biāo)準(zhǔn),從數(shù)字化質(zhì)量、目錄著錄掛接、原文存儲結(jié)構(gòu)命名、OCR識別等方面總結(jié)經(jīng)驗做法,制定可以實現(xiàn)檔案數(shù)字化副本長期保存、數(shù)據(jù)交換和數(shù)據(jù)挖掘的檔案數(shù)字化技術(shù)規(guī)范。
(七)安全運行保障體系
信息化項目確保安全是第一位的,因此系統(tǒng)架構(gòu)要建立安全運行保障體系,嚴格按照國家計算機信息系統(tǒng)安全方面的有關(guān)規(guī)定和要求,將安全方案納入數(shù)字檔案館的總體設(shè)計方案。安全運行保障體系要運用先進技術(shù),全面強化安全管理,建立健全防范機制,確保應(yīng)用系統(tǒng)和檔案數(shù)據(jù)的安全。建立統(tǒng)一的信息安全管理體系和安全管理框架,從安全管理制度、安全管理機構(gòu)、安全管理人員、安全建設(shè)管理及安全運維管理等方面進行系統(tǒng)規(guī)劃設(shè)計,建立統(tǒng)一的網(wǎng)絡(luò)安全管理系統(tǒng),落實各項管理制度等。
以上數(shù)字檔案系統(tǒng)基本架構(gòu)是目前數(shù)字檔案館系統(tǒng)建設(shè)所需的基本要求,五層系統(tǒng)架構(gòu)和兩條保障體系是目前數(shù)字檔案館建設(shè)可以參考的基本框架。
參考文獻:
1.《數(shù)字檔案館建設(shè)指南》(檔辦〔2010〕116號)
2.《數(shù)字檔案館系統(tǒng)測試辦法》(檔辦發(fā)〔2014〕6號)
3.《基于文檔型非關(guān)系型數(shù)據(jù)庫的檔案數(shù)據(jù)存儲規(guī)范 》DAT 82-2019 《電子檔案移交與接收辦法》(檔發(fā)〔2012〕7號)
4.《政務(wù)服務(wù)事項電子文件歸檔規(guī)范》(DA/T 85-2019)
5.《檔案移動服務(wù)平臺建設(shè)指南》(DA/T 73-2019)
6.《電子信息系統(tǒng)機房設(shè)計規(guī)范》(GB50174-2016)
7.《關(guān)于印發(fā)檔案信息系統(tǒng)安全等級保護定級工作指南的通知》(檔辦發(fā)〔2013〕5號)
作者單位:河北省檔案館(河北省地方志編纂委員會辦公室)