宋玉濤 張先俊
(河南省電力勘測(cè)設(shè)計(jì)院,河南 鄭州 450007)
數(shù)字檔案館是檔案行業(yè)的新興事物,是國(guó)家檔案事業(yè)信息化建設(shè)的重要?dú)v史發(fā)展階段。中國(guó)電力規(guī)劃設(shè)計(jì)協(xié)會(huì)《電力勘測(cè)設(shè)計(jì)行業(yè)檔案工作發(fā)展三年(2006~2008)規(guī)劃》要求:加大檔案信息化建設(shè)投入,實(shí)現(xiàn)檔案管理方法和管理內(nèi)容上的轉(zhuǎn)變,在電子檔案管理軟件應(yīng)用技術(shù)上取得進(jìn)展,使電子檔案管理在轉(zhuǎn)換為勘測(cè)設(shè)計(jì)能力上有明顯體現(xiàn);盡可能建立本單位的數(shù)字化檔案館。
近年來(lái)國(guó)家在深圳、青島兩個(gè)檔案館試點(diǎn)建設(shè)數(shù)字檔案館,并將成功經(jīng)驗(yàn)向各行業(yè)各地方推廣。那么什么是數(shù)字檔案館?在總結(jié)成功經(jīng)驗(yàn)的基礎(chǔ)上,目前大家比較認(rèn)可的定義是:以網(wǎng)絡(luò)為支撐,以數(shù)據(jù)庫(kù)為核心,以檔案專(zhuān)業(yè)的管理軟件為工具,通過(guò)建設(shè)“三個(gè)平臺(tái)”——網(wǎng)絡(luò)支持平臺(tái)、業(yè)務(wù)管理平臺(tái)、信息服務(wù)平臺(tái),實(shí)現(xiàn)數(shù)據(jù)傳輸網(wǎng)絡(luò)化、業(yè)務(wù)管理自動(dòng)化、信息服務(wù)在線化。
進(jìn)行數(shù)字檔案館建設(shè),首先必須要搞懂它的基本結(jié)構(gòu),否則就會(huì)無(wú)從下手。其實(shí),在數(shù)字檔案館這么一句簡(jiǎn)單的定義中已經(jīng)揭示了它的基本結(jié)構(gòu):即網(wǎng)絡(luò)支持平臺(tái)、業(yè)務(wù)管理平臺(tái)、信息服務(wù)平臺(tái)。這3個(gè)平臺(tái)既相對(duì)獨(dú)立,又緊密相連。每一個(gè)平臺(tái)針對(duì)的對(duì)象不同,解決的問(wèn)題不同。
數(shù)字檔案館3個(gè)平臺(tái)的組成結(jié)構(gòu)可以參照OSI(開(kāi)放系統(tǒng)互聯(lián)參考模型)來(lái)理解。OSI是國(guó)際標(biāo)準(zhǔn)化組織于1978年定義的一個(gè)描述網(wǎng)絡(luò)層次結(jié)構(gòu)的標(biāo)準(zhǔn)模型,通過(guò)OSI保證了各種類(lèi)型網(wǎng)絡(luò)的兼容性,互操作性。OSI說(shuō)明了信息在網(wǎng)絡(luò)中是如何傳輸?shù)?,以及各層在網(wǎng)絡(luò)中的功能和它們的框架概念。3個(gè)平臺(tái)作為檔案工作來(lái)理解可以與傳統(tǒng)檔案管理模式相對(duì)應(yīng),作為計(jì)算機(jī)網(wǎng)絡(luò)來(lái)理解可以與OSI的7個(gè)層相對(duì)應(yīng),見(jiàn)下圖:
與OSI模型功能相似,在數(shù)字檔案館3個(gè)平臺(tái)中,當(dāng)前層平臺(tái)的下一層平臺(tái)都為當(dāng)前層提供服務(wù)。3個(gè)平臺(tái)的結(jié)構(gòu)為傳統(tǒng)檔案工作向數(shù)字檔案館過(guò)渡提供了理想的結(jié)構(gòu)模型。
從檔案?jìng)鹘y(tǒng)管理模式來(lái)看,網(wǎng)絡(luò)支持平臺(tái)對(duì)應(yīng)的是檔案信息的存儲(chǔ)利用模式。傳統(tǒng)檔案工作在這個(gè)平臺(tái)上主要考慮檔案的庫(kù)房容量,檔案案卷上如何標(biāo)識(shí),檔案信息如何組織起來(lái)對(duì)外提供利用等。庫(kù)房管理和檔案案卷組織存放形式是傳統(tǒng)檔案工作的基礎(chǔ),沒(méi)有這個(gè)基礎(chǔ)檔案管理無(wú)從談起。
在數(shù)字檔案館的概念中,網(wǎng)絡(luò)支持平臺(tái)是處于最底層的一個(gè)平臺(tái),是所有服務(wù)的基礎(chǔ)。這一層平臺(tái)主要完成數(shù)字檔案館的硬件布置與連接。如:網(wǎng)絡(luò)配置、服務(wù)器設(shè)置、客戶端要求、實(shí)體文件和各種條目信息的組織形式、存儲(chǔ)容量分析等。主要對(duì)應(yīng)OSI 模型中的下面4層。即:物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層和傳輸層。這一層平臺(tái)面向檔案業(yè)務(wù)管理平臺(tái),向檔案業(yè)務(wù)管理平臺(tái)提供服務(wù),對(duì)數(shù)字檔案的有效存儲(chǔ)和安全傳遞負(fù)責(zé)。
網(wǎng)絡(luò)支持平臺(tái)中重點(diǎn)考慮的一個(gè)方面是海量數(shù)據(jù)存儲(chǔ)。海量數(shù)據(jù)是數(shù)字檔案館的一個(gè)鮮明特點(diǎn),它既是數(shù)字檔案館對(duì)外提供利用的基礎(chǔ),也是加工和處理的對(duì)象。一般來(lái)說(shuō)數(shù)字檔案館可以成為一個(gè)單位最大的數(shù)字信息庫(kù)之一,存儲(chǔ)量以“T”計(jì)。在硬件配置時(shí)應(yīng)考慮大容量硬盤(pán)或磁盤(pán)陣列,在做異地備份時(shí)可以考慮光盤(pán)。
另一個(gè)考慮的重點(diǎn)是保存信息的多樣性。隨著信息技術(shù)的發(fā)展,我們產(chǎn)生的電子信息日益呈現(xiàn)出多媒體化,這種趨勢(shì)將來(lái)會(huì)越來(lái)越明顯。如我們平時(shí)經(jīng)常遇到的工程圖紙信息(掃描圖tif、工程CAD圖紙)、文書(shū)檔案信息(原文及批文tif、word、htm)、電子圖書(shū)(CEB)、電子期刊(CAJ、PDF)、電子版規(guī)程規(guī)范(PDF),圖片信息(JPEG、BMP、GIF)等。為用戶保存和提供多媒體信息是網(wǎng)絡(luò)支持平臺(tái)應(yīng)完成的功能,千兆甚至萬(wàn)兆以太網(wǎng)和高速交換機(jī)為大容量信息傳遞提供了硬件基礎(chǔ)。
對(duì)應(yīng)于業(yè)務(wù)管理平臺(tái),傳統(tǒng)檔案管理模式可以劃分為的6個(gè)工作環(huán)節(jié),即:收集、整理、保管、鑒定、統(tǒng)計(jì)、提供利用。這6個(gè)環(huán)節(jié)體現(xiàn)了檔案的日常工作,規(guī)范了檔案信息的流向,保證了進(jìn)出檔案庫(kù)的信息都是完整、準(zhǔn)確、有效的。在數(shù)字檔案館設(shè)計(jì)中應(yīng)考慮實(shí)現(xiàn)這6個(gè)環(huán)節(jié)的功能,以便和傳統(tǒng)紙質(zhì)檔案的管理相兼容。
從計(jì)算機(jī)網(wǎng)絡(luò)角度看,這一層平臺(tái)是數(shù)字檔案館非常重要的一層,起著承上啟下的重要作用。這一層主要對(duì)應(yīng)于OSI模型中的會(huì)話層和表示層。在OSI模型中,會(huì)話層主要功能是為會(huì)話實(shí)體間建立連接,表示層主要功能是為通信提供一種公共語(yǔ)言。這兩層的功能映射到業(yè)務(wù)管理平臺(tái)中主要通過(guò)數(shù)據(jù)庫(kù)和檔案編號(hào)體系來(lái)完成,而數(shù)據(jù)庫(kù)的管理在整個(gè)數(shù)字檔案館中起著核心的作用。檔案管理人員通過(guò)數(shù)據(jù)庫(kù)完成對(duì)數(shù)字檔案信息的各種相關(guān)操作,同時(shí)接收信息服務(wù)平臺(tái)發(fā)送過(guò)來(lái)的服務(wù)請(qǐng)求。所有數(shù)字信息經(jīng)過(guò)檔案編號(hào)體系編碼后進(jìn)入數(shù)字檔案館進(jìn)行有序保管,完成一個(gè)歸檔過(guò)程。檢索出來(lái)的信息通過(guò)這一層分類(lèi)排序提供給信息服務(wù)平臺(tái),完成一個(gè)服務(wù)過(guò)程。檔案6個(gè)工作環(huán)節(jié)通過(guò)數(shù)據(jù)庫(kù)和檔案編號(hào)體系相互作用共同完成數(shù)字檔案館的系統(tǒng)操作及日常維護(hù)。
在業(yè)務(wù)管理平臺(tái),數(shù)字檔案館可以和工作流程中的上一級(jí)進(jìn)行對(duì)接和連通,使檔案工作得以延伸,從根本上解決數(shù)字檔案歸檔率低的難題。以設(shè)計(jì)行業(yè)CAD圖紙歸檔為例,通過(guò)和出版崗位的繪圖儀連通,構(gòu)筑同一個(gè)數(shù)字化管理平臺(tái),實(shí)現(xiàn)在出版CAD圖紙的同時(shí)完成歸檔,可以使CAD圖紙歸檔率達(dá)到95%以上。
在許多數(shù)字檔案館系統(tǒng)設(shè)計(jì)中都把業(yè)務(wù)管理平臺(tái)設(shè)計(jì)成C/S形式,系統(tǒng)的日常管理通過(guò)檔案工作崗位的計(jì)算機(jī)來(lái)完成。這樣做有利于數(shù)字檔案館的管理工作相對(duì)獨(dú)立,提高了系統(tǒng)的安全性和保密性,提高工作效率。
業(yè)務(wù)管理平臺(tái)完成的重點(diǎn)任務(wù)是系統(tǒng)管理、人員注冊(cè)、數(shù)據(jù)庫(kù)日常維護(hù)、權(quán)限設(shè)置和安全控制。從安全角度講,該層對(duì)整個(gè)系統(tǒng)的安全和有效負(fù)責(zé)。用戶對(duì)系統(tǒng)的操作都要通過(guò)該層來(lái)識(shí)別其權(quán)限屬性,判定該請(qǐng)求能否進(jìn)入下一層平臺(tái)。系統(tǒng)的日志記錄也在這一平臺(tái)完成。
在傳統(tǒng)檔案管理模式中,信息服務(wù)平臺(tái)對(duì)應(yīng)于檔案服務(wù)形式。檔案部門(mén)根據(jù)用戶的需求選擇不同的服務(wù)方式,提供給用戶不同的檔案產(chǎn)品。比如用戶可以用查卡片的方式檢索檔案,也可以利用計(jì)算機(jī)檢索,還可以咨詢檔案管理人員。不同的服務(wù)方式帶來(lái)了不同的操作,但結(jié)果應(yīng)當(dāng)是相同的。
從計(jì)算機(jī)網(wǎng)絡(luò)角度來(lái)看,該層平臺(tái)對(duì)應(yīng)于OSI模型中的應(yīng)用層。與應(yīng)用層功能相似,信息服務(wù)平臺(tái)是數(shù)字檔案館3個(gè)平臺(tái)中的最高層平臺(tái),也是最靠近用戶的一層平臺(tái)。它不同于其他層平臺(tái)之處在于它不為任何一個(gè)平臺(tái)提供服務(wù),它只為數(shù)字檔案館以外的用戶提供服務(wù),用戶通過(guò)信息服務(wù)平臺(tái)完成對(duì)系統(tǒng)的操作。該層的任務(wù)是研究用戶的需求,如何為用戶提供方便、準(zhǔn)確、舒適的服務(wù)。
信息服務(wù)平臺(tái)對(duì)用戶負(fù)責(zé),該層不關(guān)心數(shù)字檔案信息在哪里存放,它的組織形式是什么,它是如何傳遞等具體問(wèn)題。該層對(duì)用戶提出的需求進(jìn)行分析并啟動(dòng)業(yè)務(wù)管理平臺(tái)的數(shù)據(jù)庫(kù)系統(tǒng)對(duì)館藏?cái)?shù)據(jù)進(jìn)行檢索,檢索后的結(jié)果由業(yè)務(wù)管理平臺(tái)排序后提供給用戶。該層提供給了用戶模糊檢索、跨庫(kù)檢索、全文檢索等多種檢索工具,并可以為用戶提供瀏覽下載等多種功能。
信息服務(wù)平臺(tái)最強(qiáng)大的功能在檢索上。模糊檢索、跨庫(kù)檢索、全文檢索等多種檢索方式的采用會(huì)大大提高數(shù)字檔案的查全率和查準(zhǔn)率??鐜?kù)檢索和全文檢索是數(shù)字檔案館的突出特點(diǎn)的體現(xiàn),在數(shù)字檔案的環(huán)境下,檔案利用者不會(huì)感覺(jué)到信息存在于各個(gè)不同的數(shù)據(jù)庫(kù)中,而只是根據(jù)需要查詢索取自己所需要的信息,不管信息是被標(biāo)引或是沒(méi)有被標(biāo)引,系統(tǒng)都會(huì)自動(dòng)提供所有相關(guān)信息,真正達(dá)到相當(dāng)高的查全率。數(shù)字檔案館模糊了庫(kù)與庫(kù)之間的界線,對(duì)外界只提供一個(gè)統(tǒng)一的界面,極大地方便了利用人員查閱和使用檔案。
信息服務(wù)平臺(tái)提供能瀏覽多種媒體格式的瀏覽器,在一個(gè)界面環(huán)境下完成多媒體信息的瀏覽或下載,方便了用戶對(duì)檔案全文信息的檢索和利用。
該層平臺(tái)一般設(shè)計(jì)為B/S結(jié)構(gòu)。在通常的設(shè)計(jì)中,采用數(shù)字檔案館網(wǎng)站來(lái)鏈接各個(gè)數(shù)字資源庫(kù),網(wǎng)站上有瀏覽器插件、各種檢索工具插件等。這種設(shè)計(jì)的目的是方便用戶登錄數(shù)字檔案館,降低用戶端計(jì)算機(jī)的要求。
在3層平臺(tái)結(jié)構(gòu)中,用戶對(duì)數(shù)字檔案館提出的需求是一層一層向下傳遞,在完成相關(guān)操作后信息又一層一層向上傳遞,最后提供給用戶。比如用戶要完成一個(gè)檢索,首先經(jīng)過(guò)信息服務(wù)平臺(tái)接收處理并識(shí)別是什么需求,分析后傳遞給業(yè)務(wù)管理平臺(tái)。在業(yè)務(wù)管理平臺(tái)啟動(dòng)數(shù)據(jù)庫(kù)的檢索,通過(guò)對(duì)網(wǎng)絡(luò)支持平臺(tái)中實(shí)體文件的檢索,完成需要信息的查詢,然后向上傳遞回業(yè)務(wù)管理平臺(tái)進(jìn)行排序或分類(lèi),最后提供給信息服務(wù)平臺(tái),完成一次操作。用戶最終看到了檢索結(jié)果,見(jiàn)圖1。
圖1 最終檢索結(jié)果
數(shù)字檔案館結(jié)構(gòu)的形成經(jīng)歷了一個(gè)發(fā)展歷程,它的發(fā)展和整個(gè)檔案管理軟件的發(fā)展相一致。在早期單機(jī)版的計(jì)算機(jī)輔助管理檔案階段,只能部分實(shí)現(xiàn)“業(yè)務(wù)管理平臺(tái)”這一層的功能。這一階段的特點(diǎn)是以單個(gè)的計(jì)算機(jī)為基礎(chǔ),以對(duì)檔案卷冊(cè)的目錄級(jí)管理為重點(diǎn),具有簡(jiǎn)單的查詢、打印、排序等功能,沒(méi)有網(wǎng)絡(luò)支持平臺(tái)和為用戶服務(wù)的平臺(tái)。隨著網(wǎng)絡(luò)本身的發(fā)展以及網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的出現(xiàn),具有“網(wǎng)絡(luò)支持平臺(tái)”部分功能的第二代檔案管理軟件開(kāi)始出現(xiàn),但還不能保存管理檔案的全文。電子檔案的出現(xiàn)使得檔案管理軟件跨入第三代。第三代檔案管理軟件以網(wǎng)絡(luò)為基礎(chǔ),以檔案的全文管理為重點(diǎn),具有網(wǎng)絡(luò)查詢、瀏覽、下載全文等功能,初步具備了3個(gè)平臺(tái)的結(jié)構(gòu)。第四代檔案管理軟件以檔案整體的數(shù)字化為基礎(chǔ),以檔案管理中的歸全率、完整率為突破口,從電子文件的收集階段開(kāi)始介入進(jìn)行管理,實(shí)現(xiàn)了檔案工作的延伸和拓展,達(dá)到了確保檔案電子版全文的歸全率和完整率的目的。這些功能的完成需要3個(gè)平臺(tái)互相作用,缺一不可。
表1 檔案管理軟件發(fā)展歷史
從數(shù)字檔案館的整體結(jié)構(gòu)來(lái)說(shuō),數(shù)字檔案館的建設(shè)是一個(gè)系統(tǒng)工程,并非一朝一夕就能完成,它對(duì)一個(gè)單位的網(wǎng)絡(luò)、計(jì)算機(jī)、檔案管理、電子檔案管理甚至相關(guān)部門(mén)都提出了較高的要求。對(duì)系統(tǒng)需求進(jìn)行分析時(shí)宜從最高層入手,最底層結(jié)束。進(jìn)行建設(shè)時(shí)宜從最底層入手,最高層結(jié)束。3層平臺(tái)的結(jié)構(gòu)為我們研究數(shù)字檔案館提供了很好的模型,也為建設(shè)數(shù)字檔案館提供了理想的參照