程巧
摘??要:本文以電子文件管理及傳輸系統(tǒng)為研究對象,以真實、完整、可信、一致為系統(tǒng)功能目標,采用從上至下、由外而內(nèi)、由粗及細的建模思路,對電子文件管理及傳輸平臺所依賴的網(wǎng)絡(luò)環(huán)境規(guī)劃、元數(shù)據(jù)頂層設(shè)計、數(shù)字安全認證、數(shù)據(jù)封包等內(nèi)容進行分析,提出一套基于“異構(gòu)”背景下的電子文件管理及傳輸模型。
關(guān)鍵詞:電子文件;檔案;管理系統(tǒng);模型
Abstract:In?this?paper,?for?the?study?of?electronic?document?management?and?delivery?system,?based?on?real,?complete,?credible?and?consistent?system?functions?as?a?target,?and?detailed?analysis?of?the?contents?of?the?network?environmental?planning,?metadata?top-level?design,?digital?security,?authentication,?data?packet?structure,?etc.,?Proposed?a?more?complete,?electronic?document?management?and?transmission?model?of?"heterogeneous"?background.
Keywords:?Electronic?documents;Archives;Management?Systems;Model
1??前言
電子文件管理系統(tǒng)是保障電子文件安全有效管理及長期歸檔保存的解決方案。隨著海量電子文件的出現(xiàn),很多單位已經(jīng)開始進行電子文件管理系統(tǒng)的實踐,但究其本質(zhì),大多仍未達到“可信”標準,如系統(tǒng)不支持元數(shù)據(jù)捕獲及管理、元數(shù)據(jù)方案及結(jié)構(gòu)不完整、文件缺乏必要的簽署和認證、數(shù)據(jù)格式不規(guī)范無法長期存用等,這種似是而非的電子文件管理系統(tǒng),仍在“可信”二字上有較長道路要走。
本文主要針對業(yè)務(wù)系統(tǒng)、電子檔案管理系統(tǒng)“異構(gòu)”現(xiàn)狀,提出一套電子文件從傳輸?shù)郊械奶幹媚P?。在建模過程中,我們對系統(tǒng)功能目標、管理及傳輸網(wǎng)絡(luò)、元數(shù)據(jù)方案、數(shù)字認證、文檔封裝等內(nèi)容進行系統(tǒng)的研究,全面保障電子文件的真實可信。
2??可信的電子文件管理及傳輸平臺功能目標
2.1??真實。電子文件真實性是指形成于特定環(huán)境的電子文件經(jīng)過傳輸、處置、利用、遷移等環(huán)節(jié)之后文件的內(nèi)容、結(jié)構(gòu)和背景等基本構(gòu)成要素沒有發(fā)生變化,管理過程清晰可見。這個真實性體現(xiàn)在電子文件管理的三個階段(業(yè)務(wù)系統(tǒng)、電子文件管理系統(tǒng)、數(shù)字檔案館),都應(yīng)有相應(yīng)的評價機制來保障該份電子文件在不同封裝狀態(tài)、不同處置環(huán)境下的管理及保存狀態(tài),且該評價貫穿電子文件形成、管理到利用。
全程管理及前端控制理論要求我們,一是要設(shè)計盡可能系統(tǒng)、完整的元數(shù)據(jù)項目,包含文件實體、形成背景、處置主體及處置行為等多方面內(nèi)容;二是元數(shù)據(jù)規(guī)劃要探入系統(tǒng)設(shè)計前端,要符合國家、地區(qū)及行業(yè)有關(guān)規(guī)范及要求;三是為了輔證公文的可信,系統(tǒng)中應(yīng)有必要的權(quán)限管理與控制、操作日志、審計機制、數(shù)字保真、“留痕”等功能,可幫助我們監(jiān)控管理行為并處置非法行為。
圖1??電子文件真實保障示意圖
2.2??完整。完整性是指電子文件及其元數(shù)據(jù)完整,它和真實性一起為電子文件的“可信”創(chuàng)造了條件。影響電子文件完整性的因素主要包括電子文件管理系統(tǒng)捕獲機制是否完備、元數(shù)據(jù)方案是否規(guī)范、電子文件歸檔流程是否正確、電子文件物理及邏輯狀態(tài)是否清晰等。
從系統(tǒng)功能看,系統(tǒng)首先應(yīng)有靈活完善的收集機制,可以讓我們的管理系統(tǒng)介入業(yè)務(wù)系統(tǒng)上游,對系統(tǒng)外及手工歸檔的各類電子文件及數(shù)字副本進行收集,通過規(guī)章力量和系統(tǒng)功能來保障所有辦理完畢、具有保存價值的文件能實時或定期反映到電子文件管理系統(tǒng)之中;其次,電子文件管理的全過程要按照既定的元數(shù)據(jù)方案主動地捕獲或手工登記文件形成、處置和利用等元數(shù)據(jù),這是電子文件的重要組成部分,且與電子文件緊密聯(lián)系在一起才能證明該份電子文件的法定身份;最后要充分建立和維護好元數(shù)據(jù)與文件本身的聯(lián)系,保證電子文件與各類元數(shù)據(jù)、文檔存儲路徑及格式信息等能牢固捆綁并封裝在一起。
2.3??可用??捎眯允侵鸽娮游募膬?nèi)容能始終可讀并能長期保存,它包括內(nèi)容可用和形式可用兩個方面。內(nèi)容可用是指電子文件中所包含的二進制信息和字符編碼標準無誤。系統(tǒng)可通過元數(shù)據(jù)捕獲和記錄來注冊電子文件編碼格式、字符集和版本序號、管理軟件名稱、版本號、制作及轉(zhuǎn)換信息等特定內(nèi)容,當我們面對保存或遷移需求時,可便捷地為讀取或還原該文件提供良好的現(xiàn)實環(huán)境或仿真環(huán)境。
形式可用是指電子文件的格式和存儲載體要符合管理規(guī)范。電子文件管理及傳輸系統(tǒng)應(yīng)遵從《電子文件歸檔及管理規(guī)范》等標準,將通用電子文件格式(JPG、MP3、TXT/RTF、AVI等)納入系統(tǒng)審查機制,并允許非標格式在系統(tǒng)內(nèi)進行轉(zhuǎn)換,保證管理端、傳輸端、利用端電子文件長久可用。對于流式文檔,如DOC、TXT等格式,我們提倡采用版式文檔進行轉(zhuǎn)碼,削弱硬件設(shè)備、平臺差異對文件原貌的影響。
2.4??一致。電子文件管理系統(tǒng)應(yīng)具有相應(yīng)的檢測及約束機制,可以在系統(tǒng)管理及維護中通過內(nèi)嵌的檢測體系衡量系統(tǒng)是否達到既定效果,從而維護電子文件真實、完整、有效在理論和實踐上的一致。換言之,文件管理系統(tǒng)應(yīng)當具備自評估功能,能動態(tài)地對文件是否符合既定規(guī)劃和標準進行評估,且該結(jié)果可以表單或系統(tǒng)警報的方式反饋至系統(tǒng)使用者或管理員。
它包括,系統(tǒng)能夠?qū)﹄娮游募霸獢?shù)據(jù)的捕獲率作出完整性評估,尤其是對數(shù)據(jù)屬性為非空值的數(shù)據(jù)進行檢測,從而判斷背景、結(jié)構(gòu)、內(nèi)容、管理過程是否完整;能夠?qū)ξ募鎯Ω袷阶鞒鰳藴驶u估,非標準格式的由系統(tǒng)進行注冊并作提示和預(yù)警[1],并轉(zhuǎn)換為標準格式;能夠深入封裝、簽署、認證、保真等環(huán)節(jié),通過電子文件屬性判斷、元數(shù)據(jù)監(jiān)測、病毒檢測,作出真實性、有效性評估。評估完成后系統(tǒng)將形成評估報告,從而協(xié)助我們作出利于電子文件保存的判斷,更好地發(fā)揮電子文件的價值(圖2)。
圖2??電子文件管理系統(tǒng)一致性檢驗及約束圖
3??可信的電子文件管理系統(tǒng)模型構(gòu)建
3.1??網(wǎng)絡(luò)拓撲模型。網(wǎng)絡(luò)是電子文件管理的底層物理環(huán)境,這個環(huán)境不好,電子文件的真實性、完整性就易遭受嚴重的威脅。綜合考慮電子文件管理系統(tǒng)的用戶分布和功能訴求,我們認為有必要對ERMS所處網(wǎng)域進行功能劃分、分級管理,這既是對電子文件的管理特點的尊重與維護,也符合電子文件管理安全性要求。
電子文件隨著其生命周期的推進,將依次經(jīng)歷三個物理網(wǎng)絡(luò)(圖3),在這三個網(wǎng)絡(luò)中,電子文件的價值及處置主體(系統(tǒng))是不同的。我們可采取關(guān)鍵網(wǎng)物理分離、網(wǎng)域內(nèi)在線管理、網(wǎng)域間雙線傳輸?shù)男问絹硪?guī)范及約束電子文件的管理,確保電子文件的安全。
首個網(wǎng)絡(luò)在電子文件形成機關(guān)內(nèi)部,它通過物理網(wǎng)關(guān)及軟硬件防火墻與廣域網(wǎng)隔離,規(guī)避外界及內(nèi)部不良影響,電子文件只能在局域網(wǎng)業(yè)務(wù)系統(tǒng)內(nèi)進行登錄和處置;第二個網(wǎng)絡(luò)是資源收集或移交的關(guān)鍵,即業(yè)務(wù)系統(tǒng)中的電子文件及其元數(shù)據(jù)經(jīng)過XML封裝和數(shù)字證書加密保真后,以脫機拷貝的形式,進入到政務(wù)內(nèi)網(wǎng)或機要網(wǎng)進行處理;第三個網(wǎng)絡(luò)是電子文件接收方或管理方(檔案館、室、文件中心等)的專用網(wǎng)絡(luò),該網(wǎng)絡(luò)直接與政務(wù)內(nèi)網(wǎng)或機要網(wǎng)相連,可提供數(shù)據(jù)庫、格式轉(zhuǎn)換、封裝、備份、WEB管理、全文瀏覽、流媒體點播等服務(wù)。
圖3??電子文件生命周期內(nèi)網(wǎng)絡(luò)保障分布圖
3.2??元數(shù)據(jù)方案模型。元數(shù)據(jù),是用來描述數(shù)據(jù)的內(nèi)容、結(jié)構(gòu)及背景的信息,它可以反映數(shù)據(jù)管理的整個過程,應(yīng)用在電子文件及電子檔案的管理上,可以用來證實文件的真實性、完整性、有效性、一致性。
我們目前關(guān)于電子文件元數(shù)據(jù)研究的較為成熟的成果有ISO?15489、ISO?23081、DA/T46-2009等。綜合考慮電子檔案載體形態(tài)、電子文件管理特點、國家及地方管理特色,本文以ISO?23081中提出的法規(guī)四元組的頂層框架模型為基礎(chǔ)[2],結(jié)合《文書類電子文件元數(shù)據(jù)方案》(DA/T46-2009),將反映電子文件與各類信息的關(guān)系描述、政策法規(guī)依據(jù)、職能活動描述等列入元數(shù)據(jù)采集范圍[3]。我們在元數(shù)據(jù)方案中定義了實體、業(yè)務(wù)、責任、法規(guī)及關(guān)系等五個元數(shù)據(jù)屬類,并在封裝時將其轉(zhuǎn)成以文件為中心的扁平化結(jié)構(gòu)。在整個元數(shù)據(jù)方案中,除反映文件本身自然屬性的實體元數(shù)據(jù)穩(wěn)定不變之外,其他各類元數(shù)據(jù)都是隨管理過程的深入而動態(tài)變化(圖4)。
五個屬類中,實體元數(shù)據(jù)用于了解電子文件的來源、屬性及生成環(huán)境;責任元數(shù)據(jù)是落實責任對象、評價電子文件法定性的重要依據(jù);業(yè)務(wù)元數(shù)據(jù)是重現(xiàn)文件管理過程的重要信息;關(guān)系元數(shù)據(jù)是揭示材料間相互聯(lián)系、進行信息聯(lián)動的有力支撐;法規(guī)元數(shù)據(jù)是控制、約束業(yè)務(wù)行為與職能授權(quán)的規(guī)則。這些元數(shù)據(jù)直接為電子文件三個階段的管理提供了數(shù)據(jù)記錄及驗證支持。
圖4??元數(shù)據(jù)方案頂層設(shè)計圖
3.3??文檔封裝模型。元數(shù)據(jù)封裝是指按元數(shù)據(jù)方案的結(jié)構(gòu)將編碼數(shù)據(jù)及元數(shù)據(jù)整合為一個文檔,并用數(shù)字證書對需保真部分作摘要和簽名。封裝技術(shù)的直接優(yōu)勢在于它以純文本、小體積的形式對文件背景、內(nèi)容和關(guān)系進行了完整的自我描述。綜合考慮BS、ERMS、TDR三個管理階段的管理要求,其封裝模型呈現(xiàn)出以下特點。
其一,封裝的過程性。它的封裝不是一次成型。電子文件的管理及利用有靈活的分段封裝機制,即電子文件可以允許多次解析和封裝,BS系統(tǒng)中以結(jié)構(gòu)狀態(tài)、形成背景及處置行為為主封裝出SIP包(提交數(shù)據(jù)包),ERMS系統(tǒng)中以實體、驗證及其管理行為為主封裝AIP包(存檔數(shù)據(jù)包),TDR系統(tǒng)則以實體、認證為主封裝DIP包(分發(fā)數(shù)據(jù)包),三者基于同一種封裝及解析算法,具有一定的系統(tǒng)性,但封裝及解析又具有相對獨立性。
其二,封裝結(jié)構(gòu)的半封閉式。它的部分取值來自對文檔及生成環(huán)境的自動攝取,這些文檔及背景元數(shù)據(jù)是靜態(tài)的,提取后不可篡改,因而可保障電子文件的真實性;還有部分數(shù)據(jù)來自管理過程中的人工著錄和記錄,它是動態(tài)的,它可隨管理活動的深入而增加,呈現(xiàn)出橫向穩(wěn)定、縱向增加、不可逆轉(zhuǎn)的特點,連續(xù)的動態(tài)數(shù)據(jù)可佐證電子文件生成及管理過程、幫助解讀各項職能及業(yè)務(wù)行為、明確及判斷相關(guān)權(quán)限。
配合系統(tǒng)日志、審計機制,我們可以判斷電子文件形成、歸檔及保存全過程是否合規(guī)合法,文件是否可信(圖5)。
圖5??元數(shù)據(jù)封包結(jié)構(gòu)圖
3.4??數(shù)字認證模型。通過電子政務(wù)或電子商務(wù)平臺制作和傳輸?shù)碾娮游募?,要杜絕業(yè)務(wù)流程中的篡改、丟失、攻擊等問題,保障電子公文的真實有效,就必須借助于一定的驗證技術(shù)。數(shù)字簽名技術(shù)(PKI)就是其中一種,它利用某種密碼運算生成一系列符號及代碼組成的電子密碼進行簽名,來代替書寫簽名或印章,主要用于鑒定簽名人身份以及確保電子數(shù)據(jù)完整、真實,技術(shù)成熟、可靠性強。
傳統(tǒng)的“小作坊”式的兩兩認證只局限于處于同一編碼環(huán)境下的文件傳輸雙方,認證范圍較窄,一旦脫離這個系統(tǒng),勢必又要重新開始認證,周而復(fù)始,浪費資源。鑒于ERMS系統(tǒng)中的電子文件都形成于合法的社會組織,所以,我們主張充分引入國家認可的認證機構(gòu)及已有的認證資源,統(tǒng)一數(shù)字認證編碼算法,在全國(全?。┓秶鷥?nèi)建立一個完整的數(shù)字認證體系。當前可應(yīng)用于立檔單位與同級綜合檔案館之間電子檔案交接,待認證資源高度統(tǒng)一后,則可用于復(fù)雜的數(shù)字檔案館間檔案共享與協(xié)作、檔案交流與交換。
其原理及流程如下,CA作為國家承認并備案的第三方認證中心,負責向領(lǐng)用單位頒發(fā)證書,并通過根證書的離線或在線驗證來證實其所頒發(fā)證書的有效,建立起發(fā)證單位與領(lǐng)證單位的信任;領(lǐng)證單位得到的這份證書主要用于信息及數(shù)據(jù)的加密,我們稱為密鑰,與之相對應(yīng)的公鑰在網(wǎng)上在線發(fā)布,公私兩個密鑰是非對稱結(jié)構(gòu),接收加密數(shù)據(jù)包的單位在收到密文后,利用數(shù)字證書當中的公鑰,確認算法,從而將其還原成明文,完成解碼。
4??結(jié)論
網(wǎng)絡(luò)環(huán)境是電子文件管理系統(tǒng)所處的外界環(huán)境,是摒除網(wǎng)絡(luò)不穩(wěn)定因素,保障網(wǎng)絡(luò)及信息安全的根本所在;元數(shù)據(jù)方案是保障電子文件真實可信的關(guān)鍵因素,是確保電子文件真實可信的第一道屏障;文檔封裝是元數(shù)據(jù)的組織及解析形式,是各類驗證及評價的數(shù)據(jù)及結(jié)構(gòu)基礎(chǔ);數(shù)字認證是確保文件來源及信息真實可信的有力支撐??尚牌脚_的構(gòu)建一定要妥善處理好以上四者的關(guān)系,不可偏廢。相信隨著管理體制的不斷完善、國內(nèi)標準的不斷發(fā)布、安全技術(shù)的不斷創(chuàng)新和應(yīng)用,未來的電子文件管理系統(tǒng)會越來越成熟。
參考文獻:
[1]李澤鋒.基于OAIS的可信電子文件管理系統(tǒng)的體系構(gòu)建[J].情報雜志,2010(8):136.
[2]國際標準化組織.?ISO?23081-1信息與文件-文件管理過程-文件元數(shù)據(jù)第一部分:原則[S],?2006:?11~13.
[3]毛海帆.電子檔案元數(shù)據(jù)方案設(shè)計與應(yīng)用初探[J].檔案學研究,2010(1):74~78.
(作者單位:南昌工程學院檔案館??來稿日期:2014-10-09)