郭志軍 王秀霞
摘要:該文描述了某集團(tuán)級(jí)大型公司電子檔案管理系統(tǒng)(ERMS)整體解決方案,介紹了系統(tǒng)安全策略、數(shù)據(jù)集成技術(shù)、電子檔案數(shù)據(jù)保護(hù)等幾個(gè)方面的關(guān)鍵技術(shù)。
關(guān)鍵詞:檔案管理系統(tǒng);架構(gòu);功能模塊;關(guān)鍵技術(shù)
中圖分類(lèi)號(hào):TP315 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)02-0005-03
Abstract:This paper introduces the whole solution of the Electronic Records Management System (ERMS) of some large group . Furthermore, it also presents the key technology of the safety strategy of the system, the method of how to integrate data and electronic records data protection.
Key words:ERMS; architecture; function module; key technology
在全球日益激烈的市場(chǎng)競(jìng)爭(zhēng)和資本市場(chǎng)的雙重壓力下。各大石油公司一直在積極主動(dòng)地調(diào)整自己,在變革過(guò)程中,各家石油巨頭越來(lái)越重視對(duì)積累的檔案等知識(shí)資源的運(yùn)用,英國(guó)石油和殼牌等石油公司都在檔案的收集管理,特別是利用上進(jìn)行了卓有成效的工作[1]。
某公司作為一家世界領(lǐng)先的集石油和天然氣上下游業(yè)務(wù)、油氣田工程技術(shù)服務(wù)、石油物資裝備制造和供應(yīng)于一體的綜合性能源公司,已經(jīng)在超過(guò)半個(gè)世紀(jì)的發(fā)展歷程中積累了大量文件和各種資料,并形成了館藏量巨大的檔案,檔案分布在全集團(tuán)公司總部及上百個(gè)所屬企事業(yè)單位,公司檔案信息化面臨著巨大的挑戰(zhàn)。
對(duì)于收集工作,隨著信息技術(shù)的發(fā)展,在公司各專業(yè)領(lǐng)域都運(yùn)行著大量的信息系統(tǒng),這些信息系統(tǒng)也在不斷生成著海量的電子文件,這些實(shí)時(shí)產(chǎn)生的電子文件的收集是通過(guò)現(xiàn)有人力收集模式無(wú)法實(shí)現(xiàn)的。對(duì)于保管工作,海量的檔案目錄及內(nèi)容信息的管理,電子文件的長(zhǎng)期保存等都是需要解決的難題。對(duì)于利用工作,紙質(zhì)館藏?cái)?shù)字化、海量數(shù)字信息的快速精準(zhǔn)檢索是發(fā)揮檔案價(jià)值的關(guān)鍵。
如何解決集團(tuán)公司海量檔案管理在收集、管理、利用等方面的問(wèn)題呢?美國(guó)空間數(shù)據(jù)系統(tǒng)咨詢委員會(huì)(CCSDS)于2003發(fā)布了OAIS(開(kāi)放檔案信息系統(tǒng))參考模型,已為越來(lái)越多的機(jī)構(gòu)和企業(yè)所接受[2]。OAIS提供一個(gè)用于數(shù)字信息長(zhǎng)期保存管理利用的框架,為開(kāi)發(fā)數(shù)字信息系統(tǒng)提供了全面指導(dǎo)?;贠AIS模型,在全集團(tuán)公司建設(shè)應(yīng)用了統(tǒng)一的檔案管理系統(tǒng)(Electronic Records Management System,簡(jiǎn)稱ERMS),提高了檔案管理工作的效率、建立了集中統(tǒng)一的檔案數(shù)字信息庫(kù)、檔案利用方式實(shí)現(xiàn)網(wǎng)絡(luò)化、實(shí)現(xiàn)了全公司全部類(lèi)目檔案的共享,為集團(tuán)公司建立知識(shí)中心和憑證中心奠定了基礎(chǔ)。
1 ERMS系統(tǒng)架構(gòu)及功能
ERMS的總體目標(biāo)是建設(shè)統(tǒng)一的和專業(yè)的企業(yè)級(jí)檔案管理系統(tǒng),提高檔案相關(guān)流程的服務(wù)水平、運(yùn)行效率,整體提升檔案管理能力,同時(shí)也為企業(yè)的知識(shí)管理奠定基礎(chǔ)。通過(guò)改善檔案相關(guān)的基礎(chǔ)環(huán)境,推動(dòng)員工對(duì)檔案的加工利用;通過(guò)建立、管理各類(lèi)專業(yè)文檔庫(kù),加快企業(yè)對(duì)相似問(wèn)題的響應(yīng)和解決速度。
檔案管理系統(tǒng)將保存和提供真實(shí)的各種形式的電子文件,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)與檔案管理系統(tǒng)的有效集成;建立起某公司統(tǒng)一的檔案管理平臺(tái)和檔案信息資源共享平臺(tái);通過(guò)系統(tǒng)實(shí)現(xiàn)自動(dòng)收集歸檔、科學(xué)保管和整合利用功能。
ERMS一共包括5個(gè)模塊,其中后臺(tái)管理層面包括:應(yīng)用管理、系統(tǒng)管理等2個(gè)模塊;業(yè)務(wù)應(yīng)用層面包括:檔案收集、檔案管理、檔案利用等3個(gè)模塊。這5個(gè)模塊共包含64個(gè)二級(jí)功能點(diǎn)。ERMS總體功能架構(gòu)如圖1所示。
5 個(gè)功能模塊的主要功能定義如下:
1)系統(tǒng)管理:用于存儲(chǔ)和管理系統(tǒng)的基礎(chǔ)信息,包括系統(tǒng)菜單界面、用戶權(quán)限、操作日志、在線通知、系統(tǒng)審計(jì)等功能。
2)應(yīng)用管理:用于存儲(chǔ)和管理與業(yè)務(wù)相關(guān)的系統(tǒng)配置信息,包括著錄項(xiàng)管理、檔案類(lèi)型管理、檔號(hào)規(guī)則、業(yè)務(wù)流程管理等功能;以及系統(tǒng)與外部業(yè)務(wù)系統(tǒng)配置信息,包括組織機(jī)構(gòu)映射關(guān)系、接口接收文件狀態(tài)等信息。
3)檔案收集:面向檔案形成的歸檔人員,用于錄入、審核歸檔數(shù)據(jù),并提供如編目、立卷等歸檔前的必要操作功能。
4)檔案管理:面向檔案管理人員的全面綜合的業(yè)務(wù)管理功能集。實(shí)現(xiàn)檔案管理、庫(kù)房庫(kù)架管理、審核、鑒定與銷(xiāo)毀等功能。
5)檔案利用:最終體現(xiàn)檔案知識(shí)價(jià)值的一組面向所有檔案利用人員的功能集。包括基于檔案編目的常規(guī)檔案檢索功能,以及基于全文搜索的高級(jí)檢索功能。通過(guò)建立的檔案數(shù)據(jù)倉(cāng)庫(kù),快速實(shí)現(xiàn)檔案數(shù)據(jù)的多維分析、統(tǒng)計(jì),并提供表格及圖形化展示面板。
2 ERMS關(guān)鍵技術(shù)實(shí)現(xiàn)
2.1 系統(tǒng)安全策略
1)災(zāi)難恢復(fù)策略
從檔案管理系統(tǒng)來(lái)說(shuō),本身不是交易系統(tǒng),因此對(duì)RTO(恢復(fù)時(shí)間目標(biāo)\Recovery Time Objective,簡(jiǎn)稱RTO)的要求不是很高;但是檔案管理系統(tǒng)是一個(gè)企業(yè)憑證數(shù)據(jù)和積累的知識(shí)中心,因此對(duì)RPO(恢復(fù)點(diǎn)目標(biāo)\Recovery Point Objective,簡(jiǎn)稱RPO)的要求相當(dāng)高,不能容忍數(shù)據(jù)的丟失。根據(jù)國(guó)際標(biāo)準(zhǔn)SHARE 78(災(zāi)難恢復(fù)的7個(gè)層次),采用活動(dòng)狀態(tài)備份的方案,即層次4。
檔案管理系統(tǒng)分別在異地的兩個(gè)數(shù)據(jù)中心搭建了系統(tǒng)環(huán)境,兩個(gè)節(jié)點(diǎn)之間的應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器均建立了跨機(jī)房的高可用群集,使得兩個(gè)節(jié)點(diǎn)都處于活動(dòng)狀態(tài)并且同時(shí)互相備份,系統(tǒng)工作負(fù)載可以在兩個(gè)節(jié)點(diǎn)之間分擔(dān)。
2)UKEY及企業(yè)域服務(wù)器策略
與公司IAM(統(tǒng)一身份認(rèn)證平臺(tái))實(shí)現(xiàn)集成,運(yùn)用IAM下發(fā)的UKEY實(shí)現(xiàn)系統(tǒng)用戶的安全登錄。
ERMS域目錄采用公司統(tǒng)一的企業(yè)域目錄,消除了用戶為不同的應(yīng)用而頻繁切換登陸的操作,實(shí)現(xiàn)了一站式登陸。
3)完整的安全審計(jì)策略
ERMS涉及用戶范圍大,業(yè)務(wù)流程跨崗位、跨部門(mén)、跨二級(jí)單位,在系統(tǒng)的管理中,經(jīng)常要處理數(shù)據(jù)人為誤操作的責(zé)任追查等問(wèn)題。在系統(tǒng)層面,通過(guò)程序跟蹤用戶使用行為,完整記錄用戶操作過(guò)程及操作數(shù)據(jù)。在數(shù)據(jù)庫(kù)層面,通過(guò)SQLServer日志審計(jì)功能,完整記錄系統(tǒng)管理員的操作過(guò)程及操作數(shù)據(jù)。操作過(guò)程記錄包括登錄、增刪改查、注銷(xiāo)等全過(guò)程,從而實(shí)現(xiàn)了系統(tǒng)內(nèi)外用戶的使用生命周期管理。
2.2 數(shù)據(jù)集成技術(shù)
2.2.1 高穩(wěn)定性、高可擴(kuò)展性的數(shù)據(jù)集成接口技術(shù)
ERMS是以集中部署方式建設(shè)的統(tǒng)建信息管理系統(tǒng),根據(jù)檔案管理業(yè)務(wù)需要,涉及與ERMS進(jìn)行數(shù)據(jù)集成的系統(tǒng)眾多,包括ERP、OA、合同、勘探開(kāi)發(fā)數(shù)據(jù)管理等系統(tǒng)。由于各業(yè)務(wù)領(lǐng)域存在差異,各業(yè)務(wù)系統(tǒng)中需歸檔的數(shù)據(jù)也存在較大差異,所以ERMS數(shù)據(jù)集成接口需要定制多種邏輯來(lái)處理不同數(shù)據(jù)格式。如果采用常規(guī)開(kāi)發(fā)模式設(shè)計(jì)數(shù)據(jù)集成接口,考慮接口程序包含的處理邏輯多、回歸測(cè)試內(nèi)容不斷增加、程序復(fù)雜度高等因素,那么數(shù)據(jù)集成接口的穩(wěn)定性將嚴(yán)重不足。通過(guò)采用工廠設(shè)計(jì)模式,可以有效開(kāi)發(fā)出高聚合、低耦合的接口程序,大幅度提高接口程序的穩(wěn)定性、可擴(kuò)展性[3]。
ERMS數(shù)據(jù)集成接口技術(shù):
1)將業(yè)務(wù)系統(tǒng)標(biāo)識(shí)與對(duì)應(yīng)處理程序名稱以文本形式保存在二進(jìn)制文件中,該文件將作為配置文件可以根據(jù)需要?jiǎng)討B(tài)調(diào)整;
2)在接口框架程序運(yùn)行時(shí)調(diào)取配置文件,并根據(jù)對(duì)接業(yè)務(wù)系統(tǒng)標(biāo)識(shí)自動(dòng)匹配處理程序;
3)接口框架程序執(zhí)行匹配的處理程序。
2.2.2 分布式數(shù)據(jù)處理技術(shù)
經(jīng)過(guò)測(cè)算,OA系統(tǒng)每月有上百GB的數(shù)據(jù)需要?dú)w檔,ERP中財(cái)務(wù)管理系統(tǒng)每月有1億多條數(shù)據(jù)需要?dú)w檔到ERMS。對(duì)于每條歸入ERMS 的數(shù)據(jù)需要執(zhí)行數(shù)據(jù)安全檢查、數(shù)據(jù)合規(guī)性校驗(yàn)、屬性映射、格式轉(zhuǎn)換、數(shù)據(jù)保存等操作,這些操作均需要消耗服務(wù)器CPU時(shí)間。通過(guò)應(yīng)用分布式計(jì)算模式,使得多個(gè)業(yè)務(wù)系統(tǒng)自動(dòng)歸檔的海量檔案數(shù)據(jù)能夠快速入庫(kù)成為可能。分布式計(jì)算模式是提高程序處理速度的最佳選擇之一,其原理是將巨量的計(jì)算任務(wù)分解后派發(fā)到物理分布的多臺(tái)服務(wù)器上進(jìn)行處理,目的是提高系統(tǒng)整體的計(jì)算速度[4]。
ERMS分布式數(shù)據(jù)處理技術(shù):
1)采用Web服務(wù)模式開(kāi)發(fā)消息接收接口,用來(lái)接收來(lái)自不同業(yè)務(wù)系統(tǒng)的歸檔請(qǐng)求,并進(jìn)行集中存儲(chǔ),形成消息中心;
2)采用Window服務(wù)模式開(kāi)發(fā)消息分發(fā)程序,通過(guò)該程序?qū)⑾⒅行牡臍w檔請(qǐng)求根據(jù)任務(wù)分派算法進(jìn)行分派,目前ERMS采用的任務(wù)分派算法是“最少作業(yè)數(shù)”,即權(quán)重因子分派到不同處理服務(wù)器上的任務(wù)隊(duì)列長(zhǎng)度,隊(duì)列任務(wù)越少獲得新任務(wù)的優(yōu)先級(jí)越高;
3)任務(wù)處理服務(wù)器上Window服務(wù)在獲取到任務(wù)后,開(kāi)始與業(yè)務(wù)系統(tǒng)進(jìn)行檔案數(shù)據(jù)交換,并執(zhí)行完整的數(shù)據(jù)處理操作,最終完成自動(dòng)歸檔工作;
4)通過(guò)監(jiān)測(cè)處理服務(wù)器上處理任務(wù)隊(duì)列長(zhǎng)度,可以快速掌握整個(gè)數(shù)據(jù)集成接口的工作負(fù)載情況,管理員可以根據(jù)情況,動(dòng)態(tài)調(diào)整任務(wù)處理服務(wù)器的數(shù)量。
需要注意的是各任務(wù)處理器軟、硬件配置需要保證一致,以保證最佳的分布式計(jì)算效果。
2.2.3 基于SOA的接口設(shè)計(jì)模式
根據(jù)某公司信息技術(shù)總體規(guī)劃要求,各統(tǒng)建系統(tǒng)需要通過(guò)統(tǒng)建數(shù)據(jù)集成平臺(tái)實(shí)現(xiàn)系統(tǒng)互通互聯(lián),為了便于未來(lái)將整個(gè)數(shù)據(jù)集成功能平滑遷移到統(tǒng)建數(shù)據(jù)集成平臺(tái),ERMS的數(shù)據(jù)集成平臺(tái)整體設(shè)計(jì)模式是基于SOA實(shí)現(xiàn)的,并在系統(tǒng)設(shè)計(jì)階段就規(guī)劃了一個(gè)虛擬的“SOA模擬器”組件,以方便接口的平滑過(guò)渡。
ERMS虛擬“SOA模擬器”技術(shù):
(1)采用SOA相關(guān)標(biāo)準(zhǔn)要求,開(kāi)發(fā)“SOA模擬器”組件,該組件是SOA類(lèi)商業(yè)數(shù)據(jù)集成平臺(tái)產(chǎn)品的簡(jiǎn)化版,保留了Web服務(wù)形式的對(duì)外接口,去掉了額外復(fù)雜的功能,只設(shè)計(jì)開(kāi)發(fā)了消息轉(zhuǎn)發(fā)功能;
(2) 當(dāng)業(yè)務(wù)系統(tǒng)發(fā)起歸檔請(qǐng)求時(shí),直接調(diào)用“SOA模擬器”發(fā)布的統(tǒng)一接口,并由“SOA模擬器”將請(qǐng)求直接轉(zhuǎn)發(fā)到數(shù)據(jù)集成接口的“消息中心”組件。
2.3 電子檔案數(shù)據(jù)保護(hù)技術(shù)
2.3.1數(shù)據(jù)庫(kù)透明加密
應(yīng)用SQLServer透明數(shù)據(jù)加密技術(shù),使用DEK 數(shù)據(jù)庫(kù)加密密鑰對(duì)數(shù)據(jù)文件進(jìn)行加密,包括IO操作,加入內(nèi)存等都是存在加密和解密操作的[5]。通過(guò)該技術(shù),實(shí)現(xiàn)了在不影響前端系統(tǒng)正常使用的狀態(tài)下,直接對(duì)整個(gè)數(shù)據(jù)庫(kù)進(jìn)行加密,保證了在極端情況下,如數(shù)據(jù)庫(kù)服務(wù)器被盜等,惡意人員無(wú)法通過(guò)破解或重置數(shù)據(jù)庫(kù)管理員密碼等方式,竊取整個(gè)電子檔案數(shù)據(jù)庫(kù)的信息。另外,數(shù)據(jù)庫(kù)透明加密技術(shù)是主流商用數(shù)據(jù)庫(kù)軟件的主要安全功能之一,應(yīng)用效果好,部署方便快速。
2.3.2 對(duì)檔案數(shù)據(jù)進(jìn)行數(shù)字加密及數(shù)字簽名
為了保證電子檔案數(shù)據(jù)的安全,ERMS采用了數(shù)字加密技術(shù)。通過(guò)該技術(shù),保證了檔案數(shù)據(jù)以加密狀態(tài)存儲(chǔ)在數(shù)據(jù)庫(kù)中,目的是防止電子檔案數(shù)據(jù)內(nèi)容泄露及數(shù)據(jù)管理員“監(jiān)守自盜”。
ERMS數(shù)字加密技術(shù):
1)單獨(dú)部署兩組數(shù)字加密服務(wù)器,一組執(zhí)行加密計(jì)算,另一組執(zhí)行解密計(jì)算;
2)在兩組服務(wù)器上部署數(shù)據(jù)加密、解密API(以DLL方式)及密鑰數(shù)據(jù)庫(kù);
3)ERMS主Web程序在保存數(shù)據(jù)時(shí)調(diào)用加密API,在讀取數(shù)據(jù)時(shí)調(diào)用解密API。
為了保證電子檔案數(shù)據(jù)的不可抵賴性,防止數(shù)據(jù)被惡意篡改,ERMS采用了數(shù)字簽名技術(shù)。通過(guò)該技術(shù),保證了ERMS中的數(shù)據(jù)有不可抵賴的來(lái)源信息,并且能夠監(jiān)測(cè)到數(shù)據(jù)被非法篡改的異常。
ERMS數(shù)字簽名技術(shù):
1)通過(guò)網(wǎng)絡(luò)瀏覽器客戶端腳本程序,調(diào)用用戶UKEY中的數(shù)字簽名對(duì)上傳的檔案數(shù)據(jù)進(jìn)行數(shù)字簽名;
2)ERMS主Web程序在存儲(chǔ)檔案數(shù)據(jù)的同時(shí)保存數(shù)字簽名信息;
3)設(shè)計(jì)開(kāi)發(fā)Window服務(wù)模式的守護(hù)進(jìn)程,定時(shí)對(duì)數(shù)據(jù)進(jìn)行驗(yàn)簽操作,當(dāng)發(fā)現(xiàn)數(shù)字簽名不一致時(shí),進(jìn)行報(bào)警記錄。
需要注意的是加解密、簽名驗(yàn)簽操作的系統(tǒng)開(kāi)銷(xiāo)比較大,但是,當(dāng)信息安全風(fēng)險(xiǎn)較高的情況下,仍然需要首先考慮犧牲部分性能以保證數(shù)據(jù)絕對(duì)安全,或者通過(guò)加大服務(wù)器硬件投資以保證系統(tǒng)性能。
2.3.3 電子文件離線保護(hù)
電子文件易復(fù)制、易傳播等特征使得電子文件如何在授權(quán)范圍內(nèi)使用變成了問(wèn)題。為了解決該問(wèn)題,ERMS應(yīng)用了微軟RMS(文檔權(quán)限管理服務(wù)/Rights Management Service,簡(jiǎn)稱RMS),該技術(shù)方案同樣應(yīng)用在某公司OA系統(tǒng)中。ERMS文檔權(quán)限管理服務(wù)基于公司統(tǒng)一的域控實(shí)現(xiàn)與用戶的關(guān)聯(lián),將用戶授權(quán)操作內(nèi)嵌于文檔之中形成受保護(hù)的電子文件。當(dāng)任意用戶訪問(wèn)受保護(hù)的電子文件時(shí),操作系統(tǒng)會(huì)提示需要進(jìn)行身份驗(yàn)證,沒(méi)有通過(guò)授權(quán)的用戶將無(wú)法使用電子文件,即使通過(guò)授權(quán)的用戶也只能在授權(quán)的范圍使用電子文件,例如:查看時(shí)間被限制在72個(gè)小時(shí)、不能進(jìn)行拷貝操作等。
3 結(jié)束語(yǔ)
檔案管理系統(tǒng)是某公司信息化建設(shè)與檔案工作現(xiàn)代化管理的重要成果,系統(tǒng)按照“六統(tǒng)一”和“業(yè)務(wù)主導(dǎo)”的原則進(jìn)行建設(shè),實(shí)現(xiàn)了各類(lèi)檔案信息資源的集中管理和檔案工作的標(biāo)準(zhǔn)化、規(guī)范化與現(xiàn)代化管理,提升了檔案管理與服務(wù)水平,ERMS系統(tǒng)已經(jīng)成為某公司各級(jí)檔案管理工作中不可或缺的信息管理平臺(tái)。隨著系統(tǒng)應(yīng)用的不斷深入和完善,ERMS系統(tǒng)將為提升企業(yè)競(jìng)爭(zhēng)力、提高知識(shí)創(chuàng)新能力發(fā)揮重要作用。
參考文獻(xiàn):
[1] 趙霞. 企業(yè)檔案管理系統(tǒng)研究與實(shí)現(xiàn)[D]. 天津:天津大學(xué), 2012.
[2] 吳正明, 王歡. 淺議開(kāi)放檔案信息系統(tǒng)(OAIS)參考模型及其在我國(guó)的應(yīng)用[J]. 云南檔案, 2014(11): 41-42.
[3] Erich Gamma,Richard Helm, Ralph Johnson, et al.Design Patterns Elements of Reusable Object-Oriented Software[M]. 北京: 機(jī)械工業(yè)出版社, 2002.
[4] 周洪波. 云計(jì)算-技術(shù)、應(yīng)用、標(biāo)準(zhǔn)和商業(yè)模式[M]. 北京: 電子工業(yè)出版社, 2011.
[5] Microsfot SQL Server 2008 R2 white- pagers, Microsoft Corporation [EB/OL]. http://www.microsoft.com/china/sql/2008/white-papers.aspx.