彭蒙蒙
[摘要]數(shù)字時(shí)代加強(qiáng)電子文件歸檔和電子檔案管理,不僅是時(shí)代所需,也是提高檔案管理效率和提升檔案服務(wù)質(zhì)量的重要保障,對(duì)企業(yè)具有重要意義。論文以國(guó)泰君安為例,從電子文件歸檔、電子檔案管理、電子檔案利用三個(gè)方面,對(duì)企業(yè)電子文件歸檔和電子檔案管理模式進(jìn)行了探索。
[關(guān)鍵詞]電子文件歸檔電子檔案管理電子檔案利用
[分類號(hào)]G271
Research on the Mode of Enterprise Electronic Filing and Electronic Archive Management in Digital Era
——Taking GUOTAI JUNAN Securities as an Example
Peng Mengmeng
(GUOTAI JUNAN Securities Company, Shanghai, 200444)
Abstract: Strengthening electronic filing and electronic archive management is not only necessary in the digital time, but also is an important guarantee for improving the efficiency of archive management and the quality of archive service, which is of great significance to enterprises .This paper explores the mode of enterprise electronic filing and electronic archive management from electronic filing, electronic archive management and electronic archival utilization.
Keywords: ElectronicFiling;ElectronicArchiveManagement;ElectronicArchivalUtilization
當(dāng)今人類社會(huì)發(fā)展正處在數(shù)字時(shí)代,數(shù)字化、網(wǎng)絡(luò)化、智能化正日益融入人們生產(chǎn)生活的方方面面,極大地推動(dòng)了社會(huì)的發(fā)展進(jìn)步。數(shù)字化浪潮對(duì)現(xiàn)代檔案管理帶來(lái)了深刻的影響,數(shù)字信息的出現(xiàn)改變了檔案記錄和讀取方式,產(chǎn)生了形式多樣、規(guī)格各異且數(shù)量巨大的電子文件,打破了傳統(tǒng)檔案管理模式,為檔案工作帶來(lái)了新的要求和挑戰(zhàn)。[1]2016年,國(guó)家檔案局及上海、安徽、江西等地方檔案行政機(jī)構(gòu)紛紛把加強(qiáng)電子文件歸檔與電子檔案管理寫入了檔案事業(yè)發(fā)展“十三五”規(guī)劃。對(duì)于企業(yè)而言,加強(qiáng)電子文件歸檔和電子檔案管理,不僅是時(shí)代所需,也是提高檔案管理效率和提升檔案服務(wù)質(zhì)量的重要保障,從長(zhǎng)遠(yuǎn)來(lái)看還有利于節(jié)省管理成本,可謂意義重大。本文在電子文件歸檔相關(guān)規(guī)范的基礎(chǔ)上,以國(guó)泰君安證券股份有限公司(以下簡(jiǎn)稱“國(guó)泰君安”)為例,探索企業(yè)電子文件歸檔和電子檔案管理模式,力求形成通用性較強(qiáng)、具有指導(dǎo)意義的電子文件歸檔和電子檔案管理經(jīng)驗(yàn)。
1電子文件歸檔
電子文件歸檔是指將具有憑證、查考和保存價(jià)值且辦理完畢、經(jīng)系統(tǒng)整理的電子文件及其元數(shù)據(jù)管理權(quán)限向檔案部門提交的過(guò)程,可采用在線歸檔或離線歸檔方式。由于離線歸檔需要人工先把電子文件從業(yè)務(wù)系統(tǒng)中導(dǎo)出,之后再導(dǎo)入到電子檔案管理系統(tǒng),耗費(fèi)較多的時(shí)間和精力,而且還存在重復(fù)性大、易出錯(cuò)等弊端,而在線歸檔是通過(guò)系統(tǒng)接口實(shí)現(xiàn)電子文件直接歸檔,人工干預(yù)較少,所以綜合而言,在線歸檔整體上要比離線歸檔更合理、科學(xué)。
1.1歸檔接口
在線歸檔中,歸檔接口的設(shè)計(jì)與開(kāi)發(fā)是關(guān)鍵點(diǎn)和難點(diǎn)。作為業(yè)務(wù)系統(tǒng)與電子檔案管理系統(tǒng)的銜接,歸檔接口一方面要確保電子文件及其元數(shù)據(jù)在待歸檔時(shí)的真實(shí)性、完整性、可靠性、可用性(簡(jiǎn)稱“四性”),另一方面要保障其在整個(gè)歸檔過(guò)程中的“四性”要求,為此,歸檔接口需要具備“四性”檢測(cè)功能。下文將對(duì)“四性”檢測(cè)內(nèi)容進(jìn)行詳細(xì)闡述。
歸檔接口通常采用Web Service、中間庫(kù)或歸檔電子文件及其元數(shù)據(jù)規(guī)范存儲(chǔ)結(jié)構(gòu)的方式,三種方式各有特點(diǎn),處理方式也不相同。以中間庫(kù)為例,歸檔業(yè)務(wù)系統(tǒng)(上游系統(tǒng))將數(shù)據(jù)推送到中間庫(kù)后,歸檔接口實(shí)時(shí)采集“中間庫(kù)”數(shù)據(jù)進(jìn)行“四性”檢測(cè),對(duì)檢測(cè)結(jié)果進(jìn)行狀態(tài)回寫,并要求歸檔業(yè)務(wù)系統(tǒng)(上游系統(tǒng))定時(shí)全部依次訪問(wèn)中間庫(kù),采集檢測(cè)失敗的數(shù)據(jù)重新進(jìn)行推送歸檔,整個(gè)流程如圖1所示。該方式可同步處理多重任務(wù),效率較高,但在推行時(shí)可能會(huì)遇到接口開(kāi)發(fā)周期長(zhǎng)、需要?dú)w檔業(yè)務(wù)系統(tǒng)(上游系統(tǒng))密切配合、比較耗費(fèi)系統(tǒng)資源等問(wèn)題,企業(yè)應(yīng)根據(jù)本單位實(shí)際及業(yè)務(wù)系統(tǒng)建設(shè)情況選擇合適的接口實(shí)現(xiàn)方式。
1.2歸檔環(huán)節(jié)的“四性”檢測(cè)
在電子文件歸檔環(huán)節(jié),由于電子文件在歸檔過(guò)程中存在業(yè)務(wù)部門與檔案部門之間的權(quán)屬交接以及電子文件到電子檔案的轉(zhuǎn)變,因此需要對(duì)電子文件的“四性”進(jìn)行檢測(cè),確保電子文件歸檔的質(zhì)量?!八男浴睓z測(cè)具體內(nèi)容如圖2所示。電子文件真實(shí)性檢測(cè),包括:①電子文件來(lái)源真實(shí)性檢測(cè):MD5算法檢測(cè)歸檔電子文件的固化信息和數(shù)字摘要值是否有效;②電子文件元數(shù)據(jù)真實(shí)性檢測(cè):依據(jù)元數(shù)據(jù)方案檢測(cè)歸檔電子文件元數(shù)據(jù)數(shù)據(jù)類型、長(zhǎng)度、格式、值域是否符合要求;③電子文件元數(shù)據(jù)與內(nèi)容關(guān)聯(lián)真實(shí)性檢測(cè):檢測(cè)電子文件元數(shù)據(jù)與內(nèi)容數(shù)據(jù)是否關(guān)聯(lián),檢測(cè)元數(shù)據(jù)中記錄的文件存儲(chǔ)位置與電子檔案內(nèi)容數(shù)據(jù)的實(shí)際存儲(chǔ)位置是否一致;④電子文件內(nèi)容電子屬性真實(shí)性檢測(cè):檢測(cè)電子檔案內(nèi)容數(shù)據(jù)中包含的電子屬性信息與電子文件元數(shù)據(jù)中記錄的信息是否一致;⑤電子文件歸檔信息包真實(shí)性檢測(cè):XML封裝與MD5算法檢測(cè)比對(duì)電子文件歸檔信息包的文件名、文件大小和原始記錄,以及歸檔信息包的數(shù)字摘要值。
電子文件完整性檢測(cè),包括:①電子文件數(shù)據(jù)總量檢測(cè):檢測(cè)電子文件歸檔接收信息登記表中文件數(shù)量和大??;②元數(shù)據(jù)完整性檢測(cè):檢測(cè)電子文件元數(shù)據(jù)項(xiàng)是否填寫齊全,具有連續(xù)編號(hào)的目錄數(shù)據(jù)(案卷號(hào)、件號(hào)、文號(hào))是否有漏號(hào);③電子文件內(nèi)容完整性檢測(cè):人工檢測(cè)電子文件對(duì)應(yīng)的實(shí)體內(nèi)容是否齊全完整;④電子文件歸檔信息包完整性檢測(cè):系統(tǒng)自動(dòng)檢測(cè)歸檔信息包中實(shí)際包含的電子文件數(shù)量,以及人工檢測(cè)元數(shù)據(jù)和內(nèi)容數(shù)據(jù)是否存在遺漏或錯(cuò)誤情況。
電子文件可用性檢測(cè)內(nèi)容包括:①元數(shù)據(jù)、目錄數(shù)據(jù)可用性檢測(cè):檢測(cè)電子文件歸檔信息包中存放元數(shù)據(jù)的XML文件或目錄數(shù)據(jù)存放的EXCEL文件是否可以正常解析、讀取數(shù)據(jù);②電子文件內(nèi)容可用性檢測(cè):檢測(cè)電子文件實(shí)體是否可以被正常打開(kāi)和瀏覽;③電子文件歸檔信息包可用性檢測(cè):檢測(cè)電子文件歸檔信息包是否包含非公開(kāi)壓縮算法、是否加密、是否包含不符合歸檔要求的文件格式;④電子檔案內(nèi)容軟硬件環(huán)境監(jiān)測(cè):檢測(cè)電子屬性信息中記錄的軟硬件環(huán)境信息是否符合歸檔要求。
電子文件可靠性檢測(cè),包括:①電子文件歸檔信息包可靠性檢測(cè):系統(tǒng)或人工監(jiān)測(cè)電子文件歸檔信息包是否感染木馬或病毒;②歸檔載體可靠性檢測(cè):系統(tǒng)及人工檢測(cè)載體內(nèi)是否含有非歸檔文件,載體讀寫速度、載體外觀、光盤質(zhì)量;③歸檔過(guò)程可靠性檢測(cè):人工檢測(cè)歸檔信息包在歸檔和保存過(guò)程中是否安全、可控。
2電子檔案管理
2.1電子檔案存儲(chǔ)
在電子檔案管理過(guò)程中,電子檔案存儲(chǔ)方式直接關(guān)系著電子檔案的安全,選擇合適的存儲(chǔ)方式有利于保證電子檔案的真實(shí)、完整、可靠、可用。需要注意的是,不同的業(yè)務(wù)階段電子檔案存儲(chǔ)的作用范圍和技術(shù)要求有所不同,具體而言,在電子文件歸檔時(shí)需使用交換存儲(chǔ),在電子文件在線收集、電子檔案管理、長(zhǎng)期保存和提供利用時(shí)需使用在線存儲(chǔ),在電子檔案長(zhǎng)期保存、電子檔案?jìng)浞輹r(shí)需使用離線存儲(chǔ),各業(yè)務(wù)環(huán)節(jié)存儲(chǔ)要求規(guī)劃如圖3。在線存儲(chǔ)可采用磁盤陣列(SAN)設(shè)備,離線存儲(chǔ)可采用一次性寫入專用移動(dòng)硬盤、磁盤。
電子檔案存儲(chǔ)內(nèi)容應(yīng)包括電子檔案及其元數(shù)據(jù)、電子檔案管理系統(tǒng)及其配置數(shù)據(jù)、日志數(shù)據(jù)等。電子檔案存儲(chǔ)時(shí),應(yīng)在不改變?cè)次募那闆r下自動(dòng)批量轉(zhuǎn)換成PDF、MP3、MP4等長(zhǎng)期保存格式,無(wú)法轉(zhuǎn)換的則應(yīng)以TIFF或JPEG文件格式將紙質(zhì)文件掃描后歸檔。電子檔案的實(shí)體對(duì)象應(yīng)按照“三庫(kù)分離”原則,在系統(tǒng)中實(shí)施分別管理:長(zhǎng)期保存庫(kù)獨(dú)立于電子檔案管理系統(tǒng),用于存放電子檔案長(zhǎng)期保存封裝包;管理庫(kù)用于支持檔案管理員開(kāi)展檔案的檢測(cè)、鑒定、銷毀、統(tǒng)計(jì)、查閱、檢索和編研等業(yè)務(wù)工作;利用庫(kù)則是根據(jù)檔案的開(kāi)放利用屬性、檔案利用者的要求生成多元化的利用庫(kù)。
2.2長(zhǎng)期保存環(huán)節(jié)的“四性”檢測(cè)
電子檔案在長(zhǎng)期保存過(guò)程中,需通過(guò)制定檢測(cè)策略進(jìn)行定期和不定期檢測(cè),檢測(cè)內(nèi)容如圖4所示。檢測(cè)策略設(shè)置主要包括:電子檔案的封裝格式以及電子檔案元數(shù)據(jù)與內(nèi)容數(shù)據(jù)的關(guān)聯(lián)方式、電子檔案的存儲(chǔ)路徑與存儲(chǔ)方式、電子檔案各項(xiàng)檢測(cè)指標(biāo)與檢測(cè)周期等。在未發(fā)生系統(tǒng)更新、數(shù)據(jù)遷移、格式轉(zhuǎn)換等影響電子檔案元數(shù)據(jù)和內(nèi)容數(shù)據(jù)的行為的情況下,只需要對(duì)電子檔案的固化信息進(jìn)行檢測(cè)。反之,則需要進(jìn)行全面檢測(cè),檢測(cè)內(nèi)容包含長(zhǎng)期保存封裝包、電子檔案元數(shù)據(jù)和電子檔案內(nèi)容。在電子檔案長(zhǎng)期保存過(guò)程中,針對(duì)電子檔案所做的檢測(cè)、遷移、格式轉(zhuǎn)換、備份恢復(fù)、提取出庫(kù)應(yīng)記錄在電子檔案管理系統(tǒng)的長(zhǎng)期保存庫(kù)中,并補(bǔ)充到電子檔案的元數(shù)據(jù)中。
3電子檔案利用
電子檔案管理的最終目的是實(shí)現(xiàn)檔案資源的有效利用,充分實(shí)現(xiàn)檔案價(jià)值,為企業(yè)經(jīng)營(yíng)、管理等工作提供服務(wù)。數(shù)字時(shí)代,檔案數(shù)據(jù)資源急劇增加,檔案利用需求日益增長(zhǎng),檔案部門不能僅被動(dòng)地提供檔案查詢、借閱等傳統(tǒng)檔案服務(wù),而是要樹(shù)立現(xiàn)代管理思維,合理運(yùn)用先進(jìn)的信息技術(shù)和龐大的檔案數(shù)據(jù)資源,積極挖掘檔案價(jià)值,發(fā)揮資源優(yōu)勢(shì),主動(dòng)為業(yè)務(wù)發(fā)展服務(wù),努力提高檔案部門在企業(yè)發(fā)展過(guò)程中的角色定位。在此,本文以國(guó)泰君安為例,介紹其在電子檔案利用方面的幾項(xiàng)創(chuàng)新做法。
3.1運(yùn)用大數(shù)據(jù)技術(shù),助力業(yè)務(wù)拓展
近年來(lái),大數(shù)據(jù)在社會(huì)實(shí)踐與理論研究上影響巨大,作為一種數(shù)據(jù)技術(shù),它也被運(yùn)用到各個(gè)行業(yè)和領(lǐng)域中。面對(duì)數(shù)量龐大的檔案資源,檔案部門也可通過(guò)利用大數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)進(jìn)行價(jià)值挖掘、分析預(yù)測(cè)等資源管理,從而發(fā)揮檔案數(shù)據(jù)價(jià)值。為使分析結(jié)果更為準(zhǔn)確,檔案部門可與信息技術(shù)部門合作,將檔案數(shù)據(jù)與底層數(shù)據(jù)進(jìn)行整合,形成海量檔案信息數(shù)據(jù)池。國(guó)泰君安整合了檔案部門與信息技術(shù)部?jī)蓚€(gè)部門的客戶檔案信息資源,并以客戶檔案信息數(shù)據(jù)池為基礎(chǔ),通過(guò)大數(shù)據(jù)技術(shù)、人工智能技術(shù)形成客戶全檔案生命周期圖譜,以時(shí)間軸的方式,完整展現(xiàn)客戶辦理各個(gè)業(yè)務(wù)的時(shí)間,并從多維度對(duì)客戶進(jìn)行賬戶評(píng)級(jí),形成客戶畫像,如圖5所示。客戶全檔案生命圖譜,一方面會(huì)被推送至業(yè)務(wù)前端,助力精準(zhǔn)營(yíng)銷、業(yè)務(wù)拓展;另一方面,也會(huì)通過(guò)公司相關(guān)業(yè)務(wù)系統(tǒng)軟件推送給客戶本人,從收益能力、選股能力、倉(cāng)位控制、盤面感知、風(fēng)險(xiǎn)控制五個(gè)維度為客戶提供全面、專業(yè)的投資分析,從而發(fā)揮檔案利用價(jià)值。
3.2運(yùn)用人臉識(shí)別、簽名比對(duì),協(xié)助風(fēng)險(xiǎn)管控
人臉識(shí)別是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù),用于人員身份確認(rèn),實(shí)現(xiàn)智能預(yù)警,可有效輔助企業(yè)合規(guī)風(fēng)控工作和編研工作。通過(guò)采集特定人員的人臉照片或身份證信息形成面像文件,建立面部特征素材索引庫(kù),將面部特征素材索引庫(kù)中的素材照片進(jìn)行特性化處理,并與數(shù)據(jù)庫(kù)中相關(guān)聲像資料作對(duì)比,找出聲像檔案中含有該面部特征的片段、幀及時(shí)長(zhǎng)等信息,從而在海量的影像中快速找出特定的人物信息。國(guó)泰君安對(duì)于公司內(nèi)部員工與信用業(yè)務(wù)類客戶人臉數(shù)據(jù)的采集,一方面,將特定的人物臉部素材照片信息匹配相關(guān)影像資料,提取相關(guān)片段,應(yīng)用于公司人物、專題等檔案編研;另一方面,將特定人物臉部素材照片信息匹配對(duì)應(yīng)業(yè)務(wù)影像檔案(如客戶視頻)進(jìn)行身份對(duì)比稽核,從而應(yīng)用于業(yè)務(wù)合規(guī)性檢查,協(xié)助風(fēng)險(xiǎn)管控。
簽名比對(duì)是一種通過(guò)對(duì)手寫簽名進(jìn)行分析得出簽名是否由本人書寫的識(shí)別技術(shù),和人臉識(shí)別一樣,也可協(xié)助企業(yè)合規(guī)風(fēng)控工作。通過(guò)提取有效的簽名檔特征信息建立模板庫(kù),包括:簽名的位置、形狀、比劃方向,比劃間的搭配以及偽動(dòng)態(tài)信息等,之后由后臺(tái)引擎對(duì)模板庫(kù)中的簽名檔特征信息進(jìn)行實(shí)時(shí)對(duì)比,比對(duì)任務(wù)結(jié)束后輸出相似度,并通過(guò)接口反饋給前端平臺(tái)。該功能可對(duì)客戶簽名文件進(jìn)行批量對(duì)比發(fā)現(xiàn)可疑的簽名文件,有效協(xié)助合規(guī)、風(fēng)控、審計(jì)等工作的非現(xiàn)場(chǎng)、電子核查開(kāi)展,為公司風(fēng)控稽核工作提供了便捷。
3.3應(yīng)用自然語(yǔ)義分析,實(shí)現(xiàn)智能檢索
在系統(tǒng)查詢時(shí),可能會(huì)因題名不規(guī)范導(dǎo)致表意出現(xiàn)偏差,影響查詢結(jié)果,而自然語(yǔ)義分析能使電子檔案管理系統(tǒng)實(shí)現(xiàn)智能檢索,提高查準(zhǔn)率、查全率,從而提高用戶查詢體驗(yàn)。通過(guò)研發(fā)PIndex全文檢索技術(shù),以中文分詞為核心技術(shù),使用Spider程序?qū)eb頁(yè)面、磁盤文件以及數(shù)據(jù)庫(kù)中文本內(nèi)容三種數(shù)據(jù)源中的數(shù)據(jù)進(jìn)行抓取,再通過(guò)索引服務(wù)建立索引信息,形成分類索引,最終形成完備索引庫(kù)。同時(shí),通過(guò)建立同義詞庫(kù),使索引服務(wù)具備“自主學(xué)習(xí)”能力。例如,當(dāng)要檢索有關(guān)中國(guó)工商銀行檔案時(shí),輸入“工商銀行”“工行”“中國(guó)工商銀行”中的任何一個(gè)關(guān)鍵詞,均可檢索成功,保證查全率。
數(shù)字時(shí)代,電子文件大量產(chǎn)生,對(duì)現(xiàn)代檔案管理帶來(lái)了深刻影響。提高重視并不斷加強(qiáng)電子文件歸檔和電子檔案管理,不僅是時(shí)代發(fā)展的需要,也是提高檔案工作效率和檔案服務(wù)質(zhì)量的重要保障。現(xiàn)階段,有關(guān)電子文件歸檔和電子檔案管理理論研究與實(shí)際應(yīng)用都還存在不足之處,如制度不健全、歸檔電子文件門類不全、提供利用仍舊側(cè)重傳統(tǒng)紙質(zhì)檔案、元數(shù)據(jù)管理有待加強(qiáng)、對(duì)信息資源挖掘效果偏弱、檔案管理系統(tǒng)歸檔接口少等[2]。對(duì)此,企業(yè)應(yīng)樹(shù)立現(xiàn)代管理思維,依托技術(shù)手段和專業(yè)管理,不斷推動(dòng)電子文件歸檔和電子檔案管理邁上新臺(tái)階,充分發(fā)揮檔案資源價(jià)值,更好地服務(wù)于企業(yè)各項(xiàng)業(yè)務(wù)發(fā)展。
參考文獻(xiàn)
[1]李明華.中國(guó)的數(shù)字檔案資源建設(shè)[N].中國(guó)檔案報(bào),2016年9月15日(第3版).
[2]盛曉明,周妍,劉春波,趙杰.我省企業(yè)電子文件歸檔和電子檔案管理試點(diǎn)工作情況[J].黑龍江檔案,2016(3).