李芳芳 吳玉龍 米捷 陳成
摘? 要:通過對數(shù)字檔案室建設(shè)過程中實踐經(jīng)驗進行總結(jié),對機關(guān)電子檔案管理過程中元數(shù)據(jù)的分類、元數(shù)據(jù)體系構(gòu)建方面進行分析梳理并為機關(guān)元數(shù)據(jù)庫建設(shè)提供經(jīng)驗借鑒。以自然資源部數(shù)字檔案室建設(shè)為例從形成階段、捕獲方式、實體類型、通用及專用屬性、聚合層次等方面分析元數(shù)據(jù)體系的組成部分,研究機關(guān)電子文件收集與電子檔案管理過程中元數(shù)據(jù)體系構(gòu)建及元數(shù)據(jù)庫建設(shè)的關(guān)鍵環(huán)節(jié)并分析元數(shù)據(jù)在數(shù)字檔案管理過程中的重要作用。
關(guān)鍵詞:元數(shù)據(jù);電子文件;電子檔案;數(shù)據(jù)庫
Abstract: Aims to summarize the practical experience of metadata classification, metadata system and metadata database in the electronic archives management information system. The Digital Archives Office of the Ministry of Natural Resources of China was approved by the National Archives Administration of China as the National Demonstration Digital Archives Office in 2018.Take the Digital Archives Office of the Ministry of Natural Resources of China as an example to analyze the components of the metadata system in terms of forming stage, capture mode, entity type, general and special attributes, aggregation level, etc.. ,Study the key link of metadata system construction and metadata database construction in the process of electronic file collection and electronic archives management, and analyze the important role of metadata in the process of electronic archives management.
Keywords: Metadata; Electronic file; Electronic Archives; Database
隨著機關(guān)辦公自動化及電子政務(wù)建設(shè)的發(fā)展,以及信息技術(shù)在機關(guān)檔案管理工作中的應(yīng)用,電子文件歸檔是檔案管理信息化建設(shè)和數(shù)字檔案室建設(shè)的必然趨勢和發(fā)展方向。元數(shù)據(jù)是指描述電子檔案的內(nèi)容、結(jié)構(gòu)、背景及其整個管理過程的數(shù)據(jù),因此元數(shù)據(jù)是電子文件歸檔的重要內(nèi)容,元數(shù)據(jù)信息可應(yīng)用于電子檔案歸檔、移交、接收、利用以及長期保存數(shù)據(jù)檢測過程中,是實現(xiàn)各個環(huán)節(jié)電子檔案數(shù)據(jù)真實性、完整性、可用性和安全性的重要保障。本文以自然資源部為例,分析機關(guān)電子檔案元數(shù)據(jù)體系的構(gòu)建和組成結(jié)構(gòu),元數(shù)據(jù)在電子檔案管理過程中的作用和實踐經(jīng)驗。
機關(guān)電子檔案元數(shù)據(jù)體系的構(gòu)建與電子檔案類別息息相關(guān),既有傳統(tǒng)的文書、科技、專業(yè)、照片、音像、會計等類別,還有電子郵件、網(wǎng)頁信息以及專業(yè)數(shù)據(jù)庫、空間圖形數(shù)據(jù)等新興的檔案類別。
如何科學合理地設(shè)置各類檔案的元數(shù)據(jù),構(gòu)建機關(guān)電子檔案元數(shù)據(jù)體系,需要綜合考慮各個類別檔案的通用性,形成通用元數(shù)據(jù)項,也要考慮各個類別的特殊性,針對特殊屬性設(shè)置各個類別特有的元數(shù)據(jù)項;同時考慮到檔案收集的方式和環(huán)節(jié)、描述的實體及檔案整理的聚合層次,對各個元數(shù)據(jù)項進行分類聚合,共同形成機關(guān)電子檔案元數(shù)據(jù)體系。[1]元數(shù)據(jù)體系構(gòu)建示意圖如圖1所示。
2.1 按元數(shù)據(jù)的形成階段,可分為電子文件的形成階段、歸檔階段、管理階段。其中形成階段可形成題名、日期、起草人、部門等元數(shù)據(jù),以及審批人、審批部門、審批日期等元數(shù)據(jù),整理歸檔階段可形成檔號、件號、保管期限、移交人員、接收人員、歸檔日期等元數(shù)據(jù),管理階段可形成存儲位置、處置方式、處置日期等元數(shù)據(jù)。
2.2 按元數(shù)據(jù)的捕獲方式分,可分為從移出系統(tǒng)接收、默認賦值、自動捕獲、半自動化賦值、手工錄入等方式。其中從移出系統(tǒng)接收、默認賦值、自動捕獲為主要獲取方式。元數(shù)據(jù)的獲取方式與業(yè)務(wù)流程、功能節(jié)點密切關(guān)聯(lián),應(yīng)在電子檔案管理系統(tǒng)總體設(shè)計時做統(tǒng)籌規(guī)劃。
從移出系統(tǒng)接收是指從原辦公自動化系統(tǒng)與業(yè)務(wù)審批系統(tǒng)接收數(shù)據(jù)時與電子文件同時接收的元數(shù)據(jù),例如電子文件的題名、文號、形成日期在從辦公自動化系統(tǒng)向檔案系統(tǒng)的推送過程中進行接收;默認賦值是指通過系統(tǒng)初始化設(shè)置對諸如全宗號、單位名稱等元數(shù)據(jù)賦值;自動捕獲是指在電子文件接收、掛接或管理過程中對元數(shù)據(jù)信息進行捕獲,例如電子文件格式、大小、分辨率等信息在接收或者導入電子文件的同時進行自動捕獲,電子文件移交、登記、銷毀等業(yè)務(wù)行為元數(shù)據(jù)在業(yè)務(wù)行為發(fā)生的同時進行自動捕獲。
半自動化賦值是指在系統(tǒng)中為元數(shù)據(jù)設(shè)置詞典,用戶通過下拉菜單等形式選擇元數(shù)據(jù)值并賦值,比如保管期限等元數(shù)據(jù)。手工錄入方式主要是針對無法實現(xiàn)自動捕獲的元數(shù)據(jù),由整理人員進行手工著錄,例如在電子文件整理過程中對題名、責任者等信息進行確認和修改的過程需要手工著錄,對歷史檔案中缺失元數(shù)據(jù)需要手工著錄或手工批量錄入。
2.3 按元數(shù)據(jù)實體類型分,可分為文件實體元數(shù)據(jù)、機構(gòu)人員實體元數(shù)據(jù)、業(yè)務(wù)實體元數(shù)據(jù)和實體關(guān)系元數(shù)據(jù)等。其中文件實體元數(shù)據(jù)可分為檔案信息元數(shù)據(jù)、內(nèi)容描述元數(shù)據(jù)、形式特征元數(shù)據(jù)、電子屬性元數(shù)據(jù)、數(shù)字化屬性元數(shù)據(jù)、電子簽名元數(shù)據(jù)、存儲位置元數(shù)據(jù)、權(quán)限管理元數(shù)據(jù)等。以采礦權(quán)登記檔案元數(shù)據(jù)方案為例,表1列出了各類元數(shù)據(jù)的主要元數(shù)據(jù)項:
2.4 按元數(shù)據(jù)的通用屬性分,可分為通用元數(shù)據(jù)和專用元數(shù)據(jù)。通用元數(shù)據(jù)是指各類電子文件都需要設(shè)置的且可獲取的、符合檔案管理一般要求的元數(shù)據(jù),例如:檔號、件號、保管期限、題名、電子文件格式、大小、存儲地址等。專用元數(shù)據(jù)是指針對各個特殊類別特有的元數(shù)據(jù)項,例如:照片檔案專用元數(shù)據(jù)包括攝影者、攝影時間、攝影地點、人物、水平分辨率、垂直分辨率、圖像高度、圖像寬度、色彩空間、設(shè)備制造商、設(shè)備型號等。音像檔案專用元數(shù)據(jù)包括攝錄者、攝錄時間、時間長度、設(shè)備制造商、設(shè)備型號、色彩空間、分辨率、幀率等。
專業(yè)檔案專用元數(shù)據(jù)要依據(jù)專業(yè)檔案的分類,針對各個類別特有的信息確定專用元數(shù)據(jù),例如自然資源專業(yè)檔案中礦產(chǎn)資源管理檔案專用元數(shù)據(jù)包括類別、礦山名稱、礦山地址、許可證號、開采礦種、礦區(qū)面積、開采方式、采礦權(quán)人、生產(chǎn)規(guī)模、礦區(qū)范圍拐點坐標等,建設(shè)用地預(yù)審檔案專用元數(shù)據(jù)包括申請單位、用地規(guī)模、行業(yè)分類、涉及省份、項目代碼、批復(fù)文號等。網(wǎng)頁類電子檔案專用元數(shù)據(jù)包括欄目、網(wǎng)址、發(fā)布時間、發(fā)布單位等。[2]
2.5 按聚合層次分,可分為案卷層元數(shù)據(jù)、文件層元數(shù)據(jù)以及電子文件層元數(shù)據(jù)。按照現(xiàn)有的有關(guān)標準,元數(shù)據(jù)聚合層次分為案卷層和文件層,但是實際管理工作當中,文件層電子文件往往不是由一個單一文件組成,而是由一組文件組成,例如文書類電子文件一件檔案由正文、審批單、定稿、花臉稿以及來文審批單、來文組成,需要針對每一個電子文件描述文件大小、格式等信息。
根據(jù)檔案組件方式,如果是以案卷整理的檔案,需要設(shè)計案卷層元數(shù)據(jù)和文件層元數(shù)據(jù),其中案卷層元數(shù)據(jù)需要列出案卷題名、卷號、檔號、保管期限等案卷信息屬性,文件層元數(shù)據(jù)需要列出文件編號、文件題名、日期等信息。如果是按件整理的檔案,則不需要設(shè)計案卷層元數(shù)據(jù)。
如果文件層的電子文件數(shù)量大于1件,對每個電子文件還要分出電子文件層元數(shù)據(jù),將電子文件的格式、大小、存儲位置等信息列入電子文件層元數(shù)據(jù)。
如前文所述,元數(shù)據(jù)體系是一個復(fù)雜的系統(tǒng),涉及電子文件形成到整理歸檔、檔案管理的各個環(huán)節(jié),因此元數(shù)據(jù)體系的設(shè)計與構(gòu)建需要綜合考慮檔案分類體系,辦公自動化系統(tǒng)、業(yè)務(wù)系統(tǒng)以及檔案管理系統(tǒng)的流程,獲取方式等方面,具體的關(guān)鍵環(huán)節(jié)如下:
3.1 確定機關(guān)檔案分類體系及各類檔案通用元數(shù)據(jù)項、專用元數(shù)據(jù)項。檔案分類體系的確立是實現(xiàn)檔案科學規(guī)范管理的基礎(chǔ),根據(jù)國家有關(guān)要求,自然資源部機關(guān)檔案可分為文書檔案(WS)、專業(yè)檔案(ZY)、照片檔案(ZP)、音像檔案(YX)、網(wǎng)頁檔案(WY)、科技檔案(KJ)、會計檔案(KU)等。其中專業(yè)檔案、科技檔案需要再細化進行分類。根據(jù)檔案分類體系確定通用元數(shù)據(jù)項以及各類別專用元數(shù)據(jù)項,共同構(gòu)成機關(guān)元數(shù)據(jù)體系構(gòu)架。
3.2 在檔案系統(tǒng)中構(gòu)建元數(shù)據(jù)庫實現(xiàn)元數(shù)據(jù)統(tǒng)一配置和管理。在元數(shù)據(jù)庫建設(shè)中需要考慮各元數(shù)據(jù)項設(shè)置規(guī)則,例如數(shù)據(jù)類型、填寫格式、長度限制、編碼規(guī)則、聚合層次、值域、權(quán)限控制等。將元數(shù)據(jù)實體以及實體之間的關(guān)系進行科學設(shè)計,例如業(yè)務(wù)行為實體元數(shù)據(jù)涉及整個擬文、歸檔流程,分別在擬文、簽發(fā)、用印、整理、檢查、接收、移交等環(huán)節(jié)都需要設(shè)置,并且有一定的邏輯先后關(guān)系,以及各業(yè)務(wù)行為之間的關(guān)系。通過設(shè)置完整的元數(shù)據(jù)配置信息和數(shù)據(jù)字典等信息。在檔案的門類管理模塊根據(jù)元數(shù)據(jù)的聚合層次和各類檔案的專有屬性分別針對各類檔案的卷、件層級設(shè)置相應(yīng)的元數(shù)據(jù)項。
3.3 確定元數(shù)據(jù)的獲取方式并逐一細化實現(xiàn)元數(shù)據(jù)規(guī)范填寫。元數(shù)據(jù)完整規(guī)范的收集是元數(shù)據(jù)體系構(gòu)建和元數(shù)據(jù)庫建設(shè)的難點。在元數(shù)據(jù)體系設(shè)計之初需要考慮可獲得性。確定元數(shù)據(jù)體系后,在辦公自動化系統(tǒng)、業(yè)務(wù)系統(tǒng)與檔案系統(tǒng)的設(shè)計和建設(shè)中,系統(tǒng)之間接口開發(fā)以及數(shù)據(jù)收集、整理、掃描過程中逐一落實。例如成文日期元數(shù)據(jù),需要與辦公自動化系統(tǒng)中正文的落款日期一致,捕獲節(jié)點以部發(fā)文為例是在部領(lǐng)導最后一次簽批的節(jié)點進行捕獲。責任者元數(shù)據(jù)的收集需要根據(jù)發(fā)文的文號類別、簽報起草司局在數(shù)據(jù)字典中提前設(shè)置,自動判別和填報,收文的責任者需要在收文登記的環(huán)節(jié)通過辦公自動化系統(tǒng)進行錄入。照片以及掃描件的分辨率、圖像高度、圖像寬度、色彩空間等元數(shù)據(jù)在數(shù)據(jù)整理和數(shù)字化環(huán)節(jié)進行自動捕獲。
隨著電子文件的大量產(chǎn)生,元數(shù)據(jù)方案的確定、捕獲與管理是電子文件歸檔和電子檔案管理中不可缺少的一部分。對于實現(xiàn)電子文件的歸檔和電子檔案的有效管理和利用,完整地記錄電子文件的背景、內(nèi)容、結(jié)構(gòu)等信息,在保障電子文件的真實性、完整性、可靠性和可用性等方面發(fā)揮著重要作用。[3]
4.1 元數(shù)據(jù)為電子文件的重要組成部分。電子檔案與傳統(tǒng)載體檔案的一個重要區(qū)別就在于,電子檔案既包括電子文件又包括描述電子文件的一系列元數(shù)據(jù)。元數(shù)據(jù)隨著電子文件生成而生成,伴隨著電子文件流轉(zhuǎn)、歸檔和管理的各個環(huán)節(jié),是電子檔案不可或缺的組成部分。
4.2 元數(shù)據(jù)是電子檔案規(guī)范管理的保障。電子檔案管理的過程中,收集階段除了要完成電子文件收集外,還要完成元數(shù)據(jù)的捕獲與收集。傳統(tǒng)載體檔案整理需要編制目錄,目錄數(shù)據(jù)可以理解為元數(shù)據(jù)的一部分,電子檔案的元數(shù)據(jù)信息在傳統(tǒng)載體檔案目錄的基礎(chǔ)上進行擴充,在檔案鑒定、整理、歸檔等管理環(huán)節(jié),元數(shù)據(jù)作為重要的基礎(chǔ)數(shù)據(jù),是現(xiàn)實電子檔案規(guī)范管理的重要依據(jù)。
4.3 元數(shù)據(jù)為四性檢測的信息來源和依據(jù)。電子檔案歸檔規(guī)程中需要進行四性檢測,分別檢測電子檔案的真實性、完整性、可靠性和可用性。元數(shù)據(jù)檢測為四性檢測的重要內(nèi)容,四性檢測的實現(xiàn)主要通過對各類元數(shù)據(jù)信息內(nèi)容的檢測進行實現(xiàn)。由于電子文件的可復(fù)制、可修改等特性,與電子文件伴生的能夠說明電子文件性質(zhì)的元數(shù)據(jù)是證明電子文件真實性的重要依據(jù),包括電子文件產(chǎn)生時的電子文件自身屬性、技術(shù)環(huán)境等。
4.4 元數(shù)據(jù)是電子檔案數(shù)據(jù)查詢檢索、編研利用的基礎(chǔ)。電子檔案利用過程中,對元數(shù)據(jù)的檢索是實現(xiàn)電子檔案查詢與利用的基礎(chǔ)功能,對文件名稱、文號、機構(gòu)、年度以及檔號等信息填寫完整和規(guī)范是實現(xiàn)快速準確檢索的基礎(chǔ)。同時電子檔案的統(tǒng)計編研分析利用也是基于結(jié)構(gòu)化的元數(shù)據(jù)信息實現(xiàn)的,需要各類檔案元數(shù)據(jù)的設(shè)計與填寫齊全完整規(guī)范。
5 機關(guān)電子檔案元數(shù)據(jù)體系及元數(shù)據(jù)庫建設(shè)幾點體會
首先,各類檔案元數(shù)據(jù)體系的設(shè)計與構(gòu)建是元數(shù)據(jù)庫建設(shè)的前提條件。需要針對各個類別的檔案從電子文件形成開始,到整理、歸檔整個流程進行分析研究。電子文件起草單位和人員、審批流程、整理者、歸檔信息等元數(shù)據(jù)都需要收集,明確各個環(huán)節(jié)的元數(shù)據(jù)項和獲取方式,制定元數(shù)據(jù)標準體系框架,作為電子文件歸檔和電子檔案管理的重要內(nèi)容和依據(jù)。
其次,元數(shù)據(jù)收集齊全完整,有助于電子文件歸檔與電子檔案的規(guī)范高效管理。例如,文書檔案稿本信息元數(shù)據(jù)的收集,包括正文、定稿、花臉稿等各類稿本,這些信息收集齊全可以實現(xiàn)利用系統(tǒng)自動化判別文檔是否收集齊全完整,排序是否規(guī)范等,大大減少了檔案工作人員的工作量。業(yè)務(wù)行為元數(shù)據(jù)的收集,對于檔案是由誰、在什么時間整理、登記、歸檔、移交等行為進行詳細記錄,可以實現(xiàn)電子檔案全流程電子化管理與歷史追溯。
最后,元數(shù)據(jù)中對內(nèi)容的描述信息,特別是對各類專業(yè)檔案內(nèi)容的描述進一步細化、分類合理對檔案的利用和編研工作的開展非常重要。各類業(yè)務(wù)檔案需要檔案人員和業(yè)務(wù)人員一起,認真分析研究提出針對各類業(yè)務(wù)檔案重要的、專有的元數(shù)據(jù)項。例如礦業(yè)權(quán)登記檔案設(shè)立礦山名稱、礦山坐標、所屬省份、開采礦種、礦區(qū)面積、生產(chǎn)規(guī)模等元數(shù)據(jù)項,能夠?qū)窈髾n案利用、統(tǒng)計分析和編研提供豐富的內(nèi)容,進一步對行政管理與政策研究提供支撐與服務(wù)。
[1]陶水龍.電子文件和電子檔案元數(shù)據(jù)分類與方案設(shè)計[J].檔案學研究,2016(6),83-90
[2]田雷.電子文件元數(shù)據(jù)分類與方案設(shè)計對策研究[J].中國檔案,2017(4),62-63
[3]毛海帆.電子檔案元數(shù)據(jù)方案設(shè)計與應(yīng)用初探[J].檔案學研究,2010(1),74-78