国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于檔案元數(shù)據(jù)內(nèi)容的電子文件自動(dòng)鑒定

2014-10-30 12:06:56尚珊苗媛
檔案管理 2014年6期
關(guān)鍵詞:元數(shù)據(jù)電子文件檔案

尚珊+苗媛

摘 要:本文通過(guò)對(duì)現(xiàn)有的電子文件鑒定成果進(jìn)行梳理,指出電子文件自動(dòng)鑒定的必要性。為了使電子文件自動(dòng)鑒定結(jié)果更準(zhǔn)確,筆者以元數(shù)據(jù)內(nèi)容為切入點(diǎn)設(shè)計(jì)了電子文件保管期限自動(dòng)鑒定的元數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)中收錄了不同保管期限的元數(shù)據(jù)項(xiàng)目,在此基礎(chǔ)上,提出一些鑒定規(guī)則對(duì)自動(dòng)鑒定進(jìn)行規(guī)約,期望能最大限度實(shí)現(xiàn)鑒定的準(zhǔn)確性和自動(dòng)化。

關(guān)鍵詞:檔案; 元數(shù)據(jù); 電子文件; 保管期限; 自動(dòng)鑒定

1 電子文件鑒定研究綜述

隨著電子文件的出現(xiàn)及其對(duì)傳統(tǒng)紙質(zhì)檔案鑒定理論的沖擊,國(guó)內(nèi)外許多學(xué)者對(duì)電子文件的鑒定理論進(jìn)行了研究。劉越南認(rèn)為電子文件自動(dòng)鑒定的方法是在系統(tǒng)中納入并維護(hù)電子文件保管期限表。[1]于慧敏提出可以根據(jù)機(jī)關(guān)或部門的職能重要程度編寫程序由系統(tǒng)自動(dòng)鑒定,自動(dòng)給文件保管期限。[2]譚琤培和章丹指出要建立元數(shù)據(jù)系統(tǒng)與制定元數(shù)據(jù)標(biāo)準(zhǔn),通過(guò)系統(tǒng)自動(dòng)記錄與手工記錄獲取檔案元數(shù)據(jù)。[3]由于電子文件的迅速增長(zhǎng),關(guān)于電子文件鑒定的迫切性在業(yè)內(nèi)已經(jīng)達(dá)成了共識(shí),而大家期盼的最理想的目標(biāo)是對(duì)電子文件實(shí)行自動(dòng)鑒定。從綜述看現(xiàn)有的理論研究并未達(dá)成共識(shí),沒有形成電子文件自動(dòng)鑒定相對(duì)成熟的理論體系,需要相關(guān)研究不斷地總結(jié)與完善。目前的研究成果大都集中在電子文件鑒定內(nèi)容、程序、方法、原則等宏觀方面的研究,缺乏微觀方面的研究。

對(duì)電子文件的鑒定主要包括價(jià)值鑒定和保管期限的鑒定。價(jià)值鑒定十分復(fù)雜,需要考慮的內(nèi)容很多,而且容易受鑒定者的主觀影響,因此本文對(duì)價(jià)值鑒定不做過(guò)多的闡述。檔案的鑒定同樣可以通過(guò)保管期限來(lái)完成,在實(shí)際鑒定保管期限時(shí),目前還是參照國(guó)家檔案局出臺(tái)的文書檔案保管期限表進(jìn)行判斷,由于保管期限表?xiàng)l款劃分過(guò)粗、加之人為的因素或者判斷標(biāo)準(zhǔn)不統(tǒng)一的情況,使得電子文件的保管期限判斷不夠準(zhǔn)確。筆者試圖從電子文件的部分元數(shù)據(jù)內(nèi)容入手來(lái)判斷電子文件的保管期限。

本文以元數(shù)據(jù)為切入點(diǎn),主要采用在文獻(xiàn)調(diào)查的基礎(chǔ)上,通過(guò)統(tǒng)計(jì)方法構(gòu)建元數(shù)據(jù)庫(kù),將元數(shù)據(jù)內(nèi)容信息作為電子文件保管期限自動(dòng)鑒定的依據(jù)。筆者通過(guò)選取文件標(biāo)題、主題詞這兩個(gè)能反映文件全貌的元數(shù)據(jù)內(nèi)容項(xiàng)目進(jìn)行了實(shí)證分析,對(duì)自動(dòng)鑒定結(jié)果進(jìn)行了驗(yàn)證。

2 電子文件元數(shù)據(jù)庫(kù)的內(nèi)容創(chuàng)建

元數(shù)據(jù)是指描述文件背景、內(nèi)容、結(jié)構(gòu)及其整個(gè)管理過(guò)程的數(shù)據(jù)。檔案元數(shù)據(jù)描述的內(nèi)容有以下三方面:(1)內(nèi)容信息:如標(biāo)題、檔號(hào)、分類號(hào)、主題詞等;(2)結(jié)構(gòu)信息:如段落層次、文體、發(fā)(收)文者等;(3)背景信息:如形成文件的機(jī)構(gòu)及其職能、業(yè)務(wù)活動(dòng)等。[4]通過(guò)觀察,檔案元數(shù)據(jù)描述的內(nèi)容中除了文件標(biāo)題和主題詞能反映文件全貌,其他元數(shù)據(jù)項(xiàng)目難以用來(lái)判斷一份文件的保管期限。因此本文只選用了文件標(biāo)題和主題詞這兩個(gè)項(xiàng)目來(lái)判斷一份電子文件的保管期限。適當(dāng)?shù)那闆r下,在判斷保管期限時(shí),還可以加入責(zé)任者項(xiàng)目。

為了使電子文件自動(dòng)鑒定具有可操作性,筆者根據(jù)國(guó)家檔案局發(fā)布的第10號(hào)令《企業(yè)文件材料歸檔范圍和檔案保管期限規(guī)定》,將其中涉及的元數(shù)據(jù)內(nèi)容抽取出來(lái),該元數(shù)據(jù)庫(kù)要嵌入檔案管理系統(tǒng)自動(dòng)鑒定模塊中。部分元數(shù)據(jù)庫(kù)如表1所示:

表格說(shuō)明:

(1)一級(jí)標(biāo)識(shí)限定了電子文件的內(nèi)容方向,二、三、四級(jí)標(biāo)識(shí)隸屬于一級(jí)標(biāo)識(shí),只有同時(shí)滿足一級(jí)標(biāo)識(shí)、二級(jí)標(biāo)識(shí)、三級(jí)標(biāo)識(shí)或四級(jí)標(biāo)識(shí)才能判斷某份電子文件的保管期限。

(2)由于政策的變化,長(zhǎng)期、短期、永久劃分沒有絕對(duì)的標(biāo)準(zhǔn),各單位依據(jù)自身具體情況,參照國(guó)家檔案局出臺(tái)的保管期限劃分等相關(guān)規(guī)定進(jìn)行區(qū)分,短期可能是3年、5年、10年或15年不等,長(zhǎng)期可能是15年或30年不等。

3 電子文件自動(dòng)鑒定規(guī)則、流程與實(shí)例

3.1 電子文件自動(dòng)鑒定規(guī)則。要使電子文件實(shí)現(xiàn)自動(dòng)鑒定,只有元數(shù)據(jù)庫(kù)是不夠的,還需要一些規(guī)則對(duì)其進(jìn)行規(guī)約,筆者歸納出以下鑒定規(guī)則:

3.1.1 元數(shù)據(jù)庫(kù)中的元數(shù)據(jù)項(xiàng)目彼此之間存在從屬或并列的關(guān)系,因此在設(shè)計(jì)數(shù)據(jù)庫(kù)的時(shí)候,要把元數(shù)據(jù)項(xiàng)目之間的這種關(guān)系表達(dá)清楚,能提高自動(dòng)鑒定的準(zhǔn)確度。如下所示:

1 黨政企事業(yè)單位設(shè)立、變更、解散

1.1 籌辦申請(qǐng)、設(shè)立申請(qǐng)、批準(zhǔn)設(shè)立 永久

表中內(nèi)容是永久元數(shù)據(jù)庫(kù)中的項(xiàng)目,一級(jí)標(biāo)識(shí)是代表黨政企事業(yè)單位在設(shè)立、變更或解散過(guò)程中形成的文件材料;二級(jí)標(biāo)識(shí)是代表在滿足一級(jí)標(biāo)題的情況下,如果涉及籌辦申請(qǐng)、設(shè)立申請(qǐng)和批準(zhǔn)設(shè)立的文件要永久保存。每一級(jí)標(biāo)識(shí)里的元數(shù)據(jù)之間是并列的關(guān)系,而上一級(jí)標(biāo)識(shí)和下一級(jí)標(biāo)識(shí)之間是從屬的關(guān)系。

3.1.2 當(dāng)判斷一份歸檔文件的保管期限時(shí),系統(tǒng)自動(dòng)從檔案著錄系統(tǒng)中提取專業(yè)人員擬定的主題詞、文件標(biāo)題等元數(shù)據(jù),然后與元數(shù)據(jù)庫(kù)進(jìn)行匹配,可以設(shè)置精確匹配、模糊匹配、前向匹配等多種匹配方法。

3.1.3 當(dāng)抽取的電子文件元數(shù)據(jù)與元數(shù)據(jù)庫(kù)進(jìn)行匹配時(shí),匹配的內(nèi)容之間可能存在同一關(guān)系、同涵關(guān)系、包含關(guān)系、參照關(guān)系。因此從電子文件中抽取元數(shù)據(jù)的時(shí)候要依據(jù)概念關(guān)聯(lián)規(guī)則,尋求蘊(yùn)含關(guān)系,力求匹配準(zhǔn)確和全面。

3.1.4 如果匹配記錄為0的話,就需要相關(guān)檔案專業(yè)人員結(jié)合國(guó)家檔案局對(duì)電子文件保管期限的相關(guān)規(guī)定確定該元數(shù)據(jù)項(xiàng)目的保管期限,并參照表1及時(shí)將新增加的元數(shù)據(jù)添加到元數(shù)據(jù)庫(kù)中。

3.1.5 在檔案管理系統(tǒng)中設(shè)定歸檔電子文件到期自動(dòng)檢測(cè)功能,根據(jù)電子文件歸檔時(shí)間和保管期限,將到期的電子文件篩選出來(lái)以方便檔案人員對(duì)其鑒定。

3.1.6 標(biāo)題相同的兩份文件,在添加和刪除的時(shí)候,可以根據(jù)責(zé)任者、主題詞、文件形成時(shí)間等其他元數(shù)據(jù)項(xiàng)目進(jìn)行判斷,以防重復(fù)添加或誤刪重要文件。

3.1.7 通過(guò)對(duì)抽取出來(lái)的元數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)大部分元數(shù)據(jù)的詞性均為動(dòng)詞或名詞,因此在抽取詞匯的時(shí)候,首先應(yīng)當(dāng)過(guò)濾掉名詞與動(dòng)詞以外的詞匯,以減少計(jì)算的復(fù)雜度。此外,考慮到抽取出來(lái)的元數(shù)據(jù)還有一少部分是副詞詞性,主要有重大、重要和一般三種。鑒于此,筆者認(rèn)為需要編一個(gè)例外詞庫(kù),將這三個(gè)副詞分別標(biāo)明代碼為1,2,3。對(duì)于某些三級(jí)、四級(jí)標(biāo)識(shí)中的一般、重要以及二級(jí)標(biāo)識(shí)中重復(fù)的詞可以放到例外詞庫(kù)中,減少重復(fù)判斷的次數(shù)。將一、二、三級(jí)標(biāo)識(shí)中不重復(fù)的名詞和動(dòng)詞放入元數(shù)據(jù)詞庫(kù)中。當(dāng)判斷一份電子文件的保管期限時(shí),將抽取出來(lái)的關(guān)鍵詞與元數(shù)據(jù)詞庫(kù)和例外詞庫(kù)中的詞進(jìn)行匹配即可。

3.1.8 對(duì)于事先有保管期限的電子文件,當(dāng)自動(dòng)鑒定完成后,要將自動(dòng)鑒定結(jié)果和原有的保管期限進(jìn)行匹配。如果匹配結(jié)果不一致,系統(tǒng)將文件的保管期限修正為自動(dòng)鑒定保管期限。

3.1.9 規(guī)則說(shuō)明:例如,表中15.2.10職工培訓(xùn),一般的為短期保存,重要的為永久保存;15.5綜合治理工作一般的為長(zhǎng)期保存,重要的為永久保存。此外表中二級(jí)標(biāo)識(shí)中多次出現(xiàn)通知、請(qǐng)示、批復(fù)、報(bào)告、總結(jié)、決議、決定等詞語(yǔ),可以將其放入例外詞庫(kù)中。

3.2 電子文件自動(dòng)鑒定流程。將表征電子文件內(nèi)容的元數(shù)據(jù)項(xiàng)目抽取出來(lái),如:文件題名、主題詞、責(zé)任者等項(xiàng)目。然后判斷鑒定模塊中的元數(shù)據(jù)庫(kù)中是否存在該元數(shù)據(jù),若存在,則進(jìn)行匹配;若不存在,則人工判斷該元數(shù)據(jù)是否需要添加到元數(shù)據(jù)庫(kù)中。流程如圖1所示:

3.3 電子文件自動(dòng)鑒定實(shí)例。為了證明該方法的合理性和易操作性,筆者選取了部分電子文件,來(lái)驗(yàn)證該方法的可行性。筆者以建國(guó)后山西省×××局部分檔案為例進(jìn)行說(shuō)明,如表2所示:

由表2可以看出第5份和第7份文件保管期限的鑒定結(jié)果與原有的不符,究其原因可能是鑒定人員缺乏相應(yīng)的專業(yè)理論知識(shí)、各組織單位為了豐富館藏、領(lǐng)導(dǎo)對(duì)檔案鑒定工作不重視,等等。對(duì)于新產(chǎn)生的電子文件,可通過(guò)將元數(shù)據(jù)庫(kù)嵌入檔案管理系統(tǒng)中一次完成保管期限的鑒定。總的來(lái)說(shuō),該方法具有很強(qiáng)的適用性和準(zhǔn)確性。

4 電子文件自動(dòng)鑒定的實(shí)施

筆者認(rèn)為電子文件鑒定需要經(jīng)過(guò)三個(gè)步驟:事前鑒定、事中鑒定和事后鑒定。

4.1 事前鑒定。對(duì)原有的電子文件,首先由各職能部門檔案人員對(duì)其進(jìn)行初次鑒定;若是新產(chǎn)生的電子文件,直接轉(zhuǎn)到第二步。

4.2 事中鑒定。當(dāng)電子文件由部門傳輸?shù)絻?nèi)部檔案室時(shí),需要檔案室人員對(duì)其進(jìn)行二次鑒定。對(duì)于原有的電子文件,為了避免人為判斷造成的影響,要使用檔案管理系統(tǒng)中的元數(shù)據(jù)庫(kù)對(duì)其進(jìn)行自動(dòng)鑒定,來(lái)修正保管期限。對(duì)新產(chǎn)生的電子文件直接使用自動(dòng)鑒定模塊來(lái)確定保管期限。此外,檔案人員應(yīng)對(duì)電子文件自動(dòng)鑒定過(guò)程進(jìn)行記錄和實(shí)時(shí)監(jiān)控,以防設(shè)備出現(xiàn)異常。

4.3 事后鑒定。為了減輕檔案管理系統(tǒng)的負(fù)荷量,當(dāng)電子文件到期后,檔案人員應(yīng)該使用元數(shù)據(jù)庫(kù)重新判斷到期電子檔案是否需要繼續(xù)保管,如果需要,保管期限是什么。對(duì)于沒有保存價(jià)值的到期檔案,檔案人員應(yīng)該做好銷毀記錄,將需要銷毀的電子檔案導(dǎo)出到銷毀清單中,經(jīng)領(lǐng)導(dǎo)和各部門同意后方可進(jìn)行銷毀。

參考文獻(xiàn)

[1]劉越南.關(guān)于檔案價(jià)值鑒定的理論與實(shí)踐(五) ——對(duì)電子文件鑒定問(wèn)題的思考[J].檔案學(xué)通訊,2001(5).

[2]于慧敏.國(guó)外電子文件的鑒定理論分析及啟示[J].蘭臺(tái)世界,2003(3).

[3]譚琤培,章丹.檔案元數(shù)據(jù)在電子文件鑒定中的運(yùn)用——元數(shù)據(jù)研究之三[J].浙江檔案,2002(6).

[4]馮惠玲主編.電子文件管理教程[M].中國(guó)人民大學(xué)出版社.

(作者單位:山西大學(xué)經(jīng)濟(jì)與管理學(xué)院 來(lái)稿日期:2014-07-18)

猜你喜歡
元數(shù)據(jù)電子文件檔案
基于來(lái)源的組織機(jī)構(gòu)元數(shù)據(jù)構(gòu)建研究
檔案管理(2017年1期)2017-01-17 19:09:04
電子文件檢查歸檔移交備份存儲(chǔ)機(jī)研究
淺談電子文檔與紙質(zhì)文檔在保護(hù)技術(shù)上的差異
元數(shù)據(jù)與社會(huì)化標(biāo)簽在微視頻搜索中的應(yīng)用
高等院校智慧校園建設(shè)規(guī)劃與實(shí)現(xiàn)
檔案管理中電子文件的存儲(chǔ)探究
淺談電子文件的全過(guò)程管理
如何做好鄉(xiāng)鎮(zhèn)計(jì)劃生育檔案管理工作
檔案的開發(fā)利用在供電公司全面管理中的作用
淺談北京衛(wèi)視《檔案》的敘述方式
新聞世界(2016年10期)2016-10-11 20:31:45
福建省| 海南省| 东港市| 商丘市| 广宁县| 黑山县| 贵定县| 永年县| 梁平县| 古浪县| 鄂州市| 施甸县| 平潭县| 祁阳县| 衡阳市| 黎平县| 资阳市| 塘沽区| 容城县| 东乌| 华容县| 鹤壁市| 福清市| 建昌县| 平凉市| 民县| 崇仁县| 舟山市| 大港区| 汝阳县| 肃南| 蕲春县| 武清区| 永春县| 昔阳县| 永福县| 克拉玛依市| 乳山市| 绥宁县| 永修县| 浏阳市|