国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關于檔案管理方面的數(shù)據(jù)挖掘分析及應用探討

2020-10-21 13:00呼日樂
錦繡·上旬刊 2020年4期
關鍵詞:數(shù)據(jù)挖掘技術檔案管理應用

呼日樂

摘 要:隨著計算機技術的不斷發(fā)展和進步,人們的生活水平質(zhì)量也逐漸提高。檔案管理方面也開始應用計算機行業(yè)的數(shù)據(jù)挖掘技術,來提高檔案管理效率,進而推動檔案管理行業(yè)的發(fā)展。本文將從數(shù)據(jù)挖掘概念及形式入手,分析并探討數(shù)據(jù)挖掘技術在檔案管理方面的應用。

關鍵詞:數(shù)據(jù)挖掘技術;檔案管理;應用

引言

數(shù)據(jù)信息在人們的日常生活中扮演著重要的角色。數(shù)據(jù)可以組成若干事件、物體,甚至能夠組成整個社會。其中,這些事件和物體之間也存在著錯綜復雜的關系,而數(shù)據(jù)挖掘技術便是要從所有數(shù)據(jù)中找到關系所在,并根據(jù)這些關系直接推斷出來一些有價值且能夠直接使用的信息,而非僅僅通過一些片面的數(shù)據(jù)信息進行定論。目前,檔案管理行業(yè)應適應社會發(fā)展,運用數(shù)據(jù)挖掘技術,使人們實時獲取所需信息,提高辦公效率。本文主要對檔案管理方面的數(shù)據(jù)挖掘技術的應用進行探討。

一、數(shù)據(jù)挖掘技術的形式

數(shù)據(jù)挖掘技術的形式分為描述型和預測型。描述型是從現(xiàn)有的數(shù)據(jù)使用描述行為描述出存在的規(guī)則,進而發(fā)掘現(xiàn)有數(shù)據(jù)中更深層次的規(guī)律。預測型是從現(xiàn)有的數(shù)據(jù)中總結(jié)出共同點,同時對未來即將發(fā)生的事件進行預測。在數(shù)據(jù)挖掘技術的應用場景中,通常使用分類法、關聯(lián)法和粗糙集法。

(一)分類法

分類法是數(shù)據(jù)挖掘技術的核心。分類的優(yōu)劣不僅關系著數(shù)據(jù)不同屬性的分析,而且會對數(shù)據(jù)質(zhì)量產(chǎn)生較大的影響。分類法的主要操作流程如下:首先,對數(shù)據(jù)庫中現(xiàn)有的數(shù)據(jù)根據(jù)不同屬性進行分類。其次,對現(xiàn)有數(shù)據(jù)進行訓練集和測試集的劃分,保證訓練量足夠多,而測試量足夠的少。最后,對數(shù)據(jù)進行測試,再根據(jù)不同屬性進行二次分類。

(二)關聯(lián)法

關聯(lián)法在數(shù)據(jù)挖掘技術中不僅能夠?qū)ΜF(xiàn)有數(shù)據(jù)的相關性進行詳細的分析,而且能夠精確描述出相關數(shù)據(jù)。該方法主要流程如下:首先,對現(xiàn)有數(shù)據(jù)進行詳細描述。然后把屬于同一屬性的數(shù)據(jù)結(jié)合,并分析其相同點。這種方法不僅提高了數(shù)據(jù)的準確性,而且提升了整體工作效率。

(三)粗糙集法

粗糙集常用于研究不確定、不精確的知識。該方法在使用過程中需要注意以下幾點:首先,使用前無需關注數(shù)據(jù)準確性。其次,在使用中,即使出現(xiàn)異常數(shù)據(jù),也能夠及時發(fā)現(xiàn),并把處理過程中出現(xiàn)的數(shù)據(jù)干擾降到最低,同時能夠以最快速度總結(jié)數(shù)據(jù)規(guī)律,供查詢者使用。最后,在使用數(shù)據(jù)過程中會存在更大的不確定性,此時用粗糙集方法能夠改善不確定性,提高效率。

二、數(shù)據(jù)挖掘技術在檔案管理方面的應用

目前,在信息高速發(fā)展的社會,所有行業(yè)都追求更加高效、快速的辦公節(jié)奏,檔案信息管理行業(yè)也不例外。通過將數(shù)據(jù)挖掘技術應用到檔案信息管理上,不僅能夠提高效率,改善檔案管理模式,而且能夠充分發(fā)揮檔案管理的價值。接下來將從以下幾個方面來詳細分析數(shù)據(jù)挖掘技術在檔案管理方面的應用。

(一)檔案分類

檔案分類是指將所有檔案按照不同的屬性、功能進行歸類,屬于同一屬性的檔案放在一欄,不屬于該屬性的檔案則放在另外一欄。如果使用人工分類的方法,不僅浪費大量人力物力,還會造成一定的誤差,影響檔案分類的準確性。因此,在檔案分類時可以采用數(shù)據(jù)挖掘技術中的決策樹。該方法能夠?qū)?shù)據(jù)庫的信息進行詳細的分析,總結(jié)出一定的規(guī)則,并按照該規(guī)則對所有檔案進行分類。決策樹的實現(xiàn)步驟如下:首先,構建模型。在現(xiàn)有的數(shù)據(jù)庫中把已經(jīng)完成分類的數(shù)據(jù)篩選出來,對這些數(shù)據(jù)使用數(shù)據(jù)挖掘技術,構建相應的樹模型。其次,運用模型。對上一步中未完成分類的數(shù)據(jù),使用構建的模型進行分類。通過使用決策樹方法,不僅方便查詢者以最快速度找到自身需要的數(shù)據(jù),而且能夠?qū)罄m(xù)添加的數(shù)據(jù)快速歸類。例如,查詢者可以通過注冊個人信息訪問檔案館,同時數(shù)據(jù)挖掘技術將對訪問者所有的瀏覽記錄進行保存與分析,分析訪問者的個人信息、喜好等等,進而推送出訪問者接下來要查詢的檔案。這種方法能夠在保證信息準確性的前提下,提高訪問者的查詢速度和檔案館的服務質(zhì)量。

(二)檔案收集

基于數(shù)據(jù)挖掘技術的檔案收集是指對新的數(shù)據(jù)按照一定的規(guī)則進行對比,如果符合則進行歸入數(shù)據(jù)庫中的已有類別。具體過程如下:首先,建立模型。通過分析數(shù)據(jù)庫中的已有數(shù)據(jù),按照一定的規(guī)則建立模型。其次,使用該模型與新的數(shù)據(jù)進行差異對比,如果測試模型符合上一步建立的數(shù)據(jù)模型,那么將該數(shù)據(jù)放在測試模型中按照一定的規(guī)則進行歸類。例如,檔案管理者在網(wǎng)上發(fā)布課題讓使用者進行調(diào)研,然后把使用者的個人信息以及調(diào)研結(jié)果依次輸入數(shù)據(jù)庫中進行保存。如果后續(xù)有新的調(diào)研小組將調(diào)研情況存入數(shù)據(jù)庫中,數(shù)據(jù)挖掘技術將對該情況進行詳細分析,以提高檔案管理的服務質(zhì)量和準確性。

(三)檔案保留

檔案保留是指,重點關注老員工的檔案,將檔案流失的可能性降到最低。對于企業(yè)來講,培訓新員工通常比聘請老員工付出的代價要高很多。因此,應當采用數(shù)據(jù)挖掘技術,首先把已經(jīng)發(fā)生的檔案流失情況進行收集,其次對所有檔案流失的原因進行匯總并分析,然后針對這種現(xiàn)象采取相應措施,降低檔案流失頻率??傊?,數(shù)據(jù)挖掘技術的應用,能夠讓檔案管理工作更高效、更準確地執(zhí)行,促進檔案管理行業(yè)的快速發(fā)展。

三、結(jié)束語

綜上所述,正是因為有了計算機行業(yè)的快速發(fā)展,檔案管理行業(yè)才能夠應用數(shù)據(jù)挖掘技術,通過使用分類法、關聯(lián)法和粗糙集對檔案實行快速且準確的管理。同時,將數(shù)據(jù)挖掘技術運用在檔案的分類、收集和保留中,能夠提高檔案管理的高效性,而且能推動檔案管理行業(yè)的進一步發(fā)展。

參考文獻

[1]蔣紅健.大數(shù)據(jù)挖掘管理與技術策略在高校檔案館中的應用研究[J].山西檔案,2019(01):61-66.

[2]陳雪燕,于英香.從檔案管理走向檔案數(shù)據(jù)管理:大數(shù)據(jù)時代下的檔案管理范式轉(zhuǎn)型[J].山西檔案,2019(05):24-32.

猜你喜歡
數(shù)據(jù)挖掘技術檔案管理應用
關于企業(yè)檔案管理體制改革的探討
新形勢下檔案管理工作創(chuàng)新探析
新農(nóng)村建設形勢下衛(wèi)生院檔案管理工作探討
檔案管理現(xiàn)代化中檔案管理原理的運用分析
基于Web的數(shù)據(jù)挖掘技術與相關研究
GM(1,1)白化微分優(yōu)化方程預測模型建模過程應用分析
煤礦井下坑道鉆機人機工程學應用分析
氣體分離提純應用變壓吸附技術的分析
會計與統(tǒng)計的比較研究