張枝
摘 要:伴隨著大數(shù)據(jù)時(shí)代的到來(lái)和檔案智能化管理的需求,現(xiàn)在的檔案管理中,為了更好的采集信息和檢索整理信息,提高現(xiàn)有的檔案管理水平,大數(shù)據(jù)技術(shù)的應(yīng)用越來(lái)越被各個(gè)領(lǐng)域所重視。隨著計(jì)算機(jī)技術(shù)的成熟,建立檔案管理已存在必要性,檔案管理信息的核心就是大數(shù)據(jù)信息的管理和數(shù)據(jù)挖掘,通過(guò)計(jì)算機(jī)挖掘有效的信息,優(yōu)化檢索程序,最終實(shí)現(xiàn)資源共享,研究基于大數(shù)據(jù)技術(shù)的信息管理挖掘技術(shù),對(duì)于提高檔案管理的合理性以及檢索程序的從簡(jiǎn)化具有重要意義。
關(guān)鍵詞:檔案管理;數(shù)據(jù)挖掘;大數(shù)據(jù)
現(xiàn)在的檔案管理系統(tǒng)中存在一定的弊端,不足以滿足現(xiàn)有的需求,為了提升數(shù)據(jù)的快速查閱和檢索性能,大數(shù)據(jù)技術(shù)應(yīng)用于檔案管理系統(tǒng)走向必然,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于檔案管理中,首先需要構(gòu)建信息的數(shù)據(jù)庫(kù),并對(duì)錄入信息的有關(guān)聯(lián)特征進(jìn)行提取分析,從而建立檔案信息管理系統(tǒng)的閉頻繁項(xiàng)集后綴項(xiàng)表,進(jìn)行大數(shù)據(jù)的數(shù)據(jù)挖掘,計(jì)算機(jī)挖掘技術(shù)挖掘技術(shù)應(yīng)用于檔案管理中,能有效的節(jié)省檢索時(shí)間,優(yōu)化檔案管理流程。
1.大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘已經(jīng)成為信息管理檢索信息的關(guān)鍵,數(shù)據(jù)的產(chǎn)生和收集是信息管理的基礎(chǔ),而數(shù)據(jù)挖掘就是要檢索出信息中隱晦的和未知性的但潛在有用信息的程序化過(guò)程。
提及大數(shù)據(jù)就不得不提到云計(jì)算,二者的關(guān)系密不可分,大數(shù)據(jù)的計(jì)算需要采用分布式架構(gòu),運(yùn)用云計(jì)算綜合進(jìn)行處理,海量信息的分布式數(shù)據(jù)挖掘需要依托云計(jì)算的處理技術(shù)。大數(shù)據(jù)的“大”字并不在于為了掌握龐大的數(shù)據(jù)信息,而是對(duì)所收集的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化的處理,從而提高數(shù)據(jù)的有用性,實(shí)現(xiàn)產(chǎn)業(yè)增值。因此,可以定義大數(shù)據(jù)就是在一定的時(shí)間范圍內(nèi),有效的收集和捕捉信息,運(yùn)用常規(guī)的工具分析和處理集合數(shù)據(jù),是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘具有以下四個(gè)特征:
(1)應(yīng)用性:這是數(shù)據(jù)挖掘區(qū)別于其他交叉學(xué)科的一個(gè)重要特征,數(shù)據(jù)挖掘產(chǎn)生于實(shí)際的生產(chǎn)生活中的應(yīng)用需求,數(shù)據(jù)挖掘中的數(shù)據(jù)來(lái)自于應(yīng)用實(shí)踐,同時(shí)又服務(wù)于應(yīng)用實(shí)踐,將最合理的算法應(yīng)用于實(shí)踐中,并在實(shí)踐中檢驗(yàn)算法的準(zhǔn)確性。
(2)工程性:數(shù)據(jù)挖掘的步驟繁瑣就決定了其工程化的特征,數(shù)據(jù)挖掘不是單一的數(shù)據(jù)分析和應(yīng)用,實(shí)踐其應(yīng)用性的過(guò)程當(dāng)中需要準(zhǔn)確的數(shù)據(jù)管理和準(zhǔn)備,數(shù)據(jù)的處理和轉(zhuǎn)換,以及最后成果的驗(yàn)證和使用的完整過(guò)程。
(3)集合性:一個(gè)具體的應(yīng)用數(shù)據(jù)往往涉及多個(gè)功能,探索分析和關(guān)聯(lián)性探索,分類(lèi)預(yù)測(cè)和聚類(lèi)分析都需要諸多功能的支持,
(4)交叉性:數(shù)據(jù)挖掘更側(cè)重應(yīng)用,這是其區(qū)別其他交叉學(xué)科的重要標(biāo)志,統(tǒng)計(jì)學(xué)和人工智能等學(xué)科都與數(shù)據(jù)挖掘覺(jué)有關(guān)聯(lián)性,也正是學(xué)科之間的關(guān)聯(lián)性為自身的發(fā)展提供了一定的技術(shù)支持。
2.數(shù)據(jù)管理數(shù)據(jù)挖掘中大數(shù)據(jù)現(xiàn)有應(yīng)用問(wèn)題
2.1應(yīng)用深度不足
隨著大數(shù)據(jù)開(kāi)始進(jìn)入人們的視野,人們看到了其對(duì)信息服務(wù)質(zhì)量的有效提升,初步應(yīng)用于檔案管理之中大數(shù)據(jù)也存在一定的不足,首要的問(wèn)題就是現(xiàn)有的應(yīng)用缺乏應(yīng)有的深度,過(guò)分的依賴(lài)數(shù)據(jù)分析而片面的忽視了人的作用,大量的依賴(lài)大數(shù)據(jù)技術(shù)片面的忽視了大數(shù)據(jù)技術(shù)應(yīng)用的最終目的是優(yōu)化服務(wù)。
2.2應(yīng)用技術(shù)水平不足
目前對(duì)于大數(shù)據(jù)技術(shù)掌握的高端人才是社會(huì)上比較緊缺的,大多數(shù)檔案管理人員對(duì)于技術(shù)層面是一知半解的,熟練掌握需要集中培訓(xùn)或者長(zhǎng)時(shí)間熟練,因此在現(xiàn)階段的應(yīng)用中很難達(dá)到預(yù)期的效果,處于探索時(shí)期的應(yīng)用需要得到重視。
2.3應(yīng)用風(fēng)險(xiǎn)評(píng)估不足
大數(shù)據(jù)技術(shù)的應(yīng)用雖然有效的提升了檔案管理的數(shù)據(jù)挖掘水平,但是應(yīng)用的同時(shí)還是有一定的風(fēng)險(xiǎn)的,潛在的安全風(fēng)險(xiǎn)在數(shù)字記憶這個(gè)部分是難免存在的,一旦收到黑客的攻陷,核心數(shù)據(jù)的泄漏是毀滅性的,這樣會(huì)導(dǎo)致檔案的數(shù)據(jù)流失,這會(huì)滋生一系列的問(wèn)題。
3.大數(shù)據(jù)技術(shù)全面應(yīng)用改進(jìn)的必要性
數(shù)據(jù)挖掘中的大數(shù)據(jù)應(yīng)用主要是利用技術(shù)提供信息化的手段,隨著檔案信息數(shù)據(jù)的規(guī)模擴(kuò)大,在對(duì)檔案信息進(jìn)行存儲(chǔ)和查詢(xún)的過(guò)程中,及時(shí)的分析顯得尤為重要,傳統(tǒng)的方式顯然不能滿足現(xiàn)有的需求,海量的數(shù)據(jù)是傳統(tǒng)的方式不能理性處理的,大數(shù)據(jù)通過(guò)云計(jì)算盡性分析,從龐大的數(shù)據(jù)中將其運(yùn)算能力最大程度的發(fā)揮,能從中得出有效的信息結(jié)論,智能化的處理能有效的為檔案的管理提供決策,從而能更好管理檔案,滿足不同層面客戶(hù)不同需求,最終能有效的提升檔案管理的數(shù)據(jù)挖掘水平,優(yōu)化檔案管理的質(zhì)量,因此,大數(shù)據(jù)的應(yīng)用顯得必要性十足。
面對(duì)現(xiàn)有的大數(shù)據(jù)應(yīng)用中的問(wèn)題,我們很容易看到其中的問(wèn)題,但是也不可否認(rèn),大數(shù)據(jù)技術(shù)本身的有點(diǎn)也是十分明顯的,面對(duì)問(wèn)題,我們應(yīng)對(duì)的方式無(wú)非就是最大程度的發(fā)揮其優(yōu)勢(shì),最小化其劣勢(shì),但也不能規(guī)避問(wèn)題,而是應(yīng)該正面理性解決不足?,F(xiàn)有的應(yīng)用水平是必須直視的,檔案管理人員作為管理的主體,必須要有自身意識(shí),大數(shù)據(jù)技術(shù)的應(yīng)用要盡可能的提高數(shù)據(jù)的深度和維度,數(shù)據(jù)量的積累,數(shù)據(jù)挖掘的速度,數(shù)據(jù)的種類(lèi),數(shù)據(jù)的真實(shí)性都需要維度的積累,所說(shuō)的數(shù)據(jù)量的維度指的是,數(shù)據(jù)量的積累的同時(shí)還需要加強(qiáng)對(duì)數(shù)據(jù)的應(yīng)用,這能一定程度上提升數(shù)據(jù)量的深度;數(shù)據(jù)挖掘速度的維度指的利用大數(shù)據(jù)來(lái)提高檔案中數(shù)據(jù)的查找速度,對(duì)檔案進(jìn)行迅速的歸類(lèi)和整合,能有效的對(duì)信息數(shù)據(jù)進(jìn)行挖掘;數(shù)據(jù)種類(lèi)的維度指的是檔案的分類(lèi)合理化,利用軟件有效的處理檔案信息對(duì)數(shù)據(jù)資源進(jìn)行集中分析;數(shù)據(jù)的真實(shí)性維度指的是在冗雜的數(shù)據(jù)當(dāng)中,應(yīng)用大數(shù)據(jù)技術(shù)摒棄信息錄入中的錯(cuò)誤信息,將真正有價(jià)值的信息挖掘出來(lái)。
現(xiàn)有的技術(shù)應(yīng)用水平是備受爭(zhēng)議的,堅(jiān)持大數(shù)據(jù)理念的應(yīng)用,利用大數(shù)據(jù)技術(shù)對(duì)現(xiàn)有的檔案信息進(jìn)行全面的深度挖掘,大量的數(shù)據(jù)技術(shù)能夠建立數(shù)據(jù)檔案庫(kù),同時(shí)要切實(shí)加強(qiáng)數(shù)據(jù)的收集整理工作,在深度分析的基礎(chǔ)上,不斷的擴(kuò)充信息庫(kù)的有效內(nèi)容,這樣能有效的全面的應(yīng)對(duì)服務(wù)過(guò)程中的個(gè)性化的需求。建立智能化的信息平臺(tái)也顯得很有必要性,能更高的豐富檔案庫(kù)的信息。不難發(fā)現(xiàn),在提及大數(shù)據(jù)技術(shù)的時(shí)候,我們提到了云計(jì)算技術(shù),二者之間的關(guān)聯(lián)性不言而喻,因此,云計(jì)算技術(shù)的應(yīng)用也需要與大數(shù)據(jù)做到有效的結(jié)合,云計(jì)算的優(yōu)勢(shì)是在信息數(shù)據(jù)處理中發(fā)揮作用,這是大數(shù)據(jù)產(chǎn)生的重要途徑,云計(jì)算技術(shù)同時(shí)可以作為大數(shù)據(jù)基礎(chǔ)框架建構(gòu)的載體。因此,只有加強(qiáng)云計(jì)算技術(shù)的應(yīng)用才能提升檔案管理服務(wù)端的客戶(hù)體驗(yàn)。云計(jì)算技術(shù)能加強(qiáng)對(duì)大數(shù)據(jù)的分析和預(yù)測(cè),并設(shè)計(jì)出具有針對(duì)性的解決方式,云計(jì)算技術(shù)的應(yīng)用能夠一定程度上對(duì)潛在的風(fēng)險(xiǎn)進(jìn)行分析和處理,再此基礎(chǔ)上能有效的建立風(fēng)險(xiǎn)評(píng)估機(jī)制,從而更好的在檔案管理的過(guò)程中規(guī)避風(fēng)險(xiǎn),避免檔案數(shù)據(jù)流失造成的一些列不必要麻煩。
大數(shù)據(jù)技術(shù)的應(yīng)用已經(jīng)成了當(dāng)今時(shí)代背景下的一個(gè)必然趨勢(shì),因此為了更好促進(jìn)其與檔案管理中的數(shù)據(jù)挖掘就需要我們?cè)跈n案管理中,注重應(yīng)用深度和我維度的拓廣,加強(qiáng)應(yīng)用水平和云計(jì)算技術(shù)的應(yīng)用能有效提升和優(yōu)化檔案管理的數(shù)據(jù)挖掘。
參考文獻(xiàn)
[1]董潔,信息時(shí)代高校人事檔案管理的研究[D],山東大學(xué)2008
[2]喬瑞花,檔案管理在大數(shù)據(jù)背景下面臨的挑戰(zhàn)和對(duì)策分析[J],科技創(chuàng)新,2015
[3]鐘靜,探析大數(shù)據(jù)時(shí)代背景下的檔案管理[J],蘭州世界,2014