■劉各巧
(四川廣播電視大學(xué),四川 成都 610021)
互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,讓當(dāng)前網(wǎng)絡(luò)技術(shù)和各行業(yè)之間的發(fā)展緊密聯(lián)系起來,網(wǎng)絡(luò)技術(shù)的快速發(fā)展,讓檔案管理的信息化日漸成熟。通過對(duì)數(shù)據(jù)處理,實(shí)現(xiàn)行業(yè)的大規(guī)模發(fā)展,這也是大數(shù)據(jù)時(shí)代的特點(diǎn)。當(dāng)數(shù)據(jù)化應(yīng)用在各行業(yè)發(fā)展之中,為行業(yè)的發(fā)展帶來了一定的推動(dòng)力,也推動(dòng)了社會(huì)的發(fā)展。數(shù)據(jù)挖掘技術(shù)在社會(huì)生產(chǎn)領(lǐng)域占據(jù)著重要地位,將數(shù)據(jù)挖掘技術(shù)開展信息化管理,并建立相應(yīng)的網(wǎng)絡(luò)技術(shù),實(shí)現(xiàn)了對(duì)數(shù)據(jù)的分析,取得了一定的價(jià)值。當(dāng)然從數(shù)據(jù)挖掘的檔案信息化管理來說,正處于起步階段,從當(dāng)前的發(fā)展中所面臨的挑戰(zhàn),進(jìn)行針對(duì)性的處理,提升信息技術(shù)在檔案信息管理中的質(zhì)量,從而為數(shù)據(jù)挖掘的發(fā)展奠定基礎(chǔ)。對(duì)數(shù)據(jù)挖掘行業(yè)的發(fā)展來說,通過對(duì)其進(jìn)行信息化、數(shù)據(jù)化的處理,能夠?qū)⒗美碚搶用娴那罢靶院脱芯啃?,為?shù)據(jù)挖掘的發(fā)展創(chuàng)設(shè)更好的發(fā)展前景,也更好地推動(dòng)檔案資料信息化管理[1]。
現(xiàn)如今,是一個(gè)信息爆炸的時(shí)代,面對(duì)紛雜的信息資源,我們需要從中選擇我們所需要的信息資料并對(duì)其進(jìn)行加工處理,形成我們的知識(shí)體系,為行業(yè)發(fā)展服務(wù)??梢哉f,數(shù)據(jù)挖掘技術(shù)是伴隨著互聯(lián)網(wǎng)的發(fā)展。20世紀(jì)80年代的“第十一屆國際聯(lián)合人工智能學(xué)術(shù)會(huì)議”中,人們首次提出“數(shù)據(jù)知識(shí)庫”的概念,讓人們開始發(fā)現(xiàn)數(shù)據(jù)背后隱藏的價(jià)值,數(shù)據(jù)挖掘開始走進(jìn)人們的視野。但是,我國的數(shù)據(jù)挖掘技術(shù)還處于起步階段,面臨著大量的實(shí)際問題需要去解決,才能發(fā)揮其應(yīng)有的價(jià)值,為各行業(yè)發(fā)展服務(wù)。我國檔案的信息化管理基本上從20世紀(jì)80年代開始,到現(xiàn)在形成了大量的數(shù)據(jù),也形成了各類管理形式和各類檔案管理數(shù)據(jù)。就當(dāng)前的檔案管理來說,基本上圍繞著“資料存儲(chǔ)”以及“資料檢索”兩大功能開展,未能真正實(shí)現(xiàn)對(duì)數(shù)據(jù)的挖掘。簡單的數(shù)據(jù)堆砌是對(duì)資源的浪費(fèi),同時(shí)也增加了大量的維護(hù)費(fèi)用。隨著我國信息化的快速發(fā)展,對(duì)檔案管理的認(rèn)識(shí)也逐漸加深,開始探求數(shù)據(jù)資料背后的價(jià)值。對(duì)于檔案的利用也不應(yīng)該停留在表面,而應(yīng)該從檔案資料背后的價(jià)值出發(fā),對(duì)其進(jìn)行深入挖掘,充分利用現(xiàn)有檔案數(shù)據(jù)信息,充分發(fā)揮這些數(shù)據(jù)背后的社會(huì)價(jià)值和經(jīng)濟(jì)價(jià)值。通過數(shù)據(jù)的挖掘,實(shí)現(xiàn)檔案價(jià)值的信息化管理的最大價(jià)值,為我國的社會(huì)主義現(xiàn)代化建設(shè)服務(wù)。實(shí)現(xiàn)對(duì)數(shù)據(jù)深層次的利用和挖掘,便是建立在基本的檔案資料的處理上,需要建立一系列的數(shù)據(jù)挖掘體系和挖掘方式,才能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)的綜合性利用[2]。從我國的數(shù)據(jù)挖掘來說,雖然處于起步階段,但是仍舊取得了一定的成就,隨著當(dāng)前的發(fā)展進(jìn)程的推進(jìn),也將進(jìn)一步推動(dòng)數(shù)據(jù)挖掘技術(shù)的發(fā)展?;ヂ?lián)網(wǎng)上將檔案信息進(jìn)行分類,可以在一些專業(yè)的網(wǎng)站和行業(yè)領(lǐng)袖的博客上等,都能夠看到一些大數(shù)據(jù)信息,這便開始推動(dòng)了當(dāng)前檔案信息化發(fā)展的新內(nèi)容。在一些發(fā)達(dá)國家,早早開始了針對(duì)數(shù)據(jù)挖掘的利用,并取得了一定的成就。我國的檔案信息資料應(yīng)該是建立在檔案信息資料以及數(shù)據(jù)深入挖掘上,使檔案信息管理內(nèi)部各項(xiàng)資源形成聯(lián)系,提升檔案信息管理的效率,讓數(shù)據(jù)挖掘?yàn)闄n案信息化管理服務(wù)。
在實(shí)現(xiàn)對(duì)數(shù)據(jù)資料的挖掘過程中,便是針對(duì)檔案資料的綜合性利用,將其利用的方式和形式進(jìn)一步拓展,實(shí)現(xiàn)這些數(shù)據(jù)背后綜合性價(jià)值。因此,某種程度上來說,要想真正發(fā)揮數(shù)據(jù)挖掘的技術(shù),便是要建立在大量的檔案數(shù)據(jù)的存儲(chǔ)上,只有這樣才能夠?qū)崿F(xiàn)檔案信息資料背后的價(jià)值。數(shù)據(jù)挖掘技術(shù)在發(fā)展過程中,也是人們對(duì)數(shù)據(jù)信息資料的認(rèn)識(shí)加深的過程,是數(shù)據(jù)化時(shí)代發(fā)展的產(chǎn)物[3]??傊?,數(shù)據(jù)挖掘技術(shù)的發(fā)展,必然需要大量的檔案信息資料做出基礎(chǔ),才能夠?qū)⑦@些資料搭建系統(tǒng)化的認(rèn)知結(jié)構(gòu),看到數(shù)據(jù)背后的內(nèi)在聯(lián)系,實(shí)現(xiàn)數(shù)據(jù)的真正價(jià)值。
在檔案發(fā)展的初級(jí)階段,便是對(duì)檔案資料的管理和收集。隨著信息技術(shù)的發(fā)展,我們開始探求這些檔案資料背后的價(jià)值,建立在數(shù)據(jù)挖掘基礎(chǔ)上對(duì)行業(yè)發(fā)展的推動(dòng)作用。可以說,數(shù)據(jù)挖掘技術(shù)的發(fā)展,讓原本的檔案資料的管理脫離了當(dāng)前發(fā)展的限制,讓檔案資料以一種綜合性、立體性的方向呈現(xiàn)在大眾面前,進(jìn)一步提升了檔案的價(jià)值。人們對(duì)檔案數(shù)據(jù)的重視,為原本的檔案計(jì)算機(jī)管理提供了新的發(fā)展方向,人們不再是簡單的數(shù)據(jù)堆砌,而是建立在大量的數(shù)據(jù)研究的基礎(chǔ)上實(shí)現(xiàn)對(duì)行業(yè)發(fā)展的引導(dǎo)作用。通過對(duì)數(shù)據(jù)的深入挖掘分析,讓原本的數(shù)據(jù)資料脫離了框架的制約,以一種新的方式出現(xiàn)在大眾的視野中,也進(jìn)一步推動(dòng)了檔案資料在社會(huì)發(fā)展中的作用[4]??傊瑪?shù)據(jù)挖掘技術(shù)的發(fā)展,讓人們重新審視檔案資料的價(jià)值,以全新的視野認(rèn)識(shí)檔案的發(fā)展。另外,從檔案發(fā)展來說,數(shù)據(jù)挖掘技術(shù)的發(fā)展,讓檔案信息資源更為安全,更好地維護(hù)檔案實(shí)體的利益。檔案人員在利用檔案的過程中,通過這些資料背后的數(shù)據(jù)挖掘,進(jìn)一步提升檔案資料的服務(wù)水平能力,推動(dòng)檔案資料的良性發(fā)展。在針對(duì)數(shù)據(jù)資料的分析過程中,需要對(duì)數(shù)據(jù)資料進(jìn)行深層次的加工處理,能夠在某種程度上減負(fù),實(shí)現(xiàn)圖書館的良性發(fā)展[5]。
不同的人員對(duì)檔案的需求是不一樣的,這也意味著開展數(shù)據(jù)挖掘的方向也是不一樣的。因此,要想真正發(fā)揮數(shù)據(jù)挖掘技術(shù)背后的價(jià)值,便是需要針對(duì)當(dāng)前的檔案資料進(jìn)行信息化的管理,從檔案數(shù)據(jù)的收集、保管、統(tǒng)計(jì)等進(jìn)行細(xì)致的劃分,最大限度實(shí)現(xiàn)對(duì)檔案資料的收集和整理,才能夠真正發(fā)揮檔案資料在數(shù)據(jù)挖掘中的作用。不然再高超的技術(shù)缺乏原有資料也將成為空談,正所謂“無用武之地”。通過對(duì)當(dāng)前檔案資料的信息化處理,通過數(shù)據(jù)倉的管理理念,實(shí)現(xiàn)對(duì)當(dāng)前數(shù)據(jù)資料的整理,通過OLAP等技術(shù)的引入發(fā)揮數(shù)據(jù)背后的價(jià)值。明確數(shù)據(jù)的使用主體,能夠更好地引導(dǎo)檔案信息資料的發(fā)展。搭建針對(duì)性的數(shù)據(jù)倉庫,是建立在用戶體驗(yàn)服務(wù)上的[6]。我們通過對(duì)原有數(shù)據(jù)的挖掘,建立針對(duì)性的數(shù)據(jù)倉,便是要在此基礎(chǔ)上實(shí)現(xiàn)對(duì)數(shù)據(jù)的利用,發(fā)揮其引導(dǎo)、總結(jié)等多方面的作用。當(dāng)然建立明確的數(shù)據(jù)使用主體,其實(shí)也是前置性對(duì)數(shù)據(jù)服務(wù)對(duì)象進(jìn)行分析,確保數(shù)據(jù)挖掘技術(shù)能夠真正發(fā)揮價(jià)值[14]。
檔案資料本身就是在服務(wù)用戶,在當(dāng)前檔案資料的管理中,是對(duì)檔案資料的淺層次利用,是一種被動(dòng)的利用。信息化技術(shù)的發(fā)展,為開展多層次的利用方式奠定了技術(shù)支撐,同時(shí)從人們的觀念發(fā)展來說,也提供相應(yīng)的觀念支撐。所以說,在利用數(shù)據(jù)挖掘技術(shù)中,我們要主動(dòng)發(fā)現(xiàn)用戶規(guī)律,前置性地開展數(shù)據(jù)挖掘,提升服務(wù)質(zhì)量,真正發(fā)揮數(shù)據(jù)挖掘技術(shù)的價(jià)值。通過關(guān)聯(lián)規(guī)律對(duì)檔案資料在部門、級(jí)別、檔案資料等因素的控制,實(shí)現(xiàn)全方位的控制和管理,利用檔案資料和用戶使用之間的規(guī)律,建設(shè)相應(yīng)的服務(wù)體系和方式,落實(shí)“以人為本”的服務(wù)理念。發(fā)現(xiàn)用戶的規(guī)律,要從建立信息化的管理體系出發(fā),針對(duì)當(dāng)前的用戶的使用頻率、內(nèi)容、方式等制定信息化的量表,有著基礎(chǔ)信息的統(tǒng)計(jì),才能夠?yàn)橛脩籼峁┽槍?duì)性的服務(wù)奠定基礎(chǔ)[7]。從用戶需求出發(fā),開展數(shù)據(jù)挖掘,才能夠讓數(shù)據(jù)挖掘真正為用戶服務(wù)。不然停留在理論上的數(shù)據(jù)挖掘也失去了自身的價(jià)值。畢竟數(shù)據(jù)挖掘技術(shù)最終是為用戶服務(wù)的,只有主動(dòng)發(fā)現(xiàn)用戶規(guī)律,才能提升服務(wù)質(zhì)量[9]。
在數(shù)據(jù)挖掘技術(shù)中,數(shù)據(jù)分析的挖掘可以稱之為是大數(shù)據(jù)處理的核心部分。實(shí)際上,傳統(tǒng)信息技術(shù)難以滿足當(dāng)前數(shù)據(jù)處理的需求,這就需要對(duì)傳統(tǒng)的技術(shù)進(jìn)行優(yōu)化升級(jí)。正所謂:“創(chuàng)新,是一個(gè)民族進(jìn)步和發(fā)展的靈魂”。要想充分利用數(shù)據(jù)挖掘技術(shù)提升檔案信息化管理質(zhì)量,便是要針對(duì)當(dāng)前的管理方式和管理技術(shù)進(jìn)行創(chuàng)新,以便更好地滿足社會(huì)發(fā)展的需要。知識(shí)挖掘的組合方法則解決了傳統(tǒng)計(jì)算方法中存在的問題,充分利用多個(gè)分類器的處理結(jié)果,提升處理結(jié)果準(zhǔn)確性和效率,為數(shù)據(jù)挖掘奠定基礎(chǔ)[10]。同時(shí),這種處理方式為數(shù)據(jù)信息的全方位處理提供了技術(shù)支撐,將進(jìn)一步提升數(shù)據(jù)分類的效率以及測試的速度。當(dāng)然技術(shù)的發(fā)展不應(yīng)該是停止不前的,而是隨著時(shí)代的發(fā)展不斷完善和進(jìn)步的,才能夠讓數(shù)據(jù)挖掘技術(shù)在檔案管理中發(fā)揮更大的作用。我國的數(shù)據(jù)挖掘技術(shù)還是處于基礎(chǔ)階段,有著廣闊的發(fā)展前景。因此,數(shù)據(jù)挖掘處理人員應(yīng)該不斷提升自身的技術(shù)和業(yè)務(wù)素養(yǎng),讓技術(shù)的發(fā)展為檔案的利用奠定智力支撐[11]。
將數(shù)據(jù)挖掘技術(shù)應(yīng)用到檔案信息化管理中,其間需要的便是專業(yè)從業(yè)人員將這些信息資料進(jìn)行總結(jié)、歸納和處理。無論是技術(shù)的研發(fā)還是最終資料的整理,都是落實(shí)到專業(yè)人才的基礎(chǔ)上。因此,在發(fā)揮數(shù)據(jù)挖掘技術(shù)的價(jià)值時(shí),應(yīng)該不斷提升從業(yè)人員的專業(yè)素養(yǎng),為數(shù)據(jù)分析處理提供基礎(chǔ)性支撐。首先,按照相應(yīng)的規(guī)定對(duì)檔案資料進(jìn)行信息化管理,掌握核心內(nèi)容,不斷提升管理信息化水平和能力,實(shí)現(xiàn)專人管理,確保整個(gè)檔案資料的可靠性和有效性。對(duì)檔案信息資料進(jìn)行系統(tǒng)的信息化管理,便是真正將檔案管理基礎(chǔ)化管理方式落到實(shí)處,確保了工作開展的合理性。另外,便是設(shè)備資源和人力資源的準(zhǔn)備。在利用大數(shù)據(jù)挖掘技術(shù)的時(shí)候,都對(duì)人才的素養(yǎng)和設(shè)備的質(zhì)量提出了更高的要求。因此,在管理過程中,應(yīng)該加強(qiáng)對(duì)設(shè)備檢驗(yàn),對(duì)一些出現(xiàn)老化的設(shè)備,進(jìn)行及時(shí)的調(diào)整,不斷提升檔案信息化,從而推動(dòng)檔案信息的快速發(fā)展。在數(shù)據(jù)挖掘技術(shù)中,從業(yè)人員始終保持較高的警覺性,能夠?qū)Ξ?dāng)前的信息技術(shù)不斷優(yōu)化升級(jí),讓數(shù)據(jù)挖掘處理技術(shù)更好地為其服務(wù)[7]。
隨著經(jīng)濟(jì)的發(fā)展和科學(xué)技術(shù)的進(jìn)步,計(jì)算機(jī)技術(shù)被廣泛應(yīng)用到社會(huì)各個(gè)領(lǐng)域,促進(jìn)了各行業(yè)的迅速發(fā)展,我國檔案管理系統(tǒng)中就應(yīng)用了基于大數(shù)據(jù)的計(jì)算數(shù)據(jù)挖掘技術(shù),能極大地提高檔案管理系統(tǒng)中的數(shù)據(jù)快速檢索功能。將數(shù)據(jù)挖掘技術(shù)融入到檔案信息處理中,有利于推動(dòng)檔案管理的發(fā)展,同時(shí)也是各行業(yè)發(fā)展的現(xiàn)實(shí)要求[12]。利用數(shù)據(jù)挖掘技術(shù)開展檔案管理,對(duì)檔案中的內(nèi)容進(jìn)行深入挖掘,也提升了檔案管理的信息化水平。但是這也要求在當(dāng)前的檔案管理中,能夠針對(duì)數(shù)據(jù)挖掘提供豐富的基礎(chǔ)性資料,同時(shí)還伴有大量信息技術(shù)處理??傊陂_展檔案信息化管理,確保準(zhǔn)確適用數(shù)據(jù)挖掘技術(shù),需要在確保檔案信息高質(zhì)量管理的同時(shí),不斷創(chuàng)新檔案的管理方式。通過數(shù)據(jù)挖掘資料,建立繁雜數(shù)據(jù)背后的支撐,將數(shù)據(jù)化時(shí)代背景下的檔案資料的價(jià)值得到最大地程度發(fā)揮,推動(dòng)行業(yè)乃至社會(huì)經(jīng)濟(jì)的發(fā)展[9]。