何艷
摘 要:檔案“數(shù)據(jù)價(jià)值”是一種通過大數(shù)據(jù)技術(shù)處理、挖掘和應(yīng)用而獲得的價(jià)值。運(yùn)用大數(shù)據(jù)技術(shù)對(duì)海量檔案數(shù)據(jù)進(jìn)行存儲(chǔ)、分析,挖掘開發(fā)出新的檔案“數(shù)據(jù)價(jià)值”,為社會(huì)各界多途徑提供利用,將成為大數(shù)據(jù)時(shí)代檔案部門的重要任務(wù)。
關(guān)鍵詞:大數(shù)據(jù);大數(shù)據(jù)時(shí)代;檔案價(jià)值;數(shù)據(jù)價(jià)值;開發(fā)利用
1 基于大數(shù)據(jù)時(shí)代的檔案價(jià)值的新變化
一是隱深性。與可以通過查閱檔案直接獲取的顯性的淺層次的檔案“信息價(jià)值”不同,檔案“數(shù)據(jù)價(jià)值”是隱性的深層價(jià)值,從檔案中無(wú)法直接獲取,只通過大數(shù)據(jù)技術(shù)對(duì)海量檔案數(shù)據(jù)進(jìn)行處理挖掘才能使之顯現(xiàn)出來(lái)。二是關(guān)聯(lián)性。與具有相對(duì)獨(dú)立性的檔案“信息價(jià)值”不同,檔案“數(shù)據(jù)價(jià)值”具有關(guān)聯(lián)性,是通過檔案數(shù)據(jù)共享、交叉復(fù)用后獲取最大的檔案數(shù)據(jù)價(jià)值。三是時(shí)效性。與時(shí)效性較弱的檔案“信息價(jià)值”不同,檔案“數(shù)據(jù)價(jià)值”時(shí)效性要求更強(qiáng),過時(shí)的數(shù)據(jù)分析結(jié)果的應(yīng)用價(jià)值會(huì)大打折扣。四是宏觀性。與微觀層面的檔案“信息價(jià)值”不同,檔案“數(shù)據(jù)價(jià)值”更多體現(xiàn)在宏觀層面,是一種總體數(shù)據(jù)價(jià)值,注重的是數(shù)據(jù)的規(guī)模、完整性、多樣性而不僅僅是絕對(duì)的精準(zhǔn)。
2 大數(shù)據(jù)云計(jì)算環(huán)境下檔案安全研究路徑
2.1 大數(shù)據(jù)云計(jì)算環(huán)境下存在風(fēng)險(xiǎn)的原因
2.1.1 大數(shù)據(jù)技術(shù)的特性導(dǎo)致風(fēng)險(xiǎn)的存在
在當(dāng)前來(lái)看,大數(shù)據(jù)技術(shù)主要具備如下兩個(gè)特性:首先是數(shù)據(jù)量龐大。大數(shù)據(jù)技術(shù)之所以稱之為大數(shù)據(jù)技術(shù)就是因?yàn)槠鋽?shù)據(jù)量龐大,在以往的計(jì)算機(jī)數(shù)據(jù)使用中,所出現(xiàn)的數(shù)據(jù)一般的都是計(jì)算機(jī)內(nèi)部的數(shù)據(jù),或者是局域網(wǎng)中的數(shù)據(jù),這些數(shù)據(jù)是相對(duì)較少的。但是大數(shù)據(jù)技術(shù)中的數(shù)據(jù)不同,它是全世界所有可共享技術(shù)的合集,因此它能夠在一定的程度上代表全世界的網(wǎng)絡(luò)數(shù)據(jù),因此大數(shù)據(jù)的數(shù)據(jù)量舉起龐大。其次是大數(shù)據(jù)的內(nèi)容沒有一個(gè)完整的體系,在當(dāng)前來(lái)看,大數(shù)據(jù)的內(nèi)容都是較為雜亂的,只有具備搜索內(nèi)容的某些特質(zhì)就能夠被收錄其中,成為大數(shù)據(jù)技術(shù)中的收錄內(nèi)容,在這種情況下,大數(shù)據(jù)技術(shù)就是雜亂無(wú)章的?;谶@種情況,就導(dǎo)致一些不法分子按照一定的關(guān)鍵詞將內(nèi)部存在風(fēng)險(xiǎn)的數(shù)據(jù)投入到網(wǎng)絡(luò)之中,當(dāng)有人利用大數(shù)據(jù)技術(shù)的搜索這些關(guān)鍵詞的時(shí)候,這些有風(fēng)險(xiǎn)的數(shù)據(jù)就會(huì)混雜在其中,讓人們的電腦被入侵。
2.1.2 云計(jì)算技術(shù)的特性導(dǎo)致風(fēng)險(xiǎn)的存在
云計(jì)算技術(shù)在當(dāng)前來(lái)看主要分為三個(gè)部分組成:首先是拆分步驟。在傳統(tǒng)的計(jì)算中,都是通過一個(gè)電腦的核心按照每一個(gè)步驟進(jìn)行按部就班的計(jì)算,這種技術(shù)在當(dāng)前來(lái)看是較為緩慢的。但是云計(jì)算不同,它的一個(gè)步驟就是將整個(gè)算式拆成能夠成分的最小結(jié)構(gòu),這樣就能夠讓計(jì)算中樞計(jì)算最簡(jiǎn)單的內(nèi)容。其次是進(jìn)行傳輸計(jì)算,云計(jì)算的計(jì)算中心并不在本機(jī)之中,它是通過網(wǎng)絡(luò)將拆分好的數(shù)據(jù)傳輸?shù)饺舾蓚€(gè)計(jì)算核心中,讓這些計(jì)算核心進(jìn)行計(jì)算。最后是傳輸整合。在每一個(gè)計(jì)算核心計(jì)算完具體的數(shù)據(jù)后,計(jì)算核心會(huì)將單獨(dú)的計(jì)算內(nèi)容發(fā)回到原本的計(jì)算機(jī)中,而計(jì)算機(jī)的任務(wù)就是組合這些內(nèi)容。在一些黑客的攻擊中,通常會(huì)將自己的木馬混雜在這些發(fā)回的信息中,進(jìn)行全面的入侵,但是云計(jì)算技術(shù)是不具備甄別木馬功能的,因此會(huì)導(dǎo)致
風(fēng)險(xiǎn)。
2.2 大數(shù)據(jù)云計(jì)算環(huán)境下檔案安全建設(shè)路徑
2.2.1 在大數(shù)據(jù)技術(shù)的運(yùn)用上增設(shè)電子警察
大數(shù)據(jù)技術(shù)本身最大的缺陷就是不能夠有效的甄別數(shù)據(jù)是否安全,因此就需要進(jìn)行電子警察的建設(shè)。這個(gè)電子警察在當(dāng)前來(lái)看應(yīng)該具備兩個(gè)功能:第一個(gè)功能就是可以快速的發(fā)現(xiàn)大數(shù)據(jù)中的危險(xiǎn)數(shù)據(jù)。這也是電子警察最為核心的部分,其辨別的方式一般應(yīng)該采用殺毒軟件的運(yùn)行原理。這樣才能夠保證大數(shù)據(jù)技術(shù)在得到了危險(xiǎn)數(shù)據(jù)后能夠快速的識(shí)別出來(lái),并發(fā)現(xiàn)危險(xiǎn)的所在。第二個(gè)功能就是防衛(wèi)功能。很多的危險(xiǎn)數(shù)據(jù)在發(fā)現(xiàn)了自身暴露后,一般會(huì)采用強(qiáng)行攻擊的方法,電子警察就要能夠抵擋這些攻擊,然后能夠做出全面的反擊,將危險(xiǎn)的信息進(jìn)行清除,從而保證計(jì)算機(jī)的安全。
2.2.2 在云計(jì)算技術(shù)的運(yùn)用中增設(shè)電子門卡
云計(jì)算技術(shù)中最大的缺陷就在于不能夠有效的發(fā)現(xiàn)信息中的深層次信息。這項(xiàng)技術(shù)本身就是一個(gè)計(jì)算技術(shù),因此也不可能具備這樣的功能。在這種情況下,就應(yīng)該保證云計(jì)算技術(shù)的運(yùn)用中具備電子門卡。這個(gè)電子門卡的功能與電子警察類似,但是功能更加的高級(jí)一些。因?yàn)殡娮娱T卡的作用不僅僅是發(fā)現(xiàn)其中的危險(xiǎn),并清除掉危險(xiǎn)。而且要保證原本正確數(shù)據(jù)不被損壞,這是非常重要的。這樣雖然也會(huì)在一定的程度上犧牲計(jì)算的速度,但是相對(duì)于被入侵而言,是更加劃算的。所以,當(dāng)前大部分的企業(yè)都較為認(rèn)可這種方式,也在積極建設(shè)這種技術(shù)。
3 基于大數(shù)據(jù)時(shí)代的檔案價(jià)值開發(fā)利用
3.1 順應(yīng)時(shí)代要求,樹立“三大”理念
一要樹立“大開放”理念,加強(qiáng)對(duì)館藏檔案“數(shù)據(jù)價(jià)值”的開發(fā)挖掘,并通過傳統(tǒng)與現(xiàn)代傳播技術(shù),主動(dòng)將相關(guān)檔案數(shù)據(jù)信息傳送、推送到相應(yīng)利用者手中,促進(jìn)館藏檔案數(shù)據(jù)信息的有效利用。二要樹立“大檔案”理念,整合檔案資源,注重原始檔案數(shù)據(jù)的獲取、分析和挖掘開發(fā),并運(yùn)用數(shù)學(xué)算法使海量檔案數(shù)據(jù)更加真實(shí)、全面、客觀地反映本地區(qū)政治、經(jīng)濟(jì)、文化、社會(huì)發(fā)展和民風(fēng)民俗等全貌,從而更好地為社會(huì)各方面提供檔案數(shù)據(jù)信息利用服務(wù)。三要樹立“大服務(wù)”理念,以利用者需求為導(dǎo)向,提供“適銷對(duì)路”的檔案數(shù)據(jù)信息服務(wù)產(chǎn)品,為社會(huì)各界借鑒、研究、預(yù)測(cè)、文化、休閑提供更多、更豐富的檔案數(shù)據(jù)信息參考和素材,從而使檔案“數(shù)據(jù)價(jià)值”開發(fā)利用范圍更廣、層次更多。
3.2 增設(shè)機(jī)構(gòu)人員,強(qiáng)化隊(duì)伍建設(shè)
各級(jí)國(guó)家綜合檔案館,尤其是市縣兩級(jí)國(guó)家綜合檔案館,應(yīng)在現(xiàn)有條件允許的情況下,設(shè)立相關(guān)的檔案“數(shù)據(jù)價(jià)值”開發(fā)利用機(jī)構(gòu),配備相應(yīng)人員,充實(shí)檔案“數(shù)據(jù)價(jià)值”開發(fā)利用力量,更好地圍繞黨委、政府工作大局,以人為本,用專門的精力、從專業(yè)的角度,做好檔案“數(shù)據(jù)價(jià)值”開發(fā)利用工作。
4 總結(jié)
“‘大數(shù)據(jù)這個(gè)名詞并不新鮮,早在1980年代,美國(guó)就有人提出了‘大數(shù)據(jù)的概念?!边M(jìn)入21世紀(jì)以來(lái),世界上許多國(guó)家開始關(guān)注大數(shù)據(jù)的發(fā)展、應(yīng)用和研究,“在云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的推動(dòng)下,全球已步入了‘大數(shù)據(jù)時(shí)代?!蹦壳皝?lái)看,我國(guó)大數(shù)據(jù)的理論研究和應(yīng)用研究剛剛起步,學(xué)術(shù)界、企業(yè)界及政府部門對(duì)該領(lǐng)域的重視程度前所未有。本文僅就大數(shù)據(jù)時(shí)代的檔案價(jià)值及其開發(fā)利用問題,進(jìn)行初步探究。
參考文獻(xiàn)
[1]左永艷,王先平,安建梅.“云時(shí)代”下檔案信息資源管理模式探究[J].重慶文理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2014,05.
[2]文雯.大數(shù)據(jù)時(shí)代的檔案工作[J].卷宗,2016,08.