王鳳岐
摘 要 眾所周知,大數(shù)據(jù)時(shí)代已經(jīng)來臨。隨著社會(huì)經(jīng)濟(jì)的迅速發(fā)展,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等技術(shù)快速發(fā)展,人類社會(huì)的信息傳播介質(zhì)和存儲(chǔ)方式發(fā)生了巨大的變化,特別是信息的數(shù)據(jù)量呈現(xiàn)爆炸式增長。據(jù)IDC統(tǒng)計(jì),2011年全球的數(shù)據(jù)產(chǎn)生量達(dá)到了1.8ZB(或1.8萬億GB),企業(yè)及互聯(lián)網(wǎng)數(shù)據(jù)以每年50%的速率在增長。大數(shù)據(jù)時(shí)代,海量的數(shù)據(jù)為研究人類社會(huì)的行為規(guī)律,深度開發(fā)并充分利用數(shù)據(jù)價(jià)值進(jìn)行經(jīng)濟(jì)活動(dòng)提供了科學(xué)依據(jù)。與此同時(shí),個(gè)人隱私信息、企業(yè)商業(yè)機(jī)密數(shù)據(jù)等被泄露、被竊取等現(xiàn)象也時(shí)常發(fā)生。如何實(shí)現(xiàn)大數(shù)據(jù)的安全存儲(chǔ),不被犯罪分子或者有不法目的的人利用,是我們亟待解決的重大課題。本文分析了大數(shù)據(jù)特征,指出了大數(shù)據(jù)安全存儲(chǔ)的現(xiàn)狀和挑戰(zhàn),提出了加強(qiáng)大數(shù)據(jù)安全的措施和方法。
關(guān)鍵詞 大數(shù)據(jù);安全;存儲(chǔ);監(jiān)管
中圖分類號 G2 文獻(xiàn)標(biāo)識碼 A 文章編號 2095-6363(2015)09-0063-01
1 大數(shù)據(jù)及其特征
在(Big data)研究機(jī)構(gòu)Gartner的定義中,“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。維基百科認(rèn)為,大數(shù)據(jù)是指無法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合。
從研究機(jī)構(gòu)給出的定義中,不難發(fā)現(xiàn),大數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)類型多樣、運(yùn)算速度快、價(jià)值含量高等特征。只有準(zhǔn)確掌握了大數(shù)據(jù)的特征,才能為分析大數(shù)據(jù),并實(shí)現(xiàn)大數(shù)據(jù)安全存儲(chǔ)奠定基礎(chǔ)。
1)數(shù)據(jù)容量大。大數(shù)據(jù)時(shí)代,各類智能終端設(shè)備、傳感器和虛擬網(wǎng)絡(luò)設(shè)備一刻不停地在制造各類數(shù)據(jù),數(shù)據(jù)呈現(xiàn)爆炸式增長,數(shù)據(jù)計(jì)算單位已經(jīng)從bit、Byte、KB、MB、GB、TB,一直發(fā)展到了PB、EB、ZB、YB、,甚至是NB、DB,還在一直持續(xù)地高速的增長。某種程度上講,數(shù)據(jù)的增長是人類社會(huì)經(jīng)濟(jì)的不斷發(fā)展的真實(shí)反應(yīng)。據(jù)Gartner預(yù)測,到2020年,全球數(shù)據(jù)量將達(dá)到35ZB,相當(dāng)于80億塊4TB硬盤。
2)數(shù)據(jù)類型多樣。隨著大數(shù)據(jù)時(shí)代不斷發(fā)展,數(shù)據(jù)的種類越來越豐富,數(shù)據(jù)不再是比較單一的二維結(jié)構(gòu)數(shù)據(jù),而是包含了視頻、圖片、音頻、郵件等越來越多的非結(jié)構(gòu)化數(shù)據(jù),并且以每年60%以上的速度迅速增長。
3)運(yùn)算速度快。大數(shù)據(jù)借助云計(jì)算等工具和平臺,增加了數(shù)據(jù)存儲(chǔ)的空間,以數(shù)據(jù)流的形式提高了信息傳輸?shù)男?,通過分布式運(yùn)行系統(tǒng)的處理,使數(shù)據(jù)處理的速度大幅度提高。隨著科技的發(fā)展,數(shù)據(jù)處理的效率會(huì)越來越快,而且能夠篩選出有價(jià)值的信息并進(jìn)行快速分析,進(jìn)一步提高數(shù)據(jù)的時(shí)間價(jià)值。
4)價(jià)值含量高。有人將大數(shù)據(jù)比喻為“信息石油”、“數(shù)據(jù)核能”,大數(shù)據(jù)蘊(yùn)含的巨大能量和使用價(jià)值。大數(shù)據(jù)是國家領(lǐng)導(dǎo)人進(jìn)行決策,制定政策的重要依據(jù),能為國家治理提供科學(xué)的數(shù)據(jù)支持。在現(xiàn)代社會(huì)主義市場經(jīng)濟(jì)競爭中,經(jīng)濟(jì)數(shù)據(jù)的分析與利用正成為企業(yè)競爭的新領(lǐng)地,用戶的使用習(xí)慣、潛在的消費(fèi)需求、傾向性的行為方式等都是有巨大商業(yè)價(jià)值的信息,誰能夠掌握這些數(shù)據(jù)并挖掘到這些信息的價(jià)值,誰就能在競爭中占據(jù)制高點(diǎn)。
2 數(shù)據(jù)存儲(chǔ)安全的途徑與措施
大數(shù)據(jù)能夠?yàn)槠髽I(yè)的商業(yè)競爭提供科學(xué)的基礎(chǔ)數(shù)據(jù),也能為個(gè)人獲取有價(jià)值的信息提供了便利,大數(shù)據(jù)是具有巨大能量的“信息寶庫”,也很容易成為黑客關(guān)注和攻擊的對象,特別是近年來,信息數(shù)據(jù)遭泄露等事件時(shí)有發(fā)生,因此,加強(qiáng)大數(shù)據(jù)存儲(chǔ)安全勢在必行。
1)加強(qiáng)數(shù)據(jù)加密技術(shù)研究與開發(fā)。目前大數(shù)據(jù)都采用虛擬化海量存儲(chǔ)技術(shù)來存儲(chǔ),通過光纖、無線等數(shù)據(jù)流方式實(shí)現(xiàn)數(shù)據(jù)傳輸,在數(shù)據(jù)采集、存儲(chǔ)、分析、傳輸、利用等整個(gè)生產(chǎn)消費(fèi)鏈條中,始終伴隨著數(shù)據(jù)被竊取的風(fēng)險(xiǎn),可以利用SSL(安全套接層協(xié)議層)的方法,加強(qiáng)數(shù)據(jù)流上傳與下載的加密保護(hù),實(shí)現(xiàn)加密后才能上傳,解密后才能使用的功能,確保數(shù)據(jù)的安全存儲(chǔ)與利用。各個(gè)科研院所和生產(chǎn)企業(yè),要加強(qiáng)溝通與交流,不斷探討和研究先進(jìn)的加密技術(shù),為數(shù)據(jù)安全存儲(chǔ)提供堅(jiān)實(shí)的技術(shù)保障。國家已經(jīng)將信息安全上升為國家戰(zhàn)略,并成立了信息化安全小組,下一步應(yīng)更多的出臺鼓勵(lì)性政策、措施,并投入一定的經(jīng)費(fèi)支持,激勵(lì)相關(guān)單位和企業(yè)加大資金投入,積極進(jìn)行技術(shù)創(chuàng)新,提高信息安全存儲(chǔ)的技術(shù)水平。
2)改變數(shù)據(jù)存儲(chǔ)方式,變數(shù)據(jù)集中存儲(chǔ)為分布式存儲(chǔ)。數(shù)據(jù)集中存儲(chǔ)有利于提高數(shù)據(jù)的傳輸和使用效率,但不利于數(shù)據(jù)安全,一旦信息遭遇泄露或破壞,就會(huì)造成無法挽回的損失。采用分布式存儲(chǔ),就是將數(shù)據(jù)信息存在在多臺不同地域、空間內(nèi)相對獨(dú)立的設(shè)備上。首先,緩解了集中存儲(chǔ)對硬件設(shè)備的容量要求,減輕了集中存儲(chǔ)的設(shè)備負(fù)荷,提高了信息分類處理效率。其次,極大地提升了數(shù)據(jù)安全性,如果存儲(chǔ)設(shè)備發(fā)生故障,只可能對部分?jǐn)?shù)據(jù)產(chǎn)生影響,而且可以通過備份數(shù)據(jù)進(jìn)行有效恢復(fù),而不會(huì)造成整個(gè)數(shù)據(jù)庫的癱瘓。如果數(shù)據(jù)被竊取或者人為泄露,只會(huì)對部分用戶造成損失,而不會(huì)給整個(gè)數(shù)據(jù)鏈構(gòu)成威脅,縮小了損失的范圍,降低了危害的程度。再次,要將數(shù)據(jù)的分布式存儲(chǔ)作為強(qiáng)制性措施納入規(guī)范化管理范圍內(nèi),避免個(gè)別不法企業(yè)或個(gè)人為節(jié)約成本而不進(jìn)行分散式存儲(chǔ)。
3)加強(qiáng)存儲(chǔ)設(shè)施設(shè)備與安全標(biāo)準(zhǔn)建設(shè),為數(shù)據(jù)安全存儲(chǔ)提供保障。在激烈的市場競爭中,各大數(shù)據(jù)存儲(chǔ)設(shè)備生產(chǎn)廠家緊緊圍繞“擴(kuò)大數(shù)據(jù)容量、提高信息存儲(chǔ)使用效率”兩大核心指標(biāo)展開激烈競爭,但對數(shù)據(jù)存儲(chǔ)的安全性能關(guān)注不夠,在數(shù)據(jù)存儲(chǔ)安全技術(shù)、設(shè)備數(shù)據(jù)存儲(chǔ)安全性能的研究與生產(chǎn)投入較少,導(dǎo)致數(shù)據(jù)安全存儲(chǔ)設(shè)備的研發(fā)落后于安全形勢需要。國家對于數(shù)據(jù)安全存儲(chǔ)的標(biāo)準(zhǔn)和規(guī)范不夠明確,也不夠完善,對于數(shù)據(jù)存儲(chǔ)廠商的約束和規(guī)范相對較少,導(dǎo)致目前市場上魚目混雜。因此,國家要適時(shí)出臺相關(guān)法律法規(guī),明確數(shù)據(jù)安全存儲(chǔ)設(shè)備的技術(shù)標(biāo)準(zhǔn)和生產(chǎn)、銷售規(guī)范,整頓市場秩序,實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)的“硬件設(shè)備”與“軟件標(biāo)準(zhǔn)”支撐數(shù)據(jù)信息的安全發(fā)展。
4)加強(qiáng)數(shù)據(jù)安全監(jiān)管,打擊網(wǎng)絡(luò)犯罪。加強(qiáng)數(shù)據(jù)安全監(jiān)管與加強(qiáng)數(shù)據(jù)存儲(chǔ)安全的基礎(chǔ)設(shè)施建設(shè)是確保數(shù)據(jù)安全存儲(chǔ)“治標(biāo)”與“治本”的重要舉措。大數(shù)據(jù)種類復(fù)雜,形式多樣,要將數(shù)據(jù)信息進(jìn)行分類監(jiān)管,根據(jù)信息的種類和重要性劃分監(jiān)管的范圍,提高監(jiān)管效率;由于數(shù)據(jù)是基于網(wǎng)絡(luò)虛擬技術(shù)進(jìn)行存儲(chǔ)的,要將數(shù)據(jù)信息的采集、分析、傳輸、利用等全過程都納入監(jiān)管范圍,并明確各個(gè)階段的標(biāo)準(zhǔn)和規(guī)則,確保全覆蓋、無盲點(diǎn),全程保護(hù)數(shù)據(jù)安全;加大網(wǎng)絡(luò)監(jiān)管力量的投入,運(yùn)用法制化思維和法律手段提高網(wǎng)絡(luò)監(jiān)管的權(quán)威性和有效性,不斷提升數(shù)據(jù)存儲(chǔ)安全管理水平。
3 結(jié)論
綜上所述,大數(shù)據(jù)時(shí)代是具有鮮明的時(shí)代特征,是人類社會(huì)發(fā)展的新階段。大數(shù)據(jù)時(shí)代的競爭將是信息數(shù)據(jù)收集、分析、利用的競爭,而數(shù)據(jù)安全,則是大數(shù)據(jù)時(shí)代的競爭和發(fā)展的基礎(chǔ)。只有加大數(shù)據(jù)安全存儲(chǔ)技術(shù)研發(fā)投入,創(chuàng)新數(shù)據(jù)存儲(chǔ)的方式與方法,并加強(qiáng)大數(shù)據(jù)的安全監(jiān)管,才能確保大數(shù)據(jù)的存儲(chǔ)安全,讓大數(shù)據(jù)真正發(fā)揮自身價(jià)值。
參考文獻(xiàn)
[1]孫圣力,鄭志高,王平,等.RTDP系統(tǒng)網(wǎng)絡(luò)體系結(jié)構(gòu)及其關(guān)鍵技術(shù)[C].2013年全國通信軟件學(xué)術(shù)會(huì)議論文集,2013.
[2]朱月霞,侯建光.基于大數(shù)據(jù)的地質(zhì)數(shù)據(jù)存儲(chǔ)與管理研究[C].江蘇省測繪地理信息學(xué)會(huì)2014年學(xué)術(shù)年會(huì)論文集,2014.
[3]韓昱,黃建新,吳桂敏.房地產(chǎn)大數(shù)據(jù)及其信息挖掘體系探討[C].挑戰(zhàn)與展望——大數(shù)據(jù)時(shí)代房地產(chǎn)估價(jià)和經(jīng)紀(jì)行業(yè)發(fā)展論文集,2013.