劉錚 李春亮
摘 要:“棱鏡門”事件讓我們清醒地認(rèn)識(shí)到了大數(shù)據(jù)對(duì)于信息安全所帶來的巨大威脅。文章針對(duì)大數(shù)據(jù)的特征,詳細(xì)分析了大數(shù)據(jù)內(nèi)涵概念,并反思了大數(shù)據(jù)環(huán)境下信息安全所面臨的主要的安全威脅以及相應(yīng)的應(yīng)對(duì)策略。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)價(jià)值;數(shù)據(jù)安全
大數(shù)據(jù)的特殊意義并不在于數(shù)據(jù)規(guī)模之“大”,而在于其帶來了思維、技術(shù)和方法上的全新變革,其應(yīng)用可以不受行業(yè)、地域、用戶的限制,可以與各產(chǎn)業(yè)領(lǐng)域的未來發(fā)展相掛鉤。大數(shù)據(jù)的發(fā)展必須以數(shù)據(jù)的“流動(dòng)性和可獲取性”為前提,即數(shù)據(jù)的開放和共享,這同時(shí)也會(huì)使人們的隱私數(shù)據(jù)和敏感信息也面臨著泄露的危險(xiǎn),特別是“棱鏡門”事件的持續(xù)發(fā)酵,凸顯出大數(shù)據(jù)安全的重要性和緊迫性。
1 大數(shù)據(jù)內(nèi)涵的理解
1.1 數(shù)據(jù)總量大
大數(shù)據(jù)首先是數(shù)據(jù)總量大。當(dāng)今全球的數(shù)據(jù)量正在以指數(shù)的規(guī)模增長,國際數(shù)據(jù)公司(IDC)指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。數(shù)據(jù)總量增長的速度遠(yuǎn)遠(yuǎn)超過了硬件、軟件技術(shù)的發(fā)展速度,以致引發(fā)了數(shù)據(jù)存儲(chǔ)和處理的危機(jī)。
1.2 數(shù)據(jù)類型多
大數(shù)據(jù)的來源是多源異構(gòu)的,其數(shù)據(jù)種類和格式日漸豐富,已沖破了以前所限定的結(jié)構(gòu)化數(shù)據(jù)范疇,囊括了半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),而且它們95%以上的都是半結(jié)構(gòu)或非結(jié)構(gòu)化的數(shù)據(jù)。在過去,雖然這些數(shù)據(jù)也可以用其他方法存儲(chǔ)并保存,但現(xiàn)在要做的不僅要保存它們,還要對(duì)它們進(jìn)行分析,以便獲取更多的價(jià)值。
1.3 數(shù)據(jù)價(jià)值高
價(jià)值是大數(shù)據(jù)的關(guān)鍵所在,找到了大數(shù)據(jù)中的關(guān)聯(lián)性,也就找到了我們需要的價(jià)值。大數(shù)據(jù)總量大,導(dǎo)致了其價(jià)值密度稀疏,只有對(duì)其進(jìn)行挖掘分析后才能得到有用的信息。在大數(shù)據(jù)出現(xiàn)之前,數(shù)據(jù)通常會(huì)被歸一化處理后進(jìn)行存儲(chǔ),從而丟掉了大部分?jǐn)?shù)據(jù)所包含的信息?!按髷?shù)據(jù)”僅僅是信息技術(shù)發(fā)展到當(dāng)今時(shí)代的一種表現(xiàn)和特征,其本身并不是一種技術(shù)革新,而是一種對(duì)數(shù)據(jù)處理思維理念的變化。從某種程度上說,大數(shù)據(jù)是一種基于多源異構(gòu)、跨域關(guān)聯(lián)的海量數(shù)據(jù)分析的前沿技術(shù),它能夠?qū)ξ磥淼臎Q策流程、商業(yè)模式、科學(xué)范式、生活方式和思維理念產(chǎn)生顛覆性變化。
2 大數(shù)據(jù)面臨的安全威脅
正如Gartner所說:“大數(shù)據(jù)安全是一場必要的斗爭”[1]?!袄忡R門”事件爆發(fā)后,奧巴馬尷尬的辯解道:“你不能在擁有100%安全的情況下,同時(shí)擁有100%隱私和100%便利?!盵2]這其實(shí)就是對(duì)大數(shù)據(jù)所面臨安全問題的生動(dòng)詮釋。
2.1 大數(shù)據(jù)在開放的網(wǎng)絡(luò)中成為主要攻擊目標(biāo)
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,越來越多的交易、互動(dòng)、對(duì)話都是在開放的網(wǎng)絡(luò)上進(jìn)行的。于此同時(shí),也使得網(wǎng)絡(luò)中的大數(shù)據(jù)更容易成為黑客攻擊的主要目標(biāo)。一方面,網(wǎng)絡(luò)訪問便捷性和網(wǎng)絡(luò)安全漏洞的存在,使得網(wǎng)絡(luò)上的數(shù)據(jù)更容易暴露,再加上大數(shù)據(jù)蘊(yùn)含著巨大的價(jià)值信息,更容易成為攻擊目標(biāo)。另一方面,網(wǎng)絡(luò)平臺(tái)上存儲(chǔ)的一些大數(shù)據(jù)之間具有很強(qiáng)的關(guān)聯(lián)性,這使得一次成功的攻擊就能獲得更多有價(jià)值的信息,從而降低了黑客的進(jìn)攻次數(shù)和成本,增加了攻擊的收益率。
2.2 大數(shù)據(jù)類型的多樣性對(duì)存儲(chǔ)提出了挑戰(zhàn)
大數(shù)據(jù)中以非結(jié)構(gòu)化數(shù)據(jù)為主,這些數(shù)據(jù)缺乏索引、一致性等,以往的存儲(chǔ)系統(tǒng)已經(jīng)無法滿足大數(shù)據(jù)應(yīng)用的需要。雖然云存儲(chǔ)技術(shù)能在一定程度上解決大數(shù)據(jù)的存儲(chǔ)問題,但是云存儲(chǔ)仍然面臨諸多問題,比如云中數(shù)據(jù)在給我們帶來便利的同時(shí),也成為犯罪分子獲取數(shù)據(jù)的空間。另外,非關(guān)系數(shù)據(jù)庫也可以為大數(shù)據(jù)存儲(chǔ)提供初步解決方案,如NoSQL數(shù)據(jù)庫。雖然NoSQL數(shù)據(jù)庫具有易擴(kuò)展、高可用等特性,但它也存在成熟度和技術(shù)漏洞問題、隱私管理模式和訪問控制問題、授權(quán)與驗(yàn)證的安全問題等。
2.3 大數(shù)據(jù)技術(shù)帶來新的安全威脅
任何技術(shù)都是一把雙刃劍,大數(shù)據(jù)也不例外,它在給人們帶來價(jià)值的同時(shí)也帶來了威脅。一方面,數(shù)據(jù)分析和數(shù)據(jù)挖掘等大數(shù)據(jù)技術(shù)在帶來商業(yè)價(jià)值的同時(shí),也提高了黑客的攻擊技術(shù)。黑客利用大數(shù)據(jù)技術(shù)能夠最大限度地收集與攻擊相關(guān)的信息,使其攻擊更具精準(zhǔn)性,如震驚業(yè)界的心臟出血漏洞、攜程拖庫等事件。另一方面,大數(shù)據(jù)本身的安全防護(hù)存在漏洞。大數(shù)據(jù)價(jià)值稀疏,安全防護(hù)工具很難聚焦在其價(jià)值點(diǎn)上,黑客很容易將惡意軟件或病毒代碼隱藏在大數(shù)據(jù)中,從而達(dá)到攻擊的目的。
2.4 大數(shù)據(jù)時(shí)代我國的數(shù)據(jù)危機(jī)
大數(shù)據(jù)的應(yīng)用必須以海量的數(shù)據(jù)規(guī)模為前提。據(jù)統(tǒng)計(jì),2010年我國新增的數(shù)據(jù)只有250PB,不及日本的400PB、歐洲的2000PB和美國的3500PB。綜合分析可知,我國缺乏的不是可供收集的數(shù)據(jù),也不是收集的數(shù)據(jù)的手段,而是缺乏收集數(shù)據(jù)的意識(shí)[3],從而導(dǎo)致大量數(shù)據(jù)信息的流失。再加上,大數(shù)據(jù)應(yīng)用的前提是數(shù)據(jù)的融合和共享,由于國家、政府、企業(yè)對(duì)其的認(rèn)識(shí)不足及投入不夠,導(dǎo)致大數(shù)據(jù)質(zhì)量大打折扣,無法滿足科學(xué)研究對(duì)大數(shù)據(jù)的需求。
3 大數(shù)據(jù)安全的應(yīng)對(duì)策略
任何一項(xiàng)技術(shù)的推廣和應(yīng)用,都應(yīng)以安全作為基礎(chǔ),棱鏡門事件曝光更促使人們對(duì)大數(shù)據(jù)的安全開始反思。大數(shù)據(jù)時(shí)代如何兼顧安全與自由、利益與隱私,這對(duì)大數(shù)據(jù)的進(jìn)一步應(yīng)用提出了新要求。
3.1 健全與大數(shù)據(jù)相關(guān)的法規(guī),提高安全意識(shí)
大數(shù)據(jù)的儲(chǔ)備、分析和安全防護(hù)能力將成為一個(gè)國家最重要的核心戰(zhàn)略能力,在大數(shù)據(jù)技術(shù)領(lǐng)域的競爭,事關(guān)國家安全和未來。首先,應(yīng)從國家的層面加快建立健全促進(jìn)數(shù)據(jù)產(chǎn)業(yè)發(fā)展的政策法規(guī)。目前,我國雖然在物聯(lián)網(wǎng)“十二五”規(guī)劃上提出來將信息處理技術(shù)作為一項(xiàng)關(guān)鍵技術(shù)創(chuàng)新工程,但是還沒有大數(shù)據(jù)方面的專門規(guī)劃和政策扶持。其次,還應(yīng)該從國家層面立法保護(hù)大數(shù)據(jù)安全,堅(jiān)決嚴(yán)肅處理大數(shù)據(jù)安全犯罪,維護(hù)國家安全和社會(huì)公共利益。
3.2 提升安全防護(hù)技術(shù),保障網(wǎng)絡(luò)信息安全
隨著網(wǎng)絡(luò)、移動(dòng)終端和傳感器等技術(shù)的發(fā)展,在線數(shù)據(jù)越來越多,數(shù)據(jù)價(jià)值也越來越大,使得黑客的犯罪欲望越來越強(qiáng)烈。所以說,在大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)的安全防護(hù)是至關(guān)重要的。一是要防止APT攻擊。借助大數(shù)據(jù)技術(shù),針對(duì)APT攻擊的特點(diǎn),設(shè)計(jì)一個(gè)具有實(shí)時(shí)檢測與事后回溯能力的全流量檢測方案,對(duì)隱藏有病毒的應(yīng)用程序進(jìn)行監(jiān)控。二是用戶訪問權(quán)限控制。根據(jù)大數(shù)據(jù)用戶的不同身份設(shè)定不同的訪問等級(jí)權(quán)限,并嚴(yán)格控制訪問權(quán)限。三是數(shù)據(jù)實(shí)時(shí)分析引擎。通過數(shù)據(jù)實(shí)時(shí)分析引擎,可以在大數(shù)據(jù)中快速分析出非法操作、黑客攻擊等具有潛在威脅的各類安全事件。
3.3 積極教育引導(dǎo),提高數(shù)據(jù)收集、共享和使用意識(shí)
大數(shù)據(jù)應(yīng)用能力所引發(fā)的變革,將直接影響我國的核心競爭能力。首先,應(yīng)該從國家層面來確立大數(shù)據(jù)戰(zhàn)略,制定相應(yīng)的大數(shù)據(jù)標(biāo)準(zhǔn),鼓勵(lì)數(shù)據(jù)開放和融合,并根據(jù)國情建設(shè)數(shù)個(gè)大數(shù)據(jù)中心,以供相應(yīng)的科學(xué)研究。其次,加強(qiáng)對(duì)普通民眾的教育引導(dǎo),增強(qiáng)其收集數(shù)據(jù)、使用數(shù)據(jù)意識(shí),以便增強(qiáng)民眾對(duì)大數(shù)據(jù)的信任。最后,積極培養(yǎng)大數(shù)據(jù)時(shí)代所需的專業(yè)人才。我國非常缺綜合掌握數(shù)學(xué)、統(tǒng)計(jì)學(xué)、人工智能、數(shù)據(jù)挖掘和分析等方面知識(shí)的復(fù)合型人才,這是我們需要面對(duì)的又一緊迫問題。
4 結(jié)束語
大數(shù)據(jù)解決了大量的日常問題,重塑了我們的生活、工作和思維方式。盡管大數(shù)據(jù)意味著大機(jī)遇,擁有巨大的應(yīng)用價(jià)值,但同時(shí)也遭遇數(shù)據(jù)安全領(lǐng)域的挑戰(zhàn)。只有同時(shí)處理好大數(shù)據(jù)技術(shù)和大數(shù)據(jù)安全這兩個(gè)問題,才能充分利用這個(gè)大機(jī)遇,讓大數(shù)據(jù)為企業(yè)為社會(huì)充分發(fā)揮最大價(jià)值。
參考文獻(xiàn)
[1]陳明奇,姜禾.大數(shù)據(jù)時(shí)代的美國信息網(wǎng)絡(luò)安全新戰(zhàn)略分析[J].信息網(wǎng)絡(luò)安全,2012(8):32-35.
[2]周路菡.棱鏡下的大數(shù)據(jù)安全恐慌[J].新經(jīng)濟(jì)導(dǎo)刊,2013(9):81-85.
[3]涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2012.
[4]肖新斌,史召臣.云計(jì)算引發(fā)的安全風(fēng)險(xiǎn)[J].信息安全與技術(shù),2011(6):13-14.
作者簡介:劉錚,蚌埠汽車士官學(xué)校,助教。