張晶 王慶武
【摘要】該文從用戶信息的隱私保護(hù)、外界攻擊的預(yù)防、數(shù)據(jù)的安全存儲(chǔ)、信息的可信性甄別、數(shù)據(jù)的有效訪問控制、預(yù)測和監(jiān)控網(wǎng)絡(luò)入侵信號(hào)六個(gè)方面出發(fā),采用大數(shù)據(jù)安全與用戶隱私保護(hù)相關(guān)關(guān)鍵技術(shù),在該領(lǐng)域展開相應(yīng)研究,取得了一定的研究成果。
【關(guān)鍵詞】大數(shù)據(jù);安全存儲(chǔ);神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TP39文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào)1006-0278(2015)11-140-01
一、研究意義
在大數(shù)據(jù)時(shí)代,信息與數(shù)據(jù)的分析、研究都更加復(fù)雜、繁瑣,并且難以管理。根據(jù)相關(guān)調(diào)查統(tǒng)計(jì),僅過去三年內(nèi)全球的數(shù)據(jù)產(chǎn)生量就超過了過去四百年產(chǎn)生的數(shù)據(jù)總量。隨著數(shù)據(jù)的不斷增多,企業(yè)對數(shù)據(jù)安全性和隱私性的要求愈加嚴(yán)格,大數(shù)據(jù)的安全與隱私問題也日益凸顯。如何應(yīng)對大數(shù)據(jù)時(shí)代下的數(shù)據(jù)安全性挑戰(zhàn),是全球都應(yīng)積極思考的問題。
二、國內(nèi)外研究現(xiàn)狀、水平和發(fā)展趨勢
當(dāng)今學(xué)術(shù)界,圖靈獎(jiǎng)獲得者Jim Gray提出了科學(xué)研究的第四范式,即以大數(shù)據(jù)為基礎(chǔ)的數(shù)據(jù)密集型科學(xué)研究;2008年《Nature))推出了大數(shù)據(jù)??瘜ζ湔归_探討;2011年《Science》也推出類似的數(shù)據(jù)處理專刊。IT產(chǎn)業(yè)界行動(dòng)更為積極,持續(xù)關(guān)注數(shù)據(jù)再利用,挖掘大數(shù)據(jù)的潛在價(jià)值。
三、大數(shù)據(jù)安全研究內(nèi)容
大數(shù)據(jù)(Big Data)是指“無法用現(xiàn)有的軟件工具提取、存儲(chǔ)、搜索、共享、分析和處理的海量的、復(fù)雜的數(shù)據(jù)集合。”大數(shù)據(jù)具有四個(gè)典型特征,業(yè)界通常用四個(gè)V(即Volume、Variety、Value、Velocity)來概括大數(shù)據(jù)的特征。本課題主要從以下五個(gè)方面開展研究,實(shí)現(xiàn)大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全與用戶隱私保護(hù)。
(一)大數(shù)據(jù)環(huán)境中用戶信息的隱私保護(hù)
事實(shí)證明,如果大數(shù)據(jù)未被妥善處理會(huì)對用戶的隱私帶來極大的傷害。根據(jù)所保護(hù)的內(nèi)容不同,隱私保護(hù)又可以分為位置隱私保護(hù)、連接關(guān)系匿名保護(hù)和標(biāo)識(shí)符匿名保護(hù)等。用戶面臨的威脅不僅僅限于個(gè)人的隱私泄露,還包括基于大數(shù)據(jù)對人們狀態(tài)和行為的預(yù)測。
(二)大數(shù)據(jù)環(huán)境中外界攻擊的預(yù)防
在大數(shù)據(jù)環(huán)境中,由于數(shù)據(jù)量大、工作環(huán)境復(fù)雜,黑客能夠更容易得檢測出漏洞并進(jìn)行攻擊。一旦被攻破之后,還會(huì)根據(jù)突破口獲取更多的信息,進(jìn)而降低黑客的攻擊成本,獲得更大的利益。網(wǎng)絡(luò)化社會(huì)的形成,為大數(shù)據(jù)在各個(gè)行業(yè)領(lǐng)域?qū)崿F(xiàn)資源共享和數(shù)據(jù)交互搭建平臺(tái)和通道?;谠朴?jì)算的網(wǎng)絡(luò)化社會(huì)為大數(shù)據(jù)提供了一個(gè)開放的環(huán)境,分布在不同地區(qū)的資源可以快速整合,動(dòng)態(tài)配置,實(shí)現(xiàn)數(shù)據(jù)集合的共建共享。近年來在互聯(lián)網(wǎng)上發(fā)生的用戶賬號(hào)的信息失竊等連鎖反應(yīng)可以看出,大數(shù)據(jù)更容易吸引黑客,而且一旦遭受攻擊,失竊的數(shù)據(jù)量也是巨大的。
(三)大數(shù)據(jù)環(huán)境中數(shù)據(jù)的安全存儲(chǔ)
在當(dāng)前大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的存儲(chǔ)采用虛擬化海量存儲(chǔ)技術(shù)來存儲(chǔ)數(shù)據(jù)資源,。大數(shù)據(jù)的安全存儲(chǔ)問題主要包括:1.數(shù)據(jù)加密;在大數(shù)據(jù)安全服務(wù)的設(shè)計(jì)中,大數(shù)據(jù)可以按照數(shù)據(jù)安全存儲(chǔ)的需求,被存儲(chǔ)在數(shù)據(jù)集的任何存儲(chǔ)空間,通過安全套接層協(xié)議加密,實(shí)現(xiàn)數(shù)據(jù)集的節(jié)點(diǎn)和應(yīng)用程序之間保護(hù)大數(shù)據(jù)。應(yīng)用隱私保護(hù)和外包數(shù)據(jù)計(jì)算,屏蔽網(wǎng)絡(luò)攻擊。當(dāng)今,PGP和TrueCrypt等程序都提供了強(qiáng)大的加密功能。2.分離密鑰和加密數(shù)據(jù);使用加密技術(shù)把數(shù)據(jù)使用與數(shù)據(jù)保管分離,把密鑰與要保護(hù)的數(shù)據(jù)隔離開;同時(shí),定義產(chǎn)生、存儲(chǔ)、備份、恢復(fù)等密鑰管理生命周期。3.使用過濾器。通過過濾器的監(jiān)控,一旦發(fā)現(xiàn)數(shù)據(jù)離開了用戶的網(wǎng)絡(luò),就自動(dòng)阻止數(shù)據(jù)的再次傳輸。
(四)大數(shù)據(jù)環(huán)境中信息的可信性甄別
關(guān)于大數(shù)據(jù)的一個(gè)普遍的觀點(diǎn)是,數(shù)據(jù)自己可以說明一切,數(shù)據(jù)自身就是事實(shí)。但實(shí)際情況是,如果不仔細(xì)甄別,數(shù)據(jù)也會(huì)欺騙。大數(shù)據(jù)的可信性威脅主要包括以下兩個(gè)方面:1.偽造或刻意制造的數(shù)據(jù);若數(shù)據(jù)應(yīng)用場景明確,就可能有人刻意制造數(shù)據(jù)、營造某種“假象”,誘導(dǎo)分析者得出對其有利的結(jié)論。2.數(shù)據(jù)在傳播中逐步失真;原因之一是人工干預(yù)的數(shù)據(jù)采集過程可能引入誤差,由于失誤導(dǎo)致數(shù)據(jù)失真與偏差,最終影響數(shù)據(jù)分析結(jié)果的準(zhǔn)確性。
(五)大數(shù)據(jù)環(huán)境中信息的有效訪問控制
在大數(shù)據(jù)環(huán)境中,安全管理員可能缺乏足夠的專業(yè)知識(shí),無法準(zhǔn)確地為用戶指定其可以訪問的數(shù)據(jù)。風(fēng)險(xiǎn)自適應(yīng)的訪問控制是針對這種場景討論較多的一種訪問控制方法。將信息的數(shù)目和用戶以及信息的安全等級作為進(jìn)行風(fēng)險(xiǎn)量化的主要參考參數(shù)。當(dāng)用戶訪問的資源的風(fēng)險(xiǎn)數(shù)值高于某個(gè)預(yù)定的門限時(shí),則限制用戶繼續(xù)訪問。針對醫(yī)療數(shù)據(jù)提供用戶隱私保護(hù)的可量化風(fēng)險(xiǎn)自適應(yīng)訪問控制。
四、結(jié)語
大數(shù)據(jù)帶來了新的安全問題,但它自身也提供了解決問題的重要手段。就目前我國總體來說,當(dāng)前國內(nèi)外針對大數(shù)據(jù)安全與用戶隱私保護(hù)的相關(guān)研究還不充分。除了通過相應(yīng)的技術(shù)手段,還應(yīng)結(jié)合國家的相關(guān)政策法規(guī),才能在大數(shù)據(jù)環(huán)境下更好地解決數(shù)據(jù)安全與用戶的隱私保護(hù)問題。
參考文獻(xiàn):
[1]戈悅迎.大數(shù)據(jù)時(shí)代信息安全與公民個(gè)人隱私保護(hù)[J].中國信息界,2014(1).
[2]馮登國,張敏,李昊.大數(shù)據(jù)安全與隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2014(1).