劉洪霞
摘要:在互聯(lián)網(wǎng)技術快速普及的影響下,人們已經(jīng)進入了大數(shù)據(jù)時代,這對人們的工作、學習與生活產(chǎn)生了顛覆性的影響。以網(wǎng)絡為依托的大數(shù)據(jù)已經(jīng)成為了產(chǎn)業(yè)界學者研究的焦點。由于網(wǎng)絡所附有的開放性特質(zhì),所以我們必須要重視大數(shù)據(jù)時代下數(shù)據(jù)的安全性,做好數(shù)據(jù)的安全管理,采用先進的技術做好隱私保護。降低大數(shù)據(jù)的風險,才能夠讓其發(fā)揮應有的作用。下文中筆者對大數(shù)據(jù)安全與隱私保護方面的問題進行了總結(jié),旨在對相關工作的落實有所幫助。
關鍵詞:大數(shù)據(jù);安全;隱私保護;信息安全;研究
現(xiàn)如今,大數(shù)據(jù)依托于科技以及相關產(chǎn)業(yè)已經(jīng)逐漸受到了人們的關注,它已經(jīng)成為“云計算”之后信息產(chǎn)業(yè)發(fā)展的新的增長點。大數(shù)據(jù)在創(chuàng)造巨大的經(jīng)濟效益的同時,其中暴露出來的問題我們也無法忽視。每天都有數(shù)以億計的人在依靠大數(shù)據(jù)獲取互聯(lián)網(wǎng)信息,這個過程中他們的個人信息也暴露在了互聯(lián)網(wǎng)之上,為了保障用戶的信息隱私,我們需要提高對于安全以及隱私保護問題的重視程度,革新現(xiàn)有的技術。
一、大數(shù)據(jù)的基本概述
1、來源
從概念層面來說,大數(shù)據(jù)主要指的是復雜且數(shù)量龐大、無法用現(xiàn)有的數(shù)據(jù)管理工具來進行處理的數(shù)據(jù)群。大數(shù)據(jù)的來源渠道主要包括以下幾種:首先人為產(chǎn)生,人們使用計算機網(wǎng)絡在互聯(lián)網(wǎng)上發(fā)布的圖片、文字、音頻以及視頻等數(shù)據(jù)信息是大數(shù)據(jù)的主要來源,人為增加的這類數(shù)據(jù)信息會對人們篩選獲取信息的過程產(chǎn)生一定阻礙。其次機器產(chǎn)生,存儲在計算機中并且由機器產(chǎn)生的各類日志、數(shù)據(jù)庫以及文件等數(shù)據(jù)信息也是大數(shù)據(jù)的主要來源。最后計算機進行的設備數(shù)據(jù)記錄也是大數(shù)據(jù)中非常重要的一部分來源,例如企業(yè)倉庫記錄的各類產(chǎn)品信息,天文望遠鏡中計算所得的物品屬性類信息等等?!?】
2、特征
大數(shù)據(jù)的特征主要體現(xiàn)在以下幾個方面:首先規(guī)模性。依托于大數(shù)據(jù)而集結(jié)的信息龐大、復雜,信息總量也一直處在不斷上漲的趨勢之下。綜合相關數(shù)據(jù)分析,近些年總信息量已經(jīng)達到了8ZB,因此規(guī)模性是大數(shù)據(jù)最典型的特征。其次多樣性。過去大都依靠文本來完成對于數(shù)據(jù)的搜集,此種狀態(tài)下的數(shù)據(jù)也大都是結(jié)構(gòu)化的數(shù)據(jù),這降低了數(shù)據(jù)儲存以及查看的難度。【2】現(xiàn)如今在技術發(fā)展的影響之下,信息儲存的樣式也在不斷增加,在儲存文本的同時我們也通常需要儲存圖片、視頻以及音頻等資料,如此非結(jié)構(gòu)化的數(shù)據(jù)越來越多。最后價值性。大數(shù)據(jù)的價值性主要指的是對儲存的數(shù)據(jù)信息進行分析統(tǒng)計的過程,提取出其中有價值的信息讓使用者使用,以滿足不同的需求。此外,當前人們對信息處理效率的要求正在不斷提高,對實時信息的需求量也在不斷增加,從某種層面分析,信息的時效性也是其價值的體現(xiàn)。
二、大數(shù)據(jù)時代所面臨的安全挑戰(zhàn)
1、用戶隱私的保護
因為大數(shù)據(jù)中的信息量非常龐雜,所以為了保證用戶隱私信息的安全性必須要對其進行妥善的處理。就用戶隱私保護而言,我們可以將其分為未知隱私保護、標識符匿名隱私保護以及連接關系間的匿名隱私保護等類別。企業(yè)依托于大數(shù)據(jù),對用戶的行為以及生活狀態(tài)進行分析預測,更助于企業(yè)掌握用戶的生活習慣、愛好以及消費記錄情況。【3】以此為切入點,有針對性的進行廣告推薦取得的效果更好。結(jié)合實際分析,“匿名處理”因操作簡便等優(yōu)勢已經(jīng)成為了首選的隱私保護手段,但實際工作中,這種方式取得的效果實在非常有限。單純的隱藏用戶的真實姓名根本無法完成對于用戶隱私的保護,若繼續(xù)沿用此種模式必然會引發(fā)一系列的問題。綜上,大數(shù)據(jù)時代下我們需要創(chuàng)新用戶的隱私保護模式。
2、大數(shù)據(jù)的可信度
基于大數(shù)據(jù),在人們的認識里逐漸形成了一個錯誤的觀點:數(shù)據(jù)可以說明一切,數(shù)據(jù)本身即是事實。殊不知這一觀點不僅片面而且沒有根據(jù),如果不能仔細甄別數(shù)據(jù)信息,那么即便是大數(shù)據(jù)也會誘導我們作出錯誤的結(jié)論。這就像人如果一味的相信自己的眼睛,必然會在自己“看不到”的地方出錯一樣。
當前大數(shù)據(jù)可信度的威脅主要包括偽造、刻意捏造數(shù)據(jù)以及數(shù)據(jù)在傳播中逐步失真兩部分內(nèi)容。首先若數(shù)據(jù)的應用場景已知,那么數(shù)據(jù)信息的發(fā)布者為了誘導信息使用者得出某種有利的結(jié)論,便會刻意偽造某些數(shù)據(jù)來營造出某種“假象”。這些偽造的數(shù)據(jù)信息會藏在大量真實的數(shù)據(jù)信息之中,人們在短時間內(nèi)根本無法鑒別其真?zhèn)危藭r在這些被偽造的信息影響之下人們往往會得出錯誤的結(jié)論。這類問題常見于點評網(wǎng)站之上,某些商品的虛假評論會混在真實評論之中,用戶根本無法分辨,最終有可能會選擇劣質(zhì)的服務以及商品。互聯(lián)網(wǎng)之上虛假信息的產(chǎn)生以及傳播越來越容易,僅依靠現(xiàn)有的信息安全手段想要甄別所有信息的來源是不現(xiàn)實的。此外,人工干預的數(shù)據(jù)采集過程很容易會出現(xiàn)誤差,由此而導致的數(shù)據(jù)失真或是出現(xiàn)偏差最終會影響數(shù)據(jù)分析的準確性。數(shù)據(jù)版本的變更也有可能會導致數(shù)據(jù)逐步失真,由此現(xiàn)實情況的變化,早期采集的數(shù)據(jù)根本無法反映真實的狀況,這也會影響信息使用者的判斷。
綜上,基于大數(shù)據(jù)時代信息的使用者應該具備判斷數(shù)據(jù)來源以及傳播途徑真實性的能力,以此來了解各類信息數(shù)據(jù)的可信度,避免得出有錯或是無意義的結(jié)論。
三、大數(shù)據(jù)安全與隱私的保護措施
1、針對數(shù)據(jù)發(fā)布的匿名保護技術
基于結(jié)構(gòu)化大數(shù)據(jù),要想增強用戶數(shù)據(jù)安全與隱私的保護,就必須強化數(shù)據(jù)發(fā)布匿名保護技術的研究,不斷改進完善匿名保護技術?,F(xiàn)階段,國內(nèi)針對大數(shù)據(jù)的匿名保護仍處在較為初級的階段,保護的范圍也只是局限在一次性用戶靜態(tài)發(fā)布的數(shù)據(jù)之上。今后還需要相關技術人員不斷研究,從而擴大匿名保護的范圍。此外,在數(shù)據(jù)信息多變性的影響之下,信息的發(fā)布大多不是一次性的,所以現(xiàn)有的技術條件根本無法對數(shù)據(jù)的發(fā)布實行匿名措施。
2、針對社交網(wǎng)絡的匿名保護技術
用戶在社交網(wǎng)絡中發(fā)布的數(shù)據(jù)包含大量的隱私信息,現(xiàn)如今這類數(shù)據(jù)已經(jīng)成為了大數(shù)據(jù)的主要來源。因其中圖結(jié)構(gòu)的數(shù)據(jù)占的比例較重,所以現(xiàn)有的數(shù)據(jù)保護技術無法對這類數(shù)據(jù)進行有效的保護。入侵者通過分析點與邊的相關屬性會完成數(shù)據(jù)的分析整合,這能夠重新鑒定出用戶的身份信息。所以針對社交網(wǎng)絡中的信息所進行的匿名保護,必須依托于圖結(jié)構(gòu)的特征展開,在發(fā)布信息時就應該對能夠標識用戶信息的數(shù)據(jù)進行處理。此外,也應該對用戶間的關系進行匿名處理,以提高用戶信息匿名保護的力度?!?】
3、數(shù)據(jù)水印技術
所謂數(shù)據(jù)水印技術就是將那些可以進行標識的信息在不影響正常的數(shù)據(jù)內(nèi)容和數(shù)據(jù)使用的前提下,用相對難以察覺的方式嵌入到數(shù)據(jù)載體之中,其中在媒體版權(quán)維護、數(shù)據(jù)庫和文本文件的比較中應用的相對廣泛。根據(jù)數(shù)據(jù)水印的作用我們可以將其分為強健水印類和脆弱水印類兩種,強健水印類能夠很好的保護原作者的創(chuàng)作權(quán),而脆弱水印類則能夠確保數(shù)據(jù)的真實性。不過數(shù)據(jù)水印技術多是在小范圍內(nèi)應用,因此需要我們加強對其的研究和應用,更好的發(fā)揮其作用。
【總結(jié)】
大數(shù)據(jù)時代下,數(shù)據(jù)量呈現(xiàn)出了爆炸式的增長。大數(shù)據(jù)在給用戶帶來便利的同時,也對用戶個人信息的安全帶來了極大的威脅。未來我們必須加強大數(shù)據(jù)安全技術的運用,以技術為依托,保證信息在儲存、傳遞以及應用環(huán)節(jié)的安全性。上文筆者對此類問題進行了總結(jié),旨在對相關工作的落實有所幫助。
參考文獻:
[1]曹珍富,董曉蕾,周俊,沈佳辰,寧建廷,鞏俊卿.大數(shù)據(jù)安全與隱私保護研究進展[J].計算機研究與發(fā)展,2016,53(10):2137-2151.
[2]馮登國,張敏,李昊.大數(shù)據(jù)安全與隱私保護[J].計算機學報,2014,37(01):246-258.
[3]崔洪剛,唐浩,汪永超.試論大數(shù)據(jù)安全與隱私保護[J].科技風,2016(07):92-93.
[4]呂欣,韓曉露.大數(shù)據(jù)安全和隱私保護技術架構(gòu)研究[J].信息安全研究,2016,2(03):244-250.