国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)隱私保護(hù)探究

2019-10-21 09:36劉孟旭
科學(xué)與信息化 2019年16期
關(guān)鍵詞:大數(shù)據(jù)

劉孟旭

摘 要 大數(shù)據(jù)環(huán)境下,隱私面臨前所未有的挑戰(zhàn),部分傳統(tǒng)隱私保護(hù)技術(shù)面臨失效,如何合理選擇隱私保護(hù)技術(shù)是一個(gè)具有挑戰(zhàn)性的任務(wù)。本文分析了常用的隱私保護(hù)技術(shù)及其局限性,討論了大數(shù)據(jù)環(huán)境下的隱私保護(hù)的新挑戰(zhàn),為大數(shù)據(jù)應(yīng)用實(shí)踐中建立合理的隱私管理方案提供參考。

關(guān)鍵詞 大數(shù)據(jù);隱私泄露;匿名化技術(shù);差分隱私

大數(shù)據(jù)技術(shù)與經(jīng)濟(jì)社會(huì)的交匯融合引發(fā)了數(shù)據(jù)迅猛增長(zhǎng),數(shù)據(jù)已成為國(guó)家基礎(chǔ)性戰(zhàn)略資源。大數(shù)據(jù)在帶來(lái)了巨大效益的同時(shí),也給用戶隱私保護(hù)方面的帶來(lái)了前所未有的挑戰(zhàn)。

1 數(shù)據(jù)隱私的范圍

隱私的界定應(yīng)以法律為依據(jù),我國(guó)《中華人民共和國(guó)刑法》、《中華人民共和國(guó)民法總則》、《中華人民共和國(guó)網(wǎng)絡(luò)安全法》、《消費(fèi)者權(quán)益保護(hù)法》、《中華人民共和國(guó)電子商務(wù)法》等有多部法律、法規(guī)、規(guī)章涉及個(gè)人信息保護(hù),《中華人民共和國(guó)個(gè)人信息保護(hù)法》也已列入十三屆全國(guó)人大常委會(huì)立法規(guī)劃。梳理現(xiàn)行和即將出臺(tái)的法律法規(guī)以及國(guó)家標(biāo)準(zhǔn)規(guī)范,數(shù)據(jù)隱私主要包括身份信息、健康生理、財(cái)產(chǎn)狀況、社交行為、行蹤軌跡等反映特定主體活動(dòng)情況的各種信息[1]。

2 數(shù)據(jù)隱私泄露現(xiàn)狀

據(jù)中消協(xié)11月28日發(fā)布《100款A(yù)pp個(gè)人信息收集與隱私政策測(cè)評(píng)報(bào)告》,10類App普遍存在涉嫌過(guò)度收集個(gè)人信息的情況,59款A(yù)pp涉嫌過(guò)度收集“位置信息”,28 款A(yù)pp涉嫌過(guò)度收集“通訊錄信息”,23 款A(yù)pp涉嫌過(guò)度收集“身份信息”。全球范圍內(nèi),2018年6月,美國(guó)Exactis公司泄露約3.4億條記錄,涉及2.3億人隱私信息,泄露原因是數(shù)據(jù)庫(kù)暴露在可公開(kāi)訪問(wèn)網(wǎng)絡(luò)且未采取任何有效的安全防護(hù)措施[2]。

3 數(shù)據(jù)隱私技術(shù)

數(shù)據(jù)隱私保護(hù)的常用技術(shù)包括數(shù)據(jù)加密、匿名化以及數(shù)據(jù)溯源等技術(shù),數(shù)據(jù)加密技術(shù)主要解決數(shù)據(jù)存儲(chǔ)、計(jì)算以及通信的安全性,匿名化技術(shù)主要解決數(shù)據(jù)加工處理、挖掘分析以及數(shù)據(jù)發(fā)布時(shí)防止敏感信息泄露。

3.1 數(shù)據(jù)加密技術(shù)

目前數(shù)據(jù)加密技術(shù)主要包括安全多方計(jì)算、密文檢索、同態(tài)加密等是常用的密碼技術(shù),主要解決數(shù)據(jù)存儲(chǔ)、通信和分析應(yīng)用的安全性。安全多方計(jì)算可以解決一組互不信任的參與方之間保護(hù)隱私的協(xié)同計(jì)算問(wèn)題,并確保除了用戶的輸入以及輸出信息外,不會(huì)額外地暴露信息。加密存儲(chǔ)和密文在較高的安全前提下,提供較高的檢索效率。

3.2 匿名化技術(shù)

是隱私保護(hù)最常用的技術(shù)手段,通常采用抑制、泛化等操作隱藏或者模糊數(shù)據(jù)以及數(shù)據(jù)源。泛化是指對(duì)數(shù)據(jù)進(jìn)行更加概括、抽象的描述,而抑制則是指不發(fā)布某些數(shù)據(jù)項(xiàng),常見(jiàn)的數(shù)據(jù)隱私保護(hù)的模型有k-匿名化(K-Anonymity)、l-多樣化(L-Diversity)、T-closeness模型、差分隱私(ε-differential privacy)等模型的及其改進(jìn)算法,以滿足不同的應(yīng)用場(chǎng)景需求。

準(zhǔn)標(biāo)識(shí)符是指結(jié)合一定的外部信息能夠以較高的概率確定一條用戶記錄,k-匿名化模型要求發(fā)布的數(shù)據(jù)中存在一定數(shù)量(至少為k) 的在準(zhǔn)標(biāo)識(shí)符上不可區(qū)分的記錄,使?jié)撛诘墓粽邿o(wú)法區(qū)分隱私信息所屬的個(gè)體。k-匿名的缺陷是未對(duì)等價(jià)類中的敏感屬性進(jìn)行約束,例如,某等價(jià)類中任意一個(gè)敏感屬性取值相同,則攻擊者可以推理出該敏感值[3]。

l-多樣化(L-Diversity)模型在k-匿名化的基礎(chǔ)上要求每個(gè)等價(jià)類至少包含L個(gè)不同的敏感屬性值,雖然l-多樣化保證了敏感屬性的多樣性,卻忽視了敏感屬性的全局分布。T-closeness模型在l-多樣化基礎(chǔ)上,考慮了敏感屬性的分布問(wèn)題,要求所有等價(jià)類中敏感屬性值的分布盡量接近該屬性的全局分布。

3.3 差分隱私(ε-differential privacy)

是嚴(yán)格的、可證明的隱私保護(hù)模型,ε是隱私保護(hù)參數(shù)(ε越小隱私保護(hù)程度越高,輸出擾動(dòng)越大)來(lái)調(diào)整數(shù)據(jù)的實(shí)用性和隱私性。實(shí)際應(yīng)用中,實(shí)施的難度和成本較高,為了平衡隱私性與可用性,ε參數(shù)的選擇是個(gè)具有挑戰(zhàn)性的問(wèn)題。

4 大數(shù)據(jù)環(huán)境下的新挑戰(zhàn)

大數(shù)據(jù)具有規(guī)模大、來(lái)源多、動(dòng)態(tài)更新等特點(diǎn),傳統(tǒng)的隱私保護(hù)技術(shù)都可能失效或面臨新的挑戰(zhàn)。

首先,數(shù)據(jù)加密技術(shù)面臨的挑戰(zhàn)。許多密碼技術(shù)是基于內(nèi)存計(jì)算的,不適應(yīng)大數(shù)據(jù)分布式存儲(chǔ)和并行計(jì)算環(huán)境,面臨可擴(kuò)展性差、計(jì)算代價(jià)高,不適應(yīng)新型計(jì)算框架等方面的問(wèn)題。

其次,匿名化技術(shù)面臨的挑戰(zhàn)。匿名化模型和差分隱私保護(hù)模型都假設(shè)數(shù)據(jù)集的數(shù)據(jù)是相互獨(dú)立的,大數(shù)據(jù)的大規(guī)模性、高速性、多樣性、相關(guān)性以及多個(gè)異構(gòu)數(shù)據(jù)源的融合可能使原有的隱私保護(hù)方案失效。

最后,大數(shù)據(jù)分析和融合面給隱私保護(hù)帶來(lái)了新挑戰(zhàn)。新型計(jì)算框架、高性能算法、更加復(fù)雜的分析模型可以挖掘出大數(shù)據(jù)中的異常點(diǎn)、頻繁模式、分類模式、數(shù)據(jù)之間的相關(guān)性以及用戶行為模式等信息,從而泄露用戶隱私信息或也為攻擊者更豐富的背景知識(shí)[4]。

5 結(jié)束語(yǔ)

大數(shù)據(jù)在當(dāng)前具有廣闊的發(fā)展前景,但同時(shí)面臨的隱私挑戰(zhàn)和風(fēng)險(xiǎn)也是空前的。大數(shù)據(jù)隱私保護(hù)不僅僅是技術(shù)方面的問(wèn)題,它還涉及法律法規(guī)、監(jiān)管模式、宗教等諸多方面,需要各界共同努力才能實(shí)現(xiàn)。

參考文獻(xiàn)

[1] 中消協(xié).100款A(yù)pp個(gè)人信息收集與隱私政策測(cè)評(píng)報(bào)告(2018年)[EB/OL]. http://wemedia.ifeng.com/90478388/wemedia.shtml,2018-11-29.

[2] 張嘯劍,孟小峰.面向數(shù)據(jù)發(fā)布和分析的差分隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2014,37(4):927-949.

[3] Sweeney L.k-anonymity:Amodel for protection privacy. International Journal Uncertainty[J].Fuzzines and Knowledge-based Sys Tems,2002,10(5):557-570.

[4] 張俊,蕭小奎.數(shù)據(jù)分享中的差分隱私保護(hù)[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2014,10(6):44-51.

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
大數(shù)據(jù)時(shí)代新聞的新變化探究
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
“互聯(lián)網(wǎng)+”對(duì)傳統(tǒng)圖書出版的影響和推動(dòng)作用
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
射洪县| 嘉善县| 泰兴市| 监利县| 石城县| 凤山市| 丽江市| 乾安县| 崇左市| 翼城县| 台州市| 远安县| 四川省| 白水县| 甘南县| 靖宇县| 朝阳县| 维西| 肥乡县| 藁城市| 兴海县| 贵州省| 宿松县| 波密县| 龙南县| 互助| 大竹县| 吉安市| 星座| 卫辉市| 长武县| 临安市| 秀山| 永定县| 思南县| 彰化市| 平山县| 印江| 轮台县| 洛隆县| 黄石市|