李英
摘要:當下,全球數(shù)據(jù)資源呈現(xiàn)爆發(fā)式和多樣化的急劇增長,催生了大數(shù)據(jù)(Big Data)。大數(shù)據(jù)引發(fā)的個人信息安全已全面爆發(fā),產(chǎn)生的威脅、侵害和影響,已經(jīng)遠超越我們的范疇,信息安全與隱私泄露給我們帶來了嚴重的困擾。該文分析了大數(shù)據(jù)帶來的安全挑戰(zhàn)及隱私保護所面臨的關鍵方法,并指出大數(shù)據(jù)在引入安全問題的同時,也是解決隱私安全問題的有效手段。
關鍵詞:大數(shù)據(jù);安全;隱私;保護
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2015)13-0009-03
Abstracts: Nowadays,global data resources rise sharply in a projectile and diversified way,which gives rise to big data.personal information security started by big data has broken out comprehensively. The threat, aggression and impact generated by it have gone far beyond our category. Information security and privacy to divulge have brought us severeproblems.This paper analyzes the security challenges brought by large data and critical methods confrontingprivacy protection, as well as points out that big data not only introduces safety problems, butit is also the effective means to solve the problems of privacy, which brought new opportunitiesfor the development in the field of information security.
Key words: bigdata; safety; privacy; protection
大數(shù)據(jù)這一現(xiàn)象引發(fā)了各行各業(yè)的廣泛關注[1],而其作為一種重要的戰(zhàn)略資源,已經(jīng)不同程度地滲透到每個行業(yè)領域和部門,其深度應用有助于企業(yè)的經(jīng)營活動。大數(shù)據(jù)已成為一種新的經(jīng)濟資產(chǎn)類別,就像貨幣和黃金一樣,對數(shù)據(jù)的掌控直接關系到對市場機遇的把握和巨大的經(jīng)濟回報。大數(shù)據(jù)資源呈現(xiàn)爆發(fā)式和多樣化的急劇增長,其蘊含的無限開發(fā)潛能和巨大商業(yè)價值正引領各行各業(yè)智慧經(jīng)濟的崛起。
大數(shù)據(jù)的發(fā)展使得監(jiān)視變得更容易、成本更低廉也更有用處。當我們更多的個人信息被采集和存儲下來,大數(shù)據(jù)的弊端也就顯現(xiàn)出來了。大數(shù)據(jù)還會帶來更多的威脅,畢竟,大數(shù)據(jù)的核心思想就是用規(guī)模劇增來改變現(xiàn)狀。我們將分析它是如何加深對我們隱私的威脅的,同時還將面對一個新的挑戰(zhàn),即運用大數(shù)據(jù)預測來判斷和懲罰人類的潛在行為,我們的隱私和傾向受到很不良的影響。
1 大數(shù)據(jù)的來源及分析應用
1.1大數(shù)據(jù)的來源
網(wǎng)絡的應用發(fā)展、科學研究的需要、存儲器價格的下降和容量的巨大提升、計算機仿真等,使得我們收集到前所未見的龐大數(shù)據(jù)集[2],大數(shù)據(jù)的來源主要包括如下幾個方面。
1)社交網(wǎng)絡:隨著社交網(wǎng)絡不斷發(fā)展,更多的數(shù)據(jù)以圖作為基礎模型進行表達更為自然,而且這些數(shù)據(jù)的是極其龐大的。大型和超大型社交網(wǎng)絡的處理是手工分析方式無法完成的,在過去的二十年中,社交網(wǎng)絡分析領域的快速發(fā)展,很大程度得益于計算機計算能力的提升和各種數(shù)據(jù)挖掘方法的發(fā)展。
2)電子商務系統(tǒng)的數(shù)據(jù):電子商務用戶數(shù)量和交易數(shù)量隨著物流的快速發(fā)展都相當驚人。淘寶為了處理這些大規(guī)模的數(shù)據(jù),自行開發(fā)了海量數(shù)據(jù)庫系統(tǒng)ocean base。
1.2大數(shù)據(jù)分析應用
為了及時了解數(shù)據(jù)相應的變化,不斷優(yōu)化和改進,不僅僅要治標而且要治本,使同類的問題不再出現(xiàn);持續(xù)監(jiān)控和反饋,不斷尋找能從最根本上解決問題的最優(yōu)方案。我們必做的就是深入的分析數(shù)據(jù)[3],使這些數(shù)據(jù)更好的被應用。
我們不僅需要通過數(shù)據(jù)了解現(xiàn)在發(fā)生了什么,更需要利用數(shù)據(jù)對將要發(fā)生什么進行預測,以便在行動上做出一些主動的準備(如圖1)。例如,通過預測商品的銷售量預先采取行動,對商品進行及時的調整。
1)大量的交易歷史信息由商業(yè)組織積累而成,企業(yè)的各級管理人員希望從這些數(shù)據(jù)中分析出一些模式以便從中發(fā)現(xiàn)商業(yè)機會,通過趨勢分析,甚至預先發(fā)現(xiàn)一些正在涌現(xiàn)出來的機會。比如,美國的一位父親,女兒只有16歲,卻收到了孕婦用品商場的促銷券。憤怒的父親找到商場討公道,沒想到女兒真的懷孕了。原因是這家商場建立了一個數(shù)據(jù)模型,選了25種典型商品的消費數(shù)據(jù),構建了懷孕預測指數(shù),能夠在很小的誤差范圍內,預測到顧客的孕情,從而及早搶占市場。
2)圖分析和網(wǎng)絡分析可用于產(chǎn)品直銷、組織和個體行為分析、潛在安全威脅分析等領域[4]。圖分析和網(wǎng)絡分析規(guī)模的增長,從幾何角度看,圖的節(jié)點和邊都不斷增長。此外,公安機關發(fā)現(xiàn),犯罪分子還通過對獲取信息的整合,提高其含金量賣出更高的價格。比如,A從電信服務商獲得了一個人的姓名和手機號碼,B通過4S店得到了同一個人的姓名和車牌號,C在醫(yī)院獲得了這個人的身份證號和家庭住址,那么通過信息交易或者交換,這個人的完整信息很可能就會徹底暴露給犯罪分子。而這一切,正是大數(shù)據(jù)所擅長的分析、整合、數(shù)據(jù)碰撞。
2大數(shù)據(jù)引發(fā)的安全挑戰(zhàn)
科學技術是一把雙刃劍,在被稱為“大數(shù)據(jù)”的網(wǎng)絡時代的收集和儲存能力面前,未來的每一個人,在執(zhí)意的搜索面前,都無所遁形,大數(shù)據(jù)所引發(fā)的安全問題同樣引人注目。
大數(shù)據(jù)時代,外部數(shù)據(jù)商挖掘個人信息是不可能被屏蔽的。如今,用戶所產(chǎn)生的實時數(shù)據(jù)均不同程度地被各社交網(wǎng)站開放,數(shù)據(jù)提供商很方便收集一些數(shù)據(jù)[5],涌現(xiàn)了一些專門從事監(jiān)測數(shù)據(jù)的市場分析機構。市場分析機構之所以能以非常高的精度鎖定個人,挖掘出個人信息體系,他們是通過人們在社交網(wǎng)站中寫入的信息、智能手機顯示的位置信息等多種數(shù)據(jù)組合得出的。據(jù)市場分析機構統(tǒng)計,他們可以識別出95%的用戶,僅通過分析4個用戶曾經(jīng)到過的位置點。用戶隱私安全問題堪憂,就如前CEO斯科特麥·克尼利(Scott McNealy)說:“你沒有隱私,忘記這事吧……”。
全球最大的電子郵件營銷公司艾司?。‥psilon),曾在2011年4月初發(fā)生了史上最嚴重的黑客入侵事件,引發(fā)許多主要的企業(yè)客戶名單以及電子郵件地址因此外泄,這些受害企業(yè)包括了摩根大通、第一資本集團、萬豪飯店、美國銀行、花旗銀行及電視購物網(wǎng)絡等。
大數(shù)據(jù)對個人信息獲取渠道拓寬需求引發(fā)的另一個重要問題:安全、隱私和便利性之間的沖突。消費者受惠于海量數(shù)據(jù):更低的價格、更符合消費者需要的商品、以及從改善健康狀況到社會互動順暢等生活質量的提高?!袄忡R門”事件爆發(fā)后,尷尬的奧巴馬辯解道:“你不能在擁有100%安全情況下,同時擁有100%隱私和100%便利。”??偨y(tǒng)先生說出這樣的話,說明目前我們對大數(shù)據(jù)引發(fā)的安全挑戰(zhàn)還沒有效的遏阻。
3 大數(shù)據(jù)的隱私保護方法
3.1隱私保護方法之一——個人許可到讓數(shù)據(jù)使用都承擔責任
未來的隱私保護法應當區(qū)分用途,包括不需要或者只需要適當標準化保護的用途。對于一些危險性較大的項目,管理者必須設立規(guī)章,規(guī)定數(shù)據(jù)使用者應如何評估風險、如何規(guī)避或者減輕潛在傷害。這將激發(fā)數(shù)據(jù)的創(chuàng)新性再利用[1],同時也確保個人免受無妄之災。例如,一家公司出售了一項以駕駛員坐姿為特定識別符的汽車防盜技術。然后,它對收集到的信息進行了分析,預測駕駛員的注意力狀態(tài)(如昏昏欲睡、醉酒以及生氣),以此向周圍其他駕駛員發(fā)出警報以防發(fā)生交通事故主。根據(jù)目前的隱私規(guī)范,他可能需要新一輪的告知與許可,因為這樣使用信息是未經(jīng)駕駛員授權的。但是如今,在數(shù)據(jù)使用者的責任承擔體系下,他們就會評估預期用途的危險性。如果發(fā)現(xiàn)危害性很小,他們就可以著手實施預定計劃并實現(xiàn)提高駕駛安全性的目標。
將責任從民眾轉移到數(shù)據(jù)使用者很有意義,也存在充分的理由,因為數(shù)據(jù)使用者比任何人都明白他們想要如何利用數(shù)據(jù)。他們的評估(或者由他們所雇用的專家制定的評估)避免了商業(yè)機密的泄露。也許更為重要的是,數(shù)據(jù)使用者是數(shù)據(jù)二級應用的最大受益者,所以理所當然應該讓他們對自己的行為負責。
3.2隱私保護方法之二——個人動因和預測分析
大數(shù)據(jù)時代,關于公正的概念需要重新定義以維護個人動因的想法:人們選擇自我行為的自由意志[7]。簡單地說,就是個人可以并應該為他們的行為而非傾向負責。在大數(shù)據(jù)時代之前,這是明顯而基本的自由權利。畢竟,我們的法律體系就是這樣規(guī)定的:通過評判人們過去的行為使之為其行為承擔責任。然而,有了大數(shù)據(jù),我們就能預測人的行為,有時還能十分準確。這誘使我們依據(jù)預測的行為而非實際行為對人們進行評定。
通過保證個人動因,我們可以確保政府對我們行為的評判是基于真實行為而非單純依靠大數(shù)據(jù)分析。從而,政府只能依法對我們過去的真實行為進行追究,而不可以追究大數(shù)據(jù)預測到的我們的未來行為;或者,在政府評判我們過去的行為時,也應該防止單純依賴大數(shù)據(jù)的分析。例如,在對兩家涉嫌操縱價格的公司進行調查時,我們完全可以借助大數(shù)據(jù)分析先作出大概判定,然后監(jiān)管機構再以傳統(tǒng)手段立案和進行調查。不過,當然不能只因為大數(shù)據(jù)分析預測它們可能犯罪,就判定其有罪。
大數(shù)據(jù)管理的基本支撐是保證我們依然是通過考慮他人的個人責任對其進行評判,而不是借助“客觀”數(shù)據(jù)處理去決定他們是否違法。只有這樣,我們才是把其當作人來對待——當作有行為選擇自由和通過自主行為被評判的人。這是從大數(shù)據(jù)推論到今天的無罪推定原則。
3.3隱私保護方法之三——擊碎黑盒子,大數(shù)據(jù)算法師倔起
日前,計算機系統(tǒng)做出決策的方式是基于程序明確設定所需遵循的規(guī)則。這樣,如果它們的決策出錯(這是不可避免的),我們就可以回過頭來找出計算機做出錯誤決策的原因?!盀槭裁赐獠扛袘髟庥隹諝鉂穸燃ぴ龅那闆r時,智能飛行系統(tǒng)使飛機以5度的角度上升?”等?,F(xiàn)在的計算機編碼能被解碼、檢查,并且可以解讀其決策依據(jù)——無論多么復雜,至少對于懂得如何解碼的人不存在問題。
然而。有了大數(shù)據(jù)分析,這種追蹤會變得愈發(fā)困難。對人們而言,進行預測分析的計算機系統(tǒng)往往過于復雜,根本無法理解。但當計算機按程序設置明確執(zhí)行一系列指令時,情況就不一樣了。例如1954年早期,在IBM將俄文譯成英文的翻譯程序中,人們就能輕松理解一個單詞譯成另一個單詞的原因。但是,對于谷歌利用幾十億頁的翻譯數(shù)據(jù)開發(fā)出的翻譯系統(tǒng),當其將英文單詞“l(fā)ight”譯成“光”而不是“重量輕”時,就不可能清楚地解釋如此選擇的原因,畢竟這個預測分析是基于海量數(shù)據(jù)和龐大的統(tǒng)計計算之上的。在這些背景下,我們能看到大數(shù)據(jù)預測、運算法則和數(shù)據(jù)庫有變?yōu)楹诤凶硬煌该鳌⒉豢山忉?、不可追蹤,因而我們對其信心全無。為了防止這些情況的出現(xiàn),大數(shù)據(jù)將需要被監(jiān)測并保持透明度,當然還有使這兩項得以實現(xiàn)的新型專業(yè)技術和機構。它們將為許多領域提供支持,在這些領域里社會需要檢測預測結果并能夠為被其錯誤引導的我們提供彌補方法。
大數(shù)據(jù)將要求一個新的人群來扮演這種角色,也許他們會被稱作“算法師”。他們有兩種形式:在機構外部工作的獨立實體和機構內部的工作人員——正如公司有內部的會計人員和進行鑒證的外部審計師,即外部算法師和內部算法師!
3.4隱私保護方法之四——反數(shù)據(jù)壟斷大享
數(shù)據(jù)之于信息社會就如燃料之于工業(yè)革命,是人們進行創(chuàng)新的力量源泉。沒有大量鮮活的數(shù)據(jù)和健全的服務市場,這些創(chuàng)新就實現(xiàn)不了。隨著我們管理上的轉變[1],我們相信,大數(shù)據(jù)的不利影響將會得到控制。然則,隨著尚未成熟的大數(shù)據(jù)產(chǎn)業(yè)的不斷發(fā)展,另一個重要的挑戰(zhàn)將會是如何保護極具競爭力的大數(shù)據(jù)市場。我們必須防止21世紀數(shù)據(jù)大享的崛起,它相當于19世紀強盜大享的現(xiàn)代翻版,那些強盜大享曾壟斷了美國的鐵路、鋼鐵生產(chǎn)和電報網(wǎng)絡。