◆李華恩
(五邑大學(xué)計(jì)算機(jī)學(xué)院 廣東 525300)
探討云計(jì)算與大數(shù)據(jù)時(shí)代下的隱私與策略
◆李華恩
(五邑大學(xué)計(jì)算機(jī)學(xué)院 廣東 525300)
互聯(lián)網(wǎng)時(shí)代進(jìn)入了云計(jì)算階段加之智能移動(dòng)設(shè)備的推廣普及,人們無時(shí)無刻享受著云帶來生活與工作上的便捷與高效。但在享用科技成果的同時(shí),我們也受到了來自大數(shù)據(jù)對(duì)隱私的威脅。本文重點(diǎn)探討云計(jì)算時(shí)代誕生后對(duì)個(gè)人用戶信息的變化以及從社會(huì)及技術(shù)層面嘗試探討如何解決其帶來的負(fù)面影響。
隱私; 云計(jì)算; 大數(shù)據(jù); 安全; 網(wǎng)絡(luò)
自從人類進(jìn)入第三次科技革命時(shí)代,電子計(jì)算機(jī)變得愈發(fā)普及,互聯(lián)網(wǎng)設(shè)備也開始與人們形影不離。人們通過互聯(lián)網(wǎng)記錄、交互、分享信息。這里我們將這種自我有意識(shí)地將其公開或在某些協(xié)議背景下分享給某人的數(shù)據(jù)稱之為自我數(shù)據(jù),而另外一種,是互聯(lián)網(wǎng)或商業(yè)公司,會(huì)在供應(yīng)于用戶使用的應(yīng)用程序中收集用戶操作時(shí)的行為、習(xí)慣、行蹤等數(shù)據(jù),它們以此來提高用戶體驗(yàn),盡管用戶在使用程序前同意了某些協(xié)議,但這更多是一種被迫,而大多數(shù)用戶也許根本不清楚自己同意了什么內(nèi)容,這種人們所沒察覺到,卻被使用的數(shù)據(jù)我們可以將其稱為忽略數(shù)據(jù)。放在10年前,自我數(shù)據(jù)量與忽略數(shù)據(jù)量或許只有十年后今天的十萬分之一,原因在于計(jì)算機(jī)時(shí)代的初期,無論是計(jì)算機(jī)的運(yùn)算能力或者是硬盤的儲(chǔ)存數(shù)據(jù)量都是極為有限的,但2006年一項(xiàng)技術(shù)的推廣與普及,完全將整個(gè)局面顛覆,那便是云計(jì)算技術(shù)。
云計(jì)算(Cloud Computing)的組成包含了分布式計(jì)算(Distributed Computing)、并行計(jì)算(Parallel Computing)、效用計(jì)算(Utility Computing)、網(wǎng)絡(luò)存儲(chǔ)(Network Storage Technologies)、虛擬化(Virtualization)、負(fù)載均衡(Load Balance)、熱備份冗余(High Available)等傳統(tǒng)計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù),我們不妨將上述五種主要組成云計(jì)算的傳統(tǒng)網(wǎng)絡(luò)技術(shù)做個(gè)簡(jiǎn)化。首先分布計(jì)算原理即是將一項(xiàng)工程,分布于整個(gè)可利用的大系統(tǒng)中,以最有效率的途徑拆分給各部分系統(tǒng)完成,之后匯總結(jié)果,我們可將其視為協(xié)同工作; 并行計(jì)算,即在處理這項(xiàng)工程時(shí),調(diào)用可供其使用的計(jì)算機(jī)資源來解決復(fù)雜的計(jì)算任務(wù),我們將其視為云處理能力。網(wǎng)絡(luò)存儲(chǔ),即通過匯聚獨(dú)立儲(chǔ)存設(shè)備的容量進(jìn)行統(tǒng)一擴(kuò)容,資源儲(chǔ)備,我們可將其類比為云記憶能力; 效用計(jì)算,即無需用戶或企業(yè)組建自己的數(shù)據(jù)中心,而由網(wǎng)絡(luò)存儲(chǔ)內(nèi)容中資源共享來完成數(shù)據(jù)中心的職責(zé)。
我們?cè)賹⑸鲜鰪脑朴?jì)算提取出來這幾項(xiàng)核心部分與人類大腦進(jìn)行對(duì)比??梢园l(fā)現(xiàn),除了缺少“思考”功能,其余每一項(xiàng)對(duì)應(yīng)的恰恰是我們?nèi)四X在解決問題時(shí)的核心功能。人類只需要將云計(jì)算得出的數(shù)據(jù)協(xié)助自己的工作,配合數(shù)據(jù)操控者的思考能力,一個(gè)前所未有的高效率時(shí)代——云計(jì)算時(shí)代便如此降臨。
數(shù)據(jù)并不是什么高深的專有詞匯,它可謂是人類社會(huì)最重要的組成之一,但大數(shù)據(jù),卻是云計(jì)算時(shí)代才得到誕生。根據(jù)全球網(wǎng)絡(luò)報(bào)告,截至2016年全球網(wǎng)民數(shù)量已經(jīng)接近總?cè)丝诘囊话?,達(dá)到34.2億人口。在以往,無論是超級(jí)計(jì)算機(jī)還是極高容量的存儲(chǔ)設(shè)備都是是無法收集、存儲(chǔ)及運(yùn)算如此龐大的用戶信息,因?yàn)闊o論這些設(shè)備再?gòu)?qiáng)大,都是個(gè)體,但云概念的誕生,它共享與融合的本質(zhì),使得整個(gè)系統(tǒng)的運(yùn)算能力與存儲(chǔ)能力得到爆炸式的提高,由此誕生大數(shù)據(jù)的概念。
大數(shù)據(jù)涉及的方面十分廣泛,但本文只討論其在互聯(lián)網(wǎng)世界中對(duì)用戶隱私部分的影響及探討如何解決。上文詳細(xì)分析了云計(jì)算及其衍生出的大數(shù)據(jù)時(shí)代,我們不妨將這項(xiàng)跨時(shí)代的網(wǎng)絡(luò)成果的運(yùn)用推演在一位普通上班族用戶身上,看看會(huì)是什么結(jié)果。A先生是一位普通的上班族,屬于輕度網(wǎng)絡(luò)社交群,網(wǎng)絡(luò)購(gòu)物平臺(tái)的多樣性與便捷性使得他的主要購(gòu)物渠道是線上,乘坐交通工具上下班的A先生習(xí)慣在路途中拿起手機(jī),瀏覽了一下更新的微博與當(dāng)天的新聞動(dòng)態(tài),在遇到感悟時(shí)會(huì)社交平臺(tái)抒發(fā)一下自己的感受。回到家后,洗漱完畢的他開始在瀏覽器上搜索起自己感興趣的詞條,當(dāng)然其中還包括某些不為人所知的愛好。有時(shí)候,在網(wǎng)上找到與自己興趣相投的論壇,A先生會(huì)注冊(cè)一個(gè)該社群的賬號(hào),發(fā)帖留下了自己的聯(lián)系信息以此認(rèn)識(shí)些志同道合的朋友,但謹(jǐn)慎的A先生也不太希望網(wǎng)絡(luò)世界介入自己的生活,所以他也擁有自己的社交小號(hào)。
以上便是A先生的一天,可能他的生活代表著以億萬計(jì)市民的生活,但在他背后的云計(jì)算能將其信息搜集到什么程度?我們不妨一看。
首先,在網(wǎng)購(gòu)的時(shí)候A先生需要填寫自己的收貨信息,其中便包含了他的實(shí)名認(rèn)證手機(jī)號(hào)碼、常駐住址或公司地址,真名或習(xí)慣用的匿名; 而網(wǎng)購(gòu)平臺(tái)也會(huì)記錄下A先生所購(gòu)買產(chǎn)品品種、類別。而在他使用的智能手機(jī)中,手機(jī)廠商會(huì)在默認(rèn)的情況下開啟定位記錄A先生的位置,以此進(jìn)行某些服務(wù),在他使用微博與瀏覽新聞的過程中,程序廠商也在記錄著A先生在關(guān)注何類話題,關(guān)注哪類用戶或在什么內(nèi)容上停留的時(shí)間更久; 當(dāng)A先生回家使用電腦瀏覽論壇時(shí)候,他的IP也會(huì)記錄在他駐足的每一個(gè)頁(yè)面處。
以上便是大概估算下一天中A先生在網(wǎng)絡(luò)世界所發(fā)送出去的數(shù)據(jù)量,當(dāng)然,也可能是你我一天發(fā)送出去的數(shù)據(jù)量,當(dāng)這些數(shù)據(jù)從一天延伸到一周,一個(gè)月,一年,通過云計(jì)算的收集、分析、推演,恐怕不難得出一個(gè)比我們自己更為了解的“自己”。
由此可見云時(shí)代的來臨,我們每一個(gè)人都很難獨(dú)善其身,即使你不使用互聯(lián)網(wǎng)設(shè)備,你身邊的人記錄的點(diǎn)點(diǎn)滴滴也會(huì)在大數(shù)據(jù)的整理下一定程度將你的行蹤暴露。雖然有一些文章與書籍介紹如何盡可能地安全使用互聯(lián)網(wǎng)設(shè)備,但這些充其量只能使我們的重要信息難以落入陌生黑客的手里,但對(duì)于我們?nèi)粘I钏柢浖澈蟮幕ヂ?lián)網(wǎng)公司而言,我們這些資料數(shù)據(jù)早已以合同的方式自愿為他們使用。若這些公司將這些用戶大數(shù)據(jù)運(yùn)用得當(dāng),我們會(huì)發(fā)現(xiàn)當(dāng)自己再次打開購(gòu)物軟件時(shí)映入眼簾的全是自己感興趣或即將需要的貨物的優(yōu)惠頁(yè)面,當(dāng)打開導(dǎo)航軟件,它能準(zhǔn)確為什么實(shí)時(shí)規(guī)劃最合理省時(shí)的路線; 它們將會(huì)化成比自己更了解自己的智能管家,無時(shí)無刻推送著我們感興趣的內(nèi)容,做著最合我們心意的事。但若我們的這些大數(shù)據(jù)被泄露或被以壞處利用,我們行蹤將無處可逃,它也將會(huì)令一個(gè)個(gè)詐騙劇本在大數(shù)據(jù)的素材下編織得天衣無縫。
上文在探討云計(jì)算與大數(shù)據(jù)帶來的隱私問題,并不是希望社會(huì)否定及杯葛這項(xiàng)跨時(shí)代的技術(shù)。趨于統(tǒng)一是世界的發(fā)展的趨勢(shì),互聯(lián)網(wǎng)的誕生恰恰就是將世界聯(lián)系在一起,而云計(jì)算機(jī)則是這項(xiàng)技術(shù)的成熟與后續(xù),我們要做的是面對(duì),接下來本文將嘗試從社會(huì)責(zé)任與技術(shù)兩個(gè)層面去討論這項(xiàng)技術(shù)帶來的問題的策略。
如今,不少用戶會(huì)對(duì)自己個(gè)人信息較為敏感從而不愿意主動(dòng)提供給軟件服務(wù)公司,因此很多公司遮遮掩掩試圖讓用戶忽略式地同意軟件隱私合同。這種做法恰恰令隱私安全問題成為隱患。李克強(qiáng)總理曾在首屆世界互聯(lián)網(wǎng)大會(huì)上推廣互聯(lián)網(wǎng)+的概念,這也意味著國(guó)家鼓勵(lì)以及重視新時(shí)代中互聯(lián)網(wǎng)與傳統(tǒng)行業(yè)結(jié)合發(fā)展,其中,云計(jì)算下的大數(shù)據(jù)更是其中不可或缺的一環(huán)?;ヂ?lián)網(wǎng)公司不必膽怯,而是應(yīng)該讓用戶清楚明白在使用此款軟件時(shí)需要收錄他們何種資料及數(shù)據(jù),他們有權(quán)選擇是否使用。在這種人人皆知自己信息要為軟件程序使用的背景下,社會(huì)的關(guān)注度也會(huì)隨之上升,相關(guān)法律法規(guī)及監(jiān)督機(jī)制也會(huì)完善與規(guī)范。
Behrouz A.Forouzan曾在其著作《計(jì)算機(jī)科學(xué)導(dǎo)論》關(guān)于安全的章節(jié)討論過,數(shù)據(jù)安全的三個(gè)目標(biāo):機(jī)密性、完整性、可用性。
由于篇幅有限,本文中我們主要討論涉及用戶數(shù)據(jù)私密數(shù)據(jù)的安全部分即機(jī)密性與完整性的改進(jìn)空間。以現(xiàn)階段技術(shù)層面來講,能對(duì)數(shù)據(jù)機(jī)密性產(chǎn)生威脅的手段有兩種:嗅探與流量分析。首先討論嗅探,嗅探是指對(duì)數(shù)據(jù)的非授權(quán)訪問或偵聽。但不法分子能通過嗅探來獲得用戶資料加以利用的前提是該數(shù)據(jù)是未經(jīng)加密或者只做常見的加密處理,據(jù)世界互聯(lián)網(wǎng)安全大會(huì)統(tǒng)計(jì),目前全世界仍然有約百分之二十甚至更多的軟件在傳輸客戶資料數(shù)據(jù)時(shí)不對(duì)數(shù)據(jù)進(jìn)行任何的加密,這無疑是對(duì)用戶資料的不負(fù)責(zé)任。由此看來,在政策層面要求涉及用戶隱私數(shù)據(jù)交換分析的軟件公司實(shí)施強(qiáng)制性的用戶資料加密處理是很有必要的。
另一種會(huì)對(duì)數(shù)據(jù)機(jī)密性造成威脅的技術(shù)是流量分析,流量分析是指攻擊者通過在線流量進(jìn)行監(jiān)控和收集,這種攻擊技術(shù)雖然不受數(shù)據(jù)加密的約束但它只能通過對(duì)流量的監(jiān)控來推斷數(shù)據(jù)的類型,而對(duì)用戶數(shù)據(jù)內(nèi)容并沒有窺視與竊取的能力。
第二個(gè)重點(diǎn)需要解決的便是數(shù)據(jù)的完整性,傳統(tǒng)觀點(diǎn)認(rèn)為數(shù)據(jù)完整性的攻擊威脅主要在篡改、假冒、重放和抵賴四種方式上。經(jīng)過對(duì)四種方式進(jìn)行分類討論之后我們不難發(fā)現(xiàn),篡改、重放與抵賴都是基于信息被偵聽的情況下才能發(fā)生。結(jié)合上述對(duì)機(jī)密性的討論,由此可見,安全性問題在技術(shù)上最根本的研究方向應(yīng)該是需要一套完善的對(duì)數(shù)據(jù)加密與解密的體系。
目前傳統(tǒng)大企業(yè)對(duì)于公司內(nèi)部機(jī)密文件采取的是對(duì)稱密鑰密碼術(shù)。具體地講,假如A公司有一份機(jī)密文件‘Am’需要傳送給B公司,首先A公司會(huì)將機(jī)密文件‘Am’從明文經(jīng)過加密算法轉(zhuǎn)換成密文‘SAm’,此時(shí)他們通過一個(gè)普通信道(該信道并不隱蔽)進(jìn)行傳輸,之后A公司與B公司便需要另一個(gè)安全通道來傳遞解開密文的算法(密鑰),密鑰可能是通過雙方見面的方式遞交也可能通過互相連通的安全信道進(jìn)行傳遞。誠(chéng)然,這種方法在安全性與保密性方面都能很好地兼顧,他能幫助公司解決內(nèi)部文件的傳達(dá)。但若要為如今互聯(lián)網(wǎng)時(shí)代龐大的用戶數(shù)據(jù)交換選擇一種類似的保護(hù)措施,傳統(tǒng)的對(duì)稱密鑰密碼術(shù)便存在很大的漏洞。首先是人為的安全性問題,密鑰的公式是由某一方的公司所設(shè)計(jì),且不說既得利益方會(huì)不會(huì)出賣密鑰,在傳遞或傳輸?shù)倪^程不被攔截或竊取就已經(jīng)很難保證,另一個(gè)缺點(diǎn)就是時(shí)間效益,畢竟用戶大數(shù)據(jù)的交換要比公司的機(jī)密文件傳達(dá)頻繁得多,假如每一次的資料傳輸都要選擇一個(gè)安全的信道或者見面?zhèn)鬟f,無疑是經(jīng)濟(jì)與時(shí)間上的嚴(yán)重浪費(fèi)。
我們可以嘗試在這種方案上進(jìn)行改良。在對(duì)于需要公司內(nèi)部或者合作公司之間甚至是公司與國(guó)家之間對(duì)用戶的隱私數(shù)據(jù)進(jìn)行傳輸時(shí),可使用由國(guó)家層面的授權(quán)機(jī)構(gòu)開發(fā)的將明文按照某一隨機(jī)規(guī)律轉(zhuǎn)換密鑰,這種轉(zhuǎn)換密鑰安裝在需要用戶提供資料的軟件接口,所有傳輸?shù)挠脩魯?shù)據(jù)都將以密文的形式進(jìn)行傳遞,而傳遞到目標(biāo)機(jī)構(gòu)后,再由該機(jī)構(gòu)以某種身份確認(rèn)的方式(如生物指紋識(shí)別、工作卡授權(quán))等向密鑰機(jī)構(gòu)核實(shí)身份,由密鑰機(jī)構(gòu)提供對(duì)應(yīng)的密鑰,由于整個(gè)過程都是在互聯(lián)網(wǎng)層面進(jìn)行,不僅耗時(shí)短,也降低了用戶資料泄露的風(fēng)險(xiǎn)。
在早已進(jìn)入云計(jì)算時(shí)代的今天,數(shù)據(jù)的收集量與分析能力已遠(yuǎn)超以往任何一個(gè)時(shí)代,近年來手機(jī)程序愈發(fā)智能為人們提供了無限便捷的同時(shí),我們也目睹了越來越多的用戶信息遭受泄露,一個(gè)個(gè)網(wǎng)絡(luò)或電話欺詐案例導(dǎo)致無數(shù)家庭損失慘重,這背后若無大數(shù)據(jù)的分析,單憑騙徒們的花言巧語是不可能達(dá)成的。用戶的隱私泄露已經(jīng)到達(dá)一個(gè)我們無法想象的程度,但卻沒有多少人愿意正視這個(gè)問題,本文是對(duì)這個(gè)云時(shí)代用戶隱私的探討,希望引起更多人的注意,有拋磚引石之用,使得我們?cè)谙硎芗夹g(shù)發(fā)展帶來果實(shí)的同時(shí)也能共同解決雙刃劍帶給社會(huì)的傷害。
[1][美]Behrouz,A,F(xiàn)orouzan.計(jì)算機(jī)科學(xué)導(dǎo)論[M].北京:機(jī)械工業(yè)出版社,2015.
[2]云創(chuàng)大數(shù)據(jù).云計(jì)算是什么意思 什么是云計(jì)算[EB/OL].云創(chuàng)大數(shù)據(jù).