段謨意
摘要:為了更有效地保護用戶的軌跡隱私,提出綜合位置大數(shù)據(jù)、移動社交網(wǎng)絡服務各自的特點,從網(wǎng)絡技術(shù)、心理學、社會學、信息學等多角度,對用戶位置與行為模式之間映射后的個性向量模糊化,全方位量化分析影響位置大數(shù)據(jù)的移動社交網(wǎng)絡服務(Mobile social network service based on location big data,MSNSLBD)的屬性,重新給出了軌跡隱私的定義,最后對MSNSLBD的研究方向及需要解決的關(guān)鍵技術(shù)問題進行了展望。
關(guān)鍵詞:位置大數(shù)據(jù); 移動社交網(wǎng)絡服務; 軌跡隱私; 行為模式
中圖分類號: TP393
文獻標志碼: A
文章編號: 2095-2163(2016)06-0098-03
0引言
隨著移動互聯(lián)網(wǎng)和智能移動設備的應用拓展與普及,基于位置大數(shù)據(jù)的移動社交網(wǎng)絡服務(Mobile Social Network Service based on Location Big Data,MSNSLBD)得到了快速發(fā)展,但與此同時,MSNSLBD也隨即伴生了眾多新的問題,其中顯著突出的一類內(nèi)容展現(xiàn)就是用戶軌跡隱私將更加容易泄露。尤其是在大數(shù)據(jù)時代,移動社交網(wǎng)絡服務軌跡隱私保護問題已日趨精深復雜,而且又牽涉到諸多領域的時新高效技術(shù),因而如何讓用戶在充分享受大數(shù)據(jù)時代移動社交帶來重大優(yōu)勢便利的同時,能夠更好地保護用戶的軌跡隱私,為用戶的信息安全保駕護航,進而提供綠色網(wǎng)絡環(huán)境即已成為社會與學界吸引關(guān)注、加大投入的熱點與焦點。本文則針對這一課題范疇展開研究論述。
[BT4]1研究進展與研究現(xiàn)狀分析
[BT5]1.1研究工作綜論
文獻[1]提出了一種空間泛化和延遲發(fā)布相結(jié)合的方法,保護用戶的軌跡隱私和缺席隱私。文獻[2-3]針對軌跡數(shù)據(jù)挖掘中可能頻繁訪問模式的應用,提出了一種保護頻繁訪問模式的軌跡隱私保護方法BF-P2kA。具體地,該方法就是以前綴樹為基礎實現(xiàn)構(gòu)建軌跡k-匿名集。文獻[4]則設計了一種在移動社交網(wǎng)絡中推導用戶位置的方法,該方法通過用戶n個朋友提供的推理攻擊方法已可達到80%的精確度。文獻[5-6]還針對在近鄰服務中,當用戶在某個朋友的附近時,系統(tǒng)就會自動將用戶的位置告知其朋友,從而可能導致用戶軌跡隱私泄露給不可信的朋友或者服務提供商的情況,而相應研發(fā)了一種近鄰服務中的軌跡隱私保護方法。在此基礎上,更有文獻[7-8]針對當前社交網(wǎng)絡隱私屬性匿名算法中存在的合理模型匱乏、屬性分布特征擾動大、忽視社交結(jié)構(gòu)和非敏感屬性對敏感屬性分布的影響等現(xiàn)實缺點,發(fā)展性地推出了一種基于節(jié)點分割的隱私屬性匿名算法。另外,文獻[9]繼而又提出了一種基于GSNPP算法的隱私保護方法。方法通過對社交網(wǎng)絡中節(jié)點進行聚類,再對生成的簇通過簇內(nèi)泛化及簇間泛化,來對社交網(wǎng)絡引入匿名化處理,擬達到隱私保護的目的。此外,文獻[10]也研究了基于隱私信息檢索的位置大數(shù)據(jù)隱私保護技術(shù)。
[BT5]1.2研究成果解析
[JP2]綜上探討可知,這些文獻雖然針對MSNSLBD中軌跡隱私保護獲得了可觀技術(shù)進展,但仍存在一定不足,具體剖析如下。[JP]
1.2.1[ZK(]缺乏合理有效的MSNSLBD軌跡隱私保護算法[ZK)]
大數(shù)據(jù)時代,黑客可以從多種渠道獲得用戶公開信息和位置數(shù)據(jù),然后結(jié)合位置數(shù)據(jù)推測出用戶的隱私信息[5]。近年來,對這方面的研究都僅僅從單一網(wǎng)絡的角度來分析影響MSNSLBD的屬性,而未能綜合網(wǎng)絡技術(shù)、心理學、社會學、信息學等來全面研究針對MSNSLBD屬性的關(guān)聯(lián)作用,也未能靈活引入如下新情況所帶來的發(fā)展新因素:在位置大數(shù)據(jù)時代,隨著位置感知技術(shù)(傳感設備、移動通信等)的進步,將導致事物和人的地理位置呈現(xiàn)出數(shù)據(jù)化[9]等情形。如此片面的研究后果,即會使得現(xiàn)有軌跡隱私保護算法必然缺乏必要的合理性及有效性。
1.2.2[ZK(]對用戶位置與行為模式之間映射關(guān)系方面的研究,尚處于起步階段[ZK)]
針對位置大數(shù)據(jù)的移動社交網(wǎng)絡服務軌跡隱私保護,即應圍繞用戶位置與行為模式之間的映射關(guān)系而著重展開研究,力爭減弱攻擊者收集到的從匿名用戶位置推測可得的個性向量與不同用戶之間的個性向量上的性能匹配,從而弱化兩者之間的相關(guān)度。
同時研究可知,保護用戶位置大數(shù)據(jù)隱私的關(guān)鍵問題是:在確保服務可用的前提下,通過對映射后的個性向量設計執(zhí)行非數(shù)據(jù)化,盡量使得個性向量實現(xiàn)模糊化。因而針對不同的應用特點,既要獲得位置數(shù)據(jù)個性向量的模糊化結(jié)果,又要保持位置服務的準確性,亟需相關(guān)人員進一步的研究投入。
[JP3]1.2.3[ZK(]對MSNSLBD軌跡隱私問題的理解尚處于比較淺的層面[ZK)][JP]
分享位置為用戶提供方便的同時,也成為泄露用戶隱私的根源,用戶將不得不面對由此帶來的潛在風險。如何在保護軌跡隱私、提高服務質(zhì)量、增強MSNSLBD應用的吸引力之間維系最佳平衡則是時下MSNSLBD面臨的嚴峻挑戰(zhàn)[1]。
MSNSLBD服務的核心表述即是位置分享,因而既要考慮位置分享形成的實用優(yōu)勢,又要關(guān)注對軌跡隱私的周到保護。但是如果偏重于保護軌跡隱私、從而削弱了位置分享這項核心功能,MSNSLBD的吸引力就必將出現(xiàn)急劇下降。
特別是在大數(shù)據(jù)時代,強力提倡綠色網(wǎng)絡的大環(huán)境下,MSNSLBD陸續(xù)涌現(xiàn)的一些新問題,則需要結(jié)合社會學、地理學、經(jīng)濟學、信息學等多個學科,并同時展開全方位、多角度的梳理分析,而現(xiàn)有對這些問題的研究卻仍未臻至客觀、全面。
[HS(3][HT5H][ST5HZ]2[ZK(]位置大數(shù)據(jù)的移動社交網(wǎng)絡服務軌跡隱私保護的研究方向[ZK)][HS)]
[BT5]2.1重新定義MSNSLBD的軌跡隱私δ
[HT5”SS][ST5”BZ]
通過對基于啟發(fā)式隱私度量、概率推測、隱私信息檢索的大數(shù)據(jù)時代MSNSLBD隱私保護技術(shù)的探討分析;并立足于網(wǎng)絡技術(shù)、心理學、社會學、信息學等多維角度,而非僅是從網(wǎng)絡技術(shù)單一角度,針對影響MSNSLBD的屬性展開全方位量化分析,同時改進調(diào)用如上技術(shù),由此可得位置大數(shù)據(jù)的移動社交網(wǎng)絡服務軌跡隱私δ的數(shù)學定義為:
δ=[SX(](P(t, i, Lt)-p(t, i))*P(t, i+1)*dan(xi, xj)min[]p(i)[SX)][JY](1)
其中,p(i)表示用戶處于敏感位置的后驗概率;danmin表示最相近的2個向量的差異程度,代表不同用戶的位置數(shù)據(jù)映射到用戶個性向量xi和xj的不同元素個數(shù)的最小值; p(t,i)表示用戶在t時刻處于位置s(i)的概率,P(t,i+1) 表示用戶在t時刻處于位置s(i)下一步移動的概率;Lt則表示攻擊者收集到的用戶在時刻t之前發(fā)布的位置數(shù)據(jù)。
2.2[ZK(]為了降低軌跡隱私泄露的風險,對用戶位置與行為模式之間映射后的個性向量模糊化考慮移動社交網(wǎng)絡中用戶相關(guān)的位置數(shù)據(jù)與非位置數(shù)據(jù)之間的關(guān)系,防止攻擊者利用該關(guān)系推測用戶的敏感信息。因而需要減少用戶發(fā)布的位置數(shù)據(jù)數(shù)量,降低用戶位置數(shù)據(jù)中的元素映射為個性向量中有效元素的能力。研究用戶位置與行為模式之間的映射關(guān)系,以設法降低攻擊者根據(jù)從匿名用戶位置推測出的個性向量與攻擊者收集到的不同用戶之間的個性向量的匹配程度。在確保服務可用的前提下,盡量使映射后的個性向量顯得模糊,如此才能最大限度地降低軌跡隱私泄露的風險。
2.3[建立MSNSLBD軌跡隱私保護模型,構(gòu)建MSNSLBD軌跡隱私保護框架在大數(shù)據(jù)時代,MSNSLBD的研究中,既要考慮位置大數(shù)據(jù)的特點,又要保護移動社交網(wǎng)絡服務,這就使得大范圍、多角度分析、研究造成軌跡隱私泄露風險的原因已然成為研究必須。綜合時下各類學術(shù)成果可知,最佳技術(shù)方案可描述為:要盡快建立合理有效的MSNSLBD軌跡隱私保護模型,同時科學構(gòu)建MSNSLBD軌跡隱私保護框架。
[BT4]3擬解決的關(guān)鍵科學問題
[BT5]3.1多角度、全方位量化分析影響MSNSLBD的屬性
從網(wǎng)絡技術(shù)、心理學、社會學、信息學等多個角度,而不是從網(wǎng)絡技術(shù)單一角度,全方位量化分析影響MSNSLBD的屬性。但由于用戶心理的不確定性,不同用戶之間關(guān)系的復雜性,信息的海量性,等等這些,都給科學有效定義MSNSLBD軌跡隱私增加難度。
建立合理有效的MSNSLBD軌跡隱私保護模型,給出軌跡隱私保護算法,并驗證其先進性研究需要重點構(gòu)建位置大數(shù)據(jù)的移動社交網(wǎng)絡服務軌跡隱私保護的模型,并在優(yōu)化改進MSNSLBD軌跡隱私定義的前提下,給出更加合理的MSNSLBD軌跡隱私保護算法,在此基礎上還需進一步加入仿真驗證,由此證明軌跡隱私保護算法的先進性。
[BT4]4結(jié)束語
大數(shù)據(jù)是指一種包含大量信息、具有高新價值的數(shù)據(jù)集合。在大數(shù)據(jù)時代,由于傳感設備、移動通信等位置感知技術(shù)的發(fā)展,從而形成了位置大數(shù)據(jù)。人們在充分享用位置大數(shù)據(jù)挖掘出各種各樣的信息、使用位置大數(shù)據(jù)帶來便利的同時,用戶自身的隱私也不可避免地受到位置大數(shù)據(jù)的嚴重威脅[7-13]。因此,如何在充分利用位置大數(shù)據(jù)的同時,更好地保護用戶的行為模式、行為習慣、地理位置等敏感信息,如何構(gòu)建一個MSNSLBD軌跡隱私保護框架?如何在確保MSNSLBD可用的前提下,盡量讓用戶位置與行為模式之間映射后的個性向量變得模糊?如何建立一個更加合理的MSNSLBD軌跡隱私保護算法?使得用戶在充分享受大數(shù)據(jù)時代移動社交的效益優(yōu)勢的同時能夠更趨安全地使用MSNSLBD,即已成為一個現(xiàn)實重要的研究問題。本文在MSNSLBD軌跡隱私保護方面提出了一些新的思路,同時還對擬解決的關(guān)鍵科學問題進行了前景展望。
參考文獻:
SADILEK A, KAUTZ H, BIGHAM J P, Finding your friends and following them to where you are[C]//Proceedings of the 5th International Conference on Web Search and Data Mining (WSDM12). Seattle, USA:ACM, 2012:723-732.
[2] MASCETTI S, FRENI D, BETTINI C,et al. Privacy in geosocial networks: Proximity notification with untrusted service providers and curious buddies[J]. The VLDB Journal,2011,20(4):541-566.
[3] MASCETTI S, BETTINI C,F(xiàn)RENI D, et al. Privacyaware proximity based services[C]//Proceedings of the 10th International Conference on Mobile Data Management (MDM '09). Taipei, China:IEEE, 2009:31-40.
[4] FRENI D, VICENTE C R, MASCETTI S,et al. Preserving location and absence privacy in geosocial networks[C]//Proceedings of the 19th ACM International Conference on Information and Knowledge Management (CIKM10). Toronto, Canada:ACM,2010:309-318.
[5] PENSA U R, MONREALE A, PINELLI F,et al. Patternpreserving k-anonymization of sequences and its application to mobility data mining[C]//Proceedings of the 1st International Workshop on Privacy in LocationBased Applications (PiLBA11). Malaga, Spain:CEURWS, 2008:1-17.
[6] GUNTER C A, MAY M J, STUBBLEBINE S G. A formal privacy system and its application to location based services[M]//MARTIN D, SERJANTOV A. Privacy Enhancing Technologies. Berlin Heidelberg: Springer, 2004,3424: 256-282.
[7] 付艷艷,張敏,馮登國,等. 基于節(jié)點分割的社交網(wǎng)絡屬性隱私保護[J]. 軟件學報,2014,25(4):768-780.
[8] 楊秋偉,劉玲,李肯立,等. 一種支持隱私保護的角色訪問控制模型[J]. 計算機科學,2010,37(6):46-50,121.
[9] 韋偉,李楊,張為群. 一種基于GSNPP算法的社交網(wǎng)絡隱私保護方法研究[J]. 計算機科學,2012,39(3):104-106.
[10]王璐, 孟小峰. 位置大數(shù)據(jù)隱私保護研究綜述[J]. 軟件學報,2014,25(4):693-712.
[11]談嶸. 軌跡隱私保護及其在基于位置的社交網(wǎng)絡服務中的應用研究[D]. 上海:華東師范大學,2013.
[12]劉向宇,王斌,楊曉春. 社會網(wǎng)絡數(shù)據(jù)發(fā)布隱私保護技術(shù)綜述[J]. 軟件學報,2014,25(3):576-590.
[13]王敏君,李千目. 移動定位社交服務下的位置隱私保護方法[J]. 南京理工大學學報,2016,40(1) :17-23.[ZK)]