丁紅發(fā),彭長根,田有亮,向淑文
(1.貴州大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院公共大數(shù)據(jù)國家重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽 550025;2.貴州財(cái)經(jīng)大學(xué)信息學(xué)院,貴州 貴陽 550025;3.貴州大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,貴州 貴陽 550025)
訪問控制是信息系統(tǒng)保障數(shù)據(jù)安全和系統(tǒng)安全的重要和基礎(chǔ)性工具[1]。云計(jì)算、大數(shù)據(jù)及物聯(lián)網(wǎng)的興起和發(fā)展,使網(wǎng)絡(luò)和系統(tǒng)更加復(fù)雜、開放,數(shù)據(jù)安全和隱私需求更加多樣化,用戶和系統(tǒng)的角色、屬性更加難以發(fā)掘,需要更加動(dòng)態(tài)化、自適應(yīng)、細(xì)粒度的訪問控制模型以滿足新環(huán)境下的安全和隱私需求[2]。
強(qiáng)制訪問控制[3]、自主訪問控制[4]、基于角色訪問控制[5]等訪問控制模型的訪問策略是靜態(tài)的,訪問控制粒度粗放,且面對大規(guī)模用戶的開放系統(tǒng)難以預(yù)先指定用戶身份,故這些模型難以適用于云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)中新型的應(yīng)用場景?;趯傩栽L問控制[6]因其訪問控制粒度較細(xì)、不需要指定用戶身份或角色而受到了廣泛關(guān)注,在云計(jì)算、物聯(lián)網(wǎng)等場景得到了廣泛應(yīng)用,但其需要預(yù)先定義訪問策略,屬性挖掘與屬性撤銷的計(jì)算和實(shí)施都比較困難,不能適應(yīng)動(dòng)態(tài)訪問控制需求[7]。為了解決基于屬性訪問控制等傳統(tǒng)訪問控制模型存在的諸多問題,風(fēng)險(xiǎn)和信任被先后引入訪問控制中,提出了基于角色或?qū)傩缘娘L(fēng)險(xiǎn)訪問控制模型[8-10],一定程度上解決了用戶訪問的動(dòng)態(tài)控制,并進(jìn)一步發(fā)展為基于風(fēng)險(xiǎn)訪問控制[11-12],更加適用于大數(shù)據(jù)環(huán)境的訪問控制需求。同時(shí),醫(yī)療、社交網(wǎng)絡(luò)、位置信息服務(wù)等系統(tǒng)的大量多樣性數(shù)據(jù)集訪問具有開放性、動(dòng)態(tài)性和隱私敏感需求,隱私侵犯來自內(nèi)部和外部訪問[13],迫切需要在訪問過程中對用戶隱私信息進(jìn)行隱私保護(hù)。
訪問控制模型中存在授權(quán)不足或授權(quán)過度的現(xiàn)象,引發(fā)數(shù)據(jù)和系統(tǒng)安全、隱私泄露的風(fēng)險(xiǎn),亟需能夠平衡安全隱私與授權(quán)度間的解決方案。訪問控制可看作訪問主體(用戶)與訪問客體(服務(wù)提供者或系統(tǒng))間的沖突與合作。博弈論[14]作為一種解決參與者對抗與合作,并使參與者獲取最大化利益的數(shù)學(xué)工具,被自然引入訪問控制以平衡安全和訪問效用[15-17],但現(xiàn)有研究多集中于二人訪問控制博弈,要求參與者是完全理性的,難以客觀描述訪問控制模型中多個(gè)用戶與系統(tǒng)間的博弈。
本文針對現(xiàn)有訪問控制模型難以滿足適應(yīng)性保護(hù)隱私的需求,且其訪問控制博弈模型難以刻畫多用戶與系統(tǒng)間的非完全理性對抗與合作問題,基于用戶訪問隱私風(fēng)險(xiǎn)量化和多人演化博弈,面向開放環(huán)境的數(shù)據(jù)存儲隱私保護(hù),提出一種基于演化博弈的多參與者的理性風(fēng)險(xiǎn)訪問控制模型,并分析其演化穩(wěn)定狀態(tài)和演化穩(wěn)定策略求解。該訪問控制模型在保持風(fēng)險(xiǎn)訪問控制優(yōu)勢的同時(shí),通過用戶訪問隱私風(fēng)險(xiǎn)約束,限制用戶高隱私風(fēng)險(xiǎn)的惡意、好奇訪問請求,實(shí)現(xiàn)隱私保護(hù),同時(shí)僅假設(shè)參與者有限理性,用多人非合作博弈對多用戶對系統(tǒng)資源訪問的策略、收益進(jìn)行分析,通過演化達(dá)到博弈演化穩(wěn)定狀態(tài),實(shí)現(xiàn)了用戶和系統(tǒng)間的均衡及穩(wěn)定,有效平衡隱私保護(hù)和訪問效用,更加符合現(xiàn)實(shí)場景中用戶與系統(tǒng)間的策略動(dòng)態(tài)變化選取特征。具體而言,本文的貢獻(xiàn)如下。
1)面向開放環(huán)境的數(shù)據(jù)存儲隱私保護(hù),在有限理性假設(shè)下,通過分析多用戶場景的敏感數(shù)據(jù)隱私保護(hù)訪問控制問題及需求,提出了一種包含隱私風(fēng)險(xiǎn)量化和演化博弈模塊的多人隱私風(fēng)險(xiǎn)自適應(yīng)訪問控制模型。減弱了現(xiàn)有理性訪問控制模型的參與者完全理性假設(shè),將二人博弈擴(kuò)展為多人的群體博弈,且能夠適應(yīng)以數(shù)據(jù)為中心的系統(tǒng)敏感數(shù)據(jù)隱私保護(hù)需求。
2)在“Need to Know”的原則下,根據(jù)用戶訪問請求敏感資源的特征,定義了基于信息量化的訪問請求隱私風(fēng)險(xiǎn)和用戶隱私風(fēng)險(xiǎn),并給出了自適應(yīng)的動(dòng)態(tài)隱私風(fēng)險(xiǎn)計(jì)算方法。
3)對所提的多用戶隱私保護(hù)訪問控制模型構(gòu)建了演化博弈模型,提出了基于隱私風(fēng)險(xiǎn)自適應(yīng)的效用函數(shù),利用動(dòng)態(tài)復(fù)制方程分析并求解了所提訪問控制模型的博弈演化均衡策略。
4)利用動(dòng)力學(xué)理論對所提訪問控制模型的演化博弈過程進(jìn)行了仿真,結(jié)果表明所提多用戶隱私風(fēng)險(xiǎn)自適應(yīng)訪問控制模型可在有限理性的演化博弈過程中達(dá)到演化穩(wěn)定狀態(tài),能夠?qū)崿F(xiàn)自適應(yīng)風(fēng)險(xiǎn)的敏感數(shù)據(jù)隱私保護(hù)。
5)與相關(guān)基于風(fēng)險(xiǎn)訪問控制模型和理性訪問控制模型相比,所提訪問控制模型在以數(shù)據(jù)為中心的信息系統(tǒng)隱私保護(hù)方面具有更好的優(yōu)勢,風(fēng)險(xiǎn)自適應(yīng)程度好,訪問控制參與者假設(shè)更符合實(shí)際,能達(dá)到較好的隱私保護(hù)效果。
在風(fēng)險(xiǎn)訪問控制[18]的概念提出后,Cheng等[11]用多層安全的思路量化了風(fēng)險(xiǎn),將風(fēng)險(xiǎn)劃分為不同等級,實(shí)現(xiàn)了該模型的一個(gè)實(shí)例,但該量化方法缺乏數(shù)學(xué)理論支持。隨后,Ni等[12]用模糊推測理論在Cheng等的基礎(chǔ)上重新量化風(fēng)險(xiǎn),使風(fēng)險(xiǎn)量化滿足合取、析取及取反操作需求,用以處置訪問控制中的緊急訪問需求。但文獻(xiàn)[11-12]中風(fēng)險(xiǎn)量化是靜態(tài)的,無法應(yīng)對訪問需求多樣、無法預(yù)先定義安全等級,因此缺乏適用性,同時(shí)不能滿足系統(tǒng)的隱私保護(hù)需求,也不能對訪問主體的高風(fēng)險(xiǎn)訪問進(jìn)行激勵(lì)約束。
針對文獻(xiàn)[11-12]的風(fēng)險(xiǎn)量化靜態(tài)和不適應(yīng)高敏感環(huán)境的問題,Shaikh等[19]利用歷史訪問行為進(jìn)行風(fēng)險(xiǎn)和信任動(dòng)態(tài)量化,其風(fēng)險(xiǎn)通過威脅概率和數(shù)據(jù)泄露影響量化,利用指數(shù)移動(dòng)加權(quán)平均算法提出了動(dòng)態(tài)風(fēng)險(xiǎn)的訪問控制,以保護(hù)系統(tǒng)安全。Armando等[20]基于策略訪問控制,將訪問風(fēng)險(xiǎn)和用戶信任進(jìn)行對比,通過增強(qiáng)用戶信任、削減訪問安全風(fēng)險(xiǎn)以平衡二者,保護(hù)系統(tǒng)資源安全。Diaz-Lopez等[21]將訪問風(fēng)險(xiǎn)量化多層分類,并定義對應(yīng)的風(fēng)險(xiǎn)控制策略,利用遺傳算法為動(dòng)態(tài)訪問的訪問行為提供安全應(yīng)對措施,以保護(hù)高敏感環(huán)境的數(shù)據(jù)安全。但這些方法在風(fēng)險(xiǎn)量化過程中所依賴的信息過多,在實(shí)際環(huán)境中不能全部獲取,易使風(fēng)險(xiǎn)量化不精確而導(dǎo)致訪問控制失敗。為此,Santos等[22]提出基于權(quán)重的多因子聚合風(fēng)險(xiǎn)量化,并提出一種面向云安全的風(fēng)險(xiǎn)訪問控制框架。Ding等[23]利用馬爾可夫模型對主體訪問行為的風(fēng)險(xiǎn)進(jìn)行量化,并提出了基于信用卡額度約束的風(fēng)險(xiǎn)訪問控制模型,在云環(huán)境數(shù)據(jù)安全保護(hù)中激勵(lì)低風(fēng)險(xiǎn)訪問行為,約束高風(fēng)險(xiǎn)訪問行為。但文獻(xiàn)[19-23]提出的風(fēng)險(xiǎn)量化是面向安全的,不適用于隱私保護(hù)需求。
為了滿足隱私保護(hù)需求,Wang等[24]針對醫(yī)療信息系統(tǒng),利用信息熵按照“Need to Know”的原則,基于惡意醫(yī)生和誠實(shí)醫(yī)生間訪問信息的不同,對醫(yī)生訪問病患信息的風(fēng)險(xiǎn)進(jìn)行量化,提出了一種靈活的風(fēng)險(xiǎn)訪問控制模型,但該模型預(yù)先假設(shè)了誠實(shí)醫(yī)生的行為,風(fēng)險(xiǎn)量化缺乏適應(yīng)性以對應(yīng)訪問需求變化。在文獻(xiàn)[24]的基礎(chǔ)上,惠榛等[25]利用最大期望(EM,expectation maximization)二分算法對基于信息熵的醫(yī)生訪問行為進(jìn)行區(qū)分,監(jiān)測和控制隱私侵犯的高風(fēng)險(xiǎn)訪問性。Zhang等[26]定義了隱蔽非誠實(shí)醫(yī)生行為,基于時(shí)間盒和迭代實(shí)現(xiàn)了以主題建模為核心的風(fēng)險(xiǎn)自適應(yīng)訪問控制模型。文獻(xiàn)[24-26]提出的方法僅適用于醫(yī)療信息系統(tǒng)隱私保護(hù),且并未考慮訪問主體與客體間的合作與對抗。針對用戶匿名保護(hù)需求,Armando等[27]將風(fēng)險(xiǎn)訪問控制與匿名訪問結(jié)合,同時(shí)考慮匿名與數(shù)據(jù)效用,在匿名系統(tǒng)中抑制高風(fēng)險(xiǎn)訪問。
與傳統(tǒng)訪問控制模型中的參與者博弈[16,28-29]類似,基于風(fēng)險(xiǎn)訪問控制中的訪問主體與客體間也存在二人或多人沖突與合作關(guān)系。Helil等[15]基于二人非合作博弈模型,利用用戶信任和訪問風(fēng)險(xiǎn)刻畫效用函數(shù),分析了風(fēng)險(xiǎn)訪問控制模型中的子博弈完美Nash均衡,有效保證了訪問控制決策的科學(xué)性,但其并未考慮多訪問主體訪問客體間的沖突與合作。
本文針對開放、動(dòng)態(tài)的大規(guī)模多樣性數(shù)據(jù)訪問隱私保護(hù)需求及多用戶與系統(tǒng)間的沖突與合作關(guān)系,提出一種多參與者的理性隱私風(fēng)險(xiǎn)自適應(yīng)訪問控制模型。相比已有工作,該模型僅要求參與者有限理性,通過對訪問控制過程中的多參與者的行為、策略和隱私效用的博弈要素進(jìn)行多參與者演化博弈建模,解決了現(xiàn)有文獻(xiàn)對風(fēng)險(xiǎn)訪問控制參與者行為刻畫不足的問題;通過對歷史訪問行為和資源建模,利用信息論對訪問請求和用戶的隱私侵犯風(fēng)險(xiǎn)量進(jìn)行評估,僅用少量先驗(yàn)信息資源,減少了對系統(tǒng)歷史訪問信息的要求;僅利用隱私風(fēng)險(xiǎn)量化,不再依賴信任機(jī)制,簡化了模型的設(shè)計(jì)復(fù)雜度;通過多人演化博弈的演化穩(wěn)定策略狀態(tài)求解,不但有效約束了高隱私風(fēng)險(xiǎn)的訪問請求,激勵(lì)用戶進(jìn)行低隱私侵犯訪問,而且實(shí)現(xiàn)了動(dòng)態(tài)風(fēng)險(xiǎn)訪問控制的優(yōu)化訪問決策,可有效保護(hù)系統(tǒng)隱私數(shù)據(jù)。
本節(jié)介紹風(fēng)險(xiǎn)訪問控制模型、信息論與博弈論相關(guān)基礎(chǔ)知識,為提出面向隱私保護(hù)的基于演化博弈風(fēng)險(xiǎn)自適應(yīng)訪問控制模型提供基礎(chǔ)。
基于風(fēng)險(xiǎn)訪問控制往往包含訪問控制管理、風(fēng)險(xiǎn)量化評估和上下文檢索3個(gè)核心模塊[18,23,26],如圖1所示。其中,風(fēng)險(xiǎn)量化評估模塊是關(guān)鍵模塊,其負(fù)責(zé)對訪問請求的安全或隱私風(fēng)險(xiǎn)進(jìn)行量化,以支持訪問控制管理模塊做出允許訪問或者拒絕訪問決策。風(fēng)險(xiǎn)的量化取決于當(dāng)前訪問請求及其關(guān)聯(lián)的上下文資源,如歷史訪問行為、擬訪問的信息資源等,通過上下文檢索模塊實(shí)現(xiàn)對上下文資源的關(guān)聯(lián)應(yīng)用。訪問控制管理模塊通過對風(fēng)險(xiǎn)值和上下文的處理,做出訪問決策。
根據(jù)風(fēng)險(xiǎn)值計(jì)算的對象不同,基于風(fēng)險(xiǎn)訪問控制模型可分為面向安全需求[12]和面向隱私保護(hù)需求[26]。根據(jù)風(fēng)險(xiǎn)的計(jì)算方法不同,基于風(fēng)險(xiǎn)訪問控制模型可分為基于模糊邏輯[12]、基于歷史決策的分類訓(xùn)練[22]和基于用戶歷史行為[24]等。
圖1 基于風(fēng)險(xiǎn)訪問控制模型示意
信息論[30]是一種量化信息量和不確定度的有效工具,在訪問控制中具有廣泛的應(yīng)用[23-25]。一般地,有隨機(jī)變量X=(x1,x2,…,xn)及其概率分布P(X)=(p(x1),p(x2),…,p(xn)),則事件xi的香農(nóng)信息或自信息為
自信息表示了事件所蘊(yùn)含的信息量,自信息越大,該事件攜帶的信息量越多,反之越少。香農(nóng)信息熵是香農(nóng)信息的平均值,可表示為
信息熵表示隨機(jī)變量的不確定度,熵越大,不確定度越大,反之越小。香農(nóng)信息熵也被擴(kuò)展為極大熵、極小熵、正規(guī)熵、Renyi熵等,以適應(yīng)不同的場景[31]。
3.3.1 博弈模型
博弈論[14]研究利益存在沖突的多個(gè)理性主體在對抗合作過程中的策略選擇。經(jīng)典博弈論中的理性參與者總是選擇對自己最有利的策略,并達(dá)到均衡。策略博弈模型Γ=(P,A,u)中包含參與者P={P1,P2,…,Pn}、所有參與者行為集合A={A1,A2,…,An}和效用函數(shù)u={u1,u2,…,un}。稱n個(gè)參與者的行為有序集合a=(a1,a2,…,an)為行為組態(tài),其中ai∈Ai是參與者Pi在其行為集合Ai中的一個(gè)策略選擇。行為組態(tài)a可表示為a=(ai,a-i),其中a-i表示除參與者Pi之外其他參與者的策略組合。ui(ai,a-i)表示參與者Pi在策略組合(ai,a-i)狀態(tài)下的效用函數(shù)。
定義1Nash均衡[14]。在策略博弈Γ中,對任意參與者Pi∈P,其效用函數(shù)有
策略博弈是一次性博弈,其可進(jìn)行多次擴(kuò)展,稱為擴(kuò)展式博弈。博弈可分為合作博弈與非合作博弈,也可分為完美信息博弈和非完美信息博弈。
3.3.2 演化博弈
演化博弈[32]將經(jīng)典博弈中參與者的理性假設(shè)放寬為有限理性,并引入了群體演化。參與者的策略選擇在每一次博弈中不一定是最優(yōu)的,其可在演化過程中模仿其他參與者的高收益策略,調(diào)整其后續(xù)博弈策略以提高其收益。演化博弈關(guān)注所有參與者策略的動(dòng)態(tài)平衡,其核心在于演化穩(wěn)定策略。
定義2演化穩(wěn)定策略。演化博弈中,若一個(gè)被所有個(gè)體采用的策略可成功抵抗所有其他策略的少量個(gè)體入侵,則此策略就被稱為演化穩(wěn)定策略。形式化地,若策略se滿足
則稱策略se為演化穩(wěn)定策略[32],其中E(se,si)表示當(dāng)策略se遇到si時(shí)se的收益。
本節(jié)首先分析本文構(gòu)建的多參與者博弈的風(fēng)險(xiǎn)訪問控制模型所要解決的問題,其次提出多參與者隱私風(fēng)險(xiǎn)訪問控制模型。
在醫(yī)療信息系統(tǒng)、情報(bào)信息系統(tǒng)、外包計(jì)算數(shù)據(jù)池等環(huán)境中存在大量包含個(gè)人隱私的數(shù)據(jù),訪問用戶量大且動(dòng)態(tài)更新其訪問需求,用戶的角色、屬性、訪問策略等信息難以預(yù)先定義,這些信息難以隨用戶的訪問而動(dòng)態(tài)更新。為了保護(hù)隱私,需對訪問請求的數(shù)據(jù)所包含的隱私量進(jìn)行量化,現(xiàn)有的風(fēng)險(xiǎn)訪問控制模型難以對隱私進(jìn)行有效描述和精確動(dòng)態(tài)的量化。訪問控制模型中,參與者間是長期的多次訪問控制交互,在訪問過程中往往無法對所有背景知識和他人信息全部了解,也無法在每次訪問時(shí)理性地做出最佳策略選擇,但參與者可模仿其他參與者的高收益策略,調(diào)整其后續(xù)行為策略。因此,需要設(shè)計(jì)效用函數(shù)促使非完全理性的多參與者誠實(shí)合作,盡可能不侵犯隱私且取得高收益,并使參與者短期利益和長期利益一致。
在所提的面向隱私保護(hù)的多參與者理性風(fēng)險(xiǎn)訪問控制模型中,試圖通過以下措施解決上述問題。
1)定義并量化訪問請求的隱私風(fēng)險(xiǎn)
依據(jù)“Need to Know”的原則,用戶為完整工作職責(zé)而訪問信息資源中的敏感信息不應(yīng)當(dāng)是隱私侵犯,除此之外的訪問應(yīng)當(dāng)認(rèn)為是隱私侵犯。在經(jīng)認(rèn)證的用戶群體中,用戶會(huì)優(yōu)先完成自己的職責(zé),其大多數(shù)訪問請求都是為了完成自己的職責(zé),若該用戶單次訪問請求與其歷史訪問請求產(chǎn)生偏移距離,則偏離越遠(yuǎn),其違背“Need to Know”原則越嚴(yán)重,訪問的隱私信息資源的隱私量越大,隱私風(fēng)險(xiǎn)越高。
2)定義并量化用戶的隱私風(fēng)險(xiǎn)
將具有相似訪問請求行為模式的用戶群看作具有相同職責(zé)的用戶。在歷史訪問過程中,某一用戶的訪問偏離該用戶群的距離越遠(yuǎn),其違背“Need to Know”原則越嚴(yán)重,其用戶隱私風(fēng)險(xiǎn)越高。
3)構(gòu)建演化博弈以刻畫多用戶和系統(tǒng)的非理性多次博弈
不再假設(shè)參與者是完全理性的,而將所有用戶和系統(tǒng)視為有限理性的參與者。將訪問控制系統(tǒng)的所有參與者看作用戶群體和信息資源系統(tǒng)群體,2個(gè)群體之間進(jìn)行多次動(dòng)態(tài)博弈。博弈過程中,群體中的低收益參與者會(huì)模仿高收益參與者的博弈選擇策略,不斷進(jìn)行演化,最終達(dá)到穩(wěn)定的狀態(tài),該狀態(tài)下的參與者策略選擇即為演化穩(wěn)定策略,是參與者的最優(yōu)策略。
4)所設(shè)計(jì)的動(dòng)態(tài)訪問控制博弈模型求解
利用動(dòng)態(tài)復(fù)制方程的動(dòng)力學(xué)原理,提出并分析風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的參與者收益函數(shù)和信念函數(shù),進(jìn)一步分析其演化穩(wěn)定狀態(tài)及其機(jī)理,提出演化穩(wěn)定策略的求解式。在不同的初始狀態(tài)下,通過博弈的不斷演化,訪問控制博弈總能達(dá)到某個(gè)演化穩(wěn)定狀態(tài),該狀態(tài)下的博弈策略選擇即為參與者的最優(yōu)策略。
面向隱私保護(hù)需求,多用戶和信息資源系統(tǒng)間的有限理性參與者隱私風(fēng)險(xiǎn)訪問控制模型如圖2所示,包含訪問請求決策管理模塊、演化博弈建模模塊、隱私風(fēng)險(xiǎn)評估模塊、上下文信息模塊和風(fēng)險(xiǎn)策略模塊。
圖2 基于演化博弈的隱私風(fēng)險(xiǎn)訪問控制模型
圖2中,訪問請求決策管理模塊接收用戶訪問請求,根據(jù)博弈結(jié)果和風(fēng)險(xiǎn)策略模塊提供的信息做出授權(quán)或不授權(quán)等訪問決策,并反饋至上下文信息模塊。演化博弈建模模塊對參與訪問控制的用戶和系統(tǒng)進(jìn)行博弈演化,博弈過程中通過隱私風(fēng)險(xiǎn)信息和上下文信息進(jìn)行動(dòng)態(tài)策略選擇,給出演化策略結(jié)果,并將結(jié)果反饋給上下文信息模塊和訪問請求決策管理模塊。隱私風(fēng)險(xiǎn)評估模塊對訪問請求隱私風(fēng)險(xiǎn)和用戶隱私風(fēng)險(xiǎn)進(jìn)行動(dòng)態(tài)量化,支撐演化博弈建模和風(fēng)險(xiǎn)策略更新,并將結(jié)果反饋存儲至上下文信息模塊中。上下文信息模塊動(dòng)態(tài)記錄并存儲用戶信息、信息資源、訪問歷史、歷史隱私風(fēng)險(xiǎn)值、歷史博弈策略及收益函數(shù)等信息。風(fēng)險(xiǎn)策略模塊動(dòng)態(tài)更新各用戶的隱私風(fēng)險(xiǎn)訪問控制策略。
本節(jié)針對4.1節(jié)所述隱私風(fēng)險(xiǎn)量化問題,分別定義訪問請求隱私風(fēng)險(xiǎn)和用戶隱私風(fēng)險(xiǎn),并給出自適應(yīng)風(fēng)險(xiǎn)計(jì)算方法。
訪問控制系統(tǒng)中,信息資源可以通過自然語言處理或機(jī)器學(xué)習(xí)的方式進(jìn)行標(biāo)簽化,使所有信息資源記錄或原子集合都包含與系統(tǒng)資源使用功能、目的相關(guān)的標(biāo)簽信息,如醫(yī)療系統(tǒng)中所有的醫(yī)療數(shù)據(jù)可以根據(jù)ICD-10標(biāo)準(zhǔn)進(jìn)行標(biāo)簽化處理,情報(bào)系統(tǒng)中所有的情報(bào)信息可按照情報(bào)屬性和功能進(jìn)行標(biāo)簽化標(biāo)注。將訪問控制過程按照時(shí)間劃分為不同的時(shí)間段T0,T1,T2,…,每個(gè)時(shí)間段可以是一小時(shí)、一天或一周等。用戶U在前一個(gè)時(shí)間段T內(nèi)和當(dāng)前時(shí)間段內(nèi)截至目前向系統(tǒng)發(fā)出了n次訪問請求,對應(yīng)的訪問信息資源集合(實(shí)際應(yīng)用中利用信息資源集合對應(yīng)的標(biāo)簽集合進(jìn)行風(fēng)險(xiǎn)計(jì)算)為,則U訪問的信息資源集合為。當(dāng)前用戶U的訪問請求為,該請求對應(yīng)的系統(tǒng)信息資源集合為。根據(jù)各用戶的歷史訪問信息資源集合的相似性和聚類,可將具有相似訪問行為的用戶劃分為一組,在某一組中,所有的用戶具有相同的系統(tǒng)職責(zé),在訪問行為上僅有較小的差異。設(shè)用戶U屬于用戶分組g,用戶分組g在前一個(gè)時(shí)間段T內(nèi)和當(dāng)前時(shí)間段內(nèi)截至目前,訪問的信息資源集合為Rg。則用戶U的當(dāng)前訪問請求隱私風(fēng)險(xiǎn)為
其中,p(x)表示x在Rg中的概率,1>α>β>0,且α+β=1。
根據(jù)用戶組g中用戶的訪問請求風(fēng)險(xiǎn)值的歷史及分布可利用分位數(shù)設(shè)置閾值tg,若,則定義為隱私侵犯訪問請求,否則為非隱私侵犯訪問請求。特別注意的是,前述定義是從系統(tǒng)的角度看待某一訪問請求,用戶U會(huì)主動(dòng)選擇正常訪問或隱私侵犯訪問,但系統(tǒng)僅根據(jù)訪問請求本身來判定,可能將用戶的正常訪問識別為隱私侵犯訪問,亦有可能將用戶的隱私侵犯訪問識別為非隱私侵犯訪問。當(dāng)某一訪問請求被識別為隱私侵犯訪問時(shí),用戶可通過風(fēng)險(xiǎn)消除措施降低隱私風(fēng)險(xiǎn),文獻(xiàn)[21]討論了相關(guān)措施。
用戶U的隱私風(fēng)險(xiǎn)根據(jù)其訪問行為特征而發(fā)生變化,當(dāng)用戶訪問請求隱私風(fēng)險(xiǎn)值高時(shí),則用戶的隱私風(fēng)險(xiǎn)提高;當(dāng)用戶訪問請求隱私風(fēng)險(xiǎn)值低時(shí),則用戶隱私風(fēng)險(xiǎn)降低,且用戶隱私風(fēng)險(xiǎn)提高的速率高而降低的速率低。這樣的假設(shè)與銀行對客戶的信用風(fēng)險(xiǎn)評估一致,若客戶發(fā)生一次信用違約,其信用風(fēng)險(xiǎn)提高很快,需要很多次的信用守約才能將其信用風(fēng)險(xiǎn)降低至原來的值。用戶隱私風(fēng)險(xiǎn)僅與其前一隱私風(fēng)險(xiǎn)值和前一次訪問請求隱私風(fēng)險(xiǎn)值相關(guān)。設(shè)用戶U的初始隱私風(fēng)險(xiǎn)值為,其在當(dāng)前訪問請求之前的隱私風(fēng)險(xiǎn)值為,則當(dāng)前訪問請求發(fā)出之后,系統(tǒng)根據(jù)其隱私風(fēng)險(xiǎn)值和訪問請求的隱私風(fēng)險(xiǎn)值計(jì)算用戶U的更新隱私風(fēng)險(xiǎn)值
本節(jié)將訪問敏感信息的用戶和信息資源系統(tǒng)看作2個(gè)有限理性的群體,2個(gè)群體中的參與者進(jìn)行動(dòng)態(tài)演化博弈,通過不斷演化達(dá)到演化穩(wěn)定狀態(tài),所有博弈參與者都選取最優(yōu)博弈策略。定義隱私風(fēng)險(xiǎn)訪問控制的演化博弈模型,包含參與者、博弈策略、信念和收益函數(shù),并給出演化穩(wěn)定策略均衡求解計(jì)算方法,進(jìn)一步分析演化穩(wěn)定狀態(tài)及演化穩(wěn)定策略的特征和機(jī)理。
在有限理性參與者假設(shè)下,基于演化博弈可構(gòu)建面向隱私保護(hù)的風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型。
定義3風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型(risk-adaptive based access control evolutionary game model),可表示為四元組RaBACEGM=(P,,APr,u)。
1)P={U,S}是演化博弈的參與者空間,其中,U是用戶,S是信息資源系統(tǒng)。
2)A={AU,AS}是博弈策略空間,其中,AU={Normal,Malicious}是用戶的可選策略集合,包含正常訪問和惡意訪問;AS={Grant,Deny}是信息資源系統(tǒng)的可選策略集合,包含授權(quán)和拒絕。
3)Pr={p,q}是博弈信念集合,其中,p={pNormal,pMalicious}表示用戶分別采取正常訪問和惡意訪問的概率,且pNormal+pMalicious=1;q={qGrant,qDeny}表示信息資源系統(tǒng)分別采取授權(quán)和拒絕的概率,且qGrant+qDeny=1。
4)u={uU,uS}是博弈參與者的收益函數(shù)集合,其中,是用戶的收益函數(shù),是信息資源系統(tǒng)的收益函數(shù),二者的值由參與者的訪問策略選擇所決定。
本文的訪問控制系統(tǒng)中,用戶U和資源信息系統(tǒng)S都有2個(gè)策略可以選擇,在博弈的不同階段,用戶和資源信息系統(tǒng)對策略的選擇概率不同,且該概率根據(jù)演化博弈的演化學(xué)習(xí)機(jī)制而不斷變化,使訪問控制參與者的策略選擇形成動(dòng)態(tài)變化的過程。該博弈模型形成的基本博弈樹如圖3所示,表示單次博弈中用戶與信息資源系統(tǒng)的博弈策略和收益情況。
圖3 風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的基本博弈樹
博弈參與者根據(jù)自身和其他參與者的策略選擇而獲取不同的數(shù)值收益,所有參與者的收益矩陣如表1所示。
表1 風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的基本收益矩陣
表1中對演化博弈模型中各參與者的信念、策略和收益進(jìn)行了形式化描述,特別地,參與者的收益根據(jù)訪問請求的隱私風(fēng)險(xiǎn)不同而不同。
基于表1,可計(jì)算用戶不同訪問策略的期望收益和平均收益為
由于風(fēng)險(xiǎn)訪問收益較低者會(huì)學(xué)習(xí)模仿高收益參與者所選取的策略,針對用戶可選策略集合AU={Normal,Malicious},選取不同策略的用戶比例將隨時(shí)間發(fā)生變化。pNormal(t)表示選取正常訪問策略的用戶比例,pMalicious(t)表示選取惡意訪問策略的用戶比例,滿足pNormal(t)+pMalicious(t)=1。對于某一用戶訪問策略,選取該策略的用戶比例是時(shí)間的函數(shù),其動(dòng)態(tài)變化速率可用復(fù)制動(dòng)態(tài)方程[33]表示。
其中,i∈{Normal,Malicious}。
同理,信息資源系統(tǒng)不同策略選擇的期望收益和平均收益為
對信息資源系統(tǒng)的博弈策略選取亦可建立復(fù)制動(dòng)態(tài)方程
其中,j∈{Grant,Deny},且qj(t)。通過聯(lián)立式(9)和式(11),令
通過求解式(12),即可得到隱私風(fēng)險(xiǎn)訪問模型的演化博弈平衡狀態(tài)點(diǎn),從而實(shí)現(xiàn)訪問控制策略選取的分析和預(yù)測。
所提出的隱私風(fēng)險(xiǎn)訪問控制模型中,用戶選取不同的訪問行為策略會(huì)產(chǎn)生不同的收益,收益低的用戶會(huì)模仿收益高的用戶所選取的訪問行為策略。對于相同工作職責(zé)的n個(gè)用戶,有2種訪問策略{Normal,Malicious}可選,選取這2種訪問策略的用戶比例隨著時(shí)間發(fā)生變化,分別為pNormal(t)和1–pNormal(t)。對于訪問策略Normal,選取該策略的用戶人數(shù)比例是時(shí)間的函數(shù),其動(dòng)態(tài)變化速率可表示為動(dòng)態(tài)復(fù)制函數(shù)
令D(pNormal)=0,將式(8)代入式(13)可求解,得
類似地,信息資源系統(tǒng)的2種可選行為策略為{Grant,Deny},其策略選取概率為qGrant(t)和1–qGrant(t),對于策略Grant的選取概率時(shí)間變化函數(shù),亦可求解得q=0,q=1和pNormal=
將用戶與信息資源系統(tǒng)的策略選取復(fù)制動(dòng)態(tài)方程相結(jié)合,構(gòu)建隱私風(fēng)險(xiǎn)訪問控制演化博弈方程組,對博弈模型進(jìn)行穩(wěn)定性分析。求解方程組得到5個(gè)解:和其中,表示用戶選取純策略惡意訪問請求Malicious,信息資源系統(tǒng)選取純策略拒絕訪問Deny;表示用戶純策略選取惡意訪問請求Malicious,信息資源系統(tǒng)選取純策略允許訪問Grant;表示用戶純策略選取正常訪問請求Normal,信息資源系統(tǒng)選取純策略拒絕訪問Deny;表示用戶純策略選取正常訪問請求Normal,信息資源系統(tǒng)選取純策略允許訪問Grant;表示用戶以混合概率組合選取策略{Normal,Malicious},信息資源系統(tǒng)以混合概率組合選取策略{Grant,Deny}。根據(jù)演化穩(wěn)定策略理論可知Y1、Y2、Y3、Y4為鞍點(diǎn),Y5為中心點(diǎn),故所提風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型存在演化穩(wěn)定均衡。
演化穩(wěn)定策略是演化博弈模型中能夠抵抗侵犯的策略。在所提風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型中,用戶和信息資源系統(tǒng)雙方各自存在復(fù)制動(dòng)態(tài),以用戶為例,對其演化穩(wěn)定策略進(jìn)行分析。通過式(13)可知,用戶正常訪問請求策略選取的復(fù)制動(dòng)態(tài)相位有3種,當(dāng)時(shí),對任意的用戶正常訪問請求Normal策略選取概率pNormal,有一旦qGrant的取值發(fā)生偏移,就會(huì)劇烈變化,其所代表的狀態(tài)不具有穩(wěn)定性;當(dāng)時(shí),pNormal=1為用戶的演化穩(wěn)定策略;當(dāng)qGrant<時(shí),pNormal=0為用戶的演化穩(wěn)定策略。
本節(jié)對本文提出的隱私風(fēng)險(xiǎn)自適應(yīng)訪問控制模型的演化博弈過程,利用動(dòng)力學(xué)理論進(jìn)行仿真,分析隱私風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的最優(yōu)訪問策略選取問題。
由6.2節(jié)可知,該訪問控制模型的演化博弈穩(wěn)定狀態(tài)為Y1=[0,0]',Y2=[0,1]',Y3=[1,0]'和Y4=[1,1]',下面針對pNormal和qGrant的不同初始狀態(tài),進(jìn)行實(shí)驗(yàn)仿真。通過仿真可以觀察出pNormal和qGrant的演化趨勢,得到最終的演化穩(wěn)定狀態(tài),通過演化分析,實(shí)現(xiàn)隱私風(fēng)險(xiǎn)訪問控制系統(tǒng)中參與者的策略選擇預(yù)測,從而選取出最優(yōu)的訪問控制策略。本文的仿真實(shí)驗(yàn)中,根據(jù)6.1節(jié)中的分析對用戶的效用函數(shù)設(shè)定為,對信息資源系統(tǒng)的效用函數(shù)設(shè)定為
1)當(dāng)初始狀態(tài)為pNormal=0,qGrant∈[0,1)時(shí),用戶以概率1選取惡意訪問Normal策略,信息資源系統(tǒng)以概率1選取拒絕訪問Deny策略或任意其他混合策略選取授權(quán)訪問Grant、拒絕訪問Deny策略,通過系統(tǒng)仿真,經(jīng)過演化,用戶和信息資源系統(tǒng)雙方的策略選取都會(huì)演化為pNormal=0,qGrant=0的概率,即用戶以純策略選取惡意訪問Malicious,信息資源系統(tǒng)以純策略選取拒絕訪問Deny。pNormal和qGrant的具體演化曲線如圖4所示。在圖4中,訪問請求為正常訪問的初始概率pNormal=0,訪問請求被授權(quán)的初始概率qGrant在區(qū)間[0,1)內(nèi),其初始值從0到0.9變化,步長為0.1,演化穩(wěn)定狀態(tài)都為pNormal=0,qGrant=0。在達(dá)到演化穩(wěn)定狀態(tài)Y1=[0,0]'時(shí),風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的博弈參與者兩方博弈策略選取最優(yōu)。
圖4 初始狀態(tài)為pNormal=0,qGrant∈[0,1)時(shí),隱私風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的演化曲線
2)當(dāng)初始狀態(tài)為pNormal=0,qGrant=1時(shí),用戶以概率1選取惡意訪問Malicious策略,信息資源系統(tǒng)以概率1選取授權(quán)訪問Grant策略,通過演化,該演化博弈模型的博弈雙方的策略選取不變,pNormal和qGrant的具體演化曲線如圖5所示,演化穩(wěn)定狀態(tài)為pNormal=0,qGrant=1。
圖5 初始狀態(tài)為時(shí)pNormal=0,qGrant=1,隱私風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的演化曲線
在圖5中,盡管該演化過程的最終狀態(tài)Y2=[0,1]'是所提出的演化博弈模型的演化穩(wěn)定狀態(tài),但在實(shí)際應(yīng)用中,信息資源系統(tǒng)為了遏制惡意訪問請求,保護(hù)系統(tǒng)中的隱私數(shù)據(jù),同時(shí)盡可能吸引更多用戶訪問系統(tǒng),其不會(huì)以純策略方式選取授權(quán)訪問Grant,故當(dāng)用戶初始訪問策略選取為純策略惡意訪問Malicious時(shí),會(huì)轉(zhuǎn)換為圖4所示的演化曲線。
3)當(dāng)初始狀態(tài)為pNormal∈(0,1],qGrant∈(0,1]時(shí),用戶以混合策略方式選取正常訪問Normal、惡意訪問Malicious,或以純策略方式(概率為1)選取正常訪問Normal,信息資源系統(tǒng)以混合策略方式選取授權(quán)訪問Grant、拒絕訪問Deny,或以純策略方式(概率為1)選取拒絕訪問Deny,博弈模型通過不斷演化,會(huì)達(dá)到演化穩(wěn)定狀態(tài)Y4=[1,1]',即用戶以純策略方式選取正常訪問Normal,信息資源系統(tǒng)以混合策略方式選取授權(quán)訪問Grant。該狀態(tài)下風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的博弈策略選擇最優(yōu),pNormal和qGrant的演化曲線如圖6所示。在圖6中,訪問請求為正常訪問的初始概率pNormal以及訪問請求被授權(quán)的初始概率qGrant都在區(qū)間[0,1)內(nèi),其初始值分別從0到0.9變化,步長為0.1,演化穩(wěn)定狀態(tài)為pNormal=1,qGrant=1。
4)當(dāng)初始狀態(tài)為pNormal∈(0,1],qGrant=0時(shí),用戶以混合策略方式選取正常訪問Normal、惡意訪問Malicious,或以純策略方式(概率為1)選取正常訪問Normal,信息資源系統(tǒng)以純策略方式(概率為1)選取拒絕訪問Deny,通過不斷演化,會(huì)達(dá)到演化穩(wěn)定狀態(tài)pNormal=1,qGrant=0,即用戶以純策略方式選取正常訪問Normal,信息資源系統(tǒng)以純策略方式選取拒絕訪問Deny。pNormal和qGrant的具體演化曲線如圖7所示。在圖7中,訪問請求為正常訪問的初始概率pNormal在區(qū)間[0,1)內(nèi),其初始值分別從0.1到1變化,步長為0.1,訪問請求被授權(quán)的初始概率qGrant=0,演化穩(wěn)定狀態(tài)為pNormal=1,qGrant=0。
圖6 初始狀態(tài)為pNormal∈(0,1],qGrant∈(0,1]時(shí),隱私風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的演化曲線
圖7 初始狀態(tài)為pNormal∈(0,1],qGrant=0時(shí),隱私風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的演化曲線
在圖7中,最終達(dá)到的演化狀態(tài)是風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型的演化穩(wěn)定狀態(tài)Y3=[1,0]'。但在實(shí)際應(yīng)用中,信息資源系統(tǒng)為了吸引更多用戶訪問系統(tǒng),不會(huì)以純策略方式選取拒絕訪問Deny,而是以混合策略的方式選取其博弈策略,其演化過程會(huì)轉(zhuǎn)換為圖6所示的演化曲線。
由以上仿真結(jié)果可知,給定不同的策略選取初始狀態(tài),經(jīng)過演化,所提出的風(fēng)險(xiǎn)自適應(yīng)訪問控制模型在演化博弈過程中會(huì)達(dá)到某個(gè)穩(wěn)定狀態(tài)。通過觀察對比,本演化博弈模型的模擬演化結(jié)果與第6節(jié)中的理論分析保持一致,說明該演化博弈模型與現(xiàn)實(shí)系統(tǒng)中的規(guī)律相符。因此,本文提出的風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型具有有效性,可應(yīng)用于面向隱私保護(hù)的風(fēng)險(xiǎn)自適應(yīng)訪問控制系統(tǒng),為訪問控制系統(tǒng)的參與者進(jìn)行隱私保護(hù)訪問策略選取提供依據(jù)。
表2 本文所提模型與已有模型對比
在風(fēng)險(xiǎn)訪問控制、基于博弈的訪問控制和基于演化博弈的信息安全模型方面均有相應(yīng)的研究,本節(jié)針對這些研究工作進(jìn)行對比,如表2所示。
由表2可知,相較于文獻(xiàn)[12,19,22],本文所提出的風(fēng)險(xiǎn)訪問控制從系統(tǒng)安全保護(hù)擴(kuò)展至數(shù)據(jù)隱私信息保護(hù),同時(shí)在有限理性假設(shè)下,應(yīng)用多人演化博弈對自適應(yīng)風(fēng)險(xiǎn)訪問控制的參與者群體進(jìn)行了建模和分析;相較于文獻(xiàn)[24,26],本文將隱私保護(hù)的應(yīng)用范圍推廣至一般以隱私數(shù)據(jù)為中心的系統(tǒng)中,并利用博弈論對隱私保護(hù)的訪問策略選擇進(jìn)行了分析;相較于文獻(xiàn)[16,29],本文不關(guān)注系統(tǒng)的安全,而關(guān)注于系統(tǒng)中的敏感數(shù)據(jù)隱私保護(hù),通過隱私風(fēng)險(xiǎn)量化對博弈的效用函數(shù)進(jìn)行定義,且放松了對博弈參與者的絕對理性假設(shè),用演化的思想動(dòng)態(tài)分析參與者的訪問策略選擇;相較于文獻(xiàn)[15],本文的主要目標(biāo)是隱私保護(hù),將傳統(tǒng)訪問控制的二人博弈擴(kuò)展為有限理性下的多人動(dòng)態(tài)博弈,更加適用于訪問控制的真實(shí)場景,風(fēng)險(xiǎn)量化函數(shù)也通過信息量的量化對隱私風(fēng)險(xiǎn)進(jìn)行描述,并反映到博弈效用函數(shù)中;相較于文獻(xiàn)[28],本文不局限于特定場景的隱私保護(hù),其適用于通用的隱私保護(hù)場景,并且通過對用戶隱私風(fēng)險(xiǎn)和訪問請求隱私風(fēng)險(xiǎn)進(jìn)行動(dòng)態(tài)量化,實(shí)現(xiàn)了隱私風(fēng)險(xiǎn)自適應(yīng)。在多人博弈場景中,本文所提模型對參與者的理性假設(shè)放松為有限理性,利用演化的思想對參與者的策略選擇進(jìn)行動(dòng)態(tài)更新,更加符合現(xiàn)實(shí)場景中參與者的訪問行為變化特征。
隱私保護(hù)是以數(shù)據(jù)為中心的開放系統(tǒng)的核心問題之一,設(shè)計(jì)有效的細(xì)粒度自適應(yīng)訪問控制模型能夠保護(hù)系統(tǒng)中的隱私數(shù)據(jù)不被惡意、好奇的訪問行為侵犯隱私。本文面向隱私保護(hù),在有限理性假設(shè)下,提出了一種基于演化博弈的隱私風(fēng)險(xiǎn)自適應(yīng)訪問控制模型,該模型利用隱私信息量化的方法對訪問請求隱私風(fēng)險(xiǎn)和用戶隱私風(fēng)險(xiǎn)進(jìn)行量化,在此基礎(chǔ)上構(gòu)建了兩方群體的演化博弈模型,群體中博弈參與者不斷學(xué)習(xí)模仿高收益的參與者博弈策略,最終達(dá)到演化穩(wěn)定狀態(tài)。通過復(fù)制動(dòng)態(tài)方程分析了所提出的風(fēng)險(xiǎn)自適應(yīng)訪問控制演化博弈模型中參與者的策略選擇變化過程和演化穩(wěn)定狀態(tài)形成機(jī)理,提出了演化穩(wěn)定策略的求解式。通過仿真實(shí)驗(yàn),對所提自適應(yīng)隱私風(fēng)險(xiǎn)訪問控制模型的有效性進(jìn)行了驗(yàn)證,該模型能有效應(yīng)用于隱私保護(hù)的訪問控制;通過與相關(guān)文獻(xiàn)對比,證明該模型提出了新的隱私風(fēng)險(xiǎn)自適應(yīng)量化方法,減少了對系統(tǒng)歷史信息的要求,具有更好的隱私風(fēng)險(xiǎn)動(dòng)態(tài)適應(yīng)性,并將自適應(yīng)隱私風(fēng)險(xiǎn)量化結(jié)果用以設(shè)計(jì)演化博弈的效用函數(shù);提出了有限理性多參與者的風(fēng)險(xiǎn)訪問控制演化博弈模型,該模型中參與者的博弈策略選擇動(dòng)態(tài)更新,更加適用于真實(shí)場景。