薛凌云
(邵陽(yáng)教育學(xué)院,湖南 邵陽(yáng) 422000)
一種P2P網(wǎng)絡(luò)動(dòng)態(tài)信任模型
薛凌云
(邵陽(yáng)教育學(xué)院,湖南 邵陽(yáng) 422000)
為了提高P2P網(wǎng)絡(luò)節(jié)點(diǎn)的安全性,論文提出了一種基于信任機(jī)制的動(dòng)態(tài)信任模型,詳細(xì)描述了模型的工作流程和算法,認(rèn)為仿真實(shí)驗(yàn)證明模型對(duì)惡意節(jié)點(diǎn)的識(shí)別率高,具有良好的抗攻擊性。
信任模型;信任機(jī)制;惡意節(jié)點(diǎn)
近幾年,中國(guó)互聯(lián)網(wǎng)用戶呈現(xiàn)爆炸式增長(zhǎng),P2P技術(shù)發(fā)展迅速,P2P網(wǎng)絡(luò)安全也受到越來越多的關(guān)注[1]。由于網(wǎng)絡(luò)失信問題日益嚴(yán)重,建立必要的網(wǎng)絡(luò)信任機(jī)制是當(dāng)前必須解決的一個(gè)重要課題。
信任是一個(gè)多學(xué)科的定義,不同領(lǐng)域的專家對(duì)信任有著不同的理解。美國(guó)田納西大學(xué)的Lee在其博士論文中列舉了48種有關(guān)信任的定義[2],涉及社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、心理學(xué)和管理學(xué)等多個(gè)領(lǐng)域。此外,國(guó)內(nèi)外大量的知名專家和一些機(jī)構(gòu)也都給出了自己對(duì)于信任[3-5]的理解。筆者認(rèn)為:信任是在交互之前,一個(gè)用戶判斷另一個(gè)用戶的某種行為發(fā)生的可能性。
本文設(shè)計(jì)了基于影響因子的信任模型,綜合考慮各種因素對(duì)可信度的影響,使整個(gè)系統(tǒng)的查詢速度更快,適應(yīng)能力更強(qiáng)。
為了使討論具有針對(duì)性,特以P2P文件下載環(huán)境為對(duì)象,當(dāng)然也可以將此思想用于P2P電子商務(wù)應(yīng)用,P2P數(shù)據(jù)管理系統(tǒng)及P2P協(xié)同計(jì)算系統(tǒng)等領(lǐng)域。為方便討論,首先定義幾個(gè)基本術(shù)語(yǔ),再給出構(gòu)建信任模型的流程。
定義1:自能力(Isc),描述節(jié)點(diǎn)自身環(huán)境的服務(wù)能力。
定義2:外能力(Osc),描述節(jié)點(diǎn)外部環(huán)境的安全保障能力。
定義3:評(píng)價(jià)向量(EV):由自能力,外能力和下載速度(Dsp)和文件質(zhì)量(Dqu)構(gòu)成的一個(gè)四維向量,用來描述SR對(duì)SP的一次服務(wù)的評(píng)價(jià)。
定義4:行為預(yù)期向量(BEV),指在行為發(fā)生之前,通過綜合節(jié)點(diǎn)的動(dòng)態(tài)服務(wù)能力和推薦信息得出的預(yù)期的對(duì)節(jié)點(diǎn)行為的評(píng)價(jià)向量。
定義5:行為表現(xiàn)向量(BPV),指在行為發(fā)生之后,節(jié)點(diǎn)代理通過對(duì)行為發(fā)生時(shí)實(shí)時(shí)監(jiān)控得出的真實(shí)值。
定義6:影響因子向量(IFV),是用來描述行為預(yù)期向量和行為表現(xiàn)向量偏差的一個(gè)向量。分別由自能力因子(Iscf)、外能力因子(Oscf)、下載速度因子(Dspf)、文件質(zhì)量因子(Dquf)四個(gè)因素構(gòu)成,表現(xiàn)形式如下:
定義7:服務(wù)請(qǐng)求數(shù)據(jù)包(rq_dataset),SR發(fā)出的服務(wù)請(qǐng)求,除對(duì)下載文件種類進(jìn)行說明外,還要包含自能力偏好系數(shù)(λ)、外能力偏好系數(shù)(α)、下載速度偏好系數(shù)(β)及文件質(zhì)量偏好系數(shù)(γ),系數(shù)應(yīng)滿足λ+α+β+γ=1。
定義8:直接信任向量(DT),SR根據(jù)SR的鄰居節(jié)點(diǎn)對(duì)SP的推薦信息計(jì)算得出的評(píng)價(jià)向量。
定義9:推薦信任向量(RT),SR根據(jù)SP的鄰居節(jié)點(diǎn)對(duì)SP的推薦信息計(jì)算得出的評(píng)價(jià)向量。
定義10:可信度(T),綜合直接信任向量和推薦信任向量得出的SR對(duì)SP的信任程度。
描述節(jié)點(diǎn)自身處理事務(wù)的能力,為了細(xì)致的刻畫節(jié)點(diǎn)的自能力,定義如下四個(gè)參數(shù)。
1.等候時(shí)間參數(shù)(W tf):由節(jié)點(diǎn)本次從提交服務(wù)請(qǐng)求到請(qǐng)求被響應(yīng)的時(shí)間差w tn和歷史前n-1次的時(shí)間差最小值w tmin決定。
?是用戶忍耐等候時(shí)間參數(shù),?值越大表明用戶允許的等候時(shí)間越長(zhǎng)。當(dāng)w tf值小于0時(shí),用戶將不再等待。W tf值越大,表明等候時(shí)間越少。w tmin隨時(shí)更新,以防止n值很大時(shí)計(jì)算量較大。
2.運(yùn)行時(shí)間參數(shù)(Rtf):由SP本次提供服務(wù)的時(shí)間rtn和歷史前n-1次提供服務(wù)的時(shí)間最小值rtmin決定。
κ是用戶忍耐運(yùn)行時(shí)間參數(shù),κ值越大表明用戶允許的運(yùn)行時(shí)間越長(zhǎng)。當(dāng)Rtf值小于0時(shí),按0處理。Rtf值越大,表明運(yùn)行時(shí)間越少。rtmin隨時(shí)更新,以防止n值很大時(shí)計(jì)算量較大。
3.服務(wù)許可證參數(shù)(Sc):為了減輕系統(tǒng)的負(fù)載,系統(tǒng)通過設(shè)置節(jié)點(diǎn)代理,根據(jù)系統(tǒng)的負(fù)載能力發(fā)放若干個(gè)服務(wù)許可證,服務(wù)請(qǐng)求者申請(qǐng)某種服務(wù)時(shí),需先獲得許可證才能申請(qǐng)服務(wù)。SP獲得服務(wù)許可證為1,否則為0;
最后,由這三個(gè)參數(shù)根據(jù)下述公式可得出節(jié)點(diǎn)的自能力的值。i
ω參數(shù)是預(yù)先給定的參數(shù)值,參數(shù)值的不同表示用戶對(duì)于不同因素的重要性有著不同的認(rèn)識(shí)。用戶認(rèn)為重要的可以賦予較高的值,但是應(yīng)滿足
外能力:描述的是節(jié)點(diǎn)外部環(huán)境的服務(wù)能力,為了更好的描述外能力,定義如下四個(gè)參數(shù)。
1.主機(jī)安全環(huán)境參數(shù)(Rpcf):由服務(wù)請(qǐng)求者所在的主機(jī)的安全環(huán)境決定,包括主機(jī)是否具有防火墻(Fw),是否進(jìn)行密碼通信(Pwc),是否進(jìn)行認(rèn)證(Ct)以及是否為可信PC(Tc)四項(xiàng)。若有則為1,否則為0,對(duì)于每一項(xiàng)賦予不同的權(quán)重按照下述公式做和。
2.網(wǎng)絡(luò)傳輸質(zhì)量參數(shù)(Ntqf):由服務(wù)請(qǐng)求者申請(qǐng)服務(wù)時(shí)當(dāng)前網(wǎng)絡(luò)的傳輸質(zhì)量決定。包括網(wǎng)絡(luò)的物理特性,傳輸特性,連通特性,地理范圍,抗干擾性以及物理設(shè)備的相對(duì)價(jià)格所決定。為簡(jiǎn)單起見,模型根據(jù)本次傳輸速度(Ts)和丟包率(Plr)的乘積和前n-r次的乘積的最大值確定Ntqf。對(duì)于每一項(xiàng)采用不同的權(quán)重根據(jù)下述公式進(jìn)行計(jì)算。
δ是用戶忍耐網(wǎng)絡(luò)傳輸質(zhì)量參數(shù), δ值越大表明當(dāng)前允許的網(wǎng)絡(luò)傳輸質(zhì)量變化范圍越大。當(dāng)Ntqf值超過1時(shí),按1處理。Ntqf值越大,表明網(wǎng)絡(luò)傳輸質(zhì)量越好。此外模型為防止計(jì)算量較大,只計(jì)算前n-r次乘積的最大值。
3.目的IP安全環(huán)境參數(shù)(Ppcf):與主機(jī)安全環(huán)境相對(duì)應(yīng),由服務(wù)提供者所在主機(jī)的安全環(huán)境決定。計(jì)算方法可見公式(4)。
4.滿足要求IP個(gè)數(shù)參數(shù)(NIPf):由服務(wù)請(qǐng)求者本次搜索到的符合文件下載要求的目的IP個(gè)數(shù)(NPIPn)和前n-1次搜索到的IP個(gè)數(shù)的最大值決定??砂聪率龉接?jì)算。
ε是用戶忍耐IP個(gè)數(shù)參數(shù),ε值越大表明當(dāng)前允許的滿足要求IP個(gè)數(shù)變化范圍越大。當(dāng)NIPf值超過1時(shí),按1處理。NIPf值越大,表明滿足要求的IP越多。此外模型為防止計(jì)算量較大,只計(jì)算前n-r次乘積的最大值。最后,由這四個(gè)參數(shù)根據(jù)下述公式可得出節(jié)點(diǎn)的外能力的值。i
η參數(shù)是預(yù)先給定的參數(shù)值,參數(shù)值的不同表示用戶對(duì)于不同因素的重要性有著不同的認(rèn)識(shí)。用戶認(rèn)為重要的可以賦予較高的值,但是應(yīng)滿足
行為預(yù)期向量是指在行為發(fā)生之前,通過綜合節(jié)點(diǎn)的動(dòng)態(tài)服務(wù)能力和推薦信息得出的預(yù)期的對(duì)節(jié)點(diǎn)行為的評(píng)價(jià)向量。具體表示如下:
下載速度(Dsp):節(jié)點(diǎn)提供下載時(shí)的平均速度。SP在對(duì)SR提供下載的時(shí)候,可能會(huì)對(duì)不同的SR表現(xiàn)出不同的下載速度。因?yàn)楣?jié)點(diǎn)的下載速度是一個(gè)變化的值,所以采取微分來計(jì)算文件下載速度更加合理,公式如下:
其中,Dsp表示下載速度,F(xiàn)l表示下載文件的大小。用微分來描述文件下載的速度,可以很好的保證節(jié)點(diǎn)在提供服務(wù)的時(shí)候不會(huì)投機(jī)取巧,還會(huì)為了賺取到一定的聲譽(yù)把文件上傳完整。
下載文件質(zhì)量(Dqu):SP提供文件的質(zhì)量。SP在提供文件下載時(shí),可能會(huì)為用戶提供虛假文件甚至惡意文件,因此需要采取一定的機(jī)制來對(duì)文件的質(zhì)量進(jìn)行評(píng)價(jià)。假定文件可以分為五類,分別是G(good),C(common), N(no response) ,I(inauthentic), M(malicious),評(píng)價(jià)機(jī)制如下:
下載速度和下載文件質(zhì)量?jī)蓚€(gè)值以及節(jié)點(diǎn)的自能力和外能力構(gòu)成了節(jié)點(diǎn)本次下載的評(píng)價(jià)向量,用這個(gè)評(píng)價(jià)向量來描述節(jié)點(diǎn)的服務(wù)質(zhì)量,可以很細(xì)致地刻畫出節(jié)點(diǎn)在提供下載時(shí)的行為。
行為表現(xiàn)向量指在行為發(fā)生之后,節(jié)點(diǎn)代理通過對(duì)行為發(fā)生時(shí)實(shí)時(shí)監(jiān)控得出的真實(shí)值,為和行為預(yù)期向量一致,模型也設(shè)置由一個(gè)四維向量組成。
具體表示如下:
影響因子向量是用來描述行為預(yù)期向量和行為表現(xiàn)向量差異的一個(gè)向量。
向量中每個(gè)元素按照下述公式計(jì)算
公式的三個(gè)性質(zhì):
1.公式表達(dá)的是表現(xiàn)和預(yù)期擬合的程度,它的直觀表示為在數(shù)軸上與真實(shí)值靠近的比值。
2.當(dāng)公式的值為正值時(shí),表示行為表現(xiàn)小于預(yù)期。當(dāng)公式的值為負(fù)值的時(shí)候,表示行為表現(xiàn)好于預(yù)期。當(dāng)公式的值為0時(shí),表示行為表現(xiàn)與預(yù)期相符,不過這種情況很少出現(xiàn)。
3.對(duì)于一個(gè)節(jié)點(diǎn)來講,表現(xiàn)出不真實(shí)的行為固然是我們不希望的,但是如果表現(xiàn)的行為好于預(yù)期的話要對(duì)這種情況有所記錄,所應(yīng)用的公式要能對(duì)這種情況有所體現(xiàn)。為了體現(xiàn)這一點(diǎn),公式進(jìn)行了一定的變形,對(duì)于表現(xiàn)差于預(yù)期的加1,表現(xiàn)好于預(yù)期的減1。
模型的計(jì)算流程如圖1所示:
圖1 模型計(jì)算流程
SR向SP發(fā)出服務(wù)請(qǐng)求后,在自己的鄰居節(jié)點(diǎn)中尋求推薦信息,處于同一時(shí)間段的對(duì)影響因子向量加權(quán)平均,處于不同時(shí)間段的推薦信息引入時(shí)間衰減因子加權(quán)平均。推薦可信度計(jì)算方式如下:
則RP的信任向量為:
權(quán)重x1和x2是用戶根據(jù)自己的要求預(yù)先指定的值。
本節(jié)進(jìn)行實(shí)驗(yàn)仿真。硬件環(huán)境為:CPU為P4 2.93GHz,內(nèi)存為2G,硬盤為120G。軟件環(huán)境為: Windows XP SP2,sun JDK1.4.08,IBM MyEclipse5.5.1GA,Peersim1.0.4。
在仿真實(shí)驗(yàn)中,假設(shè)有50種每種1000個(gè)共計(jì)50000個(gè)文件,隨機(jī)分布在1000個(gè)節(jié)點(diǎn)上。每個(gè)節(jié)點(diǎn)在整個(gè)仿真過程中每次選擇一個(gè)自己沒有的文件進(jìn)行下載。若最后用戶擁有該文件則稱為下載成功,否則稱為下載失敗。下載成功的次數(shù)占總下載次數(shù)的比值稱為下載成功率。
由于推薦信息中每一維的量綱不一樣,所以利用指數(shù)化處理方法消去各維的量綱。上文提到這種變換是不改變數(shù)據(jù)分布的。為了驗(yàn)證這一觀點(diǎn),隨機(jī)選取了十組推薦信息進(jìn)行測(cè)試,結(jié)果如圖2所示:
圖2.指數(shù)化方法處理數(shù)據(jù)對(duì)推薦可信度的影響
因?yàn)橹笖?shù)化處理方法是線性變換,而線性變換不會(huì)改變數(shù)據(jù)集的分布形狀,所以從圖2可以看出,這十組數(shù)據(jù)在指數(shù)化處理前后的推薦可信度相差無幾。
圖3.對(duì)惡意節(jié)點(diǎn)的識(shí)別成功率
如圖3所示,實(shí)驗(yàn)結(jié)果表明本模型對(duì)惡意節(jié)點(diǎn)的識(shí)別成功率較高,在惡意節(jié)點(diǎn)比例為10%時(shí)甚至接近于100%。
建立信任機(jī)制是解決P2P網(wǎng)絡(luò)安全問題的一種重要途徑。論文建立了動(dòng)態(tài)的P2P網(wǎng)絡(luò)信任模型,給出了可信度計(jì)算方法。仿真實(shí)驗(yàn)表明,模型識(shí)別惡意節(jié)點(diǎn)時(shí)準(zhǔn)確率較高,具有較高的安全性。但是,模型參數(shù)均為估計(jì)值,如何選擇最優(yōu)參數(shù)缺乏較好的算法,下一步工作將圍繞這方面展開。
[1]B Wang,y,vassileva J.Trust and reputation model in peer-topeer networks peer-to-peer Computing[A].Third International Conference[C].2003,1-3 Sept.:150-157.
[2]Lee,E.J.Factors influence consumer trust in human-computer interaction: an exam ination of interface factors and the moderating influences[D].Tennessee University Doctor Paper,2002.
[3]田春岐,鄒仕洪,王文東等.一種基于推薦證據(jù)的有效抗攻擊P2P網(wǎng)絡(luò)信任模型[J].計(jì)算機(jī)學(xué)報(bào),2008,(2).
[4]張騫,張霞,文學(xué)志等.Peer-to-Peer環(huán)境下多粒度Trust模型構(gòu)造.軟件學(xué)報(bào)[J].2006,(1).
[5]李小勇,桂小林等.大規(guī)模分布式環(huán)境下動(dòng)態(tài)信任模型研究[J].軟件學(xué)報(bào),2007,(6):1510-1521.
TP338.8
A
1673-2219(2011)04-0062-05
2011-01-15
薛凌云(1973-),女,湖南邵陽(yáng)人,邵陽(yáng)教育學(xué)院講師。
(責(zé)任編校:京華)