唐晶晶,張玉瑛,黃自強(qiáng),龍 佳
(湖南人文科技學(xué)院 計(jì)算機(jī)科學(xué)技術(shù)系,湖南 婁底 417000)
當(dāng)今,Internet在人們生活中各個(gè)方面起著非常重要的作用,文件共享是目前Internet上最主要、最成功的P2P應(yīng)用,可以說文件共享的需求直接引發(fā)了P2P技術(shù)的產(chǎn)生與開發(fā)熱潮[1],而且文件共享應(yīng)用已經(jīng)成為當(dāng)今互聯(lián)網(wǎng)流量的重要組成部分[2-3]。因此,P2P文件共享系統(tǒng)的節(jié)點(diǎn)行為特征研究是整個(gè)網(wǎng)絡(luò)通信領(lǐng)域研究的熱點(diǎn)之一。P2P文件共享系統(tǒng)的節(jié)點(diǎn)行為特征研究需要解決的一個(gè)關(guān)鍵問題是如何準(zhǔn)確地刻畫文件的復(fù)制傳播特性。文件復(fù)制傳播特性的研究有兩個(gè)方面的意義:一是加深研究對(duì)P2P文件共享系統(tǒng)的認(rèn)識(shí),包括定性和定量的認(rèn)識(shí);二是為P2P文件共享系統(tǒng)的流量分析和控制提供指導(dǎo)。
由于P2P文件共享系統(tǒng)中文件復(fù)制傳播范圍很廣,而且具有突發(fā)性,通過在真實(shí)網(wǎng)絡(luò)環(huán)境中觀測(cè)來精確地研究其傳播特征是不可行的。通過統(tǒng)計(jì)分析的方法來仿真建模是進(jìn)行研究P2P文件共享系統(tǒng)中文件復(fù)制傳播的一種重要的手段。文件復(fù)制傳播模型是通過一組微分方程或者離散的遞歸表達(dá)式來描述文件在網(wǎng)絡(luò)中復(fù)制傳播的統(tǒng)計(jì)規(guī)律和動(dòng)態(tài)過程。由于文件在網(wǎng)絡(luò)中的復(fù)制傳播與流行疾病在人群中傳播有許多相似之處,因此,本文運(yùn)用系統(tǒng)動(dòng)力學(xué)方法提出基于SEIR的文件復(fù)制傳播模型(以下簡(jiǎn)稱SDFCM模型),從定性和定量?jī)蓚€(gè)方面來研究文件在網(wǎng)絡(luò)中復(fù)制傳播的過程。
定義1 S態(tài)是指用戶節(jié)點(diǎn)在提出文件下載請(qǐng)求前,在文件共享系統(tǒng)中搜索和查找文件時(shí)的狀態(tài)。集合S的元素總數(shù)記為s, 時(shí)刻t的S態(tài)節(jié)點(diǎn)總數(shù)記為s( t)。
定義2 P態(tài)是指用戶節(jié)點(diǎn)在提出下載請(qǐng)求后,會(huì)進(jìn)入下載隊(duì)列等待下載完成的狀態(tài),相當(dāng)于疾病傳播模型中的潛伏期態(tài)。集合P 的元素總數(shù)記為p, 時(shí)刻t 的P態(tài)節(jié)點(diǎn)總數(shù)為p( t) 。
定義3 用戶節(jié)點(diǎn)在提出下載請(qǐng)求后,進(jìn)入下載隊(duì)列等待文件下載的時(shí)間段記為π。
定義4 I態(tài)是指當(dāng)用戶節(jié)點(diǎn)下載文件完成后,可能會(huì)共享該文件一段時(shí)間的狀態(tài)。集合I的元素總數(shù)記為i, 時(shí)刻t 的I態(tài)節(jié)點(diǎn)總數(shù)記為i( t) 。
定義5 Q態(tài)是用戶節(jié)點(diǎn)在文件共享系統(tǒng)中搜索和查找文件后,對(duì)該文件不感興趣,沒有提出下載請(qǐng)求后的狀態(tài)。集合Q 的元素總數(shù)記為q, 時(shí)刻t 的Q態(tài)節(jié)點(diǎn)總數(shù)記為q( t) 。
定義6 用戶節(jié)點(diǎn)完成下載文件后并不共享該文件或者共享該文件一段時(shí)間后刪除了該文件,此時(shí)的狀態(tài)為R態(tài)。集合R 的元素總數(shù)記為r, 時(shí)刻t 的R態(tài)節(jié)點(diǎn)總數(shù)記為r( t) 。
用戶節(jié)點(diǎn)狀態(tài)之間的轉(zhuǎn)移關(guān)系如圖1 所示。
圖1 SDFCM模型中用戶節(jié)點(diǎn)狀態(tài)轉(zhuǎn)移關(guān)系圖
在SDFCM模型中,我們給出兩個(gè)基本假設(shè):
1)我們分析的是用戶節(jié)點(diǎn)的統(tǒng)計(jì)變化規(guī)律,使用在一個(gè)時(shí)間段上各種狀態(tài)下用戶節(jié)點(diǎn)的統(tǒng)計(jì)數(shù)目來描述其行為的變化,并通過微分方程來描述用戶節(jié)點(diǎn)在文件傳播過程中行為的變化。
2)環(huán)境封閉原則,即所研究的各種狀態(tài)用戶節(jié)點(diǎn)的總數(shù)量和沒有發(fā)生變化,并假設(shè)所有用戶節(jié)點(diǎn)的總數(shù)為N。
根據(jù)上面的兩個(gè)基本假設(shè)和用戶節(jié)點(diǎn)狀態(tài)轉(zhuǎn)移關(guān)系圖,建立微分方程組。
S態(tài)的用戶節(jié)點(diǎn)數(shù)量隨時(shí)間變化的速度為:
(1)
其中α是單位時(shí)間內(nèi)S態(tài)的用戶節(jié)點(diǎn)對(duì)某種文件感興趣,并提出下載請(qǐng)求的概率,設(shè)α=ω(1-p(t)/N)λ,一般情況下ω=0.5,λ=3[4-5];β是單位時(shí)間內(nèi)S態(tài)的用戶節(jié)點(diǎn)對(duì)某種文件不感興趣,不會(huì)提出下載請(qǐng)求的概率,β=1-α。
P態(tài)的用戶節(jié)點(diǎn)數(shù)量隨時(shí)間變化的速度為:
其中δ是單位時(shí)間內(nèi)P態(tài)的用戶節(jié)點(diǎn)經(jīng)過等待后下載完成并愿意共享該文件的概率,設(shè)δ=δ0(1-i(t)/N)λ/π。
一般情況下,δ0=0.8/N,λ=3,ε=1-δ[4-5]。
I態(tài)的用戶節(jié)點(diǎn)數(shù)量隨時(shí)間變化的速度為:
(3)
其中μ=K/Ts,Ts是I態(tài)的用戶節(jié)點(diǎn)愿意共享該文件的平均時(shí)間,一般情況下K為一個(gè)經(jīng)驗(yàn)值,可以根據(jù)實(shí)際情況而定。
R態(tài)的用戶節(jié)點(diǎn)數(shù)量隨時(shí)間變化的速度為:
(4)
Q態(tài)的用戶節(jié)點(diǎn)數(shù)量隨時(shí)間變化的速度為:
(5)
我們使用BitComet系統(tǒng)中記錄用戶節(jié)點(diǎn)上傳和下載信息的日志文件來構(gòu)造實(shí)驗(yàn)環(huán)境。
實(shí)驗(yàn)環(huán)境說明如下:
1)假設(shè)所有用戶節(jié)點(diǎn)在會(huì)對(duì)其中的某些流行文件感興趣,選取BitComet系統(tǒng)中MP3格式的流行度排名在前5名的文件,它們分別以A,B,…,E來表示,作為我們的實(shí)驗(yàn)數(shù)據(jù)。用戶節(jié)點(diǎn)數(shù)是指系統(tǒng)注冊(cè)號(hào)不同的節(jié)點(diǎn)。
2)由于系統(tǒng)中存在一些不上傳文件的節(jié)點(diǎn),設(shè)節(jié)點(diǎn)共享概率等于系統(tǒng)中既上傳又下載的節(jié)點(diǎn)數(shù)量和所有下載節(jié)點(diǎn)的數(shù)量的比值。
3)平均下載速度定義為所有用戶節(jié)點(diǎn)的下載量除以所有用戶節(jié)點(diǎn)自進(jìn)入下載隊(duì)列排隊(duì)到下載結(jié)束這段時(shí)間的商。平均下載速率除以文件長(zhǎng)度即是單位時(shí)間的下載完成速率。
表1 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)結(jié)果如表1所示??梢钥闯?,用戶日志記錄的下載完成用戶數(shù)據(jù)和實(shí)驗(yàn)結(jié)果相差不大,吻合性很好,說明我們的模型具有很好的實(shí)用性。
本文提出的SDFCM模型能夠比較合理地刻畫P2P文件共享系統(tǒng)中文件復(fù)制傳播過程特征。該模型從定性和定量?jī)蓚€(gè)方面對(duì)文件復(fù)制傳播過程進(jìn)行建模,通過實(shí)驗(yàn)來驗(yàn)證了模型的合理性和實(shí)用性。如何對(duì)模型進(jìn)行改進(jìn),使其能適用于P2文件共享系統(tǒng)規(guī)模動(dòng)態(tài)變化等情況,是今后的研究工作之一。
參考文獻(xiàn):
[1]MOORE D,HEBELER J.對(duì)等網(wǎng)[M].蘇忠,戰(zhàn)曉雷,等譯.北京:清華大學(xué)出版社,2003.
[2]AZURI C , IPOQUE.Internet study 2007:P2P file sharing still dominates the world wide Internet [EB/OL].http://www. ipoqpe.com,2007.
[3]The true picture of Peer-to-Peer file-sharing [EB/OL].http://www. cachelogic.com/researh/Cache-Logic_Analyst_Presnetation_july2004.Pdf, 2004.
[4]戴明強(qiáng),李衛(wèi)軍,楊鵬飛.?dāng)?shù)學(xué)模型及其應(yīng)用[M].北京:科學(xué)出版社,2007.
[5]馬知恩.傳染病動(dòng)力學(xué)的建模和研究[M].北京:科學(xué)出版社,2004.