基于BP模型的KAD網(wǎng)絡(luò)核心節(jié)點(diǎn)識(shí)別算法研究

2013-08-07 11:32:42馮偉森邱興超

計(jì)算機(jī)工程與應(yīng)用 2013年7期

關(guān)鍵詞：樣本核心節(jié)點(diǎn)

王建，馮偉森，邱興超，劉繼，盧林

WANG Jian1，2,FENG Weisen1,QIU Xingchao1,LIU Ji1,LU Lin1

1.四川大學(xué) 計(jì)算機(jī)學(xué)院，成都 610041

2.四川大學(xué) 錦城學(xué)院計(jì)算機(jī)科學(xué)與軟件工程系，成都 611731

◎網(wǎng)絡(luò)、通信、安全◎

基于BP模型的KAD網(wǎng)絡(luò)核心節(jié)點(diǎn)識(shí)別算法研究

王建1，2，馮偉森1，邱興超1，劉繼1，盧林1

WANG Jian1，2,FENG Weisen1,QIU Xingchao1,LIU Ji1,LU Lin1

1.四川大學(xué) 計(jì)算機(jī)學(xué)院，成都 610041

2.四川大學(xué) 錦城學(xué)院計(jì)算機(jī)科學(xué)與軟件工程系，成都 611731

針對(duì)在KAD網(wǎng)絡(luò)中核心節(jié)點(diǎn)的識(shí)別問(wèn)題，提出了一種基于BP模型對(duì)節(jié)點(diǎn)重要程度進(jìn)行實(shí)時(shí)判定的方法。結(jié)合KAD網(wǎng)絡(luò)測(cè)量的結(jié)果，對(duì)網(wǎng)絡(luò)中核心節(jié)點(diǎn)的屬性特征進(jìn)行提取和歸一化處理，獲得了一組可分離度較高特征集合。采用MatLab設(shè)計(jì)相應(yīng)的學(xué)習(xí)算法對(duì)BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練，使結(jié)果收斂于預(yù)定誤差區(qū)間。將完成訓(xùn)練的BP網(wǎng)絡(luò)模型應(yīng)用于對(duì)測(cè)試節(jié)點(diǎn)的判定，實(shí)驗(yàn)結(jié)果表明該方法可以實(shí)時(shí)地完成核心節(jié)點(diǎn)的判定，并且識(shí)別準(zhǔn)確率可達(dá)到約70%。

反向傳播算法；KAD網(wǎng)絡(luò)；核心節(jié)點(diǎn)；識(shí)別

1 引言

網(wǎng)絡(luò)節(jié)點(diǎn)的排序問(wèn)題是復(fù)雜網(wǎng)絡(luò)中的一個(gè)基本和重要問(wèn)題，被廣泛應(yīng)用于數(shù)據(jù)挖掘、網(wǎng)絡(luò)分析、網(wǎng)絡(luò)預(yù)測(cè)、網(wǎng)絡(luò)安全與控制等領(lǐng)域。隨著復(fù)雜網(wǎng)絡(luò)研究的深入發(fā)現(xiàn)，大量真實(shí)的網(wǎng)絡(luò)既不是規(guī)則的，也非完全隨機(jī)的。因此，有效地評(píng)估和度量網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性，不但是網(wǎng)絡(luò)數(shù)據(jù)挖掘的首要問(wèn)題，也是復(fù)雜網(wǎng)絡(luò)、社會(huì)關(guān)系網(wǎng)和互聯(lián)網(wǎng)搜索、系統(tǒng)科學(xué)的研究重點(diǎn)[1]。KAD是P2P技術(shù)歷經(jīng)10年發(fā)展后的新一代DHT網(wǎng)絡(luò)[2]，其去中心化、可測(cè)量、易擴(kuò)展、高容錯(cuò)性等優(yōu)點(diǎn)使它迅速滲透到文件共享、即時(shí)通訊、分布式存儲(chǔ)、云存儲(chǔ)等領(lǐng)域。這種無(wú)中心服務(wù)器的設(shè)計(jì)使得各個(gè)節(jié)點(diǎn)相對(duì)平等，既是服務(wù)的提供者，又是服務(wù)的請(qǐng)求者。KAD網(wǎng)絡(luò)的發(fā)展使其并發(fā)用戶已達(dá)到數(shù)百萬(wàn)級(jí)，海量的用戶使得對(duì)于網(wǎng)絡(luò)的控制和監(jiān)管變得十分困難。大量網(wǎng)絡(luò)測(cè)量實(shí)驗(yàn)表明，DHT網(wǎng)絡(luò)中節(jié)點(diǎn)負(fù)載非均衡性廣泛存在[3-5]。可以將那些在KAD網(wǎng)絡(luò)中為其他節(jié)點(diǎn)提供了更多路由服務(wù)或下載服務(wù)的節(jié)點(diǎn)稱(chēng)為核心（重要或關(guān)鍵）節(jié)點(diǎn)。如果能利用這種非均衡性，發(fā)現(xiàn)和識(shí)別網(wǎng)絡(luò)中發(fā)揮了核心作用的節(jié)點(diǎn)，則是對(duì)KAD網(wǎng)絡(luò)的監(jiān)督將有著重要的作用。

2 相關(guān)工作

基于鏈接的節(jié)點(diǎn)排序是網(wǎng)絡(luò)分析中的一個(gè)核心任務(wù)，它通過(guò)圖中節(jié)點(diǎn)之間鏈接表現(xiàn)出的重要性不同對(duì)節(jié)點(diǎn)進(jìn)行排序。目前國(guó)內(nèi)外研究者對(duì)節(jié)點(diǎn)排序方法有四種典型的方式[6]：一是基于純粹網(wǎng)絡(luò)靜態(tài)參數(shù)指標(biāo)來(lái)進(jìn)行衡量節(jié)點(diǎn)的關(guān)鍵程度，常用評(píng)價(jià)指標(biāo)有點(diǎn)中心度、凝聚中心度、子圖中心度、網(wǎng)絡(luò)流中心度等等?；趥鹘y(tǒng)的靜態(tài)社會(huì)分析方法有著明顯的缺點(diǎn)，它忽略引起網(wǎng)絡(luò)狀態(tài)變化的重要因素[7]，從而造成信息缺失問(wèn)題。例如，不注重個(gè)體之間的連接關(guān)系、相關(guān)個(gè)體之間的相互影響以及隨時(shí)間變化趨勢(shì)[8]。二是借鑒圖分割方法中標(biāo)準(zhǔn)來(lái)進(jìn)行衡量，即找出圖中的割點(diǎn)作為核心節(jié)點(diǎn)，因?yàn)閯h除該節(jié)點(diǎn)后可以將圖割裂為多個(gè)子圖[9]。三是使用搜索引擎中節(jié)點(diǎn)排序的思想來(lái)進(jìn)行核心節(jié)點(diǎn)發(fā)現(xiàn)排序，其主要的思想是基于隨機(jī)行走模型[10]。四是使用基于統(tǒng)計(jì)方法或數(shù)據(jù)挖掘的算法，如頻繁項(xiàng)集[11-12]、隱空間模型[13]、兩階聚類(lèi)等經(jīng)典模型。數(shù)據(jù)挖掘算法中以使用頻繁項(xiàng)集的方法最為典型，但目前這些方法存在著節(jié)點(diǎn)判斷的滯后性這個(gè)明顯的缺點(diǎn)，即對(duì)于節(jié)點(diǎn)的重要程度的差別需要較大的時(shí)間和空間復(fù)雜度為代價(jià)才能得到，而無(wú)法實(shí)時(shí)地對(duì)一個(gè)未知節(jié)點(diǎn)進(jìn)行判定。這在一些實(shí)時(shí)性要求較高的應(yīng)用場(chǎng)景下將有著較大的限制。

3 核心節(jié)點(diǎn)評(píng)價(jià)算法

在KAD網(wǎng)絡(luò)中，核心節(jié)點(diǎn)是指那些對(duì)網(wǎng)絡(luò)的基本服務(wù)起著重要作用的節(jié)點(diǎn)，它們實(shí)際提供了更多其他節(jié)點(diǎn)的訪問(wèn)、路由工作，其定義表示如下[14]：

定義2（關(guān)鍵字熱點(diǎn)）在任一區(qū)域Zx中，假設(shè)該區(qū)域中節(jié)點(diǎn)的索引Ia，若每個(gè)節(jié)點(diǎn)接受的訪問(wèn)數(shù)量為Ca。給定一個(gè)關(guān)鍵字訪問(wèn)次數(shù)閥值c，若Ca＞c則稱(chēng)Ia為一個(gè)關(guān)鍵字熱點(diǎn)。當(dāng)其共有n個(gè)索引時(shí)，該節(jié)點(diǎn)的訪問(wèn)次數(shù)為其所有索引被訪問(wèn)次數(shù)之和：

定義3（核心節(jié)點(diǎn)）在任一區(qū)域Zx中，若節(jié)點(diǎn)A是一個(gè)路由熱點(diǎn)，或節(jié)點(diǎn)A是一個(gè)關(guān)鍵字節(jié)點(diǎn)，若在給定的時(shí)間T內(nèi)，A收到的訪問(wèn)次數(shù)R大于給定的閥值c，則A為一個(gè)核心節(jié)點(diǎn)。

神經(jīng)網(wǎng)絡(luò)是一個(gè)多學(xué)科交叉領(lǐng)域，它通過(guò)模仿人的大腦思維來(lái)挖掘海量數(shù)據(jù)背面的潛在規(guī)律，已在各個(gè)領(lǐng)域中得到了廣泛應(yīng)用，并取得了很多重要的成果。采用BP網(wǎng)絡(luò)對(duì)當(dāng)前已獲取到的樣本節(jié)點(diǎn)進(jìn)行學(xué)習(xí)，期望挖掘出有價(jià)值的規(guī)律，以便對(duì)未知節(jié)點(diǎn)進(jìn)行更加實(shí)時(shí)準(zhǔn)確的判定。圖1顯示了使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測(cè)試的整個(gè)流程，其中關(guān)鍵的環(huán)節(jié)在于樣本特征提取和處理及網(wǎng)絡(luò)訓(xùn)練兩個(gè)步驟。

圖1 樣本數(shù)據(jù)訓(xùn)練流程圖

圖1中特征提取是指根據(jù)訓(xùn)練目標(biāo)，從一組特征集合中選取一組最好的子集。為了處理方便，還需對(duì)特征數(shù)據(jù)進(jìn)行歸一化預(yù)處理，使其值均在[0，1]區(qū)間內(nèi)變化。下面對(duì)KAD中可用的特征屬性進(jìn)行歸納和改進(jìn)。

（1）R′c：返回節(jié)點(diǎn)的有效率

KAD每一次查詢(xún)中，若該點(diǎn)不為目標(biāo)節(jié)點(diǎn)時(shí)，會(huì)為請(qǐng)求者返回α個(gè)路由表中更靠近的節(jié)點(diǎn)。從KAD路由選擇算法中可看出，當(dāng)鄰居節(jié)點(diǎn)收到請(qǐng)求后，先從對(duì)應(yīng)K桶中選出指定數(shù)量的節(jié)點(diǎn)，當(dāng)該桶中節(jié)點(diǎn)數(shù)量小于指定數(shù)量時(shí)，則從鄰近的K桶中進(jìn)行選取。那么，只要路由表中的節(jié)點(diǎn)總量不小于指定返回的節(jié)點(diǎn)數(shù)量，就一定會(huì)返回指定數(shù)量的節(jié)點(diǎn)。當(dāng)各個(gè)鄰居節(jié)點(diǎn)若在線，每次提供的下一跳路由節(jié)點(diǎn)的數(shù)量均相等。因此，采用數(shù)量計(jì)算并不能使其具有較好地可分離性，這里使用返回節(jié)點(diǎn)的有效率來(lái)進(jìn)行衡量，計(jì)算公式如下所示：

其中，Bn表示節(jié)點(diǎn)I返回的下一跳的路由節(jié)點(diǎn)總數(shù)，Ln則為當(dāng)前仍在線的節(jié)點(diǎn)數(shù)量。對(duì)于Ln值的獲取，可以在鄰居節(jié)點(diǎn)返回信息后，使用Ping操作探測(cè)其中仍在線節(jié)點(diǎn)數(shù)量。該值反映了一個(gè)鄰居節(jié)點(diǎn)返回的路由信息中，仍然有效的節(jié)點(diǎn)占所有返回總量的比例。

人像蠶一樣拼命織關(guān)系的網(wǎng)，但織成之后，卻又千方百計(jì)逃之夭夭。范堅(jiān)強(qiáng)給了一杭一個(gè)逃離的機(jī)會(huì)，可以放下一切，每日枕著書(shū)香入眠。一杭成為這間石屋實(shí)質(zhì)上的主人以后，范堅(jiān)強(qiáng)給他送來(lái)了書(shū)，讓他在漫長(zhǎng)的白天與黑夜，不至于孤獨(dú)。但單純的生活結(jié)束了，石屋的門(mén)終于打開(kāi)來(lái)。

（2）S′c：平均異或距離

在KAD中以跳數(shù)作為度量依據(jù)，并不能準(zhǔn)確地表明節(jié)點(diǎn)之間的距離，這里采用平均異或距離進(jìn)行度量。此值描述了對(duì)一個(gè)節(jié)點(diǎn)進(jìn)行詢(xún)問(wèn)后，返回結(jié)果能更接近目標(biāo)節(jié)點(diǎn)的程度，反映了該點(diǎn)在一次查詢(xún)過(guò)程中所起到的作用。若節(jié)點(diǎn)I共返回n個(gè)路由節(jié)點(diǎn)，則節(jié)點(diǎn)I的平均距離值由下列公式計(jì)算得到：

式中，ri代表I的一個(gè)返回節(jié)點(diǎn)，s與d分別代表請(qǐng)求節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)。從上式容易看出，當(dāng)返回的距離越大，則表明通過(guò)節(jié)點(diǎn)I的查詢(xún)后，與目標(biāo)節(jié)點(diǎn)的位置將更接近。

（3）T′t：處理查詢(xún)返回時(shí)間

該值越大表明了被查詢(xún)節(jié)點(diǎn)處理性能更高。通常將發(fā)出消息和接收消息的時(shí)間間隔作為其往返時(shí)間。為了處理的方便，設(shè)定一個(gè)固定的TTL基數(shù)作為參照物，若小于此值則也近似地認(rèn)為與此值相等，這里將TTL設(shè)定為2 000 ms。則該值由以下公式?jīng)Q定，其中Mt為返回時(shí)間中最大的一個(gè)值，也可設(shè)置一個(gè)固定的較大數(shù)值：

（4）R′i：節(jié)點(diǎn)返回查詢(xún)數(shù)量比

該值反映了一個(gè)目標(biāo)節(jié)點(diǎn)返回的文件數(shù)量占所有返回結(jié)果數(shù)量中的比例。采用如下公式進(jìn)行計(jì)算：

其中，Rc表明本次查詢(xún)所有節(jié)點(diǎn)返回的文件總和，但該值僅針對(duì)有返回結(jié)果的節(jié)點(diǎn)才可適用。由于不能保證測(cè)試的節(jié)點(diǎn)均為有存儲(chǔ)結(jié)果返回的節(jié)點(diǎn)，因此，需要對(duì)經(jīng)過(guò)多個(gè)節(jié)點(diǎn)路由轉(zhuǎn)發(fā)得到的R′i進(jìn)處理，確定每個(gè)節(jié)點(diǎn)的R′i值的大小。這里的基本思想是按各點(diǎn)的S′c的大小來(lái)按比例分配，S′c反映了節(jié)點(diǎn)推薦的路由節(jié)點(diǎn)接近目標(biāo)的程度。即節(jié)點(diǎn)I推薦節(jié)點(diǎn)的距離越大，使得請(qǐng)求節(jié)點(diǎn)能更接近目標(biāo)，則I所分到的R′i值則越多。其值的計(jì)算公式如下：

（5）F′d：節(jié)點(diǎn)返回查詢(xún)質(zhì)量比

該值反映了某點(diǎn)對(duì)查詢(xún)返回結(jié)果文件名與查詢(xún)?cè)~的平均匹配程度，它的計(jì)算公式如下：

Fi代表了一個(gè)返回文件與查詢(xún)關(guān)鍵字的匹配程度；n代表某點(diǎn)所有返回的文件數(shù)量；c為不同節(jié)點(diǎn)返回的文件索引數(shù)量的總和。其值越大，表明本次查詢(xún)所返回的值更好地匹配了關(guān)鍵字查詢(xún)要求。

由于該值也僅適合于計(jì)算有返回結(jié)果的情況，因此，參照上一特征值處理過(guò)程，對(duì)其值使用以下公式進(jìn)行轉(zhuǎn)化：

通過(guò)以上的處理過(guò)程，可以得到一個(gè)歸一化后的特征集合＜R′c，S′c，N′m，R′i，F(xiàn)′d＞。該集合中所有取值都已限定在[0，1]范圍中變化。

為了進(jìn)行訓(xùn)練，需要收集正反例樣本進(jìn)行學(xué)習(xí)與測(cè)試。訓(xùn)練樣本的采集工具使用了自設(shè)計(jì)的軟件KFetch[14]對(duì)網(wǎng)絡(luò)拓?fù)淇煺者M(jìn)行獲取，采用社會(huì)網(wǎng)絡(luò)中凝聚中心度指標(biāo)和隨機(jī)行走算法對(duì)節(jié)點(diǎn)進(jìn)行評(píng)價(jià)，將兩種算法共同評(píng)價(jià)為核心和非核心的節(jié)點(diǎn)選出。測(cè)試的時(shí)間開(kāi)始于2012年2 月4日20：00，采樣時(shí)間持續(xù)40 min。這里選取了已有的核心節(jié)點(diǎn)作為正例樣本，選擇其中60%的節(jié)點(diǎn)作為訓(xùn)練樣本，將余下的節(jié)點(diǎn)作為測(cè)試樣本，產(chǎn)生了所需的訓(xùn)練樣本和測(cè)試樣本集。

4 實(shí)驗(yàn)過(guò)程與結(jié)果分析

針對(duì)不同的目的，可以在上述特征集中選取適合的子集進(jìn)行訓(xùn)練。從KAD的消息類(lèi)型可知，其主要有四種基本的RPC（Remote Process Command，RPC）。與查詢(xún)相關(guān)的包括節(jié)點(diǎn)查詢(xún)和關(guān)鍵字查詢(xún)操作。由于兩種消息用于不同的場(chǎng)景，因此其特征值子集也不相同。將兩種消息命令與上面的特征集合進(jìn)行一個(gè)映射后，選取適合的特征屬性建立對(duì)應(yīng)的特征子集。

將與Find_Node相關(guān)的特征集合標(biāo)記為Cn，選取與其對(duì)應(yīng)的特征有＜R′c，S′c，N′m＞。因?yàn)樵谝怨?jié)點(diǎn)為目標(biāo)的查詢(xún)中，其返回的結(jié)果只有兩種可能性，即能命中或不能目標(biāo)。因此，對(duì)于返回結(jié)果的處理相對(duì)簡(jiǎn)單，則記為C′n=＜R′c，S′c，N′m＞。選擇與Find_Value相關(guān)的特征集合標(biāo)記為Vn，則與其對(duì)應(yīng)的特征有＜R′c，S′c，N′m，R′i，F(xiàn)′d＞。該特征集合中含有查詢(xún)結(jié)果索引及索引結(jié)果質(zhì)量，這樣可以更全面地考核用戶查詢(xún)后結(jié)果的命中情況，記為Vn= ＜R′c，S′c，N′m，R′i，F(xiàn)′d＞。

使用Find_Node采集節(jié)點(diǎn)的特征屬性。先將該區(qū)域劃分為?個(gè)部分，在各部分中隨機(jī)挑選一個(gè)節(jié)點(diǎn)ID作為待查詢(xún)目標(biāo)ID。這樣做的目的是更有效地考察某點(diǎn)到各個(gè)距離位置的情況。?個(gè)測(cè)試服務(wù)器分別選定一個(gè)ID的鄰居來(lái)生成客戶端ID。開(kāi)始測(cè)試時(shí)需保證一定的節(jié)點(diǎn)已將?個(gè)節(jié)點(diǎn)的加入自己的路由表中。實(shí)驗(yàn)中參數(shù)?設(shè)定為8，先對(duì)通過(guò)前面選的核心節(jié)點(diǎn)進(jìn)行特征采集，測(cè)試時(shí)間持續(xù)25 min，完成所有待訓(xùn)練和測(cè)試節(jié)點(diǎn)的樣本所需特征值的獲取。

將得到的歸一化處理后的樣本數(shù)據(jù)組成為學(xué)習(xí)和訓(xùn)練樣本，格式為：L=T=＜R′c，S′c，N′m，E＞。E為該節(jié)點(diǎn)的對(duì)應(yīng)期望取值，即該節(jié)點(diǎn)為核心節(jié)點(diǎn)的概率。由于希望輸出結(jié)果為一個(gè)概率值，因此在進(jìn)行重要程度排序的時(shí)候，不能將一個(gè)最重要的節(jié)點(diǎn)與一般重要節(jié)點(diǎn)進(jìn)行等同，這樣將降低結(jié)果的精度。因此，需要將上述兩種算法得到的核心節(jié)點(diǎn)進(jìn)行相應(yīng)變換操作。其方法是取兩種方式所共同選中的核心節(jié)點(diǎn)，按重要程度排序后，對(duì)應(yīng)指定結(jié)果的概率范圍為[0.6，1]。即將所有核心節(jié)點(diǎn)進(jìn)行5等分，每一部分區(qū)域中的節(jié)點(diǎn)給定一個(gè)對(duì)應(yīng)的概率期望值，對(duì)反例樣本的處理也是按此方法進(jìn)行。將這樣組成后的訓(xùn)練樣本送入網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí)，這里的實(shí)驗(yàn)中對(duì)學(xué)習(xí)誤差設(shè)置為0.001。隱層神經(jīng)元個(gè)數(shù)取輸入層的1.4倍，即設(shè)置為5個(gè)，輸入層的傳遞函數(shù)設(shè)置S型正切函數(shù)tansig，輸出層的傳遞函數(shù)S型對(duì)數(shù)函數(shù)logsin，采用負(fù)梯度權(quán)值修正方法。為了降低編碼的難度，其學(xué)習(xí)和測(cè)試過(guò)程均使用了MatLab[15]工具箱中的神經(jīng)元組件進(jìn)行實(shí)驗(yàn)，程序清單如下所示，其中輸入數(shù)據(jù)整理為矢量形式，其值對(duì)應(yīng)變量P，輸出的期望值也按矢量方式賦值于變量T。

上面代碼中minmax（P）是指以輸入數(shù)據(jù)中的最大和最小值為訓(xùn)練數(shù)據(jù)的變化范圍，net_1為訓(xùn)練后得到的輸出網(wǎng)絡(luò)。

通過(guò)多步的網(wǎng)絡(luò)訓(xùn)練可得到了滿足誤差要求的樣本數(shù)據(jù)擬合情況，實(shí)驗(yàn)結(jié)果如圖2所示。

圖2 Find_Node特征學(xué)習(xí)擬合效果圖

由圖2可以看出，當(dāng)學(xué)習(xí)的次數(shù)到達(dá)889時(shí)，則誤差已經(jīng)控制在指定的范圍了。將該訓(xùn)練完成的網(wǎng)絡(luò)輸出結(jié)果概率與期望值進(jìn)行對(duì)比，將誤差范圍在0.2之內(nèi)的均認(rèn)為成功。那么，其中正例樣本識(shí)別達(dá)到78.3%，反例樣本的識(shí)別率達(dá)到了67.1%。將訓(xùn)練好的網(wǎng)絡(luò)模型在實(shí)際的KAD中進(jìn)行了驗(yàn)證，采用KFetch工具對(duì)節(jié)點(diǎn)關(guān)系進(jìn)行獲取后，抽取出在線節(jié)點(diǎn)的對(duì)應(yīng)屬性集送入模型中進(jìn)行判定。每次實(shí)驗(yàn)時(shí)間持續(xù)30 min，實(shí)驗(yàn)共重復(fù)5次，對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行統(tǒng)計(jì)和分析。同時(shí)，將識(shí)別結(jié)果與使用凝聚中心度與隨機(jī)行走算法所篩選出的核心節(jié)點(diǎn)進(jìn)行對(duì)比，結(jié)果顯示采用BP模型的核心節(jié)點(diǎn)識(shí)別率平均為63.8%。雖然實(shí)際網(wǎng)絡(luò)中識(shí)別率略低于訓(xùn)練結(jié)果，但仍可證明該方法具有一定的可行性和實(shí)用性。

5 小結(jié)

本文通過(guò)利用測(cè)量實(shí)驗(yàn)收集KAD節(jié)點(diǎn)的屬性特征，并根據(jù)查詢(xún)命令選取了對(duì)應(yīng)的特征子集進(jìn)行實(shí)驗(yàn)。從實(shí)驗(yàn)結(jié)果可以看出，由于網(wǎng)絡(luò)中節(jié)點(diǎn)的動(dòng)態(tài)性命使得識(shí)別效率仍有待提高，但這種實(shí)時(shí)的判定方法可有效地解決判定的滯后性，具有更廣闊的應(yīng)用前景。為了改進(jìn)識(shí)別的準(zhǔn)確性，今后，將重點(diǎn)對(duì)節(jié)點(diǎn)的屬性進(jìn)行更為深入的研究。從上可知，BP網(wǎng)絡(luò)性能的高低主要取決于兩個(gè)因素：抽取的節(jié)點(diǎn)屬性特征數(shù)量和選擇的屬性特征質(zhì)量。尋找有效的節(jié)點(diǎn)屬性特征需要更深入地對(duì)KAD網(wǎng)絡(luò)中節(jié)點(diǎn)進(jìn)行分析，抽取出節(jié)點(diǎn)有效屬性特征來(lái)豐富屬性集合。其次，嘗試采用其他模式識(shí)別的方法，如模擬退火算法、Tabu搜索算法和遺傳算法等[16]，可以對(duì)現(xiàn)有的特征屬性進(jìn)行適當(dāng)?shù)刈冃?、?jì)算和提取，以得到更佳的具有可分屬特征值，從而有效地提升核心節(jié)點(diǎn)識(shí)別的準(zhǔn)確率。

[1]何建軍，李仁發(fā).改進(jìn)的隨機(jī)游走模型節(jié)點(diǎn)排序方法[J].計(jì)算機(jī)工程與應(yīng)用，2011，47（12）：87-89.

[2]Maymounkov P，Mazieres D.Kademlia：a peer-to-peer informaticssystem based on theXOR metric[C]//Proceedings of the 1th International Workshop on P2P Systems，2002：53-65.

[3]蔣君，鄧倩妮.eMule系統(tǒng)中的非均勻性分布[J].微電子學(xué)與計(jì)算機(jī)，2007，24（10）：153-156.

[4]熊偉，謝冬青，焦炳旺，等.一種結(jié)構(gòu)化P2P的自適應(yīng)負(fù)載均衡方法[J].軟件學(xué)報(bào)，2009，20（3）：661-663.

[5]李振宇，謝高崗.基于DHT的P2P負(fù)載均衡算法[J].計(jì)算機(jī)研究與發(fā)展，2006，43（9）：1579-1580.

[6]周春光，曲鵬程，王曦，等.DSNE：一個(gè)新的動(dòng)態(tài)社會(huì)網(wǎng)絡(luò)分析算法[J].吉林大學(xué)學(xué)報(bào)：工學(xué)版，2008，38（2）：408-411.

[7]Cai Hua，Zhou Chunguang，Wang Zhe，et al.Algorithm research on community mining from dynamic social network[J].Journal of Jinlin University，2008，26（4）：380-382.

[8]Berger-Wolf T Y，Saia J.A framework for analysis of dynamic social networks[C]//Proceeding of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining，2006，12：523-528.

[9]赫南，李德毅，淦文燕，等.復(fù)雜網(wǎng)絡(luò)中重要性節(jié)點(diǎn)發(fā)掘綜述[J].計(jì)算機(jī)科學(xué)，2007，34（12）：1-4.

[10]郭軍，李明輝，董社勤，等.隨機(jī)行走的電路分析應(yīng)用及并行化改進(jìn)[J].計(jì)算機(jī)工程與應(yīng)用，2010，46（18）：199-201.

[11]鄧忠軍，宋威，鄭雪峰，等.P2P網(wǎng)絡(luò)中最大頻繁項(xiàng)集挖掘算法研究[J].計(jì)算機(jī)應(yīng)用研究，2010，27（9）：3490-3492.

[12]宋文軍，劉紅星，王崇駿，等.以圖頻繁集為基礎(chǔ)的核心節(jié)點(diǎn)發(fā)現(xiàn)[J].計(jì)算機(jī)科學(xué)與探索，2010，4（1）：82-85.

[13]Sarkar P.Dynamic social network analysis using latent space models[C]//ProceedingsoftheACM SIGKDD Explorations Newsletter，2005：31-35.

[14]王建.基于KAD網(wǎng)絡(luò)監(jiān)督的關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D].成都：四川大學(xué)，2012.

[15]飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與MATLAB7實(shí)現(xiàn)[M]// MATLAB應(yīng)用技術(shù).北京：電子工業(yè)出版社，2005：4-90.

[16]邊肇祺，張學(xué)工.模式識(shí)別[M].北京：清華大學(xué)出版社，2006：176-208.

1.College of Computer,Sichuan University,Chengdu 610041,China

2.Department of Computer Science and Software Engineering,Jincheng College of Sichuan University,Chengdu 611731,China

In view of the core node recognition in the KAD（Kademlia）,a model based on BP is presented to determine whether a node is core node in real time.According to the result of the measurement for KAD,some attribute characteristics extraction and normalization processing is implemented to obtain an attribute set with higher separable degree.An algorithm in MatLab is designed to train the BP network until the results limit in a predetermined error range.In addition,the trained BP model is adapt to test prepared data,the results of the experiment show that the method can judge a node degrees of importance,and the recognition accuracy rate is up to about 70%.

Back-Prorogation（BP）;KAD network;core node;recognition

TP393

10.3778/j.issn.1002-8331.1210-0276

WANG Jian,FENG Weisen,QIU Xingchao,et al.Study of recognition algorithm for core node in kad network based on BP model.Computer Engineering and Applications,2013,49（7）：72-75.

王建（1979—），男，博士，講師，研究領(lǐng)域?yàn)榫W(wǎng)絡(luò)安全與應(yīng)用；馮偉森（1962—），男，副教授，研究方向?yàn)榫W(wǎng)絡(luò)信息系統(tǒng)。E-mail：wj_98@163.com

2012-10-26

2012-12-28

1002-8331（2013）07-0072-04

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于BP模型的KAD網(wǎng)絡(luò)核心節(jié)點(diǎn)識(shí)別算法研究

1 引言

2 相關(guān)工作

3 核心節(jié)點(diǎn)評(píng)價(jià)算法

4 實(shí)驗(yàn)過(guò)程與結(jié)果分析

5 小結(jié)