国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

挖掘算法在高速網(wǎng)絡(luò)流頻繁項(xiàng)計(jì)算中的實(shí)驗(yàn)應(yīng)用

2018-07-18 05:30:38盧來鄧文吳紹軍黃錦煥
現(xiàn)代計(jì)算機(jī) 2018年18期
關(guān)鍵詞:流長(zhǎng)計(jì)數(shù)器過濾器

盧來,鄧文,吳紹軍,黃錦煥

(廣東海洋大學(xué)寸金學(xué)院,湛江 524094)

0 引言

所謂高速網(wǎng)絡(luò)流的頻繁項(xiàng)數(shù)據(jù)挖掘是指在當(dāng)前網(wǎng)絡(luò)中海量的數(shù)據(jù)流中找出頻率超出特定閾值的數(shù)據(jù)項(xiàng)。作為數(shù)據(jù)挖掘和數(shù)據(jù)流研究的重點(diǎn)工作,頻繁項(xiàng)挖掘不僅關(guān)系到計(jì)算機(jī)專家對(duì)網(wǎng)絡(luò)的管理,而且對(duì)于保障網(wǎng)絡(luò)安全也具有重要影響[1]。數(shù)據(jù)流中最為典型的模型為網(wǎng)絡(luò)流,對(duì)網(wǎng)絡(luò)流進(jìn)行分析可知,其除了具有一般數(shù)據(jù)流的動(dòng)態(tài)流動(dòng)且無法重演以及因數(shù)據(jù)量過多而無法全部保存等特點(diǎn)外,還具有報(bào)文的傳輸速率極高以及以少數(shù)的流項(xiàng)便可承擔(dān)當(dāng)前網(wǎng)絡(luò)中絕大多數(shù)荷載的特點(diǎn)。基于上述特點(diǎn),對(duì)網(wǎng)絡(luò)流頻繁項(xiàng)進(jìn)行挖掘?qū)τ诒U暇W(wǎng)絡(luò)安全、規(guī)范網(wǎng)絡(luò)管理具有重要的作用和意義。

本文通過提出一種基于時(shí)間與流長(zhǎng)因素的網(wǎng)絡(luò)流頻繁項(xiàng)數(shù)據(jù)挖掘算法,即IWFIM,通過分析該方法的原理,進(jìn)而提出了基于散列方法與計(jì)數(shù)方法二者優(yōu)點(diǎn)的CBF-IWFIM算法,進(jìn)而對(duì)兩種算法對(duì)網(wǎng)絡(luò)流頻繁項(xiàng)的識(shí)別展開深入研究。

1 網(wǎng)絡(luò)流的特性分析

由于頻繁項(xiàng)算法的性能是由數(shù)據(jù)流的分布來直接決定的,而網(wǎng)絡(luò)流又是數(shù)據(jù)流的一種典型表現(xiàn)形式,故在進(jìn)行頻繁項(xiàng)算法設(shè)計(jì)前,有必要對(duì)網(wǎng)絡(luò)流的特性展開分析。為了使所得網(wǎng)絡(luò)流的特性具有一般數(shù)據(jù)流的特點(diǎn),將研究對(duì)象確定為選取骨干鏈路1999-03-21以及2009-03-30和2011-08-013組流量數(shù)據(jù)集,并以5元組方式將3組流量數(shù)據(jù)集的IP報(bào)文歸并成數(shù)據(jù)流,在各組中隨機(jī)選出10000條網(wǎng)絡(luò)流作為分析對(duì)象,研究其相關(guān)特性[2]。經(jīng)分析可知,網(wǎng)絡(luò)流的持續(xù)時(shí)間t與流長(zhǎng)l無明顯現(xiàn)線性關(guān)系,而對(duì)于不同流長(zhǎng)而言,其流的持續(xù)時(shí)間在分布上也較為分散。例如,橢圓區(qū)內(nèi)網(wǎng)絡(luò)流的持續(xù)時(shí)間不到整個(gè)網(wǎng)絡(luò)流測(cè)量周期的1/2,而處于橢圓區(qū)內(nèi)的網(wǎng)絡(luò)流在處于1/2以上測(cè)量周期中并未接收到相關(guān)的數(shù)據(jù)報(bào)文。而對(duì)于矩形區(qū)的網(wǎng)絡(luò)流而言,其流速雖然比較緩慢,但由于該部分流具有較長(zhǎng)的持續(xù)時(shí)間,使得矩形區(qū)的網(wǎng)絡(luò)流會(huì)隨著持續(xù)時(shí)間的增加而逐漸成為大流。對(duì)上述橢圓區(qū)和矩形區(qū)的網(wǎng)絡(luò)流進(jìn)行分析可知,雖然二者在整個(gè)測(cè)量周期中都具有相近的流長(zhǎng),但若設(shè)定具體的時(shí)間段,研究2中IP流在特定時(shí)間段內(nèi)的流長(zhǎng),將可能出現(xiàn)較大差異。由此可知,在對(duì)網(wǎng)絡(luò)流頻繁項(xiàng)的挖掘算法進(jìn)行計(jì)算時(shí),需要將流長(zhǎng)、流的時(shí)間以及流速等方面因素進(jìn)行綜合考慮。

2 IWFIM算法設(shè)計(jì)與分析

2.1 原理分析

對(duì)網(wǎng)絡(luò)流的特點(diǎn)進(jìn)行分析可知,流長(zhǎng)越大,則此流流長(zhǎng)超過閾值進(jìn)而成為網(wǎng)絡(luò)流頻繁項(xiàng)的可能性就越大。此外,區(qū)域內(nèi),流的時(shí)間越新,在該流的最近一段時(shí)間中,其獲得網(wǎng)絡(luò)數(shù)據(jù)報(bào)文的可能性就越大[3]。以此為基礎(chǔ),IWFIM將利用時(shí)時(shí)間與流長(zhǎng)組合賦權(quán)的方法將每一個(gè)具體的流項(xiàng)賦權(quán),而當(dāng)當(dāng)前網(wǎng)絡(luò)流中的緩存為100%并此時(shí)有新流進(jìn)入時(shí),IWFIM算法總是將當(dāng)前具有最小權(quán)值的網(wǎng)絡(luò)流項(xiàng)。由于此時(shí),數(shù)據(jù)流對(duì)計(jì)算機(jī)和當(dāng)前網(wǎng)絡(luò)的緩存占用同收到報(bào)文的數(shù)量極為緊密,故本算法以達(dá)到的報(bào)文在整個(gè)網(wǎng)絡(luò)中的序號(hào)對(duì)網(wǎng)絡(luò)流的時(shí)間因素進(jìn)行描述。

設(shè) IWFIM 中 F=<ID,f,weight>,其中 5 元組用 ID 來表示,f為網(wǎng)絡(luò)流F的長(zhǎng)度,流的權(quán)值表示為weight[4]。需要說明的是weight為流長(zhǎng)、時(shí)間分別為權(quán)重系數(shù)α與β的多項(xiàng)式之和,表示為weight=αf+βiF,式中,達(dá)到的報(bào)文在整個(gè)網(wǎng)絡(luò)中的序號(hào)為達(dá)到的報(bào)文在整個(gè)網(wǎng)絡(luò)中的序號(hào)為iF。若某一網(wǎng)絡(luò)流Fhit中已有報(bào)文Xhit抵達(dá),則Fhit的流長(zhǎng)與權(quán)重經(jīng)更新后表示如下:fhit=fhit+1,weight=αf+βi,(f=fhit)值得注意的是如果所抵達(dá)的報(bào)文Xhit并未命中網(wǎng)絡(luò)流頻繁項(xiàng)數(shù)據(jù)挖掘算法即IWFIM算法中的任何流,則應(yīng)新建流項(xiàng) Fnew=<IDhit,1,αf+βi>。由于網(wǎng)絡(luò)流中的短流占據(jù)全部網(wǎng)絡(luò)流數(shù)的半數(shù)以上,故為了盡量避免后期所出現(xiàn)的某一單報(bào)文流便可將前期一個(gè)較大的流項(xiàng)淘汰的情況,有且僅有新流Fnew的權(quán)值超過IWFIM算法中緩存流的最小權(quán)值時(shí),采用Fnew替換原IWFIM算法中緩存的最小權(quán)值流項(xiàng)[5]。

由于網(wǎng)絡(luò)流頻繁項(xiàng)的另一特點(diǎn)為不同流的持續(xù)時(shí)間也具有較大差異,且多半大流的持續(xù)時(shí)間較少(未達(dá)到整個(gè)測(cè)量周期的1/2),故此類流若在小于半個(gè)測(cè)量周期內(nèi)便結(jié)束,則在后半個(gè)測(cè)量周期內(nèi),其權(quán)值始終保持不變。又由于后到達(dá)的新流Fnew初始權(quán)重的變化與其時(shí)間的變化呈現(xiàn)出顯著的正相關(guān),即新流權(quán)重歲時(shí)間的延長(zhǎng)而不斷增加[6]。因此,即便后期到達(dá)的新流流長(zhǎng)較小,若流到達(dá)的時(shí)間間隔足夠大,后期到達(dá)的新流權(quán)值也將超過前半個(gè)測(cè)量周期中大流的權(quán)值,進(jìn)而將其淘汰出流的緩存空間,故在利用IWFIM算法時(shí),需要先對(duì)前期所識(shí)別出的大流進(jìn)行保護(hù)。

2.2 算法分析

IWFIM將網(wǎng)絡(luò)中的全部緩存空間劃分為P與M,其中算法所識(shí)別出的頻繁項(xiàng)流以緩存P進(jìn)行保存(初始值為0)。當(dāng)緩存M中出現(xiàn)大于閾值的大流T流時(shí),緩存P+1,M-1,并將T由M轉(zhuǎn)移到P中[7]。M緩存以時(shí)間與流長(zhǎng)組合賦權(quán)的方式將網(wǎng)絡(luò)流中的頻繁項(xiàng)進(jìn)行挖掘,緩存M每進(jìn)行1次剪枝操作,便將權(quán)值最小的流項(xiàng)刪除。

對(duì)IWFIM算法的參數(shù)進(jìn)行選擇如下:由于權(quán)值weight=αf+βi,對(duì)于同一個(gè)網(wǎng)絡(luò)流項(xiàng)而言,若α與β的取值不同,則該流的權(quán)值也有所不同,且IWFIM剪枝操作的順序也不完全相同。具體來說就是,α與β的取值會(huì)對(duì)IWFIM算法的性能產(chǎn)生直接影響,且此算法下剪枝操作的順序與各個(gè)流項(xiàng)的權(quán)值大小的排列次序相關(guān)聯(lián),且與各流項(xiàng)的具體權(quán)值大小無關(guān),這表示在IWFIM算法中,剪枝操作并不受α與β同時(shí)擴(kuò)大或縮小相應(yīng)的倍數(shù)的影響[8]。由于在并不知曉網(wǎng)絡(luò)流量具體分布的前提下很難找到一個(gè)β值進(jìn)而保證IWFIM算法所提取的網(wǎng)絡(luò)流頻繁項(xiàng)效果最好,故本文在確定β值方面采取一種啟發(fā)式的原理,利用網(wǎng)絡(luò)中新到流的權(quán)值要略大于各流項(xiàng)的平均權(quán)值。因此,新到的流總是可以替換出緩存內(nèi)具有較小平均流長(zhǎng)的流。以l表示該算法的表項(xiàng)數(shù)量,若β=1/l,則新到流權(quán)值表示為weightnew=1+1/l,由此可知,新到流Fnew的權(quán)值weightnew要比平均流大,故能夠滿足要求,進(jìn)而將參數(shù)β確定為β=1/l。

對(duì)此算法進(jìn)行復(fù)雜度的分析如下:在IWFIM算法中如以散列的方法對(duì)報(bào)文的位置進(jìn)行查找,則所查找報(bào)文的時(shí)間的復(fù)雜度和緩存P中網(wǎng)絡(luò)流更新的復(fù)雜度均為O(l)。此外,緩存M中命中流項(xiàng)權(quán)值時(shí)間及流長(zhǎng)的復(fù)雜度也為O(l)。當(dāng)緩存P與M中均未命中新到流項(xiàng)Fnew時(shí),則需要從M中找出當(dāng)前具有最小權(quán)值weightmin的流項(xiàng),其時(shí)間的復(fù)雜度為 O(l2)[9]。由此可知,在IWFIM算法中,報(bào)文時(shí)間復(fù)雜度最差,即最復(fù)雜時(shí)為 O(l2),最優(yōu)為 O(1)。

3 CBF-IWFIM算法設(shè)計(jì)與分析

3.1 原理分析

由第2節(jié)可知,與流相比,網(wǎng)絡(luò)中的短流在總體的網(wǎng)絡(luò)流中占有極高的比例,而需要說明的是當(dāng)網(wǎng)絡(luò)遭遇DDoS攻擊即分布式拒絕服務(wù)攻擊時(shí),在較短的時(shí)間內(nèi)網(wǎng)絡(luò)中所出現(xiàn)的短流以急劇的速度增長(zhǎng),又由于以技術(shù)算法為主的頻繁項(xiàng)挖掘算法的每一個(gè)流項(xiàng)所占據(jù)的網(wǎng)絡(luò)緩存流量相同,故計(jì)數(shù)算法下的大部分流量都會(huì)被網(wǎng)絡(luò)中的短流占據(jù)[10]。因此,在大量短流存在于緩存區(qū)的情況下,將會(huì)對(duì)頻繁項(xiàng)挖掘算法的識(shí)別產(chǎn)生較大阻礙。綜上所述,在有限的緩存區(qū)中將網(wǎng)絡(luò)中的部分短流進(jìn)行過濾,進(jìn)而減少進(jìn)入計(jì)數(shù)算法的流數(shù),將會(huì)有效提高頻繁項(xiàng)挖掘效果。為此,本文引入CBFIWFIM算法,即基于計(jì)數(shù)型布魯姆過濾(CBF)的網(wǎng)絡(luò)流頻繁項(xiàng)挖掘算法(IWFIM)進(jìn)而實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)流頻繁項(xiàng)的挖掘工作。在將散列算法與計(jì)數(shù)算法各自優(yōu)勢(shì)進(jìn)行有機(jī)結(jié)合的基礎(chǔ)上,通過借助散列的方法將當(dāng)前網(wǎng)絡(luò)中需要進(jìn)行頻繁挖掘的流項(xiàng)數(shù)目盡可能地減少,并以計(jì)數(shù)算法將IP流信息進(jìn)行有效保存,從而使當(dāng)前網(wǎng)絡(luò)中的部分短流因受到散列沖突而進(jìn)入布魯姆過濾器CBF,并由IWFIM算法將其淘汰。CBF-IWFIM算法的原理圖如圖1所示。

圖1 CBF-IWFIM算法的原理圖

在應(yīng)用CBF-IWFIM算法時(shí)需要注意的是,因?yàn)榫W(wǎng)絡(luò)中的短流(流長(zhǎng)小于16)占據(jù)總體流數(shù)量的半數(shù)以上的比例,故基于計(jì)數(shù)型的CBF中的每個(gè)計(jì)數(shù)器的閾值TCBF設(shè)置為15即可。當(dāng)CBF中每個(gè)計(jì)數(shù)器的值L=TCBF時(shí),則判定為該流項(xiàng)已經(jīng)通過CBF。又由于網(wǎng)絡(luò)流中存在相應(yīng)的散列沖突,故CBF的人過濾效果與其自身計(jì)數(shù)器的顯示值呈現(xiàn)出顯著的負(fù)相關(guān)關(guān)系,即過濾效果隨著計(jì)數(shù)器數(shù)值的增加而逐漸減少,當(dāng)CBF中所顯示的計(jì)數(shù)器的值等于TCBF的NCBF的數(shù)量超過網(wǎng)絡(luò)中短流數(shù)量N0時(shí),布魯姆過濾器將執(zhí)行剪枝操作,即過濾器中的全部非0值均在原有的基礎(chǔ)上減1。對(duì)于隨新到流項(xiàng)Fnew而抵達(dá)的新報(bào)文Xi而言,首先需對(duì)其位置進(jìn)行判斷,并判斷Xi是否在IWFIM中,若是,則繼續(xù)利用IWFIM算法對(duì)Xi進(jìn)行處理,若否,則通過CBF即布魯姆過濾器對(duì)Xi進(jìn)行處理。

3.2 算法分析

對(duì)CBF進(jìn)行分析可知,由于其無需將IP流的5元組進(jìn)行保存,且對(duì)與其相關(guān)的指針信息也無需保存,又由于每個(gè)計(jì)數(shù)器設(shè)置為4b即可,故基于CBF的網(wǎng)絡(luò)流頻繁項(xiàng)具有較高的空間利用率。對(duì)其挖掘網(wǎng)絡(luò)頻繁項(xiàng)的時(shí)間復(fù)雜度進(jìn)行分析可知,相較于單一的IWFIM算法,CBF-IWFIM算法對(duì)于網(wǎng)絡(luò)中不在IWFM的流項(xiàng),還需添加計(jì)數(shù)器更新以及新的散列運(yùn)算等相關(guān)操作,且操作時(shí)間的復(fù)雜度也大都為O(1),故在時(shí)間復(fù)雜度方面,兩種算法對(duì)于網(wǎng)絡(luò)頻繁項(xiàng)的數(shù)據(jù)挖掘較為相似。

對(duì)CBF過濾器對(duì)網(wǎng)絡(luò)中大流的影響做出如下分析。若在t時(shí)刻,CBF過濾器中有流項(xiàng)F通過,對(duì)于繼F后到達(dá)的報(bào)文Xi,只要其與流項(xiàng)F中的前一報(bào)文Xi-1到達(dá)的時(shí)間間隔處于CBF-IWFIM兩次剪枝操作的時(shí)間間隔之間,則對(duì)F本身進(jìn)行分析可知,其存在著減1或不變兩種可能。值得注意的是,無論流項(xiàng)F自減1還是保持不變,在CBF過濾器執(zhí)行過濾操作后,均能夠使F所影射的CBF過濾器中的k個(gè)計(jì)數(shù)器的值為TCBF,而過濾操作被執(zhí)行的過程中,將不會(huì)對(duì)流項(xiàng)F的通過產(chǎn)生影響。由此可知,CBF-IWFIM算法對(duì)于網(wǎng)絡(luò)中大流通過所造成的影響是較為有限的。

對(duì)CBF過濾器對(duì)網(wǎng)絡(luò)中短流的影響做出如下分析。在忽略網(wǎng)絡(luò)流項(xiàng)的散列沖突的前提下,流長(zhǎng)l<TCBF的流項(xiàng)并不能通過CBF過濾器。而由3.1中CBFIWFIM的原理可知,即便在存在散列沖突的情況下,高速網(wǎng)絡(luò)中的短流通過了CBF過濾器,在IWFIM的作用下,其也會(huì)被立即淘汰,這也是CBF-IWFIM為什么不要求CBF過濾器將全部短流進(jìn)行過濾的原因。而在網(wǎng)絡(luò)中短流未通過CBF過濾器或已通過過濾器的短流被IWFIM算法淘汰時(shí),CBF-IWFIM通過對(duì)CBF過濾器中計(jì)數(shù)器值為TCBF的計(jì)數(shù)器數(shù)量NCBF進(jìn)行限制,進(jìn)而確保過濾器中所產(chǎn)生散列沖突的概率可以被限定在有限區(qū)間內(nèi)。由此可見,基于CBF-IWFIM的高速網(wǎng)絡(luò)的頻繁項(xiàng)數(shù)據(jù)挖掘算法可以即時(shí)過濾掉網(wǎng)絡(luò)中的短流。具體算法如下:

輸入:網(wǎng)絡(luò)報(bào)文{X1,X2...Xn},Xi=<IDx,i>。輸入式中,報(bào)文Xi的5元組用IDx來表示,且Xi的序號(hào)用i來表示。

輸出:IWFIM算法中緩存P的所有流項(xiàng)。具體步驟為:(1)當(dāng)Xi到達(dá)時(shí),對(duì)5元組進(jìn)行查找,并確定IWFIM中是否存在IDx、,若存在,則調(diào)用IWFIM算法對(duì)此報(bào)文進(jìn)行處理,若不存在,則跳轉(zhuǎn)到下一步;(2)以散列算法將與5元組相對(duì)應(yīng)的布魯姆過濾器中的k個(gè)計(jì)數(shù)器計(jì)算出來,并對(duì)其中未達(dá)到TCBF的計(jì)數(shù)器加1,并對(duì)CBF中k個(gè)計(jì)數(shù)器的值是否均達(dá)到TCBF進(jìn)行判斷,若為True,則CBF允許Xi通過,若為false,則轉(zhuǎn)入下一步;(3)對(duì)CBF中計(jì)數(shù)器的值為TCBF的數(shù)量NCBF進(jìn)行統(tǒng)計(jì),若其大于等于N0,則過濾器計(jì)數(shù)器的非0值均做減1操作,隨機(jī)結(jié)束此次循環(huán)并等待下一個(gè)報(bào)文Xi+1到來。

4 實(shí)驗(yàn)分析與評(píng)價(jià)

4.1 實(shí)驗(yàn)材料

本次實(shí)驗(yàn)主要分為對(duì)數(shù)據(jù)的預(yù)處理以及頻繁項(xiàng)的挖掘兩方面。在數(shù)據(jù)的預(yù)處理方面,通過借助Plab開發(fā)包對(duì)網(wǎng)絡(luò)流長(zhǎng)、網(wǎng)絡(luò)流的持續(xù)時(shí)間以及IP報(bào)文5元組等相關(guān)信息進(jìn)行采集并記錄,進(jìn)而將此階段所采集到的頻繁項(xiàng)與網(wǎng)絡(luò)流的流長(zhǎng)共同作為算法效果的評(píng)估標(biāo)準(zhǔn)。在網(wǎng)絡(luò)流頻繁項(xiàng)的挖掘階段,通過利用數(shù)學(xué)軟件MATLAB在windows XP系統(tǒng)實(shí)現(xiàn)IWFIM與CBFIWFIM兩種算法。本次實(shí)驗(yàn)所選取的網(wǎng)絡(luò)流數(shù)據(jù)集為CAIDA所提供的一條型號(hào)為OC48鏈路的網(wǎng)絡(luò)流量trace-2013與trace-2011。

4.2 基于IWFIM算法的參數(shù)設(shè)置

本次研究將網(wǎng)絡(luò)流頻繁項(xiàng)定義為出現(xiàn)頻次大于1000的IP流。設(shè)Nt與Nf分別為正確檢測(cè)出的大流數(shù)量與網(wǎng)絡(luò)中誤檢測(cè)的大流數(shù)量,由IWFIM算法所檢測(cè)出的大流流長(zhǎng)于網(wǎng)絡(luò)中原流長(zhǎng)之間差的絕對(duì)值同原流長(zhǎng)之比的平均值為本次實(shí)驗(yàn)的頻數(shù)均差率E。由3.1中所述的IWFIM原理可知,IWFIM算法并不會(huì)出現(xiàn)將網(wǎng)絡(luò)大流進(jìn)行誤報(bào)的情況,故參數(shù)Nf=0。通過實(shí)驗(yàn)可知,當(dāng)表項(xiàng)數(shù)目l固定時(shí),頻數(shù)均差率E與大流數(shù)量Nt則分別存在著極小值與極大值,以Nt為例,當(dāng)表項(xiàng)數(shù)目l分別為 6000、8000、10000 時(shí),Nt的極大值分別位于β=1/l、β=1/10000(但與(Nt1/l)相差僅為 5)和β=1/11000(但與(Nt1/l)相差僅為3)。而對(duì)于頻數(shù)均差率E而言,當(dāng)l固定時(shí),其具有較小的變化幅度,可忽略不計(jì)。由此可知,當(dāng)表項(xiàng)數(shù)l固定時(shí),IWFIM算法較為適合參數(shù)β=1/l的網(wǎng)絡(luò)流頻繁項(xiàng)的數(shù)據(jù)處理。

4.3 CBF-IWFIM算法的過濾效果分析

當(dāng)利用CBF-IWFIM算法進(jìn)行網(wǎng)絡(luò)流頻繁項(xiàng)挖掘時(shí),將CBF中計(jì)數(shù)器的數(shù)量設(shè)置為N=214,并將4b設(shè)置成CBF計(jì)數(shù)器的位寬,設(shè)置散列函數(shù)數(shù)目k=3,N0=N/4,TCBF=15。將 CBF-IWFIM的表項(xiàng)數(shù)目l設(shè)置為10000,β=1/l。需要說明的是,由于在IWFIM算法中,每個(gè)網(wǎng)絡(luò)流表項(xiàng)需要對(duì)流技術(shù)器、流指針以及IP5元組等信息進(jìn)行保存。將每個(gè)流表項(xiàng)位寬設(shè)置為200b,則對(duì)CBF過濾器進(jìn)行分析可知,過濾器占用的位寬不足500b。由此可知,CBF具有較高的空間利用率。

表1給出了CBF算法的原始流量信息以及到達(dá)IWFIM信息模塊中的流量信息對(duì)比情況。

在實(shí)驗(yàn)過程中,通過對(duì)CBF-IWFIM算法的頻繁項(xiàng)挖掘信息與IWFM算法的模塊流量信息進(jìn)行比較,進(jìn)而得出CBF具有較好過濾效果的結(jié)論,進(jìn)而說明了基于CBF-IWFIM的高速網(wǎng)絡(luò)流頻繁項(xiàng)數(shù)據(jù)挖掘算法可以在確保大多數(shù)網(wǎng)絡(luò)報(bào)文得以正常通過的前提下,使IWFIM的表項(xiàng)數(shù)發(fā)生變化,即降低一個(gè)數(shù)量級(jí),表明CBF可將網(wǎng)絡(luò)中絕大多數(shù)的短流進(jìn)行過濾,從而降低對(duì)計(jì)數(shù)算法處理的壓力,并提高CBF-IWFIM中計(jì)數(shù)算法的頻繁項(xiàng)挖掘效果。

5 結(jié)語

本文通過對(duì)高速網(wǎng)絡(luò)流頻繁項(xiàng)數(shù)據(jù)挖掘的概念進(jìn)行闡述,在結(jié)合網(wǎng)絡(luò)流的特性進(jìn)行分析的基礎(chǔ)上,從網(wǎng)絡(luò)流頻繁項(xiàng)數(shù)據(jù)挖掘的IWFIM算法與CBF-IWFIM算法兩方面對(duì)其在高速網(wǎng)絡(luò)流頻繁項(xiàng)數(shù)據(jù)挖掘中的應(yīng)用展開了實(shí)驗(yàn)分析。由本次實(shí)驗(yàn)可知,IWFIM所采用的流長(zhǎng)與時(shí)間組合賦權(quán)值的方式實(shí)際上是對(duì)網(wǎng)絡(luò)中的每個(gè)流項(xiàng)賦權(quán),且在此算法下每次進(jìn)行剪枝操作時(shí),總是將具有最小權(quán)值的流項(xiàng)進(jìn)行刪除。而CBF-IWFIM算法所改進(jìn)的布魯姆過濾器將網(wǎng)絡(luò)中的絕大多數(shù)的短流進(jìn)行過濾,隨后再采用IWFIM算法實(shí)現(xiàn)頻繁項(xiàng)的數(shù)據(jù)挖掘。通過本次實(shí)驗(yàn)表明,IWFIM與CBF-IWFIM算法在告訴網(wǎng)絡(luò)流頻繁項(xiàng)數(shù)據(jù)挖掘計(jì)算方面均具有良好效果,且與IWFIM算法相比,CBF-IWFIM算法的空間利用率更高??梢?,未來加強(qiáng)對(duì)挖掘算法在高速網(wǎng)絡(luò)流頻繁項(xiàng)計(jì)算中的應(yīng)用研究對(duì)于保障網(wǎng)絡(luò)安全提高網(wǎng)絡(luò)管理效率具有重要的歷史作用和現(xiàn)實(shí)意義。

表1 CBF-IWFIM過濾算法中CBF的過濾效果

猜你喜歡
流長(zhǎng)計(jì)數(shù)器過濾器
母愛流長(zhǎng)
歌海(2022年4期)2022-11-27 05:57:32
煤氣與熱力(2022年2期)2022-03-09 06:29:30
安全之渠溪流穩(wěn) 和諧社會(huì)遠(yuǎn)流長(zhǎng)
根深才會(huì)葉茂源遠(yuǎn)方能流長(zhǎng)
尋根(2020年1期)2020-04-07 03:44:34
支持過濾器的REST模型研究與實(shí)現(xiàn)
聲音過濾器
趣味(語文)(2018年2期)2018-05-26 09:17:55
韶光荏苒 意韻流長(zhǎng)——紀(jì)念張韶教授誕辰90周年學(xué)術(shù)活動(dòng)在京舉行
人民音樂(2017年7期)2017-07-19 13:03:04
計(jì)數(shù)器競(jìng)爭(zhēng)冒險(xiǎn)及其處理的仿真分析
基于LOGO!的空氣過濾器自潔控制系統(tǒng)
HVM膜過濾器管板改造總結(jié)
黑龙江省| 永善县| 福鼎市| 贵南县| 白玉县| 武汉市| 中阳县| 安岳县| 广宗县| 分宜县| 华阴市| 青海省| 林甸县| 铜陵市| 金昌市| 舟曲县| 惠水县| 大关县| 河东区| 峡江县| 济源市| 凤阳县| 左云县| 锡林郭勒盟| 沙洋县| 奉新县| 金华市| 洛隆县| 威远县| 砀山县| 安塞县| 北辰区| 星子县| 武威市| 杭州市| 电白县| 区。| 孙吴县| 穆棱市| 于田县| 昂仁县|