◆崔丹丹
(開封大學(xué)信息工程學(xué)院 河南 475000)
對于校園網(wǎng)來說,P2P流量控制系統(tǒng)的兼容性較好,能夠讓技術(shù)與設(shè)備、設(shè)備與設(shè)備之間兼容性提升,可以加強(qiáng)系統(tǒng)的擴(kuò)展要求,在此后的使用中可以進(jìn)行設(shè)備方面的擴(kuò)展,同時網(wǎng)絡(luò)應(yīng)該是開放的,這已經(jīng)成為流量識別系統(tǒng)的一個主要的發(fā)展方向,系統(tǒng)的相關(guān)集成開發(fā)商可以有效的利用提供的端口來進(jìn)行進(jìn)一步的開發(fā),我們也可以采用國外的設(shè)備來對其進(jìn)行改造與升級,這也是我國流量識別技術(shù)的發(fā)展趨勢,采用國際通用的協(xié)議與端口,可以加強(qiáng)其兼容性,這樣就能使得其重構(gòu)性增強(qiáng),成本降低。我們主要考慮校園網(wǎng)系統(tǒng)的技術(shù)性與先進(jìn)性,同時要加強(qiáng)系統(tǒng)的穩(wěn)定性,考慮在流量發(fā)生故障或出現(xiàn)問題時,能夠讓數(shù)據(jù)進(jìn)行有效的保存,同時能夠讓數(shù)據(jù)的精確度提升,并且短時間內(nèi)可以恢復(fù)到原始的狀態(tài),能夠有不錯的抗擾動能力。在P2P流量識別系統(tǒng)設(shè)計(jì)時,主要保證技術(shù)上可行,同時經(jīng)濟(jì)成本不能過高,在我們的科技高速發(fā)展的同時,市場上的高新技術(shù)越來越多,因此我們應(yīng)當(dāng)在滿足要求的情況下,盡量的選用可以長期使用的設(shè)備,根據(jù)可行性與經(jīng)濟(jì)性,同時能夠盡量的配合周圍一些設(shè)備的工作,兼容性強(qiáng)一些,能夠在此基礎(chǔ)上建立較好的整體化系統(tǒng)設(shè)計(jì)方案,滿足國家相關(guān)部門的要求。
基于IP地址與端口的分類技術(shù)由于僅利用UDP/TCP端口號來分類流量,計(jì)算開銷小,所以可擴(kuò)展性好。另一方面,基于端口的分類技術(shù)僅使用單一數(shù)據(jù)包就分類流量,若數(shù)據(jù)包丟失勢必影響分類,所以健壯性就差。同時,基于端口的分類技術(shù)的準(zhǔn)確性也為差?;谏顚訑?shù)據(jù)包檢測的分類由于負(fù)載加密和隱私等因素的考慮,其分類的準(zhǔn)確性正在逐漸下降。而基于流量統(tǒng)計(jì)特征的分類技術(shù)和基于網(wǎng)絡(luò)行為模式的分類技術(shù)需要采集和分析大量的數(shù)據(jù),計(jì)算開銷很大,可擴(kuò)展性也因之就差。但隨著分析數(shù)據(jù)的不斷增多,這兩種分類技術(shù)的準(zhǔn)確性也不斷提高,并且由于需要分析大量的數(shù)據(jù),個別的數(shù)據(jù)包丟失,亂序等因素對流量分類的影響不大,由此健壯性就較好?;谌斯ぶ悄艿牧髁糠诸惣夹g(shù)和分布式協(xié)同分類技術(shù)具有一定的網(wǎng)絡(luò)環(huán)境自適應(yīng)能力,所以健壯性和準(zhǔn)確性均好,但其可擴(kuò)展性相對于基于端口的分類技術(shù),則較差。
實(shí)際網(wǎng)絡(luò)中不同的節(jié)點(diǎn)有著不同的網(wǎng)絡(luò)直徑與功能:有的節(jié)點(diǎn)起著服務(wù)器的功能,向網(wǎng)絡(luò)其他節(jié)點(diǎn)提供資源傳輸服務(wù);有的節(jié)點(diǎn)起著客戶端的功能,接收服務(wù)器提供的各項(xiàng)服務(wù)。選取P2P流量的行為特征時,需要考慮如下情況:P2P網(wǎng)絡(luò)中的節(jié)點(diǎn)既可以作為服務(wù)器向其他對等節(jié)點(diǎn)提供服務(wù),又可以作為客戶端接收其他對等節(jié)點(diǎn)提供的服務(wù),因此,具有P2P節(jié)點(diǎn)和非P2P節(jié)點(diǎn)呈現(xiàn)出有差異的行為特征。本文關(guān)注的多流行為特征主要包括:多流會話時間的變化,多流大小的變化,多流上下行速度對比,多流IP地址與端口數(shù)目對比等。
人工神經(jīng)網(wǎng)絡(luò)是一種通過模仿人類的思考方式來進(jìn)行流量識別的數(shù)學(xué)模型,它們的結(jié)構(gòu)是極為復(fù)雜的,可以通過節(jié)點(diǎn)之間的相互連接來進(jìn)行信息的處理與傳遞,人工神經(jīng)網(wǎng)絡(luò)對于新事物可以進(jìn)行學(xué)習(xí)和自適應(yīng),通過之前的訓(xùn)練數(shù)據(jù),來對于P2P流量進(jìn)行分類識別,對于被訓(xùn)練的對象以及需要計(jì)算的對象進(jìn)行分析,判斷兩者之間的差距,同時根據(jù)權(quán)值來對于輸出結(jié)果進(jìn)行計(jì)算,神經(jīng)網(wǎng)絡(luò)是一種極為重要的運(yùn)算模型,主要有非常多的神經(jīng)元來進(jìn)行構(gòu)成的,每個輸出函數(shù)都和一個節(jié)點(diǎn)相連接,叫做激勵函數(shù),兩個節(jié)點(diǎn)間的連接權(quán)值反映了信號的傳輸強(qiáng)度,這和人類自身的細(xì)胞是類似的,同時網(wǎng)絡(luò)的輸出和連接方式有著極為重要的關(guān)系,并且也會受到激勵函數(shù)和權(quán)重的影響,網(wǎng)絡(luò)自身的計(jì)算和逼近方法可以對于最優(yōu)策略進(jìn)行有效的計(jì)算和表達(dá)。人工神經(jīng)網(wǎng)絡(luò)是模仿生物的實(shí)際細(xì)胞來進(jìn)行訓(xùn)練的,它可以進(jìn)行單輸入但輸出和多輸入多輸出,同時具有非線性的特點(diǎn),激活函數(shù)F主要是由輸入分量和權(quán)值分量相乘得出的,可以對于P2P流量進(jìn)行分析,輸出信號要受到神經(jīng)元本身以及F函數(shù)的影響,同時還應(yīng)該有一定的限制叫做閾值,神經(jīng)網(wǎng)絡(luò)主要是通過訓(xùn)練的方式來進(jìn)行學(xué)習(xí),從而進(jìn)行P2P流量的識別與分類,對于內(nèi)部的權(quán)重進(jìn)行改變,在實(shí)際的分類識別當(dāng)中,可以使得誤差盡量的減少,達(dá)到模仿人類思考的目的。
自適應(yīng) P2P流量識別是極為重要的一個發(fā)展方向,自適應(yīng)P2P流量識別以流量特征為基礎(chǔ),同時實(shí)現(xiàn)了最優(yōu)控制和自動控制的問題,它主要是根據(jù)貝爾曼的優(yōu)化方式,來使得非線性系統(tǒng)和約束性較多的系統(tǒng),都能夠?qū)崿F(xiàn)最優(yōu)識別,不管初始狀態(tài)是如何的,經(jīng)過這樣的優(yōu)化都可以得到最優(yōu)的策略。但是,對于實(shí)際的P2P流量識別來說,可能會存在一些問題,在這樣的情況下,就需要采用神經(jīng)網(wǎng)絡(luò)的方式對其進(jìn)行學(xué)習(xí)與訓(xùn)練,使得P2P流量識別能夠?qū)崿F(xiàn)強(qiáng)化學(xué)習(xí),同時,可以近似的構(gòu)造帶代價函數(shù)來進(jìn)行規(guī)劃,使得最后的結(jié)果更加滿足于實(shí)際的需求。自適應(yīng)的規(guī)劃方式可以有效的對于無法確定相關(guān)數(shù)學(xué)表達(dá)式的優(yōu)化問題進(jìn)行解決,可以對于系統(tǒng)的輸入輸出來對其進(jìn)行模擬與仿真,建立相關(guān)的最優(yōu)化模型,但是這個模型還是存在一些不確定的因素的,因此要將狀態(tài)與變量之間進(jìn)行解耦運(yùn)算,使得維度高的系統(tǒng)得以簡化,便于計(jì)算,同時對于離散化的系統(tǒng),要將其轉(zhuǎn)換為連續(xù)系統(tǒng)進(jìn)行求解,這樣就可以使得復(fù)雜 P2P流量識別能夠?qū)崿F(xiàn)最優(yōu)化。
對分布式P2P流量識別進(jìn)行有效的分析,可以將其的技術(shù)優(yōu)勢完全的發(fā)揮出來,分布式的流量控制決定了其傳輸需要依靠一定的內(nèi)外部條件才能執(zhí)行,同時這些流量必須通過相關(guān)裝置的配合才能進(jìn)行傳輸,同時也無法進(jìn)行調(diào)度,分布式P2P流量識別使得潮流分布進(jìn)行了改變與優(yōu)化,對于P2P流量識別來說,分布式管理可能會帶來多個方向的信號潮流,給其中的管理與調(diào)度帶來了其他的問題,所以在發(fā)生故障時,一些分布式信號需要進(jìn)行退出,這樣就可能讓系統(tǒng)的暫態(tài)平衡更難實(shí)現(xiàn),對于系統(tǒng)來說它的危害較大,這樣會導(dǎo)致系統(tǒng)的安全性受到影響,同時大量的分布信號可能會使得系統(tǒng)管理人員的調(diào)度負(fù)擔(dān)變得非常大,分布信號管理在運(yùn)行時具有隨機(jī)性,故障具有不可知性,這樣就可能會使得整個系統(tǒng)的穩(wěn)定性有所偏差,因此對于并網(wǎng)的分布式信號運(yùn)行,一定要進(jìn)行相關(guān)的規(guī)定,施加一定的規(guī)則來對其調(diào)度運(yùn)輸進(jìn)行統(tǒng)一,這樣就有利于其運(yùn)行時可以科學(xué)化規(guī)范化,避免出現(xiàn)更加嚴(yán)重的問題,造成事故隱患與風(fēng)險。分布式P2P流量識別技術(shù)對于設(shè)備的要求是非常高的,因?yàn)槠鋾苯佑绊懙接脩舻氖褂觅|(zhì)量,同時對于信號的管理方面有著極大的問題,需要依靠計(jì)算機(jī)等相關(guān)來技術(shù)來對其進(jìn)行管理,同時,分布式P2P流量識別沒有得到廣泛應(yīng)用的原因,主要在于技術(shù)方面出現(xiàn)問題,而且傳統(tǒng)的網(wǎng)絡(luò)智能化程度不夠,無法進(jìn)行自動化的管理,但是分布式信號管理的優(yōu)勢也是非常明顯的,它可以把流量之間進(jìn)存儲與供給,使得信息網(wǎng)絡(luò)可以根據(jù)負(fù)荷的實(shí)際情況來進(jìn)行調(diào)整,就讓系統(tǒng)的內(nèi)部成本與效益更加的平衡。
隨著計(jì)算速度和準(zhǔn)確率的不斷提升,P2P流量識別技術(shù)處理的應(yīng)用越來越普遍,同時推動了網(wǎng)絡(luò)技術(shù)的發(fā)展速度,其雖然有很多無法克服的缺點(diǎn),但是借助科技發(fā)展的趨勢,也在一步一步推動各行業(yè)蓬勃發(fā)展,讓生活更加智能化。P2P流量處理大大的減少了人力的成本,提升了網(wǎng)絡(luò)傳輸?shù)臏?zhǔn)確性,智能識別是重要的技術(shù)基礎(chǔ),它在工業(yè)生產(chǎn)領(lǐng)域有著深遠(yuǎn)的影響。
[1]于明,朱超.利用半監(jiān)督近鄰傳播聚類算法實(shí)現(xiàn)P2P流量識別[J].哈爾濱工程大學(xué)學(xué)報,2013.
[2]袁雪美,王暉,張鑫,劉亞杰. P2P流量識別技術(shù)綜述[J].計(jì)算機(jī)應(yīng)用,2009.
[3]陳云菁. P2P流量識別技術(shù)的研究[D].揚(yáng)州大學(xué),2009.
[4]趙瑞.基于特征串的 P2P流量識別研究與實(shí)現(xiàn)[D].電子科技大學(xué),2009.