国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

優(yōu)化PSO-BP算法及其在校園網(wǎng)安全日志分類上的應(yīng)用

2018-09-12 09:52:08梁師哲梁京章梁成國
關(guān)鍵詞:校園網(wǎng)日志權(quán)值

◆梁師哲 梁京章 梁成國

?

優(yōu)化PSO-BP算法及其在校園網(wǎng)安全日志分類上的應(yīng)用

◆梁師哲 梁京章 梁成國

(廣西大學(xué)計算機(jī)與電子信息學(xué)院 廣西 530004)

伴隨著傳統(tǒng)教育步入大數(shù)據(jù)時代,高校對于大數(shù)據(jù)安全平臺的部署和數(shù)據(jù)挖掘變得越來越廣泛和深入。為了提高高校海量安全日志的識別分類準(zhǔn)確率,預(yù)測網(wǎng)絡(luò)攻擊行為,避免高校校園網(wǎng)因網(wǎng)絡(luò)攻擊造成更多的損失,本文提出了一種改進(jìn)的基于粒子群優(yōu)化的BP(back propagation)神經(jīng)網(wǎng)絡(luò)強(qiáng)學(xué)習(xí)算法,用于校園網(wǎng)安全日志的分類,提取日志中的屬性值作為BP神經(jīng)網(wǎng)絡(luò)的輸入值,利用粒子群優(yōu)化算法(PSO)初始化BP神經(jīng)網(wǎng)絡(luò)連接權(quán)值和閾值,結(jié)合Adaboost算法的思想將多個BP神經(jīng)網(wǎng)絡(luò)弱學(xué)習(xí)算法組合構(gòu)建為一個強(qiáng)學(xué)習(xí)算法,并針對校園網(wǎng)海量日志存在的非平衡數(shù)據(jù)及算法本身等問題提出改進(jìn),設(shè)計基于Adaboost優(yōu)化的PSO-BP算法的校園網(wǎng)安全日志分類模型。利用真實(shí)校園網(wǎng)安全日志數(shù)據(jù)進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明經(jīng)過改進(jìn)的算法可以提高BP弱學(xué)習(xí)算法的分類性能,適用于識別安全日志,預(yù)測攻擊行為。

校園網(wǎng);安全日志;PSO-BP;神經(jīng)網(wǎng)絡(luò);Adaboost

0 引言

隨著國家對網(wǎng)絡(luò)安全宣傳的逐漸重視,作為信息化建設(shè)的主體,高校網(wǎng)絡(luò)安全問題逐漸成為建設(shè)的焦點(diǎn)問題。校園網(wǎng)對于網(wǎng)絡(luò)攻擊事件的安全防范通常都是以日志記錄以及告警的形式輸出數(shù)據(jù),并管理控制潛在的風(fēng)險,分析這些校園網(wǎng)安全日志是通過收集分析各種安全日志文件以識別出入侵和入侵企圖,是網(wǎng)絡(luò)安全防御系統(tǒng)的重要組成部分,在網(wǎng)絡(luò)安全中起著重要作用[1]。在大數(shù)據(jù)時代,各高校部署的安全平臺更趨于完善,對于海量安全日志的收集和分析手段更加豐富,人們對校園網(wǎng)的安全防范意識也逐漸加強(qiáng)。校園網(wǎng)的海量安全日志不僅記錄了一段時期內(nèi)針對校園網(wǎng)的攻擊和試探行為,同時也蘊(yùn)含了大量攻擊行為的特征,這些特征和規(guī)律更值得我們關(guān)注、分析和挖掘。

數(shù)據(jù)挖掘技術(shù)是在海量數(shù)據(jù)環(huán)境中收集并分析數(shù)據(jù)的技術(shù),目的是發(fā)現(xiàn)未知的關(guān)系和以數(shù)據(jù)擁有者可以理解并對其有價值的新穎方式來總結(jié)數(shù)據(jù)[2],又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KDD),即從大量數(shù)據(jù)中提取或“挖掘知識”。針對日志文件的數(shù)據(jù)挖掘技術(shù)主要有統(tǒng)計分析[3,4]、序列模式分析[5,6]、關(guān)聯(lián)規(guī)則[7,8]、分類和聚類[9,10]等。一般校園網(wǎng)日志的關(guān)鍵詞有Web訪問、流量信息、被屏蔽的網(wǎng)絡(luò)訪問、攻擊、各種服務(wù)(Web、FTP、Email、VPN等)以及網(wǎng)關(guān)登錄、維護(hù)信息等等[11],校園網(wǎng)安全日志分析是通過對校園網(wǎng)安全日志文件的數(shù)據(jù)進(jìn)行統(tǒng)計分析,發(fā)現(xiàn)有關(guān)訪問者連接的特征。上述方法中,統(tǒng)計分析方法雖能提高性能但無法對特征進(jìn)行深層次的分析,序列模式更注重時間順序上的數(shù)據(jù)項(xiàng),更適用于Web日志的挖掘,關(guān)聯(lián)規(guī)則和聚類方法則更關(guān)注于訪問者的行為挖掘,因此針對于具有攻擊行為的日志識別,這些方法都不適用。

本文采用機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)分類算法對校園網(wǎng)安全日志進(jìn)行分類識別預(yù)測。傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)采用梯度下降算法,通過學(xué)習(xí)得到的誤差值反向傳播調(diào)整整個網(wǎng)絡(luò)的權(quán)值和閾值,因此合理的初始值會影響到整個算法的性能。為避免出現(xiàn)學(xué)習(xí)過程中易陷入局部最優(yōu)解、泛化能力差等問題,本文采用基于粒子群優(yōu)化的算法,通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的誤差值找到使得群體適應(yīng)度最小的粒子,利用該粒子的位置矢量設(shè)置神經(jīng)網(wǎng)絡(luò)最合適的初始權(quán)值和閾值;同時,結(jié)合Adaboost算法的思想,將優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)作為弱學(xué)習(xí)算法,組合構(gòu)建由多個BP神經(jīng)網(wǎng)絡(luò)輸出的強(qiáng)學(xué)習(xí)算法,以提高對安全日志的識別準(zhǔn)確率,使校園網(wǎng)安全日志的分類更加可靠。

1 PSO-BP算法

1.1 粒子群算法

粒子群算法(PSO算法),也稱為粒子群優(yōu)化算法或鳥群覓食算法(Particle Swarm Optimization),是由J. Kennedy和R. C. Eberhart[12]等于1995年提出并應(yīng)用于函數(shù)優(yōu)化的進(jìn)化算法(Evolutionary Algorithm - EA)。PSO 算法和其他進(jìn)化算法相似,通過隨機(jī)初始化的粒子迭代進(jìn)化尋找最優(yōu)的位置矢量,并依據(jù)適應(yīng)度來評價解的品質(zhì)[13]。PSO算法基于粒子群體,采用實(shí)數(shù)求解,且需要調(diào)整的參數(shù)較少,通過追隨當(dāng)前搜索到的最優(yōu)值來尋找全局最優(yōu),因此廣泛應(yīng)用于函數(shù)優(yōu)化、神經(jīng)網(wǎng)絡(luò)和其他遺傳算法等領(lǐng)域。

PSO算法通過將鳥的飛行空間看作為問題的解空間,將每只鳥的個體看作為一個粒子,粒子規(guī)模為N,每個粒子i在N維空間中都有其空間位置Xi=(x1,x2,?,xN)和速度Vi=(v1,v2,?,vN),并依據(jù)自己的飛行經(jīng)驗(yàn)和群體全局的飛行經(jīng)驗(yàn)動態(tài)地調(diào)整自己的飛行軌跡。每個粒子在進(jìn)化中通過由目標(biāo)函數(shù)決定的適應(yīng)值(fitness value)知道自己目前位置的好壞。當(dāng)每輪進(jìn)化結(jié)束后,粒子可以知道自己能發(fā)現(xiàn)的最好位置(pbest),并通過更新全局獲得粒子群全局最好的位置(gbest),這也決定了每個粒子在下一步進(jìn)化中的飛行方向和粒子群總體的飛行方向:

vi=w*vi+c1*rand()*(pbest[i]-x[i])+c2*rand()*(gbest-x[i]) (1)

xi=xi+vi(2)

上式中粒子迭代尋找最優(yōu)解,利用找到的最優(yōu)位置pbest[i]和粒子群全局最優(yōu)解gbest這兩個極值來更新自己的速度和位置。其中,vi為粒子的速度,xi為粒子的位置,rand()產(chǎn)生0到1之間的隨機(jī)數(shù),w為慣性權(quán)重,c1和c2為學(xué)習(xí)因子。在進(jìn)化迭代過程中,需根據(jù)實(shí)際需要為vi和xi指定范圍。

1.2 BP神經(jīng)網(wǎng)絡(luò)

BP神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)的一種,它模擬人類大腦的神經(jīng)元工作,是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)[14]。因?yàn)锽P神經(jīng)網(wǎng)絡(luò)有很強(qiáng)的非線性映射能力且結(jié)構(gòu)相對簡單,所以如今已被廣泛應(yīng)用于各行業(yè)的研究。三層BP神經(jīng)網(wǎng)絡(luò)如圖1所示,即輸入層、隱藏層(中間層)、輸出層,各層之間的神經(jīng)元實(shí)行全連接,同層內(nèi)的神經(jīng)元無連接,各層神經(jīng)元的個數(shù)可以根據(jù)實(shí)際情況決定,其訓(xùn)練的效果也會因此有所不同。

圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

輸入樣本數(shù)據(jù)從網(wǎng)絡(luò)輸入節(jié)點(diǎn)向前傳播后,分別經(jīng)由隱藏層和輸出層的線性函數(shù)作用和非線性函數(shù)的變換,最終從輸出節(jié)點(diǎn)得到結(jié)果。如果輸出的結(jié)果與訓(xùn)練結(jié)果預(yù)期有差別,則定義網(wǎng)絡(luò)輸出結(jié)果與期望輸出的誤差信號,并將誤差信號逆向傳播,反復(fù)修改每層網(wǎng)絡(luò)的權(quán)值和節(jié)點(diǎn)的閾值,直到輸出誤差減小到一定的范圍。

1.3 基于PSO優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)

BP神經(jīng)網(wǎng)絡(luò)雖然已得到成熟的應(yīng)用,但也存在一些缺陷,其中最主要的就是學(xué)習(xí)速度慢,有時對于一個神經(jīng)網(wǎng)絡(luò)的多次訓(xùn)練也有可能得到較差的收斂效果。其次,BP神經(jīng)網(wǎng)絡(luò)采用誤差反向傳播來調(diào)整網(wǎng)絡(luò)連接權(quán)值,也會陷入粒子尋優(yōu)過程中局部最優(yōu)解的問題,從而導(dǎo)致無法找到全局最優(yōu)解,本文引入了基于PSO改進(jìn)的算法以解決這個問題?;赑SO優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)算法步驟如下:

(1)處理數(shù)據(jù)。對訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理并歸一化;

(2)確定參數(shù)。確定BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)以及PSO粒子的相關(guān)參數(shù);

(3)初始化粒子。隨機(jī)初始化粒子位置和速度;

(4)進(jìn)化粒子。訓(xùn)練神經(jīng)網(wǎng)絡(luò),將輸出誤差作為粒子的適應(yīng)度,并得到該粒子的個體最優(yōu)值和全局最優(yōu)值;

(5)更新粒子。根據(jù)(1) (2)式更新粒子的位置和速度;

(6)判斷是否大于迭代次數(shù),如果大于,保存參數(shù),進(jìn)行步驟(7),否則跳轉(zhuǎn)到步驟(4);

(7)賦值參數(shù)。將獲得全局最優(yōu)值的粒子的位置參數(shù)作為BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值;

(8)輸出結(jié)果。對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練直至結(jié)束,輸出分類結(jié)果。

上述步驟中,步驟(4)通過將適應(yīng)度值設(shè)置為使用該組權(quán)值時的網(wǎng)絡(luò)輸出誤差,在預(yù)設(shè)的迭代次數(shù)內(nèi)搜索最優(yōu)的網(wǎng)絡(luò)權(quán)值,這樣可以提高神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度,同時也有效避免了BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)時陷入局部最優(yōu)解的問題。

2 基于Adaboost改進(jìn)的PSO-BP分類模型

2.1 Adaboost算法

AdaBoost算法是基于Boosting思想的機(jī)器學(xué)習(xí)算法[15],其基本思想是通過迭代尋找合適的弱學(xué)習(xí)算法,并將多個弱學(xué)習(xí)算法組合構(gòu)建為一個強(qiáng)學(xué)習(xí)算法以減小學(xué)習(xí)誤差。Hansen和Salamon[16]證明了組合多個BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練后的輸出可以提高算法的識別能力。

Adaboost算法主要是通過每次訓(xùn)練樣本集的分類結(jié)果情況,以及之前總體分類的準(zhǔn)確率,以確定每個訓(xùn)練樣本的權(quán)值。將修改權(quán)值的新數(shù)據(jù)傳送給下次迭代的學(xué)習(xí)算法進(jìn)行訓(xùn)練,然后將每次訓(xùn)練得到的弱學(xué)習(xí)算法融合起來,組合構(gòu)建成最后的強(qiáng)學(xué)習(xí)算法。Adaboost強(qiáng)學(xué)習(xí)算法的步驟如下:

a)選擇數(shù)據(jù)。訓(xùn)練集中每個樣本有一個權(quán)重D,也稱為樣本權(quán)重。α為弱學(xué)習(xí)算法的權(quán)重。對于樣本的訓(xùn)練集{(xi,yi)}(i=1,2,…,N),初始化時設(shè)定每個樣本數(shù)據(jù)的權(quán)重:

D1=(w1,1,w1,2,…,w1,N) (3)

w1,i=1/N,i=1,2,…,N (4)

b) 訓(xùn)練弱學(xué)習(xí)算法。利用h1弱學(xué)習(xí)算法對數(shù)據(jù)進(jìn)行學(xué)習(xí),學(xué)習(xí)后計算錯誤率:

其中#error為錯誤分類數(shù),#all為分類總數(shù)。

c) 計算序列權(quán)重。將錯誤率ε作為計算弱學(xué)習(xí)算法的權(quán)重的一部分:

d)訓(xùn)練數(shù)據(jù)權(quán)值更新。更新訓(xùn)練數(shù)據(jù)集的權(quán)值分布:

其中,Zt是歸一化因子;

e)判斷是否大于迭代次數(shù),如果大于,進(jìn)行步驟f),否則跳轉(zhuǎn)到步驟b)繼續(xù)訓(xùn)練弱學(xué)習(xí)算法;

f)強(qiáng)學(xué)習(xí)算法計算。經(jīng)過t輪的學(xué)習(xí)后,得到t個弱學(xué)習(xí)算法{h1,h2,…,ht}及其權(quán)重{α1,α2,…,αt}。分別計算t個弱學(xué)習(xí)算法的輸出{h1(X),h2(X),…,ht(X)},最終得到Adaboost算法的輸出結(jié)果為:

2.2 基于改進(jìn)的PSO-BP的校園網(wǎng)安全日志分類模型設(shè)計

基于Adaboost算法原理對PSO-BP算法做出以下改進(jìn):針對BP權(quán)值初始化問題,采用先用PSO算法優(yōu)化后得到效果較優(yōu)的權(quán)值和閾值后再進(jìn)行BP神經(jīng)網(wǎng)絡(luò)的初始化;并將PSO優(yōu)化后的算法作為弱學(xué)習(xí)算法,結(jié)合AdaBoost算法進(jìn)行多次弱學(xué)習(xí)算法訓(xùn)練,最終加權(quán)組合成強(qiáng)學(xué)習(xí)算法,以提高模型預(yù)測準(zhǔn)確度。改進(jìn)后的算法學(xué)習(xí)模型如圖2。

圖2 改進(jìn)的學(xué)習(xí)算法流程圖

2.3 主要問題及改進(jìn)

(1)由于校園網(wǎng)安全日志中多數(shù)記錄了無攻擊行為的正常訪問數(shù)據(jù),而記錄攻擊行為的日志占極少數(shù),所以是非平衡數(shù)據(jù)集。非平衡數(shù)據(jù)集在普通的學(xué)習(xí)過程中會因分類器更加傾向于多數(shù)類數(shù)據(jù)而導(dǎo)致在稀有類數(shù)據(jù)上的分類效果很差[17]。針對這個問題,采用隨機(jī)過抽樣技術(shù),通過將攻擊日志數(shù)據(jù)隨機(jī)復(fù)制樣本集增加到非平衡數(shù)據(jù)集中,以獲得更好的分類性能;

(2)雖然大多安全日志數(shù)據(jù)的屬性值為標(biāo)稱型數(shù)據(jù),都是合法數(shù)據(jù)且可以作為分類算法的輸入值,但基于網(wǎng)絡(luò)安全的常識,有的屬性值如端口號、協(xié)議等存在多值問題,這些數(shù)值中大部分對于攻擊行為的識別沒有幫助,反而會降低學(xué)習(xí)的效率。因此需要依照經(jīng)驗(yàn)預(yù)先設(shè)定閾值,清理這些無效的數(shù)據(jù),保留閾值范圍內(nèi)的屬性值;

(3)針對PSO優(yōu)化的過程中易陷入局部最優(yōu)解的問題,采用自適應(yīng)變異的方法。在PSO算法分別中,兩個學(xué)習(xí)因子分別控制粒子自身和粒子群全局這兩個部分對粒子速度的影響。在粒子尋優(yōu)過程中,我們希望算法初期能在整個粒子空間內(nèi)搜索解,從而避免提前陷入局部最優(yōu)解中,因此在進(jìn)化過程中控制rand()的值,當(dāng)rand()值大于閾值而使得粒子或全局部分的比重過大時,重新賦予粒子均勻的隨機(jī)值。

3 實(shí)驗(yàn)及結(jié)果分析

本文采用Matlab R2016a軟件,實(shí)驗(yàn)用計算機(jī)配置為Intel Core i7-4790 CPU,3.60GHz主頻,8GB內(nèi)存。

3.1 實(shí)驗(yàn)數(shù)據(jù)集

本文采用廣西大學(xué)信息網(wǎng)絡(luò)中心某一月份的校園網(wǎng)安全日志,約有300萬條日志數(shù)據(jù),其中約2000條記錄了帶有攻擊的行為,將這些數(shù)據(jù)標(biāo)識為安全日志和攻擊日志兩類,隨機(jī)選取其中70%作為訓(xùn)練數(shù)據(jù),30%作為測試數(shù)據(jù)。校園網(wǎng)日志文件包括時間、源地址、源端口、目的地址、目的端口、URL、MAC地址、協(xié)議等屬性,將數(shù)據(jù)預(yù)處理后的屬性值作為特征屬性。

本文通過對單個弱BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法、PSO-BP神經(jīng)網(wǎng)絡(luò)算法和改進(jìn)后的強(qiáng)學(xué)習(xí)算法入手,對日志數(shù)據(jù)進(jìn)行訓(xùn)練。從訓(xùn)練數(shù)據(jù)集中隨機(jī)選取1500組數(shù)據(jù)用于訓(xùn)練,之后逐漸增加訓(xùn)練集的數(shù)量,利用驗(yàn)證集數(shù)據(jù)驗(yàn)證三種算法的分類準(zhǔn)確率。通過將輸入數(shù)據(jù)轉(zhuǎn)換為數(shù)值的方式,將BP神經(jīng)網(wǎng)絡(luò)弱學(xué)習(xí)算法輸入節(jié)點(diǎn)設(shè)為5個,輸出節(jié)點(diǎn)設(shè)為2個,根據(jù)多次實(shí)驗(yàn)比較,將隱藏層節(jié)點(diǎn)數(shù)設(shè)為10個時分類效果最佳,同時采用梯度下降算法更新權(quán)值和閾值;設(shè)置粒子規(guī)模為30,最大進(jìn)化次數(shù)為100次,慣性權(quán)重為0.5,學(xué)習(xí)因子c1和c2均為1.5;強(qiáng)學(xué)習(xí)算法使用5個相同BP神經(jīng)網(wǎng)絡(luò)弱學(xué)習(xí)算法組合。下表1為三種算法在10次不同數(shù)量驗(yàn)證集下分類的準(zhǔn)確率。

表1 三種算法的分類準(zhǔn)確率

將表1映射到圖3中,可知三種算法在訓(xùn)練集樣本量很小的情況下分類效果并不理想,但隨著樣本規(guī)模的增大,PSO-BP神經(jīng)網(wǎng)絡(luò)算法的分類準(zhǔn)確率明顯大于BP神經(jīng)網(wǎng)絡(luò)的分類準(zhǔn)確率,如圖4即為PSO優(yōu)化過程中適應(yīng)度最優(yōu)的個體的變化曲線,PSO算法使得BP神經(jīng)網(wǎng)絡(luò)多次跳出局部極小值;同時,改進(jìn)后的強(qiáng)學(xué)習(xí)算法的分類準(zhǔn)確率也明顯大于其他兩類算法;BP神經(jīng)網(wǎng)絡(luò)算法和PSO-BP算法的分類誤差變化幅度較大,而改進(jìn)后的強(qiáng)學(xué)習(xí)算法的分類誤差較小且相對平穩(wěn)。圖5為改進(jìn)后的強(qiáng)學(xué)習(xí)算法和單個弱BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法分類準(zhǔn)確率的差距,可見其準(zhǔn)確率有較大提升,提升率達(dá)到5%~20%左右。

圖3 三種算法的分類準(zhǔn)確率

圖4 每次迭代中最優(yōu)粒子適應(yīng)度

圖5 強(qiáng)學(xué)習(xí)算法與弱BP學(xué)習(xí)算法效果的提升

綜上分析,通過基于Adaboost改進(jìn)的PSO-BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模型用于校園網(wǎng)日志識別更為合理,更加有效地提高了識別的泛化能力和可靠性。

4 結(jié)論

校園網(wǎng)安全問題已經(jīng)逐漸成為高校建設(shè)的焦點(diǎn)問題,對大數(shù)據(jù)平臺海量日志的分析和挖掘越來越有深刻的意義。對于如何提高校園網(wǎng)安全日志識別準(zhǔn)確率,不僅需要對分類學(xué)習(xí)算法改進(jìn)設(shè)計,還要對數(shù)據(jù)集本身進(jìn)行合適特征選擇和提取。本文提出一種基于Adaboost思想改進(jìn)的PSO-BP強(qiáng)學(xué)習(xí)算法,并通過真實(shí)校園網(wǎng)安全日志的實(shí)驗(yàn)驗(yàn)證了改進(jìn)后的算法具有良好的分類準(zhǔn)確率,對于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的分類效果有明顯改善,能夠更加有效地識別具有攻擊行為的校園網(wǎng)安全日志,預(yù)測網(wǎng)絡(luò)攻擊。

[1]姜傳菊.網(wǎng)絡(luò)日志分析在網(wǎng)絡(luò)安全中的作用[J].現(xiàn)代圖書情報技術(shù),2004.

[2]Hand D J, Smyth P, Mannila H. Principles of data mining[J]. Drug Safety, 2007.

[3]Osmar R. Za?ane, Xin M, Han J. Discovering Web Access Patterns and Trends by Applying OLAP and Data Mining Technology on Web Logs[C]// Advances in Digital Libraries Conference. IEEE Computer Society, 1998.

[4]郭巖,白碩,楊志峰等.網(wǎng)絡(luò)日志規(guī)模分析和用戶興趣挖掘[J].計算機(jī)學(xué)報,2005.

[5]Deshpande M, Karypis G. Selective Markov models for predicting Web page accesses[J]. Acm Transactions on Internet Technology, 2004.

[6]Sarukkai R R. Link prediction and path analysis using Markov chains 1[J]. Computer Networks, 2000.

[7]Liu B, Hsu W, Ma Y. Mining association rules with multiple minimum supports[C]// Proc. of the ACM SIGKDD Intl. Conference on Knowledge Discovery and Data Mining. 1999.

[8]Chen M S, Park J S, Yu P S. Data mining for path traversal patterns in a web environment[C]// International Conference on Distributed Computing Systems. IEEE Computer Society, 1996.

[9]陳澤紅.基于Web訪問日志的用戶聚類研究[D].廈門大學(xué),2014.

[10]邢東山,沈鈞毅,宋擒豹.從Web日志中挖掘用戶瀏覽偏愛路徑[J].計算機(jī)學(xué)報, 2003.

[11]劉進(jìn)軍,張明勇.基于校園網(wǎng)日志數(shù)據(jù)挖掘系統(tǒng)的研究[J].滁州學(xué)院學(xué)報,2007.

[12]Kennedy J, Eberhart R. Particle swarm optimization[C]// IEEE International Conference on Neural Networks, 1995. Proceedings,1995.

[13]沈?qū)W利,張紅巖,張紀(jì)鎖.改進(jìn)粒子群算法對BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化[J].計算機(jī)系統(tǒng)應(yīng)用,2010.

[14]周志華.機(jī)器學(xué)習(xí) : = Machine learning[M].清華大學(xué)出版社, 2016.

[15]曹瑩,苗啟廣,劉家辰等.AdaBoost算法研究進(jìn)展與展望[J].自動化學(xué)報,2013.

[16]Hansen L K, Salamon P. Neural network ensembles[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,2002.

[17]職為梅,郭華平,范明等.非平衡數(shù)據(jù)集分類方法探討[J].計算機(jī)科學(xué),2012.

猜你喜歡
校園網(wǎng)日志權(quán)值
一種融合時間權(quán)值和用戶行為序列的電影推薦模型
一名老黨員的工作日志
華人時刊(2021年13期)2021-11-27 09:19:02
CONTENTS
CONTENTS
數(shù)字化校園網(wǎng)建設(shè)及運(yùn)行的幾點(diǎn)思考
甘肅教育(2020年18期)2020-10-28 09:05:54
扶貧日志
心聲歌刊(2020年4期)2020-09-07 06:37:14
試論最大匹配算法在校園網(wǎng)信息提取中的應(yīng)用
電子制作(2019年10期)2019-06-17 11:45:26
游學(xué)日志
NAT技術(shù)在校園網(wǎng)中的應(yīng)用
電子制作(2017年8期)2017-06-05 09:36:15
基于權(quán)值動量的RBM加速學(xué)習(xí)算法研究
垣曲县| 于都县| 巴青县| 嘉黎县| 平乐县| 嘉定区| 正宁县| 淮北市| 莱州市| 巧家县| 佛教| 海兴县| 逊克县| 梁山县| 樟树市| 重庆市| 满洲里市| 遂昌县| 仪征市| 洪泽县| 东辽县| 花莲县| 葵青区| 陆川县| 新安县| 正蓝旗| 瓮安县| 友谊县| 精河县| 惠东县| 嫩江县| 九寨沟县| 涟水县| 信阳市| 洱源县| 彩票| 文安县| 白城市| 富阳市| 崇明县| 定襄县|