施艷昭
(安徽電子信息職業(yè)技術(shù)學(xué)院 經(jīng)濟(jì)管理系,安徽 蚌埠 233000)
近年來(lái),社會(huì)各界對(duì)于BP神經(jīng)網(wǎng)絡(luò)組合模型十分關(guān)注,對(duì)此開(kāi)展了很多研究和分析[1].為了能夠更好地挖掘與分析BP神經(jīng)網(wǎng)絡(luò)組合模型,對(duì)于解析計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)算法有了更高的要求[2].針對(duì)有限空間的環(huán)境下,結(jié)合分治思想構(gòu)建了STREAM算法.這種算法并未對(duì)數(shù)據(jù)變化進(jìn)行充分的反映[3].構(gòu)建的CLUSTREAM算法可以利用BP神經(jīng)網(wǎng)絡(luò)組合模型,在計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)劃分為兩個(gè)階段:第一個(gè)階段是微計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù),第二階段為自適應(yīng)宏計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù),以實(shí)現(xiàn)計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)[4].針對(duì)BP神經(jīng)網(wǎng)絡(luò)組合模型的雙重特征,提出了可以通過(guò)投影計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)實(shí)現(xiàn)有效的解決[5].在上述幾種算法中,其依據(jù)的根本思想都是k-means計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)思想,這種思想的主要不足是無(wú)法實(shí)現(xiàn)對(duì)任意形式分布的計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)[6].
本文提出一種融合雙重BP神經(jīng)網(wǎng)絡(luò)組合模型的Python解析計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)算法.整個(gè)算法的主要構(gòu)成部分為:在線網(wǎng)格單元數(shù)據(jù)統(tǒng)計(jì)部分和自適應(yīng)聚類演化部分.將數(shù)據(jù)空間進(jìn)行網(wǎng)絡(luò)化處理,隨后對(duì)于在線部分對(duì)應(yīng)的網(wǎng)格單元信息可通過(guò)近似技術(shù)來(lái)進(jìn)行合理的統(tǒng)計(jì)與分析.而且,能夠依據(jù)改進(jìn)之后的金字塔時(shí)間結(jié)構(gòu)將潛在密集網(wǎng)格單元進(jìn)行存儲(chǔ),采取的是快照形式.進(jìn)入到Python解析階段,則是利用深度優(yōu)先搜索方式來(lái)實(shí)施計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù),而且借助實(shí)驗(yàn)對(duì)算法可行性進(jìn)行了有效的分析.
以A={A1,A2,…,Ak}代表歐氏空間下對(duì)應(yīng)的屬性集合,可將其k維數(shù)據(jù)空間表示為S=A1×A2×…×Ak,那么此時(shí)在某時(shí)刻t,在S上的BP神經(jīng)網(wǎng)絡(luò)組合即可表示為X=
定義1 給定一個(gè)BP神經(jīng)網(wǎng)絡(luò)組合模型X上的時(shí)間段[t-h,t],稱density(u)=count(u)/(|N|)為單元u的密度.其中:|N|為BP神經(jīng)網(wǎng)絡(luò)組合總量,count(u)代表的則是在單元u中具有的數(shù)據(jù)點(diǎn)個(gè)數(shù).
定義2 假定[t-h,t]表示的是在X上的某個(gè)時(shí)間段,其密度閾值為τ,ε表示其誤差因子,假如滿足density(u)≥τ-ε,那么可以證明此時(shí)該單元u為密集的;若density(u)>ε,則網(wǎng)格單元u是潛在密集的;若density(u)≤ε,則網(wǎng)格單元u是非密集的.
假如從開(kāi)始至今所經(jīng)過(guò)的總時(shí)間表示為T(mén)c,那么此時(shí)在第0層具有的最小時(shí)間粒度則可表示為T(mén)min.如下所述即為改進(jìn)金字塔的時(shí)間結(jié)構(gòu)定義:①其最大層數(shù)表示為logα(Tc/Tmin),α一般的取值為2,4,8;②如果滿足條件((Tc/Tmin)modαi)=0and((Tc/Tmin)modαi+1)≠0,那此時(shí)將取i為時(shí)刻Tc時(shí),對(duì)應(yīng)的存儲(chǔ)快照層次;③在每層所可存儲(chǔ)的快照僅為最近的β個(gè),其中β取值為大于α的正整數(shù);④Tminαi表示的則是第i層對(duì)應(yīng)的時(shí)間跨度.
對(duì)比未改進(jìn)之前的金字塔時(shí)間結(jié)構(gòu),將其進(jìn)行改進(jìn)之后,對(duì)于參數(shù)存儲(chǔ)快照是可以結(jié)合用戶的精度需求來(lái)進(jìn)行設(shè)置的,包括Tmin等參數(shù),而且使得快照是不會(huì)出現(xiàn)冗余問(wèn)題的,也不用進(jìn)行刪除處理.
性質(zhì)1 在改進(jìn)后的金字塔時(shí)間結(jié)構(gòu)下,假如將當(dāng)前時(shí)間點(diǎn)以Tc表示,用戶指定時(shí)間跨度則以h表示,那么要求在Ts時(shí)刻,存在快照滿足Tc-Ts≤2h.
依據(jù)改進(jìn)金字塔結(jié)構(gòu),能夠得到在第r個(gè)時(shí)刻產(chǎn)生的時(shí)間序列可表示為tr,t0代表的則是起始時(shí)刻點(diǎn),那么X=Nt1∪Nt2∪…∪Nti∪…,表示的是BP神經(jīng)網(wǎng)絡(luò)組合模型,其中:Nti為從時(shí)刻ti-1到ti的BP神經(jīng)網(wǎng)絡(luò)分段.
因此,在對(duì)LGE進(jìn)行刪除之前,對(duì)應(yīng)的非密集單元具有的誤差水平應(yīng)當(dāng)能夠控制在ε以下,而且不會(huì)由于刪除而使得密集單元輸出的正確性受到影響.因此,當(dāng)ε為給定的前提下,要求對(duì)潛在密集網(wǎng)格單元進(jìn)行存儲(chǔ),以此來(lái)實(shí)現(xiàn)對(duì)空間復(fù)雜度的有效降低.
為了更好地驗(yàn)證本文算法的性能,對(duì)文中計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)精度進(jìn)行了界定.如圖1、圖2所示,分別表示的是在真實(shí)數(shù)據(jù)集KDD-CUP-99,以及仿真數(shù)據(jù)集B300kC5D30S6的情況下,CMDBPNN以及CluStream具有的精度水平.由于Python解析計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)算法采用子空間計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù),面對(duì)雙重?cái)?shù)據(jù)也能夠進(jìn)行有效的處理,而且對(duì)于任意形式分布計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)的效果也是很好的.因此,對(duì)比CluStream,本文算法具有更好的精度水平,相關(guān)參數(shù)設(shè)置為τ=0.002,ε=0.05τ,h=10,l=5.
圖1 基于KDD-CUP-99的精度比較(數(shù)據(jù)流100組/秒)
圖2 基于仿真數(shù)據(jù)集的精度比較(數(shù)據(jù)流500組/秒)
利用真實(shí)數(shù)據(jù)集KDD-CUP-99,對(duì)算法具有的執(zhí)行效率進(jìn)行分析,將CMDBPNN算法和CluStream展開(kāi)對(duì)比,而且要求進(jìn)行周期性的快照存貯,進(jìn)行實(shí)驗(yàn)時(shí),則以快照存儲(chǔ)于內(nèi)存中.結(jié)合圖3,盡管CMDBPNN算法的子空間計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)需要一定的時(shí)間耗費(fèi),然而,是不需要CluStream進(jìn)行頻繁的聚合、增刪等操作的.因此,能夠得出,CMDBPNN與CluStream具有基本相同的執(zhí)行效率,相關(guān)參數(shù)設(shè)置為τ=0.005,ε=0.1τ,h=10,l=5.
實(shí)驗(yàn)中還生成了B300kC5D30S6仿真數(shù)據(jù)集,以對(duì)算法內(nèi)存占用情況進(jìn)行有效的分析,在內(nèi)存中主要是對(duì)數(shù)據(jù)結(jié)構(gòu)SET進(jìn)行存儲(chǔ),而在硬盤(pán)中則進(jìn)行快照存儲(chǔ).結(jié)合圖4,能夠得出,該算法中所需的內(nèi)存空間并不大,而且如果CMDBPNN呈現(xiàn)出了相對(duì)穩(wěn)定的分布,那么此時(shí)對(duì)應(yīng)的內(nèi)存狀態(tài)也是比較穩(wěn)定的.而且如果具有的密度閾值較大,那么此時(shí)其中的潛在密集網(wǎng)格也僅有少部分需要維護(hù),因此內(nèi)存占用較少,在實(shí)驗(yàn)中相關(guān)參數(shù)設(shè)置如下:ε=0.05τ,h=10,l=5.
將得到的B300kC5D30S6數(shù)據(jù)集分別取不同的維數(shù),15,20,25,30,35得到對(duì)應(yīng)的仿真數(shù)據(jù)集,以分析BP神經(jīng)網(wǎng)絡(luò)組合模型空間維度對(duì)算法的影響,參數(shù)設(shè)置為:τ=0.005,ε=0.1τ,h=10,l=6.
為測(cè)試CMDBPNN所含計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)維數(shù)的伸縮性,生成B300kC5D30S6,取其在4,5,6,7和8維數(shù)下的仿真數(shù)據(jù)集,并且分析τ=0.005,ε=0.1τ,h=10的情況下,當(dāng)維數(shù)為4,5時(shí),l=4,6,7;當(dāng)維數(shù)為8時(shí)l=6的情況,結(jié)合圖3及圖4,能夠得出不管是空間維數(shù)還是計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)維數(shù)都具有較好的伸縮性.
圖3 對(duì)數(shù)據(jù)空間維數(shù)的伸縮性
圖4 對(duì)所含計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)維數(shù)的伸縮性
針對(duì)計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)問(wèn)題,提出了融合雙重BP神經(jīng)網(wǎng)絡(luò)組合模型的Python解析計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)算法.該算法對(duì)于雙重BP神經(jīng)網(wǎng)絡(luò)組合模型的數(shù)據(jù)上傳問(wèn)題能夠有效解決,任何形態(tài)分布的計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)都能夠?qū)崿F(xiàn).而且,對(duì)優(yōu)化之后的金字塔時(shí)間結(jié)構(gòu),對(duì)其中潛藏的網(wǎng)格單元來(lái)實(shí)施有效的存儲(chǔ).最終結(jié)果表明:本文算法能夠使得計(jì)算機(jī)網(wǎng)絡(luò)上傳數(shù)據(jù)具有較高的實(shí)現(xiàn)效率.