周愛平,程光
(東南大學(xué) 計算機科學(xué)與工程學(xué)院,教育部計算機網(wǎng)絡(luò)和信息集成重點實驗室,江蘇 南京 211189)
互聯(lián)網(wǎng)流量的特征一直是網(wǎng)絡(luò)測量的研究熱點之一。大量研究表明網(wǎng)絡(luò)流量具有長相關(guān)性、自相似性和突發(fā)性[1~3]。IP業(yè)務(wù)由于突發(fā)性對網(wǎng)絡(luò)帶寬的需求變得越來越大,從而網(wǎng)絡(luò)流量突發(fā)性的研究在網(wǎng)絡(luò)帶寬需求估計中顯得尤其重要。網(wǎng)絡(luò)帶寬需求的估計是網(wǎng)絡(luò)容量規(guī)劃的依據(jù)和基礎(chǔ)。網(wǎng)絡(luò)容量規(guī)劃的目標是網(wǎng)絡(luò)容量足夠滿足網(wǎng)絡(luò)流量的突發(fā)性。文中提出的峰值流量表示在繁忙時間內(nèi)的最大吞吐量,一定程度上反映了網(wǎng)絡(luò)流量的突發(fā)性[4,5]。Van De Meent R[6]等提出了基于拇指規(guī)則的網(wǎng)絡(luò)容量規(guī)則,規(guī)則如下:
其中,C表示目標網(wǎng)絡(luò)容量,M表示網(wǎng)絡(luò)帶寬需求,d( 1d≥ )是一個常數(shù),表示足夠的網(wǎng)絡(luò)容量滿足帶寬需求M的突發(fā)性。
目前,通過在不同的聚合等級上建立整個流量過程模型來解決容量規(guī)劃的問題已經(jīng)取得了一些成果。在報文級上,經(jīng)典的排隊論利用馬爾科夫到達和服務(wù)時間為容量規(guī)劃提供了一個架構(gòu)。然而,依據(jù)互聯(lián)網(wǎng)流量的自相似性,這樣的假設(shè)不再適用[7]。在流級上,Berger A等[8]提出了基于流測度的容量規(guī)劃模型,該模型對流特征的變化非常敏感,在實際應(yīng)用中幾乎是不可行的,而峰值流量測度更具有頑健性和實用性。Giordano S等[9]提出了一種基于聚合測度和流測度的混合模型,聚合測度與網(wǎng)絡(luò)負載有關(guān),流測度與流的特征相關(guān)。Van De Meent R等[6]對混合模型進行改進,利用聚合流量的方差對流量突發(fā)性建模。上述的2種方法,假定在整個分析過程中平均流量需求是恒定的,作者主要考慮網(wǎng)絡(luò)流量突發(fā)性。根據(jù)網(wǎng)絡(luò)流量平穩(wěn)性假設(shè),這些方法只適用于短期的網(wǎng)絡(luò)容量規(guī)劃,而不適用于長期的網(wǎng)絡(luò)容量規(guī)劃。Paxson V等[10]研究結(jié)果表明網(wǎng)絡(luò)流量平穩(wěn)性假設(shè)與遵循人類行為的流量模式相違背。在應(yīng)用級上,Marques-Neto H T等[11]把每個用戶流量需求描述為一種典型應(yīng)用會話的綜合,如Web瀏覽,P2P,即時通信和email,而該模型需要正確地鑒別每個應(yīng)用,對用戶請求模式的改變非常敏感,不適用于流量預(yù)測。Papagiannaki K等[12]通過建立整個流量測量圖模型解決容量規(guī)劃問題,還給出了在大時間尺度上的流量測量值,首先對流量測量值進行聚合,然后利用小波變換和方差分析對聚合數(shù)據(jù)進行壓縮處理。
本文提出的方法能夠有效克服上述文獻中的局限性。首先提出了峰值流量的相關(guān)概念,研究峰值流量的特征,發(fā)現(xiàn)峰值流量服從高斯分布,及其具有相互獨立性。其次分別建立方差分析模型和協(xié)方差分析模型研究網(wǎng)絡(luò)的內(nèi)在特征(主要指接入帶寬和網(wǎng)絡(luò)用戶數(shù))對峰值流量的影響,發(fā)現(xiàn)接入帶寬對峰值流量的影響較小,而網(wǎng)絡(luò)用戶數(shù)對峰值流量的影響較大。然后建立基于網(wǎng)絡(luò)用戶數(shù)的線性回歸模型,實驗結(jié)果表明網(wǎng)絡(luò)用戶數(shù)與峰值流量的均值和標準差之間存在線性關(guān)系,最后利用峰值流量的高斯性及網(wǎng)絡(luò)用戶數(shù)與峰值流量的均值或標準差之間的線性關(guān)系,在式(1)基礎(chǔ)上建立基于網(wǎng)絡(luò)用戶數(shù)的容量規(guī)劃模型,通過新建校園網(wǎng)對該模型進行了有效性驗證,實驗結(jié)果表明在缺乏網(wǎng)絡(luò)流量測量值的情況下,能夠準確評估新建校園網(wǎng)的接入帶寬。峰值流量測度既簡化了數(shù)據(jù)采集、存儲、管理和分析的過程,又能夠有效地進行鏈路容量規(guī)劃,更具有實用性和頑健性。
定義 1 平均吞吐量(HT(t))指一條鏈路或路徑在內(nèi)能夠傳輸數(shù)據(jù)量的平均值。
式中,A(t)表示鏈路在單位時間內(nèi)能夠傳輸?shù)臄?shù)據(jù)量。
定義 2 峰值流量(X)指平均吞吐量(HT(t))在內(nèi)取得的最大值。
定義 4 離差系數(shù)(CV)指吞吐量標準差與峰值流量的比值。
式(5)中,Xi, Vi, CVi分別表示第i天的峰值流量、吞吐量方差及離差系數(shù),離差系數(shù)反映了峰值流量與它的均值之間的偏離程度。
本文所使用的實驗數(shù)據(jù)來源于江蘇省教育和科研網(wǎng)邊界到國家主干路由之間采集的Netflow數(shù)據(jù)[13],抽樣比率為1∶2 048, 時間粒度為5min,數(shù)據(jù)采集時間從2011年3月1日到5月31日。對Netflow數(shù)據(jù)進一步處理得到近似吞吐量A(t),根據(jù)吞吐量A(t)計算每天的峰值流量X和吞吐量方差V,得到時間序列{Xi, i=1,2,…,N}和{Vi, i=1,2,…,N}。圖1顯示了持續(xù)3天的吞吐量(A(t)),峰值流量({ Xi, i =1,2,3 })和吞吐量方差({ Vi, i = 1,2,3 })。
圖1 U1的連續(xù)3天吞吐量,峰值流量及吞吐量方差
為了能夠有效地進行容量規(guī)劃,剔除時間序列中的節(jié)假日的峰值流量。網(wǎng)絡(luò)升級和配置改變也可能對峰值流量的特征產(chǎn)生不利影響,排除在 2011年已經(jīng)升級或配置改變的大學(xué)網(wǎng)絡(luò)。經(jīng)過上述處理得到的數(shù)據(jù)集包含來自 13個大學(xué)網(wǎng)絡(luò)的樣本,此數(shù)據(jù)集具有了所謂的網(wǎng)絡(luò)內(nèi)在特征,如接入帶寬、網(wǎng)絡(luò)用戶數(shù)等。表1給出了每個大學(xué)網(wǎng)絡(luò)的接入帶寬、網(wǎng)絡(luò)用戶數(shù)、最大峰值流量及帶寬最大利用率。從表1可知,所有鏈路利用率比較低,即使在高負載的情況下,也低于30%,平均鏈路利用率大約為25%,在最重負載下,U2的鏈路最大利用率也低于60%。鏈路的低利用率使得覆蓋效應(yīng)失效,主要原因是最大峰值流量遠遠沒有達到鏈路的最大接入帶寬,而在具有高鏈路利用率的低接入帶寬下,覆蓋效應(yīng)將會產(chǎn)生顯著效果。
利用式(6)和式(7)計算峰值流量的均值和標準差的估計值,如表2的第2、3列所示。
其次,給出了最大離差系數(shù)
最大離差系數(shù)表明了網(wǎng)絡(luò)流量的突發(fā)性行為,如表2的第4列所示。
最后,根據(jù)零假設(shè),峰值流量服從均值為μ?Uj,方差為σ ?U2j的高斯分布。通過Q-Q圖判斷零假設(shè)是否成立。如果峰值流量的散點圖組成的直線越接近對角線,表示峰值流量分布越接近高斯分布。如圖2所示,U1的大部分峰值流量值分布在對角線的周圍,所以接受零假設(shè),表明大學(xué)網(wǎng)絡(luò)的峰值流量進行Q-Q圖檢驗,得到類似的結(jié)果。
表1 大學(xué)網(wǎng)絡(luò)的內(nèi)在特征,最大峰值流量及最大利用率
圖2 U1的峰值流量的正態(tài)分布
另外,利用擬合優(yōu)度檢驗對峰值流量的高斯分布進行客觀評價。表 2最后一列給出了 Shapiro-Wilk[14]擬合優(yōu)度檢驗的結(jié)果,絕大部分大學(xué)網(wǎng)絡(luò)通過了擬合優(yōu)度檢驗,從而進一步說明大學(xué)網(wǎng)絡(luò)的峰值流量服從高斯分布。斜體部分表示沒有通過擬合優(yōu)度檢驗,擬合優(yōu)度檢驗失效可能是網(wǎng)絡(luò)流量的異常值造成的。綜合上述分析,表明大學(xué)網(wǎng)絡(luò)的峰值流量分布漸近高斯分布。
自相關(guān)函數(shù)反映了同一序列在不同時刻的取值之間的相關(guān)程度。通過自相關(guān)實驗研究連續(xù)的峰值流量之間是否存在相關(guān)性。圖3顯示了其中2個大學(xué)網(wǎng)絡(luò)在上傳和下載方向上的自相關(guān)系數(shù)和置信水平為95%的置信區(qū)間。由圖3可知,大學(xué)網(wǎng)絡(luò)U1和 U2的絕大部分自相關(guān)系數(shù)落在置信區(qū)間內(nèi),從而驗證了連續(xù)的峰值流量之間不存在相關(guān)性,其余大學(xué)網(wǎng)絡(luò)均有類似的結(jié)果。
前面的實驗結(jié)果表明,峰值流量服從高斯分布N(μ, σ2),參數(shù) μ 和 σ2可以通過峰值流量的均值和方差進行估計。下面的實驗研究網(wǎng)絡(luò)的內(nèi)在特征(包括接入帶寬、網(wǎng)絡(luò)用戶數(shù)、大學(xué)的類型及大學(xué)教職工與學(xué)生的比率等)是否對參數(shù)μ和σ產(chǎn)生影響以及影響的大小[15,16],本文運用統(tǒng)計學(xué)方法,如方差分析,協(xié)方差分析[17],主要研究接入帶寬和網(wǎng)絡(luò)用戶數(shù)對參數(shù)μ和σ的影響。
表2 峰值流量的均值、標準差、最大偏差系數(shù)及擬合優(yōu)度檢驗結(jié)果
方差分析和協(xié)方差分析需要滿足以下3個前提條件:①樣本服從正態(tài)分布;②樣本方差均相等;③樣本之間是獨立的。如果每組的元素的個數(shù)是相似的,并且沒有嚴重偏離同方差性假設(shè),則方差分析和協(xié)方差分析的結(jié)果一般是可以接受的。另外,協(xié)方差分析模型假設(shè)自變量與因變量之間存在相關(guān)性。
根據(jù)表1中接入帶寬的大小對大學(xué)網(wǎng)絡(luò)進行分組,接入帶寬在 300Mbit/s以上的大學(xué)網(wǎng)絡(luò)歸為一組,其余大學(xué)網(wǎng)絡(luò)歸為另一組。
圖3 U1和U2的自相關(guān)系數(shù)及95%的置信區(qū)間
對于每個大學(xué)網(wǎng)絡(luò) Uj,接入帶寬 BUj和網(wǎng)絡(luò)用戶數(shù) PUi均是已知的,第4部分的實驗只是考慮接入帶寬 BUj,而沒有考慮網(wǎng)絡(luò)用戶數(shù) PUj。下面的實驗僅僅研究接入帶寬對峰值流量的影響,將接入帶寬 BUj作為控制變量,把參數(shù)μUj和σUj作為觀測變量。
方差分析是檢驗多組樣本均值間的差異是否具有統(tǒng)計意義的一種統(tǒng)計方法。方差分析過程如下:
1) 將觀測變量μUj(或σUj)分成2組,并提出零假設(shè);
2) 計算組間離差平方和與組內(nèi)離差平方和;
3) 選擇F值檢驗,F(xiàn)統(tǒng)計量的觀測值等于平均組間平方和與平均組內(nèi)平方和之比,計算F統(tǒng)計量的觀測值和概率p值;
4) 給出顯著性水平 α(α = 0.05)。如果 p > α,接受零假設(shè),表明樣本來自相同的正態(tài)總體,組間沒有顯著差異;如果p < α,拒絕零假設(shè),表明樣本來自不同的正態(tài)總體,分組的均值差異有統(tǒng)計意義。通過方差分析可以知道不同變量的變異對總變異的貢獻大小,確定控制變量對觀測變量的影響大小。對接入帶寬BUj為控制變量和參數(shù)μUj(或σUj)為觀測變量,建立方差分析模型
其中,ky是觀測變量y的總體均值,為了和觀測變
表3顯示了峰值流量的均值μ和標準差σ的方差分析結(jié)果。由表3可知,p值均大于顯著性水平α(α = 0.05),表明接入帶寬因子對均值和標準差均沒有顯著影響,組內(nèi)的離差平方和占總的離差平方和的百分比較高,分別為91%,84%,82%,86%,進一步表明接入帶寬對峰值流量的影響較小,可能還有其他因子影響峰值流量。
協(xié)方差分析是一種結(jié)合回歸分析與方差分析的統(tǒng)計方法。在協(xié)方差分析中,先將定量的影響因素看作自變量,或稱為協(xié)變量,建立因變量隨自變量變化的回歸方程,這樣就可以利用回歸方程把因變量的變化中受不易控制的定量因素(協(xié)變量)的影響去除掉,再將定性的影響因素看作自變量,建立因變量隨自變量變化的方差分析模型。把網(wǎng)絡(luò)用戶數(shù)看作定量變量(或協(xié)變量),接入帶寬看作定量變量,峰值流量的均值或方差看作因變量。對式(9)進行擴展建立協(xié)方差分析模型表示網(wǎng)絡(luò)用戶數(shù)對峰值流量的影響。
表3 接入帶寬為自變量,參數(shù)μ和σ為因變量的方差分析結(jié)果
表4 接入帶寬為自變量,網(wǎng)絡(luò)用戶數(shù)為協(xié)變量,參數(shù)μ和σ為因變量的協(xié)方差分析結(jié)果
協(xié)方差分析先利用回歸分析消除網(wǎng)絡(luò)用戶數(shù)對峰值流量的影響,再利用方差分析分析接入帶寬對峰值流量的影響。表4給出了協(xié)方差分析的結(jié)果。由表4可知,協(xié)變量網(wǎng)絡(luò)用戶數(shù)的離差平方和對總的離差平方和的貢獻明顯增加,表明組內(nèi)的離差平方和所占總離差平方和的比例顯著減少。相比于方差分析的結(jié)果,對于峰值流量的均值 μ,組內(nèi)的離差平方和在上傳和下載方向上分別減少到 30%和35%,對于峰值流量的標準差 σ,組內(nèi)的離差平方和在上傳和下載方向上分別減少到18%和13%,而方差分析模型將接入帶寬作為惟一的影響因子,對于峰值流量的均值 μ,組內(nèi)的離差平方和在上傳和下載方向上分別高達91%和82%,對于峰值流量的標準差 σ,組內(nèi)的離差平方和在上傳和下載方向上分別高達84%和86%。
由上述分析可知,接入帶寬貢獻的離差平方和大小是由于接入帶寬與網(wǎng)絡(luò)用戶數(shù)的相關(guān)性造成的,而不僅僅是接入帶寬的影響,從而表明接入帶寬不是影響峰值流量的主要因素。
由上述可知,協(xié)方差分析利用線性回歸消除協(xié)變量對總的離差平方和的影響,從而將網(wǎng)絡(luò)用戶數(shù)作為自變量,建立線性回歸模型準確評價網(wǎng)絡(luò)用戶數(shù)對峰值流量的影響。為了簡化模型,對于所有的大學(xué)網(wǎng)絡(luò),假設(shè)βgroup是相同的,用β表示βgroup,建立線性回歸的簡化模型
該模型只把網(wǎng)絡(luò)用戶數(shù) PUj作為影響峰值流量的分布N (μ, σ2)的唯一因子。β表示線性回歸模型的斜率,即每個網(wǎng)絡(luò)用戶對峰值流量的均值μUj貢獻的流量大小。當考慮基于網(wǎng)絡(luò)用戶數(shù)的鏈路容量規(guī)劃時,β是一個關(guān)鍵的參數(shù)。
表5給出了模型的回歸系數(shù)和95%的置信區(qū)間。對于大學(xué)網(wǎng)絡(luò) Uj,網(wǎng)絡(luò)用戶數(shù) PUj,在下載方向上接入帶寬需求 CUj= 2 6431 + 2 772?PUj,其中,2 772表示每個網(wǎng)絡(luò)用戶對接入帶寬貢獻的大小。利用峰值流量的高斯性及網(wǎng)絡(luò)用戶數(shù)與峰值流量的均值或方差之間的線性關(guān)系,在式(1)的基礎(chǔ)上建立了一個基于網(wǎng)絡(luò)用戶數(shù)的鏈路容量規(guī)劃模型
式中, ε ~ N ( 0,σε2) ,且 ε ≤ 0.1。
在缺少網(wǎng)絡(luò)流量測量值的情況下,該方法能夠準確評估新建校園網(wǎng)的帶寬需求,還可以用來估計網(wǎng)絡(luò)用戶數(shù)隨著時間變化的校園網(wǎng)的帶寬需求。
表5 參數(shù)μ、σ的線性回歸系數(shù)及95%的置信區(qū)間
這部分實驗主要驗證容量規(guī)劃模型對新建校園網(wǎng)的有效性。表6給出了8個新建校園網(wǎng)的內(nèi)在特征,以及參數(shù)μ和σ的估計值。圖4給出了模型數(shù)據(jù),回歸直線,驗證數(shù)據(jù)以及參數(shù)μ和σ的95%的置信區(qū)間。由圖4可知,絕大部分驗證數(shù)據(jù)落在模型的95%的置信區(qū)間內(nèi),說明了容量規(guī)劃模型的有效性,其中有極少部分大學(xué)網(wǎng)絡(luò)的流量測量值落在置信區(qū)間外,表明在相同網(wǎng)絡(luò)用戶數(shù)的情況下其產(chǎn)生更多的網(wǎng)絡(luò)流量,而模型數(shù)據(jù)中也有極少部分大學(xué)網(wǎng)絡(luò)的流量測量值落在置信區(qū)間外,表明其與上述的大學(xué)具有類似的行為,造成這種現(xiàn)象的原因可能是工科類大學(xué)每個網(wǎng)絡(luò)用戶對網(wǎng)絡(luò)流量的需求比其他類型大學(xué)更高,以及不同學(xué)生與教職工的比率也會造成不同大學(xué)的網(wǎng)絡(luò)流量需求差異。從而表明該模型未能充分考慮不同類型大學(xué)及不同學(xué)生與教職工的比率的大學(xué)網(wǎng)絡(luò)用戶的流量需求差異。考慮更多的影響因素(如大學(xué)類型、學(xué)生與教職工的比率),權(quán)衡模型評估的準確性和時間復(fù)雜度,建立優(yōu)化的容量規(guī)劃模型進一步解釋這種現(xiàn)象,也是今后研究的一個方向。
表6 大學(xué)網(wǎng)絡(luò)的內(nèi)在特征,峰值流量的均值及標準差
圖4 線性回歸模型的驗證結(jié)果
本文對21個CERNET校園網(wǎng)的峰值流量進行深入研究,研究表明峰值流量服從高斯分布,不同天的峰值流量之間相互獨立,因此,在幾個月內(nèi)網(wǎng)絡(luò)流量可以利用峰值流量的高斯分布均值和方差進行估計。通過建立方差分析模型和協(xié)方差分析模型,研究網(wǎng)絡(luò)的內(nèi)在特征對峰值流量的影響,方差分析結(jié)果表明在鏈路的最大利用率遠遠未達到接入帶寬的情況下,接入帶寬對峰值流量的影響較小,協(xié)方差分析結(jié)果表明網(wǎng)絡(luò)用戶數(shù)是影響峰值流量的主要因素。最后建立基于網(wǎng)絡(luò)用戶數(shù)的線性回歸模型,實驗結(jié)果表明網(wǎng)絡(luò)用戶數(shù)與峰值流量均值和標準差之間存在線性關(guān)系。由此利用峰值流量的高斯性及網(wǎng)絡(luò)用戶數(shù)與峰值流量的均值或標準差之間的線性關(guān)系,建立一個基于網(wǎng)絡(luò)用戶數(shù)的網(wǎng)絡(luò)容量規(guī)劃模型,同時驗證了該模型對新建校園網(wǎng)鏈路容量規(guī)劃的有效性,在缺乏網(wǎng)絡(luò)流量測量值的情況下,準確評估新建校園網(wǎng)的接入帶寬。峰值流量既簡化了數(shù)據(jù)采集、存儲、管理和分析的過程,又能夠有效地進行容量規(guī)劃,更具有實用性和頑健性。雖然網(wǎng)絡(luò)用戶數(shù)對總的離差平方和貢獻較大,使得組內(nèi)的離差平方和的比例顯著減小,還需考慮更多的內(nèi)在特征建立優(yōu)化模型,獲得更準確的估計值。分析網(wǎng)絡(luò)的其他內(nèi)在特征(比如大學(xué)的類型、大學(xué)的學(xué)生與教職工的比率等)對峰值流量的影響以及建立優(yōu)化的容量規(guī)劃模型將作為下一步的研究目標。
[1] GONG W, LIU Y, MISRA V, et al. Self-similarity and long range dependence on the internet: second look at the evidence origins and implications[J]. Computer Networks, 2005, 48(3): 377-399.
[2] BERAN J, SHERMAN R, TAQQU M S, et al. Long-range dependence in variable-bit-rate video traffic[J]. IEEE Transactions on Communications, 1995, 43(234): 1566-1579.
[3] YIN Q H, JIANG Y M, JIANG S M, et al. Analysis on generalized stochastically bounded bursty traffic for communication networks[A].Proceedings of IEEE Conference on Local Computer Networks(LCN’02)[C]. Tampa, Florida, USA, 2002. 141-149.
[4] GARCíA-DORADO J L, HERNáNDEZ J A, ARACIL J, et al. Characterization of the busy-hour traffic of IP networks based on their intrinsic features[J]. Computers Networks, 2011, 55(9): 2111-2125.
[5] ZINK M, SUH K, GU Y, et al. Characteristics of Youtube network traffic at a campus network-measurements, models, and implications[J].Computer Networks, 2009, 53(4): 501-514.
[6] MEENT R V D, MANDJES M R H, PRAS A. Smart dimensioning of IP network links[A]. Proceedings of IFIP/IEEE International Workshop on Distributed Systems: Operations and Management[C]. San José, USA, 2007. 86-97.
[7] CROVELLA M E, BESTAVROS A. Self-similarity in World Wide Web traffic: evidence and possible causes[J]. IEEE/ACM Transactions on Networking, 1997, 5(6): 835-846.
[8] BERGER A, KOGAN Y. Dimensioning bandwidth for elastic traffic in high-speed data networks[J]. IEEE/ACM Transactions on Networking,2000, 8(5): 643-654.
[9] GIORDANO S, SALSANO S, Van den Berghe S, et al. Advanced QoS provisioning in IP networks: the european premium IP projects[J].IEEE Communications Magazine, 2003, 41 (1): 30-36.
[10] PAXSON V, FLOYD S. Why we don’t know how to simulate the Internet[A]. Proceedings of the 29th Conference on Winter Simulation[C]. Washington, USA, 1997. 1037-1044.
[11] MARQUES-NETO H T, ALMEIDA J M, ROCHA L C D, et al. A characterization of broadband user behavior and their e-business activities[J]. SIGMETRICS Performance Evaluation Review, 2004,32(3): 3-13.
[12] PAPAGIANNAKI K, TAFT N, ZHANG Z L, et al. Long-term forecasting of Internet backbone traffic: observations and initial models[A]. Proceedings of IEEE INFOCOM[C]. Burlingame, CA, USA,2003.1178-1188.
[13] ESTAN C, KEYS K, MOORE D, et al. Building a better netflow[A].Proceedings of ACM SIGCOMM[C]. New York, USA. 2004.245-256.
[14] LESLIE J R, STEPHENS M A, FOTOPOULOS S. Asymptotic distribution of the Shapiro-Wilk W for testing for normality[J]. The Annals of Statistics, 1986, 14(4): 1497-1506.
[15] GARCíA-DORADO J L, HERNáNDEZ J A, ARACIL J, et al. On the duration and spatial characteristics of Internet traffic measurement experiments[J]. IEEE Communications Magazine, 2008, 46(11): 148-155.
[16] WANG J H, AN C Q, YANG J H. A study of traffic, user behavior and pricing policies in a large campus network[J]. Computer Communications, 2011, 34(16): 1922-1931.
[17] KESELMAN H J, HUBERTY C J, LIX L M, et al. Statistical practices of educational researchers: an analysis of their ANOVA, MANOVA,and ANCOVA analysis[J]. Review of Education Research, 1998, 68(3):350-386.