国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

LIBSVM回歸算法在話務(wù)預(yù)測(cè)中的應(yīng)用

2014-02-10 01:29:44
關(guān)鍵詞:話務(wù)量特征向量向量

(福建省郵電規(guī)劃設(shè)計(jì)院有限公司,福州 350001)

LIBSVM回歸算法在話務(wù)預(yù)測(cè)中的應(yīng)用

鐘壇旺,林昭語

(福建省郵電規(guī)劃設(shè)計(jì)院有限公司,福州 350001)

話務(wù)量預(yù)測(cè)在工程規(guī)劃建設(shè)中有重要的意義,但常用的預(yù)測(cè)方法總體準(zhǔn)確率不高,而LIBSVM算法在解決回歸問題上表現(xiàn)出優(yōu)良的性能。本文以H市連續(xù)587天早忙時(shí)話務(wù)量樣本作為LIBSVM模型訓(xùn)練,之后用60個(gè)樣本點(diǎn)作為測(cè)試數(shù)據(jù),驗(yàn)證LIBSVM模型的預(yù)測(cè)性能,并對(duì)結(jié)果進(jìn)行均方誤差和平均相對(duì)誤差的指標(biāo)評(píng)價(jià)分析。

話務(wù)量預(yù)測(cè);LIBSVM;模型訓(xùn)練;樣本集

在工程規(guī)劃與建設(shè)中需要根據(jù)對(duì)目標(biāo)期的話務(wù)量預(yù)測(cè)來確定目標(biāo)無線網(wǎng)絡(luò)容量、擴(kuò)容需要的設(shè)備類型和數(shù)量等,話務(wù)預(yù)測(cè)結(jié)果的準(zhǔn)確與否直接關(guān)系到目標(biāo)無線網(wǎng)絡(luò)利用率、投資效益等企業(yè)發(fā)展的關(guān)鍵指標(biāo),因此以相對(duì)準(zhǔn)確的話務(wù)量預(yù)測(cè)來指導(dǎo)運(yùn)營商網(wǎng)絡(luò)建設(shè),能成功應(yīng)對(duì)用戶行為的變化及其趨勢(shì),為移動(dòng)網(wǎng)絡(luò)長久、穩(wěn)定的運(yùn)行奠定基礎(chǔ)。在通信網(wǎng)絡(luò)的規(guī)劃和設(shè)計(jì)中,常用的預(yù)測(cè)方法主要有趨勢(shì)外推法、回歸預(yù)測(cè)法、業(yè)務(wù)模型法、市場調(diào)查法等,常用的預(yù)測(cè)方法在網(wǎng)絡(luò)快速工程建設(shè)中,起到一定的積極作用,但總體準(zhǔn)確率不高。

支持向量機(jī)(SVM,Support Vector Machine)是近年來出現(xiàn)的一種機(jī)器學(xué)習(xí)方法,在解決分類和回歸問題方面都表現(xiàn)出優(yōu)良的性能。借助于支持向量機(jī)方法,通過使用LIBSVM工具箱對(duì)話務(wù)量的特征向量進(jìn)行學(xué)習(xí)訓(xùn)練,經(jīng)過交叉驗(yàn)證確定了回歸機(jī)的最優(yōu)參數(shù)組合,經(jīng)實(shí)驗(yàn)驗(yàn)證預(yù)測(cè)效果較理想,針對(duì)話務(wù)量的預(yù)測(cè)提供了一種新思路。

1 SVM 綜述

SVM是建立在統(tǒng)計(jì)學(xué)的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則基礎(chǔ)上的機(jī)器學(xué)習(xí)方法,它能夠根據(jù)有限樣本信息,在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,是SLT的一種成功實(shí)現(xiàn)。

當(dāng)SVM用于回歸估計(jì)時(shí),稱為SVM回歸機(jī)。假設(shè)訓(xùn)練樣本為(xi,yi),(i=1,…,l)。最簡單的SVM回歸機(jī)使用線性函數(shù)對(duì)樣本點(diǎn)進(jìn)行擬合。對(duì)于無法用線性函數(shù)擬合的問題,則將樣本映射到高維特征空間,在高維特征空間中建立線性模型,其中是將樣本點(diǎn)映射到高維空間的非線性變換,SVM回歸機(jī)可以表示為

滿足以下約束條件:

式(1)中,‖ω‖2代表與模型復(fù)雜度相關(guān)的因素;C>0為懲罰系數(shù),它控制對(duì)超出誤差的樣本的懲罰程度;ε為不敏感損失函數(shù),其取值大小影響支持向量的數(shù)目;為松弛變量,表示樣本偏離ε不敏感區(qū)域的程度。

對(duì)于式(1),通常通過求解上述模型的Lagrange對(duì)偶問題獲得原問題的最優(yōu)解

其中,K(xi+xj)稱為核函數(shù),滿足Mercer條件且K(xi+xj)=φ(xi)φ(xj)。徑向基核(radial basis function,RBF)是普適的核函數(shù),K(x+x')=exp(-‖x+x'‖2/σ2) =exp(-γ‖x+x'‖2),其中σ>0是核寬度系數(shù),γ=1/σ2。懲罰系數(shù)C、不敏感系數(shù)ε、核函數(shù)及相關(guān)參數(shù)的選擇,對(duì)SVM的效果有顯著影響。

LIBSVM是國立臺(tái)灣大學(xué)林智仁博士等開發(fā)設(shè)計(jì)的通用SVM軟件包,可以解決分類問題(包括C-SVC、v-SVC)、回歸問題(包括SVR、v-SVR)以及分布估計(jì)(one-class-SVM)等問題,提供了線性、多項(xiàng)式、徑向基和S形函數(shù)4種常用的核函數(shù)供選擇,可以有效地解決多類問題、交叉驗(yàn)證選擇參數(shù)、對(duì)不平衡樣本加權(quán)、多類問題的概率估計(jì)等。

2 基于LIBSVM的話務(wù)量預(yù)測(cè)方法

采用支持向量機(jī)求解回歸問題,關(guān)鍵是核函數(shù)與參數(shù)的選擇,通過對(duì)LIBSVM軟件包中核函數(shù)類型及其相關(guān)參數(shù)的對(duì)比分析,以找到最適合本預(yù)測(cè)方法的模型?;贚IBSVM的話務(wù)量預(yù)測(cè)方法流程如圖1所示。

圖1 基于LIBSVM的話務(wù)量預(yù)測(cè)方法流程圖

2.1 數(shù)據(jù)樣本采集、構(gòu)造特征向量、預(yù)處理

2.1.1 數(shù)據(jù)樣本采集、構(gòu)造特征向量

話務(wù)量是一種動(dòng)態(tài)的、隨機(jī)的時(shí)間序列,受政策因素、經(jīng)濟(jì)發(fā)展、人口數(shù)量、季節(jié)及其它自然因素等的影響,這些因素均與預(yù)測(cè)目標(biāo)值有一定的關(guān)聯(lián),但較難完全量化為回歸模型的輸入向量,而歷史話務(wù)量數(shù)據(jù)在時(shí)間序列上一定程度的反映了某些因素的影響;因此選取容易量化的時(shí)間序列與歷史的話務(wù)量相結(jié)合,構(gòu)造一個(gè)多元回歸預(yù)測(cè)特征向量如下。

式中:year(d),mon(d),day(d)為數(shù)據(jù)樣本的對(duì)應(yīng)年月日,體現(xiàn)出話務(wù)數(shù)據(jù)與時(shí)間序列的對(duì)應(yīng)關(guān)系。

user(d)為數(shù)據(jù)樣本的對(duì)應(yīng)日期的VLR登記用戶數(shù),用戶規(guī)模的發(fā)展趨勢(shì)與話務(wù)量的發(fā)展密切相關(guān),加入該維度用來表達(dá)話務(wù)量與用戶數(shù)量間的關(guān)聯(lián)性。

x(d-1),x(d-2),x(d-3)為數(shù)據(jù)樣本對(duì)應(yīng)前3天的話務(wù)量實(shí)際值,加入該維度體現(xiàn)相鄰時(shí)段話務(wù)量的相關(guān)性。平均話務(wù)量,體現(xiàn)相鄰時(shí)段話務(wù)量的相關(guān)性及一定時(shí)段內(nèi)的發(fā)展趨勢(shì),同時(shí)弱化短期內(nèi)不合理的話務(wù)波動(dòng)。

預(yù)測(cè)過程就是通過LIBSVM算法,以獲取能反映上述特征向量模型的最優(yōu)函數(shù)關(guān)系f。本文中取H市連續(xù)647天早忙時(shí)的話務(wù)量,按以上的特征向量模型建立樣本集,其中用587個(gè)樣本點(diǎn)進(jìn)行模型訓(xùn)練,之后用60個(gè)樣本點(diǎn)作為測(cè)試數(shù)據(jù)。

2.1.2 樣本集預(yù)處理

將樣本數(shù)據(jù)按LIBSVM要求的數(shù)據(jù)格式進(jìn)行整理,具體格式為(1abel>[index1]: [value1] [index2]:[value2]……

其中:label是訓(xùn)練數(shù)據(jù)集的目標(biāo)值,index是從l開始的整數(shù),表示特征的序號(hào);value是用來訓(xùn)練或預(yù)測(cè)的數(shù)據(jù),即預(yù)測(cè)模型的相關(guān)輸入維度,部分樣本集實(shí)例如表1所示。

表1 部分樣本集實(shí)例

為了避免輸入向量中各變量數(shù)量級(jí)相差過大影響訓(xùn)練效果,調(diào)用scale工具對(duì)訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)進(jìn)行歸一化處理,歸一化區(qū)間設(shè)為[-1,1]。

2.2 樣本集訓(xùn)練建模及預(yù)測(cè)

2.2.1 樣本集訓(xùn)練建模

LIBSVM回歸算法關(guān)鍵步驟之一,就是選取最合適的參數(shù),以達(dá)到最佳的預(yù)測(cè)效果,而進(jìn)行人工試驗(yàn)工作量大且較難實(shí)現(xiàn)最優(yōu)化。因此本文中直接調(diào)用gridregression.py函數(shù)進(jìn)行自動(dòng)尋優(yōu),通過設(shè)定SVM類型、核函數(shù)、10分交叉驗(yàn)證方式等,得到模型訓(xùn)練中所需的最優(yōu)參數(shù)為c=1 024,g=0.25,p=128。

應(yīng)用e -SVR與RBF函數(shù),并結(jié)合以上的參數(shù)進(jìn)行模型訓(xùn)練,得到預(yù)測(cè)模型顯示為

#iter=1 368(為迭代次數(shù));

nu=0.658 622(n-SVC、one-class-SVM與 n-SVR中參數(shù));

obj=-150 064 894.68(SVM文件轉(zhuǎn)換為的二次規(guī)劃求解得到的最小值);

rho=-7 462.401(為判決函數(shù)的常數(shù)項(xiàng)b);

nSV=407(為支持向量個(gè)數(shù));

nBSV=369(為邊界上的支持向量個(gè)數(shù))。

2.2.2 預(yù)測(cè)

根據(jù)得到的預(yù)測(cè)模型對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),輸出結(jié)果包括均方誤差(Mean Squared Error)=251 743;相關(guān)系數(shù)(Squared Correlation Coefficient)=0.692 042,同時(shí)輸出預(yù)測(cè)的話務(wù)量數(shù)據(jù),擬合的效果如圖2所示。

圖2 LIBSVM模型話務(wù)量預(yù)測(cè)擬合的效果

從圖2中可以看出預(yù)測(cè)數(shù)據(jù)曲線與真實(shí)數(shù)據(jù)曲線的趨勢(shì)基本吻合,預(yù)測(cè)曲線更為平緩,當(dāng)實(shí)際值波動(dòng)較大時(shí),預(yù)測(cè)結(jié)果出現(xiàn)較大偏差。

2.3 預(yù)測(cè)結(jié)果評(píng)價(jià)

本次的評(píng)價(jià)過程是將LIBSVM模型預(yù)測(cè)結(jié)果與趨勢(shì)外推法的預(yù)測(cè)結(jié)果進(jìn)行指標(biāo)對(duì)比。

2.3.1 評(píng)價(jià)指標(biāo)定義

對(duì)不同的預(yù)測(cè)結(jié)果進(jìn)行均方誤差和平均相對(duì)誤差這兩個(gè)指標(biāo)的評(píng)價(jià),這兩個(gè)指標(biāo)定義如下:

式中:mse為均方誤差,n為樣本總個(gè)數(shù),yi表示實(shí)際值,表示預(yù)測(cè)值。

式中:E為平均相對(duì)誤差,n為樣本總個(gè)數(shù),yi表示實(shí)際值,表示預(yù)測(cè)值。

2.3.2 趨勢(shì)外推法的預(yù)測(cè)結(jié)果

將587天的忙時(shí)話務(wù)量樣本模型進(jìn)行指數(shù)、線性、對(duì)數(shù)、冪、移動(dòng)平均、二次曲線和三次曲線等的擬合,選擇擬合度最高的三次曲線建立趨勢(shì)模型,如圖3所示。

圖3 話務(wù)量增長趨勢(shì)擬合曲線

根據(jù)圖3中的趨勢(shì)模型y=-3E-05x3+0.0183x2+9.456x+4500.9,計(jì)算得到的60個(gè)測(cè)試樣本的預(yù)測(cè)值與實(shí)際擬合的效果如圖4所示。

2.3.3 評(píng)價(jià)指標(biāo)對(duì)比

兩種預(yù)測(cè)方法的均方誤差和平均相對(duì)誤差指標(biāo)對(duì)比如表2所示。

從以上評(píng)價(jià)指標(biāo)可以看出,LIBSVM回歸方法通過時(shí)間序列和活躍用戶數(shù)刻畫趨勢(shì)量、相鄰時(shí)段的相關(guān)維度輸入等,并利用SVM突出的高維識(shí)別能力進(jìn)行擬合,預(yù)測(cè)數(shù)據(jù)曲線與真實(shí)數(shù)據(jù)曲線發(fā)展趨勢(shì)基本吻合,與趨勢(shì)外推法相比預(yù)測(cè)精度有較大的提高。

表2 兩種預(yù)測(cè)方法指標(biāo)對(duì)比

圖4 趨勢(shì)外推法話務(wù)量預(yù)測(cè)擬合的效果

3 結(jié)論

LIBSVM回歸算法通過分析建立合適的輸入樣本集、通過參數(shù)選優(yōu)確定最優(yōu)參數(shù),并利用SVM突出的高維識(shí)別能力進(jìn)行擬合,能實(shí)現(xiàn)與目前常用預(yù)測(cè)方法相比誤差更小的預(yù)測(cè),體現(xiàn)LIBSVM回歸算法的優(yōu)越性。在無線網(wǎng)絡(luò)工程規(guī)劃建設(shè)中,應(yīng)用本算法對(duì)規(guī)劃期的目標(biāo)預(yù)測(cè)值進(jìn)行必要的修正,在設(shè)備配置合理化等方面將會(huì)起到積極的作用。

Application of LIBSVM regression algorithm in traffic prediction

ZHONG Tan-wang,LIN Zhao-yu
(Fujian Posts and Telecommunications Planning and Design Institute Co., Ltd., Fuzhou 350001, China)

Traffic prediction has an important significance in the project, overall accuracy is not high by some common methods, but the LIBSVM algorithm shows good performance quality in solving the regression problems. This paper takes the samples as LIBSVM model training ,basing on the early busy traff c of H city for 587 consecutive days, and verify the predicted performance of LIBSVM model by testing data for following 60 samples. Finally, analyzes the results by the methods of evaluation error and average relative error.

traff c prediction; LIBSVM; model training; sample set

TN929.5

A

1008-5599(2014)09-0080-04

2014-07-08

猜你喜歡
話務(wù)量特征向量向量
二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
向量的分解
克羅內(nèi)克積的特征向量
聚焦“向量與三角”創(chuàng)新題
基于時(shí)間序列模型的異常話務(wù)量分塊建模和預(yù)測(cè)
一類特殊矩陣特征向量的求法
EXCEL表格計(jì)算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
S1240交換機(jī)實(shí)時(shí)話務(wù)量統(tǒng)計(jì)的分析與實(shí)現(xiàn)研究
向量垂直在解析幾何中的應(yīng)用
向量五種“變身” 玩轉(zhuǎn)圓錐曲線
海南省| 平江县| 双牌县| 凤阳县| 定襄县| 泾源县| 甘孜| 湖州市| 双牌县| 桑日县| 涞源县| 襄汾县| 巴彦淖尔市| 赫章县| 石嘴山市| 依安县| 海伦市| 金山区| 读书| 布尔津县| 锡林浩特市| 龙游县| 扎兰屯市| 张家川| 鄢陵县| 兴安盟| 定边县| 滨海县| 白玉县| 固镇县| 阿克| 孟州市| 汾西县| 淮滨县| 舟曲县| 太仓市| 郎溪县| 瑞金市| 太仆寺旗| 介休市| 云林县|