任小強,夏耩,吳光華,管一霖
(1 中國移動通信集團甘肅有限公司蘭州分公司,蘭州 730000; 2 成都理工大學,成都 610059)
基于疊加馬爾可夫鏈的4G流量訂購量分析與預測*
任小強1,2,夏耩2,吳光華1,管一霖1
(1 中國移動通信集團甘肅有限公司蘭州分公司,蘭州 730000; 2 成都理工大學,成都 610059)
針對馬爾可夫鏈預測的局限性,本文提出了能夠定量計算疊加4G流量訂購量的馬爾可夫鏈預測方法。以定西地區(qū)2月4G流量訂購量進行狀態(tài)分級,劃分為滯銷、偏滯銷、一般、偏暢銷和暢銷,計算狀態(tài)轉(zhuǎn)移矩陣,將不同步長轉(zhuǎn)移矩陣求得的預測值進行加權平均,并運用疊加馬爾可夫鏈方法建立該地區(qū)4G流量訂購量模型,分析擬合結(jié)果。結(jié)果表明,該模型的預測精度達到了87.99%,預測效果較好,為4G流量訂購量的預測提供了一種方法。
疊加馬爾科夫鏈;4G流量訂購量;狀態(tài)分級
通信運營商資費主要由話音資費、4G流量資費、數(shù)據(jù)業(yè)務資費3部分組成,4G流量業(yè)務是資費的組成部分之一。科學合理地預測4G流量訂購量,既是合理安排促銷人員的科學依據(jù),又是制定方針政策的有效指導。然而由于多種條件因素的綜合影響增加了4G流量訂購量預測的復雜性,如人員流動、地理差異和時間變化等。常見的預測方法有線性擬合方法、插值法、函數(shù)逼近法、迭代法、解析法等方法,實際工作中,通常需要預測出未來某時段訂購量的變化區(qū)間,進而預測某時段訂購量的數(shù)值,而馬爾科夫鏈模型比較適合預測波動比較大的隨機動態(tài)過程,但是只能預測某個時期預測量處于某種狀態(tài)的概率,預測結(jié)果是一個區(qū)間,預測效果較為模糊。針對馬爾科夫鏈模型的局限性,分析疊加馬爾科夫鏈模型在4G流量訂購量中的應用,它能夠充分利用已知信息,得到具體的預測結(jié)果,該方法應用較為廣泛。
本文選取定西市2016年2月中國移動4G流量訂購量作為研究對象,采用均值——方差設立分級標準,將其分為滯銷、偏滯銷、一般、偏暢銷和暢銷5種狀態(tài),并用疊加馬爾科夫鏈預測方法對4G流量訂購量進行預測,利用馬爾科夫鏈的穩(wěn)態(tài)分布求的每種狀態(tài)分級出現(xiàn)的概率,為當?shù)剡\營商提供分析和制定政策的科學依據(jù)。
定西市位于甘肅中部,距離蘭州市98 km,截至2015年12月31日定西市管轄6縣1區(qū),包括安定區(qū)、通渭、隴西、渭源、臨洮、漳縣和岷縣,常住人口297萬,占地面積20 330 km2。主要以中國移動、中國電信和中國聯(lián)通三大運營商為主,由于地處偏僻,加之交通較為不便,當?shù)鼐用竦钠骄杖胨捷^低,有些地區(qū)4G信號甚至還沒有完全覆蓋,仍然以傳統(tǒng)的非智能機為主,所以這一地區(qū)的流量訂購量相比其它地區(qū)較差,但是也呈現(xiàn)出一定的規(guī)律。以2016年2月4G流量訂購量為原始序列,其變化曲線如圖1所示。由圖1可知,該地區(qū)4G訂購量的變化區(qū)間為[4 000,120 000],在1-8日、26-29日高于平均水平,其它日期段的訂購量低于平均水平,不過15日附近有個緩慢增減趨勢。
圖1 研究區(qū)2016年2月4G流量訂購量變化曲線
定西市地區(qū)2016年2月4G流量訂購量的原始序列的均值及均方差的無偏估計量由下式計算得出:
采用均值方差法將4G流量訂購量序列進行分級,這里分為5種狀態(tài):分別為滯銷、偏滯銷、一般、偏暢銷和暢銷。因此,用均值方差法把該序列劃分為5個區(qū)間,每個區(qū)間對應一個馬爾科夫狀態(tài),4G流量訂購量分級標準如表1所示。
依據(jù)表1中的分級標準對定西市地區(qū)2016年2月4G流量訂購量進行分級,結(jié)果如表2所示。
表1 4G流量訂購量分級標準
表2 研究地區(qū)2月4G流量訂購量狀態(tài)等級劃分
在建立馬爾可夫鏈模型前,需要計算步長為1-4的狀態(tài)轉(zhuǎn)移矩陣,其中第k步狀態(tài)轉(zhuǎn)移矩陣中第i行,第j列的元素,表示由狀態(tài)i經(jīng)過第k步轉(zhuǎn)移到狀態(tài)j的概率,即
4G流量訂購量的狀態(tài)均值向量分量是其分級區(qū)間的上下限均值,第一個分量的下限是原始序列的最小值,最后一個分量的上限是原始序列的最大值,計算得到均值向量a={5 804、5 092、6 320、7 429、8 864}。根據(jù)2016年2月4G流量訂購量序列及其相應步長的狀態(tài)轉(zhuǎn)移概率矩陣對2月26-29日的訂購量進行預測,26日的4G流量訂購量分級狀態(tài)為3,距離3月的步長為4,就可以利用均值向量的轉(zhuǎn)置與狀態(tài)為3,步長為4的狀態(tài)轉(zhuǎn)移矩陣進行相乘,得到的預測值為6 162,與實際值的相對誤差為0.030 9,依次類推,27-29日預測結(jié)果與相對誤差如表3和圖2所示。
表3 研究地區(qū)26-29號4G流量訂購量預測結(jié)果
圖2 研究地區(qū)26-29日4G流量訂購量預測值與實際值
由疊加馬爾可夫鏈對2月26-29日的4G流量訂購量的預測結(jié)果來看,預測值總體偏小,其相對誤差達到-0.243 4。其中一般狀態(tài)等級下的誤差較小,如26、27日。偏暢銷狀態(tài)等級下的誤差較大,如28日。暢銷狀態(tài)等級下的誤差也較大,如29日。在上述預測的基礎上,用疊加馬爾可夫鏈對2016年研究地區(qū)3月的4G流量訂購量進行預測,結(jié)果如表4和圖3所示。對表4中的相對誤差進行平均,得到0.120 1,則疊加馬爾科夫鏈的預測精度為0.879 9,預測效果較好。
表4 研究地區(qū)3月4G流量訂購量預測結(jié)果
設穩(wěn)態(tài)分布的概率為P=(π1,π2,π3,π4,π5),由于2步狀態(tài)轉(zhuǎn)移概率矩陣與其它的狀態(tài)轉(zhuǎn)移概率矩陣都有聯(lián)系,這里選擇2步長狀態(tài)轉(zhuǎn)移概率矩陣求其4G流量訂購量的馬爾科夫鏈模型的平穩(wěn)分布,即
代入2步狀態(tài)轉(zhuǎn)移概率矩陣得
解以上方程組,得到π1,π2,π3,π4,π5的值分別為0.144 6、0.204 5、0.431 4、0.128 6和0.090 9。這說明,研究地區(qū)的4G流量訂購量的變化過程,在很多次狀態(tài)轉(zhuǎn)移以后,該商品處于滯銷、偏滯銷、一般、偏暢銷和暢銷出現(xiàn)的概率分別為0.144 6、0.204 5、0.431 4、0.128 6和0.090 9。
圖3 研究3月4G流量訂購量預測值與實際值
(1)疊加馬爾可夫鏈預測方法克服了馬爾可夫鏈預測方法不能給出具體預測值的缺陷,利用已知4G流量訂購量數(shù)據(jù)信息,對未來4G流量訂購量進行預測,為運營商制定政策和安排促銷人員等提供了科學依據(jù)。
(2)馬爾可夫鏈的狀態(tài)轉(zhuǎn)移概率矩陣的元素都是某一狀態(tài)下的事件發(fā)生的概率,需要較多的資料數(shù)據(jù)才能進行較為合理的預測。本文采用研究地區(qū)29天的4G流量訂購量作為原始數(shù)據(jù)序列,這種情況下的頻率可以近似于概率,從而使馬爾可夫鏈模型對4G流量訂購量預測提供了科學依據(jù),預測精度達到0.8799,說明該方法改進了馬爾可夫鏈預測方法,其預測精度更高。
(3)利用馬爾可夫鏈中的遍歷性定理,計算出研究地區(qū)的穩(wěn)態(tài)分布概率,得出研究地區(qū)4G流量訂購量處于滯銷、偏滯銷、一般、偏暢銷和暢銷出現(xiàn)的概率分別為0.1446、0.2045、0.4314、0.1286和0.0909。
(4)這里選取2016年2月定西市地區(qū)數(shù)據(jù),運用疊加馬爾可夫鏈預測4G流量訂購量的變化趨勢,由于樣本量較少,加上時間影響,使其預測值與實際值的相對誤差較大,下一步的主要工作就是利用大數(shù)據(jù)和快數(shù)據(jù)的特點,并結(jié)合疊加馬爾可夫鏈方法對研究地區(qū)的4G流量訂購量進行分析與預測,使預測的相對誤差更小。
[1] 裘俊紅, 郭天民. 若干數(shù)據(jù)線性擬合方法分析[J]. 中國石油大學學報:自然科學版, 1996(6):121-125.
[2] 涂俐蘭, 黃丹. 插值法在數(shù)據(jù)修正中的應用[J]. 數(shù)學理論與應用, 2012(3):110-116.
[3] 吳方應. 可靠性計算中失效區(qū)線性逼近的最小割集模型研究及驗證[D]. 合肥:合肥工業(yè)大學, 2015.
[4] 楚敬龍. 解析法在山區(qū)地下水環(huán)境影響評價中的應用[J]. 有色金屬:礦山部分, 2011, 63(5):71-74.
[5] 張聰聰, 陳效民, 陳旭, 等. 基于馬爾可夫鏈的太湖流域典型地區(qū)年降水量分析與預測[J]. 水土保持通報, 2015, 35(1).
[6] 廖普明. 基于馬爾科夫鏈狀態(tài)轉(zhuǎn)移概率矩陣的商品市場狀態(tài)預測[J]. 統(tǒng)計與決策, 2015(2):97-99.
[7] 張有存. 馬爾可夫鏈在韶關市年降水量預測中的應用[J]. 韶關學院學報, 2015(4):4-7.
Analysis and prediction of 4G data traffic order based on superimposed markov chain
REN Xiao-qiang1,2, XIA Jiang2, WU Guang-hua1, GUAN Yi-lin1
(1 China Mobile Group Gansu Co., Ltd. Lanzhou Branch, Lanzhou 730000, China; 2 Chengdu University of Technology, Chengdu 610059, China)
Aiming at the limitation of Markov chain prediction, a Markov chain forecasting method is proposed to calculate and superpose the order amount of the 4G roaming data quantitatively. In the Dingxi prefecture’s order amount of the 4G roaming data in february for example, it is classified by status, which includes five parts, the unsalable, the partial unsalable, the general, the popular and the bestselling. The model of the region’s 4G roaming data ordering amount is established by using the additive Markov chain method, through weighted averages of the predicted value obtained by the different step transfer matrix. Last but not least, the results show that the prediction accuracy of the model is up to 87.99%, and the prediction effect is good, which provides a method for the prediction of 4G traffic order quantity.
superimposed Markov chain; business dealing of 4G data traffic; status classification
TP391.1
A
1008-5599(2017)08-0082-04
2017-03-04
2016年國家級大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目(201610616091)和2016四川省科技創(chuàng)新苗子工程(2016138)。