趙旻,張丹楓,曾中良,謝東風(fēng),李青,徐路寧
1 云南省煙草專賣局(公司),信息中心,云南省昆明 650000;
2 云南省煙草專賣局(公司),卷煙銷售管理處,云南省昆明 650000;
3 北京中軟國際信息技術(shù)有限公司,互聯(lián)網(wǎng)ITS集團(tuán)MSO中心,北京海淀 100000
目前關(guān)于卷煙需求預(yù)測的研究成果有很多。文獻(xiàn)[1]利用1997-2002年中國煙草行業(yè)和相關(guān)經(jīng)濟(jì)學(xué)指標(biāo),從宏觀層面構(gòu)建了我國卷煙消費(fèi)需求的數(shù)學(xué)模型,認(rèn)為居民消費(fèi)支出、卷煙價(jià)格、地區(qū)差異、經(jīng)濟(jì)增長、產(chǎn)業(yè)升級(jí)、城鄉(xiāng)居民消費(fèi)差異和卷煙平均消費(fèi)傾向等因素對我國卷煙需求具有顯著影響。文獻(xiàn)[2]以2008-2012年云南省宏觀經(jīng)濟(jì)數(shù)據(jù)和銷售數(shù)據(jù)為基礎(chǔ),通過脈沖響應(yīng)函數(shù)得到宏觀經(jīng)濟(jì)對卷煙市場運(yùn)行的影響具有一定的滯后效應(yīng);方差分解分析結(jié)果顯示在短期和中期投資對卷煙市場拉動(dòng)的效果最為顯著,消費(fèi)對卷煙市場拉動(dòng)的效果最不顯著。文獻(xiàn)[3]基于2007-2013云南省宏觀經(jīng)濟(jì)數(shù)據(jù)和銷售數(shù)據(jù),分析城鎮(zhèn)農(nóng)村市場差異,明確了對農(nóng)村城鎮(zhèn)市場分別進(jìn)行預(yù)測分析的思路,提出了銷售額數(shù)據(jù)按照不同CPI還原的思路,降低數(shù)據(jù)受價(jià)格指數(shù)變動(dòng)影響程度;并運(yùn)用PCA主成分分析,對銷售數(shù)據(jù)基于宏觀經(jīng)濟(jì)數(shù)據(jù)的表達(dá)式進(jìn)行了解讀。但現(xiàn)有的卷煙需求預(yù)測研究存在一些不足,首先,都是運(yùn)用當(dāng)期的宏觀經(jīng)濟(jì)指標(biāo)預(yù)測當(dāng)期的卷煙銷量,實(shí)際可操作性較差,不能滿足煙草行業(yè)的預(yù)測需求;其次,文獻(xiàn)中均未基于預(yù)測實(shí)際情況,開展模型的穩(wěn)定性評(píng)價(jià)研究。
本文構(gòu)建了一種適合云南煙草行業(yè)需求預(yù)測的方法體系,并對需求預(yù)測模型進(jìn)行了動(dòng)態(tài)評(píng)判。
由于各品類季節(jié)性差異大,銷售曲線完全不同,可以按品類單獨(dú)構(gòu)建預(yù)測模型來預(yù)測其銷量。
本文運(yùn)用IBM SPSS Modeler為分析工具,以云南省2009-2016年的宏觀經(jīng)濟(jì)數(shù)據(jù)和卷煙銷量數(shù)據(jù)為基礎(chǔ),構(gòu)建組合預(yù)測模型預(yù)測云南省卷煙銷量。在數(shù)據(jù)處理階段,運(yùn)用居民消費(fèi)價(jià)格指數(shù)(CPI)對宏觀數(shù)據(jù)和銷量數(shù)據(jù)進(jìn)行處理[3];在指標(biāo)選擇上,運(yùn)用時(shí)差相關(guān)分析法和簡單相關(guān)分析法分析宏觀經(jīng)濟(jì)指標(biāo)與卷煙銷量的相關(guān)關(guān)系,選擇了科學(xué)的模型指標(biāo),在預(yù)測時(shí)間點(diǎn)運(yùn)用宏觀經(jīng)濟(jì)數(shù)據(jù)進(jìn)行回歸;在模型構(gòu)建上,通過構(gòu)建組合預(yù)測模型[4][5][6](ARIMA模型[7]和回歸模型[8])預(yù)測卷煙銷量;在對模型穩(wěn)定性評(píng)價(jià)上,通過計(jì)算模型的預(yù)測精度、置信度等對模型進(jìn)行實(shí)時(shí)評(píng)價(jià),構(gòu)建了新的評(píng)價(jià)體系,確保預(yù)測模型科學(xué)可信。
以對云南省卷煙總量預(yù)測為例,對宏觀經(jīng)濟(jì)指標(biāo)選擇、模型構(gòu)建、模型評(píng)價(jià)等過程進(jìn)行分析及說明。
圖1 需求預(yù)測路徑Fig.1 The route of demand forecast
宏觀經(jīng)濟(jì)領(lǐng)域的經(jīng)濟(jì)活動(dòng)會(huì)在一定程度上影響和反映卷煙需求市場波動(dòng)狀況。通過查閱文獻(xiàn)資料,結(jié)合數(shù)據(jù)可得性,選定規(guī)模以上工業(yè)增加值、固定資產(chǎn)投資、社會(huì)消費(fèi)品零售總額、進(jìn)出口貿(mào)易總額、地區(qū)生產(chǎn)總值、第一產(chǎn)業(yè)增加值、第二產(chǎn)業(yè)增加值、第三產(chǎn)業(yè)增加值、農(nóng)林牧漁服務(wù)業(yè)總產(chǎn)值、城鎮(zhèn)常住居民人均可支配收入、城鎮(zhèn)居民人均消費(fèi)支出、農(nóng)村居民人均現(xiàn)金收入、居民消費(fèi)價(jià)格指數(shù)(CPI)、第三產(chǎn)業(yè)占GDP比值等指標(biāo)進(jìn)入備選指標(biāo)庫。
考慮到宏觀數(shù)據(jù)的情況,采用季度數(shù)據(jù)進(jìn)行預(yù)測,2009年1季度到2016年3季度共31個(gè)樣本。CPI反映居民家庭購買消費(fèi)商品及服務(wù)價(jià)格水平的變動(dòng)情況。本文利用居民消費(fèi)價(jià)格指數(shù)(CPI)對本研究中涉及貨幣的數(shù)據(jù)進(jìn)行價(jià)格可比調(diào)整,逐期縮減至基期,折算CPI原始值?,F(xiàn)有CPI數(shù)據(jù)共有城鎮(zhèn)CPI、農(nóng)村CPI、綜合CPI、煙酒食品CPI等若干細(xì)分類。本文選擇2010年1月為基期,所有月份CPI均先逐年同比到2010年同月,再環(huán)比折回2010年1月。
2.1.1 原始的CPI計(jì)算原理
現(xiàn)將原始CPI同除以100,即得到:
2.1.2 將所有的CPI1換算成2010年對應(yīng)月份為基期的同比CPI2。
如:求2008年9月同比2010年9月的CPI1,即:
2.1.3 以2010年對應(yīng)月份為基期的同比CPI2,換算成以2010年1月為基期的CPI3。
如:求CPI3(2007.3/2010.1)
2.1.4 2010年各月環(huán)比的求解
由:環(huán)比的增長率=當(dāng)期消費(fèi)價(jià)格/上一期消費(fèi)價(jià)格-1
則有:環(huán)比CPI=1+環(huán)比增長率
已知CPI綜合2012年各月的環(huán)比,及2012年對應(yīng)2011年各月同比消費(fèi)價(jià)格指數(shù),求2011年各月環(huán)比,配合2011年對應(yīng)2010年各月同比CPI,進(jìn)而求得2010年各月的環(huán)比 CPI。
2.1.5 對應(yīng)分析周期處理數(shù)據(jù)周期
CPI綜合用于GDP、社會(huì)零售品總額、固定資產(chǎn)投資經(jīng)濟(jì)指標(biāo)換算,CPI煙酒用于銷售額換算。各類型的CPI算法相同,均為折算到同一個(gè)基期。
2.2.1 指標(biāo)選擇方法
本文運(yùn)用時(shí)差相關(guān)分析和相關(guān)分析法來對指標(biāo)進(jìn)行篩選,再將與卷煙銷量有較強(qiáng)相關(guān)關(guān)系的宏觀經(jīng)濟(jì)指標(biāo)納入回歸模型對卷煙需求進(jìn)行預(yù)測,同時(shí)考慮到宏觀經(jīng)濟(jì)指標(biāo)公布的滯后性以及經(jīng)濟(jì)指標(biāo)本身反映經(jīng)濟(jì)活動(dòng)的滯后性,引入滯后期概念,運(yùn)用先行宏觀經(jīng)濟(jì)數(shù)據(jù)預(yù)測當(dāng)期銷量。
● 時(shí)差相關(guān)分析
時(shí)差相關(guān)分析是利用時(shí)差相關(guān)系數(shù)驗(yàn)證經(jīng)濟(jì)時(shí)間序列先行、一致、滯后關(guān)系的一種常用方法。選定應(yīng)變基準(zhǔn)指標(biāo),使被選自變指標(biāo)超前或滯后基準(zhǔn)指標(biāo)若干期,計(jì)算它們的相關(guān)系數(shù),最大的相關(guān)系數(shù)對應(yīng)的移動(dòng)月數(shù)為該應(yīng)變指標(biāo)延遲數(shù)。即:設(shè)基準(zhǔn)指標(biāo)為Y,被選指標(biāo)為X,然后計(jì)算Y和X的時(shí)滯為k的時(shí)間序列之間的相關(guān)系數(shù)kr(k=0,±1,±2,…),能使相關(guān)系數(shù)最大的時(shí)滯k,即為該指標(biāo)的先行或滯后月份。
式中k表示超前或滯后期,k取負(fù)值時(shí)表示超前,取正數(shù)時(shí)表示滯后,k被稱為時(shí)差或延遲數(shù)。一般來講,最大的時(shí)差相關(guān)系數(shù)最好大于0.5,這樣說明時(shí)滯性比較明顯,否則說明入選的指標(biāo)的時(shí)滯意義不明顯。
● 相關(guān)分析
相關(guān)分析是變量之間相關(guān)程度的指標(biāo)。相關(guān)系數(shù)的取值在-1到1之間。
2.2.2 指標(biāo)篩選結(jié)果
以卷煙銷量為基準(zhǔn)指標(biāo),以宏觀經(jīng)濟(jì)指標(biāo)為備選指標(biāo)進(jìn)行時(shí)差相關(guān)分析。通過時(shí)差相關(guān)分析結(jié)果發(fā)現(xiàn)規(guī)模以上工業(yè)增加值、進(jìn)出口貿(mào)易總額、農(nóng)村居民人均現(xiàn)金收入和第三產(chǎn)業(yè)占GDP比重4個(gè)指標(biāo)先行1-4期與卷煙銷量的相關(guān)系數(shù)都小于0.5,說明這六個(gè)指標(biāo)與卷煙銷量的相關(guān)性較低,對預(yù)測卷煙銷量的貢獻(xiàn)較小,從備選指標(biāo)庫刪除。
表1 時(shí)差相關(guān)分析結(jié)果Tab.1 The result of time difference correlation analysis
再通過宏觀經(jīng)濟(jì)指標(biāo)間的相關(guān)性分析,將高度相關(guān)的幾個(gè)指標(biāo)用一個(gè)指標(biāo)來替代,用此指標(biāo)反映這一類指標(biāo)對卷煙銷量的影響,即通過主成分分析,避免較多指標(biāo)的搜集工作,提高工作效率。
下表是地區(qū)生產(chǎn)總值與其他宏觀經(jīng)濟(jì)指標(biāo)間的相關(guān)系數(shù),地區(qū)生產(chǎn)總值與第一產(chǎn)業(yè)總值、第二產(chǎn)業(yè)總值、第三產(chǎn)業(yè)總值的相關(guān)系數(shù)均高于0.9,且這四個(gè)指標(biāo)均反映生產(chǎn)總值數(shù)據(jù),反映的經(jīng)濟(jì)因素相似,故用地區(qū)生產(chǎn)總值替代這一類指標(biāo)。從備選指標(biāo)庫刪除第一產(chǎn)業(yè)總值、第二產(chǎn)業(yè)總值、第三產(chǎn)業(yè)總值。
表2 第一產(chǎn)業(yè)總值與其他各宏觀經(jīng)濟(jì)指標(biāo)相關(guān)系數(shù)表Tab.2 The correlation coefficient between total production value of the primary industry and other macroeconomic indicators
綜上,云南卷煙銷量預(yù)測的宏觀經(jīng)濟(jì)指標(biāo)池保留固定資產(chǎn)投資、社會(huì)消費(fèi)品零售總額、地區(qū)生產(chǎn)總值、農(nóng)林牧漁服務(wù)業(yè)總產(chǎn)值、城鎮(zhèn)常住居民人均可支配收入、城鎮(zhèn)居民人均消費(fèi)支出、期末常住人口。
2.3.1 預(yù)測模型方法[5][6][7][8][9][10]
運(yùn)用篩選后的宏觀經(jīng)濟(jì)指標(biāo)和卷煙銷量分別建立回歸預(yù)測模型和時(shí)間序列預(yù)測模型對不同品類的卷煙市場需求進(jìn)行預(yù)測,再進(jìn)行預(yù)測結(jié)果擬合。
● 時(shí)間序列模型
ARIMA模型[7]是現(xiàn)代時(shí)間序列預(yù)測的一種常用方法(又叫博克思-詹金斯法),即求和自回歸移動(dòng)平均模型,預(yù)測模型為:
其中q為滑動(dòng)平均模型的階數(shù),Yt為時(shí)間序列在t期的觀測值,et是時(shí)間序列模型在期的誤差或偏差,et-q是時(shí)間序列模型在t -q期的誤差或偏差,φ1,φ2,...,φp是滑動(dòng)平均模型的參數(shù)。
● 回歸預(yù)測模型
本文主要運(yùn)用多元線性回歸[8]進(jìn)行市場預(yù)測,了解兩個(gè)或多個(gè)變量間是否相關(guān)、相關(guān)方向與強(qiáng)度,并通過處理多變量間相關(guān)關(guān)系形成一個(gè)統(tǒng)計(jì)預(yù)測模型以觀察特定變量預(yù)測銷量銷售額數(shù)據(jù)。
● 最小二乘法確定組合預(yù)測模型權(quán)重[9]
得到時(shí)間序列及回歸預(yù)測模型預(yù)測結(jié)果后,構(gòu)造二次規(guī)劃的模型,其
約束條件為
其中i為預(yù)測模型的種類,k為用來預(yù)測的模型的總數(shù),Yt為實(shí)際值(或觀測值),為預(yù)測值,構(gòu)造式的廣義拉格朗日函數(shù)在極值點(diǎn)應(yīng)滿足,分別對ω、λ求偏導(dǎo)得方程組,通過解這個(gè)的方程組,即可以得到各權(quán)重系數(shù)ωi。
運(yùn)用矩陣計(jì)算簡化模型計(jì)算。設(shè)在某個(gè)時(shí)刻t的觀察值(實(shí)際值)為Yt,設(shè)第i種預(yù)測方法的組合系數(shù)或權(quán)重為ωi,取權(quán)向量,且滿足
于是組合預(yù)測模型寫成向量形式為
我們運(yùn)用k種預(yù)測方法,對n個(gè)數(shù)值進(jìn)行預(yù)測得到n×k矩陣的預(yù)測矩陣為
則上式可寫為 AW = Y
運(yùn)用矩陣的運(yùn)算ATAW=ATY
則運(yùn)用矩陣的計(jì)算可以求出權(quán)向量W。
2.3.2 預(yù)測模型及結(jié)果
運(yùn)用云南省2009年1季度至2016年3季度的宏觀經(jīng)濟(jì)數(shù)據(jù)和卷煙銷量數(shù)據(jù),通過構(gòu)建組合預(yù)測模型,預(yù)測云南省2016年4季度及2017年1季度的卷煙總需求量。
對卷煙銷量的歷史數(shù)據(jù)進(jìn)行時(shí)間序列預(yù)測,記一階差分調(diào)整后的銷量序列為,建立ARIMA(1,1,1)模型:
模型調(diào)整后的R2為0.89,擬合度較高。
本文運(yùn)用先行兩期的宏觀經(jīng)濟(jì)指標(biāo)數(shù)據(jù)對當(dāng)期卷煙需求進(jìn)行預(yù)測,運(yùn)用逐步回歸法最終進(jìn)入回歸模型的指標(biāo)有國內(nèi)生產(chǎn)總值(GDP)、社會(huì)消費(fèi)品零售總額(consume)、城鎮(zhèn)居民人均可支配收入(income)三個(gè)指標(biāo),記回歸預(yù)測值為,建立回歸模型:
模型調(diào)整后的R2為0.93,擬合效果較好。
運(yùn)用最小二乘法計(jì)算兩個(gè)預(yù)測模型的權(quán)重,運(yùn)用最小二乘法計(jì)算兩個(gè)預(yù)測模型的權(quán)重,根據(jù)前面的定義可知
得
從而:
最終得到2016年4季度及2017年1季度的預(yù)測結(jié)果如下表所示,從表中可知,跟實(shí)際銷量相比預(yù)測結(jié)果的誤差均在3%以下,預(yù)測結(jié)果可信。
表3 云南省總量預(yù)測結(jié)果Tab.3 The forecast result of Yunnan cigarette demand
圖2 云南省一類煙銷量預(yù)測擬合效果Fig.2 Fitting result of thefirst class cigarette sales forecast of Yunnan
同理,分別構(gòu)建云南省一類煙、二類煙、三類煙的預(yù)測模型,得到各品類卷煙的擬合效果如下三圖所示:
圖3 云南省二類煙銷量預(yù)測擬合效果Fig.3 Fitting result of the second class cigarette sales forecast of Yunnan
圖4 云南省三類煙銷量預(yù)測擬合效果Fig.4 Fitting result of the third class cigarette sales forecast of Yunnan
2.4.1 模型評(píng)價(jià)方法
通過查找相關(guān)文獻(xiàn)[11]發(fā)現(xiàn),對模型穩(wěn)定性評(píng)價(jià)研究較少。本文創(chuàng)新性的以歷史建模預(yù)測誤差為基礎(chǔ),計(jì)算不同誤差值的置信度,根據(jù)可接受的置信度范圍對模型穩(wěn)定性進(jìn)行判定,確保模型科學(xué)可靠。
評(píng)價(jià)標(biāo)準(zhǔn)及計(jì)算步驟如下:
1.根據(jù)業(yè)務(wù)需要設(shè)定預(yù)測精準(zhǔn)度及預(yù)測精準(zhǔn)度置信度,本文設(shè)定預(yù)測精準(zhǔn)度=90%,置信度=88%
2.計(jì)算預(yù)測模型的預(yù)測精準(zhǔn)度。
3.計(jì)算預(yù)測精準(zhǔn)度的置信度。
4.根據(jù)設(shè)定的預(yù)測精準(zhǔn)度和置信度對模型穩(wěn)定性進(jìn)行評(píng)價(jià),若模型未達(dá)到設(shè)定標(biāo)準(zhǔn),則重新建模進(jìn)行預(yù)測。
2.4.2 模型評(píng)估結(jié)果
2010年1季度至2016年3季度云南省預(yù)測模型的擬合誤差如下圖,組合預(yù)測模型的預(yù)測誤差波動(dòng)相對比較穩(wěn)定,雖然不能保證每個(gè)時(shí)點(diǎn)的預(yù)測精度最低,但用組合模型對所有時(shí)點(diǎn)的預(yù)測是最優(yōu)的,預(yù)測結(jié)果也更加貼近實(shí)際結(jié)果?;诮M合預(yù)測模型的預(yù)測誤差,計(jì)算其不同預(yù)測精準(zhǔn)度下的置信度。鑒于不同地區(qū)的銷量變化趨勢不同,構(gòu)建的預(yù)測模型不同,需針對不同的情況設(shè)定不同的評(píng)價(jià)標(biāo)準(zhǔn)。
本文確定三類評(píng)價(jià)標(biāo)準(zhǔn):
A級(jí):模型預(yù)測精準(zhǔn)度90%以上,置信度90%以上,共有4個(gè)地市(含云南?。M足;
圖5 云南省總量預(yù)測模型誤差比較圖Fig.5 Comparison diagram of prediction error among three methods
B級(jí):不滿足A級(jí)標(biāo)準(zhǔn),但模型預(yù)測精準(zhǔn)度85%以上,置信度88%以上,共有12個(gè)地市滿足;
C級(jí):不滿足A、B級(jí)標(biāo)準(zhǔn),模型預(yù)測精準(zhǔn)度85%以上,置信度88%以下,共有1個(gè)。
云南省總量預(yù)測模型預(yù)測精準(zhǔn)度為90%時(shí),置信度92.85%;預(yù)測精準(zhǔn)度85%時(shí),置信度100%。根據(jù)設(shè)定的評(píng)判標(biāo)準(zhǔn),則可將云南省總量預(yù)測模型評(píng)為A級(jí),此預(yù)測模型穩(wěn)定性較好,預(yù)測結(jié)果科學(xué)可信。
針對A級(jí)預(yù)測結(jié)果的地市,預(yù)測結(jié)果可直接運(yùn)用,針對B級(jí)預(yù)測結(jié)果的地州,進(jìn)行進(jìn)一步的觀測與數(shù)據(jù)追蹤,針對C級(jí)預(yù)測結(jié)果地州,需逐個(gè)具體進(jìn)行分析,對基礎(chǔ)數(shù)據(jù)、業(yè)務(wù)開展情況、模型科學(xué)性進(jìn)行進(jìn)一步驗(yàn)證。
本文以云南省宏觀經(jīng)濟(jì)數(shù)據(jù)和銷量數(shù)據(jù)為基礎(chǔ),構(gòu)建了一套合理的適合煙草行業(yè)需求預(yù)測的方法,并通過實(shí)際驗(yàn)證得到云南需求預(yù)測結(jié)果誤差在3%以內(nèi),模型穩(wěn)定性評(píng)價(jià)為A級(jí)。本文的創(chuàng)新之處有以下幾點(diǎn):一是鑒于宏觀經(jīng)濟(jì)數(shù)據(jù)公布的滯后性,并考慮到卷煙行業(yè)需求預(yù)測的實(shí)際需求,在驗(yàn)證可行的情況下,在模型構(gòu)建階段,運(yùn)用先行兩期的宏觀經(jīng)濟(jì)指標(biāo)來預(yù)測當(dāng)期的卷煙需求量,預(yù)測結(jié)果科學(xué)有效。二是在組合預(yù)測模型的權(quán)重計(jì)算上,運(yùn)用最小二乘法計(jì)算回歸預(yù)測模型和時(shí)間序列預(yù)測模型的權(quán)重,確保組合預(yù)測模型結(jié)果的科學(xué)性。三是在對模型穩(wěn)定性評(píng)價(jià)上,以建模預(yù)測結(jié)果的平均相對誤差及置信度為基礎(chǔ),研究出了一套適合云南卷煙需求預(yù)測的模型評(píng)判標(biāo)準(zhǔn),并運(yùn)用判定標(biāo)準(zhǔn)對模型的穩(wěn)定性進(jìn)行判定,確保模型科學(xué)可靠。