董志學(xué) 宮越 胡勇 甘孟壯
摘 ?要:在通過LightGBM、Prophet、HotWinters等單一預(yù)測算法,以及通過引入搜索指數(shù)等消費者行為數(shù)據(jù)作為預(yù)測變量等無法達到汽車品牌銷量預(yù)測精度的情況下,基于銷量數(shù)據(jù)特征遴選出HotWinters、Prophet、LightGBM三個預(yù)測模型,并自主構(gòu)建了Musgrave方法,以此四個算法構(gòu)建了組合預(yù)測模型,并結(jié)合熵值法作為權(quán)重動態(tài)變化的方法,構(gòu)建了“動態(tài)變權(quán)組合預(yù)測策略”。本策略使用“單地區(qū)多品牌維度、多品牌維度、多地區(qū)多品牌維度”三種方式進行六期預(yù)測并檢驗預(yù)測效果,結(jié)果表明三種方式預(yù)測誤差中位數(shù)分別為7.50%、6.11%、9.61%,因此,本策略能夠滿足對具有復(fù)雜多變特征的數(shù)據(jù)進行預(yù)測的需要。
關(guān)鍵詞:動態(tài)變權(quán);組合預(yù)測;Musgrave;熵值法
中圖分類號:TP311 ? ? 文獻標識碼:A
Abstract: Prediction accuracy of automobile brand sales cannot be achieved through single prediction algorithms such as LightGBM, Prophet, HotWinters, and the introduction of consumer behavior data such as search indexes as predictors. Based on the characteristics of sales data, this paper proposes to select three predicting models, LightGBM, HotWinters and Prophet, and independently build Musgrave method. With these four algorithms, a combined forecasting model is constructed, and a "dynamic variable weight combination predicting strategy" is constructed by taking the entropy method as a method of dynamic weight change. This strategy uses three methods of "single-region multi-brand dimension, multi-brand dimension, and multi-regional and multi-brand dimensions" to conduct six-period predictions and test the prediction results. Results show that the median prediction errors of the three methods are 7.50%, 6.11%, 9.61%. Therefore, this strategy can meet the needs of predicting data with complex and changeable characteristics.
Keywords: dynamic variable weight; combined prediction; Musgrave; entropy method
1 ? 引言(Introduction)
作為我國最重要的產(chǎn)業(yè)部門之一,汽車產(chǎn)業(yè)無論橫向還是縱向都跨越多個行業(yè)部門,同時又與百姓生活關(guān)聯(lián)緊密,對汽車市場銷量態(tài)勢進行準確預(yù)測有助于從國家層面洞察各個汽車品牌的經(jīng)營態(tài)勢,也有利于從消費者方面了解不同價值等級消費者選擇不同汽車品類過程中體現(xiàn)出來的消費結(jié)構(gòu)和能力的變遷。然而,汽車銷量數(shù)據(jù)除了具有周期性(如車型換代)、季節(jié)性(如金九銀十)、節(jié)假日(如春節(jié))等特征,還容易受政府調(diào)控(如限行限號、車險費率改革)、車企不定期促銷、優(yōu)惠措施(如購置稅減半)等行為的影響,同時又具有隨機性特征,而現(xiàn)在新興的直播購車等互聯(lián)網(wǎng)形式的營銷活動又進一步增加了預(yù)測的復(fù)雜性。
為提升預(yù)測精度,有關(guān)學(xué)者分別從應(yīng)用并改進人工智能算法[1]、引入搜索指數(shù)等消費者行為數(shù)據(jù)作為變量[2]等方面進行預(yù)測研究。雖然此類方法能夠在特點品牌[3]、特定時段[4]產(chǎn)生較高的預(yù)測精度,但更多實踐表明,使用ARIMA、X-11、HotWinters等時間序列預(yù)測方法難以覆蓋全部的數(shù)據(jù)特征,預(yù)測結(jié)果容易出現(xiàn)“有時準”但難以做到“實時準”,而當今流行的Prophet、LightGBM等機器學(xué)習算法具有難以將數(shù)據(jù)全部特征提取完全的弊端。所以,在單一靜態(tài)預(yù)測無法滿足需要的前提下,動態(tài)組合預(yù)測成為一種改善單項模型預(yù)測性能的有效策略。
本文基于相關(guān)學(xué)者的研究成果,在組合預(yù)測的基礎(chǔ)上引入動態(tài)變權(quán)的策略,以廣東地區(qū)30大品牌銷量數(shù)據(jù)為基礎(chǔ),在數(shù)據(jù)特征識別、預(yù)測模型動態(tài)選擇依據(jù)、各算法價值權(quán)重的自動調(diào)整方面進行預(yù)測研究。同時,為進一步驗證動態(tài)變權(quán)組合預(yù)測策略的有效性,將預(yù)測對象從廣東地區(qū)30大汽車品牌擴展到全國42 個地區(qū)的30大汽車品牌以及全國30大汽車品牌進行擴展預(yù)測,以期達到能夠真正指導(dǎo)實踐的目的。
2 ? 模型設(shè)計(Model design)
2.1 ? 組合預(yù)測模型的原型
組合預(yù)測最早可追溯到1969 年BATES和GRANGER[5]提出的將單個預(yù)測組合成復(fù)合預(yù)測的原理,組合模型憑借可以有效去除滯后變量和非平穩(wěn)性對預(yù)測的干擾[6]、在單項預(yù)測結(jié)果存在有偏性的情況下通過組合能產(chǎn)生具有無偏性的預(yù)測結(jié)果[7]等優(yōu)勢得到了研究學(xué)者的廣泛應(yīng)用,尤其是機器學(xué)習預(yù)測算法的引入,對通過識別長時間序列數(shù)據(jù)自身具有的規(guī)律性特征進而提升預(yù)測精度具有顯著效果。組合預(yù)測模型如下:
假設(shè)選取種預(yù)測模型(,),每個模型在預(yù)測過程中均能夠依據(jù)誤差產(chǎn)生依據(jù)時間序列而變動的權(quán)重,則變權(quán)重組合預(yù)測模型可表示為:
式中,為隨機噪音。
2.2 ? 單項預(yù)測模型的選擇
預(yù)測模型種類繁多且各有優(yōu)劣勢,從統(tǒng)計學(xué)層面來看,可分為回歸問題和分類問題兩大類。而在機器學(xué)習層面,可分為線性模型、樹型模型和神經(jīng)網(wǎng)絡(luò)模型,例如,謝如賢等[8](1992)使用ARMA、季節(jié)變量回歸模型、指數(shù)自回歸模型組成變權(quán)重組合模型對社會商品零售總額進行了預(yù)測,將平均誤差(ME)降到了0.10;王永剛等[9](2013)以灰色Verhulst模型、Brown指數(shù)平滑模型及非線性冪函數(shù)回歸模型為單項模型,構(gòu)建航空運輸事故征候的最優(yōu)變權(quán)組合預(yù)測模型,組合預(yù)測模型的平均絕對百分比誤差(MAPE)為0.02323;朱周帆等[10](2020)將SVM、RF、XGBoost與ARIMA模型相組合應(yīng)用于汽車市場預(yù)測,平均絕對百分比誤差(MAPE)為0.0297。通過對現(xiàn)有研究成果的歸納總結(jié),本文選擇的納入組合模型的預(yù)測算法需要重點考慮能夠處理季節(jié)性、趨勢性、節(jié)假日等特征的模型,因此,初選模型包括ARIMA、HotWinters、Prophet、LightGBM、XGBoost、GM(1,1)。
2.3 ? 權(quán)重設(shè)計與動態(tài)計算
預(yù)測效果的評估方法有絕對偏差、均方誤差、均方根誤差、平均絕對相對誤差、平均絕對誤差等,而權(quán)重的確定方法有等權(quán)重法、最小方差法、誤差倒數(shù)法、優(yōu)勢矩陣法、權(quán)重收縮法等。在預(yù)測效果評價方面,本文選擇絕對偏差法
()作為評價準則;在權(quán)重方法選擇方面,考慮到預(yù)測數(shù)據(jù)收到季節(jié)性、節(jié)假日等因素的影響,各預(yù)測算法對預(yù)測對象的預(yù)測結(jié)果存在動態(tài)誤差[11],權(quán)重同樣需要考慮實時、動態(tài)的特征,所以本文使用熵值法[12]計算組合預(yù)測模型的參數(shù)。熵值法的基本原理是:假設(shè)有 個評價對象(各預(yù)測算法),有 個評價指標(各品牌預(yù)測誤差),視計算結(jié)果情況將其歸一化后轉(zhuǎn)變?yōu)闃藴驶瘮?shù)據(jù),則其第 個指標的熵的計算公式為:
式中,為權(quán)數(shù),為第項指標下第年占該指標的比重。將式(2)代入式(1)即得到基于熵值法的組合預(yù)測模型。
3 ? 實例研究(Case study)
3.1 ? 數(shù)據(jù)特征認知
本文研究使用的銷量數(shù)據(jù)以月為單位,數(shù)據(jù)對象是汽車30大品牌的新車銷量數(shù)據(jù),數(shù)據(jù)范圍包括全國銷售數(shù)據(jù)和42 個主要地區(qū)的銷售數(shù)據(jù),選擇2017 年1 月至2020 年9 月作為測試集,選擇2020 年10 月至2021 年3 月數(shù)據(jù)作為驗證集。因此,從數(shù)據(jù)的時間跨度來看,數(shù)據(jù)內(nèi)涵既包括各品牌的銷售行為等微觀特征,又包括各地區(qū)經(jīng)濟發(fā)展、市場推廣等宏觀特征,這無疑都加大了預(yù)測難度。
(1)平穩(wěn)性檢驗
為進一步確定數(shù)據(jù)集的特征,本文使用ADF進行平穩(wěn)性檢驗。平穩(wěn)性是選擇預(yù)測模型的先決條件,對于平穩(wěn)型數(shù)據(jù)可使用AR、MA、ARMA等方式直接建模,而對于非平穩(wěn)型數(shù)據(jù)則需要通過取對數(shù)、差分等方法處理后使用ARIMA進行建模。對平穩(wěn)性的檢驗分為依據(jù)時序圖和自相關(guān)圖進行判斷的圖檢驗法以及構(gòu)造檢驗統(tǒng)計量的假設(shè)檢驗法,前者主要依據(jù)研究者的經(jīng)驗以主觀方式判斷,后者可通過單位根檢驗法進行客觀判別,因此,本文采取ADF方法進行檢驗。從如表1所示的檢測結(jié)果表可以看出,30大品牌中不平穩(wěn)對象占大多數(shù),僅有7 個品牌(東風本田、長安福特、長安、凱迪拉克、榮威、吉利、領(lǐng)克)在數(shù)據(jù)期內(nèi)平穩(wěn),因此,在模型選擇中,ARMA、ARIMA應(yīng)包含在選擇對象之內(nèi)。
(2)季節(jié)性判定
長期趨勢、循環(huán)波動、季節(jié)性變化、隨機波動是數(shù)據(jù)序列波動的四大類因素,因此,對季節(jié)性因素進行識別是提升預(yù)測精度的一個有效手段。本文使用圓形分布法結(jié)合集中度進行是否存在季節(jié)性以及集中月份的識別,該方法通過三角函數(shù)變換使得原始數(shù)據(jù)成為線性數(shù)據(jù),進而識別季節(jié)分布特征。圓形分布法先將12 個月變換成360 度,1 年按365.2563 天計算,1 天相當于0.9856 度(360/365.2563),以1 月1 日零時為起點,以每個月月中值作為組中值折算為度,如:1 月份31 天,組中值為15.5 天,轉(zhuǎn)換角度為15.2769 度;2 月份28 天,組中值為45(31+28/2) 天,轉(zhuǎn)換角度為44.3524 度;其他以此類推。通過公式計算圓形分布的值、平均角和角標準差。由平均角和角標準差推算該對象的集中時間和增長高峰期,由于圓形分布法對數(shù)據(jù)格式的要求必須是整年數(shù)據(jù),因此,選取2017 年、2018 年、2019 年、2020 年作為研究數(shù)據(jù),并選取0.5作為標準差系數(shù),經(jīng)計算可得廣東地區(qū)2017—2020年度30大品牌銷售高峰的月度,如表2所示。
通過以上計算結(jié)果可以看出,各個品牌在研究期間內(nèi)的季節(jié)性呈現(xiàn)出多樣化的特征,各品牌差異化程度較高,例如廣汽本田的銷售高峰期分別是6 月底7 月初和12 月底1 月初,紅旗品牌的銷售高峰期則是12 月底1 月初,而奔馳品牌的銷售高峰期則是6 月底7 月初。同時可以看出,廣汽、吉利品牌的銷售高峰近4 年均在6 月底7 月初。由此可見,各個品牌的季節(jié)性規(guī)律并不統(tǒng)一,基于此種數(shù)據(jù)特征,特將HotWinters、Prophet、LightGBM列入選擇范圍。
3.2 ? 單項模型選擇
通過對每個算法的預(yù)測進行實驗,根據(jù)預(yù)測誤差進一步淘汰了中位數(shù)誤差較大的ARIMA、GM(1,1)、XGBoost模型,最終選取了HotWinters、Prophet、LightGBM三個模型,考慮到能夠滿足數(shù)據(jù)特征的預(yù)測算法相對較少,本文結(jié)合數(shù)據(jù)特征,基于Musgrave和Henderson系數(shù)單獨設(shè)計了算法進行預(yù)測(下文簡稱Musgrave方法)。
針對本文研究的數(shù)據(jù)特征,本文使用Musgrave非對稱濾子和Henderson濾子思想構(gòu)建基于數(shù)據(jù)對稱分布特征的預(yù)測[13]。在X-11中,使用Henderson移動平均可以從季節(jié)調(diào)整后序列中提取趨勢這一成分,在應(yīng)用項中心化移動平均時,由于結(jié)構(gòu)限制,得不到序列最初項和最后項的平滑估計值,這容易給預(yù)測帶來困擾,因為通常序列中最重要的點就是最末的那個點,因此在實際應(yīng)用中需要采用非中心化移動平均來估計這些值。Musgrave的思路就是構(gòu)建這樣的非對稱移動平均,能使得未來對估計值做出的修正達到最小。其基本原理是:
3.3 ? 組合預(yù)測策略
(1)算法匹配策略
通過前期預(yù)測實驗發(fā)現(xiàn),不同的算法對同一品牌的預(yù)測能力、同一算法對不同品牌的預(yù)測能力均存在顯著差異,在實際工作中預(yù)測中位數(shù)誤差在6%以內(nèi)具有較高的使用價值,因此本文將誤差6%作為評價算法優(yōu)劣的邊界,而預(yù)測中位數(shù)誤差在6%—10%具有一般的使用價值,因此,本文分別以6%、10%作為各算法匹配的閾值,具體匹配策略如下:
第一,對于在期預(yù)測累計雙誤差(均值和中位數(shù))均低于6%的算法直接用于預(yù)測第期;如果對于多個算法都在6%以內(nèi)的,則根據(jù)此算法在該品牌的預(yù)測誤差權(quán)重,使用動態(tài)變權(quán)組合預(yù)測策略計算期綜合預(yù)測值。
第二,對某品牌的中位數(shù)誤差為的品牌的算法,使用組合算法進行預(yù)測,其中:①如果某個機構(gòu)的某個品牌上有多個算法,中位數(shù)誤差均在,則根據(jù)權(quán)重進行“動態(tài)組合預(yù)測”。②如果某個機構(gòu)的某個品牌上只有一個算法,中位數(shù)誤差均在,則使用該算法進行預(yù)測。
第三,對于某品牌的中位數(shù)大于0.1,選取各算法預(yù)測中位數(shù)誤差較低的算法進行預(yù)測。
(2)預(yù)測維度選取策略
動態(tài)變權(quán)組合預(yù)測策略能否在實踐中發(fā)揮關(guān)鍵作用取決于兩個因素,其一是在滿足數(shù)據(jù)特征多樣性前提下帶來的預(yù)測結(jié)果的準確性;其二是在一套匹配策略下能夠滿足不同類別預(yù)測場景的多樣性。因此,本文并未從單一汽車品牌銷量開始預(yù)測,而是考慮到以應(yīng)用為核心目標,在明確數(shù)據(jù)時間的前提下從不同的維度采取如下策略:第一,在單地區(qū)多品牌維度方面,選取廣東地區(qū)30大汽車品牌進行預(yù)測;第二,在多品牌維度方面,選取30大汽車品牌各自的全國銷量進行預(yù)測;第三,在多地區(qū)多品牌維度方面,選取全國42 個主要地區(qū)的30大汽車品牌銷量進行預(yù)測。之所以從這三個維度進行預(yù)測研究,其核心目的是在預(yù)測精度的前提下評估動態(tài)變權(quán)組合策略在多場景下的綜合適用性,而本文的效果評估也從這三個維度展開。
3.4 ? 預(yù)測效果評估
模型評估標準是對預(yù)測效果的直接決定影響因素,本文在評估方法方面考慮到預(yù)測對象數(shù)量較多,因此選擇“誤差中位數(shù)”作為標準。而在實踐中,決策者經(jīng)常需要對一段時間的銷量進行跨期預(yù)測,因此本文選擇2020 年10 月起至2021 年3 月累計6 個月銷量進行預(yù)測測試,而各算法在這6 期的表現(xiàn)也將作為最終效果評價的標準?;谇笆龅募僭O(shè),現(xiàn)將動態(tài)變權(quán)組合預(yù)測模型的預(yù)測效果總結(jié)和分析如下:
(1)以廣東為例的單地區(qū)多品牌維度預(yù)測效果評價
在實踐中,對單地區(qū)的汽車品牌銷量進行預(yù)測可以有效指導(dǎo)分/子公司層面的經(jīng)營行為,本文通過使用動態(tài)變權(quán)組合預(yù)測策略對廣東地區(qū)30大品牌2020 年10 月至2021 年3 月銷量進行預(yù)測,從動態(tài)變權(quán)組合預(yù)測策略所體現(xiàn)的誤差中位數(shù)可以看出,動態(tài)變權(quán)組合預(yù)測模型的誤差中位數(shù)為7.50%,明顯低于其他單一預(yù)測模型,如表3所示。
(2)以全國為預(yù)測對象的多品牌維度預(yù)測效果評價
為進一步驗證動態(tài)變權(quán)組合預(yù)測模型對宏觀方面的適用性,本文繼續(xù)對“全國30大品牌”進行預(yù)測,經(jīng)過對預(yù)測結(jié)果統(tǒng)計分析發(fā)現(xiàn),預(yù)測誤差中位數(shù)為6.11%,依然低于其他預(yù)測模型,如表4所示。
(3)在多地區(qū)為預(yù)測對象的多品牌維度預(yù)測效果評價
為進一步體現(xiàn)動態(tài)變權(quán)組合預(yù)測的能力,本文將預(yù)測對象進一步拓展到“42地區(qū)30大品牌”。經(jīng)統(tǒng)計分析發(fā)現(xiàn),動態(tài)變權(quán)組合預(yù)測模型誤差中位數(shù)為9.61%,預(yù)測效果依然比較優(yōu)秀,但相比于前兩類預(yù)測對象,誤差中位數(shù)明顯增加不少,如表5所示。對原始數(shù)據(jù)的研究表明,這主要是由于預(yù)測對象和數(shù)據(jù)維度增加了數(shù)據(jù)復(fù)雜度,進而加大了預(yù)測難度。
4 ? 結(jié)論(Conclusion)
本文提出了一種動態(tài)變權(quán)組合的預(yù)測策略,綜合來看,本策略除了能夠顯著提升預(yù)測效果外,更能擴大實踐中的預(yù)測業(yè)務(wù)場景,可以進一步增強為決策者提供輔助決策的能力。本文雖有創(chuàng)新,但也存在以下不足,綜合總結(jié)如下:
(1)預(yù)測對象數(shù)據(jù)特征的變化是決定動態(tài)變權(quán)的依據(jù)。實踐表明,對預(yù)測對象數(shù)據(jù)特征的認知至關(guān)重要,引起數(shù)據(jù)特征變化的因素多種多樣,既有行業(yè)因素,又有企業(yè)因素,還有國家和地區(qū)的政策因素,而這些都需要進行通盤考慮。更重要的是,針對每個因素導(dǎo)致的誤差都要找到相應(yīng)的預(yù)測解決方案,最終形成與預(yù)測算法、權(quán)重算法并重的數(shù)據(jù)認知算法模塊。
(2)如何將權(quán)重實現(xiàn)智能計算需要進一步研究。本文在預(yù)測算法中使用了基于權(quán)重的動態(tài)匹配策略,因為權(quán)重在不同時間同樣是一個變化的隨機變量,所以在確定權(quán)重方法時,有必要實時考慮它的不確定性,除了本文使用的熵值法,權(quán)重的計算依然有綜合評價法、Topsis法、方差倒數(shù)法等多種方法,如何通過方差、變異系數(shù)等更詳細地評估各算法在預(yù)測過程中的穩(wěn)定性,對權(quán)重的計算采用動態(tài)匹配模式非常值得進一步研究。
參考文獻(References)
[1] 劉吉華,張夢迪,彭紅霞,等.基于卷積神經(jīng)網(wǎng)絡(luò)的汽車銷量預(yù)測模型[J].計算機科學(xué),2021,48(6A):178-189.
[2] 王煉,寧一鑒,賈建民.基于網(wǎng)絡(luò)搜索的銷量與市場份額預(yù)測:來自中國汽車市場的證據(jù)[J].管理工程學(xué)報,2015,29(4):56-64.
[3] 劉吉華,張夢迪.基于百度指數(shù)的大眾汽車銷量預(yù)測研究[J].統(tǒng)計與管理,2020,35(279):25-33.
[4] 王守中,崔東佳,彭賡.基于Web搜索數(shù)據(jù)的寶馬汽車銷量預(yù)測研究[J].經(jīng)濟師,2013(12):24-26,28.
[5] BATES J M, GRANGER C. The combination of forecasts[J]. Journal of the Operational Research Society, 1969, 20(4):451-468.
[6] HOLDEN K, PEEL D A. An empirical investigation of combinations of economic forecasts[J]. Journal of Forecasting, 2010, 5(4):15-18.
[7] COULSON N E, ROBINS R P. Forecast combination in a dynamic setting [J]. Journal of Forecasting, 2010, 12(1):63-67.
[8] 謝如賢,成盛超,吳健中.變權(quán)重組合預(yù)測模型的建立與應(yīng)用[J].預(yù)測,1992,11(4):64-67.
[9] 王永剛,鄭紅運.基于最優(yōu)變權(quán)組合模型的航空運輸事故征候預(yù)測[J].中國安全科學(xué)學(xué)報,2013,23(4):26-31.
[10] 朱周帆,郝鴻,張立文.基于機器學(xué)習與時間序列組合模型的中國汽車市場預(yù)測[J].統(tǒng)計與決策,2020,36(548):179-182.
[11] 凌立文,張大斌.組合預(yù)測模型構(gòu)建方法及其應(yīng)用研究綜述[J].統(tǒng)計與決策,2019(01):20-25.
[12] 狄淼,王明剛.基于熵權(quán)組合模型的風電功率預(yù)測[J].科學(xué)技術(shù)與工程,2012,20(29):7713-7718.
[13] 中國人民銀行調(diào)查統(tǒng)計司.時間序列X-12-ARIMA季節(jié)調(diào)整——原理與方法[M].北京:中國金融出版社,2006:76-85.
作者簡介:
董志學(xué)(1980-),男,博士,算法工程師.研究領(lǐng)域:統(tǒng)計學(xué),數(shù)學(xué).
宮 ? 越(1987-),女,碩士,算法工程師.研究領(lǐng)域:數(shù)據(jù)挖掘.
胡 ? 勇(1973-),男,碩士,算法工程師.研究領(lǐng)域:機器學(xué)習.
甘孟壯(1986-),男,碩士,軟件工程師.研究領(lǐng)域:自然語言處理,機器學(xué)習.