朱亮 張建萍
[摘 要]旅游需求的序列相關(guān)結(jié)構(gòu)是旅游學(xué)研究中長(zhǎng)期被忽略的一個(gè)問(wèn)題。在旅游預(yù)測(cè)建模中,往往假定線性的或者是某種特定的非線性序列相關(guān)結(jié)構(gòu)。這種假定雖然為模型構(gòu)建帶來(lái)一定的便捷性,但是很可能會(huì)影響預(yù)測(cè)的精確性。該研究引入Bernstein Copula函數(shù)刻畫(huà)中國(guó)入境旅游需求的序列相關(guān)結(jié)構(gòu),以構(gòu)建預(yù)測(cè)模型進(jìn)行實(shí)證分析。實(shí)證結(jié)果表明,Bernstein Copula模型在旅游預(yù)測(cè)中具有其優(yōu)越性。研究的結(jié)果為旅游需求建模提供了一個(gè)新的思考方向。
[關(guān)鍵詞]序列相關(guān)結(jié)構(gòu);Bernstein Copula函數(shù);中國(guó)入境旅游;旅游需求預(yù)測(cè)
[中圖分類(lèi)號(hào)]F59
[文獻(xiàn)標(biāo)識(shí)碼]A
[文章編號(hào)]1002-5006(2017)11-0041-08
Doi: 10.3969/j.issn.1002-5006.2017.11.010
引言
旅游需求預(yù)測(cè)對(duì)于政府和旅游相關(guān)企業(yè)的戰(zhàn)略規(guī)劃和決策制定來(lái)說(shuō)有著極為重要的作用[1],因而長(zhǎng)期受到旅游學(xué)界的關(guān)注。許多學(xué)者都致力于旅游需求預(yù)測(cè)模型的研究,以期提高旅游預(yù)測(cè)的精確度。然而,對(duì)于不同的建模數(shù)據(jù)頻率、預(yù)測(cè)期長(zhǎng)度、客源地和目的地來(lái)說(shuō),旅游需求預(yù)測(cè)模型也會(huì)表現(xiàn)出不同的預(yù)測(cè)能力[2-3]。因此,迄今為止,旅游需求預(yù)測(cè)依然是旅游研究中的熱點(diǎn)和難點(diǎn)。
國(guó)內(nèi)外學(xué)者從20世紀(jì)60年代就開(kāi)始對(duì)旅游需求預(yù)測(cè)進(jìn)行研究,并取得眾多成果[4]。Peng等的綜述結(jié)果顯示,時(shí)間序列模型從80年代開(kāi)始成為旅游需求建模的主流[5]。這些時(shí)間序列模型主要是單變量模型,依賴旅游需求的序列相關(guān)關(guān)系,即滯后變量與當(dāng)期變量之間的相關(guān)性,來(lái)進(jìn)行預(yù)測(cè)。其中,Box和Jenkins提出的自回歸移動(dòng)平均(ARMA)模型[6],運(yùn)用最為廣泛,其各種衍生模型也被應(yīng)用到旅游需求預(yù)測(cè)中,如考慮季節(jié)性因素的SARIMA模型[6-10]、分?jǐn)?shù)整合的ARFIMA模型[11]、奇異譜分析模型[12]等。ARMA及其衍生模型因在應(yīng)用中具有易操作性和易解讀性等特征而受到推崇,但是在理論上,這些模型具有兩個(gè)主要缺陷。首先,這些模型的運(yùn)用需要假設(shè)旅游需求服從特定的累積分布形式(如正態(tài)分布);其次,這些模型通常假設(shè)旅游需求的當(dāng)期變量和滯后期變量之間是線性關(guān)系。
線性模型雖然簡(jiǎn)單且容易解釋?zhuān)€性關(guān)系只是眾多相關(guān)關(guān)系的一種。Yu等通過(guò)分析一個(gè)旅游需求的大數(shù)據(jù)集,發(fā)現(xiàn)旅游需求呈現(xiàn)4種數(shù)據(jù)特征:穩(wěn)定的線性趨勢(shì),非線性趨勢(shì),波浪形趨勢(shì)和結(jié)構(gòu)驟變趨勢(shì);這些數(shù)據(jù)特征會(huì)影響旅游需求預(yù)測(cè)的準(zhǔn)確性[13]。這些數(shù)據(jù)特征的后3種都屬于廣義上的非線性特征,因此單純的使用線性結(jié)構(gòu)來(lái)描述旅游需求的序列相關(guān)關(guān)系往往是不準(zhǔn)確的。為了解決線性結(jié)構(gòu)的局限性,神經(jīng)網(wǎng)絡(luò)被引入旅游預(yù)測(cè)中,但是神經(jīng)網(wǎng)絡(luò)存在網(wǎng)絡(luò)結(jié)構(gòu)難以確定及過(guò)度擬合等問(wèn)題[14],在旅游預(yù)測(cè)中不易推廣。其他一些非線性模型,如正弦波回歸和稀疏高斯回歸模型等[15-16],也是事先為旅游需求的序列相關(guān)關(guān)系假定了某種特定的結(jié)構(gòu),而不是尋找序列相關(guān)結(jié)構(gòu)的最優(yōu)表達(dá),因此不具有普適性。
中國(guó)旅游資源豐富,是世界上最受歡迎的旅游熱點(diǎn)地區(qū)之一。近年來(lái),隨著中國(guó)入境旅游不斷升溫,對(duì)中國(guó)入境旅游需求預(yù)測(cè)的研究開(kāi)始受到國(guó)際學(xué)術(shù)領(lǐng)域的重視。Huang從修正旅游需求分布形式的角度出發(fā),提出基于Skew-t分布的ARMA模型,并與傳統(tǒng)的基于正態(tài)分布的ARMA模型進(jìn)行比較,從而檢驗(yàn)修正分布形式對(duì)中國(guó)入境旅游需求預(yù)測(cè)的重要性[17]。Yang等則從數(shù)據(jù)源入手,探討搜索引擎數(shù)據(jù)對(duì)中國(guó)入境旅游需求預(yù)測(cè)的貢獻(xiàn)[18]。國(guó)內(nèi)對(duì)入境旅游需求預(yù)測(cè)的研究眾多,涉及的預(yù)測(cè)模型包括各種線性的時(shí)間序列模型[19-20],也包括神經(jīng)網(wǎng)絡(luò)等非線性的預(yù)測(cè)方法等[21-22]。這些研究從不同的角度提出優(yōu)化入境旅游需求預(yù)測(cè)模型的可行方案,但是仍未涉及對(duì)序列相關(guān)結(jié)構(gòu)的探討。
據(jù)此,本研究從尋找相關(guān)結(jié)構(gòu)最優(yōu)表達(dá)的思路出發(fā),利用Bernstein Copula函數(shù)描繪中國(guó)入境旅游需求的序列相關(guān)結(jié)構(gòu),并在此基礎(chǔ)上檢驗(yàn)序列相關(guān)結(jié)構(gòu)的準(zhǔn)確刻畫(huà)對(duì)入境旅游需求預(yù)測(cè)的影響,以期為旅游預(yù)測(cè)建模開(kāi)辟一個(gè)新的角度。
1 序列相關(guān)結(jié)構(gòu)與Copula 函數(shù)
1.1 序列相關(guān)結(jié)構(gòu)
正如引言所述,廣泛運(yùn)用于旅游需求預(yù)測(cè)的時(shí)間序列模型主要依賴于旅游需求的序列相關(guān)關(guān)系,因此,旅游需求的當(dāng)期變量和滯后變量之間的相關(guān)性分析對(duì)于旅游需求預(yù)測(cè)建模來(lái)說(shuō)就顯得尤為重要。然而,現(xiàn)有研究通常只關(guān)注相關(guān)程度的分析,而將相關(guān)模式限制為線性結(jié)構(gòu)或者某種特定的非線性結(jié)構(gòu),忽略了對(duì)序列相關(guān)結(jié)構(gòu)的最優(yōu)表達(dá)進(jìn)行探討。
對(duì)于兩個(gè)隨機(jī)變量來(lái)說(shuō),線性相關(guān)系數(shù)常被用來(lái)分析它們之間的相關(guān)性;然而事實(shí)上,只有當(dāng)聯(lián)合分布服從橢圓分布(如高斯分布或t分布)時(shí),聯(lián)合分布才能由這兩個(gè)變量間的線性相關(guān)系數(shù)和邊緣分布唯一確定[23]。但事實(shí)上,隨機(jī)變量之間的聯(lián)合分布不一定是橢圓分布;而即使是聯(lián)合分布服從橢圓分布的兩個(gè)隨機(jī)變量,它們之間的相關(guān)性也不一定就是線性結(jié)構(gòu)[24]。這一結(jié)論對(duì)于旅游需求的序列相關(guān)性來(lái)說(shuō)也是適用的。定義隨機(jī)變量Yt為旅游需求t時(shí)刻的當(dāng)期變量,隨機(jī)變量Yt-i即為旅游需求的滯后i期的變量。Yt和Yt-i之間的的聯(lián)合分布不一定服從橢圓分布;即使在橢圓聯(lián)合分布的情況下,線性結(jié)構(gòu)也不一定適用于描述Yt和Yt-i之間的相關(guān)性。
1.2 Copula技術(shù)對(duì)序列相關(guān)性的刻畫(huà)
Copula函數(shù)實(shí)際上是連接隨機(jī)變量邊緣分布的累積分布函數(shù)。Copula技術(shù)可以幫助尋找或識(shí)別旅游需求序列相關(guān)的相關(guān)模式,確定序列相關(guān)結(jié)構(gòu),并進(jìn)一步服務(wù)于旅游需求的預(yù)測(cè)。目前,Copula技術(shù)在分析不同隨機(jī)變量相關(guān)結(jié)構(gòu)上的高度靈活性已經(jīng)在金融、精算和經(jīng)濟(jì)學(xué)等研究領(lǐng)域中得到廣泛探討[25-30]。對(duì)于任何形式的相關(guān)關(guān)系,無(wú)論是線性還是非線性的,對(duì)稱(chēng)的還是尾部相關(guān)的,都可以找到一個(gè)適宜的Copula函數(shù)來(lái)描述[31]。不僅是不同隨機(jī)變量的相關(guān)結(jié)構(gòu)分析,時(shí)間序列中的序列相關(guān)結(jié)構(gòu)分析也同樣得益于Copula技術(shù)[32-35]。任何形式的序列相關(guān)關(guān)系也同樣可以找到一個(gè)適宜的Copula函數(shù)來(lái)描述。此外,Copula技術(shù)的靈活性還體現(xiàn)在它不限制邊緣分布的選擇。邊緣分布是一個(gè)相對(duì)于聯(lián)合分布的概念,一般就是指隨機(jī)變量的累積分布。傳統(tǒng)的時(shí)間序列模型中會(huì)要求旅游需求服從特定的累積分布形式(通常是正態(tài)分布),而Copula技術(shù)對(duì)旅游需求的累積分布形式則沒(méi)有限制。因此,當(dāng)序列相關(guān)結(jié)構(gòu)不是線性結(jié)構(gòu)或旅游需求不滿足特定累積分布假設(shè)時(shí),可以選擇不同的Copula函數(shù)描述相關(guān)形式和選擇不同的累積分布作為邊緣分布。從這個(gè)意義上講,Copula是一個(gè)更為一般的框架,既有的線性時(shí)間序列模型都可以放到Copula的框架之下而成為一種特例。endprint
由式(3)可看出,Copula技術(shù)將旅游需求的序列相關(guān)程度和相關(guān)結(jié)構(gòu)有機(jī)地結(jié)合在一起,不僅可以通過(guò)相關(guān)系數(shù)來(lái)度量序列相關(guān)程度,還可以通過(guò)具體的Copula函數(shù)形式來(lái)描述序列相關(guān)結(jié)構(gòu),從而更全面地刻畫(huà)旅游需求的序列相關(guān)關(guān)系。
1.3 Bernstein Copula函數(shù)
Copula函數(shù)的種類(lèi)繁多,可以描述形形色色的相關(guān)結(jié)構(gòu)。但在實(shí)際操作中,最常用的Copula函數(shù)主要是兩大類(lèi):參數(shù)估計(jì)的Copula函數(shù)和非參數(shù)估計(jì)的Copula函數(shù)。其中,參數(shù)估計(jì)的Copula函數(shù)雖然形式相對(duì)簡(jiǎn)單,但是單個(gè)函數(shù)所能刻畫(huà)的相關(guān)結(jié)構(gòu)有一定的限制,而且有的函數(shù)只能刻畫(huà)二維(即雙變量)的相關(guān)關(guān)系,無(wú)法處理多維(即三變量或以上)的相關(guān)關(guān)系。相比較而言,非參數(shù)估計(jì)的Copula函數(shù),如Bernstein Copula函數(shù),對(duì)相關(guān)結(jié)構(gòu)的刻畫(huà)更為自由。
Bernstein Copula函數(shù)是由Sancetta和Satchell于2004年提出。該函數(shù)以Bernstein多項(xiàng)式為基礎(chǔ),可以靈活地刻畫(huà)多維相關(guān)關(guān)系[39]。一方面,Bernstein多項(xiàng)式的微分結(jié)果是閉型解,在利用Bernstein Copula函數(shù)處理多維相關(guān)關(guān)系時(shí),這一特征會(huì)帶來(lái)運(yùn)算上的便利性。另一方面,任何一種Copula函數(shù)都可以近似地用Bernstein Copula函數(shù)來(lái)表達(dá)。事實(shí)上,Bernstein Copula函數(shù)可以描述任意的相關(guān)結(jié)構(gòu)。Sancetta和Satchell的研究中展示的是對(duì)多變量相關(guān)結(jié)構(gòu)的描繪,本研究中將Bernstein Copula函數(shù)的應(yīng)用加以拓展,用來(lái)描述單變量時(shí)間序列的序列相關(guān)結(jié)構(gòu),并在此基礎(chǔ)上構(gòu)建中國(guó)入境旅游需求預(yù)測(cè)模型。
Bernstein Copula函數(shù)的基本原理,是將一個(gè)k+1維(k≥1)的單位向量空間劃分為mt×mt-1×…×mt-k等份,并形成(mt+1)×(mt-1+1)×…×(mt-k+1)個(gè)交點(diǎn)(包括原點(diǎn)),這些交點(diǎn)即為描述序列相關(guān)關(guān)系的關(guān)鍵。假設(shè)我們描述的是二維(k=1)的相關(guān)結(jié)構(gòu),且mt=mt-1=2,單位向量空間如圖1所示。點(diǎn)A是由ut-1及其對(duì)應(yīng)的ut構(gòu)成的點(diǎn)。Bernstein Copula函數(shù)則是用點(diǎn)A到各交點(diǎn)的距離作為權(quán)重,用以描述ut和ut-1的相關(guān)結(jié)構(gòu)。多維相關(guān)結(jié)構(gòu)則是在二維情況下加以拓展。
2 實(shí)證分析
本研究在R語(yǔ)言環(huán)境下對(duì)中國(guó)入境旅游需求的序列相關(guān)結(jié)構(gòu)進(jìn)行分析,并在此基礎(chǔ)上利用Bernstein Copula函數(shù)實(shí)現(xiàn)對(duì)旅游需求的預(yù)測(cè)。具體實(shí)現(xiàn)如下:首先要確保旅游需求序列是平穩(wěn)序列,并檢驗(yàn)其馬爾科夫性;其次確定旅游需求序列的累積分布,并計(jì)算累計(jì)密度;再次,利用確定的累積密度觀察旅游需求當(dāng)期變量與滯后變量累積密度的散點(diǎn)圖,分析序列相關(guān)結(jié)構(gòu);最后,利用確定的累積密度和Bernstein Copula函數(shù),構(gòu)建條件累積分布函數(shù),通過(guò)二分法查找算法來(lái)實(shí)現(xiàn)對(duì)旅游需求的預(yù)測(cè)。
2.1 數(shù)據(jù)來(lái)源及數(shù)據(jù)分析
本研究以中國(guó)入境旅游人數(shù)作為旅游需求的代理變量進(jìn)行實(shí)證分析,探討旅游需求的序列相關(guān)結(jié)構(gòu)特征及Bernstein Copula技術(shù)對(duì)旅游需求預(yù)測(cè)的貢獻(xiàn)。研究人員收集了從1998年1月到2015年12月中國(guó)入境旅游的游客總量的月度數(shù)據(jù)(數(shù)據(jù)來(lái)源于中國(guó)國(guó)家旅游局)。其中,以1998年1月到2012年12月的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,進(jìn)行序列相關(guān)的結(jié)構(gòu)分析,并確定預(yù)測(cè)模型的構(gòu)成。2013年1月到2015年12月的數(shù)據(jù)則作為驗(yàn)證數(shù)據(jù)集,進(jìn)行樣本外預(yù)測(cè),以檢驗(yàn)?zāi)P偷念A(yù)測(cè)精度。
實(shí)證研究的第一步是檢驗(yàn)用于分析和建模的時(shí)間序列是否是平穩(wěn)序列。本研究同時(shí)參考ADF(Augmented Dickey-Fuller)單位根檢驗(yàn)和KPSS(Kwaitkowski-Philips-Schmidt-Shin)平穩(wěn)性檢驗(yàn)。其中,ADF單位根檢驗(yàn)的原假設(shè)是序列具有單位根。如果ADF統(tǒng)計(jì)值高于臨界值,則拒絕原假設(shè),認(rèn)為時(shí)間序列是平穩(wěn)序列,沒(méi)有單位根。而KPSS平穩(wěn)性檢驗(yàn)的原假設(shè)則是序列是平穩(wěn)的。如果KPSS統(tǒng)計(jì)值低于臨界值,則接受原假設(shè),認(rèn)為序列是平穩(wěn)的。同時(shí)使用單位根檢驗(yàn)和平穩(wěn)性檢驗(yàn)的方法稱(chēng)之為確定性數(shù)據(jù)分析(confirmatory data analysis),得到的結(jié)果穩(wěn)健性較佳[40]。如表1所示,ADF的結(jié)果顯示原序列存在單位根,KPSS的結(jié)果也顯示原序列非平穩(wěn)。而經(jīng)過(guò)一階差分后的序列則同時(shí)通過(guò)ADF和KPSS檢驗(yàn)。但是,由于本研究中所用數(shù)據(jù)是月度數(shù)據(jù),一階差分后的數(shù)據(jù)仍然存在季節(jié)性單位根。如圖2a中的自相關(guān)圖所示,經(jīng)過(guò)一次差分(一階差分)后的序列仍然表現(xiàn)出很強(qiáng)的季節(jié)性特征,自相關(guān)圖每12個(gè)滯后期就會(huì)出現(xiàn)一次明顯波動(dòng)。季節(jié)性差分可以消除序列的季節(jié)性波動(dòng)。但是如表1所示,季節(jié)性差分序列的KPSS統(tǒng)計(jì)值大于臨界值,序列非平穩(wěn)。因此,本文中對(duì)旅游需求序列進(jìn)行兩次差分(一階差分和季節(jié)性差分)。兩次差分之后,旅游需求序列達(dá)到平穩(wěn)(表1),且季節(jié)性波動(dòng)消除(圖2b)。因此,后續(xù)討論針對(duì)的是經(jīng)過(guò)二次差分的中國(guó)入境旅游需求時(shí)間序列。
對(duì)于平穩(wěn)的時(shí)間序列,還需確保其屬于馬爾科夫過(guò)程,才能利用Copula函數(shù)進(jìn)行序列相關(guān)分析。Deco和Schürmann的論述中指出,一個(gè)時(shí)間序列的p階自回歸模型,或AR(p)模型,如果其殘差是白噪聲,那么這一時(shí)間序列可以看作是p階馬爾科夫過(guò)程[41]。月度數(shù)據(jù)由于具有季節(jié)性變化特征,當(dāng)期變量往往會(huì)受到12期滯后變量的影響。因此對(duì)于月度數(shù)據(jù),應(yīng)優(yōu)先考察AR(12)模型,檢驗(yàn)序列是否是12階馬爾科夫過(guò)程。而在時(shí)間序列分析中,越靠近當(dāng)期變量的滯后期變量對(duì)當(dāng)期變量的影響一般更為顯著。因此對(duì)于中國(guó)入境旅游需求時(shí)間序列,從一個(gè)只含有1階和12階自回歸項(xiàng)的AR(12)模型開(kāi)始檢驗(yàn)其馬爾科夫性質(zhì)。該AR(12)模型的自相關(guān)偏相關(guān)圖和Q檢驗(yàn)結(jié)果如圖3所示。Q檢驗(yàn)值在所有12個(gè)滯后期上均不顯著,說(shuō)明AR(12)模型的殘差可看作是白噪聲。因此可以認(rèn)為中國(guó)入境旅游需求時(shí)間序列是一個(gè)12階的馬爾科夫過(guò)程。endprint
在確定序列滿足平穩(wěn)性要求和馬爾科夫過(guò)程以后,則可以利用卡方檢驗(yàn)(Chi-square test)確定旅游需求序列的累積分布??ǚ綑z驗(yàn)的原假設(shè)是受測(cè)數(shù)據(jù)服從給定的分布形式。如果檢驗(yàn)結(jié)果的卡方值大于對(duì)應(yīng)的臨界值,那么就會(huì)拒絕原假設(shè),認(rèn)為數(shù)據(jù)是不服從給定的分布形式的。對(duì)于本研究中給定的樣本量,卡方檢驗(yàn)在0.05顯著水平上對(duì)應(yīng)的臨界值是15.510。一般情況下,假定旅游需求序列是正態(tài)分布的。對(duì)于本研究的序列來(lái)說(shuō),正態(tài)分布對(duì)應(yīng)的卡方值為9.738,小于臨界值。因此認(rèn)為該序列服從正態(tài)分布,可以用正態(tài)分布函數(shù)求解累積密度。值得注意的是,當(dāng)時(shí)間序列不服從正態(tài)分布的時(shí)候,也可以利用卡方檢驗(yàn)來(lái)檢驗(yàn)其他分布形式,并用確定的分布函數(shù)求解時(shí)間序列的累積密度。
確定了旅游需求序列的累積分布以后,可以通過(guò)觀察旅游需求當(dāng)期變量與滯后變量累積密度的散點(diǎn)圖來(lái)獲得對(duì)序列相關(guān)結(jié)構(gòu)的直觀認(rèn)識(shí)。如圖4所示,中國(guó)入境旅游需求的序列相關(guān)結(jié)構(gòu)應(yīng)該是一個(gè)非對(duì)稱(chēng)的結(jié)構(gòu),散點(diǎn)在圖形中部以及右尾部(圖形右上方)顯得相對(duì)集中。而如果序列相關(guān)結(jié)構(gòu)是線性的話,那么散點(diǎn)圖應(yīng)該呈現(xiàn)出對(duì)稱(chēng)的橢球體結(jié)構(gòu)。散點(diǎn)在圖形中的分布也應(yīng)該較為均勻,不會(huì)出現(xiàn)明顯的中部或者尾部集中。因此,可以判斷中國(guó)入境旅游需求序列相關(guān)結(jié)構(gòu)的非線性性要更為突出。
相對(duì)于線性模型來(lái)說(shuō),Bernstein Copula能描述這種非線性結(jié)構(gòu),從而提高需求預(yù)測(cè)的精確性。具體的做法是要將圖4的三維空間劃分為m×m×m等份,利用訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)來(lái)估計(jì)經(jīng)驗(yàn)Copula,再由已知的ut-1和ut-12來(lái)預(yù)測(cè)ut。根據(jù)Sancetta和Satchell的經(jīng)驗(yàn),取m=10對(duì)圖4進(jìn)行空間劃分[42]。Bernstein Copula方法下的經(jīng)驗(yàn)Copula可以隨三維空間中的散點(diǎn)分布狀態(tài)不同而不同,因此具有很強(qiáng)的靈活性,可以刻畫(huà)任何形式的相關(guān)結(jié)構(gòu)。
2.2 預(yù)測(cè)結(jié)果分析
2.2.1 其他預(yù)測(cè)模型與誤差評(píng)價(jià)方法
為了檢驗(yàn)Copula技術(shù)對(duì)提高旅游預(yù)測(cè)精確度的貢獻(xiàn),本研究將Bernstein Copula模型的預(yù)測(cè)結(jié)果與不同的基準(zhǔn)模型的預(yù)測(cè)結(jié)果進(jìn)行比較,看哪個(gè)模型的預(yù)測(cè)誤差較小。這些基準(zhǔn)模型包括:季節(jié)性Na?ve(S-Na?ve)模型,只含1階和12階自回歸項(xiàng)的AR(12)模型,以及包含1階自回歸項(xiàng)和1階季節(jié)性自回歸項(xiàng)的SARIMS(1,0,0)×(1,0,0)12模型。其中,季節(jié)性Na?ve模型是旅游預(yù)測(cè)研究中最基本的基準(zhǔn)模型,主要是利用上一年同期觀測(cè)值作為當(dāng)前的預(yù)測(cè)值。AR(12)模型與Bernstein Copula具有相同的自回歸項(xiàng),只不過(guò)前者估計(jì)的是線性結(jié)構(gòu)序列相關(guān),而后者估計(jì)的既可以是線性,又可以是非線性結(jié)構(gòu)的序列相關(guān)。因此,兩者的比較更能凸顯出序列相關(guān)結(jié)構(gòu)的選擇對(duì)旅游預(yù)測(cè)的影響。此外,由于本研究中使用的是月度數(shù)據(jù),還利用SARIMA(1,0,0)×(1,0,0)12進(jìn)行旅游需求預(yù)測(cè)。AR模型和SARIMA模型的估計(jì)和預(yù)測(cè)均利用Eviews來(lái)實(shí)現(xiàn)。
為了比較Bernstein Copula模型與其他預(yù)測(cè)模型的優(yōu)劣,本研究中引入均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)作為衡量預(yù)測(cè)性能的依據(jù)。對(duì)于預(yù)測(cè)誤差的計(jì)算,是將差分?jǐn)?shù)據(jù)轉(zhuǎn)換成非差分?jǐn)?shù)據(jù)后進(jìn)行。為了便于比較各種預(yù)測(cè)模型對(duì)于短期預(yù)測(cè)和長(zhǎng)期預(yù)測(cè)的預(yù)測(cè)能力,本研究采用遞歸窗體(recursive window)的預(yù)測(cè)方法,并比較1、2、3、6、12、18、24期(月)向前預(yù)測(cè)的RMSE和MAPE。其中,超過(guò)12月以上的預(yù)測(cè)期在旅游行業(yè)中被視為是長(zhǎng)期預(yù)測(cè)[12]。
2.2.2 預(yù)測(cè)結(jié)果比較
表2中給出不同方法的預(yù)測(cè)誤差情況??傮w上看,Bernstein Copula模型的預(yù)測(cè)能力比其他3種預(yù)測(cè)方法要好。具體來(lái)說(shuō),通過(guò)比較表2中各種模型預(yù)測(cè)的RMSE和MAPE可以得到以下結(jié)論:(1)對(duì)于1期到24期向前預(yù)測(cè),Bernstein Copula模型的MAPE比S-Na?ve模型、AR模型和SARIMA模型要小,說(shuō)明Bernstein Copula模型預(yù)測(cè)會(huì)產(chǎn)生較小的相對(duì)誤差;(2)盡管1期向前預(yù)測(cè)中SARIMA模型的RMSE最小,但是Bernstein Copula模型在其他期向前預(yù)測(cè)上的RMSE都是最小,說(shuō)明Bernstein Copula模型預(yù)測(cè)的絕對(duì)誤差也比其他3種基準(zhǔn)模型要?。唬?)單單比較Bernstein Copula和AR模型的預(yù)測(cè)結(jié)果,可以發(fā)現(xiàn)除了1期向前預(yù)測(cè)之外,Bernstein Copula模型的RMSE和MAPE明顯比AR模型小,而在1期向前預(yù)測(cè)中Bernstein Copula模型的MAPE也較小,說(shuō)明利用Bernstein Copula模型描述非線性序列相關(guān)結(jié)構(gòu)確實(shí)會(huì)提高預(yù)測(cè)水平。
3 結(jié)論
旅游需求序列相關(guān)結(jié)構(gòu)是旅游預(yù)測(cè)研究中長(zhǎng)期被忽視的一個(gè)問(wèn)題。由于缺乏一種有效分析旅游需求序列相關(guān)結(jié)構(gòu)的工具,傳統(tǒng)的預(yù)測(cè)模型只能假定線性的或者是某種特定的非線性結(jié)構(gòu),使得模型的預(yù)測(cè)精確度受到影響。本研究中將Bernstein Copula技術(shù)引入旅游學(xué)研究中,為旅游需求建模提供一個(gè)可以靈活描述序列相關(guān)結(jié)構(gòu)的工具,并為旅游需求預(yù)測(cè)建模提出了一個(gè)新的思考方向。
實(shí)證研究的結(jié)果表明,考慮了序列相關(guān)結(jié)構(gòu)的Bernstein Copula模型不管是在長(zhǎng)期預(yù)測(cè)還是在短期預(yù)測(cè)上表現(xiàn)都比基準(zhǔn)模型要好。與AR模型相比,Bernstein Copula模型只是修正了對(duì)序列相關(guān)結(jié)構(gòu)的描述,并沒(méi)有增加額外的變量信息或滯后期信息,即可帶來(lái)預(yù)測(cè)精度的提高。此外,與SARIMA(1,0,0)×(1,0,0)12模型相比,Bernstein Copula模型的預(yù)測(cè)結(jié)果也要更優(yōu)。值得一提的是,SARIMA模型中的1階季節(jié)性自回歸項(xiàng)實(shí)際上近似于12階和13階自回歸項(xiàng)的線性組合,也就是說(shuō),SARIMA模型中具有額外的滯后期信息,但是預(yù)測(cè)精度仍不如Bernstein Copula模型,這就更說(shuō)明了序列相關(guān)結(jié)構(gòu)的重要性。endprint
Copula技術(shù)在分析旅游序列相關(guān)結(jié)構(gòu)上具有優(yōu)越性,而B(niǎo)ernstein Copula更是在處理高階序列相關(guān)關(guān)系上具有較大的靈活性。這種技術(shù)可以和其他技術(shù)結(jié)合起來(lái),構(gòu)建更為合理的模型。例如可以和ARIMA模型或者SARIMA模型相結(jié)合,在Bernstein Copula函數(shù)中加入移動(dòng)平均項(xiàng)或者季節(jié)變量。這也是未來(lái)的研究中值得關(guān)注的方向。
參考文獻(xiàn)(References)
[1] Song H, Witt S F. Forecasting international tourist flows to Macau[J]. Tourism Management, 2006, 27 (2): 214-224.
[2] Witt S F, Song H. Forecasting future tourism flows[A] // Medlik S, Lockwood A . Tourism and Hospitality in the 21st Century [C]. Oxford: Butterworth-Heinemann, 2000:106-118.
[3] Li G, Song H, Witt S F. Recent developments in econometric modeling and forecasting[J]. Journal of Travel Research, 2005, 44: 82-99.
[4] Liao Zhixue, Ge Peng, Ren Peiyu, et al. Research on prediction of tourists quantity in Jiuzhai Valley based on AB@G integration model[J]. Tourism Science, 2013, 28 (4): 88-93. [廖治學(xué), 戈鵬, 任佩瑜,等. 基于AB@G集成模型的九寨溝景區(qū)游客量預(yù)測(cè)研究[J]. 旅游學(xué)刊, 2013, 28 (4): 88-93.]
[5] Peng B, Song H, Crouch G I. A meta-analysis of international tourism demand forecasting and implications for practice[J]. Tourism Management, 2014, 45: 181-193.
[6] Box G E, Jenkins G M. Time Series Analysis: Forecasting and Control[M]. San Francisco: Holden-Day, 1970.
[7] Goh C, Law R. Modeling and forecasting tourism demand for arrivals with stochastic nonstationary seasonality and intervention[J]. Tourism Management, 2002, 23 (5): 499-510.
[8] Kim J H, Ngo T. Modelling and forecasting monthly airline passenger flows among three major Australian cities[J]. Tourism Economics, 2001, 7 (4): 397-412.
[9] Lim C, McAleer M. 2000. A seasonal analysis of Asian tourist arrivals to Australia[J]. Applied Economics, 2000, 32 (4): 499-509.
[10] Liang Y H. Forecasting models for Taiwanese tourism demand after allowance for Mainland China tourists visiting Taiwan[J]. Computers & Industrial Engineering, 2014, 74: 111-119.
[11] Chu F L. A fractionally integrated autoregressive moving average approach to forecasting tourism demand[J]. Tourism Management, 2008, 29 (1): 79-88.
[12] Hassani H, Webster A, Silva E S, et al. Forecasting US tourist arrivals using optimal singular spectrum analysis[J]. Tourism Management, 2015, 46: 322-335.
[13] Yu G, Schwartz Z, Humphreys B R. Data patterns and the accuracy of annual tourism demand forecasts[J]. Tourism Analysis, 2007, 12 (1-1):15-26.
[14] Tu J V. Advantages and disadvantages of using artificial neural networks versus logistic regression for predicting medical outcomes[J]. Journal of Clinical Epidemiology, 1996, 49 (11): 1225-1231.endprint
[15] Chan Y M. Forecasting tourism: A sine wave time series regression approach[J]. Journal of Travel Research, 1993, 32 (2): 58-60.
[16] Wu Q, Law R, Xu X. A sparse Gaussian process regression model for tourism demand forecasting in Hong Kong[J]. Expert Systems with Applications, 2012, 39 (5): 4769-4774.
[17] Huang Y L. Forecasting the demand for tourism in China by applying the Skew-t Distribution Model[J]. Chinese Economy, 2013, 46(4): 49-62.
[18] Yang X, Pan B, Evans J A, et al. Forecasting Chinese tourist volume with search engine data[J]. Tourism Management, 2015, 46: 386-397.
[19] Shang Lin, Qin Weiliang. Forecasting exchange earning of Chinese inbound tourism using ARIMA-EGARCH Model[J]. Ststistical Education, 2007, (4): 46-48. [尚林, 秦偉良. 基于ARIMA和EGARCH模型的中國(guó)入境旅游收匯預(yù)測(cè)分析[J]. 統(tǒng)計(jì)教育, 2007, (4): 46-48.]
[20] Weng Gangmin, Zheng Zhuye, Liu Yang. An empirical study on inbound tourism demand forecast based on ARFIMA Model[J]. Commercial Research, 2009, (6): 1-4. [翁鋼民, 鄭竹葉, 劉洋. 我國(guó)入境旅游預(yù)測(cè): 基于ARFIMA模型的研究[J]. 商業(yè)研究, 2009, (6): 1-4.]
[21] Deng Zutao, Lu Yuqi. The application of BP Neural Network in forecasting Chinas inbound tourist population[J]. Tourism Science, 2006, 20(4): 49-53. [鄧祖濤, 陸玉麒. BP神經(jīng)網(wǎng)絡(luò)在我國(guó)入境旅游人數(shù)預(yù)測(cè)中的應(yīng)用[J]. 旅游科學(xué), 2006, 20(4): 49-53.]
[22] Zhang Chen, Zhang Jie. Neural Network ensemble for Chinese inbound tourism demand prediction[J]. Scientia Geographica Sinica, 2011, (10): 1208-1212. [張郴, 張捷. 中國(guó)入境旅游需求預(yù)測(cè)的神經(jīng)網(wǎng)絡(luò)集成模型研究[J]. 地理科學(xué), 2011, (10): 1208-1212.]
[23] Patton A J. Modeling Time-varying Exchange Rate Dependence Using the Conditional Copula[R]. San Diego: Department of Economics, University of California, 2001.
[24] Embrechts P, Lindskog F, McNeil A. Modelling Dependence with Copulas[R]. Zurich: Rapport technique, Département de mathématiques, Institut Fédéral de Technologie de Zurich, 2001.
[25] Balakrishnan N, Lai C D. Continuous Bivariate Distributions[M]. Springer: Science & Business Media, 2009.
[26] Embrechts P, McNeil A, Straumann D. Correlation and dependence in risk management: Properties and pitfalls[J]. Risk Management: Value at Risk and Beyond, 2002: 176-223.
[27] Frees E W, Valdez E A. Understanding relationships using copulas[J]. North American Actuarial Journal, 1998, 2 (1): 1-25.
[28] Joe H. Multivariate Models and Multivariate Dependence Concepts[M]. London: CRC Press, 1997.
[29] Klugman S A, Panjer H H, Willmot G E. Loss Models: From Data to Decisions[M]. New Jersey: John Wiley & Sons, 2012.endprint
[30] Nelsen R B. An Introduction to Copulas[M]. New York: Springer Science & Business Media, 2007.
[31] de Melo Mendes B V, Aíube C. Copula based models for serial dependence[J]. International Journal of Managerial Finance, 2011, 7 (1): 68-82.
[32] Beare B K. Copulas and temporal dependence[J]. Econometrica, 2010, 78 (1): 395-410.
[33] Chen X, Fan Y. Estimation of copula-based semiparametric time series models[J]. Journal of Econometrics, 2006, 130 (2): 307-335.
[34] Ibragimov R. Copula-based characterizations for higher order Markov processes[J]. Econometric Theory, 2009, 25 (3): 819-846.
[35] Smith M, Min A, Almeida C, et al. Modeling longitudinal data using a pair-copula decomposition of serial dependence[J]. Journal of the American Statistical Association, 2010, 105 (492): 1467-1479.
[36] Sklar A. Fonctions de Répartition ? N Dimensions Et Leurs Marges [M]. Paris: Université Paris 8, 1959.
[37] Chen X, Fan Y. Estimation of copula-based semiparametric time series models[J]. Journal of Econometrics, 2006, 130(2): 307-335.
[38] Ibragimov R. Copula-based characterizations for higher order Markov processes[J]. Econometric Theory, 2009, 25(3): 819-846.
[39] Sancetta A, Satchell S. The Bernstein copula and its applications to modeling and approximations of multivariate distributions[J]. Econometric Theory, 2004, 20(3): 535-562.
[40] Brooks C. Introductory Econometrics for Finance[M]. Cambridge: Cambridge University Press, 2014.
[41] Deco G, Schürmann B. Information Dynamics: Foundations and Applications[M]. New York: Springer Science & Business Media, 2012.
[42] Sancetta A, Satchell S E. Bernstein Approximations to the Copula Function and Portfolio Optimization [EB/OL]. https://www.repository. cam.ac.uk/handle/1810/284,2016-09-22.
Abstract: Tourism demand modeling and forecasting has long been an attractive topic in the tourism demand literature, because of its great impact on decision making of governments and tourism related businesses. Many researchers have highlighted the necessity of tourism demand forecasting. China is one of the most popular destinations in the world, and the rapid development of the tourism sector in China has caused tourism demand forecasting to become increasingly essential. This paper proposes the Bernstein Copula model as an alternative to analyze serial dependence structure of China inbound tourism demand for forecasting. Forecast endeavors should be underpinned by knowledge of serial dependence structure; however discussion of the latter has been insufficient in the tourism forecasting literature. In the traditional tourism demand forecasting model, the serial dependence structure is always been predetermined, either as the linear structure or some certain nonlinear structure. This restriction can reduce the forecasting accuracy of the traditional models. The proposed Bernstein Copula model is thus appealing, as it possesses some advanced properties which make it applicable and appealing for high dimensional associations. First of all, Bernstein polynomials are closed under differentiation, which leads to the computational convenience of the Bernstein copula for high dimensional associations. Second, any copula can be approximately represented by certain Bernstein copula with only simple restriction on the coefficients. Actually, the Bernstein copula allows for arbitrary dependence structure between dependent variables and covariates. Thirdly, different from many traditional models, the Bernstein Copula does not require the tourism demand variable follow any given distribution (usually normal distribution). Our empirical results indicate that China inbound tourism demand follow normal distribution, but its serial dependence structure is probably nonlinear. To illustrate the benefit of using the Bernstein Copula model for tourism demand forecasting, we compare the forecasting performance of the Bernstein Copula model with those of several benchmarks, including the Seasonal Naive (S-Naive) model, the Autoregressive (AR) model, as well as the Seasonal Autoregressive Integrated Moving Average (SARIMA) model. The compare results show that the Bernstein Copula model produces smaller root mean square error and mean absolute percentage error than the three benchmarks, which indicates that the Bernstein Copula performs better in forecasting China inbound tourism demand. The contribution of this study is not introducing the Bernstein Copula model as the universally best approach for forecasting tourist demand. Instead, it contributes to the existing tourism demand and forecasting research by highlighting the importance of serial dependence structure to tourism demand forecasting. The consideration of the serial dependence structure generalizes the existing time series model into a broaden setting, in which both linear and nonlinear serial associations can be addressed and the restricted distribution assumption of the demand series involved can be released.
Keywords: serial dependence structure; Bernstein Copula function; Chinese inbound tourism; tourism demand forecasting
[責(zé)任編輯:宋志偉;責(zé)任校對(duì):周小芳]endprint