胡亞敏,楊 力,方潤月
基于數(shù)據(jù)驅動的旅游需求預測研究
*胡亞敏1,楊 力2,方潤月3
(1. 安徽理工大學人文社會科學學院,安徽,淮南 232001;2.安徽理工大學經(jīng)濟與管理學院,安徽,淮南 232001;3.安徽理工大學數(shù)學與大數(shù)據(jù)學院,安徽,淮南 232001)
合理預測景區(qū)客流量不僅可以為景區(qū)提供參考,更是旅游治理體系和治理能力現(xiàn)代化建設的內在要求?;诰耪瘻巷L景區(qū)官網(wǎng)于2012年5月至2021年5月披露的每日客流量數(shù)據(jù),運用Python爬取與九寨溝旅游相關的搜索行為數(shù)據(jù)和九寨溝每日平均氣溫,構建ARIMA、SVR模型和加入百度搜索指數(shù)與日平均氣溫的LSTM神經(jīng)網(wǎng)絡模型,對九寨溝風景區(qū)客流量進行擬合和預測。結果表明,LSTM神經(jīng)網(wǎng)絡模型預測精度高于ARIMA和SVR模型,加入百度搜索指數(shù)和日平均氣溫的LSTM神經(jīng)網(wǎng)絡模型可以顯著提升客流量預測精度。
旅游需求預測;九寨溝;LSTM神經(jīng)網(wǎng)絡模型;ARIMA模型;SVR模型
在全域旅游、文旅融合發(fā)展的背景下,旅游需求預測有助于旅游市場的平穩(wěn)運行,也是旅游治理體系和治理能力現(xiàn)代化建設的內在要求。學術界有關旅游客流量的預測研究取得了豐碩成果,在預測時段上,可以分為中長期預測和短期預測,涉及的預測方法主要有時間序列模型、計量經(jīng)濟模型和機器學習三大類。早期的研究方法多以時間序列模型為主,其中應用最為廣泛的是Box-Jenkins模型,包括MA(移動平均模型)、AR(自回歸模型)、ARMA(自回歸移動平均模型)和ARIMA(綜合自回歸移動平均模型)[1-3],其原理是通過研究歷史規(guī)律,建立線性回歸關系,對變量的穩(wěn)定性有較高要求,無法深入研究客流量的形成原因[4]。為解決上述問題,學者們將時間序列模型與其它模型進行了組合。如韓兆洲等[5]建立了GIOWHA-GALSSVR-SARIMA組合模型,預測廣東省接待過夜游客數(shù)。李乃文等[6]結合ARIMA模型與RBF神經(jīng)網(wǎng)絡估測了我國入境旅游人數(shù)。計量經(jīng)濟模型則多以ADLM(自回歸分布滯后模型)和VAR(向量自回歸模型)為主[7-8],主要研究外部因素,如匯率、價格、收入等對客流量的影響,可探究變量間的定量關系和因果關系,在一定程度上彌補了時間序列模型的缺陷。近些年,計量經(jīng)濟模型也逐漸與其它模型進行組合,例如,Assaf等[9]引入了空間自回歸固定效應模型,并將貝葉斯模型引入了VAR,提高了預測精度。隨著人工智能技術的發(fā)展,機器學習在預測客流量方面的應用越來越多,集中于人工神經(jīng)網(wǎng)絡、深度學習和支持向量機上。如陸文星等[10]基于改進的PSO-BP神經(jīng)網(wǎng)絡算法預測了黃山短期客流量;陸利軍等[11]則以張家界為研究對象,創(chuàng)建了EMD-BP神經(jīng)網(wǎng)絡。在支持向量機研究上,陳榮等[12]基于SEA的AGA-SVR模型預測了節(jié)假日的客流量,王蘭梅等[13]用灰狼算法優(yōu)化支持向量回歸,提出了GWO-SVR模型。
深度學習是在人工神經(jīng)網(wǎng)絡的基礎上發(fā)展而來的,具有較強的擬合能力,因此被廣泛應用于公交、地鐵客流量預測、股票價格預測、GDP增速預測等多個領域[14-17]。目前,KELM(核極限學習機)和LSTM(長短時記憶神經(jīng)網(wǎng)絡)是深度學習在旅游客流量預測方面運用較多的兩種方法。Shaolong Su等[18]融合了百度指數(shù)和谷歌指數(shù)構建的客流量KELM序列模型擁有較高的預測精度和穩(wěn)健性。倪田[19]搭建了SPCA-LSTM模型研究四姑娘山日客流量;Rob Law等[20]通過構建旅游需求預測概念框架,添加注意機制,驗證了LSTM模型在旅游需求預測中的能力。
縱觀旅游客流量研究發(fā)展歷程,可以發(fā)現(xiàn),研究方法和手段不斷從單一模型走向多元組合模型,從數(shù)理統(tǒng)計走向動力理論。基于此,本文以九寨溝風景區(qū)為研究對象,引入百度搜索指數(shù),分別構建包含搜索指數(shù)和日平均氣溫的LSTM神經(jīng)網(wǎng)絡模型和不包含因素的ARIMA模型、SVR模型,對九寨溝風景區(qū)客流量進行擬合和預測,同時對三類模型的預測結果進行比較。
首先,采用九寨溝官網(wǎng)于2012年5月25日至2021年5月18日披露的每日進溝人數(shù)作為旅游客流量數(shù)據(jù)來源。其次,通過氣象網(wǎng)站收集九寨溝每日最低溫度和最高溫度,取其平均值,形成每日平均氣溫數(shù)據(jù)。最后,借助自編譯的Python搜尋器工具從百度指數(shù)網(wǎng)站收集與九寨溝客流量相關的5個關鍵詞(“九寨溝”、“九寨溝天氣”、“九寨溝旅游攻略”、“九寨溝門票”、“九寨溝景點”)的每日百度搜索指數(shù)。綜上,共統(tǒng)計了2526條數(shù)據(jù),刪去景區(qū)限流期間的數(shù)據(jù)后,最終得到1887條數(shù)據(jù),分別整理成所需的數(shù)據(jù)集,供本研究分析。
2017年8月8日,受地質災害影響,九寨溝閉園整修,待重新開放后因各種原因限流,后又遇新冠肺炎疫情。因此,為降低不可控因素對客流量預測造成的影響,研究特將數(shù)據(jù)劃分為兩個階段,分別是2012年5月25至2017年8月7日及2018年3月8日至2021年5月18日。通過圖1和圖2可以看出,客流量呈現(xiàn)明顯的季節(jié)趨勢,因此采用時間序列的季節(jié)性預測方法來進行擬合。
圖1 2012年-2017年客流量變化趨勢
圖2 2018年-2021年客流量變化趨勢
通過比較前文選取的5個關鍵詞的百度搜索指數(shù)趨勢可以發(fā)現(xiàn),百度搜索指數(shù)的變化趨勢(圖3)與景區(qū)客流量變化趨勢大致吻合,說明百度搜索指數(shù)對預測客流量具有一定的參考價值。
圖3 百度指數(shù)關鍵詞搜索趨勢
LSTM神經(jīng)網(wǎng)絡是RNN的延伸拓展結構,在提取時間序列數(shù)據(jù)的非線性成分時具有顯著優(yōu)越性,且能夠通過存儲單元處理長期依賴性問題,克服了RNN的局限性,適合用于本研究。LSTM的網(wǎng)絡結構如圖4所示。
圖4 LSTM網(wǎng)絡結構圖
LSTM中的一個存儲單元由一個記憶細胞、遺忘門(f)、輸入門(i)和輸出門(o)組成。f表示遺忘門的閾值,通過sigmoid激活函數(shù)控制上一個存儲單元的遺忘概率,輸出為0即上個存儲單元的信息全部遺忘,輸出為1即絕對保留上個存儲單元的信息。i表示輸入門的控制信號,用于決定新信息被更新的程度,通過tanh激活函數(shù)生成新記憶后與控制信號逐元素相乘,最終決定新信息進入神經(jīng)元狀態(tài)的數(shù)量。o表示輸出門的控制信號,通過sigmoid激活函數(shù)決定神經(jīng)元狀態(tài)需要被輸出的部分,當前神經(jīng)元狀態(tài)經(jīng)過tanh激活函數(shù)處理后再與該控制信號逐元素相乘,得到最終的輸出結果。LSTM神經(jīng)網(wǎng)絡的前饋計算公式具體如下:
ARIMA模型是自回歸移動平均模型的廣義模型,是結合自回歸(AR)和移動平均(MA)過程建立起的時間序列的復合模型。ARIMA模型的構建過程如下:
2.2.1 數(shù)據(jù)預處理
首先對時間序列數(shù)據(jù)進行平穩(wěn)性檢驗,若原序列不平穩(wěn),采用差分或先對數(shù)變換再差分的方法,將非平穩(wěn)時間序列轉換為平穩(wěn)序列。本研究采用ADF單位根檢驗法進行檢驗。
2.2.2 模型識別
針對平穩(wěn)序列,通過觀察ACF自相關圖和PACF偏自相關圖截尾情況大致判斷、的值。再進一步按照AIC信息準則定階,選取AIC值最小時的階數(shù)作為自相關階數(shù)和移動平均階數(shù)。
2.2.3 參數(shù)估計
對確定好階數(shù)的模型進行參數(shù)估計。由于旅游景區(qū)存在旺季和淡季,因此關于客流量的時序數(shù)據(jù)可能包含季節(jié)因素,帶季節(jié)性的ARIMA模型也許更能反映九寨溝景區(qū)游客人數(shù)的時間序列數(shù)據(jù)特征。
2.2.4 模型檢驗
檢驗殘差是否為白噪聲序列,若殘差序列通過白噪聲檢驗,說明時間序列中有用的信息已經(jīng)被提取完畢。本文采用殘差序列的QQ圖和自相關性對殘差進行檢驗。
2.2.5 序列預測
運用最終確定的ARIMA模型,以2012-2021年九寨溝客流量數(shù)據(jù)為基礎,分別對劃分出的訓練集和測試集進行預測。
支持向量回歸(SVR)是基于支持向量機(SVM)提出的一種回歸算法。本文研究的客流量是非線性數(shù)據(jù),需要通過非線性變換將訓練樣本映射到高維空間,使得在高維空間中樣本的分布更有規(guī)律性。
設給定的訓練樣本(x,y),=1,2,…,;x=R;y∈;x為輸入向量,即客流量的影響因素;y為x對應的輸出值,即客流量的預測值;為訓練樣本個數(shù),依據(jù)如下表達式進行估計:
其中,x為訓練集輸入值,為測試集輸入值。
在理論基礎上,進行模型訓練,首先對數(shù)據(jù)進行標準化處理,隨后運用LSTM、ARIMA、SVR模型分別進行訓練并進行對比分析。
大數(shù)據(jù)分析中,數(shù)據(jù)來源不同,量綱及量綱單位不同,采用標準化方法消除由此帶來的偏差,使其具有可比性。在本次建模前先對數(shù)據(jù)進行標準化處理,即對樣本矩陣作如下變換:
3.2.1 初步訓練分析
數(shù)據(jù)進行標準化處理后,對得到的1887條數(shù)據(jù)按照7:3的比例從原始數(shù)據(jù)集中隨機劃分出訓練集和測試集,將訓練集用于模型擬合的數(shù)據(jù)樣本,將測試集用于模型泛化能力的評估。基于Python的深度學習框架torch.nn建立了關于九寨溝旅游景區(qū)客流量預測的LSTM模型。以5個百度搜索指數(shù)和九寨溝日平均溫度作為輸入的6個特征,日客流量作為輸出特征。
設定模型的原始參數(shù)為:optimizer:Adam,num_layers:6,hidden_size:5,表示LSTM神經(jīng)網(wǎng)絡中含有6個隱藏層,每層中的神經(jīng)元數(shù)為5,Adam作為模型優(yōu)化器。以此對建立的LSTM神經(jīng)網(wǎng)絡模型進行訓練,并繪制模型在訓練集和測試集上的預測值與樣本真實值的對比圖,如圖5所示。
由于本次實驗選用的數(shù)據(jù)相對較多,為了更清晰地反映預測情況,以下所有對比圖均隨機選取了其中的150個數(shù)據(jù)點來繪制預測情況。從圖5中可以看出,訓練集和測試集的預測精度均不高,預測值與真實值之間吻合得較差,存在一定的偏差。采用平均絕對誤差(MAE)、均方根誤差(RMSE)作為模型的衡量指標,定義如下:
結果顯示,初始模型的平均絕對誤差MAE為2086.8638,均方根誤差RMSE為2505.802,表明模型具有進一步優(yōu)化的空間。
3.2.2 優(yōu)化訓練分析
考慮建立的初始模型并不是最優(yōu)模型,對景區(qū)客流量的預測存在較大偏差,因此,進行了模型優(yōu)化以使得模型的性能更好。本研究利用grid search進行模型最優(yōu)參數(shù)的選擇,先為模型中不同的超參數(shù)設置一個值列表,隨后通過遍歷每個超參數(shù)的組合來評估模型的性能,并選出使得模型性能最佳的參數(shù)組合,最后運用最優(yōu)參數(shù)組合進行預測。
利用Python的sklearn庫中的GridsearchCv來進行最優(yōu)參數(shù)的選擇??紤]影響LSTM模型的主要參數(shù)為optimizer、num_layers和hidden_size,因此將用于最優(yōu)模型選擇的參數(shù)組合設置如下:parameters:[{'optimizer':['Adam','SGD'],'num_layers':[3,6],'hidden_size:'[5,10,15]}。
圖6 不同超參數(shù)組合對應的RMSE圖
圖6表示不同超參數(shù)組合對應的RMSE??梢钥闯鰞?yōu)化器為Adam,隱藏層數(shù)為3,每層中的神經(jīng)元數(shù)為15時,LSTM模型的均方根誤差最小。因此選擇的最優(yōu)參數(shù)組合為parameters:{ optimizer ='Adam',num_layers =3, hidden_size =15}。利用最優(yōu)參數(shù)組合對九寨溝景區(qū)客流量預測的結果如圖7所示。
從圖7中可以看出優(yōu)化后的模型對于九寨溝景區(qū)客流量的預測更加接近于真實值,相比初始LSTM模型,其性能有較大的提升,優(yōu)化后模型的訓練誤差和測試誤差均處于較低水平(見圖8)。優(yōu)化后模型的平均絕對誤差MAE為807.3074,均方根誤差RMSE為957.775,相較于優(yōu)化前的模型均有了明顯的下降,模型得到了良好的改善。
圖8 優(yōu)化后模型的誤差圖
利用Python軟件,構建ARIMA模型進行預測。由于原始序列數(shù)據(jù)值較大,因此首先對原序列做對數(shù)變換。從客流量的變化情況來看,客流量數(shù)據(jù)存在明顯的季節(jié)性趨勢,即隨著時間的推移而定期重復的循環(huán)趨勢。因此預測前對數(shù)據(jù)使用季節(jié)差分去除季節(jié)性趨勢,去除趨勢后的時序圖如圖9所示。
圖9 去除季節(jié)性趨勢后的時序圖
首先對去除季節(jié)性趨勢后的九寨溝景區(qū)客流量時序數(shù)據(jù)進行ADF平穩(wěn)性檢驗,檢驗原始序列的平穩(wěn)性。結果顯示,=5.23324×10-5< 0.05,表明在0.05的顯著性水平下,原序列通過平穩(wěn)性檢驗,序列平穩(wěn)(見表1)。
表1 平穩(wěn)性檢驗
Table 1 Stationarity test
Test Statistic Value-4.80873 p-value5.23324e-05 Lags Used22 Number of Observations Used1498 Critical Value(1%)-3.43472 Critical Value(5%)-2.86347 Critical Value(10%)-2.5678
其次,對模型進行定階。為了確定ARIMA模型中自相關階數(shù)和移動平均階數(shù),繪制了自相關圖和偏自相關圖初步判斷、的值(見圖10)。
圖10 自相關圖和偏自相關圖
由圖10可知,自相關系數(shù)拖尾,偏自相關系數(shù)截尾,符合AR(p)模型的特征。其中偏自相關圖顯示在滯后8階之后,偏自相關系數(shù)大致回到置信邊界內。進一步根據(jù)AIC最小準則不斷調整的大小,最終確定的九寨溝景區(qū)客流量ARIMA模型為ARIMA(8,0,0),模型結果如表2所示。
表2 ARIMA模型結果
Table 2 ARIMA model results
Result:ARIMA Model:AIC: constar.L8.num AR.8ARMA1332.4368Coef.0.0865-0.2513Real1.2373BICHQICt1.5876-10.1481Imaginary0.00001385.70811352.269P>|t|0.11240.0000Modulus1.2383
隨后檢驗ARIMA模型的殘差序列是否為高斯白噪聲序列。結果顯示,殘差序列的Ljung-Box檢驗結果的值均大于0.05,DW檢驗值為1.997,接近于2。從QQ圖中也可以看出殘差近似服從正態(tài)分布,即殘差序列為白噪聲序列,不存在自相關性,表明構建的ARIMA模型是有效的。
圖11 ARIMA模型殘差QQ圖
最后將構建的ARIMA(8,0,0)用于預測九寨溝景區(qū)的客流量,從圖12中看出ARIMA模型對于數(shù)據(jù)的擬合效果不是很好,預測值與真實值之間偏差較大。模型的MAE為2694.018,RMSE為4300.942。
圖12 ARIMA模型的預測值與真實值的對比
圖13 SVR模型的預測值與真實值的對比
從圖13中可以看出,SVR模型的預測值與真實值之間存在偏差,預測結果精度不高。SVR模型的MAE為3691.463,RMSE為4845.491。
本研究采用LSTM神經(jīng)網(wǎng)絡模型、ARIMA模型和SVR模型對九寨溝景區(qū)客流量進行預測,運用平均絕對誤差(MAE)和均方根誤差(RMSE)評估三個模型的預測性能。結果表明,LSTM神經(jīng)網(wǎng)絡模型的預測更加接近于真實值,且LSTM神經(jīng)網(wǎng)絡模型較ARIMA模型和SVR模型在MAE和RMSE上都有明顯的下降。與ARIMA模型相比,MAE下降了70%,RMSE下降了77%;與SVR模型相比,MAE下降了78%,RMSE下降了80%(如表3所示),表明LSTM神經(jīng)網(wǎng)絡模型較ARIMA模型和SVR模型的預測精度更高,也更適合運用于九寨溝景區(qū)客流量預測。
本研究主要是針對九寨溝景區(qū)客流量數(shù)據(jù)這一復雜多變的非線性時間序列數(shù)據(jù)做預測,且數(shù)據(jù)樣本量相對較多,使得LSTM模型的學習能力得到充分發(fā)揮,而ARIMA模型和SVR模型顯得無能為力。同時,LSTM神經(jīng)網(wǎng)絡考慮了時間、日平均溫度和百度搜索指數(shù)等多重因素,對九寨溝景區(qū)客流量預測與真實輸出在總體趨勢上均能達成一致。ARIMA模型僅考慮時間因素,將客流量數(shù)據(jù)作為時序數(shù)據(jù)處理,沒有考慮其它因素對客流量的影響,SVR模型則對大規(guī)模數(shù)據(jù)訓練比較困難。因此,LSTM神經(jīng)網(wǎng)絡模型相較于ARIMA模型和SVR模型預測性能更好,也更適合用于預測景區(qū)客流量。
表3 三種模型預測精度比較
Table 3 Comparison of prediction accuracy of three models
模型MAERMSE LSTM807.3074957.775 ARIMA2694.0184300.942 SVR3691.4634845.491
本研究以九寨溝景區(qū)2012年5月25日至2021年5月18日客流量數(shù)據(jù)為基礎,分別采用LSTM模型、ARIMA模型和SVR模型進行預測。結果表明,LSTM模型預測精度較高,在很大程度上可以反映九寨溝風景區(qū)每日客流的情況,也較ARIMA模型和SVR模型更適合用于預測客流量此類時間序列數(shù)據(jù)。
由于客流量數(shù)據(jù)本身的復雜性,深度學習模型無疑比傳統(tǒng)的時間序列分析模型ARIMA、ARIMAX或機器學習模型SVR、RF、ANN更適合用于客流預測,擬合能力更強,預測準確性更高。但LSTM模型仍存在一定缺陷,受數(shù)據(jù)來源限制,LSTM考慮的外部因素只有氣溫和百度搜索指數(shù),因素較少,若能獲取更加完整精確的相關氣象數(shù)據(jù)如:降水量、空氣質量等,同時考慮爬取“攜程”、“去哪兒”等知名旅游網(wǎng)站的評論數(shù)據(jù),擴充影響因素,篩選出多重重要因素代入模型,會提高模型的預測精度,取得更佳的預測效果。
[1] 孫燁,張宏磊,劉培學,等.基于旅游者網(wǎng)絡關注度的旅游景區(qū)日游客量預測研究——以不同客戶端百度指數(shù)為例[J].人文地理,2017,32(3):152-160.
[2] Peng B,Song H Y,Geoffrey Crouch. A meta-analysis of international tourism demand forecasting and implications for practice[J]. Tourism Management,2014,45:181-193.
[3] Ulrich Gunter,Irem ?nder. Forecasting international city tourism demand for Paris: Accuracy of uni-and multivariate models employing monthly data[J]. Tourism Management,2015,46:123-135.
[4] 張玲玲,張笑,崔怡雯.基于聚類方法的百度搜索指數(shù)關鍵詞優(yōu)化及客流量預測研究[J].管理評論,2018,30(8):126-137.
[5] 韓兆洲,方澤潤.基于GIOWHA-GALSSVR-SARIMA組合模型在旅游需求預測中的應用[J].數(shù)學的實踐與認識,2019,49(19):69-79.
[6] 李乃文,韓婧婧.基于時間序列修正算法的我國入境旅游人數(shù)預測[J].資源開發(fā)與市場,2015,31(01):126-128,130.
[7] 任婕.基于向量自回歸模型的旅游熱門景點預測方法研究[J].現(xiàn)代電子技術,2020,43(3):158-161.
[8] 黃鯤.九寨溝網(wǎng)絡關注度分析及客流量預測模型構建[D]上海:上海師范大學,2016.
[9] George Assaf A, Li G,Song H Y,et al. Modeling and forecasting regional tourism demand using the bayesian global vector autoregressive (BGVAR) Model[J]. Journal of Travel Research,2019,58(3):383-397.
[10] 陸文星,戴一茹,李楚,等.基于改進PSO-BP神經(jīng)網(wǎng)絡的旅游客流量預測方法[J].系統(tǒng)科學與數(shù)學, 2020, 40(8):1407-1419.
[11] 陸利軍,廖小平.基于EMD-BP神經(jīng)網(wǎng)絡的游客量預測研究[J].統(tǒng)計與決策,2019,35(4):85-89.
[12] 陳榮,梁昌勇,葛立新.基于SEA的AGA-SVR節(jié)假日客流量預測方法研究[J].旅游科學,2016,30(5):12-23.
[13] 王蘭梅,陳崇成,葉曉燕,等.網(wǎng)絡搜索數(shù)據(jù)和GWO-SVR模型的旅游短期客流量預測[J].福州大學學報:自然科學版,2019,47(5):598-603.
[14] 趙建立,石敬詩,孫秋霞,等.基于混合深度學習的地鐵站進出客流量短時預測[J].交通運輸系統(tǒng)工程與信息,2020,20(5):128-134.
[15] 李佳,黃之豪,王佳慧.基于獨立循環(huán)神經(jīng)網(wǎng)絡方法的GDP預測[J].統(tǒng)計與決策,2020,36(14):24-28.
[16] 喬若羽.基于神經(jīng)網(wǎng)絡的股票預測模型[J].運籌與管理,2019,28(10):132-140.
[17] 陳深進,薛洋.基于改進卷積神經(jīng)網(wǎng)絡的短時公交客流預測[J].計算機科學,2019,46(5):175-184.
[18] Sun S L, Wei Y J,Tsui K L,et al. Forecasting tourist arrivals with machine learning and internet search index[J]. Tourism Management,2019,70(FEB.):1-10.
[19] 倪田. 基于機器學習的旅游景區(qū)日客流量預測方法研究[D].西安:西安理工大學,2020.
[20] Law R, Li G, Fong D, et al. Tourism demand forecasting: A deep learning approach[J].Annals of Tourism Research, 2019,75:410-423.
THE PREDICTION OF TOURISM DEMAND BASED ON DATA DRIVEN
*HU Ya-min1, YANG Li2, FANG Run-yue3
(1. School of Humanities and Social Science, Huainan, An hui 232001, China; 2. School of Economics and Management, Huainan, An hui 232001, China; 3. School of Mathematics and Big Data, Anhui University of Science & Technology, Huainan, Anhui 232001, China)
Reasonable prediction of tourist flow in scenic spots can not only provide reference for scenic spots, but also is the inherent requirement of modernization construction of tourism management system and management capacity. Based on the daily passenger flow data disclosed by Jiuzhaigou scenic spot official website from May 2012 to May 2021, the search behavior data related to tourism in Jiuzhaigou and the daily average temperature were extracted, and the passenger flow of Jiuzhaigou scenic spot was fitted and predicted by constructing ARIMA model, SVR model and LSTM neural network model of adding factors. The results show that the prediction accuracy of LSTM neural network model is higher than ARIMA model and SVR model, and the LSTM neural network model with Baidu search index and daily average temperature can significantly improve the prediction accuracy of passenger flow.
tourism demand forecast; Jiuzhaigou valley; LSTM model; ARIMA model; SVR model
1674-8085(2022)04-0007-08
F590.3 文獻識別碼:A
10.3969/j.issn.1674-8085.2022.04.002
2021-12-31;
2022-03-15
國家社會科學基金重大項目子課題研究項目(20ZDA084)
*胡亞敏(1998-),女,安徽宣城人,碩士生,主要從事管理決策與分析研究(E-mail:1934360318@qq.com).