吳學(xué)成
(凱里學(xué)院,貴州 凱里 556011)
對景區(qū)客流量進(jìn)行建模與預(yù)測,可以幫助景區(qū)管理人員了解景區(qū)客流量的變化動態(tài),制定一些更加合理的管理措施,增強(qiáng)景區(qū)管理水平,因此景區(qū)客流量預(yù)測成為經(jīng)濟(jì)領(lǐng)域研究的一個(gè)熱點(diǎn)課題[1?3]。
當(dāng)前景區(qū)客流量預(yù)測模型分為三類:線性回歸方法、時(shí)間序列分析法、神經(jīng)網(wǎng)絡(luò)[4]。其中線性回歸方法主要有多元回歸、逐步回歸,對景區(qū)客流量數(shù)據(jù)直接進(jìn)行建模,景區(qū)客流量預(yù)測誤差大[5];時(shí)間序列分析法根據(jù)時(shí)間先后對景區(qū)客流量進(jìn)行組合,然后對其進(jìn)行建模[6?7],該類方法主要針對季節(jié)性、周期性等變化規(guī)律的景區(qū)客流量,通用性差[8?10];人工神經(jīng)網(wǎng)絡(luò)可以深層次挖掘景區(qū)客流量變化特點(diǎn),是當(dāng)前主要的建模工具[11?13]。在實(shí)際應(yīng)用中,當(dāng)前景區(qū)客流量預(yù)測模型同樣存在一些不足,如景區(qū)客流量預(yù)測誤差比較大,景區(qū)客流量預(yù)測穩(wěn)定性比較差[14?16]。
為了解決回聲狀態(tài)網(wǎng)絡(luò)的參數(shù)優(yōu)化問題,以提高景區(qū)客流量預(yù)測效果為目標(biāo),提出了數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測模型,并通過具體景區(qū)客流量預(yù)測仿真對比實(shí)驗(yàn),驗(yàn)證了本文模型的有效性和優(yōu)越性。
回聲狀態(tài)網(wǎng)絡(luò)是一種數(shù)據(jù)挖掘技術(shù),具有短期記憶數(shù)據(jù)的功能,其結(jié)構(gòu)如圖1所示。其中,Win,Wout分別表示輸入層和儲備層、儲備層和輸出層之間的連接權(quán)重矩陣。
圖1 回聲狀態(tài)網(wǎng)絡(luò)結(jié)構(gòu)
回聲狀態(tài)網(wǎng)絡(luò)的工作狀態(tài)方程可以采用如下形式進(jìn)行描述:
式中:W x為連接矩陣;u(t),x(t)分別為輸入向量和儲備池內(nèi)部向量。
回聲狀態(tài)網(wǎng)絡(luò)的輸出形式可以描述為:
式中y(t)為輸出向量。
采用最小二乘法對輸出權(quán)值進(jìn)行求解,那么目標(biāo)函數(shù)可以描述為:
式中:X=[x(1),x(2),…,x(l)]T,X∈Rl×N,N為儲備池節(jié)點(diǎn)數(shù),l為訓(xùn)練樣本數(shù);Y=[y(1),y(2),…,y(l)]T。
對于大規(guī)模網(wǎng)絡(luò)流量數(shù)據(jù),訓(xùn)練樣本數(shù)常大于儲備池節(jié)點(diǎn)數(shù),那么,根據(jù)式(3)得到解:
X的奇異值分解可以描述為:
式中:U=(u1,u2,…,ul)和V=(v1,v2,…,vl)是酉矩陣;Σ=diag(σ1,…,σr,σr+1,…,σN)。
當(dāng)前X的秩是r,那么可以得到:
X的逆矩陣為X+,那么可以采用式(7)進(jìn)行表示:
這樣可以得到:
傳統(tǒng)回聲狀態(tài)網(wǎng)絡(luò)的魯棒性差,為了克服該缺陷,選擇拉普拉斯分布描述高斯分布,可得到:
這樣,w的先驗(yàn)分布計(jì)算公式可以表示為:
那么可以得到:
式中p(y|a,β)為邊際函數(shù),且有:
基于邊際優(yōu)化原則有:
式中ε=y-Aw。
得到:
p(w|y)和p(y|a,β)替代函數(shù)分別為:
綜合式(10)、式(16)以及式(18)產(chǎn)生如下公式:
其中:
最后得到w的計(jì)算公式為:
其中:
式中A表示對角矩陣。
對于參數(shù)a和β可以根據(jù)證據(jù)函數(shù)方法確定,通過對輸出權(quán)值w積分,可得邊際似然函數(shù)為:
式中,C=β-1Λ+ΦA(chǔ)-1ΦT。
將lnp分別對參數(shù)a和β求偏導(dǎo),并令導(dǎo)數(shù)為零,可以得到a和β估計(jì)公式具體如下:
式中γj=1-aj Σij。
1)收集景區(qū)客流量預(yù)測數(shù)據(jù),并根據(jù)時(shí)間先后順序組成景區(qū)客流量的學(xué)習(xí)樣本集合。
2)對原始的景區(qū)客流量時(shí)間序列數(shù)據(jù)進(jìn)行重構(gòu),得到景區(qū)客流量預(yù)測的訓(xùn)練集和測試集合。
3)回聲狀態(tài)網(wǎng)絡(luò)對景區(qū)客流量的訓(xùn)練集進(jìn)行學(xué)習(xí),并確定回聲狀態(tài)網(wǎng)絡(luò)的參數(shù)。
4)根據(jù)參數(shù)建立景區(qū)客流量預(yù)測模型,采用測試樣本對景區(qū)客流量預(yù)測模型性能進(jìn)行分析。
為了測試基于數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測性能,采用黔東南地區(qū)某景區(qū)客流量歷史數(shù)據(jù)作為研究對象,如圖2 所示。圖2 景區(qū)客流量數(shù)據(jù)具有一定的隨機(jī)性和混沌性,因此不能采用原始的景區(qū)客流量數(shù)據(jù)進(jìn)行建模與預(yù)測,需要對其進(jìn)行相應(yīng)的變換。
圖2 景區(qū)客流量的歷史數(shù)據(jù)
景區(qū)客流量數(shù)據(jù)嵌入維和延遲時(shí)間如圖3 所示。從圖3 可以看出,景區(qū)客流量數(shù)據(jù)嵌入維和延遲時(shí)間最優(yōu)值為3 和5,對圖2 景區(qū)客流量重構(gòu),選擇50 個(gè)樣本作為景區(qū)客流量,其他景區(qū)客流量數(shù)據(jù)用于訓(xùn)練回聲狀態(tài)網(wǎng)絡(luò),建立景區(qū)客流量預(yù)測模型。
圖3 景區(qū)客流量數(shù)據(jù)的嵌入維和延遲時(shí)間
為了檢測基于數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測的優(yōu)越性,選擇BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預(yù)測模型、時(shí)間序列分析法的景區(qū)客流量預(yù)測模型進(jìn)行對比實(shí)驗(yàn),預(yù)測結(jié)果如圖4 所示。
對圖4的景區(qū)客流量預(yù)測結(jié)果進(jìn)行對比和分析可知:
圖4 不同模型的景區(qū)客流量預(yù)測結(jié)果對比
1)時(shí)間序列分析法的景區(qū)客流量預(yù)測值與實(shí)際的景區(qū)客流量值之間的偏差最大,這表明時(shí)間序列分析法無法描述景區(qū)客流量的變化態(tài)勢,使得景區(qū)客流量預(yù)測誤差大。
2)BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預(yù)測值與實(shí)際的景區(qū)客流量值之間的偏差不大,這表明BP 神經(jīng)網(wǎng)絡(luò)可以描述景區(qū)客流量的變化態(tài)勢,但是其個(gè)別景區(qū)客流量預(yù)測誤差比較大,使得景區(qū)客流量預(yù)測結(jié)果不穩(wěn)定,導(dǎo)致景區(qū)客流量預(yù)測整體精度比較低。
3)相對于時(shí)間序列分析法的景區(qū)客流量預(yù)測模型和BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預(yù)測模型,本文模型的預(yù)測值與實(shí)際景區(qū)客流量之間的偏差最小,這表明本文模型可以更好地?cái)M合景區(qū)客流量的變化態(tài)勢,減少了景區(qū)客流量預(yù)測誤差,獲得了更加理想的景區(qū)客流量預(yù)測結(jié)果,體現(xiàn)了本文模型的優(yōu)越性。
為了分析基于數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測模型的通用性,采用全國10 個(gè)熱門景區(qū)客流量作為研究對象,統(tǒng)計(jì)每一個(gè)景區(qū)客流量的預(yù)測精度,結(jié)果如表1 所示。
表1 不同景區(qū)客流量預(yù)測精度 %
對表1 的景區(qū)客流量預(yù)測精度進(jìn)行對比可以發(fā)現(xiàn),相對于BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預(yù)測模型和時(shí)間序列分析法的景區(qū)客流量預(yù)測模型,本文模型的景區(qū)客流量預(yù)測精度得到了提高,景區(qū)客流量預(yù)測精度平均值超過了90%,景區(qū)客流量預(yù)測誤差處于景區(qū)客流量實(shí)際管理范圍內(nèi),獲得了較好的通用性。
針對當(dāng)前景區(qū)客流量預(yù)測效果差的弊端,以改善景區(qū)客流量預(yù)測結(jié)果為目標(biāo),本文提出了基于互聯(lián)網(wǎng)大數(shù)據(jù)的景區(qū)客流量預(yù)測模型。仿真實(shí)驗(yàn)結(jié)果表明,本文模型是一種精度高、通用性好的景區(qū)客流量平均預(yù)測模型,具有廣泛的應(yīng)用前景。