国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測模型研究

2021-08-06 14:35吳學(xué)成
現(xiàn)代電子技術(shù) 2021年15期
關(guān)鍵詞:客流量分析法數(shù)據(jù)挖掘

吳學(xué)成

(凱里學(xué)院,貴州 凱里 556011)

0 引言

對景區(qū)客流量進(jìn)行建模與預(yù)測,可以幫助景區(qū)管理人員了解景區(qū)客流量的變化動態(tài),制定一些更加合理的管理措施,增強(qiáng)景區(qū)管理水平,因此景區(qū)客流量預(yù)測成為經(jīng)濟(jì)領(lǐng)域研究的一個(gè)熱點(diǎn)課題[1?3]。

當(dāng)前景區(qū)客流量預(yù)測模型分為三類:線性回歸方法、時(shí)間序列分析法、神經(jīng)網(wǎng)絡(luò)[4]。其中線性回歸方法主要有多元回歸、逐步回歸,對景區(qū)客流量數(shù)據(jù)直接進(jìn)行建模,景區(qū)客流量預(yù)測誤差大[5];時(shí)間序列分析法根據(jù)時(shí)間先后對景區(qū)客流量進(jìn)行組合,然后對其進(jìn)行建模[6?7],該類方法主要針對季節(jié)性、周期性等變化規(guī)律的景區(qū)客流量,通用性差[8?10];人工神經(jīng)網(wǎng)絡(luò)可以深層次挖掘景區(qū)客流量變化特點(diǎn),是當(dāng)前主要的建模工具[11?13]。在實(shí)際應(yīng)用中,當(dāng)前景區(qū)客流量預(yù)測模型同樣存在一些不足,如景區(qū)客流量預(yù)測誤差比較大,景區(qū)客流量預(yù)測穩(wěn)定性比較差[14?16]。

為了解決回聲狀態(tài)網(wǎng)絡(luò)的參數(shù)優(yōu)化問題,以提高景區(qū)客流量預(yù)測效果為目標(biāo),提出了數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測模型,并通過具體景區(qū)客流量預(yù)測仿真對比實(shí)驗(yàn),驗(yàn)證了本文模型的有效性和優(yōu)越性。

1 數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測模型

1.1 回聲狀態(tài)網(wǎng)絡(luò)

回聲狀態(tài)網(wǎng)絡(luò)是一種數(shù)據(jù)挖掘技術(shù),具有短期記憶數(shù)據(jù)的功能,其結(jié)構(gòu)如圖1所示。其中,Win,Wout分別表示輸入層和儲備層、儲備層和輸出層之間的連接權(quán)重矩陣。

圖1 回聲狀態(tài)網(wǎng)絡(luò)結(jié)構(gòu)

回聲狀態(tài)網(wǎng)絡(luò)的工作狀態(tài)方程可以采用如下形式進(jìn)行描述:

式中:W x為連接矩陣;u(t),x(t)分別為輸入向量和儲備池內(nèi)部向量。

回聲狀態(tài)網(wǎng)絡(luò)的輸出形式可以描述為:

式中y(t)為輸出向量。

采用最小二乘法對輸出權(quán)值進(jìn)行求解,那么目標(biāo)函數(shù)可以描述為:

式中:X=[x(1),x(2),…,x(l)]T,X∈Rl×N,N為儲備池節(jié)點(diǎn)數(shù),l為訓(xùn)練樣本數(shù);Y=[y(1),y(2),…,y(l)]T。

對于大規(guī)模網(wǎng)絡(luò)流量數(shù)據(jù),訓(xùn)練樣本數(shù)常大于儲備池節(jié)點(diǎn)數(shù),那么,根據(jù)式(3)得到解:

X的奇異值分解可以描述為:

式中:U=(u1,u2,…,ul)和V=(v1,v2,…,vl)是酉矩陣;Σ=diag(σ1,…,σr,σr+1,…,σN)。

當(dāng)前X的秩是r,那么可以得到:

X的逆矩陣為X+,那么可以采用式(7)進(jìn)行表示:

這樣可以得到:

傳統(tǒng)回聲狀態(tài)網(wǎng)絡(luò)的魯棒性差,為了克服該缺陷,選擇拉普拉斯分布描述高斯分布,可得到:

這樣,w的先驗(yàn)分布計(jì)算公式可以表示為:

那么可以得到:

式中p(y|a,β)為邊際函數(shù),且有:

基于邊際優(yōu)化原則有:

式中ε=y-Aw。

得到:

p(w|y)和p(y|a,β)替代函數(shù)分別為:

綜合式(10)、式(16)以及式(18)產(chǎn)生如下公式:

其中:

最后得到w的計(jì)算公式為:

其中:

式中A表示對角矩陣。

對于參數(shù)a和β可以根據(jù)證據(jù)函數(shù)方法確定,通過對輸出權(quán)值w積分,可得邊際似然函數(shù)為:

式中,C=β-1Λ+ΦA(chǔ)-1ΦT。

將lnp分別對參數(shù)a和β求偏導(dǎo),并令導(dǎo)數(shù)為零,可以得到a和β估計(jì)公式具體如下:

式中γj=1-aj Σij。

1.2 數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測步驟

1)收集景區(qū)客流量預(yù)測數(shù)據(jù),并根據(jù)時(shí)間先后順序組成景區(qū)客流量的學(xué)習(xí)樣本集合。

2)對原始的景區(qū)客流量時(shí)間序列數(shù)據(jù)進(jìn)行重構(gòu),得到景區(qū)客流量預(yù)測的訓(xùn)練集和測試集合。

3)回聲狀態(tài)網(wǎng)絡(luò)對景區(qū)客流量的訓(xùn)練集進(jìn)行學(xué)習(xí),并確定回聲狀態(tài)網(wǎng)絡(luò)的參數(shù)。

4)根據(jù)參數(shù)建立景區(qū)客流量預(yù)測模型,采用測試樣本對景區(qū)客流量預(yù)測模型性能進(jìn)行分析。

2 景區(qū)客流量預(yù)測模型性能的仿真測試

2.1 景區(qū)客流量的歷史數(shù)據(jù)

為了測試基于數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測性能,采用黔東南地區(qū)某景區(qū)客流量歷史數(shù)據(jù)作為研究對象,如圖2 所示。圖2 景區(qū)客流量數(shù)據(jù)具有一定的隨機(jī)性和混沌性,因此不能采用原始的景區(qū)客流量數(shù)據(jù)進(jìn)行建模與預(yù)測,需要對其進(jìn)行相應(yīng)的變換。

圖2 景區(qū)客流量的歷史數(shù)據(jù)

2.2 重構(gòu)景區(qū)客流量的歷史數(shù)據(jù)

景區(qū)客流量數(shù)據(jù)嵌入維和延遲時(shí)間如圖3 所示。從圖3 可以看出,景區(qū)客流量數(shù)據(jù)嵌入維和延遲時(shí)間最優(yōu)值為3 和5,對圖2 景區(qū)客流量重構(gòu),選擇50 個(gè)樣本作為景區(qū)客流量,其他景區(qū)客流量數(shù)據(jù)用于訓(xùn)練回聲狀態(tài)網(wǎng)絡(luò),建立景區(qū)客流量預(yù)測模型。

圖3 景區(qū)客流量數(shù)據(jù)的嵌入維和延遲時(shí)間

2.3 與經(jīng)典景區(qū)客流量預(yù)測模型的性能對比

為了檢測基于數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測的優(yōu)越性,選擇BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預(yù)測模型、時(shí)間序列分析法的景區(qū)客流量預(yù)測模型進(jìn)行對比實(shí)驗(yàn),預(yù)測結(jié)果如圖4 所示。

對圖4的景區(qū)客流量預(yù)測結(jié)果進(jìn)行對比和分析可知:

圖4 不同模型的景區(qū)客流量預(yù)測結(jié)果對比

1)時(shí)間序列分析法的景區(qū)客流量預(yù)測值與實(shí)際的景區(qū)客流量值之間的偏差最大,這表明時(shí)間序列分析法無法描述景區(qū)客流量的變化態(tài)勢,使得景區(qū)客流量預(yù)測誤差大。

2)BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預(yù)測值與實(shí)際的景區(qū)客流量值之間的偏差不大,這表明BP 神經(jīng)網(wǎng)絡(luò)可以描述景區(qū)客流量的變化態(tài)勢,但是其個(gè)別景區(qū)客流量預(yù)測誤差比較大,使得景區(qū)客流量預(yù)測結(jié)果不穩(wěn)定,導(dǎo)致景區(qū)客流量預(yù)測整體精度比較低。

3)相對于時(shí)間序列分析法的景區(qū)客流量預(yù)測模型和BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預(yù)測模型,本文模型的預(yù)測值與實(shí)際景區(qū)客流量之間的偏差最小,這表明本文模型可以更好地?cái)M合景區(qū)客流量的變化態(tài)勢,減少了景區(qū)客流量預(yù)測誤差,獲得了更加理想的景區(qū)客流量預(yù)測結(jié)果,體現(xiàn)了本文模型的優(yōu)越性。

2.4 景區(qū)客流量預(yù)測模型的通用性測試

為了分析基于數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測模型的通用性,采用全國10 個(gè)熱門景區(qū)客流量作為研究對象,統(tǒng)計(jì)每一個(gè)景區(qū)客流量的預(yù)測精度,結(jié)果如表1 所示。

表1 不同景區(qū)客流量預(yù)測精度 %

對表1 的景區(qū)客流量預(yù)測精度進(jìn)行對比可以發(fā)現(xiàn),相對于BP 神經(jīng)網(wǎng)絡(luò)的景區(qū)客流量預(yù)測模型和時(shí)間序列分析法的景區(qū)客流量預(yù)測模型,本文模型的景區(qū)客流量預(yù)測精度得到了提高,景區(qū)客流量預(yù)測精度平均值超過了90%,景區(qū)客流量預(yù)測誤差處于景區(qū)客流量實(shí)際管理范圍內(nèi),獲得了較好的通用性。

3 結(jié)語

針對當(dāng)前景區(qū)客流量預(yù)測效果差的弊端,以改善景區(qū)客流量預(yù)測結(jié)果為目標(biāo),本文提出了基于互聯(lián)網(wǎng)大數(shù)據(jù)的景區(qū)客流量預(yù)測模型。仿真實(shí)驗(yàn)結(jié)果表明,本文模型是一種精度高、通用性好的景區(qū)客流量平均預(yù)測模型,具有廣泛的應(yīng)用前景。

猜你喜歡
客流量分析法數(shù)據(jù)挖掘
異步機(jī)傳統(tǒng)分析法之困難及其克服
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于嵌入式系統(tǒng)的商場客流量統(tǒng)計(jì)算法
基于時(shí)間重疊分析法的同車倒卡逃費(fèi)探析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
層次分析法在SWOT分析法中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于AFC數(shù)據(jù)的城軌站間客流量分布預(yù)測
AHP和SWOT分析法在規(guī)劃編制中的應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究