国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Wi-Fi探測(cè)數(shù)據(jù)的公共場(chǎng)所客流預(yù)測(cè)方案

2018-03-22 02:20:18
信息通信技術(shù)與政策 2018年2期
關(guān)鍵詞:誤差率客流量客流

李 煒 杭州東信北郵信息技術(shù)有限公司,北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國家重點(diǎn)實(shí)驗(yàn)室副教授

1 引言

隨著無線網(wǎng)絡(luò)通信的快速普及,通過無線網(wǎng)絡(luò)提供設(shè)備來偵測(cè)用戶設(shè)備相關(guān)信息變得越來越容易,這為客流分析及人群移動(dòng)性等研究課題提供了新的方法和途徑。本文將利用無線通信技術(shù)(Wi-Fi)來獲取用戶信息,結(jié)合用戶周圍的環(huán)境信息(地理位置信息)來對(duì)現(xiàn)實(shí)世界中的客流及用戶行為進(jìn)行分析的技術(shù)稱為基于Wi-Fi探測(cè)數(shù)據(jù)的客流分析。基于Wi-Fi探測(cè)數(shù)據(jù)的客流分析對(duì)用戶、大型活動(dòng)負(fù)責(zé)人乃至場(chǎng)館經(jīng)營者都具有很大價(jià)值,用戶將受益于個(gè)性化服務(wù),大型活動(dòng)負(fù)責(zé)人將使用戶最大化地參與活動(dòng),場(chǎng)館經(jīng)營者將全面了解并掌控場(chǎng)館的客流情況并進(jìn)行有效的管理控制。

本文通過在公共場(chǎng)所提供智能Wi-Fi信號(hào)設(shè)備進(jìn)行Wi-Fi信號(hào)探測(cè),收集到包括設(shè)備MAC地址、RSSI信號(hào)強(qiáng)度、信號(hào)時(shí)間戳等在內(nèi)的設(shè)備數(shù)據(jù)。收集到數(shù)據(jù)之后,使用滑動(dòng)窗口加權(quán)平均的方案對(duì)數(shù)據(jù)進(jìn)行清洗。然后,通過開源Web可視化工具對(duì)統(tǒng)計(jì)結(jié)果進(jìn)行可視化展現(xiàn),同時(shí)提供交互可視化工具。之后,采用改進(jìn)的基于滑動(dòng)窗口的二次指數(shù)平滑算法對(duì)短時(shí)客流進(jìn)行了預(yù)測(cè)。同時(shí),對(duì)不同區(qū)間的真實(shí)客流數(shù)據(jù)進(jìn)行了實(shí)地統(tǒng)計(jì),利用回歸分析的方法,建立了各區(qū)間內(nèi)Wi-Fi探測(cè)數(shù)據(jù)和真實(shí)客流量的回歸方程,從而為公共場(chǎng)所經(jīng)營者提供了分時(shí)段的客流準(zhǔn)確數(shù)據(jù)參考。

2 數(shù)據(jù)預(yù)處理與可視化

如圖1所示,本研究內(nèi)容包括基于Wi-Fi設(shè)備信號(hào)探測(cè)系統(tǒng)、Wi-Fi探測(cè)數(shù)據(jù)采集系統(tǒng)、Wi-Fi探測(cè)數(shù)據(jù)可視化平臺(tái)等項(xiàng)目。首先,Wi-Fi設(shè)備信號(hào)探測(cè)系統(tǒng)中,在智能Wi-Fi設(shè)備上部署了基于openWRT研發(fā)的程序,能夠偵測(cè)環(huán)境中的Wi-Fi信號(hào)幀并以一定格式(設(shè)備MAC地址、設(shè)備信息、RSSI強(qiáng)度、時(shí)間戳等)上報(bào)給服務(wù)器。而Wi-Fi探測(cè)數(shù)據(jù)采集系統(tǒng)中,服務(wù)器端接收分布式的Wi-Fi設(shè)備上報(bào)的探測(cè)數(shù)據(jù),進(jìn)行儲(chǔ)存并通過長連接形式傳送給數(shù)據(jù)使用方。Wi-Fi探測(cè)數(shù)據(jù)可視化分析系統(tǒng)中,服務(wù)端通過長連接從數(shù)據(jù)采集系統(tǒng)中獲取探測(cè)原始數(shù)據(jù),通過對(duì)原始數(shù)據(jù)進(jìn)行處理,得到偵測(cè)到的每一設(shè)備的設(shè)備信息、駐留時(shí)長以及某一探測(cè)點(diǎn)的實(shí)時(shí)客流、歷史客流、客流變化等信息,并將相關(guān)數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫中。探測(cè)數(shù)據(jù)可視化呈現(xiàn)子系統(tǒng),包括實(shí)時(shí)數(shù)據(jù)監(jiān)控面板、歷史數(shù)據(jù)分析面板、設(shè)備分組管理面板、系統(tǒng)用戶管理面板4個(gè)部分。

圖1 數(shù)據(jù)收集分析可視化系統(tǒng)結(jié)構(gòu)圖

本文基于可視化平臺(tái)提供的某一月每一天的Wi-Fi探測(cè)數(shù)據(jù)進(jìn)行客流趨勢(shì)分析和統(tǒng)計(jì),然后將統(tǒng)計(jì)分析和預(yù)測(cè)結(jié)果反饋給可視化平臺(tái)進(jìn)行可視化呈現(xiàn),兩者相輔相成。

3 客流預(yù)測(cè)算法分析

3.1 基于二次指數(shù)平滑算法的趨勢(shì)預(yù)測(cè)

同一天不同時(shí)段的客流量是一個(gè)典型的時(shí)間序列上的趨勢(shì)預(yù)測(cè)問題,對(duì)于趨勢(shì)預(yù)測(cè)問題,指數(shù)平滑算法是一個(gè)常用的經(jīng)典算法。指數(shù)平滑算法一般分為一次指數(shù)平滑算法、二次指數(shù)平滑算法、三次指數(shù)平滑算法。一次指數(shù)平滑算法像擁有無限記憶且權(quán)值呈指數(shù)級(jí)遞減的移動(dòng)平均法。越近的歷史記錄對(duì)當(dāng)前平滑值的計(jì)算權(quán)值越大。一次指數(shù)平滑算法足夠簡單、易于理解,但一次指數(shù)平滑法中沒有考慮序列中的趨勢(shì)信息,得到的預(yù)測(cè)結(jié)果并不適合于具有趨勢(shì)的時(shí)間序列,如果用來處理有趨勢(shì)的序列,平滑值將始終滯后于原始數(shù)據(jù)。而且如果數(shù)據(jù)波動(dòng)較大,波動(dòng)的變化將需要多次迭代才能收斂。在一個(gè)客流波峰過程中,如果在波峰開始部分預(yù)測(cè)的比較準(zhǔn)確,那么在接下來的時(shí)間內(nèi)預(yù)測(cè)值將始終低于實(shí)際值。在波峰之后,預(yù)測(cè)值又將始終高于實(shí)際值。調(diào)整的過程較慢。

對(duì)于一次指數(shù)平滑算法無法預(yù)測(cè)趨勢(shì)的問題,業(yè)界一般采用二次指數(shù)平滑算法來解決,二次指數(shù)平滑算法保留了平滑信息和趨勢(shì)信息,使得模型可以預(yù)測(cè)具有趨勢(shì)的時(shí)間序列。

3.2 基于三次指數(shù)平滑算法的趨勢(shì)及周期預(yù)測(cè)

二次指數(shù)平滑算法很好地解決了一次指數(shù)平滑算法沒有體現(xiàn)時(shí)間序列趨勢(shì)性的問題,但對(duì)于具有周期性的時(shí)間序列數(shù)據(jù),沒有將周期性(或者季節(jié)性)考慮進(jìn)去。例如,對(duì)于客流數(shù)據(jù),多日期、同時(shí)段的客流數(shù)據(jù)可能具有規(guī)律性,每個(gè)月相同日期的客流也可能具有規(guī)律性。從時(shí)間軸的視角上看,也就是客流變化可能會(huì)具有每月和每天的周期性。針對(duì)此類問題,業(yè)界現(xiàn)有的解決方案有三次指數(shù)平滑算法等。三次指數(shù)平滑算法也叫做Holt-Winter指數(shù)平滑算法,三次指數(shù)平滑算法相比二次指數(shù)平滑算法,增加了第三個(gè)變量來描述周期性。

但本文研究的基于Wi-Fi探測(cè)數(shù)據(jù)的客流統(tǒng)計(jì)問題,數(shù)據(jù)量較大,同時(shí)指數(shù)平滑算法是一種遞歸算法,迭代運(yùn)算,逐步收斂,通過遞歸循環(huán)將空閑時(shí)間的歷史記錄用于當(dāng)前的預(yù)測(cè)中。過多的樣本量會(huì)使遞歸序列變長,加大運(yùn)算量和運(yùn)算空間,會(huì)給系統(tǒng)性能造成負(fù)擔(dān)。

3.3 改進(jìn)的基于二次指數(shù)平滑算法的預(yù)測(cè)方案

針對(duì)此問題,本研究通過觀察客流數(shù)據(jù)的可視化結(jié)果得知,客流變化具有嚴(yán)格的周期性,每天的客流數(shù)據(jù)構(gòu)成一個(gè)周期,因而使用三次指數(shù)平滑算法進(jìn)行從頭迭代來考慮周期性的必要性較小。通過對(duì)多日期同時(shí)段的客流數(shù)據(jù)進(jìn)行縱向?qū)Ρ?,從日期序列上?duì)當(dāng)前時(shí)段客流量進(jìn)行預(yù)測(cè),從而考慮客流周期性的影響。通過對(duì)同一天不同時(shí)段的客流量數(shù)據(jù)進(jìn)行迭代運(yùn)算來從時(shí)間序列上對(duì)當(dāng)前時(shí)段客流量進(jìn)行預(yù)測(cè),從而考慮趨勢(shì)性的影響。在兩個(gè)時(shí)間序列上均采用基于滑動(dòng)窗口的二次指數(shù)平滑算法進(jìn)行計(jì)算,便可使用較少的計(jì)算量實(shí)現(xiàn)客流預(yù)測(cè)的趨勢(shì)性和周期性。

si為基于同一天時(shí)間序列的當(dāng)前平滑值。

xi+h為基于同一天時(shí)間序列的當(dāng)前預(yù)測(cè)值。

基于相同的公式,可以得到y(tǒng)i+h,代表基于多日期同時(shí)段的時(shí)間序列得到的當(dāng)前預(yù)測(cè)值。

之后,可以將一天內(nèi)的客流趨勢(shì)預(yù)測(cè)結(jié)果和周期性的預(yù)測(cè)結(jié)果通過平衡參數(shù)進(jìn)行加權(quán)平均,從而得到誤差率更低的預(yù)測(cè)結(jié)果。

最后,通過對(duì)客流數(shù)據(jù)進(jìn)行合理的時(shí)段分區(qū)和實(shí)際客流統(tǒng)計(jì),并通過回歸分析,可以得到不同時(shí)段內(nèi)實(shí)際客流值和Wi-Fi探測(cè)值之間的回歸方程,最后求得實(shí)際客流值的預(yù)測(cè)公式。

4 算法應(yīng)用和結(jié)果分析

本文選取了在某物業(yè)小區(qū)部署的Wi-Fi設(shè)備在某月的Wi-Fi探測(cè)數(shù)據(jù)來進(jìn)行分析。該月每日客流總量在200人左右,本文選取了某一天(該月20日)的客流數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。

4.1 單日客流數(shù)據(jù)分析

首先,本研究在同一天不同時(shí)段的時(shí)間序列客流數(shù)據(jù)上應(yīng)用了二次指數(shù)平滑算法。通過試驗(yàn),擇優(yōu)設(shè)定參數(shù)s0=x0,t0=0,α =0.75,β =0.7,h=1。執(zhí)行數(shù)據(jù)處理程序,得到的數(shù)據(jù)經(jīng)過可視化之后,效果如圖2所示。

分析數(shù)據(jù)可知,在數(shù)據(jù)變化較為平穩(wěn)時(shí),該預(yù)測(cè)方案能保持95%以上的準(zhǔn)確率。通過計(jì)算,在該種方案下,客流預(yù)測(cè)的平均誤差率是10.32%,即平均準(zhǔn)確率為89.68%。進(jìn)一步觀察可視化結(jié)果并結(jié)合數(shù)據(jù)分析可以發(fā)現(xiàn),當(dāng)數(shù)據(jù)變化率較大時(shí),該種預(yù)測(cè)方案的預(yù)測(cè)結(jié)果會(huì)出現(xiàn)較大的誤差率。主要原因是客流趨勢(shì)在預(yù)測(cè)點(diǎn)之前處于單調(diào)增加或者單調(diào)減少的趨勢(shì)中,負(fù)責(zé)記錄趨勢(shì)因素的參數(shù)起的作用過大,這一問題將在接下來的基于多日期、同時(shí)段時(shí)間序列的二次指數(shù)平滑算法的應(yīng)用中嘗試解決。

4.2 多日期同時(shí)段客流數(shù)據(jù)分析

在多日期同時(shí)段時(shí)間序列的客流數(shù)據(jù)分析中,本研究根據(jù)現(xiàn)有的數(shù)據(jù)粒度,將一天劃分為48個(gè)時(shí)間區(qū)間,每個(gè)區(qū)間存在一個(gè)客流數(shù)據(jù)值。在算法實(shí)現(xiàn)程序中,本研究構(gòu)造了48個(gè)數(shù)組,每個(gè)數(shù)組里面有當(dāng)前月份當(dāng)前日期之前的N天內(nèi)同一時(shí)段的客流數(shù)據(jù)值。對(duì)于每個(gè)數(shù)組,應(yīng)用二次指數(shù)平滑算法進(jìn)行了預(yù)測(cè)。

由二次指數(shù)平滑算法的公式可知,實(shí)際客流量的歷史記錄以加權(quán)平均的方式影響當(dāng)前的預(yù)測(cè),距離當(dāng)前預(yù)測(cè)時(shí)間越久,對(duì)預(yù)測(cè)結(jié)果的影響越小。為此,設(shè)計(jì)了滑動(dòng)窗口的方法。通過控制滑動(dòng)窗口的大小,減少預(yù)測(cè)時(shí)的計(jì)算量。不同滑動(dòng)窗口下該預(yù)測(cè)方案的誤差率變化如圖3所示。

從相關(guān)數(shù)據(jù)可以看出,在滑動(dòng)窗口為6或1時(shí),該方案的誤差率相對(duì)較小,為15%左右;考慮到充分利用歷史數(shù)據(jù)和減少誤差率的需求,本研究把滑動(dòng)窗口值設(shè)定為6。

圖2 同一天不同時(shí)段的時(shí)間序列的預(yù)測(cè)結(jié)果

圖3 預(yù)測(cè)結(jié)果準(zhǔn)確率隨計(jì)算的歷史天數(shù)的變化

此時(shí)經(jīng)過計(jì)算,該預(yù)測(cè)方案下的平均誤差率為15.31%,略高于基于同一天內(nèi)的時(shí)間序列的預(yù)測(cè)方案。分析可知,在多日期同時(shí)段由于時(shí)段跨度較大,客流趨勢(shì)的規(guī)律性弱于在同一天不同時(shí)段的客流趨勢(shì)規(guī)律性,因而得到了相對(duì)較高的誤差率。在接下來的綜合方案中,會(huì)根據(jù)這一情況調(diào)整該方案所得預(yù)測(cè)結(jié)果的權(quán)重。

4.3 單日與多日客流數(shù)據(jù)結(jié)合的預(yù)測(cè)

在上文中,無論基于單日不同時(shí)段時(shí)間序列的預(yù)測(cè)方案,還是基于多日同時(shí)段時(shí)間序列的預(yù)測(cè)方案,都只考慮了時(shí)間序列的趨勢(shì)性或者周期性因素中的一個(gè),無法兼顧兩者。本研究提出了結(jié)合同一天內(nèi)的時(shí)間序列和多日期同時(shí)段時(shí)間序列使用二次指數(shù)平滑算法進(jìn)行預(yù)測(cè)的方案。假設(shè)基于多日期同時(shí)段時(shí)間序列預(yù)測(cè)結(jié)果是xi+h,基于多日期同時(shí)段時(shí)間序列的預(yù)測(cè)結(jié)果是yi+h,使用以下公式將兩個(gè)預(yù)測(cè)結(jié)果進(jìn)行加權(quán)平均。其中r是可變參數(shù)。

在試驗(yàn)過程中,對(duì)不同r的取值下誤差率的情況進(jìn)行了試驗(yàn)計(jì)算,得到了不同的r下平均誤差率的變化如圖4所示。

計(jì)算結(jié)果顯示,當(dāng)r=0.63時(shí),結(jié)合方案可以取得最低的誤差率為8.34%,相比基于同一天內(nèi)的時(shí)間序列的預(yù)測(cè)方案誤差率下降了19%,相對(duì)基于多日期同時(shí)段時(shí)間序列的預(yù)測(cè)方案誤差率下降了45%。試驗(yàn)結(jié)果表明,該方案確實(shí)能夠提升基于二次指數(shù)平滑算法的預(yù)測(cè)方案的準(zhǔn)確率。

圖4 總誤差率隨參數(shù)r的變化趨勢(shì)

4.5 基于實(shí)際客流統(tǒng)計(jì)和回歸分析的預(yù)測(cè)方案校正

為了研究Wi-Fi客流統(tǒng)計(jì)數(shù)據(jù)和實(shí)際客流直接的關(guān)系,本研究在該月對(duì)該物業(yè)小區(qū)的實(shí)際客流進(jìn)行了統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果顯示,實(shí)際客流與Wi-Fi探測(cè)客流之間的相關(guān)性在高峰期和低峰期有較大差別。本研究采取了有序聚類Fisher算法,劃分了每天的客流峰值區(qū)間,并建立了Wi-Fi探測(cè)客流量x和實(shí)際統(tǒng)計(jì)客流量y的回歸方程,結(jié)果如表1所示。

表1 不同時(shí)段預(yù)測(cè)客流量和實(shí)際統(tǒng)計(jì)客流量的回歸方程

每個(gè)客流量區(qū)間的回歸方程的顯著性檢驗(yàn)指標(biāo)|R|均大于0.85,說明Wi-Fi探測(cè)所得的客流量和實(shí)際統(tǒng)計(jì)的客流量y存在一定程度的線性相關(guān)性,可以將Wi-Fi探測(cè)數(shù)據(jù)所得的客流量通過回歸方程近似計(jì)算出實(shí)際客流量。

5 結(jié)束語

本文利用部署在某物業(yè)小區(qū)的Wi-Fi提供設(shè)備采集的客流數(shù)據(jù),通過對(duì)同一天不同時(shí)段的時(shí)間序列和多日期同時(shí)段的時(shí)間序列的客流數(shù)據(jù)分別應(yīng)用二次指數(shù)平滑算法,并通過試驗(yàn)確定了平衡參數(shù),對(duì)兩個(gè)緯度的預(yù)測(cè)結(jié)果進(jìn)行加權(quán)平均,使得最后的綜合預(yù)測(cè)結(jié)果相比單一維度的預(yù)測(cè)結(jié)果平均誤差率降低19%~45%,準(zhǔn)確率保持在92%左右。之后,通過對(duì)實(shí)際客流量進(jìn)行人工統(tǒng)計(jì)并與Wi-Fi探測(cè)結(jié)果在不同的峰值區(qū)間進(jìn)行回歸分析得到相應(yīng)時(shí)段的回歸方程,進(jìn)一步提高了預(yù)測(cè)客流量的準(zhǔn)確率。由于時(shí)間和條件所限,本文中使用的數(shù)據(jù)量還不夠大,進(jìn)行試驗(yàn)驗(yàn)證的樣本數(shù)量也有限,實(shí)際統(tǒng)計(jì)客流的方式也可換用更為先進(jìn)的方式。在今后的研究中,還會(huì)進(jìn)一步完善試驗(yàn)條件從而得到更加完善的預(yù)測(cè)方案和實(shí)際效果。

[1]張明光,張鈺,陳曉婧,等.基于Holt-Winter超短期負(fù)荷預(yù)測(cè)的配電網(wǎng)狀態(tài)估計(jì)算法[J].蘭州理工大學(xué)學(xué)報(bào),2016,42(2):92-96.

[2]朱翠濤,王艷歡.基于滑動(dòng)窗口的指數(shù)平均動(dòng)態(tài)電源管理預(yù)測(cè)算法[J].中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,28(04):102-105.

[3]方開泰.有序樣品的一些聚類方法[J].應(yīng)用數(shù)學(xué)學(xué)報(bào),1982,5(1):94-101.

[4]楊智偉,趙騫,趙勝川,金雷,毛羿.基于公交IC卡數(shù)據(jù)信息的客流預(yù)測(cè)方法研究[J].交通標(biāo)準(zhǔn)化,2009(09):115-119.

[5]茆詩松,丁元,周紀(jì)薌.回歸分析及其試驗(yàn)設(shè)計(jì)[M].上海:華東師范大學(xué)出版社,1981.

猜你喜歡
誤差率客流量客流
客流增多
生化檢驗(yàn)全程中質(zhì)量控制管理方式及應(yīng)用意義
健康大視野(2020年1期)2020-03-02 11:33:53
降低評(píng)吸人員單料煙感官評(píng)分誤差率探討
基于嵌入式系統(tǒng)的商場(chǎng)客流量統(tǒng)計(jì)算法
無線傳感器網(wǎng)絡(luò)定位算法在環(huán)境監(jiān)測(cè)中的應(yīng)用研究
電工儀表測(cè)量中容易忽略的幾個(gè)問題
基于自學(xué)習(xí)補(bǔ)償?shù)氖覂?nèi)定位及在客流分析中的應(yīng)用
基于AFC數(shù)據(jù)的城軌站間客流量分布預(yù)測(cè)
人工免疫算法在電梯客流時(shí)段劃分的應(yīng)用
城市軌道交通運(yùn)營客流數(shù)據(jù)分析缺陷及應(yīng)對(duì)
旬阳县| 石渠县| 桃园市| 大化| 新乡县| 顺义区| 新安县| 马尔康县| 江山市| 左贡县| 大连市| 东明县| 安义县| 慈利县| 新化县| 文登市| 临海市| 苍南县| 调兵山市| 清徐县| 巴楚县| 宜章县| 喀喇沁旗| 石首市| 天津市| 云安县| 嘉禾县| 铁岭市| 上思县| 延寿县| 天等县| 昔阳县| 玛沁县| 时尚| 揭东县| 阿坝| 呼玛县| 滕州市| 焦作市| 潼南县| 乡宁县|