余萍
【摘要】? ? ?隨著無(wú)線網(wǎng)絡(luò)的大量普及,人們生活中產(chǎn)生大量的無(wú)線網(wǎng)絡(luò)信令數(shù)據(jù),找出其中的共同規(guī)律,研究人員可以借此規(guī)律來(lái)建立城市交通模型。其中,組歸一化網(wǎng)格循環(huán)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)在構(gòu)建模型中起主導(dǎo)作用。組歸一化處理能提升模型的數(shù)據(jù)源規(guī)模和收斂速度,簡(jiǎn)化內(nèi)部程序循環(huán)的計(jì)算過(guò)程,解決傳統(tǒng)模型計(jì)算量大的問(wèn)題,通過(guò)記憶單元對(duì)所需數(shù)據(jù)進(jìn)行存儲(chǔ)和更新。針對(duì)噪聲數(shù)據(jù),對(duì)數(shù)據(jù)集進(jìn)行網(wǎng)格化和篩選,以規(guī)避噪聲數(shù)據(jù)的影響。卷積神經(jīng)網(wǎng)絡(luò)具有更好的用戶分類性能,提高了識(shí)別率。
【關(guān)鍵詞】? ? 無(wú)線網(wǎng)絡(luò)信令? ? 組歸一化? ? 卷積神經(jīng)網(wǎng)絡(luò)
引言:
在大力的發(fā)展無(wú)線網(wǎng)絡(luò)的同時(shí),城市交通網(wǎng)絡(luò)的流量也隨著增加。掌握實(shí)時(shí)、準(zhǔn)確的交通流量對(duì)于城市管理與人們出行服務(wù)尤為重要。傳統(tǒng)居民的出行問(wèn)卷調(diào)查容易受到受訪者主觀意識(shí)影響,也存在支出高、回報(bào)率低、工作量大、處理時(shí)間長(zhǎng)等問(wèn)題。移動(dòng)信令數(shù)據(jù)正好解決了這些問(wèn)題。本文研究移動(dòng)信令在城市交通模型構(gòu)建中的價(jià)值。
一、移動(dòng)信令的特點(diǎn)與價(jià)值
1.1移動(dòng)信令的特點(diǎn)
城市的土地資源有限,城市交通堵塞問(wèn)題日趨嚴(yán)重,而信息技術(shù)應(yīng)用于交通是大勢(shì)所趨的。為了改善現(xiàn)狀,通過(guò)移動(dòng)信令建立城市交通模型是最合適的方法,而移動(dòng)信令采集方便、實(shí)時(shí)、覆蓋范圍廣、目標(biāo)明確。最開(kāi)始采集的移動(dòng)信令數(shù)據(jù)冗余,通過(guò)對(duì)移動(dòng)信令數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,將重復(fù)、有缺失和不符合規(guī)則的數(shù)據(jù)進(jìn)行刪除和修改,最后才能獲得有效準(zhǔn)確的移動(dòng)信令。
數(shù)據(jù)網(wǎng)絡(luò)的不斷普及,人們能迅速的統(tǒng)計(jì)移動(dòng)信令,并通過(guò)移動(dòng)信令及時(shí)的掌握居民的交通動(dòng)態(tài),實(shí)時(shí)了解城市當(dāng)前交通狀態(tài)。國(guó)內(nèi)聯(lián)通、移動(dòng)和電信運(yùn)營(yíng)商的無(wú)線網(wǎng)絡(luò)信令幾乎形成了全國(guó)覆蓋,移動(dòng)信令可以準(zhǔn)確記錄每個(gè)用戶的出行行為軌跡,系統(tǒng)可以根據(jù)以往的出行軌跡和最新的交通動(dòng)態(tài)為出行者推薦最佳路線。
1.2移動(dòng)信令的價(jià)值體現(xiàn)
通過(guò)對(duì)用戶的移動(dòng)信令數(shù)據(jù)的進(jìn)一步分析,可以得到人口密度、人口流動(dòng)變化等有效信息。分析的結(jié)果對(duì)于人們的出行軌跡、擁堵預(yù)測(cè)和交通規(guī)劃提供了可靠的參考。根據(jù)經(jīng)過(guò)處理后的移動(dòng)信令,通過(guò)熱力圖和散點(diǎn)圖了解人們的出行頻率,實(shí)時(shí)了解各地的人流量,并獲得城市人群熱力分布和當(dāng)前道路的通行情況,如該區(qū)域的擁堵情況、高峰時(shí)段和異常聚集。然后,根據(jù)之前獲得到的人口密度信息和每日人流量密度變化,剔除特殊路況等信息,為出行者提出最優(yōu)的路線。通過(guò)數(shù)據(jù)的變化,可以清楚的知道這個(gè)地方每天的人流量高峰點(diǎn),并對(duì)用戶步行或者使用交通工具出行進(jìn)行判斷,對(duì)用戶的出行方式進(jìn)行標(biāo)簽化。交通出行方式的識(shí)別對(duì)城市的交通規(guī)劃、智能交通系統(tǒng)的運(yùn)行、精確的推薦和各地的服務(wù)等是至關(guān)重要的。而對(duì)于人流量高峰時(shí)期,也可以做出更好的道路行程安排。同時(shí),以人流量變化模型作為理論依據(jù),結(jié)合人群密度和時(shí)間的關(guān)系,可以減少踩踏和擁擠事故。
二、移動(dòng)信令在城市交通模型構(gòu)建中的價(jià)值實(shí)現(xiàn)思路
2.1理論依據(jù)
無(wú)線信令數(shù)據(jù)的收集不受被調(diào)查者的人為影響,能夠更加精準(zhǔn)地、完整地統(tǒng)計(jì)被調(diào)查者的出行信息。同時(shí),它還具有統(tǒng)計(jì)速度快、信息準(zhǔn)確性高、數(shù)據(jù)量大等優(yōu)點(diǎn),成為獲取人們出行軌跡信息的有效新途徑。目前,國(guó)內(nèi)外有大量基于移動(dòng)信令行程鏈提取和行程模式分析的研究成果,但在移動(dòng)信令的數(shù)據(jù)清洗和現(xiàn)實(shí)生活中利用方面的研究成果較少。近年來(lái),國(guó)內(nèi)外學(xué)者為預(yù)測(cè)交通流量的短期狀況,提出了關(guān)于時(shí)間序列的預(yù)測(cè)方法,但時(shí)序數(shù)據(jù)要求平穩(wěn)或差分后平穩(wěn)。如果是非平穩(wěn)數(shù)據(jù),則不能發(fā)現(xiàn)它的規(guī)律,本質(zhì)上,這種方法只能獲取其數(shù)據(jù)的線性關(guān)系。這種時(shí)序預(yù)測(cè)技術(shù)可以處理正常情況下的數(shù)據(jù)。
然而,在現(xiàn)實(shí)中,時(shí)間序列數(shù)據(jù)通常是沒(méi)有規(guī)律的,容易受到外部因素的影響,使交通流量模型預(yù)測(cè)的精確度受到了極大挑戰(zhàn)。傳統(tǒng)獲取用戶流量信息的方法是采用問(wèn)卷調(diào)查或電話采訪的方式,這種方法通常存在耗時(shí)昂貴、信息不完整等問(wèn)題。這時(shí)就需要一種低成本和采集信息完整的方法,比如移動(dòng)信號(hào)數(shù)據(jù)。為了收集不同地區(qū)的移動(dòng)信令數(shù)據(jù),中國(guó)在各地建立了大量的網(wǎng)絡(luò)基站。隨著基站設(shè)備的更新?lián)Q代,無(wú)線網(wǎng)絡(luò)的全球覆蓋,基站能夠迅速收集到各地用戶的信令數(shù)據(jù)信息。因此,通過(guò)移動(dòng)信令建立城市交通模型尤為重要和方便。
2.2模型構(gòu)建
組歸一化網(wǎng)格循環(huán)網(wǎng)絡(luò)模型結(jié)合了無(wú)線信令交通流量數(shù)據(jù)詳細(xì)特性,并借鑒傳統(tǒng)機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法的優(yōu)缺點(diǎn),網(wǎng)格化操作更精確地找出并標(biāo)出模型的關(guān)鍵信息,降低了信息冗余帶來(lái)的損失。模型的具體構(gòu)建流程分為 5個(gè)部分:
1.收集所研究的交通流量數(shù)據(jù)。
2.對(duì)數(shù)據(jù)進(jìn)行清洗,如填充缺失值、處理異常值、刪除冗余數(shù)據(jù)等。
3.將清洗后的交通流量數(shù)據(jù)進(jìn)行分組,并對(duì)分組的數(shù)據(jù)編碼和組歸一化操作。
4.將編碼處理后的數(shù)據(jù)分成訓(xùn)練樣本和測(cè)試樣本。
5.將訓(xùn)練樣本和測(cè)試樣本分別帶入循環(huán)網(wǎng)絡(luò)模型(RN)和網(wǎng)格循環(huán)網(wǎng)絡(luò)模型(GRN)。
交通流量的信令數(shù)據(jù)雖然經(jīng)過(guò)了數(shù)據(jù)預(yù)處理,但依然會(huì)存在無(wú)效的數(shù)據(jù)。而卷積神經(jīng)網(wǎng)絡(luò)可以通過(guò)局部連接來(lái)處理這類數(shù)據(jù)。卷積神經(jīng)網(wǎng)絡(luò)的處理過(guò)程分為兩個(gè)過(guò)程:一個(gè)過(guò)程是無(wú)線信令由低層次向高層次傳播的過(guò)程;另一個(gè)過(guò)程是當(dāng)前輸出的結(jié)果不符合預(yù)期時(shí),將誤差從高層次傳播到低層次的過(guò)程,步驟為:
1.行權(quán)值的初始化。
2.數(shù)據(jù)經(jīng)過(guò)卷積層、池化層、全連接層的向前傳播得到結(jié)果。
3.結(jié)果與目標(biāo)值之間的誤差。
4.當(dāng)誤差大于我們的目標(biāo)值時(shí),將誤差傳回?cái)?shù)據(jù)庫(kù)中,依次求得全連接層,池化層層,卷積層的誤差。這些誤差可以理解為對(duì)于數(shù)據(jù)庫(kù)的總誤差,當(dāng)誤差等于或小于我們的目標(biāo)值時(shí),結(jié)束數(shù)據(jù)運(yùn)行。
5.誤差進(jìn)行權(quán)值更新。模型運(yùn)行原理如圖1所示。
2.3識(shí)別系統(tǒng)
卷積神經(jīng)網(wǎng)絡(luò)是一種用于圖像整理歸類的神經(jīng)網(wǎng)絡(luò),它可以對(duì)輸入圖像的一部分進(jìn)行卷積運(yùn)算。卷積神經(jīng)網(wǎng)絡(luò)的主干由若干個(gè)卷積層、激活層、池化層以及Dropout組成。卷積層的作用是使數(shù)據(jù)可以在特征圖上滑動(dòng),并將一維特征圖轉(zhuǎn)化為三維特征圖輸出;到卷積層輸出之后,使用 Re LU 激活函數(shù);最后,卷積層輸出的特征圖通過(guò)池化層進(jìn)行壓縮。卷積神經(jīng)網(wǎng)絡(luò)的顯著特點(diǎn)是可以接受高度、寬度和深度三個(gè)維度的輸入。先將圖片輸入,經(jīng)過(guò)卷積層,會(huì)產(chǎn)生很多的特征圖,是輸入圖片經(jīng)過(guò)特征探測(cè)器生成的圖片,在此基礎(chǔ)上可以加上線性激活層,增加非線性性,之后,通過(guò)池化層處理壓縮,得到維度更小的特征圖。最后,通過(guò)全連接堆疊成卷積神經(jīng)網(wǎng)絡(luò)模型。卷積神經(jīng)網(wǎng)絡(luò)模型和其他模型相比,有更大的優(yōu)勢(shì),它在數(shù)據(jù)準(zhǔn)確率和數(shù)據(jù)回收率兩個(gè)方面上也同樣具有優(yōu)勢(shì)。卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)準(zhǔn)確性遠(yuǎn)遠(yuǎn)大于其他模型。在樣本數(shù)量相對(duì)均衡的前提下,準(zhǔn)確率和回收率都能很好地展示出卷積神經(jīng)網(wǎng)絡(luò)模型在交通出行方式識(shí)別方面的性能。
2.4性能優(yōu)化
通常,組歸一化網(wǎng)格循環(huán)網(wǎng)絡(luò)會(huì)將數(shù)據(jù)分成小批量進(jìn)行處理,這樣往往導(dǎo)致了迭代次數(shù)的增加,而得不到最優(yōu)解。因此,選擇正確的優(yōu)化器、正則化和訓(xùn)練周期能得到準(zhǔn)確的結(jié)果。優(yōu)化器的合理選用對(duì)交通流量預(yù)測(cè)模型至關(guān)重要,Momentum 優(yōu)化器、RMSprop 優(yōu)化器和Adam 優(yōu)化器等是比較受歡迎的優(yōu)化器。Momentum 優(yōu)化器對(duì)梯度運(yùn)動(dòng)指數(shù)的加權(quán)平均可以減小梯度擺動(dòng)幅度;RMSprop 優(yōu)化器可以通過(guò)求相似梯度的平均值來(lái)自動(dòng)地調(diào)整學(xué)習(xí)率;Adam 優(yōu)化器每次迭代時(shí)參數(shù)的學(xué)習(xí)率固定在一定范圍內(nèi)。卷積神經(jīng)網(wǎng)絡(luò)的性能優(yōu)化也可以選取合適的優(yōu)化器、正則化和迭代周期。正則化的選擇也同樣影響著交通流量預(yù)測(cè)模型的性能。L1 正則化,在城市交通模型的損失函數(shù)中加各入?yún)?shù)的絕對(duì)值;L2 正則化,在城市交通模型中的損失函數(shù)中加各入個(gè)參數(shù)平方和的開(kāi)方;Dropout 正則化隨機(jī)地將某層的一些輸出特征設(shè)置為 0。其中 Dropout 正則化主要通過(guò)其數(shù)據(jù)的結(jié)果比率影響組歸一化網(wǎng)格循環(huán)網(wǎng)絡(luò)的交通流量預(yù)測(cè)模型。
三、注意問(wèn)題
無(wú)線網(wǎng)絡(luò)全世界的大量普及,造成移動(dòng)信令的收集繁雜,組歸一化網(wǎng)格循環(huán)和卷積神經(jīng)網(wǎng)絡(luò)所需硬件的精密,數(shù)據(jù)預(yù)處理所需要的程序代碼復(fù)雜。數(shù)據(jù)的清洗并不能達(dá)到要求,同時(shí),關(guān)于交通方式和國(guó)家法律的改變,不能及時(shí)更新造成數(shù)據(jù)錯(cuò)誤。移動(dòng)信令建立的城市交通模型并不具有很強(qiáng)的保密性和嚴(yán)謹(jǐn)性,無(wú)線網(wǎng)絡(luò)的癱瘓很容易導(dǎo)致城市交通擁堵,從而,造成一系列的損失。組歸一化網(wǎng)格循環(huán)和卷積神經(jīng)網(wǎng)絡(luò)所構(gòu)建的模型并不能適用所有地區(qū),無(wú)法處理一些人為造成的影響。同時(shí)也不能對(duì)小范圍進(jìn)行數(shù)據(jù)采集,構(gòu)建交通模型。
四、結(jié)束語(yǔ)
無(wú)線網(wǎng)絡(luò)的大量普及是一種常態(tài),將無(wú)線網(wǎng)絡(luò)中的移動(dòng)信令應(yīng)用到城市交通模型構(gòu)建,以便實(shí)時(shí)了解城市交通問(wèn)題,及時(shí)應(yīng)對(duì)交通擁堵帶來(lái)的麻煩,記錄人們出行方式與路線,提供最佳的出行路線。然而數(shù)據(jù)的采集需要精密的儀器和設(shè)備,需要加強(qiáng)技術(shù)人員的培養(yǎng),設(shè)備和國(guó)家的支持,同時(shí)還要根據(jù)不同的地區(qū),采用不同的模型構(gòu)建方法。
參? 考? 文? 獻(xiàn)
[1] 邱莉萍,鄧拓.基于手機(jī)信令的人群密度分析與交通規(guī)劃研究.
[2] 暴建民,翟英明.蔣研基于云平臺(tái)的電動(dòng)汽車充電設(shè)備管理系統(tǒng)201911239706.6,2019.12.06.
[3] 暴建民,翟英明,丁飛.基于組歸一化和網(wǎng)格化協(xié)同的交通流預(yù)測(cè)方法202010011994.2,2020.01.06.