溫浩宇,趙靈君,王 帆,于江霞
(1. 西安電子科技大學(xué) 經(jīng)濟(jì)與管理學(xué)院,陜西 西安 710126; 2. 西安大數(shù)據(jù)資產(chǎn)經(jīng)營(yíng)有限責(zé)任公司,陜西 西安 710075)
截止到2019年,西安市機(jī)動(dòng)車(chē)保有量已經(jīng)突破360萬(wàn)輛,并以每年約30萬(wàn)輛的速度持續(xù)增長(zhǎng)。汽車(chē)給生活帶來(lái)便利的同時(shí),也給城市治理造成了困擾,帶來(lái)了如停車(chē)位短缺、道路堵塞及環(huán)境污染等一系列問(wèn)題。停車(chē)誘導(dǎo)是緩解城市“停車(chē)難”問(wèn)題的有效方法之一,通過(guò)交通大數(shù)據(jù)技術(shù),以線(xiàn)上線(xiàn)下并行的方式實(shí)時(shí)發(fā)布區(qū)域內(nèi)的停車(chē)地點(diǎn)、空滿(mǎn)狀態(tài)、路線(xiàn)規(guī)劃等信息,幫助駕駛者快速有效地解決尋泊問(wèn)題,減少了因車(chē)輛尋泊而產(chǎn)生的交通擁堵及環(huán)境污染,提高交通系統(tǒng)運(yùn)行效率。目前停車(chē)誘導(dǎo)系統(tǒng)大多基于停車(chē)場(chǎng)實(shí)時(shí)泊位對(duì)駕駛者在到達(dá)停車(chē)場(chǎng)前進(jìn)行誘導(dǎo),但駕駛者更關(guān)注的是在到達(dá)停車(chē)場(chǎng)后是否還有停車(chē)泊位。因此,有效停車(chē)泊位的短時(shí)預(yù)測(cè)對(duì)停車(chē)誘導(dǎo)系統(tǒng)的調(diào)度、改進(jìn)具有重要意義[1]。
傳統(tǒng)的有效停車(chē)泊位預(yù)測(cè)方法主要包括自回歸移動(dòng)平均模型(ARIMA)、卡爾曼濾波模型、馬爾可夫模型等。隨著停車(chē)數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng),機(jī)器學(xué)習(xí)方法開(kāi)始應(yīng)用于有效停車(chē)泊位的預(yù)測(cè),如神經(jīng)網(wǎng)絡(luò)算法、粒子濾波算法、遺傳算法等。許多學(xué)者對(duì)停車(chē)場(chǎng)泊位預(yù)測(cè)問(wèn)題展開(kāi)了研究,唐克雙等[2]采用ARIMA模型、卡爾曼濾波模型和BP模型對(duì)有效停車(chē)泊位進(jìn)行預(yù)測(cè)研究,發(fā)現(xiàn)ARIMA和BP模型有較高的預(yù)測(cè)精度,但沒(méi)有考慮各停車(chē)場(chǎng)間的相關(guān)性對(duì)預(yù)測(cè)的影響,且ARIMA模型刻畫(huà)復(fù)雜泊位時(shí)間序列非線(xiàn)性特征的能力較弱;季彥婕等[3-4]提出結(jié)合粒子群算法的小波神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,先利用粒子群算法對(duì)小波神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行優(yōu)化選取,再通過(guò)小波神經(jīng)網(wǎng)絡(luò)對(duì)有效停車(chē)泊位進(jìn)行預(yù)測(cè),并通過(guò)實(shí)例分析驗(yàn)證了預(yù)測(cè)模型的有效性,但粒子群算法所需訓(xùn)練時(shí)間較長(zhǎng),預(yù)測(cè)效率有待提升;韓印等[5]提出基于灰色—小波神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,取得了較為理想的預(yù)測(cè)結(jié)果,但由于訓(xùn)練樣本數(shù)量不夠充足,導(dǎo)致預(yù)測(cè)結(jié)果存在一定局限性。
BP(back-propagation)神經(jīng)網(wǎng)絡(luò)由于能夠捕捉非線(xiàn)性關(guān)系,具有良好的自學(xué)習(xí)能力和適應(yīng)性,在時(shí)間序列的預(yù)測(cè)問(wèn)題上有良好效果[6-8]。但是對(duì)于較為復(fù)雜的時(shí)間序列,BP神經(jīng)網(wǎng)絡(luò)無(wú)法體現(xiàn)出時(shí)間序列內(nèi)部的關(guān)聯(lián)性,導(dǎo)致對(duì)時(shí)間序列的特征刻畫(huà)不足,影響預(yù)測(cè)精度。針對(duì)停車(chē)場(chǎng)有效停車(chē)泊位的預(yù)測(cè)問(wèn)題,當(dāng)前時(shí)刻有效停車(chē)泊位的預(yù)測(cè)值不僅和停車(chē)場(chǎng)的歷史泊位數(shù)據(jù)有關(guān),更和之前時(shí)刻停車(chē)場(chǎng)的有效停車(chē)泊位相關(guān),所以建立起不同時(shí)刻泊位數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系尤為重要。
LSTM(long short-term memory)神經(jīng)網(wǎng)絡(luò)不僅能夠有效處理復(fù)雜時(shí)間序列的非線(xiàn)性和隨機(jī)性問(wèn)題,還能記憶時(shí)間序列內(nèi)部的關(guān)聯(lián)性,已廣泛應(yīng)用于動(dòng)態(tài)交通流量預(yù)測(cè)中,并取得了較好的預(yù)測(cè)效果[9-11]。靜態(tài)交通指車(chē)輛出行中的停車(chē)過(guò)程,是動(dòng)態(tài)交通的延續(xù),動(dòng)、靜態(tài)交通共同組成了一個(gè)城市的交通系統(tǒng)[12],但目前LSTM在靜態(tài)交通領(lǐng)域的應(yīng)用較少。
為了更好刻畫(huà)有效停車(chē)泊位時(shí)間序列內(nèi)部的相關(guān)聯(lián)性,筆者擬在分析西安市歷史停車(chē)數(shù)據(jù)的基礎(chǔ)上,建立基于深度學(xué)習(xí)的LSTM有效停車(chē)泊位預(yù)測(cè)模型,以改進(jìn)西安市機(jī)動(dòng)車(chē)停放服務(wù)中心的停車(chē)誘導(dǎo)系統(tǒng)。
基于LSTM的有效停車(chē)泊位預(yù)測(cè)模型主要利用了循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)算法。RNN是深度學(xué)習(xí)領(lǐng)域重要的研究方向之一,是一類(lèi)具有短期記憶能力的神經(jīng)網(wǎng)絡(luò)。RNN的網(wǎng)絡(luò)表現(xiàn)形式中有循環(huán)結(jié)構(gòu),使過(guò)去輸出的信息作為“記憶”被保留下來(lái),應(yīng)用于當(dāng)前的輸出計(jì)算。
基于RNN的有效停車(chē)泊位預(yù)測(cè)模型結(jié)構(gòu)如圖1。在t時(shí)刻下,網(wǎng)絡(luò)的輸入為歷史泊位數(shù)據(jù)xt,輸出為預(yù)測(cè)泊位數(shù)據(jù)ht。st為t時(shí)刻的隱藏層狀態(tài)值,包含網(wǎng)絡(luò)儲(chǔ)存的記憶狀態(tài)信息,使前一時(shí)刻的泊位信息作為記憶保留,并應(yīng)用于當(dāng)前時(shí)刻泊位數(shù)據(jù)的計(jì)算中,從而建立起不同時(shí)刻泊位數(shù)據(jù)間的關(guān)聯(lián)關(guān)系。U是輸入層到隱藏層的權(quán)重矩陣,V是隱藏層到輸出層的權(quán)重矩陣,W是隱藏層上一時(shí)刻狀態(tài)值st-1作為本時(shí)刻輸入的權(quán)重矩陣。
圖1 基于RNN的有效停車(chē)泊位預(yù)測(cè)模型結(jié)構(gòu)Fig. 1 Structure diagram of effective parking space prediction model based on RNN
由于輸入的歷史泊位數(shù)據(jù)與輸出的預(yù)測(cè)泊位數(shù)據(jù)間的時(shí)間間隔較長(zhǎng),容易產(chǎn)生梯度消失問(wèn)題,難以實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè)。為實(shí)現(xiàn)對(duì)長(zhǎng)時(shí)間間隔泊位序列的有效處理,筆者采用RNN的改進(jìn)模型——LSTM模型進(jìn)行預(yù)測(cè)分析,即在RNN結(jié)構(gòu)的基礎(chǔ)上引入LSTM單元,利用不同門(mén)控機(jī)制加強(qiáng)對(duì)記憶信息的控制能力,從而解決梯度消失問(wèn)題。
基于LSTM的有效停車(chē)泊位預(yù)測(cè)模型結(jié)構(gòu)如圖2,一個(gè)LSTM記憶單元包括輸入門(mén)、輸出門(mén)和遺忘門(mén)3種。遺忘門(mén)ft負(fù)責(zé)對(duì)上一時(shí)刻的單元狀態(tài)Ct-1進(jìn)行選擇性?huà)仐?,重置記憶單元。輸入門(mén)it負(fù)責(zé)對(duì)歷史泊位數(shù)據(jù)xt進(jìn)行讀取及過(guò)濾無(wú)用信息。輸出門(mén)ot負(fù)責(zé)對(duì)當(dāng)前時(shí)刻的單元狀態(tài)Ct進(jìn)行選擇過(guò)濾,輸出預(yù)測(cè)泊位數(shù)據(jù)ht。圖2表示的是同一神經(jīng)元A在不同時(shí)刻xt的狀態(tài)信息ht的傳遞,即上一時(shí)刻的輸出會(huì)作為下一時(shí)刻的輸入?yún)⑴c模型的訓(xùn)練。
圖2 基于LSTM的有效停車(chē)泊位預(yù)測(cè)模型結(jié)構(gòu)Fig. 2 Structure diagram of effective parking space prediction model based on LSTM
LSTM記憶單元的遺忘門(mén)、輸入門(mén)、輸出門(mén)對(duì)應(yīng)的運(yùn)算過(guò)程為:
ft=σ(Wf·[ht-1,xt]+bf)
(1)
it=σ(Wi·[ht-1,xt]+bi)
(2)
ot=σ(Wo·[ht-1,xt]+bo)
(3)
式中:W和b分別為各門(mén)的權(quán)重矩陣和偏移量;σ(·)為sigmoid激活函數(shù)。
LSTM記憶單元最終的輸出ht由輸出門(mén)和單元狀態(tài)共同決定:
(4)
(5)
ht=ot·tanh(Ct)
(6)
截至到2019年底,西安市擁有2 000余個(gè)路邊公共停車(chē)場(chǎng),超過(guò)45 000個(gè)公共停車(chē)位。筆者所選數(shù)據(jù)為西安市2017年的2 700萬(wàn)行相關(guān)停車(chē)記錄。
停車(chē)場(chǎng)泊位利用情況受工作、生活等作息習(xí)慣的影響,也受到停車(chē)場(chǎng)位置、泊位類(lèi)型、收費(fèi)標(biāo)準(zhǔn)、時(shí)間、天氣、周邊交通條件等多種因素的干擾[1]。從尋泊的角度看,駕駛者通常考慮的是目標(biāo)區(qū)域內(nèi)的停車(chē)場(chǎng)是否存在有效停車(chē)泊位。從停車(chē)管理的角度,機(jī)動(dòng)車(chē)停放服務(wù)中心通常針對(duì)目標(biāo)區(qū)域內(nèi)的停車(chē)場(chǎng),進(jìn)行有效停車(chē)泊位的預(yù)測(cè)和停車(chē)誘導(dǎo)。在停車(chē)場(chǎng)的選擇方面,筆者的研究對(duì)象不局限于某一停車(chē)場(chǎng),而是把目標(biāo)區(qū)域內(nèi)的停車(chē)場(chǎng)視為一個(gè)整體,這樣可以避免各停車(chē)場(chǎng)間的相關(guān)性對(duì)預(yù)測(cè)結(jié)果造成影響,也在一定程度上減少了周邊交通條件對(duì)預(yù)測(cè)結(jié)果的干擾。
為避免停車(chē)數(shù)據(jù)受特殊停車(chē)活動(dòng)及偶然因素的影響,保證結(jié)論的普適性,選擇5種不同類(lèi)型的停車(chē)區(qū)域進(jìn)行研究,分別為:商圈(小寨商圈)、景點(diǎn)(大雁塔)、醫(yī)院(西京醫(yī)院)、住宅小區(qū)(世家星城)和學(xué)校(高新一中)。提取西安市內(nèi)各停車(chē)場(chǎng)經(jīng)緯度信息,以目標(biāo)區(qū)域的經(jīng)緯度坐標(biāo)為中心,計(jì)算各停車(chē)場(chǎng)與坐標(biāo)中心的直線(xiàn)距離,選取直線(xiàn)距離1 500 m范圍內(nèi)的停車(chē)場(chǎng),得到目標(biāo)區(qū)域內(nèi)停車(chē)場(chǎng)的數(shù)據(jù)信息。各停車(chē)區(qū)域數(shù)據(jù)信息如表1,泊位類(lèi)型均為路邊停車(chē)泊位,收費(fèi)模式為單一收費(fèi)。
表1 各停車(chē)區(qū)域數(shù)據(jù)信息Table 1 Data information of each parking area
對(duì)各停車(chē)區(qū)域在2017年01月01日—12月31日的每日有效停車(chē)泊位數(shù)據(jù)進(jìn)行采集,采集由08:00開(kāi)始至20:00結(jié)束,每10 min采集一次,得到有效數(shù)據(jù)共計(jì)355 d,選擇前250 d數(shù)據(jù)作為訓(xùn)練集用于模型訓(xùn)練,后105 d數(shù)據(jù)作為測(cè)試集用于模型測(cè)試。各停車(chē)區(qū)域日均停車(chē)數(shù)的時(shí)序如圖3。
圖3 各停車(chē)區(qū)域日均停車(chē)數(shù)時(shí)序Fig. 3 Time sequence of average daily number of parking spaces in each parking area
構(gòu)建輸入與輸出的映射關(guān)系:在使用LSTM模型前,需要將有效停車(chē)泊位時(shí)間序列的預(yù)測(cè)問(wèn)題轉(zhuǎn)換為機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)問(wèn)題,即構(gòu)建輸入與輸出的映射關(guān)系。采用滑動(dòng)窗口的方法,利用前n個(gè)時(shí)間間隔的歷史觀測(cè)數(shù)據(jù)區(qū)間(t-n,t-1)來(lái)預(yù)測(cè)下一時(shí)間間隔t時(shí)刻的有效停車(chē)泊位。假設(shè)每天開(kāi)始記錄的時(shí)間為08:00,結(jié)束的時(shí)間為20:00,輸入序列的時(shí)間步長(zhǎng)為5,則時(shí)間間隔輸入序列為{08:00,08:10,08:20,08:30,08:40},{08:10,08:20,08:30,08:40,08:50},…,{19:00,19:10,19:30,19:40,19:50},相應(yīng)的時(shí)間間隔輸出序列為{8:50,9:00,…,19:50,20:00}。
(7)
式中:xi為原始數(shù)據(jù);xmax為最大有效停車(chē)泊位數(shù);xmin最小有效停車(chē)泊位數(shù)。
采用了2種評(píng)價(jià)指標(biāo)作為模型預(yù)測(cè)結(jié)果的評(píng)估標(biāo)準(zhǔn),即均方根誤差(RMSE)和平均絕對(duì)百分誤差(MAPE),2個(gè)指標(biāo)的計(jì)算公式為:
(8)
(9)
LSTM神經(jīng)網(wǎng)絡(luò)輸入層的神經(jīng)元個(gè)數(shù)取決于輸入序列的時(shí)間步長(zhǎng)大小。LSTM神經(jīng)網(wǎng)絡(luò)可以處理任意時(shí)間步長(zhǎng),能刻畫(huà)有效停車(chē)泊位時(shí)間序列較長(zhǎng)時(shí)刻的前后關(guān)聯(lián)關(guān)系。選取輸入時(shí)間步長(zhǎng)為4、5、10、15進(jìn)行預(yù)測(cè),結(jié)果如表2。由表2可知:不同的輸入時(shí)間步長(zhǎng)對(duì)網(wǎng)絡(luò)的預(yù)測(cè)性能影響不大,RMSE在8左右, MAPE在6%左右。輸入時(shí)間步長(zhǎng)為5時(shí),訓(xùn)練時(shí)間最短,故選擇輸入時(shí)間步長(zhǎng)為5。
表2 不同輸入時(shí)間步長(zhǎng)下LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果Table 2 LSTM neural network prediction results with different input time steps
對(duì)于有效停車(chē)泊位時(shí)間序列的預(yù)測(cè)問(wèn)題,單隱含層神經(jīng)網(wǎng)絡(luò)已能夠刻畫(huà)其映射關(guān)系,因此采用單隱含層的神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。隱含層的神經(jīng)元個(gè)數(shù)對(duì)LSTM神經(jīng)網(wǎng)絡(luò)模型性能有重要影響,個(gè)數(shù)過(guò)多容易出現(xiàn)過(guò)擬合問(wèn)題,個(gè)數(shù)過(guò)少則網(wǎng)絡(luò)的學(xué)習(xí)能力不足,無(wú)法實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)。分別選取神經(jīng)元個(gè)數(shù)為50、100、150、200進(jìn)行預(yù)測(cè),結(jié)果如表3。由表3可知:在不同的隱含層神經(jīng)元個(gè)數(shù)下,預(yù)測(cè)結(jié)果有小幅波動(dòng), RMSE在8左右, MAPE在6%左右,隨著神經(jīng)元個(gè)數(shù)的增加,網(wǎng)絡(luò)訓(xùn)練時(shí)間在不斷增加。綜合考慮RMSE、MAPE及網(wǎng)絡(luò)訓(xùn)練時(shí)間,選擇隱含層神經(jīng)元個(gè)數(shù)為150。
表3 不同隱含層神經(jīng)元個(gè)數(shù)下LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果Table 3 LSTM neural network prediction results with different number of hidden layer neurons
輸出層的神經(jīng)元個(gè)數(shù)與預(yù)測(cè)步數(shù)有關(guān),預(yù)測(cè)可分為單步預(yù)測(cè)和多步預(yù)測(cè),筆者主要研究的是單步預(yù)測(cè),因此輸出層神經(jīng)元個(gè)數(shù)為1。
由于數(shù)據(jù)量較大,小批量梯度下降法具有訓(xùn)練速度快、計(jì)算量較小的特點(diǎn),因此選擇小批量梯度下降法對(duì)LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。采用小批量梯度下降法時(shí),需要確定訓(xùn)練子集的大小。分別選取batch-size為5、10、20、50、100進(jìn)行預(yù)測(cè),結(jié)果如表4。由表4可知:當(dāng)batch-size小于20時(shí),不同batch-size下的RMSE在8左右,MAPE在5%左右,隨著batch-size的增加,訓(xùn)練時(shí)間減少。當(dāng)batch-size大于20時(shí),LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)誤差開(kāi)始明顯增加,綜上,選擇batch-size為20。
表4 不同batch-size下LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果Table 4 LSTM neural network prediction results with different batch size
綜上,輸入層的輸入時(shí)間步長(zhǎng)選擇為5;采用單步預(yù)測(cè),輸出層神經(jīng)元個(gè)數(shù)為1;采用單隱含層網(wǎng)絡(luò)結(jié)構(gòu),隱含層神經(jīng)元個(gè)數(shù)為150;采用小批量梯度下降法對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,batch-size為20。另外,選取的迭代次數(shù)為10,優(yōu)化算法為Adam。
采用LSTM模型、BP模型和ARIMA模型3種方法對(duì)各停車(chē)區(qū)域進(jìn)行有效停車(chē)泊位的預(yù)測(cè)和比較,預(yù)測(cè)結(jié)果如表5。由于ARIMA模型擬合非線(xiàn)性趨勢(shì)能力較弱,選用ARIMA模型作為基線(xiàn)模型,作為與其他模型進(jìn)行比較和評(píng)估的參考。
表5 LSTM模型、BP模型和ARIMA模型的預(yù)測(cè)結(jié)果對(duì)比Table 5 Comparison of prediction results between LSTM model, BP model and ARIMA model
由表5可知:在不同停車(chē)區(qū)域的有效停車(chē)泊位預(yù)測(cè)中,基于LSTM模型的有效停車(chē)泊位預(yù)測(cè)均取得了良好的預(yù)測(cè)效果,不同停車(chē)區(qū)域LSTM模型預(yù)測(cè)結(jié)果的MAPE均在10%以?xún)?nèi),精度在90%以上,說(shuō)明LSTM模型在有效停車(chē)泊位預(yù)測(cè)問(wèn)題上可靠且有效。在不同停車(chē)區(qū)域的泊位預(yù)測(cè)中,LSTM模型預(yù)測(cè)誤差均小于BP模型,說(shuō)明LSTM模型比BP模型更有效。
LSTM模型、BP模型和ARIMA模型的預(yù)測(cè)值和真實(shí)值的對(duì)比如圖4(以小寨商圈2017年10月01日—10月07日為例)。由圖4可知:LSTM模型表現(xiàn)出了和真實(shí)值相似的變化趨勢(shì),BP模型次之,ARIMA模型存在較大誤差,說(shuō)明LSTM模型能較好地刻畫(huà)有效停車(chē)泊位時(shí)間序列內(nèi)部的相關(guān)聯(lián)性,預(yù)測(cè)精度更高。
圖4 LSTM模型、BP模型和ARIMA模型的預(yù)測(cè)值和真實(shí)值對(duì)比Fig. 4 Comparison of predicted and true values of LSTM model, BP model and ARIMA model
筆者綜合考慮了有效停車(chē)泊位預(yù)測(cè)的時(shí)空特性。一方面分析了傳統(tǒng)有效停車(chē)泊位預(yù)測(cè)方法的不足,提出基于LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,該模型由于其“記憶單元”的獨(dú)特結(jié)構(gòu),可產(chǎn)生對(duì)過(guò)去泊位信息的記憶,充分利用了泊位序列前后時(shí)刻的關(guān)聯(lián)關(guān)系;另一方面選取目標(biāo)區(qū)域內(nèi)多個(gè)鄰近停車(chē)場(chǎng)的歷史停車(chē)數(shù)據(jù)組成訓(xùn)練樣本,既避免了停車(chē)場(chǎng)之間的相關(guān)性對(duì)預(yù)測(cè)結(jié)果造成影響,也滿(mǎn)足了神經(jīng)網(wǎng)絡(luò)對(duì)海量數(shù)據(jù)的訓(xùn)練需求。運(yùn)算結(jié)果表明:對(duì)于不同類(lèi)型停車(chē)區(qū)域的有效停車(chē)泊位預(yù)測(cè),考慮時(shí)空特性的LSTM預(yù)測(cè)模型預(yù)測(cè)結(jié)果與真實(shí)值一致性較高,預(yù)測(cè)精度在90%以上且均高于BP預(yù)測(cè)模型,說(shuō)明LSTM模型是實(shí)現(xiàn)有效停車(chē)泊位預(yù)測(cè)的有效方法。下一步,可加入時(shí)間因素、天氣條件等相關(guān)參數(shù)進(jìn)行有效停車(chē)泊位的預(yù)測(cè),進(jìn)一步提高預(yù)測(cè)的準(zhǔn)確性。