国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于空間滯后模型的出租車需求影響因素分析

2019-04-30 06:30:18張自荷
關(guān)鍵詞:因變量高峰出租車

張自荷 王 振 吳 瑞

(長安大學(xué)公路學(xué)院1) 西安 710064) (北京交通發(fā)展研究院2) 北京 100161)

0 引 言

出租車是城市公共交通系統(tǒng)的重要組成部分[1].現(xiàn)階段,出租車行業(yè)在空間區(qū)域面臨需求與供給不匹配的問題[2],因此,對不同城市區(qū)域的出租車需求量進行精準(zhǔn)預(yù)測對提高出租車服務(wù)水具有十分重要的意義.需求量預(yù)測的常用方法有原單位法、增長率法、聚類分析法、函數(shù)法和回歸分析法.當(dāng)自變量和因變量等相關(guān)數(shù)據(jù)可以準(zhǔn)確獲取時,回歸分析可以很好得對未來出行量進行預(yù)測[3].出租車GPS數(shù)據(jù)作為地理空間活動記錄數(shù)據(jù),包含了車輛的設(shè)備狀況、運營狀態(tài)、地理位置信息、瞬時速度以及運行方位角等信息[4],現(xiàn)已被用來進行交通狀態(tài)的估計[5]、交通行為分析[6]、出行OD預(yù)測[7]和出行時間預(yù)測[8],但目前較少研究關(guān)注利用出租車GPS數(shù)據(jù)研究高峰時期的出租車需求,且建模過程中未考慮需求在空間上的依賴關(guān)系和聚集現(xiàn)象.

綜上,文中基于出租車GPS數(shù)據(jù),通過提取上車點獲得基于交通小區(qū)的出租車需求,構(gòu)建空間回歸模型,研究高峰時期出租車需求的影響因素并對結(jié)果進行討論,為城市公共交通系統(tǒng)優(yōu)化、高峰時期出租車需求量預(yù)測等提供方法支撐和研究途徑.

1 數(shù)據(jù)預(yù)處理

1.1 GPS數(shù)據(jù)預(yù)準(zhǔn)備

出租車GPS數(shù)據(jù)由車載終端生成,通常為每隔15~60 s采集一次數(shù)據(jù)信息并采用及時通信方式上傳至數(shù)據(jù)中心的數(shù)據(jù)庫中.本文所采用數(shù)據(jù)為西安市2017年4月17日繞城高速范圍內(nèi)的出租車GPS數(shù)據(jù),所選日為星期一,天氣晴朗,無重大節(jié)假日,因而保證了數(shù)據(jù)所具有的代表性.數(shù)據(jù)包含信息中與本研究相關(guān)的包括車牌號、經(jīng)度、緯度、GPS時間、車輛載客狀態(tài),其形式見表1.

表1 與本研究相關(guān)的出租車GPS數(shù)據(jù)結(jié)構(gòu)

出租車交通行為由多個在時空上連續(xù)的GPS軌跡點組成,構(gòu)成車輛的行駛軌跡,并可反應(yīng)車輛上、下客活動信息[9].本文研究的是出租車需求的影響因素,因此,首先需要從一系列軌跡點中提取上車點的經(jīng)緯度信息以確定出租車上客點在空間上的數(shù)量與分布.以西安市出租車GPS為例,具體提取步驟如下:①數(shù)據(jù)清洗,刪除狀態(tài)位無效,存在數(shù)據(jù)錯誤或缺失,車輛狀態(tài)值為0,1,2,3,6,7的記錄;②數(shù)據(jù)排序,按車牌號聚類并按時間升序排列;③上下車點提取,將車牌號相同的由持續(xù)的車輛狀態(tài)值為4轉(zhuǎn)變到狀態(tài)值為5和緊鄰的持續(xù)狀態(tài)值為5轉(zhuǎn)變到狀態(tài)值為4的兩點提取出來,將此兩點認(rèn)為是一次完整出行的上、下客點.

通過上述提取步驟,獲得繞城高速區(qū)域內(nèi)11 634輛營運出租車的356 972條行程數(shù)據(jù),其全天上客點隨時間的分布見圖1,其中早、晚高峰時段(參照相關(guān)研究,本文早高峰時段確定為07:00—09:00,晚高峰確定為18:00—20:00出行量分別為32 420次和35 162次,占比為9.1%和9.9%,全天平均小時出行量為14 874次.考慮現(xiàn)有研究未涉及到高峰時段出租車出行量影響因素且晚高峰出行量較高,故選擇晚高峰時段作為研究對象.

圖1 繞城高速范圍內(nèi)出租車出行量的時間分布

1.2 地圖匹配

地圖匹配是指在ArcGIS軟件中通過一致坐標(biāo)系下的空間位置關(guān)系將出租車上客點連接至路網(wǎng)線地理文件和交通小區(qū)面地理文件,其中,交通小區(qū)是用來預(yù)測出行產(chǎn)生和吸引的最基本的分析單元,通常包含人口數(shù)量、工作崗位數(shù)量、機動車擁有量等屬性信息,本研究中將西安市繞城高速范圍內(nèi)區(qū)域劃分為601個交通小區(qū),每個小區(qū)內(nèi)包含2011年西安市綜合交通調(diào)查獲取的常駐人口、賓館流動人口、崗位數(shù)、小汽車擁有量等屬性數(shù)據(jù).通過統(tǒng)計晚高峰時段落在各交通小區(qū)內(nèi)部的上客點數(shù)量獲得各小區(qū)的晚高峰出租車需求[10],見圖2.

圖2 交通小區(qū)晚高峰出租車需求空間分布

2 出租車需求影響因素分析

2.1 出租車需求相關(guān)影響因素分析

出租車需求預(yù)測可分為短期預(yù)測和中長期預(yù)測[11].中長期預(yù)測用于出租車宏觀管理和規(guī)劃,短期預(yù)測為出租車實時調(diào)度提供依據(jù),本文主要研究的是出租車中長期出行預(yù)測.綜合已有文獻,影響出租車中長期需求的影響因素包括,總?cè)丝跀?shù)量、就業(yè)人口數(shù)量、小汽車擁有量、性別占比等區(qū)域人口屬性;通勤出行時間、出行目的等出行特征[12];商業(yè)區(qū)面積、居住區(qū)面積等土地利用特征[13];停車場供給,公共車供給,地鐵供給,自行車道密度等其他交通方式供給特征等因素.

2.2 地鐵可達性指標(biāo)構(gòu)建

公交車供給和地鐵供給這兩個影響因素,通常通過可達性進行量化,即對于某個目的點來講,乘坐公交車的便利程度.可達性由可達性指標(biāo)表征,通常與到達該點車輛頻次、車站距離目的地的步行時間等影響因子有關(guān),然而,由于很難獲得整個城市的具體公交車頻次信息,現(xiàn)有研究多只計算特定區(qū)域內(nèi)公交可達性指標(biāo).考慮到數(shù)據(jù)可得性,本文僅計算各交通小區(qū)的地鐵可達性指標(biāo)(metro access time, MAT),借鑒文獻[3]對公交可達性指標(biāo)的定義方法,本文將其定義為每個交通小區(qū)的質(zhì)心到距離最近地鐵站的步行時間加上地鐵等待時間,其中,步行速度取4 km/h,等待時間按發(fā)車間隔時間的1/2計算,為

(1)

式中:f為每小時的地鐵發(fā)車頻次;D為基于拓?fù)渎肪W(wǎng)的交通小區(qū)質(zhì)心到最近地鐵站的步行距離;Vw為步行速度.地鐵可達性越高,地鐵可達性指標(biāo)(MAT)越小.

2.3 數(shù)據(jù)準(zhǔn)備與變量定義

選用的潛在自變量及變量解釋見表2.受城市布局和功能結(jié)構(gòu)影響,出租車需求在某些交通小區(qū)較高,而在某些交通小區(qū)較低,因此,研究區(qū)域內(nèi)基于交通小區(qū)的晚高峰出租車需求直方圖呈現(xiàn)偏態(tài)分布,見圖3.為滿足后續(xù)建立線性回歸模型的因變量正態(tài)分布假設(shè)前提,將因變量進行對數(shù)轉(zhuǎn)換,結(jié)果見圖4.為保持與因變量的一致性以更好表征兩者間的線性關(guān)系,各潛在自變量也做相應(yīng)對數(shù)變換.

表2 潛在自變量和潛在因變量的定義

圖3 晚高峰出租車需求直方圖

圖4 對數(shù)變換后晚高峰出租車需求直方圖

3 考慮空間自相關(guān)的出租車影響因素建模

3.1 全局空間自相關(guān)

通過晚高峰出租車上車點可視化結(jié)果,可以看出某交通小區(qū)晚高峰出租車需求與鄰近交通小區(qū)晚高峰出租車需求相關(guān),即以交通小區(qū)為單位的出租車需求具有空間相關(guān)性,若基于統(tǒng)計學(xué)和傳統(tǒng)計量經(jīng)濟學(xué)理論對此類存在空間相關(guān)性的樣本進行建模,將會導(dǎo)致較大的方差估計、較低的假設(shè)檢驗顯著水平和較低的擬合度,因此,需要對此類數(shù)據(jù)進行空間相關(guān)性檢驗.通過構(gòu)建全局Moran’s I指標(biāo)檢驗出租車需求在統(tǒng)計學(xué)上是否具有空間集聚特征,計算式為

(2)

(3)

根據(jù)各交通小區(qū)的空間關(guān)系構(gòu)建空間權(quán)重矩陣,利用Geoda軟件計算得到晚高峰各交通小區(qū)出租車需求的全局Moran’sI指數(shù)為0.440,檢驗的Z值為20.025,表明在1%的顯著水平上通過了檢驗,即晚高峰期間出租車需求在空間上是正相關(guān)的.

3.2 空間滯后模型建立

由于晚高峰出租車需求在研究區(qū)域是空間正相關(guān)的,因此對其建模時,應(yīng)充分考慮因變量在空間上不獨立這一前提,將地區(qū)間的相互關(guān)系引入模型,采用基于空間權(quán)重矩陣對傳統(tǒng)線性線性回歸模型進行改進的空間計量模型進行模型構(gòu)建.空間計量經(jīng)濟模型根據(jù)經(jīng)濟活動的空間相依性和回歸模型中的誤差項的相依性特征基本分為兩類模型:空間滯后模型和空間誤差模型,而這兩類模型的構(gòu)建的都是以相應(yīng)的線性回歸模型為基礎(chǔ)的,因此,本文首先對各影響因素變量與因變量之間的相關(guān)性和各影響因素之間的相關(guān)性進行檢驗,篩選出進入回歸模型的潛在自變量.其次,建立普通線性回歸模型并構(gòu)建判別指標(biāo)選出適合的空間計量模型.最后,建立空間計量模型,利用最大似然法對系數(shù)進行估計,將回歸結(jié)果與普通最小二乘法的回歸結(jié)果進行比較,分析變量的系數(shù)變化及擬合度差異.

3.2.1潛在自變量的篩選

由于潛在自變量較多,為避免無效變量進入模型,先對各潛在自變量進行初步篩選,從而選出進入回歸模型的自變量.考慮到本研究中各自變量均為數(shù)值型變量,采用皮爾遜相關(guān)系數(shù)矩陣計算出各潛在自變量與因變量之間的相關(guān)系數(shù),通常,統(tǒng)計顯著情況下相關(guān)系數(shù)絕對值大于0.5被作為潛在自變量進入模型的依據(jù),為避免遺漏晚高峰出租車需求的有效影響因素,本文采用在0.01顯著水平下相關(guān)系數(shù)的絕對值為0.2作為潛在自變量進入模型的臨界值.為避免自變量之間的共線性導(dǎo)致的回歸模型系數(shù)有偏估計,本文在上步篩選基礎(chǔ)上計算了擬進入模型變量兩兩之間的相關(guān)性系數(shù),相關(guān)性系數(shù)大于0.7的變量中至多有一個能進入模型.

根據(jù)上述原則構(gòu)建皮爾遜相關(guān)系數(shù)矩陣對潛在自變量進行篩選,結(jié)果表明,賓館流動人口、公共停車場數(shù)量、公交車站牌數(shù)和地鐵可達性與因變量在0.01顯著性水平下的相關(guān)性系數(shù)分別為0.204,-0.239,0.525和0.219,且四個潛在變量兩兩之間的相關(guān)系數(shù)均小于0.7,因此,選擇以上四個變量作為進入普通線性回歸模型的變量.

3.2.2空間計量模型的建立

1) 普通線性回歸模型的建立 空間計量模型是以普通線性回歸模型為基礎(chǔ)建立的,因此,首先構(gòu)建如下普通線性回歸模型:

(4)

式中:Yi為各交通小區(qū)中晚高峰出租車需求;Xi為第i個解釋變量;n為自變量的個數(shù),在初始模型中n= 4;a0為模型的截距;ai為對應(yīng)與Xi的系數(shù).采用最小二乘法對變量系數(shù)進行估計,即當(dāng)觀測變量與預(yù)測變量間的殘差平方和最小時,所得系數(shù)為系數(shù)估計值.此外,為獲得解釋度更高的模型,采用逐步回歸的方法對初步篩選出的變量進行二次篩選,其優(yōu)點在于每向模型中引入一個變量,均要考察原來在模型中的自變量是否統(tǒng)計顯著,若否,則將變量剔除.

模型的回歸結(jié)果見表3,模型的擬合優(yōu)度為0.468,且各變量在0.001的統(tǒng)計水平下顯著.變量公共停車場數(shù)量和變量公交車站牌數(shù)的系數(shù)分別為0.544和0.219,表明這兩個變量對出租車需求的影響均為正向的.變量地鐵可達性指標(biāo)的系數(shù)為-0.218,結(jié)合前述地鐵可達性指標(biāo)算法可知,該指標(biāo)越小,地鐵可達性越高,因此,地鐵可達性越高的地方相應(yīng)的出租車需求也越高.從模型的總體結(jié)果來看,與停車場、地鐵和公交車服務(wù)供給越多的地方,出租車需求越少的預(yù)期相反,其他機動車方式越便捷的區(qū)域,出租車需求也相應(yīng)越高,這可能與兩個原因相關(guān):①公共停車場、地鐵和公交車服務(wù)供給較多的區(qū)域,通常出行需求也較旺盛;②出租車因其靈活的出行方式,可作為其他交通方式的接駁以完成基于“門到門”的出行過程.

由于各交通小區(qū)的出租車需求為空間變量,為檢驗普通線性回歸模型的殘差中是否存在未解釋成分,對其殘差進行空間自相關(guān)檢驗,結(jié)果表明,Moran’sI統(tǒng)計值為0.360,相應(yīng)的Z得分為16.354,即在0.01顯著性水平下,拒絕殘差不具有空間自相關(guān)性的原假設(shè).這說明普通線性回歸模型對因變量的未解釋部分是未考慮因變量之間的空間相對關(guān)系造成的,因此,需要建立空間模型來解釋出租車晚高峰需求.

2) 空間模型選擇 空間滯后模型和空間誤差模型作為兩種基礎(chǔ)的空間計量模型,充分考慮了變量之間的空間交互效應(yīng),其區(qū)別體現(xiàn)在空間滯后因子的構(gòu)成上.在空間滯后模型(spatial lag model,SLM)中,空間滯后項由空間權(quán)重矩陣與因變量乘積構(gòu)成,作為模型右側(cè)的解釋變量之一;

表3 模型估計結(jié)果

在空間誤差模型(spatial error model,SEM)中,空間滯后項由空間權(quán)重矩陣與誤差項乘積構(gòu)成,作為誤差項的解釋變量,但不作為因變量的解釋變量.構(gòu)建兩個拉格朗日乘數(shù)(Lagrange multiplier)形式LMERR、LMLAG及其穩(wěn)健的R-LMERR、R-LMLAG來實現(xiàn)空間滯后模型與空間誤差模型的選擇,Anselin 等[14]給出的判別準(zhǔn)則:若在空間效應(yīng)的檢驗中發(fā)現(xiàn)當(dāng)LMLAG較之LMERR在統(tǒng)計上更加顯著,則選擇空間滯后模型較為合適;相反,若LMREE比LMLAG在統(tǒng)計上更加顯著,且R-LMERR顯著而R-LMLAG不顯著,則選擇空間誤差模型較為合適.表4為基于普通線性回歸模型的空間效應(yīng)檢驗結(jié)果,由兩類拉格朗日乘數(shù)檢驗可以看出,LMLAG較LMERR在統(tǒng)計上顯著,且R-LMLAG在0.01水平下顯著而R-LMERR不顯著,因此空間滯后模型更適合擬合出租車晚高峰需求.

表4 晚高峰出租車需求的空間效應(yīng)檢驗

3) 空間模型的建立及分析 針對晚高峰出租車需求的空間滯后模型為

Y=ρWY+Xβ+ε

(5)

式中:Y為N×1維因變量向量;X為包含解釋變量公共停車場數(shù)量,地鐵可達性和公交站點數(shù)量的N×3維向量;WY為前述的空間滯后因子;ε為N×1維誤差向量;W為N×N維空間權(quán)重矩陣,與前述空間自相關(guān)時建立的權(quán)重矩陣相同,β為解釋變量的系數(shù);ρ為空間自相關(guān)系數(shù);N=601為研究區(qū)域內(nèi)交通小區(qū)的數(shù)量.假設(shè)誤差服從均值為零,方差為σ2的獨立同分布,且與解釋變量X不相關(guān),即E(X′ε)=0.當(dāng)空間自相關(guān)效應(yīng)存在時,空間滯后項的系數(shù)ρ≠0, 即出現(xiàn)變量的內(nèi)生性問題,普通最小二乘估計將不再適用,因此本文采用最大似然估計法(ML)對各自變量的系數(shù)進行估計.

利用Geoda軟件得到的空間滯后模型的估計結(jié)果見表3.由表3可知,模型的擬合優(yōu)度指標(biāo)R2由0.468提高到0.598,對數(shù)似然值Log likelihood有所增大,同時,從赤池信息準(zhǔn)則和施瓦茨準(zhǔn)則看,模型的AIC值和SC值都有所下降,且空間滯后項 的系數(shù)在0.01水平下顯著,因此,空間滯后模型的整體擬合效果較好.從模型的系數(shù)估計結(jié)果看,所有系數(shù)均在0.01水平下顯著,空間滯后項的系數(shù)為0.529,表征當(dāng)某個小區(qū)的出租車需求較高時將會對與它有共同邊或節(jié)點的臨近交通小區(qū)的出租車需求產(chǎn)生正向的影響,即出租車需求具有區(qū)域溢出效應(yīng).此外,引入空間滯后項后,各變量的系數(shù)雖符號未變,但其絕對值都較未引入前有所減少,表明晚高峰某交通小區(qū)的出租車需求不僅與這一交通小區(qū)內(nèi)的公共停車場數(shù)量、地鐵可達性和公交車站牌數(shù)均成正向關(guān)系,也與周邊交通小區(qū)的出租車需求有很大的正向關(guān)系.

4 結(jié) 論

1) 在對出租車GPS軌跡數(shù)據(jù)進行預(yù)處理的前提下,提取上客點的地理位置,通過統(tǒng)計落在各交通小區(qū)的上客點數(shù)量,得到了各交通小區(qū)晚高峰時段的出租車需求.

2) 晚高峰出租車需求的全局空間自相關(guān)檢驗結(jié)果表明,晚高峰期間出租車需求在空間上是正相關(guān)的,因此將其作為因變量進行建模時應(yīng)充分考慮其在空間上不獨立這一特征.

3) 空間滯后模型的估計結(jié)果表明,空間滯后項在0.01統(tǒng)計水平下顯著,且其整體擬合效果優(yōu)于普通線性模型,因此,空間滯后模型能更好的對晚高峰出租車需求進行擬合.

4) 晚高峰出租車需求與地鐵可達性、公共汽車站數(shù)量、公共停車場數(shù)量均成正相關(guān),且考慮空間因素后,這些變量對出租車晚高峰需求的影響有所降低.

猜你喜歡
因變量高峰出租車
調(diào)整有限因變量混合模型在藥物經(jīng)濟學(xué)健康效用量表映射中的運用
中國藥房(2022年7期)2022-04-14 00:34:30
病毒病將迎“小高峰”全方位布控巧應(yīng)對
乘坐出租車
石慶云
書香兩岸(2020年3期)2020-06-29 12:33:45
適應(yīng)性回歸分析(Ⅳ)
——與非適應(yīng)性回歸分析的比較
憑什么
偏最小二乘回歸方法
開往春天的深夜出租車
山東青年(2016年1期)2016-02-28 14:25:29
雨天早高峰,自在從容時。
在解決Uber之前先解決出租車行業(yè)的壟斷
IT時代周刊(2015年8期)2015-11-11 05:50:45
深水埗区| 伽师县| 大方县| 买车| 洛川县| 泸州市| 商丘市| 洪泽县| 黔西县| 卓资县| 抚州市| 桂阳县| 黎平县| 土默特左旗| 皮山县| 临猗县| 诸城市| 武功县| 洪江市| 潜山县| 滨海县| 伊金霍洛旗| 舞钢市| 永修县| 通化县| 大港区| 秦安县| 即墨市| 游戏| 台山市| 英超| 长沙市| 龙井市| 贵阳市| 盘山县| 古田县| 堆龙德庆县| 土默特右旗| 鹰潭市| 临沭县| 南川市|