国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

移動(dòng)群智感知下的交通流速缺失數(shù)據(jù)恢復(fù)算法

2021-03-13 06:00張建宗
關(guān)鍵詞:路網(wǎng)流速路段

張建宗,陶 丹

(北京交通大學(xué) 電子信息工程學(xué)院信息處理與人工智能研究所,北京100044)

1 引 言

隨著社會(huì)的發(fā)展,機(jī)動(dòng)車數(shù)量逐年增加,交通擁堵問(wèn)題成為現(xiàn)代城市面臨的主要問(wèn)題.為了減輕城市路網(wǎng)的壓力,對(duì)交通狀態(tài)進(jìn)行有效的評(píng)估顯得尤為重要.近年來(lái),我國(guó)大中城市在主要道路布置了大量交通傳感器(比如:攝像機(jī)、環(huán)路感應(yīng)器)進(jìn)行交通狀態(tài)監(jiān)測(cè),但這種方式部署困難且維護(hù)成本較高.隨著移動(dòng)終端處理器、內(nèi)存等硬件設(shè)備的快速發(fā)展和提升,攝像頭、麥克風(fēng)、GPS、陀螺儀、加速度計(jì)等傳感器嵌入到以智能手機(jī)、平板電腦為代表的移動(dòng)智能終端中.在此背景下,人們提出了一種新型的感知模式——移動(dòng)群智感知[1],即利用城市中廣泛存在的移動(dòng)智能設(shè)備以及車輛,通過(guò)群體間有意識(shí)或者無(wú)意識(shí)的協(xié)作完成感知任務(wù).由于移動(dòng)群智感知模式下的感知節(jié)點(diǎn)分布廣泛、移動(dòng)靈活,因此被廣泛應(yīng)用在智能交通領(lǐng)域[2].其中,利用探測(cè)車數(shù)據(jù)進(jìn)行城市規(guī)模的交通狀態(tài)評(píng)估就是較為常見(jiàn)的一種應(yīng)用[3].探測(cè)車是安裝有GPS等信息采集設(shè)備的車輛,能夠周期性的將車輛位置以及行駛狀態(tài)上傳至控制中心,基于此,能夠利用某時(shí)間段內(nèi)路段上的流速來(lái)表征交通狀況.由于探測(cè)車在城市范圍內(nèi)的概率分布,因此當(dāng)探測(cè)車數(shù)量足夠大時(shí),使得城市級(jí)的交通狀態(tài)評(píng)估成為可能.另外,安裝在探測(cè)車上的GPS設(shè)備的普及也極大的降低了系統(tǒng)成本.然而,受到探測(cè)車規(guī)模的限制,導(dǎo)致車輛在時(shí)空上分布不均勻,此時(shí)在使用探測(cè)車數(shù)據(jù)進(jìn)行交通狀態(tài)評(píng)估時(shí)存在著數(shù)據(jù)缺失,這是其應(yīng)用于交通狀態(tài)評(píng)估時(shí)的主要困難之一[4].

為實(shí)現(xiàn)對(duì)城市級(jí)交通狀態(tài)的有效評(píng)估,得到完整的城市交通狀態(tài)地圖,需要對(duì)缺失的交通數(shù)據(jù)進(jìn)行準(zhǔn)確恢復(fù).近年來(lái)積累了一系列利用探測(cè)車評(píng)估交通狀況的研究成果.基于公交車數(shù)據(jù),Herring等[5]提出了一種概率模型框架來(lái)預(yù)測(cè)主干道的行程時(shí)間分布,將交通狀態(tài)建模為耦合隱馬爾可夫模型以估計(jì)模型參數(shù).然而,這種方法需要通過(guò)現(xiàn)場(chǎng)研究和大量探測(cè)數(shù)據(jù)進(jìn)行訓(xùn)練.Zhu等[4]將出租車作為路況感知的探測(cè)車輛,隨后分析路況數(shù)據(jù)在時(shí)空上的結(jié)構(gòu)性特點(diǎn),利用低秩矩陣填充技術(shù)推測(cè)出沒(méi)有探測(cè)車經(jīng)過(guò)的路段的路況信息,以此實(shí)現(xiàn)大范圍的路況評(píng)估;然而該方法在數(shù)據(jù)缺失程度較大時(shí)數(shù)據(jù)恢復(fù)的效果不太理想.隨著機(jī)器學(xué)習(xí)的發(fā)展,更多研究學(xué)者嘗試學(xué)習(xí)數(shù)據(jù)特征以實(shí)現(xiàn)數(shù)據(jù)恢復(fù).Zhang等[6]將圖像超分辨率的概念應(yīng)用于交通流量數(shù)據(jù)感知重建.Zhang等[7]利用卷積神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)出租車交通流模式,進(jìn)而預(yù)測(cè)下一時(shí)刻的交通流分布矩陣,然而,這些重建過(guò)程都是“網(wǎng)格化”分布節(jié)點(diǎn)的數(shù)據(jù)采樣過(guò)程,與群智感知網(wǎng)絡(luò)節(jié)點(diǎn)非均勻感知過(guò)程不盡相同.由此,本文研究利用有限探測(cè)車數(shù)據(jù)進(jìn)行城市級(jí)交通狀態(tài)評(píng)估,針對(duì)路網(wǎng)提取、交通流速矩陣獲取以及缺失數(shù)據(jù)恢復(fù)等開(kāi)展了一系列研究工作.

2 交通流速缺失數(shù)據(jù)恢復(fù)框架

如圖1所示,為了實(shí)現(xiàn)城市級(jí)交通狀態(tài)評(píng)估,本文提出了交通流速缺失數(shù)據(jù)恢復(fù)框架.探測(cè)車會(huì)實(shí)時(shí)的向接收中心發(fā)送其運(yùn)行狀態(tài)以及位置信息,本文以某一時(shí)段內(nèi)某一路段的探測(cè)車速度表征交通運(yùn)行狀況.首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,刪除冗余數(shù)據(jù)并清理停滯點(diǎn),其次根據(jù)GPS數(shù)據(jù)獲取道路中心點(diǎn)完成路網(wǎng)提取,再次對(duì)其進(jìn)行時(shí)空劃分,并計(jì)算細(xì)粒度下的交通流速,進(jìn)而得到表征交通狀況的交通流速矩陣.在此基礎(chǔ)上,本文充分考慮數(shù)據(jù)間的時(shí)空相關(guān)性,改進(jìn)壓縮感知稀疏基進(jìn)而完成交通缺失數(shù)據(jù)恢復(fù),達(dá)到路況評(píng)估的目的.

圖1 交通流速缺失數(shù)據(jù)恢復(fù)框架Fig.1 Traffic velocity missing data recovery framework

2.1 數(shù)據(jù)預(yù)處理

同一輛探測(cè)車在行駛過(guò)程中,GPS終端會(huì)周期性地將GPS數(shù)據(jù)發(fā)送到控制中心.由于設(shè)備或者噪聲等影響而產(chǎn)生的錯(cuò)誤數(shù)據(jù)會(huì)直接影響路網(wǎng)提取的精度,進(jìn)而影響后續(xù)的交通狀態(tài)評(píng)估.數(shù)據(jù)預(yù)處理是路網(wǎng)提取的前提,主要包括清除冗余數(shù)據(jù)與消除停滯點(diǎn)兩方面.

2.1.1 清除冗余數(shù)據(jù)

由于數(shù)據(jù)傳輸誤差,會(huì)造成越界數(shù)據(jù)的存在,常見(jiàn)的如車頭方向超出[0°,359°],或者GPS點(diǎn)超出研究地圖的經(jīng)緯度范圍,對(duì)此類數(shù)據(jù)設(shè)置閾值范圍進(jìn)行清理.此外,數(shù)據(jù)中存在全部字段值均相同的情況,清除掉這些冗余的定位數(shù)據(jù),以提升路網(wǎng)提取的效率.

2.1.2 消除停滯點(diǎn)

由于本文將出租車作為探測(cè)車進(jìn)行研究,分析出租車運(yùn)營(yíng)特性可知,車輛在商場(chǎng)、車站等地常常停滯待客,或是乘客上下車也會(huì)造成數(shù)據(jù)變化微小,通常此類停滯點(diǎn)數(shù)據(jù)在整體數(shù)據(jù)中占比較大,且無(wú)法提供有效的路況信息,應(yīng)當(dāng)刪除此類數(shù)據(jù).同時(shí),考慮到道路交叉口信號(hào)燈變化周期等情況,本文將連續(xù)5分鐘車速為0的數(shù)據(jù)當(dāng)成停滯點(diǎn)進(jìn)行清除.

表1為部分預(yù)處理后的數(shù)據(jù)示例,經(jīng)過(guò)數(shù)據(jù)預(yù)處理后,數(shù)據(jù)剔除率高達(dá)55.67%.

表1 部分預(yù)處理后數(shù)據(jù)示例Table 1 Samples of partial preprocessed data

2.2 路網(wǎng)提取

在城市交通地圖中,由于探測(cè)車一般分布在道路上,而其他地方的探測(cè)車數(shù)據(jù)分布量較小,因此可以將研究區(qū)域劃分為網(wǎng)格,并計(jì)算網(wǎng)格內(nèi)探測(cè)車密度,設(shè)置合理的閾值篩選出作為道路主干道的網(wǎng)格,并擬合形成路網(wǎng),以此達(dá)到路網(wǎng)提取的目的.這種基于探測(cè)車數(shù)據(jù)的路網(wǎng)提取方法不僅可以對(duì)現(xiàn)有的道路網(wǎng)絡(luò)進(jìn)行修正,還為后續(xù)的交通流速計(jì)算提供了基礎(chǔ).本文將路網(wǎng)提取分為道路中心點(diǎn)提取和道路中心點(diǎn)擬合兩步.

2.2.1 道路中心點(diǎn)提取

基于網(wǎng)格思想,考慮到經(jīng)緯度與現(xiàn)實(shí)距離的換算關(guān)系,同時(shí)考慮道路實(shí)際寬度,將GPS數(shù)據(jù)在空間維度以2×10-5°(約為2米)為邊長(zhǎng)進(jìn)行網(wǎng)格劃分,這樣能保證較小的運(yùn)算復(fù)雜度同時(shí)在形成路網(wǎng)時(shí)誤差較小.

設(shè)定網(wǎng)格內(nèi)軌跡點(diǎn)密度閾值Q1、鄰域內(nèi)網(wǎng)格數(shù)目閾值Q2和聚類半徑E,當(dāng)網(wǎng)格密度大于密度閾值Q1時(shí)則將此網(wǎng)格判定為路網(wǎng)網(wǎng)格,如果某路網(wǎng)網(wǎng)格E鄰域內(nèi)的總路網(wǎng)網(wǎng)格數(shù)量大于Q2,則通過(guò)聚類算法將E鄰域內(nèi)包含的網(wǎng)格轉(zhuǎn)化為聚類點(diǎn),聚類點(diǎn)坐標(biāo)由鄰域內(nèi)所有路網(wǎng)網(wǎng)格決定.

2.2.2 道路中心點(diǎn)擬合

由于城市道路復(fù)雜多變,故本文采用了準(zhǔn)均勻B樣條曲線擬合方法,該方法能夠在擬合過(guò)程中將首尾端點(diǎn)擬合到曲線上,得到實(shí)際路網(wǎng)形狀的曲線.基于網(wǎng)格密度的路網(wǎng)獲取如算法1所示.

算法1.基于網(wǎng)格密度的路網(wǎng)獲取算法

輸入:GPS數(shù)據(jù)集合I{p1,p2,…,pn},密度閾值Q1、Q2和聚類半徑E.

輸出:路網(wǎng)矩陣R

1.以2×10-5°進(jìn)行網(wǎng)格劃分,得到網(wǎng)格矩陣N;

2.for網(wǎng)格矩陣中每個(gè)位置Nij;

3. 計(jì)算網(wǎng)格內(nèi)GPS數(shù)據(jù)密度K;

4. 如果K大于Q1,則形成新的集合C,并計(jì)算坐標(biāo)值;

5.end for;

6.return聚類點(diǎn)集合C={C1,C2,…,Cn};

7.for聚類點(diǎn)集合C中每個(gè)網(wǎng)格Cij;

8. 計(jì)算網(wǎng)格質(zhì)心坐標(biāo);

9.end for;

10.return網(wǎng)格質(zhì)心坐標(biāo)集合D={D1,D2,…,Dn};

11.對(duì)集合D進(jìn)行準(zhǔn)均勻B樣條曲線擬合;

12.return路網(wǎng)數(shù)據(jù)R

進(jìn)行路網(wǎng)提取前后的對(duì)比效果如圖2(a)、圖2(b)所示.由圖可以得出:通過(guò)篩選網(wǎng)格密度過(guò)低的網(wǎng)格,可以有效地清除主干道路以外的數(shù)據(jù)點(diǎn)和人跡罕至的小路數(shù)據(jù),且道路形狀保存較好.

圖2 路網(wǎng)提取前后對(duì)比Fig.2 Comparison before and after road network extraction

2.3 時(shí)空劃分

1)時(shí)間劃分:由于城市道路狀態(tài)在時(shí)間上變化頻繁,因此在對(duì)道路進(jìn)行狀態(tài)評(píng)估時(shí)需要將其劃分為一定的時(shí)間粒度進(jìn)行研究.圖3分別是以5分鐘、10分鐘和15分鐘為時(shí)間粒度下的數(shù)據(jù)缺失情況.由圖可知:雖然進(jìn)行時(shí)間劃分時(shí)時(shí)段越長(zhǎng)數(shù)據(jù)缺失率越小,但過(guò)長(zhǎng)的時(shí)間間隔不能及時(shí)反映交通狀況的變化.因此考慮到路況變化周期,本文選取5分鐘作為時(shí)間粒度.將一天時(shí)間劃分為288(12×24)個(gè)時(shí)間片段,在以5分鐘為時(shí)間粒度時(shí),數(shù)據(jù)缺失率高達(dá)85.3%.

圖3 不同時(shí)間粒度下數(shù)據(jù)缺失率Fig.3 Comparison ofthe levels of data missing at different time granularities

2)空間劃分:對(duì)于一條道路來(lái)說(shuō),尤其對(duì)于距離過(guò)長(zhǎng)、交通狀態(tài)差別或變動(dòng)較大的路段,難以用一個(gè)流速表征整條路段的信息.為此,本文將道路劃分為若干個(gè)子路段,用子路段的流速能夠更好地表示道路的交通狀態(tài).

考慮到城市路網(wǎng)中各道路被交叉口自然分割,形成存在一定拓?fù)浣Y(jié)構(gòu)的路段,本文將道路交叉口作為路段劃分的自然分界點(diǎn).對(duì)于長(zhǎng)度大于0.5km的自然路段,利用公式(1)對(duì)其進(jìn)一步劃分為若干子路段,

n=(?L」+1)×2

(1)

其中,n為某一路段被劃分的個(gè)數(shù),L為路段長(zhǎng)度,單位km.經(jīng)過(guò)子路段劃分后過(guò)長(zhǎng)的路段被劃分為長(zhǎng)度在0.25~0.5km之間的子路段.

經(jīng)過(guò)路段劃分,將研究區(qū)域內(nèi)的路網(wǎng)劃分為了432個(gè)路段.由此完成了數(shù)據(jù)的時(shí)空劃分.

2.4 流速計(jì)算

通常車輛在道路上的行駛速度能夠直接反映道路的通行狀況,因此本文將路段內(nèi)車輛流速作為評(píng)價(jià)交通狀態(tài)的指標(biāo).通常人們?cè)谟?jì)算交通流速時(shí)是通過(guò)計(jì)算某一路段內(nèi)經(jīng)過(guò)車輛的速度的平均值或是通過(guò)車輛的行駛軌跡與時(shí)間估計(jì)流速,但這種方法在樣本極差較大時(shí)或是車輛數(shù)目較少時(shí)會(huì)帶來(lái)較大的誤差.因此本文區(qū)分兩種典型情形并設(shè)計(jì)了一種自適應(yīng)的流速估計(jì)方法.

1)樣本數(shù)大于δ且極差大于μ,此時(shí)說(shuō)明該路段內(nèi)通過(guò)的車輛較多,但不同車輛間車速有著較大的差異.因此根據(jù)樣本數(shù)據(jù)的奇偶性,利用公式(2)計(jì)算該路段內(nèi)的流速的中位值.式中v為路段內(nèi)流速,un為第n個(gè)車速數(shù)據(jù).

(2)

2)樣本數(shù)小于δ或者樣本數(shù)大于δ且極差小于μ,此時(shí)說(shuō)明了該路段內(nèi)通過(guò)的車輛較少,或是車輛較多且不同車輛間的車速差別不大,使用公式(3)計(jì)算該路段內(nèi)的流速.

(3)

自適應(yīng)的流速估計(jì)方法采用均值計(jì)算的思想,設(shè)置參數(shù)在數(shù)據(jù)滿足一定條件下使用中位值法以避免離群點(diǎn)的影響.本文隨機(jī)節(jié)選8個(gè)路段計(jì)算其流速,圖4為不同流速計(jì)算方法的結(jié)果對(duì)比.相比傳統(tǒng)平均值法、中位值法,本文設(shè)計(jì)的流速計(jì)算方法更接近準(zhǔn)確值,為后續(xù)的交通狀態(tài)評(píng)估奠定了堅(jiān)實(shí)的基礎(chǔ).

圖4 不同流速計(jì)算方法的對(duì)比Fig.4 Comparison of different velocity calculation methods

通過(guò)數(shù)據(jù)預(yù)處理、路網(wǎng)提取、時(shí)空劃分以及流速計(jì)算等一系列處理,得到了存在缺失的交通流速矩陣.交通流速矩陣示例如表2所示.這樣,可以將探測(cè)車數(shù)據(jù)轉(zhuǎn)化為交通流速矩陣,矩陣的行列對(duì)應(yīng)著路網(wǎng)的路段和時(shí)段,由此可以更加方便地進(jìn)行時(shí)空建模和數(shù)據(jù)恢復(fù).

表2 交通流速矩陣示例Table 2 Sample of traffic velocity matrix

3 基于時(shí)空相關(guān)性的壓縮感知數(shù)據(jù)恢復(fù)算法

皮爾遜相關(guān)系數(shù)是刻畫(huà)變量之間關(guān)聯(lián)性常用的參數(shù),因此本文選取皮爾遜相關(guān)系數(shù)來(lái)揭示交通流速數(shù)據(jù)間的時(shí)空關(guān)聯(lián),對(duì)于二維向量存在:

(4)

實(shí)驗(yàn)選取了同一路段相鄰7個(gè)時(shí)間片段和同一時(shí)段相鄰的7個(gè)路段分別計(jì)算其相關(guān)系數(shù),結(jié)果如圖5(a)、圖5(b)所示.分析圖中數(shù)據(jù)可知:編號(hào)越接近的時(shí)段或路段其皮爾遜系數(shù)越大,路段(時(shí)段)間隔小于3時(shí)系數(shù)基本都在0.8以上,數(shù)據(jù)間有著強(qiáng)烈的時(shí)空關(guān)聯(lián)性.

圖5 時(shí)空相關(guān)性Fig.5 Spatio-temporal correlation

由于探測(cè)車數(shù)量有限,對(duì)數(shù)據(jù)進(jìn)行時(shí)空劃分后使得數(shù)據(jù)存在大量的缺失.近年來(lái)對(duì)探測(cè)車進(jìn)行交通數(shù)據(jù)恢復(fù)時(shí)通常認(rèn)為數(shù)據(jù)缺失是無(wú)規(guī)律的,然而通過(guò)分析上一章節(jié)得到的流速矩陣發(fā)現(xiàn):矩陣中數(shù)據(jù)缺失存在著一定的規(guī)律.根據(jù)缺失數(shù)據(jù)的位置特點(diǎn),將數(shù)據(jù)缺失情形分為以下3種:

1)隨機(jī)缺失:交通流速缺失元素隨機(jī)的分布在矩陣的各個(gè)位置.如果缺失的數(shù)據(jù)在流速矩陣中表現(xiàn)為分散的維度小于等于3(例如1×3、2×1)的行列矩陣,則將此類情形歸為隨機(jī)缺失.產(chǎn)生這種情況的原因可能是不同時(shí)段不同路段探測(cè)車的概率分布所致.

2)整塊缺失:交通流速缺失數(shù)據(jù)導(dǎo)致流速矩陣中出現(xiàn)大塊的空白情況,即缺失數(shù)據(jù)在流速矩陣中呈現(xiàn)為行列皆大于2(例如3×3、3×4)的子矩陣,則此類情況為整塊缺失.產(chǎn)生此情況的原因可能是某一區(qū)域探測(cè)車長(zhǎng)時(shí)間未覆蓋.

3)行列缺失:交通流速矩陣中某行或某列數(shù)據(jù)連續(xù)缺失,表現(xiàn)為元素大于3的行矩陣或者列矩陣(例如4×1、1×5),則此類情況為行列缺失.產(chǎn)生這種情況的原因可能是連續(xù)一段時(shí)間內(nèi)沒(méi)有探測(cè)車經(jīng)過(guò)或是一段道路長(zhǎng)時(shí)間未被探測(cè)車覆蓋.

特別地,一些特殊情形可以劃分為3種缺失情形的組合,不再贅述.

本文改進(jìn)了壓縮感知算法的稀疏基,以避免大范圍數(shù)據(jù)缺失帶來(lái)的影響,將缺失數(shù)據(jù)的預(yù)測(cè)問(wèn)題建模成稀疏向量的恢復(fù)問(wèn)題.在此,設(shè)計(jì)了一種基于時(shí)空相關(guān)性的壓縮感知數(shù)據(jù)恢復(fù)算法STC-CS(Spatio-Temporal Correlation based Compressed Sensing).

交通流速往往在時(shí)間上平滑變化,即在兩個(gè)相鄰的時(shí)間粒度下交通流速值變化較小,因此設(shè)計(jì)時(shí)間稀疏基矩陣T:

(5)

則流速si在矩陣T下的投影為γt=Tsi,令φt=T-1,則流速可以稀疏表示為si=φtγt.

由于城市路網(wǎng)之間往往存在著一定的拓?fù)浣Y(jié)構(gòu),這種拓?fù)浣Y(jié)構(gòu)揭示了數(shù)據(jù)間的空間相關(guān)性,因此設(shè)計(jì)空間稀疏基矩陣:

(6)

由上所述,分別從時(shí)空兩個(gè)角度考慮設(shè)計(jì)了稀疏表示基,將其進(jìn)行Kronecker積運(yùn)算就可以得到交通流速的稀疏表示基:

φ=φt?H

(7)

則交通流速矩陣可以進(jìn)行稀疏表示為:

si=φα

(8)

假設(shè)帶有缺失的流速矩陣為si,定義矩陣W∈Rm×n表示S中是否缺失

(9)

假設(shè)完整的流速數(shù)據(jù)為S,則:

si=S⊙W

(10)

由上述公式可知,矩陣W的第i行表示時(shí)間序列中的數(shù)據(jù)是否缺失,而缺失數(shù)據(jù)的預(yù)測(cè)就是利用未缺失的數(shù)據(jù)作為測(cè)量值恢復(fù)原數(shù)據(jù).由此設(shè)計(jì)觀測(cè)矩陣:

(11)

如果矩陣ψi∈RMi×K在(m,n)處的值為1,表明第m個(gè)測(cè)量值是在第n個(gè)時(shí)段得到的.就可以得到觀測(cè)矩陣:

(12)

令y表示si的觀測(cè)值,則矩陣si觀測(cè)向量可表示為:

y=ψφα

(13)

已知y、ψ、φ,就可以通過(guò)求解凸優(yōu)化問(wèn)題求解α,進(jìn)而恢復(fù)交通流速數(shù)據(jù).

4 實(shí)驗(yàn)仿真

本文基于移動(dòng)群智感知思想,使用探測(cè)車數(shù)據(jù)進(jìn)行路況評(píng)估.數(shù)據(jù)來(lái)源為東莞市1000輛出租車采集的約25萬(wàn)條數(shù)據(jù)(1)OpenData2[EB/OL].http://www.openits.cn/openData2/604.jhtml.,時(shí)間跨度為10天,覆蓋范圍為經(jīng)度23.0°~23.07°E,緯度113.7°~113.84°N,每條探測(cè)車數(shù)據(jù)包含車輛編號(hào)、位置、時(shí)間、車輛速度以及車頭方向等信息.

本文設(shè)計(jì)了兩組對(duì)比實(shí)驗(yàn):隨機(jī)缺失情形下不同數(shù)據(jù)缺失程度對(duì)比與50%數(shù)據(jù)缺失程度下不同缺失情形對(duì)比.實(shí)驗(yàn)與3D形函數(shù)時(shí)空插值修復(fù)法(3D-SHAPE)[8]、基于灰色GM(1,N)模型[9]、基于統(tǒng)計(jì)學(xué)的插值計(jì)算法(SI)以及最近鄰算法(KNN)這4種方法進(jìn)行對(duì)比.其中,3D-SHAPE是將數(shù)據(jù)的時(shí)空相關(guān)性加入到3D函數(shù)中進(jìn)行數(shù)據(jù)恢復(fù).基于灰色GM(1,N)模型是基于灰色殘差GM(1,N)模型的數(shù)據(jù)修復(fù)算法.SI與KNN是依據(jù)相鄰數(shù)據(jù)間關(guān)系進(jìn)行數(shù)據(jù)恢復(fù).

為了比較以上方法在本文實(shí)驗(yàn)數(shù)據(jù)集下的恢復(fù)結(jié)果,本文采用均方根誤差(RMSE)、均絕對(duì)誤差(MAE)、平均絕對(duì)值誤差率(MAPE)作為性能評(píng)價(jià)標(biāo)準(zhǔn).

1)隨機(jī)缺失情形下的數(shù)據(jù)恢復(fù)效果

為了比較隨機(jī)缺失情形下不同數(shù)據(jù)缺失程度的數(shù)據(jù)恢復(fù)性能,本文選取了數(shù)據(jù)缺失程度分別為30%、50%和80%的數(shù)據(jù),并使用上述5種算法對(duì)缺失數(shù)據(jù)進(jìn)行恢復(fù).數(shù)據(jù)恢復(fù)性能如表3所示.

表3 不同缺失程度下數(shù)據(jù)恢復(fù)性能對(duì)比Table 3 Comparison of data recovery performances at different evels of data missing

分析可知:當(dāng)數(shù)據(jù)缺失程度較小時(shí),由于未缺失數(shù)據(jù)能夠提供較多的信息,因此5種數(shù)據(jù)恢復(fù)算法都能夠較為準(zhǔn)確的恢復(fù)缺失數(shù)據(jù).其中SI算法和KNN算法的恢復(fù)效果相較于其他3種算法略差.在數(shù)據(jù)缺失程度為50%和80%時(shí),SI算法和KNN算法的恢復(fù)性能顯著下降,而另外3種考慮數(shù)據(jù)時(shí)空特性的數(shù)據(jù)恢復(fù)算法恢復(fù)的交通流速數(shù)據(jù)更加準(zhǔn)確,更接近實(shí)際中的交通流速數(shù)據(jù).在數(shù)據(jù)缺失程度為50%時(shí),3D-SHAPE算法、GM(1,N)算法和STC-CS算法的MAPE值基本相同,但在MAE與RMSE的表現(xiàn)上各有優(yōu)勢(shì).當(dāng)數(shù)據(jù)缺失程度進(jìn)一步加大時(shí),由于缺乏臨近數(shù)據(jù)的支持,導(dǎo)致SI算法和KNN算法的性能表現(xiàn)變得更差.3D-SHAPE算法與GM(1,N)算法恢復(fù)效果略有下降,而本文所提的STC-CS算法由于是基于數(shù)據(jù)時(shí)空特征將數(shù)據(jù)稀疏表示,重構(gòu)原始數(shù)據(jù)進(jìn)而恢復(fù)缺失數(shù)據(jù),因此恢復(fù)效果優(yōu)于其他算法,仍然能夠較為準(zhǔn)確地恢復(fù)缺失數(shù)據(jù).

2)不同缺失情形下的數(shù)據(jù)恢復(fù)效果

該實(shí)驗(yàn)將數(shù)據(jù)缺失程度統(tǒng)一設(shè)定為50%.隨機(jī)缺失情形下的數(shù)據(jù)恢復(fù)效果與表3(b)實(shí)驗(yàn)條件、實(shí)驗(yàn)結(jié)果相同;整塊缺失與行列缺失情形下,塊/行列的規(guī)模和數(shù)目是隨機(jī)的.表4為5種算法在3種不同缺失情形下的數(shù)據(jù)恢復(fù)效果.

表4 不同缺失情形下的數(shù)據(jù)恢復(fù)性能對(duì)比Table 4 Comparison of data recovery performances at different missing cases

通過(guò)分析可知:相較于整塊缺失與行列缺失,隨機(jī)缺失下由于缺失數(shù)據(jù)均勻分布,使得5種數(shù)據(jù)恢復(fù)算法的表現(xiàn)最好.行列缺失情形下本文所提的STC-CS算法的數(shù)據(jù)恢復(fù)效果相較于3D-SHAPE與GM(1,N)性能略優(yōu).在整塊缺失情形下由于大塊數(shù)據(jù)的缺失使得塊中心位置的參考數(shù)據(jù)變少,導(dǎo)致5種數(shù)據(jù)恢復(fù)算法的誤差變大,但相比較而言本文提出的算法恢復(fù)效果表現(xiàn)最佳,這是由于STC-CS算法將原始交通流速矩陣映射到其他維度,有效地避免了上述現(xiàn)象.

5 總 結(jié)

充分考慮探測(cè)車數(shù)據(jù)的時(shí)空特征,本文開(kāi)展交通流速缺失數(shù)據(jù)恢復(fù)研究.設(shè)計(jì)了基于網(wǎng)格密度提取路網(wǎng)的方法,提出了自適應(yīng)的路段流速計(jì)算方法,進(jìn)而得到交通流速矩陣,基于數(shù)據(jù)時(shí)空特征改進(jìn)了壓縮感知的稀疏基實(shí)現(xiàn)有效數(shù)據(jù)恢復(fù).一系列實(shí)驗(yàn)驗(yàn)證本文所提方法在缺失程度較大時(shí)能夠有效地恢復(fù)缺失數(shù)據(jù).

猜你喜歡
路網(wǎng)流速路段
云南智慧高速路網(wǎng)綜合運(yùn)營(yíng)管控平臺(tái)建設(shè)實(shí)踐
多中心、多路段、協(xié)同應(yīng)急指揮系統(tǒng)探析
液體壓強(qiáng)與流速的關(guān)系
保護(hù)母親河
山雨欲來(lái)風(fēng)滿樓之流體壓強(qiáng)與流速
愛(ài)虛張聲勢(shì)的水
基于元胞自動(dòng)機(jī)下的交通事故路段仿真
基于元胞自動(dòng)機(jī)下的交通事故路段仿真
肥西县| 花莲县| 汽车| 滁州市| 闽侯县| 方正县| 平安县| 揭东县| 北京市| 陆川县| 阿荣旗| 鄂州市| 贺兰县| 莒南县| 隆德县| 伊吾县| 明溪县| 沛县| 仙游县| 嘉祥县| 象州县| 罗田县| 开封市| 慈利县| 德州市| 定襄县| 云龙县| 万年县| 汪清县| 华池县| 佛坪县| 聊城市| 新闻| 武鸣县| 大安市| 墨脱县| 绥芬河市| 浦北县| 德阳市| 肃北| 磐石市|