李陽
摘 要:主要研究高速公路車檢器流量檢測數(shù)據(jù)的篩選方法和修補方法。首先從交通流三參數(shù)的關(guān)系出發(fā),分析錯誤數(shù)據(jù)的種類及原因,提出一種對錯誤數(shù)據(jù)的篩選方法;然后分析與修補數(shù)據(jù)相關(guān)性最強的參數(shù)集合,制定修補算法對缺失數(shù)據(jù)進(jìn)行補修。錯誤數(shù)據(jù)的篩選主要運用閾值法,閾值的制定以道路通行能力為依據(jù)。本研究為高速公路的車檢器流量檢測數(shù)據(jù)的預(yù)處理技術(shù)提出了新的思路。
關(guān)鍵詞:流量檢測數(shù)據(jù);錯誤數(shù)據(jù)篩選;修補算法;閾值法
中圖分類號:TP316 文獻(xiàn)標(biāo)識碼:A 文章編號:2095-1302(2015)02-00-02
0 引 言
交通流數(shù)據(jù)主要包括車流量、車速、車間距、車輛類型、道路占有率等信息,其一般采用車輛檢測器檢測,車輛檢測器是高速公路交通監(jiān)控系統(tǒng)中不可缺少的組成部分,在智能交通系統(tǒng)中占有重要的地位,其檢測數(shù)據(jù)的有效利用能很大程度上提高交通監(jiān)控系統(tǒng)的管理水平。但是,由于車檢器的老化程度各有差異,受到路面交通狀況、惡劣環(huán)境等因素的影響程度也不同,車檢器也會存在不同程度的間歇性工作故障,流量檢測數(shù)據(jù)也會有不同程度的缺失與錯誤,若直接將有質(zhì)量問題的數(shù)據(jù)應(yīng)用到交通流狀態(tài)辨識及后續(xù)應(yīng)用中,必將對應(yīng)用結(jié)果帶來不良影響,甚至直接影響科學(xué)決策的正確性[1]。因此,為獲得高效精益化的交通流數(shù)據(jù),數(shù)據(jù)篩選與修補顯得尤為重要。目前,錯誤數(shù)據(jù)的判別算法中的閾值方法、基于交通流機(jī)理的方法應(yīng)用較為廣泛,修補算法中加權(quán)平均法、BP神經(jīng)網(wǎng)絡(luò)等方法也均有應(yīng)用[2]。而本研究采用的閾值法與交通流理論相結(jié)合的數(shù)據(jù)篩選方法,與已有的方法相比篩選規(guī)則更加精細(xì),篩選流程更加清晰有據(jù),且數(shù)據(jù)修補算法較為簡便易懂,便于實際運用[3]。本文通過設(shè)計科學(xué)合理的算法對高速公路車檢器流量檢測數(shù)據(jù)的質(zhì)量給予評估,過濾掉錯誤的數(shù)據(jù),并再此基礎(chǔ)上將錯誤數(shù)據(jù)修補成較為真實的數(shù)據(jù),為車檢器檢測數(shù)據(jù)在ITS應(yīng)用領(lǐng)域發(fā)揮更好與更大的效能提供基礎(chǔ)[4]。
1 流量檢測數(shù)據(jù)的篩選
車檢器檢測數(shù)據(jù)表現(xiàn)了高速公路的交通運行狀態(tài)特征,可提供總交通量、大中小分車型交通量、車輛占有率、速度等參數(shù)。其中,占有率、總交通量與速度間具有密切的聯(lián)系(在交通流量較小的情況下,單位時間內(nèi)通過檢測器的車輛數(shù)較小,且由于車速較高,導(dǎo)致時間占有率比較低。隨著交通量增加,單位時間內(nèi)通過檢測器的車輛數(shù)增加,而且車速有所降低,因此檢測器被車輛占用的時間增加,時間占有率會顯著增加。當(dāng)出現(xiàn)交通擁擠時,通過檢測器的交通量雖然可能降低,但由于車速明顯下降,使得時間占有率仍然處在一個較高的水平。)當(dāng)檢測數(shù)據(jù)中三者的關(guān)系符合其正常關(guān)系時,總交通量符合真實值,反之,則可認(rèn)定其錯誤。然而,在判斷總交通量正確的情況下,并不能反映出分車型流量的正誤,如圖1所示。當(dāng)分車型流量與總流量之間有一條數(shù)據(jù)不符合實際情況,那么此條數(shù)據(jù)就為錯誤數(shù)據(jù)。
圖1 XX省XX段某車檢器流量檢測數(shù)據(jù)
1.1 總交通量的篩選方法
利用占有率、交通量與速度之間的密切聯(lián)系,把交通流三參數(shù)作為一個整體考慮,有利于更好地利用其內(nèi)在的規(guī)律進(jìn)行篩選。表1是交通流三參數(shù)九種不同情況取值的組合,通過對這些組合的分析,可以對交通流三參數(shù)做一個基本的判斷,篩選出明顯錯誤的數(shù)據(jù)[5,6],其中,v代表車檢器采集到的速度值,o表示車檢器采集到的占有率,q表示車檢器采集到的總流量。
通過上述研究可得,除了被認(rèn)為數(shù)據(jù)錯誤的5種情況被直接過濾掉外,另外4種情況將進(jìn)一步制定判別方法判斷流量檢測數(shù)據(jù)是否為真實值或錯誤值,本研究主要運用閾值法,閾值篩選是指交通量、速度和占有率不能超過一定的閾值。
表1 錯誤數(shù)據(jù)篩選判編號 參數(shù)形式 錯誤判斷 處理方式
1 v=0,o=0,q=0 數(shù)據(jù)缺失或真實值 進(jìn)行下一步檢驗
2 v=0,o=0,q≠0 數(shù)據(jù)錯誤 刪除
3 v=0,o≠0,q=0 數(shù)據(jù)錯誤 刪除
4 v≠0,o=0,q=0 數(shù)據(jù)錯誤 刪除
5 v=0,o≈1,q=0 完全停車情況 進(jìn)行下一步檢驗
6 v≠0,o≠0,q=0 數(shù)據(jù)錯誤 刪除
7 v=0,o≠0,q≠0 數(shù)據(jù)錯誤 刪除
8 v≠0,o=0,q≠0 待定 進(jìn)行下一步檢驗
9 v≠0,o≠0,q≠0 待定 進(jìn)行下一步檢驗
針對交通量不為零的情況(情況8和情況9,在交通低峰時期,車速快,車輛檢測器有時會出現(xiàn)靈敏度不夠的情況,占有率就會顯示為零),可通過最大閾值法排除檢測交通量數(shù)值超過道路通行能力的情況。道路通行能力是指道路上某一地點、某一車道或某斷面處,單位時間內(nèi)可能通過的最大的交通實體(車輛或行人)數(shù),估算單車道的道路通行能力的公式為[7]:
(1)
l0=lc+la (2)
根據(jù)道路通行能力的估算,定義交通量的取值范圍q的合理范圍為:0≤q≤C·T/60·f。其中:C為道路通行能力(veh/h);v為小客車的行車速度(km/h);T為數(shù)據(jù)采集的時間間隔(min),一般為5 min;l0為車頭最小間隔;lc為小客車的長度(km);la為車輛間的安全間距(km);f為修正系數(shù),一般取1.3~1.5。
針對交通量為零,占有率約為1的情況,可通過前5分鐘和后5分鐘的數(shù)據(jù)判斷是否出現(xiàn)停車或擁堵狀況,如果前后三項數(shù)據(jù)基本一致則正確,否則將此條數(shù)據(jù)視為錯誤數(shù)據(jù)。
針對交通量和占有率均為0的情況,可能是因為凌晨流量較低,也可能是數(shù)據(jù)傳輸中斷造成丟失。這里可以對不同天數(shù)同一時段的交通流量的數(shù)據(jù)進(jìn)行比較,如果前后兩天的流量接近0,則數(shù)據(jù)為真實值;否則為錯誤數(shù)據(jù)。
1.2 分車型流量數(shù)據(jù)的篩選方法
將總流量有錯誤的數(shù)據(jù)過濾掉后,需要判斷分車型流量數(shù)據(jù)是否有錯誤。當(dāng)總流量為真值時,分車型流量的和與總流量相比相差過大也是不對的。分車型流量的篩選通過以下公式判斷:
(3)
其中:qi為分車型流量的值(i=1,2,3,分別表示大、中、小型車的檢測流量值);Q為總交通量;δ%為設(shè)定誤差,通常根據(jù)車檢器的精度參數(shù)進(jìn)行設(shè)定。
如果總交通量的值與分車型流量的和之間的相對誤差在規(guī)定范圍內(nèi),可視為數(shù)據(jù)為真實值;否則本條數(shù)據(jù)錯誤,需要過濾掉。
2 流量檢測數(shù)據(jù)的修補
將保留下來的車檢器流量檢測數(shù)據(jù)(包括小、中、大型車和總流量的檢測數(shù)據(jù))根據(jù)殘缺度,還原成完整度為1的數(shù)值,作為車檢器全天正常工作時檢測到的數(shù)據(jù)。車檢器一天中某缺失時段的總交通量的修補值根據(jù)對應(yīng)缺失時段的前15天的總交通量檢測數(shù)據(jù)與后15天的總交通量檢測數(shù)據(jù)計算得出,公式如下:
(4)
其中: kn為車檢器第n天缺失時段的總流量修補值。針對大、中、小、型車的檢測數(shù)據(jù)的修補方法,與總流量數(shù)據(jù)的修補方法相同。
3 結(jié) 語
本研究利用閾值法和數(shù)理統(tǒng)計知識對車檢器流量檢測數(shù)據(jù)的錯誤數(shù)值的篩選提供了思路和依據(jù),并將其修補為正確性高,完整率為1的檢測數(shù)據(jù)。該方法的使用可以為高速公路管理部門提供質(zhì)量更好的流量檢測數(shù)據(jù),使車檢器數(shù)據(jù)發(fā)揮出更好的效能。
參考文獻(xiàn)
[1]王曉原,吳芳.交通流數(shù)據(jù)清洗的關(guān)鍵理論及方法研究[D].淄博:山東理工大學(xué),2009.
[2]王保保,葉慶添.基于數(shù)據(jù)挖掘技術(shù)的短時交通流預(yù)測的研究與應(yīng)用[D].西安:西安電子科技大學(xué),2013.
[3]姜桂艷.道路交通狀態(tài)判別技術(shù)與應(yīng)用[M].北京:人民交通出版社,2004.
[4]金盛.環(huán)形線圈檢測器交通數(shù)據(jù)預(yù)處理方法研究[D].長春:吉林大學(xué),2007.
[5]姜桂艷,江龍暉,張曉東,等.動態(tài)交通數(shù)據(jù)故障識別與修復(fù)方法[J].交通運輸工程學(xué)報,2004,4(1):121- 125.
[6]裴玉龍,馬驥.實時交通數(shù)據(jù)的篩選與恢復(fù)研究[J].土木工程學(xué)報,2003,36(7):78-83.
[7]張亞平,裴玉龍.道路通行能力研究現(xiàn)狀及發(fā)展綜述[J].交通運輸工程學(xué)報,2002,2(2):95- 97.