文/中國公路工程咨詢集團有限公司總經(jīng)理 李志軍
對于交通行業(yè)而言,投融資是交通全生命周期的一個重要環(huán)節(jié)。投資決策的質(zhì)量和效率關(guān)乎到交通行業(yè)資源的優(yōu)化配置,對實現(xiàn)交通強國的目標具有重要的戰(zhàn)略意義。大數(shù)據(jù)技術(shù)有助于解決傳統(tǒng)投資決策目前存在的問題,為提高交通投資決策的質(zhì)量和效率提供有力的支撐。
當前,我國交通投資決策存在分階段決策、信息碎片化、考慮因素不全、海量數(shù)據(jù)價值挖掘不足、投資決策無法實時應(yīng)對市場變化、投資分析模型選擇偏主觀等問題,貫穿項目全生命周期的立項、實施管理、養(yǎng)護,以及運輸服務(wù)等環(huán)節(jié)的投資決策科學(xué)性和準確性,都有待進一步提升。
在立項環(huán)節(jié),存在預(yù)測分析不準的問題,原因在于規(guī)劃的階段性太強,而信息卻是碎片化的,數(shù)據(jù)采集成本高,數(shù)據(jù)間分析過多依賴經(jīng)驗,投資決策的精準度還有待提高。在實施管理環(huán)節(jié),由于技術(shù)手段等原因,傳統(tǒng)方式下項目管理精細化程度不高。
在養(yǎng)護方面,技術(shù)數(shù)據(jù)獲取有限并且使用率不高,數(shù)據(jù)深入挖掘分析有待開展,養(yǎng)護管理信息化程度、行業(yè)決策及政策制定手段都有待提高。在運營服務(wù)環(huán)節(jié),由于市場信息共享不充分,運輸服務(wù)市場通用誠信體系尚未建立,存在效率低、成本高、資源配置不平衡的情況。
針對上述問題,中國公路工程咨詢集團有限公司(簡稱“中咨集團”)利用大數(shù)據(jù)技術(shù),輔助交通全生命周期投資決策。
大數(shù)據(jù)的應(yīng)用貫穿了交通全生命周期,包含建、管、養(yǎng)、運等多個環(huán)節(jié)。在大數(shù)據(jù)環(huán)境下,可積極探索用數(shù)據(jù)流去活化交通流,每一次循環(huán)都給每個業(yè)務(wù)環(huán)節(jié)單元帶來新的變化,最終促成基礎(chǔ)設(shè)施產(chǎn)業(yè)鏈的生態(tài)系統(tǒng)升級。具體而言,是深入考察研究交通全生命周期的立項、設(shè)計、施工、管理、養(yǎng)護、運營等環(huán)節(jié)中的投資決策問題,并嘗試利用大數(shù)據(jù)技術(shù)建模分析。
在每個環(huán)節(jié)的應(yīng)用研究過程中,首先,收集大量的數(shù)據(jù)源,包括路網(wǎng)、車輛行駛過程、高分遙感、交通經(jīng)濟、資源環(huán)境等綜合性樣本數(shù)據(jù)。其次,將每個數(shù)據(jù)因素進行歸類,并關(guān)聯(lián)建模、分析解決問題的輸出項,再耦合迭代多個模型,得到相對精準的模型,輸出科學(xué)合理的預(yù)測值或結(jié)論,輔助解決相應(yīng)的投資決策問題,彌補、改善傳統(tǒng)模式的不足,使投資決策更加科學(xué)和精準。
在交通全生命周期投資決策中,中咨集團建立了大數(shù)據(jù)支撐平臺,具體包括四個步驟:把采集的數(shù)據(jù)在存儲平臺進行分布式存儲和分類管理;搭建“SPARK+Hadoop“分析平臺并提供通用分析工具;運用神經(jīng)網(wǎng)絡(luò)、機器學(xué)習(xí)等技術(shù)建立相應(yīng)解決方案模型;最終形成投資決策、管理決策等實際應(yīng)用。
通過大數(shù)據(jù)模式與傳統(tǒng)模式的對比發(fā)現(xiàn),傳統(tǒng)模式數(shù)據(jù)簡單,往往把很復(fù)雜的系統(tǒng)問題進行簡單化處理,比如將交通量與GDP掛鉤,而最終決策還是以專家經(jīng)驗為主,更多是做趨勢化的預(yù)測;而大數(shù)據(jù)模式則是追求在海量數(shù)據(jù)間尋找規(guī)律和關(guān)系,更精準地預(yù)測未來,以此找到解決問題的路徑。
簡單的說,傳統(tǒng)模式是簡單處理復(fù)雜問題,其誤差是每年累積的,且預(yù)測周期越長,誤差越大,甚至可能南轅北轍;而大數(shù)據(jù)模式是全面客觀處理復(fù)雜問題,隨著時間周期的增長,通過機器學(xué)習(xí)使誤差不斷被校正,其準確率會越來越高。
基于大數(shù)據(jù)的山西省公路立項投資決策是一個典型的案例。在傳統(tǒng)模式下,公路立項環(huán)節(jié)由于交通流量預(yù)測不準,導(dǎo)致投資決策依據(jù)不充分。在解決這一問題時,綜合考慮多種影響因素,利用大數(shù)據(jù)對交通流量進行準確預(yù)測,以此作為提高立項投資決策質(zhì)量和效率的突破口。
總體來講,我國的交通需求分析還是遵循交通四階段法。傳統(tǒng)四階段法的不足之處共有四方面:首先,OD調(diào)查難度高,數(shù)據(jù)樣本量?。黄浯危鲩L分析時受彈性系數(shù)法的限制,考慮的影響因素較少,甚至在一些特殊的地區(qū)、特殊的項目,有可能關(guān)鍵的影響因素并不被重視;再次,數(shù)據(jù)誤差較大,由于交通量存在時空波動,以少數(shù)幾天的調(diào)查數(shù)據(jù)推算年平均日交通量,會導(dǎo)致基礎(chǔ)數(shù)據(jù)存在較大的誤差;最后,四階段法建模時,許多過程依賴經(jīng)驗進行參數(shù)標定,不可避免引入人為誤差,這些誤差可能會產(chǎn)生迭代累積并被放大。
為了彌補不足,在大數(shù)據(jù)環(huán)境下采用機器學(xué)習(xí)和大數(shù)據(jù)技術(shù),在四階段法的基礎(chǔ)上建立大數(shù)據(jù)交通量預(yù)測方法,實現(xiàn)了對傳統(tǒng)方法的改進提升。
首先,大數(shù)據(jù)方法使用全路網(wǎng)全樣本數(shù)據(jù),包括歷年路網(wǎng)數(shù)據(jù)、收費站流水數(shù)據(jù)、交調(diào)數(shù)據(jù)以及配合其他數(shù)據(jù)獲取源共享數(shù)據(jù);其次,大數(shù)據(jù)方法采用動態(tài)路網(wǎng)參與模型計算,包括從過去、現(xiàn)在、到將來的動態(tài)演化路網(wǎng);再次,在統(tǒng)計年鑒等通常數(shù)據(jù)獲取途徑的基礎(chǔ)上,通過網(wǎng)絡(luò)爬蟲等技術(shù)補充數(shù)據(jù),提煉了對交通量產(chǎn)生影響的上百個影響因子;最后,對交通量預(yù)測中的相關(guān)函數(shù),利用大數(shù)據(jù)技術(shù)統(tǒng)計分析歷史數(shù)據(jù)再自動標定參數(shù)。
通過以上方式,建立的新交通量預(yù)測模型。這個模型的特點是,不止為一個項目服務(wù)。某級政府部門建立這個系統(tǒng)后,由于其網(wǎng)絡(luò)爬蟲數(shù)據(jù)等動態(tài)數(shù)據(jù)實時更新,可以依據(jù)政府需求隨時提出預(yù)測。這在某種程度上是對我國前期交通預(yù)測、交通需求分析工作的一個革命性改變。
在借鑒傳統(tǒng)四階段法基礎(chǔ)上,建立基于大數(shù)據(jù)的交通量預(yù)測模型,這個模型內(nèi)部構(gòu)建了路網(wǎng)拓撲關(guān)系模型、交通總量預(yù)測模型、交通分布預(yù)測模型、路段交通量預(yù)測模型四個子模型。
對于路網(wǎng)拓撲關(guān)系模型,在收集到高速公路網(wǎng)和國省道公路網(wǎng)的數(shù)據(jù),通過匹配相應(yīng)字段,建立高速與國省道的拓撲關(guān)系,將這兩個路網(wǎng)合二為一。
對于總量預(yù)測模型,首先盡可能采集與交通量相關(guān)或有可能相關(guān)的基礎(chǔ)數(shù)據(jù)。山西的項目中,一共采集了130個影響因子,通過主成分分析降維處理,提取關(guān)鍵影響因子,通過降維,提煉出涉及到社會經(jīng)濟指標、路網(wǎng)總體結(jié)構(gòu)、交通運輸指標等30個主成分因子,遠遠超過以往常規(guī)的交通需求分析的變量要求。
確立主要影響因子后,尋找模型建立影響因子與交通量的關(guān)系,通過比選各種模型,構(gòu)建了BP神經(jīng)網(wǎng)絡(luò)和RNN神經(jīng)網(wǎng)絡(luò)的聯(lián)合模型,分別實現(xiàn)增長分類功能和增長預(yù)測功能,共同組成交通總量預(yù)測模型。
大數(shù)據(jù)將輔助我國交通運輸行業(yè)的投資決策更加科學(xué)性和準確性
對于構(gòu)建交通分布預(yù)測模型主要分為兩步。首先是構(gòu)建基年OD表,根據(jù)基礎(chǔ)年的OD標定預(yù)測模型的參數(shù)。其中,高速公路OD是由收費站之間交通量轉(zhuǎn)換得到的,國省道OD基于斷面交通量觀測數(shù)據(jù),采用反推算法得到的。然后,對上一步交通總量模型預(yù)測出的交通發(fā)生與吸引總量,采用重力模型得到流量在最小區(qū)間的分布。
在路段交通量預(yù)測模型方面,把小區(qū)間的OD分配到具體路段上,這里采用Frank-Wolfe算法來求解用戶均衡問題。對模型中的相關(guān)參數(shù),基于實際數(shù)據(jù),采用機器學(xué)習(xí)曲線擬合的方法標定,模型最終輸出每個路段的交通量,同時可形成行程速度、行程時間、路段服務(wù)水平等數(shù)據(jù)。模型建好后,還需要不斷補充數(shù)據(jù)進行模型的維護與更新,從技術(shù)維度、空間維度和時間維度等多個方面迭代更新,持續(xù)改進模型,提高預(yù)測精度。
眾所周知,交通量預(yù)測是投資立項決策的最大變量。首先其難度是高的,另外對項目經(jīng)濟效益的影響也是很大的。該案例充分利用大數(shù)據(jù)技術(shù),優(yōu)化傳統(tǒng)四階段法,通過對交通流量精準預(yù)測分析、建模,為項目立項環(huán)節(jié)提供更好的支撐。
為了檢驗?zāi)P托Ч?,在利用實測數(shù)據(jù)對模型精度核查后,綜合采用浮動車現(xiàn)場調(diào)查數(shù)據(jù)、連續(xù)觀測站監(jiān)測數(shù)據(jù)、主線收費站流水數(shù)據(jù)等核查預(yù)測模型,結(jié)果準確率都在80%以上。隨著技術(shù)進步、數(shù)據(jù)更新、模型迭代,預(yù)測精度還將進一步提高。這是以山西全省范圍的一個路網(wǎng)交通需求的案例。
第二個案例是中咨集團開發(fā)的基于大數(shù)據(jù)的公路養(yǎng)護投資決策管理系統(tǒng)。我國公路養(yǎng)護投資決策一直存在信息化程度不高,缺乏決策技術(shù)手段等問題,影響到公路養(yǎng)護資金的使用效率。
利用大數(shù)據(jù)全面梳理養(yǎng)護業(yè)務(wù),從區(qū)域、路線等維度,建立技術(shù)狀況綜合評定、養(yǎng)護資金優(yōu)化分配模型來提高道路服務(wù)水平。養(yǎng)護投資決策管理系統(tǒng)充分利用有限資源,輸出更加科學(xué)合理的養(yǎng)護投資決策方案,使得公路基礎(chǔ)設(shè)施在其全生命周期內(nèi)發(fā)揮最佳的經(jīng)濟和社會效益。
開發(fā)的系統(tǒng)在收集了歷史技術(shù)狀況、社會經(jīng)濟環(huán)境、路面養(yǎng)護業(yè)務(wù)及路面養(yǎng)護資金預(yù)算等數(shù)據(jù)資料后,經(jīng)過數(shù)據(jù)整合、分析,建立技術(shù)狀況評定模型、養(yǎng)護投資決策模型,資金優(yōu)化分配模型,提供一年至多年的養(yǎng)護資金分配方案,同時可根據(jù)實時發(fā)生的資金分配方案產(chǎn)生的數(shù)據(jù)迭代分析,輔助相關(guān)部門做出科學(xué)合理的養(yǎng)護投資決策。
在微觀方面,通過引入實時交通量,建立“基于實時交通量的路面性能模型”,建立時間、交通量、路面性能指標三者的關(guān)聯(lián)關(guān)系模型,更好地為養(yǎng)護資金使用提供實時的評定數(shù)據(jù),便于縮短養(yǎng)護投資決策周期。
公路養(yǎng)護投資決策系統(tǒng)可滿足不同層級用戶的管理需要,在大數(shù)據(jù)技術(shù)的應(yīng)用下,采集歷史養(yǎng)護需求數(shù)據(jù)、檢測數(shù)據(jù)、時間維度和空間維度等數(shù)據(jù),通過建立路況評定模型和養(yǎng)護資金優(yōu)化分配模型,輸出項目級養(yǎng)護決策資金,為養(yǎng)護投資決策提供更科學(xué)、更高質(zhì)量、更高效率的依據(jù)。
未來,將通過高分遙感、聯(lián)網(wǎng)收費等技術(shù),致力于構(gòu)建以交通一張圖和數(shù)據(jù)一張網(wǎng)為基礎(chǔ)的全國交通運輸一張網(wǎng),實現(xiàn)道路交通的多維度信息可視化,并將其應(yīng)用于政策研究、防災(zāi)減災(zāi)、路網(wǎng)規(guī)劃、勘察設(shè)計等領(lǐng)域,更好地服務(wù)行業(yè)、服務(wù)政府、服務(wù)公眾。目前,中咨集團已取得階段性進展,高分交通數(shù)據(jù)中心已對外正式提供服務(wù)。
現(xiàn)階段只是利用感知、認知、洞察與控制的數(shù)據(jù)驅(qū)動,實現(xiàn)交通基礎(chǔ)設(shè)施的全過程可管,未來將實現(xiàn)全生命周期流程再造,以及全新商業(yè)模式的革新。