苗曉變 ,廖家俊 ,梅華杰 ,馮 沖 ,毛嘉莉
(1.華東師范大學(xué) 數(shù)據(jù)科學(xué)與工程學(xué)院,上海 200062;2.華為技術(shù)有限公司,杭州 310000)
隨著大數(shù)據(jù)、人工智能、云計(jì)算等新一代信息技術(shù)的日趨廣泛應(yīng)用,傳統(tǒng)的鋼鐵物流行業(yè)開(kāi)啟了數(shù)字化轉(zhuǎn)型,進(jìn)入網(wǎng)絡(luò)貨運(yùn)時(shí)代.通過(guò)構(gòu)建網(wǎng)絡(luò)貨運(yùn)平臺(tái),對(duì)車(chē)輛和貨物進(jìn)行合理匹配,解決了貨源與車(chē)源之間的信息不對(duì)稱問(wèn)題.貨運(yùn)平臺(tái)將所有客戶所在地 (運(yùn)輸終點(diǎn)) 按照行政區(qū)域劃分為多個(gè)流向,對(duì)于各個(gè)流向承運(yùn)貨物的車(chē)輛統(tǒng)稱為運(yùn)力.由于鋼鐵產(chǎn)成品常采用公路長(zhǎng)途運(yùn)輸,需要由重卡、超重卡汽車(chē)執(zhí)行運(yùn)輸任務(wù),貨運(yùn)平臺(tái)僅對(duì)貨車(chē)進(jìn)行單程 (即由鋼廠到客戶企業(yè)) 運(yùn)輸任務(wù)指派,返程 (返回鋼廠) 貨源則由貨車(chē)司機(jī)自行聯(lián)系,司機(jī)更傾向于接受其熟悉流向的運(yùn)輸任務(wù),故承運(yùn)不同運(yùn)輸流向的車(chē)輛數(shù)分布極不均勻.如圖1 所示,在某一家物流企業(yè)的網(wǎng)絡(luò)貨運(yùn)平臺(tái)上注冊(cè)有6 048 名貨車(chē)司機(jī)(山東省內(nèi)),其中超過(guò)2 700 名司機(jī)只承擔(dān)過(guò)1 個(gè)流向的運(yùn)輸任務(wù).圖1 反映了鋼鐵物流中車(chē)輛對(duì)路線的依賴度.為緩解企業(yè)的倉(cāng)庫(kù)貨物囤積問(wèn)題,保證運(yùn)輸任務(wù)的高效執(zhí)行,亟需恰當(dāng)?shù)倪\(yùn)力預(yù)測(cè)方法來(lái)支持運(yùn)力調(diào)度與車(chē)貨匹配決策.
圖1 車(chē)輛對(duì)路線的依賴度分析Fig.1 Analysis of vehicles dependence on routes
鋼鐵物流中的運(yùn)力預(yù)測(cè)問(wèn)題,其目是預(yù)測(cè)未來(lái)時(shí)段內(nèi)運(yùn)輸某個(gè)流向的空閑車(chē)輛信息.近年來(lái),僅有少數(shù)研究基于車(chē)輛軌跡為網(wǎng)約車(chē)派單平臺(tái)設(shè)計(jì)了給定區(qū)域的空載車(chē)輛數(shù)預(yù)測(cè)方法[1],該類(lèi)方法僅關(guān)注局部時(shí)空區(qū)域?qū)M(jìn)/出給定區(qū)域車(chē)輛數(shù)的影響.與運(yùn)力預(yù)測(cè)類(lèi)似的交通預(yù)測(cè)問(wèn)題受到了學(xué)術(shù)界、工業(yè)界的普遍關(guān)注,并獲得了較為廣泛的研究,這些研究大多是解決城市道路的流量預(yù)測(cè)以及旅行時(shí)間預(yù)測(cè)[2-5]等問(wèn)題.上述方法和研究未關(guān)注不同車(chē)輛對(duì)運(yùn)輸流向的偏好,不適合用于解決鋼鐵物流的運(yùn)力預(yù)測(cè)問(wèn)題.鑒于貨車(chē)司機(jī)對(duì)運(yùn)輸流向的高度依賴性,為支持運(yùn)力的有效調(diào)度,運(yùn)力預(yù)測(cè)需要提供不同流向可服務(wù)車(chē)輛的信息 (如車(chē)輛ID).隨著網(wǎng)絡(luò)貨運(yùn)平臺(tái)業(yè)務(wù)的不斷發(fā)展,海量的貨車(chē)軌跡、運(yùn)單、車(chē)輛以及運(yùn)輸終點(diǎn)等物流數(shù)據(jù)被積累,這些物流數(shù)據(jù)為運(yùn)力預(yù)測(cè)問(wèn)題的研究提供了機(jī)會(huì).鋼鐵物流對(duì)不同流向的可用運(yùn)力預(yù)測(cè)問(wèn)題主要包括2 部分工作: ①預(yù)測(cè)各個(gè)時(shí)段內(nèi)返回鋼廠的空閑運(yùn)力信息,稱為運(yùn)力的可達(dá)性預(yù)測(cè);②預(yù)測(cè)到達(dá)鋼廠的運(yùn)力在未來(lái)時(shí)段選擇承運(yùn)的運(yùn)輸流向.
鑒于鋼鐵物流的復(fù)雜性,運(yùn)力預(yù)測(cè)正面臨嚴(yán)峻的挑戰(zhàn).基于歷史物流數(shù)據(jù)的分析發(fā)現(xiàn),貨車(chē)再次成為鋼廠的可用運(yùn)力,其時(shí)長(zhǎng)包括完成平臺(tái)分配運(yùn)輸任務(wù)的執(zhí)行時(shí)間和任務(wù)完成后返回鋼廠的時(shí)間.如圖2 所示,每次運(yùn)輸中,貨車(chē)的行程涉及離開(kāi)鋼廠(運(yùn)輸起點(diǎn),Pstart)運(yùn)輸貨物到客戶企業(yè)(運(yùn)輸終點(diǎn),Pend) 和再驅(qū)車(chē)返回鋼廠.運(yùn)力預(yù)測(cè)亟需解決的2 個(gè)問(wèn)題: 第一,根據(jù)車(chē)輛每行駛4 h 司機(jī)必須休息20 min 的交通法規(guī),貨車(chē)在執(zhí)行長(zhǎng)距離運(yùn)輸途中需要多次在休息區(qū)停留.由于司機(jī)的個(gè)體習(xí)慣以及停留原因的不同,導(dǎo)致在各個(gè)休息區(qū)耗時(shí)的不同,增加了預(yù)測(cè)運(yùn)輸完成時(shí)間的難度.第二,由于返程時(shí)司機(jī)自行聯(lián)系運(yùn)輸貨源,導(dǎo)致運(yùn)輸返程軌跡缺失,從而造成返程時(shí)間的不確定.
圖2 鋼鐵貨運(yùn)全程示例Fig.2 Illustration of steel freight
對(duì)于運(yùn)輸任務(wù)執(zhí)行過(guò)程中的停留時(shí)長(zhǎng)不確定問(wèn)題,究其原因是受司機(jī)個(gè)體差異化的駕駛習(xí)慣以及客戶企業(yè)收貨時(shí)間不同等因素影響.鑒于此,本文通過(guò)結(jié)合運(yùn)單、車(chē)輛、運(yùn)輸終點(diǎn)以及車(chē)輛軌跡數(shù)據(jù)等提取多個(gè)表征司機(jī)駕駛習(xí)慣的特征,同時(shí)獲取不同客戶的收貨習(xí)慣 (這里指客戶企業(yè)的工作時(shí)間范圍) 特征,并將上述特征輸入所構(gòu)建的運(yùn)力可達(dá)性預(yù)測(cè)模型.針對(duì)返程軌跡缺失導(dǎo)致返程貨起/終點(diǎn)不確定帶來(lái)的返程時(shí)間預(yù)測(cè)誤差過(guò)大問(wèn)題,本文將運(yùn)輸任務(wù)執(zhí)行與返程時(shí)間的預(yù)測(cè)問(wèn)題并入運(yùn)力可達(dá)性預(yù)測(cè)問(wèn)題進(jìn)行研究.文中首先通過(guò)對(duì)歷史物流數(shù)據(jù)進(jìn)行分析,提取包括反映司機(jī)駕駛習(xí)慣的特征與返程時(shí)間的相關(guān)特征;考慮到特征之間的相互影響,受注意力機(jī)制[6]的啟發(fā),在構(gòu)建運(yùn)力可達(dá)性預(yù)測(cè)模型時(shí)設(shè)計(jì)了兩個(gè)注意力網(wǎng)絡(luò),分別用于捕捉對(duì)駕駛習(xí)慣有影響的不同特征及其影響權(quán)重、以及對(duì)返程時(shí)間有影響的特征及其影響權(quán)重.
此外,鑒于運(yùn)力服務(wù)流向的有限性,本文通過(guò)對(duì)運(yùn)單和軌跡數(shù)據(jù)的進(jìn)一步分析發(fā)現(xiàn),貨車(chē)司機(jī)在缺少熟悉流向時(shí)傾向于接受相似流向的運(yùn)輸任務(wù).因此,為降低貨車(chē)的空駛率,可以根據(jù)流向間的相似性進(jìn)一步擴(kuò)充貨車(chē)的服務(wù)流向集合.為此,本文定義了流向間的相似度,從而基于相似流向生成運(yùn)力的候選運(yùn)輸流向集.考慮運(yùn)輸流向在地理空間上的距離相近 (稱為流向的地理相似度) 以及流向間的潛在相似性 (稱為流向的語(yǔ)義相似度),將流向間的相似度定義為地理相似度與語(yǔ)義相似度的加權(quán)和.關(guān)于語(yǔ)義相似度計(jì)算,若貨車(chē)的歷史運(yùn)輸任務(wù)中除運(yùn)輸次數(shù)最多的流向外,還運(yùn)輸過(guò)其他流向,則認(rèn)為這兩個(gè)流向具有語(yǔ)義相似性.如果歷史數(shù)據(jù)中同時(shí)選擇運(yùn)輸這兩個(gè)流向的司機(jī)越多,那么這兩個(gè)流向之間的語(yǔ)義相似度越大.
對(duì)于各運(yùn)輸流向的運(yùn)力候選集,本文根據(jù)可達(dá)性預(yù)測(cè)模型得到各時(shí)段內(nèi)的可達(dá)運(yùn)力集.隨后,需要結(jié)合貨車(chē)司機(jī)長(zhǎng)期的運(yùn)輸流向偏好與流向價(jià)格變化給司機(jī)帶來(lái)的短期流向選擇影響,預(yù)測(cè)未來(lái)時(shí)段內(nèi)可用運(yùn)力選擇的運(yùn)輸流向.為提取司機(jī)的流向選擇行為隨時(shí)間變化的規(guī)律,本文將該問(wèn)題建模為一個(gè)時(shí)間序列預(yù)測(cè)問(wèn)題.具體地,按照運(yùn)單時(shí)間基于司機(jī)歷史承運(yùn)的流向生成隨時(shí)間變化的流向序列,預(yù)測(cè)未來(lái)時(shí)段司機(jī)選擇接受的運(yùn)輸流向.鑒于長(zhǎng)短期記憶網(wǎng)絡(luò) (Long Short-Term Memory,LSTM) 在捕捉長(zhǎng)周期時(shí)序特征方面的優(yōu)勢(shì)[7],本文利用LSTM 模型預(yù)測(cè)可達(dá)運(yùn)力選擇接受的運(yùn)輸流向,從而獲得未來(lái)時(shí)段內(nèi)各個(gè)流向的可用運(yùn)力列表.
本文的主要貢獻(xiàn)如下.
(1) 首次提出了鋼鐵物流的運(yùn)力預(yù)測(cè)問(wèn)題,并設(shè)計(jì)了1 個(gè)三階段的運(yùn)力預(yù)測(cè)方法,包括基于流向相似度的運(yùn)力候選集生成、候選運(yùn)力的可達(dá)性預(yù)測(cè),以及可達(dá)運(yùn)力選擇承運(yùn)的流向預(yù)測(cè)等.
(2) 為降低停留時(shí)長(zhǎng)不確定與返程軌跡缺失對(duì)運(yùn)力可達(dá)性預(yù)測(cè)精度的影響,基于歷史物流數(shù)據(jù)提取車(chē)輛停留行為特征、運(yùn)輸終點(diǎn)特征、環(huán)境特征;同時(shí),引入自注意力機(jī)制分別獲取不同特征對(duì)貨車(chē)運(yùn)輸行程與返程耗時(shí)的影響及其權(quán)重.
(3) 基于物流企業(yè)真實(shí)數(shù)據(jù)集上的對(duì)比試驗(yàn),驗(yàn)證了本文所提預(yù)測(cè)方法的有效性;此外,本文模型已成功地應(yīng)用于鋼鐵物流企業(yè)的網(wǎng)絡(luò)貨運(yùn)平臺(tái).
本文后續(xù)結(jié)構(gòu): 第1 章梳理運(yùn)力預(yù)測(cè)的相關(guān)工作;第2 章對(duì)重要概念進(jìn)行形式化定義,并給出本文研究的問(wèn)題定義;第3 章詳細(xì)介紹本文提出的技術(shù)方案;第4 章在真實(shí)數(shù)據(jù)集上對(duì)本文所提方法與一些經(jīng)典方法進(jìn)行對(duì)比實(shí)驗(yàn);第5 章是對(duì)全文的總結(jié).
交通流量預(yù)測(cè)與運(yùn)力預(yù)測(cè)較為相似,其主要任務(wù)是通過(guò)分析城市道路網(wǎng)絡(luò)中的時(shí)空數(shù)據(jù) (如車(chē)輛的軌跡數(shù)據(jù)),對(duì)各條道路或不同地理區(qū)域內(nèi)通行的車(chē)輛數(shù)進(jìn)行預(yù)測(cè),該問(wèn)題已得到廣泛而深入的研究.早期,Kamarianakis 等[8]利用自回歸移動(dòng)平均 (Auto-Regression and Moving Average model,ARMA) 模型對(duì)道路網(wǎng)絡(luò)交通流進(jìn)行建模.但是由于統(tǒng)計(jì)模型僅關(guān)注單個(gè)路段或較小的道路網(wǎng)絡(luò)區(qū)域,捕捉復(fù)雜非線性關(guān)系的能力有限,不適用于由數(shù)千個(gè)路段組成的大型城市路網(wǎng)的交通流量預(yù)測(cè)問(wèn)題.隨著機(jī)器學(xué)習(xí)模型的興起,不少學(xué)者開(kāi)始將機(jī)器學(xué)習(xí)模型引入交通預(yù)測(cè)研究中.Manoel 等[9]使用支持向量機(jī)回歸模型 (Support Vector Regression model,SVR) 預(yù)測(cè)短期高速公路交通流量.Guy 等[10]結(jié)合集成學(xué)習(xí)方法 (如隨機(jī)森林) 與自適應(yīng)增強(qiáng)算法 (Adaptive Boosting,AdaBoost) 組成弱學(xué)習(xí)器用于交通流量預(yù)測(cè).近年來(lái),隨著深度學(xué)習(xí)技術(shù)的迅猛發(fā)展,更多學(xué)者在交通流量預(yù)測(cè)工作中引入深度神經(jīng)網(wǎng)絡(luò)模型以提升預(yù)測(cè)精度.Zhang 等[11]將城市路網(wǎng)中的交通流量數(shù)據(jù)視為圖像數(shù)據(jù)進(jìn)行處理,提出了基于卷積神經(jīng)網(wǎng)絡(luò) (Convolutional Neural Networks,CNN) 的深度時(shí)空殘差網(wǎng)絡(luò) (Spatio-Temporal Residual Networks,STResNet) 模型對(duì)交通流量進(jìn)行預(yù)測(cè).
在運(yùn)力預(yù)測(cè)方面,Wong 等[2]提出了兩階段的方法預(yù)測(cè)空閑出租車(chē)的行駛行為與出租車(chē)數(shù)量分布的變化,并提出了定制的深度殘差神經(jīng)網(wǎng)絡(luò)(Deep Supply-Demand,DeepSD) 模型來(lái)預(yù)測(cè)每個(gè)區(qū)域的網(wǎng)約車(chē)服務(wù)供需缺口,繼而根據(jù)供需缺口進(jìn)行運(yùn)力調(diào)度.DeepSD 模型可以看作是1 個(gè)使用多種數(shù)據(jù)源的多層感知器[12].Ke 等[13]對(duì)城市道路網(wǎng)絡(luò)按照六邊形網(wǎng)格進(jìn)行劃分,提出了基于六邊形的卷積神經(jīng)網(wǎng)絡(luò)集成框架,實(shí)現(xiàn)網(wǎng)約車(chē)服務(wù)的供需缺口預(yù)測(cè).該模型不考慮司機(jī)的偏好,只關(guān)注每個(gè)區(qū)域內(nèi)的運(yùn)力總數(shù)預(yù)測(cè).不同于上述方法應(yīng)用的網(wǎng)約車(chē)場(chǎng)景,在以鋼鐵物流為代表的大宗物流場(chǎng)景中,貨車(chē)司機(jī)對(duì)運(yùn)輸流向依賴性較強(qiáng).此外,交通流量預(yù)測(cè)僅根據(jù)各個(gè)區(qū)域之間的時(shí)空關(guān)系預(yù)測(cè)出每個(gè)區(qū)域的流量數(shù)量,無(wú)法預(yù)測(cè)每個(gè)流量的具體信息.如果采用交通流量預(yù)測(cè)方法進(jìn)行運(yùn)力預(yù)測(cè),會(huì)導(dǎo)致在后續(xù)的運(yùn)力調(diào)度階段無(wú)法兼顧運(yùn)力對(duì)流向和貨物的偏好,導(dǎo)致司機(jī)滿意度下降,造成司機(jī)流失,影響平臺(tái)的長(zhǎng)遠(yuǎn)發(fā)展.因此,為支持運(yùn)力調(diào)度以及車(chē)貨匹配的有效決策,本文提出的運(yùn)力預(yù)測(cè)問(wèn)題需面向不同運(yùn)輸流向預(yù)測(cè)可用車(chē)輛的信息 (如車(chē)牌號(hào)),不能直接采用上述方法解決.
如前所述,本文提及的運(yùn)力預(yù)測(cè)問(wèn)題與給定時(shí)段內(nèi)運(yùn)力的可達(dá)性預(yù)測(cè)相關(guān),后者的預(yù)測(cè)精度取決于運(yùn)輸?shù)竭_(dá)時(shí)間與返程時(shí)間預(yù)測(cè)的有效性.近年來(lái),車(chē)輛的旅行時(shí)間預(yù)測(cè)問(wèn)題已成為交通、物流等領(lǐng)域內(nèi)的經(jīng)典預(yù)測(cè)問(wèn)題,涌現(xiàn)出了一大批研究工作.它們大致可以分為2 類(lèi): ①基于路徑的時(shí)間預(yù)測(cè),即預(yù)測(cè)車(chē)輛行駛通過(guò)給定路徑需要的時(shí)長(zhǎng);②基于起點(diǎn)/終點(diǎn) (Origin-Destination,OD) 的行駛時(shí)長(zhǎng)預(yù)測(cè),即給定起點(diǎn)和終點(diǎn),不指定具體路徑,預(yù)測(cè)車(chē)輛從起點(diǎn)出發(fā)行駛至終點(diǎn)所需時(shí)間.在基于路徑的旅行時(shí)間預(yù)測(cè)方法中,給定路徑的總的旅行時(shí)間常被估算為車(chē)輛在每個(gè)路段的行駛時(shí)間與每個(gè)交叉路口的等待時(shí)間的總和.Jenelius 等[14]提出了SMA (Spatial Moving Average) 模型,根據(jù)歷史數(shù)據(jù)提取不同路段之間的空間相關(guān)性.Zheng 等[15]將旅行時(shí)間預(yù)測(cè)問(wèn)題建模為1 個(gè)回歸問(wèn)題,提出了WDR(Wide-Deep-Recurrent) 模型,Wide-Deep 用于捕捉行程的整體信息,并采用循環(huán)神經(jīng)網(wǎng)絡(luò) (Recurrent Neural Networks,RNN) 模型對(duì)軌跡建模以學(xué)習(xí)路段之間的關(guān)聯(lián)信息.與之相比,基于OD 的旅行時(shí)間預(yù)測(cè)方法則聚焦于給定OD 的旅行時(shí)間預(yù)測(cè).Jindal 等[3]提出的用于旅行時(shí)間估計(jì)的多層前饋神經(jīng)網(wǎng)絡(luò)(Spatio-Temporal Neural Networks,ST-NN)模型,先以起點(diǎn)和目的地的經(jīng)緯度坐標(biāo)作為輸入來(lái)預(yù)測(cè)旅行距離,再結(jié)合旅行距離與時(shí)間信息估計(jì)旅行所需時(shí)間.Li 等[4]提出了無(wú)需路線信息的到達(dá)時(shí)間預(yù)測(cè)方法,根據(jù)有限的可用信息以及復(fù)雜的時(shí)空依賴性,提出了預(yù)估到達(dá)時(shí)間的多任務(wù)表征學(xué)習(xí)(MUlti-task Representation learning model for Arrival Time estimation,MURAT)模型,并通過(guò)多任務(wù)學(xué)習(xí)在訓(xùn)練階段利用歷史行程的路徑信息進(jìn)一步提升了模型的性能.Wang 等[5]通過(guò)計(jì)算具有相似起點(diǎn)和目的地位置的相鄰行程的加權(quán)平均值來(lái)估計(jì)被查詢行程的行駛時(shí)間.與上述工作不同的是,本文提出的可達(dá)性預(yù)測(cè)方法不僅考慮了時(shí)空相關(guān)性,還關(guān)注了對(duì)運(yùn)力可達(dá)預(yù)測(cè)結(jié)果有影響的環(huán)境因素、司機(jī)個(gè)人駕駛習(xí)慣、客戶地卸貨規(guī)律、貨物品種等方面.
(1)終點(diǎn)
每個(gè)終點(diǎn)表示1 個(gè)客戶所在地,即1 次運(yùn)輸任務(wù)需要送達(dá)的具體位置.本文中終點(diǎn)由(eid,eadd,elon,elat)組成.其中,eid為終點(diǎn)ID,eadd為自然語(yǔ)言表示的終點(diǎn)地址,elon、elat分別為終點(diǎn)的經(jīng)度和緯度.
(2)流向
流向表示對(duì)終點(diǎn)的劃分,多個(gè)距離相近的終點(diǎn)屬于同一個(gè)流向.本文中終點(diǎn)根據(jù)行政區(qū)縣劃分為流向,將山東省內(nèi)的20 000 余個(gè)終點(diǎn)劃分為135 個(gè)流向.
(3)貨車(chē)
貨車(chē)為在平臺(tái)上注冊(cè)的運(yùn)輸車(chē)輛,由 (cid,cno,cer)組成.其中,cid表示車(chē)輛ID,cno表示車(chē)牌號(hào),cer表示車(chē)輛司機(jī).
(4)運(yùn)力
(5)運(yùn)單
運(yùn)單表示1 次運(yùn)輸任務(wù)的記錄,由1 個(gè)五元組 (cid,eid,s,l,Δt) 組成.五元組是由運(yùn)輸任務(wù)的承載貨車(chē)cid、終點(diǎn)eid和開(kāi)始時(shí)間s,并加入鋼廠至終點(diǎn)的歷史平均路徑距離l和完成運(yùn)輸并返回鋼廠所需時(shí)間 Δt組成.其中,歷史平均路徑距離l為該終點(diǎn)所有歷史運(yùn)單路徑距離的平均值,且每個(gè)歷史運(yùn)單的路徑距離為貨車(chē)行駛軌跡經(jīng)過(guò)的路徑總長(zhǎng)度.
(6)貨車(chē)歷史軌跡
貨車(chē)的歷史軌跡記錄每輛貨車(chē)從運(yùn)輸開(kāi)始至貨物送達(dá)之間的行駛過(guò)程,每間隔2 min 進(jìn)行1 次采樣,每條軌跡為S個(gè)連續(xù)的歷史GPS 點(diǎn),即貨車(chē)軌跡Ptra,i={p1,p2,···,pS},每個(gè)GPS 點(diǎn)包含經(jīng)度、緯度和時(shí)間戳.此外本文所用軌跡數(shù)據(jù)集中也記錄了產(chǎn)生當(dāng)前軌跡的貨車(chē)ID.
(7)運(yùn)力預(yù)測(cè)問(wèn)題
公式(1)中:F(·)表示本文提出的模型預(yù)測(cè)函數(shù);表示流向i在t+1 時(shí)刻的運(yùn)力.
本文所采用的數(shù)據(jù)來(lái)自山東某鋼鐵物流公司運(yùn)營(yíng)中采集的真實(shí)數(shù)據(jù),主要包括車(chē)輛軌跡數(shù)據(jù)和訂單數(shù)據(jù),以及運(yùn)輸終點(diǎn)和車(chē)輛的輔助信息.平臺(tái)采集的原始軌跡數(shù)據(jù)不記錄軌跡生成時(shí)車(chē)輛的行為目的,然而,本文的運(yùn)力預(yù)測(cè)模型訓(xùn)練需提取車(chē)輛每次運(yùn)輸任務(wù)完成過(guò)程中的特征,從而學(xué)習(xí)車(chē)輛的駕駛習(xí)慣.因此,本文需要對(duì)軌跡數(shù)據(jù)進(jìn)行切分,將每個(gè)車(chē)輛的原始軌跡根據(jù)運(yùn)輸任務(wù)切分為不同的子軌跡,為提升軌跡質(zhì)量,對(duì)子軌跡進(jìn)行異常點(diǎn)處理和缺失識(shí)別并補(bǔ)齊,為提取車(chē)輛到達(dá)客戶地的卸貨特征,還需識(shí)別車(chē)輛在客戶地附近的停留行為.除此之外,由于司機(jī)駛離鋼廠后平臺(tái)無(wú)法對(duì)司機(jī)進(jìn)行實(shí)時(shí)監(jiān)控,只可通過(guò)GPS 軌跡采集軌跡數(shù)據(jù),為預(yù)測(cè)貨車(chē)的可達(dá)性,本文需要對(duì)運(yùn)輸完成和返程時(shí)間等數(shù)據(jù)進(jìn)行補(bǔ)齊,并為防止異常數(shù)據(jù)對(duì)訓(xùn)練的干擾,需剔除運(yùn)單數(shù)據(jù)中的異常值.綜上所述,為方便后續(xù)的特征正確提取,本文需要對(duì)平臺(tái)采集的原始軌跡和運(yùn)單數(shù)據(jù)進(jìn)行多種預(yù)處理.
2.2.1 軌跡數(shù)據(jù)預(yù)處理
軌跡數(shù)據(jù)是指有帶時(shí)間戳的位置組成的序列,在對(duì)車(chē)輛軌跡分析的過(guò)程中,可以提取司機(jī)的駕駛行為,如停留時(shí)間、停留頻次等.軌跡數(shù)據(jù)預(yù)處理旨在提高軌跡質(zhì)量,并將每個(gè)車(chē)輛的軌跡切分為與運(yùn)單匹配的子軌跡.
(1) 切分子軌跡
采集原始軌跡數(shù)據(jù)中每輛貨車(chē)執(zhí)行每個(gè)自然月的運(yùn)輸任務(wù)位置信息作為1 條軌跡,本文根據(jù)各個(gè)運(yùn)單的起始時(shí)間,將車(chē)輛軌跡切分為與不同運(yùn)單匹配的多條子軌跡.
(2) 異常點(diǎn)處理
在軌跡數(shù)據(jù)的采集過(guò)程中,由于GPS 設(shè)備故障或信號(hào)不穩(wěn)定,會(huì)產(chǎn)生一些異常數(shù)據(jù)點(diǎn).本文主要識(shí)別并處理速度異常軌跡點(diǎn),貨車(chē)的行駛速度通常小于60 km/h,本文將速度大于90 km/h 的軌跡點(diǎn)識(shí)別為速度異常軌跡點(diǎn)予以刪除.
(3) 缺失軌跡識(shí)別與處理
在貨車(chē)行駛過(guò)程中,由于車(chē)內(nèi)信號(hào)設(shè)備故障或衛(wèi)星信號(hào)不穩(wěn)定等情況,在相當(dāng)長(zhǎng)一段時(shí)間內(nèi)無(wú)法正常采集貨車(chē)的位置信息,導(dǎo)致貨車(chē)部分軌跡缺失.以車(chē)輛軌跡中從信號(hào)丟失到再獲取的時(shí)間間隔作為軌跡缺失時(shí)間段,令每條軌跡中存在M個(gè)缺失時(shí)間段,則以1 條軌跡中M個(gè)缺失時(shí)間段的總和與該軌跡總時(shí)間的比值作為軌跡的缺失率.當(dāng)1 條軌跡的缺失率超過(guò)50%,則稱該條軌跡為嚴(yán)重缺失軌跡,將其剔除;若缺失率不超過(guò)50%,則使用線性插值法補(bǔ)充缺失時(shí)間段的軌跡點(diǎn)序列.
(4) 客戶地停留行為識(shí)別與處理
客戶地停留行為是指貨車(chē)從進(jìn)入客戶企業(yè)所在地到離開(kāi)的這段時(shí)間內(nèi)的停留行為,反映了貨車(chē)在客戶企業(yè)的卸貨過(guò)程,包括排隊(duì)等待與卸貨作業(yè).根據(jù)同一客戶不同運(yùn)單的卸貨時(shí)間可以獲得客戶企業(yè)的有效工作時(shí)段,稱之為收貨習(xí)慣.
2.2.2 運(yùn)單數(shù)據(jù)預(yù)處理
(1)數(shù)據(jù)補(bǔ)齊
原始運(yùn)單數(shù)據(jù)包括運(yùn)單的終點(diǎn) (客戶地)、出發(fā)時(shí)間、承運(yùn)車(chē)輛、貨物品種.為預(yù)測(cè)貨車(chē)的可達(dá)性,根據(jù)歷史運(yùn)單軌跡中貨車(chē)在客戶企業(yè)完成卸貨作業(yè)與再次返回鋼廠的時(shí)間間隔獲得貨車(chē)完成運(yùn)輸任務(wù)返回鋼廠耗費(fèi)的時(shí)長(zhǎng).
(2)異常數(shù)據(jù)剔除
由于車(chē)輛故障或者司機(jī)延時(shí)確認(rèn)運(yùn)輸完成等因素,部分運(yùn)單存在嚴(yán)重超時(shí)問(wèn)題,根據(jù)95%的置信區(qū)間剔除同一終點(diǎn)的時(shí)間異常運(yùn)單數(shù)據(jù).
本文構(gòu)建了基于自注意力機(jī)制的三階段運(yùn)力預(yù)測(cè)方案,包括運(yùn)力候選集生成、候選運(yùn)力可達(dá)性預(yù)測(cè)與各流向的可用運(yùn)力預(yù)測(cè),總體框架如圖3 所示: 首先,計(jì)算流向之間的相似度,根據(jù)當(dāng)前流向及其相似流向的歷史運(yùn)力集生成各個(gè)運(yùn)輸流向的運(yùn)力候選集.然后,在可達(dá)性預(yù)測(cè)階段,引入自注意力機(jī)制構(gòu)建可達(dá)性預(yù)測(cè)模型.具體地,在從多個(gè)來(lái)源的物流數(shù)據(jù)集上提取特征之后,考慮貨車(chē)運(yùn)輸途中受各種復(fù)雜因素的影響,結(jié)合自注意力機(jī)制學(xué)習(xí)不同特征的重要性,并將其輸入全連接神經(jīng)網(wǎng)絡(luò)中預(yù)測(cè)車(chē)輛是否可達(dá).最后,在可用運(yùn)力預(yù)測(cè)階段,根據(jù)每個(gè)可達(dá)車(chē)輛的歷史運(yùn)輸流向,計(jì)算未來(lái)時(shí)段貨車(chē)到達(dá)鋼廠后選擇承運(yùn)的流向,最終產(chǎn)生任一流向的可用運(yùn)力列表.
圖3 總體框架Fig.3 Framework of capacity prediction
不同流向?qū)\(yùn)力的需求不同,若司機(jī)偏好流向貨源不足時(shí),司機(jī)可能選擇其他流向承運(yùn).為預(yù)測(cè)各運(yùn)輸流向的可用運(yùn)力,本文通過(guò)計(jì)算運(yùn)力候選集,擴(kuò)充可能承運(yùn)每個(gè)流向的運(yùn)力.首先,利用歷史數(shù)據(jù)捕捉歷史運(yùn)輸任務(wù)中承運(yùn)過(guò)各流向的車(chē)輛;然后,通過(guò)計(jì)算流向之間的相似度,根據(jù)當(dāng)前流向及其相似流向的歷史運(yùn)力集生成各流向的運(yùn)力候選集.
3.1.1 流向相似度
給定N個(gè)流向,流向之間的相似度包括流向之間的地理相似度和流向之間的語(yǔ)義相似度.
(1) 地理相似度
地理相似度衡量流向之間在地理空間上的相近程度.1 個(gè)流向中包含多個(gè)終點(diǎn).為衡量2 個(gè)流向之間的距離,首先確定每個(gè)流向的中心位置,然后對(duì)流向所包含的所有終點(diǎn)進(jìn)行聚類(lèi),如圖4 所示.圖4中,將聚類(lèi)后終點(diǎn)數(shù)最多的A1類(lèi)的中心位置作為該流向的中心位置,表示流向的地理位置.
圖4 流向位置計(jì)算示例Fig.4 Calculation and graphical presentation of flow location
假設(shè)流向Fi中心位置的經(jīng)緯度為 (llon,1,llat,1),流向Fj中心位置經(jīng)緯度為 (llon,2,llat,2),則流向Fi和流向Fj之間的地理距離ddist(i,j) 為兩中心位置之間的半正矢距離.半正矢距離表示地球表面兩點(diǎn)之間的球面距離,計(jì)算公式為
其中R為地球半徑.流向Fi和流向Fj之間的地理相似度Ssim1′,ij的計(jì)算公式為
對(duì)Ssim1′,ij進(jìn)行歸一化處理,得到地理相似度Ssim1,ij.其計(jì)算公式為
(2) 語(yǔ)義相似度
語(yǔ)義相似度用于衡量流向之間的潛在相似性.具體地,若貨車(chē)的歷史運(yùn)輸流向集合中既包括流向Fi又包括流向Fj,可推斷流向Fi和流向Fj之間具有某種相似性,比如,流向Fi和流向Fj可從同一條國(guó)道上到達(dá).本文把此類(lèi)相似性稱為語(yǔ)義相似度.當(dāng)同時(shí)包括2 個(gè)流向的車(chē)輛數(shù)越多時(shí),流向間的語(yǔ)義相似度越高.根據(jù)歷史運(yùn)單數(shù)據(jù)得到流向Fi的歷史運(yùn)輸車(chē)輛集合Si={c1,c2,c3,···,cm},ci表示貨車(chē)i.利用Jaccard 相似度計(jì)算流向Fi和流向Fj之間的語(yǔ)義相似度Ssim2′,ij,公式為
對(duì)Ssim2′,ij進(jìn)行歸一化處理,得到語(yǔ)義相似度Ssim2,ij.其對(duì)應(yīng)公式為
結(jié)合地理相似度和語(yǔ)義相似度,就可獲得流向Fi和流向Fj之間的相似度Ssim,ij.其計(jì)算公式為
其中,α為超參數(shù),表示不同相似度的權(quán)重,取值范圍為(0,1).對(duì)于有同一條國(guó)道與高速公路經(jīng)過(guò)的流向,其地理距離影響程度與交通不便地區(qū)相比更小,則α取值相應(yīng)減小.α值視具體業(yè)務(wù)情況而定.
3.1.2 運(yùn)力候選集計(jì)算
流向的運(yùn)力候選集表示可運(yùn)輸該流向的所有運(yùn)力的集合,不僅包括歷史上運(yùn)輸過(guò)該流向的所有車(chē)輛,還包括潛在可能運(yùn)輸該流向的車(chē)輛.鑒于此,本文根據(jù)當(dāng)前流向和相似流向的歷史運(yùn)力集的集合生成各流向的運(yùn)力候選集,根據(jù)公式(7)計(jì)算流向間的相似度,選擇與每個(gè)流向最相似的k個(gè)流向,則流向Fi的運(yùn)力候選集XFi表示為
本節(jié)將結(jié)合各流向的運(yùn)力候選集,通過(guò)特征提取,結(jié)合自注意力機(jī)制構(gòu)建候選運(yùn)力可達(dá)性預(yù)測(cè)模型,預(yù)測(cè)候選運(yùn)力在預(yù)期時(shí)間內(nèi)能否到達(dá)鋼廠成為可用運(yùn)力.候選運(yùn)力可達(dá)性預(yù)測(cè)模型整體如圖5所示.
圖5 候選運(yùn)力可達(dá)性預(yù)測(cè)模型Fig.5 Candidate capacity accessibility forecasting model
3.2.1 特征提取
目前基于OD 的旅行時(shí)間預(yù)測(cè)方法普遍采用深度學(xué)習(xí)模型[3-5],從數(shù)據(jù)中提取豐富的特征是深度學(xué)習(xí)模型的關(guān)鍵步驟.本文從運(yùn)單、軌跡等數(shù)據(jù)中提取多個(gè)特征,包括運(yùn)力特征、流向客戶特征、貨物特征、時(shí)間特征和環(huán)境特征等,如表1 所示,隨后對(duì)其建立高維特征映射.
表1 特征描述Tab.1 Description of features
(1) 運(yùn)力特征
貨車(chē)司機(jī)的駕駛習(xí)慣影響車(chē)輛的行程時(shí)長(zhǎng).本文提取車(chē)輛的cid作為車(chē)輛特征,以歷史平均停留次數(shù)cstayTime和停留時(shí)間cstayDura作為駕駛習(xí)慣特征.
(2) 流向客戶特征
運(yùn)力可達(dá)性與其執(zhí)行運(yùn)輸任務(wù)的終點(diǎn)緊密相關(guān).因此,本文根據(jù)客戶目的地的歷史運(yùn)單和軌跡提取相關(guān)特征.車(chē)輛到達(dá)客戶地的時(shí)間以及從客戶地返回鋼廠的行駛時(shí)間依賴于客戶企業(yè)與鋼廠之間的距離,故提取每個(gè)終點(diǎn)所在區(qū)縣及該終點(diǎn)與鋼廠之間的平均路徑距離ediff作為特征;除此之外,不同客戶的收貨習(xí)慣 (工作時(shí)段) 不同、客戶收貨時(shí)間的早晚會(huì)影響貨車(chē)將貨物送達(dá)之前行程中的停留時(shí)間、客戶企業(yè)的收貨能力 (即卸貨設(shè)備作業(yè)能力) 也會(huì)影響貨車(chē)在送達(dá)之后等待卸貨的時(shí)間.因此,本文提取客戶的收貨時(shí)段etime和歷史平均卸貨時(shí)長(zhǎng)edura作為特征.歷史卸貨時(shí)長(zhǎng)通過(guò)提取軌跡在客戶地的停留時(shí)長(zhǎng)得到.
(3) 貨物特征
貨車(chē)運(yùn)輸?shù)呢浳锲贩N影響運(yùn)輸?shù)乃俣扰c到達(dá)目的地后的卸貨時(shí)長(zhǎng).通過(guò)對(duì)歷史數(shù)據(jù)的分析發(fā)現(xiàn),運(yùn)輸鋼卷類(lèi)和鋼管類(lèi)貨物的貨車(chē)行駛速度比運(yùn)輸板材類(lèi)貨物的貨車(chē)行駛速度慢.因此,本文提取貨物品種mcate以及是否是卷類(lèi)mroll作為貨物特征.
(4) 時(shí)間特征
時(shí)間特征也是影響貨車(chē)返回時(shí)間的一個(gè)重要因素.如果貨車(chē)早上由鋼廠出發(fā),司機(jī)為了1 d 中能再運(yùn)輸1 趟,會(huì)盡可能早地返回鋼廠;如果貨車(chē)是在下午或者晚上出發(fā),司機(jī)很可能選擇在第二天返回鋼廠.因此,本文提取運(yùn)單的出發(fā)時(shí)間tstart、日期dstart、歷史平均返程時(shí)間treturn、歷史平均運(yùn)輸周期tperiod作為時(shí)間特征.
(5) 環(huán)境特征
提取其他可用信息作為環(huán)境特征,例如天氣w.由于貨車(chē)運(yùn)輸周期長(zhǎng),故本文的環(huán)境特征為出發(fā)之后近3 d 之內(nèi)是否有陰雨天.
上述步驟提取的特征包括數(shù)值特征和ID 等類(lèi)別特征 (高維的一元特征).本文將類(lèi)別特征引入Embedding 嵌入層;同時(shí),將稀疏的類(lèi)別特征向量通過(guò)神經(jīng)網(wǎng)絡(luò)映射為固定長(zhǎng)度的低維稠密向量,對(duì)該嵌入層不做單獨(dú)訓(xùn)練,與整個(gè)神經(jīng)網(wǎng)絡(luò)同時(shí)訓(xùn)練.
3.2.2 自注意力機(jī)制(Self-Attention)
本文在模型中設(shè)計(jì)了2 個(gè)不同的注意力網(wǎng)絡(luò)(ATT1 和ATT2),用于解決運(yùn)輸途中的停留時(shí)長(zhǎng)不確定問(wèn)題和因返程軌跡缺失而導(dǎo)致的返程時(shí)間不確定問(wèn)題.
雖然由于司機(jī)個(gè)體的駕駛習(xí)慣不同,每個(gè)司機(jī)運(yùn)輸途中的停留時(shí)間難以確定,但在數(shù)據(jù)分析中仍可觀察到各流向包含停留時(shí)間在內(nèi)的總運(yùn)輸時(shí)長(zhǎng)具備的時(shí)間與空間的相關(guān)性.如圖6 所示,不同流向的貨車(chē)返回時(shí)間相對(duì)于出發(fā)時(shí)間具有不同的模式.如山東省臨沂市蒙陰縣流向(圖6(a)),隨著出發(fā)時(shí)間越來(lái)越晚,貨車(chē)的平均返回時(shí)間反而越來(lái)越短;而對(duì)于承載河?xùn)|區(qū)流向的貨車(chē)(圖6(b)),凌晨出發(fā)的車(chē)輛會(huì)及時(shí)返回,下午出發(fā)的車(chē)輛返回所需時(shí)間均在6~ 8 h 之間.
圖6 不同終點(diǎn)與出發(fā)時(shí)間的相關(guān)性Fig.6 Correlation of transport duration with vehicle departure times for different delivery terminals
本文在模型中首先設(shè)計(jì)了1 個(gè)自注意力網(wǎng)絡(luò)ATT1 用以捕捉運(yùn)輸途中的停留時(shí)長(zhǎng)特征.該模塊捕捉多個(gè)特征對(duì)不同司機(jī)駕駛習(xí)慣的作用,每個(gè)特征被分配1 個(gè)注意權(quán)重.本文設(shè)定,ei ∈RE表示第i個(gè)特征的E維嵌入向量,共H個(gè)特征向量;ej1∈RE表示顯式反映司機(jī)駕駛習(xí)慣特征 (歷史平均停留時(shí)長(zhǎng)) 的第j個(gè)向量;每個(gè)特征向量對(duì)駕駛習(xí)慣的影響權(quán)重αi,1.先由第一個(gè)查詢向量q1∈RH和索引向量k1∈RH點(diǎn)積得到原始分值Ssocre,i,1; 再對(duì)原始分值歸一化處理.計(jì)算過(guò)程對(duì)應(yīng)的公式為
公式(10)—公式(11)中:Wq,1∈RE×H;Wk,1∈RE×H.如式公(9)—公式(11)所示,特征向量ei通過(guò)轉(zhuǎn)換矩陣進(jìn)行非線性變換轉(zhuǎn)換到注意力空間,變換后的索引向量ki與查詢向量q1進(jìn)行點(diǎn)積,得到Ssocre,i,1,表示特征ei對(duì)ej1的重要性;再通過(guò)Softmax 函數(shù)歸一化處理得到每個(gè)特征的權(quán)重αi,1(公式(12));然后通過(guò)公式
將所有特征向量按照權(quán)重合并為嵌入向量εi1∈RE,并將εi1輸出至下一層網(wǎng)絡(luò),如圖5(b)所示.
在使用上述注意力網(wǎng)絡(luò)捕捉運(yùn)輸途中的停留時(shí)長(zhǎng)特征之后,本文可以更準(zhǔn)確地估計(jì)司機(jī)當(dāng)前運(yùn)輸任務(wù)的運(yùn)輸完成時(shí)間,但仍需估計(jì)司機(jī)在運(yùn)輸完成后司機(jī)何時(shí)能返回并進(jìn)行下一次運(yùn)輸.其中難點(diǎn)是由于返程司機(jī)自行聯(lián)系貨源、運(yùn)輸返程軌跡缺失導(dǎo)致返程時(shí)間不確定.此處引入對(duì)不同流向各司機(jī)的運(yùn)輸間隔周期特征 (此次運(yùn)輸結(jié)束時(shí)間至下次運(yùn)輸結(jié)束時(shí)間為一個(gè)運(yùn)輸間隔周期),并使用另一個(gè)注意力網(wǎng)絡(luò)捕捉特征.
與ATT1 不同,第二個(gè)注意力網(wǎng)絡(luò) (ATT2) 用以捕捉影響司機(jī)返程的特征重要性.ATT2 中的查詢向量q2∈RH,計(jì)算公式為
其中ej2∈RE為反映司機(jī)返程時(shí)間的特征 (包括運(yùn)輸間隔周期特征).ATT2 的輸出表示為ε2.
本文使用的2 個(gè)自注意力機(jī)制各自使用共享的查詢向量.與使用不同查詢向量學(xué)習(xí)不同字段的特征相比,使用共享查詢向量學(xué)習(xí)不同字段的特征有助于構(gòu)建更健壯、更準(zhǔn)確的選擇準(zhǔn)則,特別是對(duì)于具有稀疏特征的字段[16].
對(duì)由3.1節(jié)中計(jì)算得到的流向Fj的運(yùn)力候選集XFj中的貨車(chē)使用可達(dá)性模型預(yù)測(cè),判定每輛候選
可用運(yùn)力預(yù)測(cè)旨在為可達(dá)運(yùn)力集預(yù)測(cè)每個(gè)可達(dá)運(yùn)力選擇運(yùn)輸?shù)牧飨?3.2 節(jié)中預(yù)測(cè)出流向Fj可達(dá)運(yùn)力集合Vj={c1,c2,···,cl},ci表示1 個(gè)可達(dá)貨車(chē)i.對(duì)于這些可達(dá)貨車(chē),由于每一輛貨車(chē)并非只是1 個(gè)流向的固定運(yùn)力,當(dāng)司機(jī)熟悉的流向缺少待發(fā)貨源或價(jià)格下降等情況發(fā)生時(shí),司機(jī)可能會(huì)根據(jù)車(chē)隊(duì)需要選擇運(yùn)輸其他相似流向.在本階段根據(jù)可達(dá)運(yùn)力的歷史運(yùn)輸流向,采用LSTM 模型預(yù)測(cè)每個(gè)可達(dá)運(yùn)力下次選擇的運(yùn)輸流向,獲得各流向的可用運(yùn)力列表.
LSTM 是傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 的變體,可以處理時(shí)序的長(zhǎng)期依賴問(wèn)題[17],適用于貨車(chē)司機(jī)根據(jù)自身運(yùn)輸經(jīng)驗(yàn)和車(chē)隊(duì)需要選擇運(yùn)輸流向的場(chǎng)景.1 個(gè)LSTM 模塊主要由輸入門(mén)、輸出門(mén)、遺忘門(mén)等組成.LSTM 模型預(yù)測(cè)可達(dá)運(yùn)力流向選擇過(guò)程如圖7(a)所示,每個(gè)LSTM 單元結(jié)構(gòu)如圖7(b)所示.
圖7 LSTM 模型結(jié)構(gòu)示意Fig.7 LSTM structure
該LSTM 的訓(xùn)練過(guò)程: 對(duì)于每個(gè)可達(dá)運(yùn)力ci,其歷史流序列為 [fflow,1,fflow,2,···,fflow,t],fflow,k表示ci的1 次歷史運(yùn)輸任務(wù)對(duì)應(yīng)的流向,對(duì)其進(jìn)行獨(dú)熱編碼生成輸入序列[fflow_embed,1,fflow_embed,2,···,fflow_embed,t],每個(gè)LSTM 單元隱藏層狀態(tài)為 [h1,h2,···,ht],則每個(gè)單元的更新公式為
公式(15)—公式(20)中:ft為遺忘門(mén)決定前一時(shí)刻的狀態(tài)Ct-1有多少信息被保留,一般而言,對(duì)于車(chē)隊(duì)固定運(yùn)力該值較小,而對(duì)于個(gè)人流動(dòng)運(yùn)力該值較大;it為輸入門(mén)決定輸入xt有多少信息被輸入,該部分輸入貨車(chē)司機(jī)近幾次的歷史運(yùn)輸流向;ot為輸出門(mén)決定要輸出當(dāng)前狀態(tài)Ct中的多少信息,即決定本次運(yùn)輸流向及近期運(yùn)輸模式有多大程度上可代表司機(jī)的長(zhǎng)期運(yùn)輸習(xí)慣;σ為Sigmoid 激活函數(shù);表示單元更新值.
隨后,計(jì)算每個(gè)可達(dá)運(yùn)力選擇的運(yùn)輸流向,進(jìn)而獲得每個(gè)流向在t+1 時(shí)間段的可用運(yùn)力列表
算法1 給出了本文所提運(yùn)力預(yù)測(cè)模型的執(zhí)行過(guò)程: 首先,基于歷史運(yùn)單集,根據(jù)相似性計(jì)算公式(公式(6))得到流向之間的相似度矩陣A,則流向運(yùn)力候選集X為最相似的k個(gè)流向歷史運(yùn)輸車(chē)輛集合;然后,對(duì)候選運(yùn)力中的每個(gè)運(yùn)力分別提取特征ri,通過(guò)嵌入層將高維特征映射為低維稠密向量ei,通過(guò)兩層自注意力機(jī)制分別捕捉影響司機(jī)駕駛習(xí)慣和運(yùn)輸周期的特征,得到融合特征向量ε1、ε2,再將其聚合輸入多層感知機(jī)(Multilayer Perceptron,MLP)訓(xùn)練,獲得該運(yùn)力的可達(dá)性{0,1},從而得到流向Fj的可達(dá)運(yùn)力集合Vj;最后,將每個(gè)可達(dá)運(yùn)力的歷史承運(yùn)流向序列輸入LSTM 模型中獲得每個(gè)可達(dá)運(yùn)力選擇的流向,從而產(chǎn)生每個(gè)流向Fj的可用運(yùn)力集
本文在真實(shí)數(shù)據(jù)集上進(jìn)行了一系列實(shí)驗(yàn),對(duì)所提出的技術(shù)方案的有效性進(jìn)行了評(píng)估.本文所用數(shù)據(jù)集來(lái)自山東某鋼鐵物流企業(yè)的真實(shí)數(shù)據(jù)集,包含了2021 年11 月至2022 年2 月共4 個(gè)月320 499 條運(yùn)單數(shù)據(jù)及其對(duì)應(yīng)的軌跡數(shù)據(jù)、車(chē)輛數(shù)據(jù)和終點(diǎn)數(shù)據(jù),其中訓(xùn)練數(shù)據(jù)的時(shí)段為2021 年11 月至2022 年1 月 (共3 個(gè)月).為構(gòu)建訓(xùn)練集,本文將每個(gè)訓(xùn)練日的時(shí)間按 1 個(gè)/2 h 時(shí)間片進(jìn)行劃分,預(yù)測(cè)后續(xù)時(shí)間片 (可選) 的流向可用運(yùn)力集合.因此,本文共有3 909 446 個(gè)訓(xùn)練項(xiàng).
本文采用混淆矩陣評(píng)價(jià)運(yùn)力預(yù)測(cè)模型的有效性,混淆矩陣包括了樣本的實(shí)際標(biāo)簽與模型預(yù)測(cè)標(biāo)簽之間的關(guān)系.
總樣本數(shù)為N;對(duì)于每個(gè)樣本xi,預(yù)測(cè)值yi={0,1}表示可用運(yùn)力i在預(yù)測(cè)時(shí)間片是否會(huì)選擇該流向;樣本真實(shí)值ti={0,1}表示運(yùn)力i在預(yù)測(cè)時(shí)間片是否真實(shí)到達(dá)鋼廠并運(yùn)輸了該流向.評(píng)價(jià)指標(biāo)如下.
(1) 準(zhǔn)確率
準(zhǔn)確率(Accuracy,A)表示預(yù)測(cè)正確的樣本比例.其計(jì)算公式為
(2) 精確率
精確率(Precision,P)表示預(yù)測(cè)為可用的運(yùn)力中真實(shí)運(yùn)輸該流向的運(yùn)力占比.其計(jì)算公式為
(3) 召回率
召回率(Recall,R)表示在預(yù)期時(shí)間真實(shí)運(yùn)輸該流向的運(yùn)力中預(yù)測(cè)正確的運(yùn)力占比.其計(jì)算公式為
(4)F1分?jǐn)?shù)
F1分?jǐn)?shù)(F1-score)表示精確率和召回率的調(diào)和平均值,綜合了精確率和召回率.F1-score 的取值范圍為[0,1],其值越接近1 表示模型預(yù)測(cè)效果越好,而越接近0 表示模型效果越差.其計(jì)算公式為
可達(dá)性預(yù)測(cè)模型對(duì)本文中的運(yùn)力預(yù)測(cè)結(jié)果起決定性作用,若可達(dá)性預(yù)測(cè)模型效果不理想,則運(yùn)力預(yù)測(cè)結(jié)果必然更差.因此,先對(duì)可達(dá)性預(yù)測(cè)模型的有效性進(jìn)行評(píng)估.由于沒(méi)有相關(guān)工作預(yù)測(cè)車(chē)輛在預(yù)期時(shí)間是否可達(dá),本文對(duì)幾種基于OD 的旅行時(shí)間預(yù)測(cè)模型的輸出進(jìn)行修改以適應(yīng)鋼鐵物流的預(yù)測(cè)場(chǎng)景,具體地,通過(guò)比較行程的出發(fā)時(shí)間加上模型輸出的旅行時(shí)間是否早于預(yù)期時(shí)間,達(dá)到可達(dá)性預(yù)測(cè)的目的.以下是本文選擇的幾種用于評(píng)估可達(dá)性預(yù)測(cè)的模型.
(1)歷史平均 (History Average,HA)[18]
歷史平均是指旅行時(shí)間為該終點(diǎn)歷史記錄的平均值.
(2)線性回歸(Linear Regression,LR)[4]
線性回歸是指將返回時(shí)間視為鋼廠與終點(diǎn)之間的距離L 的函數(shù),訓(xùn)練一個(gè)簡(jiǎn)單的線性回歸模型作為基線模型.
(3)隨機(jī)森林 (Random Forest,RF)[19]
隨機(jī)森林是1 個(gè)集成學(xué)習(xí)模型,將司機(jī)、終點(diǎn)、客戶、出發(fā)時(shí)間作為輸入,訓(xùn)練1 個(gè)隨機(jī)森林模型;
(4)基于最近鄰的方法(Temporally Weighted Neighbors,TEMP)[5]
基于最近鄰的方法利用所有具有相似起點(diǎn)和目的地的歷史行程的加權(quán)平均旅行時(shí)間估計(jì)本次的旅行時(shí)間,每個(gè)相鄰行程的權(quán)重為相鄰行程與預(yù)測(cè)行程平均速度的相似性.
(5)本文所提出的可達(dá)性預(yù)測(cè)模型(Proposed Method,簡(jiǎn)稱Proposed)
本文所提出的可達(dá)性預(yù)測(cè)模型考慮了司機(jī)駕駛習(xí)慣和貨物、流向等偏好,來(lái)預(yù)測(cè)每個(gè)候選運(yùn)力的可達(dá)性.
本文用于評(píng)估可達(dá)性預(yù)測(cè)模型的性能指標(biāo)如4.1 節(jié)所述.圖8—圖11 分別展示了幾種模型在數(shù)據(jù)集上的準(zhǔn)確率(A)、精準(zhǔn)率(P)、召回率(R)、F1分?jǐn)?shù)(F1-score)的對(duì)比.
由實(shí)驗(yàn)結(jié)果可以看出,每個(gè)模型的準(zhǔn)確率(A)都比其他幾個(gè)評(píng)價(jià)指標(biāo)高.這是因?yàn)闇?zhǔn)確率表示分類(lèi)預(yù)測(cè)正確的比例.在本文中,由于司機(jī)運(yùn)輸周期長(zhǎng),在預(yù)測(cè)時(shí)間片之前若貨車(chē)的上1 個(gè)運(yùn)單未結(jié)束,則貨車(chē)不可達(dá),每個(gè)運(yùn)單在多個(gè)時(shí)間片的可達(dá)性均為0,數(shù)據(jù)整體負(fù)樣本比例較大,所以準(zhǔn)確率相對(duì)其他指標(biāo)較高.
從圖8—圖11 中可以看出,使用簡(jiǎn)單平均的方法也會(huì)有相對(duì)較準(zhǔn)確的結(jié)果.出乎意料的是,對(duì)線性回歸(LR)和隨機(jī)森林(RF)這2 個(gè)模型增加司機(jī)和終點(diǎn)距離等特征后,各個(gè)指標(biāo)相對(duì)于簡(jiǎn)單平均都有所下降.這表明同一終點(diǎn)、同一司機(jī)的行駛習(xí)慣也是差異化的,如果只是簡(jiǎn)單地使用1 種模式預(yù)測(cè)效果反而更差.與簡(jiǎn)單平均類(lèi)似,同樣也是將歷史行程返回時(shí)長(zhǎng)的平均值作為預(yù)測(cè)行程返回時(shí)長(zhǎng)的TEMP,利用行程速度定義了不同行程之間的相似度,根據(jù)行程之間的相似度加權(quán)平均歷史行程的返回時(shí)間,提升了TEMP 方法的預(yù)測(cè)性能.TEMP 為多個(gè)對(duì)比實(shí)驗(yàn)中精確率和召回率均較高的模型.
圖8 不同流向的準(zhǔn)確率 (A) 比較Fig.8 Accuracy comparison of multiple accessibility prediction methods for different flows
圖9 不同流向的精確率 (P) 比較Fig.9 Precision comparison of multiple accessibility prediction methods for different flows
圖10 不同流向的召回率 (R) 比較Fig.10 Recall comparison of multiple accessibility prediction methods for different flows
本文所提出的方法(Proposed)雖然準(zhǔn)確率沒(méi)有提升,但是精確率和召回率都相對(duì)其他模型有了明顯上升.由圖11 可以看出,尤其是黃島區(qū)、膠州市、城陽(yáng)區(qū)這3 個(gè)流向,本文提出的模型對(duì)預(yù)測(cè)精度的提升最為明顯.F1-score 為精確率和召回率的調(diào)和平均值,可以反映出模型的整體性能,這表明本文所提出的可達(dá)性預(yù)測(cè)模型是有效的.
圖11 不同流向的F1-score 比較Fig.11 F1-score comparison of multiple accessibility prediction methods for different flows
本節(jié)中驗(yàn)證了不同屬性特征的有效性,包括車(chē)輛特征、貨物特征、終點(diǎn)特征、時(shí)間特征、環(huán)境特征.為此本文基于上述的數(shù)據(jù)集設(shè)計(jì)了1 組對(duì)比試驗(yàn),每個(gè)實(shí)驗(yàn)剔除其中一種屬性的特征.如表2 所示,根據(jù)實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),車(chē)輛特征和貨物特征對(duì)預(yù)測(cè)效果有顯著的影響,消除這兩個(gè)屬性會(huì)使得F1-score 指標(biāo)分別下降43%和20%.這與本文前述挑戰(zhàn)相符合,貨車(chē)運(yùn)輸行駛時(shí)間與網(wǎng)約車(chē)行駛時(shí)間預(yù)測(cè)中不同,網(wǎng)約車(chē)所在的城市路網(wǎng)場(chǎng)景中,其他條件不變時(shí),不同的司機(jī)不會(huì)導(dǎo)致行駛時(shí)間有較大差異,大多數(shù)出租車(chē)網(wǎng)約車(chē)司機(jī)都很有經(jīng)驗(yàn),對(duì)有限的路網(wǎng)非常熟悉,有相似的駕駛習(xí)慣[20],而鋼鐵物流中,由于運(yùn)輸時(shí)間長(zhǎng),路途遙遠(yuǎn),司機(jī)對(duì)路線和整個(gè)路網(wǎng)的熟悉程度不同,因此不同的司機(jī)駕駛習(xí)慣不盡相同,所以在此場(chǎng)景下,針對(duì)司機(jī)進(jìn)行個(gè)性化的返程預(yù)測(cè)非常重要.
表2 不同屬性特征的重要性分析Tab.2 Effect of attribute component on the accessibility prediction
本文將基于可達(dá)運(yùn)力集的可用運(yùn)力預(yù)測(cè)視為時(shí)間序列預(yù)測(cè)問(wèn)題,即根據(jù)可達(dá)運(yùn)力的歷史運(yùn)輸流向預(yù)測(cè)每個(gè)可達(dá)運(yùn)力在預(yù)期時(shí)間的承運(yùn)流向.本文選擇以下幾種模型進(jìn)行對(duì)比.
(1)直接法 (Direct)
直接法認(rèn)為貨車(chē)司機(jī)傾向于選擇歷史運(yùn)輸最多的流向.
(2)k-近鄰 (k-Nearest Neighbors,kNN)[21]
k-近鄰認(rèn)為如果1 個(gè)樣本在特征空間中的k個(gè)最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個(gè)類(lèi)別,則該樣本也屬于這個(gè)類(lèi)別.找到訓(xùn)練集樣本空間中的k個(gè)距離預(yù)測(cè)樣本x最近的點(diǎn),統(tǒng)計(jì)k個(gè)距離最近的點(diǎn)的類(lèi)別,找出個(gè)數(shù)最多的類(lèi)別,將x歸入該類(lèi)別.
(3)樸素貝葉斯 (Naive Bayes,NB)[22]
樸素貝葉斯是一種基于貝葉斯定理與特征條件獨(dú)立假設(shè)的分類(lèi)方法.對(duì)于給定的訓(xùn)練數(shù)據(jù)集,首先基于特征條件獨(dú)立假設(shè)學(xué)習(xí)輸入/輸出的聯(lián)合概率分布;然后基于此模型,對(duì)給定的輸入x,利用貝葉斯定理求出后驗(yàn)概率最大的輸出y.
(4)梯度提升決策樹(shù) (Gradient Boosting Decision Tree,GBDT)[23]
梯度提升決策樹(shù)是以CART 決策樹(shù)作為基學(xué)習(xí)器的boosting 集成學(xué)習(xí)算法,其中每一棵決策回歸樹(shù)學(xué)習(xí)的是之前所有樹(shù)的結(jié)論和殘差,通過(guò)擬合得到1 個(gè)當(dāng)前的殘差回歸樹(shù),其最終預(yù)測(cè)值等于所有回歸樹(shù)預(yù)測(cè)值之和.
(5)隨機(jī)森林 (Random Forest,RF)[19]
隨機(jī)森林是以決策樹(shù)為基學(xué)習(xí)器的bagging 集成學(xué)習(xí)算法,集成學(xué)習(xí)的核心思想就是將若干個(gè)弱(基) 分類(lèi)器組合起來(lái),得到1 個(gè)分類(lèi)性能顯著優(yōu)越的強(qiáng)分類(lèi)器.
(6) ARIMA (Auto-Regressive Integrated Moving Average)模型[24]
ARIMA 模型將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,根據(jù)差分后的平穩(wěn)序列建模預(yù)測(cè).
(7) 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)[7]
LSTM 是時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò),為解決一般的循環(huán)神經(jīng)網(wǎng)絡(luò)存在的長(zhǎng)期依賴問(wèn)題而提出,是具有長(zhǎng)短期記憶能力的神經(jīng)網(wǎng)絡(luò).
除直接法外,其他方法預(yù)測(cè)時(shí)均考慮了有運(yùn)輸需求流向的庫(kù)存和價(jià)格信息.選擇準(zhǔn)確率(A)作為評(píng)價(jià)指標(biāo),若預(yù)測(cè)的可達(dá)運(yùn)力傾向流向與司機(jī)實(shí)際選擇的流向相同,則認(rèn)為預(yù)測(cè)正確,否則預(yù)測(cè)錯(cuò)誤.具體實(shí)驗(yàn)對(duì)比結(jié)果見(jiàn)圖12.由圖12 可以發(fā)現(xiàn),LSTM 模型的準(zhǔn)確率(A)最高.盡管ARIMA 模型也是一種時(shí)序預(yù)測(cè)模型,但ARIMA 模型預(yù)測(cè)要求時(shí)間序列數(shù)據(jù)是穩(wěn)定的,且本質(zhì)上只能捕捉到線性關(guān)系,對(duì)于不穩(wěn)定數(shù)據(jù)ARIMA 模型無(wú)法有效捕捉規(guī)律.本文的預(yù)測(cè)序列為歷史承運(yùn)流向序列,會(huì)受到當(dāng)時(shí)的價(jià)格及車(chē)隊(duì)需求影響.使用ARIMA 模型的預(yù)測(cè)效果較差;LSTM 模型不僅可以捕捉到短期內(nèi)價(jià)格等因素變化的影響,也可以捕捉到長(zhǎng)期序列中司機(jī)對(duì)流向的偏好.因此,LSTM 模型預(yù)測(cè)效果最佳.
圖12 可用運(yùn)力預(yù)測(cè)模型效果對(duì)比Fig.12 Accuracy comparison of multiple available capacity prediction models
本文所提出的三階段運(yùn)力預(yù)測(cè)方法已成功應(yīng)用并部署于山東省某鋼鐵企業(yè)的在線物流平臺(tái),可支持山東省內(nèi)共136 個(gè)流向的運(yùn)力預(yù)測(cè),用于平臺(tái)上6 000 余輛注冊(cè)貨車(chē)的運(yùn)力調(diào)度.
本文針對(duì)鋼鐵物流的運(yùn)力調(diào)度決策提出了一種三階段的運(yùn)力預(yù)測(cè)模型,包括運(yùn)力候選集生成、候選運(yùn)力可達(dá)性預(yù)測(cè)與流向可用運(yùn)力預(yù)測(cè)等.基于運(yùn)單、車(chē)輛、運(yùn)輸終點(diǎn)與車(chē)輛軌跡等數(shù)據(jù),提取影響運(yùn)輸任務(wù)執(zhí)行時(shí)間與返程時(shí)長(zhǎng)的重要特征,通過(guò)引入雙層自注意力機(jī)制獲取不同特征的影響權(quán)重,有效解決了長(zhǎng)距離運(yùn)輸過(guò)程中的停留時(shí)長(zhǎng)不確定與返程軌跡缺失的問(wèn)題.基于真實(shí)數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)驗(yàn)證了本文所提方法的有效性.在未來(lái)的研究中,會(huì)結(jié)合車(chē)輛的實(shí)時(shí)位置以及鋼廠所在地的交通狀況進(jìn)一步提升運(yùn)力預(yù)測(cè)精度.
華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2022年5期