李佳駿,王永忠,王楷文,張啟凡,萬連成
(中國民用航空飛行學(xué)院 空中交通管理學(xué)院,四川 廣漢 618307)
隨我國無車承運行業(yè)的逐步興起,承運線路的科學(xué)問價是眾多無車承運人平臺亟待解決的問題.無車承運人[1]是以承運人身份與托運人簽訂運輸合同,自愿按合同承擔(dān)承運人的責(zé)任與義務(wù),通過無車承運人平臺委托實際承運人完成運輸任務(wù)的道路貨運經(jīng)營者.該平臺具有網(wǎng)絡(luò)效應(yīng)明顯、資源整合能力強、品牌效應(yīng)廣等特點,利用互聯(lián)網(wǎng)手段和組織模式創(chuàng)新,有效促進貨運市場的資源集約整合和行業(yè)規(guī)范發(fā)展,對于促進物流貨運行業(yè)的轉(zhuǎn)型升級和提質(zhì)增效具有重要意義[2].國內(nèi)的無車承運模式主要由貨主、無車承運人平臺和承運人組成.由貨主通過平臺發(fā)單,經(jīng)平臺信息匹配后由車主接單并進行實際的運輸任務(wù).
從無車承運人的視角來考慮,面向廣大擁有運力資源的承運端司機.司機參考承運路線任務(wù)發(fā)布的價格并以此決定是否要承運此運輸任務(wù).為保證任務(wù)的承運,平臺會采取動態(tài)定價的方式,若任務(wù)未被接單承運,將帶來一定損失.如果在一段規(guī)定時間內(nèi),司機未有接單,則這條路線可以進行適度調(diào)價.每條線路任務(wù)最多允許發(fā)布3次價格,首次發(fā)布之后仍可進行兩次刷新[3].快速成交和較低的承運成本是無承運人平臺當(dāng)前最關(guān)注的目標(biāo).
為快速成交和降低承運成本,首先應(yīng)當(dāng)解決無車承運人平臺的定價問題.文中通過定量分析的方法,欲探索影響無車承運人平臺進行運輸線路定價的主要因素.利用數(shù)理統(tǒng)計的方式來分析這些問題,對這些因素進行相關(guān)性的分析并降維,確定影響定價的因素.
根據(jù)前期收集的數(shù)據(jù),建立對成交貨運路線歷史交易數(shù)據(jù)中的定價進行評價的數(shù)學(xué)模型.對歷史交易數(shù)據(jù)的定價進行評價,需要找出與定價最相關(guān)的指標(biāo),使用這些指標(biāo)再利用評價算法來建立所需的評價模型.
建立有關(guān)路線定價的數(shù)學(xué)模型,探索出關(guān)于路線任務(wù)的總成本定價以及3次報價.給出調(diào)價策略,評價對線路任務(wù)所給出的定價.要給出定價需要對前期的數(shù)據(jù)進行擬合分析,得到定價與指標(biāo)之間的相關(guān)性,基于擬合模型對數(shù)據(jù)指標(biāo)進行擬合預(yù)測從而得到所需的3次報價及總成本.最終可以根據(jù)得到報價后的調(diào)價系數(shù)來給出調(diào)價策略,促進快速成交和降低承運成本.
由于數(shù)據(jù)量非常龐大,為使得建立的模型更加準(zhǔn)確的得出路線價格,需要對數(shù)據(jù)進行分析并通過相應(yīng)的方法對其進行數(shù)據(jù)的預(yù)處理,這有利于后續(xù)模型的建立與求解.
通過對數(shù)據(jù)體的分析,將變量分為3類:文本說明變量,定量描述變量,事件類型變量.其中文本說明變量主要指數(shù)據(jù)的基本特征和完整情況,如任務(wù)ID、始發(fā)時間、出發(fā)省份等.定量描述變量主要描述數(shù)據(jù)的真實值,如路線價格、調(diào)價比例等.事件類型變量描述數(shù)據(jù)的類別,如業(yè)務(wù)類型、需求類型、是否續(xù)簽等.
為更好的找出影響無車承運人平臺進行貨運線路定價的主要因素,首先對與定價無較強相關(guān)性的因素進行刪除
在得到較為相關(guān)的變量之后對這些變量的含缺失值樣本進行刪除,從而得到預(yù)處理后的數(shù)據(jù)樣本.
在結(jié)束數(shù)據(jù)的預(yù)處理之后需要對影響定價的主要因素進行篩選,對于數(shù)據(jù)進行降維的算法有很多,但因為變量中含有轉(zhuǎn)為虛擬變量的事件類型變量,所以不能使用主成分分析、因子分析等來對定量變量進行降維算法處理,故選擇逐步回歸法對所有變量進行降維,并且主要考慮事件類型變量的選擇,再用R聚類對定量變量進行降維,同時也可以驗證定量變量選擇的準(zhǔn)確性.
1.2.1 逐步回歸算法
逐步回歸模型有3種操作方法[4].
1) 向前選擇 首先模型中只有一個單獨解釋因變量變異最大的自變量,之后嘗試將加入另一自變量,加入后整個模型所能解釋的因變量變異是否顯著增加這一過程反復(fù)迭代,最終達到?jīng)]有其他自變量還能符合加入模型的條件.
2) 向后消除 把所有變量全部放入模型中,再把其中一個自變量剔除,由此來探尋整個模型解釋因變量的變異是否產(chǎn)生了顯著的變化,然后將其中解釋量減少得最少的變量進行剔除;再由此過程進行不斷迭代,一直要等到?jīng)]有多余自變量再能符合剔除的條件即可.
3) 雙向消除 對整個模型中的所有變量進行檢驗,剔除作用不顯著的變量.目的在于盡量能夠得到一個最優(yōu)方案的變量組合結(jié)果.
再進行回歸前對選擇的變量進行描述性的統(tǒng)計,計算得到各變量之間的相關(guān)系數(shù).斯皮爾曼相關(guān)系數(shù)并沒有皮爾遜相關(guān)系數(shù)高,但皮爾遜系數(shù)要求數(shù)據(jù)的連續(xù)、正態(tài)性和線性相關(guān)性.為此本文還選取變量繪制了正態(tài)分布Q-Q圖,如圖1和圖2所示.
圖1 車輛長度與正態(tài)分布的Q-Q圖
圖2 線路總成本與正態(tài)分布的Q-Q圖
由2幅Q-Q圖上所描繪點并不近似于一條直線可以看出,存在變量不服從正態(tài)分布的問題.所以這里選擇使用斯皮爾曼相關(guān)系數(shù).
文中選用向前選擇算法[5]剔除冗余變量后得到的32個剩余變量來建立模型并進行求解,得到顯著性變量18個,模型匯總表和模型評價表如表1和表2所示.
表1 模型匯總
表2 模型評價
為檢驗剔除過后的變量是否還存在多重共線性的問題,對變量的膨脹因子進行求解得到Mean VIF>10 說明存在多重共線性問題,評價可能失真,此時需要對變量進行進一步的篩選.采用Rlasso算法來對變量進行篩選,Rlasso是一種嚴格的懲罰方法,它可以控制過度擬合.最終得到相關(guān)變量及系數(shù)如表3所示.
表3 最終變量
1.2.2 R型聚類算法及求解
R型聚類是一種聚類方法,一般用于對指標(biāo)進行降維處理[6].通過編程建立模型[7]并將定量描述變量代入運行得到聚類樹狀圖,如圖3所示.
圖3 聚類樹狀圖
從圖3可以看出指標(biāo)總里程、線路總成本、線路指導(dǎo)價(總成本)具有較大的相關(guān)性,最先被聚類到一起.將指標(biāo)分為4類,每一類指標(biāo)以及最終確定的4個代表性指標(biāo)如表4所示.
表4 各類別指標(biāo)基本信息
從以上結(jié)果可得出,交易成功時長與其他指標(biāo)存在區(qū)別,各為一類,其他類中各指標(biāo)均有明顯相關(guān)的聯(lián)系.一般來說這幾類數(shù)據(jù)都與最終的線路定價有相關(guān)性,這也說明本模型對于該問題具有較好的適應(yīng)性.
要對已成交的貨運線路歷史交易數(shù)據(jù)中的定價進行評價,首先要選擇合適的評價指標(biāo).因無車承運人在當(dāng)前階段較為關(guān)注的問題是如何快速成交并降低承運成本,結(jié)合表4中的代表性指標(biāo),如線路指導(dǎo)價、線路價格、交易成功時長、線路總成本等因素,對已經(jīng)成交貨運線路歷史交易數(shù)據(jù)中的定價來進行評價.
專家打分法是一種定性描述定量化方法,它首先根據(jù)評價對象的具體要求選定若干個評價項目,在根據(jù)評價對象的具體要求選定若干評價指標(biāo)[8].根據(jù)指標(biāo)定出標(biāo)準(zhǔn),聘請若干專家憑借自己的經(jīng)驗按此評價標(biāo)準(zhǔn)來給出各個項目的評價分值,并對其進行集結(jié)[9].其公式為:
(1)
其中W代表評價對象的總分值;n代表指標(biāo)項數(shù);wi代表第I項指標(biāo)得分值.
1) 經(jīng)專家打分法得到的各項權(quán)指標(biāo)權(quán)重如表5所示.
表5 指標(biāo)權(quán)重
3) 數(shù)據(jù)歸一化處理,為了消除不同量綱對評價結(jié)果的影響,使用評價指標(biāo)在同一個量綱體系下進行比較,需要對原始數(shù)據(jù)進行歸一化處理.處理方法為:
i=1,2,…,160 008,j=1,2,3,4.
(2)
4) 確定最劣向量Z-和最優(yōu)向量Z+,其中Z-為同一指標(biāo)的最小歸一化值,而為Z+同一評價指標(biāo)的最大歸一化值.
5) 計算各樣本與理想解的加權(quán)歐式距離[10]及各歷史訂單與理想解之間的相對接近程度
(3)
(4)
6) 對得到的結(jié)果進行排序,得到專家打分—Topsis模型計算的點單ID得分排序.
要給出所得數(shù)據(jù)的3次報價及總成本的定價,其實也就是結(jié)合前期求得數(shù)據(jù)中指標(biāo)與定價之間的相關(guān)聯(lián)系,將相關(guān)指標(biāo)通過這種相關(guān)聯(lián)系映射成3次的定價.為了方便之后對建立的模型進行評價,故選擇線路成本、線路指導(dǎo)價、線路價格、交易時長為輸出變量.
BP是一種為減小誤差使網(wǎng)絡(luò)的誤差平方和最小而通過梯度下降的學(xué)習(xí)方式反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值從而達到目標(biāo)參數(shù)的多隱含層層前饋網(wǎng)絡(luò)[11].高斯-牛頓法為避免發(fā)散可以調(diào)節(jié)下降步伐和方向[12].當(dāng)發(fā)現(xiàn)網(wǎng)絡(luò)訓(xùn)練梯度下降過快的時候,應(yīng)當(dāng)合理采用偏小的下降系數(shù),從而使其更相似于高斯牛頓法,反之,當(dāng)發(fā)現(xiàn)網(wǎng)絡(luò)訓(xùn)練梯度下降過慢時,應(yīng)選用偏大下降系數(shù),使其更相似于梯度下降法.
通過Matlab神經(jīng)網(wǎng)絡(luò)工具箱設(shè)置參數(shù)并訓(xùn)練輸出得到結(jié)果,其學(xué)習(xí)誤差在迭代數(shù)64處達到最小.模型總擬合度達到 0.994 52,如圖4和圖5所示.
圖4 學(xué)習(xí)誤差下降曲線
圖5 模型擬合度檢驗
貝葉斯決策理論是主觀貝葉斯派歸納理論的重要組成部分.貝葉斯決策就是在不完全情報下,對部分未知的狀態(tài)用主觀概率估計,然后用貝葉斯公式對發(fā)生概率進行修正,最后再利用期望值和修正概率做出最優(yōu)決策[13].該算法通常需要更多時間,但是對于困難,較小或嘈雜的數(shù)據(jù)集,可以得到很好的概括.訓(xùn)練根據(jù)自適應(yīng)減重(正則化)停止.
通過Matlab神經(jīng)網(wǎng)絡(luò)工具箱設(shè)置參數(shù)并訓(xùn)練輸出得到結(jié)果,其學(xué)習(xí)誤差在迭代數(shù)216時達到最小,模型總擬合度達到 0.994 82,如圖6和圖7所示.
圖6 學(xué)習(xí)誤差下降曲線
圖7 模型擬合度檢驗
共軛梯度法能夠有效改善前饋神經(jīng)網(wǎng)絡(luò)的明顯缺陷,例如局部震蕩和收斂速度低.采用共軛梯度法會在共軛梯度方向進行修正權(quán)值的操作,并采用概率接受原則來對是否需要進行目標(biāo)函數(shù)變化進行判斷,共軛梯度法具有較快的全局收斂性[14].此算法需要較少的內(nèi)存.當(dāng)通用性停止改善時,訓(xùn)練會自動停止,驗證樣本的均方誤差增加.
通過Matlab神經(jīng)網(wǎng)絡(luò)工具箱設(shè)置參數(shù)并訓(xùn)練輸出得到結(jié)果,其學(xué)習(xí)誤差在迭代數(shù)158時達到最小,模型總擬合度達到 0.993 55,如圖8、圖9所示.
圖8 學(xué)習(xí)誤差下降曲線
為選取最優(yōu)的預(yù)測模型,需要對上述3個模型的運行結(jié)果進行對比評價,如表6所示.
表6 模型評價
綜合3個指標(biāo)來看Levenberg-Marquardt是最優(yōu)的模型,故使用它來對評價模型中的指導(dǎo)路線價格、路線價格、總成本以及交易時間來進行預(yù)測.其中指導(dǎo)價格對應(yīng)第一次報價,路線價格對應(yīng)第三次報價.由于前期數(shù)據(jù)未求出第二次報價,所以本文采用線性插值的方法來對第二次報價進行求解,調(diào)價策略由計算調(diào)價比例得到.
圖9 模型擬合度檢驗
隨著我國無車承運行業(yè)的快速發(fā)展,各類商業(yè)模式迎來了百花齊放的時段.預(yù)計到達2020年年初的時候,在200多家的無車承運人試點當(dāng)中,將會有45.6%是屬于合同物流的業(yè)務(wù),而大約66.4%將會從事與普貨運輸相關(guān)的領(lǐng)域,另外,其中的47.7%左右會選擇從事傳統(tǒng)物流與互聯(lián)網(wǎng)轉(zhuǎn)型這樣的綜合業(yè)務(wù),除此之外還有47%是有關(guān)于互聯(lián)網(wǎng)加物流的另一種綜合業(yè)務(wù),這類平臺在貨運行業(yè)的集約化程度已經(jīng)可以看做十分健全有力了,在未來將整合社會零散運力大約135.1萬輛,高效提升相關(guān)行業(yè)的集約程度,提高運轉(zhuǎn)效率,但與之密切相關(guān)的承運線路科學(xué)合理定價問題卻是大多數(shù)無車承運人平臺急迫需要解決的.團隊一直密切關(guān)注無車承運人平臺科學(xué)定價問題,進行了積極研究,并依據(jù)文中所述的研究方法與結(jié)論,對無車承運人平臺的科學(xué)定價提出以下看法與建議:
從所得出的相關(guān)系數(shù)表中可以看出,線路總成本是線路定價和線路指導(dǎo)價的最主要影響變量之一,其間滿足強烈的正相關(guān);而線路總成本又與總里程、車輛長度、車輛噸位有強烈的正相關(guān)關(guān)系;與運輸?shù)燃壟c運輸?shù)貐^(qū)也有一定的相關(guān)關(guān)系.所以總里程較大、車輛長度與噸位較大時,線路的總成本就會較大,所以定價應(yīng)該相對較高.
將已成交貨運線路歷史交易中的定價數(shù)據(jù)進行TOPSIS法建立了評價模型,并證實了基于TOPSIS評價模型而得到的評價效果能夠適用于該平臺的評價體系.
關(guān)于線路定價的數(shù)學(xué)模型,利用3種算法建立不同的BP神經(jīng)網(wǎng)絡(luò)模型,并利用現(xiàn)有的數(shù)據(jù)對3種模型的擬合效果做了對比,在考慮時間和擬合精度的情況下得到了最優(yōu)的Levenberg-Marquardt-BP做為預(yù)測模型,為無車承運人平臺的定價問題提供了參考.