張若菡,何 穎
(1.湖南師范大學 數學與統(tǒng)計學院,湖南 長沙 410006;2.徐州工程學院 經濟學院,江蘇 徐州 221008)
發(fā)端于傳統(tǒng)社會的共享經濟作為一個新鮮事物在我們生活中的作用正日益凸顯。而享譽“中國新四大發(fā)明”之一的共享經濟代表—共享單車,因其方便快捷、低碳環(huán)保的使用特質,得到人們的廣泛認可,儼然已成為人們短途出行的重要交通工具之一,隨著在我國的迅速發(fā)展,現(xiàn)已推廣到國外。
毋庸置疑,共享單車以分時租賃的經營模式、便捷環(huán)保的使用方式,備受人們推崇,使其呈爆發(fā)式迅速增長,迅速普及,在某種程度上減緩了城市的擁堵狀況,減少了空氣污染,方便短途出行,但正是其使用時的“方便”,反而給共享單車在資源配置、管理調度上增加了困難,甚至有時反倒加劇了交通的擁堵[1]。隨著市場上共享單車保有量的迅速增大,使得車輛在資源配置、運營和管理中存在的問題日漸顯露。除了由于單車使用者個人素質差異造成的不按規(guī)定地點停放、亂停亂放、損壞車輛等不道德行為外,更大的問題是因行業(yè)競爭激烈,管理粗放,調度滯后,不能科學合理地配置資源、管理資源,不能科學預判投放數量,造成車輛投放地區(qū)不平衡[2]。經常出現(xiàn)有的地方車輛積壓阻礙交通,而有的地方又“一車難求”的局面,且共享單車運營公司“各自為政”,單車投放數量盲目,比例失衡,使得某些城市的單車數量超過城市容納量,造成極大的資源浪費。盡管很多共享單車公司為單車安裝了GPS定位系統(tǒng),能夠實現(xiàn)動態(tài)化地監(jiān)測車輛數據、騎行分布數據,但是如何充分利用智能化手段對共享單車科學調度、科學預測,提高車輛使用效率,減少擁堵發(fā)生,使共享單車這一新生事物健康有序的發(fā)展,是擺在我們面前亟待思考與解決的問題。
本文通過對北京市2017年一段時間內的共享單車使用情況的數據進行分析、挖掘,在數據預處理的基礎上,通過建立相應的數學模型,預測北京不同區(qū)域的共享單車靜態(tài)需求量以及居住區(qū)、教學區(qū)、商業(yè)區(qū)等不同區(qū)域共享單車靜態(tài)需求數量的分配權重,考慮動態(tài)時間因素和單車轉運的運輸成本、建筑分布以及總體均衡等因素,求出北京共享單車動態(tài)需求下的合理調度方案,最后給出共享單車的經濟效益分析,為共享單車在合理配置資源、科學調度、運營管理、收益分析等方面給出優(yōu)化建議,以期為共享單車這一“中國式創(chuàng)新”事物的健康發(fā)展,為城市管理者、共享單車運營者提供參考建議[3]。
由于采集得到的共享單車原始數據往往存在冗余、錯誤等問題,為了讓進一步的數據挖掘及統(tǒng)計性研究有效可行,首先對采集到的數據進行預處理。
搜集到的共享單車騎乘記錄數據共計20 000條。通過繪制數據散點圖,發(fā)現(xiàn)數據中有部分離群的異常點,于是運用LOF算法(局部異常因子算法)剝除了6個數據點,得到了19 994條可用數據。
2.2.1 空間特征分析。要想使資源分配趨于合理,需要分析不同時空下的共享單車的需求量。若僅對空間而言,共享單車的空間分布往往成集群分布,這體現(xiàn)了空間分布的不均衡性,而這種不均衡往往是不同空間所具有的固定屬性決定的。在分析空間分布與需求量的關系時,考慮了空間固有的四個不同的固定屬性,分別是:騎乘者基數、騎乘者密度、附近交通設施數與附近騎乘目的地密集度。
騎乘者基數可由常住人口密度決定,搜集的數據是2017年一段時間內北京市的騎乘數據,因此查找了北京市不同區(qū)域常住人口密度。對于空間中給定的坐標點,選定與其最近的區(qū)域中心人口密度近似替代該點的常住人口密度。根據調查,對于市區(qū)而言,共享單車往往會與其他公共交通工具起到競爭的關系,因此采集了北京市地鐵口的坐標,計算出這些坐標與騎車出發(fā)點的最短距離,作為第二項指標。
為了得到與騎乘者密度以及騎乘目的地相關的數據,通過K-means聚類算法,對騎行出發(fā)點與騎行目的地這兩項數據進行了聚類分析[4]。由于北京市面積較大,選擇使用30個質心進行聚類分析。經過多次迭代,得到聚類效果圖如圖1、圖2所示。
圖1 乘車起點聚類分析效果圖
圖2 乘車終點聚類分析效果圖
聚類分析得到的質心,雖然并不一定恰好與騎乘者最密集的中心,即騎乘者最常去的目的地相吻合,但相差不大,可忽略不計。通過Google地圖對聚類分析得到的質心進行了考察,發(fā)現(xiàn)質心基本都落在密集的居民區(qū)或商業(yè)區(qū),這也證明了前面的猜想。為了得到具體指標,參考LOF算法中的核心思想,將某一給定坐標點到騎乘出發(fā)點聚類質心的第k距離作為體現(xiàn)騎乘者密度的指標,將某一給定坐標點到騎乘目的地聚類質心的第k距離作為體現(xiàn)附近騎乘目的地密集度的指標。其中,第k距離即對于A3、A4指標,將乘車起點對于聚類質心的第k距離作為指標d(p,o)(兩點p和o之間的距離)。
對于點p的第k距離dk(p)定義如下:dk(p)=d(p,o),并且滿足在集合中至少有不包括p在內的k個點o'∈C{x≠p} ,滿足d(p,o')≤d(p,o);在集合中最多有不包括p在內的k-1個點滿足d(p,o')≤d(p,o);p的第k距離,也就是距離p第k遠的點的距離,不包括p,如圖3所示:
圖3 p的第k距離定義示意圖
這里選擇k=1,得到相應的指標后,在MATLAB上使用libsvm3.2通過支持向量機回歸建立空間特征與需求量的關系模型[5]。隨機選擇了1 000個數據作為訓練集,同時用100個數據作為測試。在進行支持向量機訓練時,使用差分進化算法,對支持向量機的兩個參數c、g進行優(yōu)化尋參數,其迭代過程如圖4所示。
圖4 差分進化算法迭代次數
最終構建了支持向量機回歸模型,其數據回測圖和殘差圖如圖5、圖6所示。
此處得到的預測值再乘以19 994,即為預測的單位空間內一天的共享單車需求數量。其中預測數據的均方誤差(MSE)為2.770 5×10-4。
2.2.2 時間特征分析。通過前面的分析,得到了支持向量機回歸模型,輸入四個指標即可得到某一空間一天的需求總量。下面,為了能得到某一空間在不同時間段中的需求量,對19 994條數據樣本進行了統(tǒng)計性分析,條形統(tǒng)計圖如圖7所示。
為了使需求量的預測結果盡量精確,將原本以分鐘為精確度的數據轉換為以小時為精確度的數據,由此可得到每小時不同時間段乘車數量的占比。故只需將支持向量機回歸預測得到的需求量與規(guī)定的時間段乘車數量的占比相乘即可獲得特定時空下的需求量。由此完整分析了不同時空下的需求量[6]。
2.2.3 各地區(qū)共享單車數量的分配權重。為了得到每個子空間內部的共享單車分配方案,選取了四個典型的地區(qū),以及五個主要因素建立需求最高地區(qū)的層次分析模型。如圖8所示。
圖5 SVR數據回測圖
圖6 殘差圖
圖7 時間分布條形統(tǒng)計圖
圖8 層次分析模型
根據共享單車的情況,結合層次分析結構中的各種因素,構造判斷矩陣如下:
通過求解得權重向量如下:
wA=(0.428 2,0.230 2,0.168 7,0.105 7,0.067 2),一致性比率為CRA=0.038 4;
wB1=(0.255 3,0.148 6,0.550 7,0.045 5),一致性比率為CRB1=0.049 0;
wB2=(0.255 3,0.148 6,0.550 7,0.045 5),一致性比率為CRB2=0.048 6;
wB3=(0.310 6,0.149 0,0.490 6,0.049 8),一致性比率為CRB3=0.071 8;
wB4=(0.295 4,0.137 9,0.490 4,0.076 3),一致性比率為CRB4=0.098 8;
wB5=(0.155 1,0.283 7,0.085 4,0.479 8),一致性比率為CRB5=0.043 2。
最后求得各地區(qū)對目標層的權重,即各地區(qū)共享單車數量的分配權重,見表1。
表1 各地區(qū)共享單車數量的分配權重
2.3.1 車輛流動模型。上一部分為了建立可以適用于整個大范圍區(qū)域,可以準確預測其每個各異的子空間共享單車需求量的回歸模型,更多地關注于不同區(qū)域不同地區(qū)固有的空間特征,選擇性地忽略了一些時間特征,因此建立的模型屬于靜態(tài)的需求量模型,可以反映某一區(qū)域某個特定時段對共享單車的需求量,卻無法反映某時段、某區(qū)域共享單車使用數量的變化,從而無法反映供求關系是否失衡。而解決共享單車調度問題,還需建立動態(tài)的車輛流動模型,在上一部分基礎上對該地區(qū)的共享單車動態(tài)變化進行進一步的分析。
實際生活中,共享單車的調度能力是有限的,考慮到調度中心人力資源有限這一影響因素,規(guī)定共享單車調度中心一天只進行兩次調度,分別對應于使用早高峰與晚高峰時段。定義時間t內單位子空間的需求變化量為Pt。通過計算早高峰時間段(07:00—09:00)和晚高峰時段(16:00—19:00)以及一整天的Pt,繪制出熱力圖,如圖9—圖11所示。
圖9 單日需求變化熱力圖
由熱力圖可以看出,無論是在早高峰還是晚高峰,需求量增加最多的地區(qū)基本處在北京市中心地帶。
2.3.2 共享單車動態(tài)需求量調度的雙目標規(guī)劃模型。為了能更好地分析整個北京城中的局部動態(tài)變化,將數據中所覆蓋的北京城區(qū),均勻地分為100個子空間,如圖12所示。由左上角第一個子區(qū)域開始向右分別標號為(1,2,…,100)。進而將問題轉化為研究每一塊子空間之間共享單車數量的變化量以及共享單車調度方法。通過MATLAB中的numel函數得到了將北京市劃分為100個均勻子區(qū)間后的需求矩陣,并分別計算了早高峰以及晚高峰的需求變化量矩陣。
圖10 早高峰需求變化熱力圖
圖11 晚高峰需求變化熱力圖
圖12 北京市空間分區(qū)圖
為了建立共享單車的調度方案,依據計算得到的早、晚高峰期需求變化矩陣,將這些子空間劃分為供不應求、供給過剩、供求均衡三種類型。這里選擇Pt<0為供不應求,Pt>0為供給過剩,Pt=0為供求均衡。在調度方案中,由供給過剩的子空間向供不應求的子空間調度共享單車,而供求均衡的子空間則可以根據子空間中實際的建筑分布情況,派遣人員對子空間中的共享單車按照靜態(tài)的需求量模型中的權重比例進行調度。對于供給過剩與供不應求的子空間,定義了全局共享單車分布不均衡度K。
為了讓整個市區(qū)在全局上擁有良好的共享單車分布狀態(tài),需要讓子空間互相調度單車,從而令目標K最小化。而對于每個子空間自身的內部調度,則需要考察子空間內的建筑分布,按照靜態(tài)的需求量模型中的結論進行調度[7]。在保證全局均衡度盡可能達到目標的前提下,考慮到北京市區(qū)空間跨度大,單車的轉運需要耗費較多的財力、人力,建立雙目標規(guī)劃模型如下。
目標函數為:
約束條件為:
在目標規(guī)劃中,單車空間分布的不合理將會造成乘客使用率減少,交通阻塞等現(xiàn)象。這些現(xiàn)象均會直接或間接地對經濟造成一定的影響,故可以對兩個目標進行加權,此處對運輸成本加權d0,從而將雙目標規(guī)劃問題轉換為單目標規(guī)劃。
使用模擬退火算法對上述模型進行求解,求解步驟如下:
(1)求解貨車行駛距離。A、B兩點的地理坐標分別為(x1,y1),(x2,y2),由于地球表面不是平面而是球面,故兩點的實際距離為A、B兩點的劣弧長。地球半徑為R=6 370km,則A、B兩點坐標可表示為:
A、B兩點實際距離為:
由式(5)可以得到兩個子空間的實際距離,用以近視替代貨車行駛的路程。
(2)產生初始解。通過rand函數隨機獲得一個匹配矩陣與匹配權重矩陣,通過多次循環(huán)選擇其中目標值D最小的兩個矩陣作為初始解。
(3)產生新解。通過rand函數獲得隨機的nk與兩個隨機的nl的新匹配方式,以及隨機分配的新權重。
(4)計算適應性,重復直到退火過程結束。如果新的匹配方式與權重得到的目標值更小,則將匹配方式與權重替換掉原本的匹配矩陣與匹配參數。
此處由于篇幅問題,僅給出求解得出的早高峰過后的調度方案,見表2。
目前,共享單車企業(yè)資金來源為融資和投資,主要收入來源為單車租金。在共享單車的運營過程中,大多數都出現(xiàn)了虧損的現(xiàn)象。由于共享單車押金、融資方面的內容缺少數據支撐,暫不對這些方面進行分析,沿用前面的結論,僅就收取騎乘費這一方面,提出新的經營模式并進行論證。傳統(tǒng)的騎乘費用都以騎乘時長為主要參考度,對于使用過程中出現(xiàn)的特殊情況,如惡意毀壞單車時會加收騎乘費等不做考慮。利用共享單車的時間分布具有雙峰性,而空間上具有集群性這些特點,可以考慮在騎乘高峰期加收費用,即于早07:00—09:00,晚16:00—19:00這兩個時間段進行騎乘費用的加收。同時可以在節(jié)假日提供免費騎乘的活動作為加收騎乘費用的補償。
表2 早高峰過后的調度方案
根據上面的運營方案,使用計算機進行模擬,在周一至周六的騎乘高峰期進行50%的費用加收,而周日全天免費使用。根據模擬得到這樣的結果:傳統(tǒng)收費方式一周僅獲利139 958元,采用高峰時段加收費,周末回饋的方式,一周可以獲利146 013元。提高使用高峰期收費所得利潤如圖13所示。
據此,又對10%—100%的提價區(qū)間進行了進一步分析,發(fā)現(xiàn)若乘客的騎乘數量不減少,僅需要提高40%的騎乘費即可達到傳統(tǒng)收益的水平[8]。但由于市場經濟規(guī)律的影響,騎乘費的提高往往會帶來騎乘數量的下降,所以要想對這個問題進行精確的研究,還需要再對不同品牌的共享單車之間的競爭因素做進一步調查,從而得到更多的數據再做進一步分析。
圖13 提高高峰期收費利潤
本文對北京市2017年一段時間內的共享單車使用情況進行了數據分析和挖掘,通過建立數學模型,預測了北京不同區(qū)域的共享單車靜態(tài)需求量以及居住區(qū)、教學區(qū)、商業(yè)區(qū)等不同區(qū)域共享單車靜態(tài)需求數量的分配權重,考慮動態(tài)時間因素和單車轉運的運輸成本、建筑分布以及總體均衡等因素,求出了北京共享單車動態(tài)需求下的合理調度方案,最后,給出了共享單車的經濟效益分析。該研究結果符合北京市共享單車的實際情況,為解決共享單車的需求、調度、管理等提供了一定的決策參考。同時,該研究方法也為其他城市解決共享單車問題提供了參考建議。