阮永嬌,陳 昕,孫承臻,陳婭鑫
零擔(dān)貨物快遞服務(wù)公司自動匹配研究
阮永嬌,陳 昕,孫承臻,陳婭鑫
(遼寧工業(yè)大學(xué) 汽車與交通工程學(xué)院,遼寧 錦州 121001)
研究零擔(dān)貨物快遞服務(wù)公司自動匹配,研究SVM自動匹配方法,依據(jù)零擔(dān)貨物快遞服務(wù)需求自動匹配出最適合的快遞公司,研究方法是基于機器學(xué)習(xí),借助已有的人工匹配數(shù)據(jù)構(gòu)建的數(shù)據(jù)集,通過python編程,用訓(xùn)練集訓(xùn)練零擔(dān)貨物快遞服務(wù)公司自動匹配的機器學(xué)習(xí)模型,驗證集驗證自動匹配效果。驗證集評估結(jié)果表明,SVM自動匹配方法,根據(jù)零擔(dān)需求進行快遞服務(wù)公司的自動匹配,匹配時間僅為1.89 s,精度達到0.90,自動匹配方法能夠高效恰當(dāng)?shù)貫榱銚?dān)需求匹配出適合的快遞公司,使得零擔(dān)貨物快遞的供需雙方高度契合。本文研究可以幫助物流服務(wù)公司節(jié)約匹配成本,提高匹配效率,增強公司競爭力,同時為機器學(xué)習(xí)中SVM的應(yīng)用提供思路和參考依據(jù)。
零擔(dān)貨物快遞;快遞需求;快遞公司;自動匹配;SVM
在零擔(dān)貨物快遞時,需要根據(jù)貨物自身的特點對眾多快遞公司的快遞價格,平均服務(wù)水平和服務(wù)范圍等多個因素進行考察,匹配出最適合零擔(dān)貨物的快遞公司提供快遞服務(wù)。目前零擔(dān)貨物快遞需求與快遞公司的匹配主要由人工完成。表1是某公司零擔(dān)貨物快遞服務(wù)信息的原始數(shù)據(jù)表。
表1 原始數(shù)據(jù)表
編號發(fā)貨省份配送時效發(fā)貨數(shù)量發(fā)貨品種數(shù)出庫包裹數(shù)稱重重量快遞公司 0海南省正常送達2211.41韻達快遞 1吉林省正常送達1114.043重貨-吉林黃馬甲 2湖南省正常送達2111.511韻達快遞 3上海正常送達2111.41韻達快遞 4天津次日達8118.095晟邦-快消 5廣東省正常送達8119.56韻達快遞 ······································· 10490山西省次日達4311.051建華快遞 10491廣東省正常送達12413.499韻達快遞 10492遼寧省正常送達3114.051重貨-遼寧黃馬甲 10493北京當(dāng)日達2210.884萬象-自營 10494黑龍江省正常送達1110.32EMS-落地配 10495福建省正常送達4111.577韻達快遞 ······································· 20981廣東省正常送達1110.57韻達快遞 20982北京次日達3110.46韻達快遞 20983貴州省正常送達4212.737韻達快遞 20984江蘇省正常送達2211.43韻達快遞 20985黑龍江省正常送達3110.47EMS-落地配 ······················································ 41959湖北省正常送達4210.776韻達快遞 41960天津次日達4212.737晟邦-快消 41961山東省正常送達4411.52山東遞速 41962北京次日達1114.77萬象-自營 41963河北省正常送達1114.468萬象-自營 ······················································
原始數(shù)據(jù)表中,每一條零擔(dān)貨物快遞需求對應(yīng)1條人工匹配記錄,8列數(shù)據(jù)字段中,第1列是數(shù)據(jù)樣本編號、發(fā)貨省份、發(fā)貨數(shù)量、發(fā)貨品種數(shù),出庫包裹數(shù)和稱重重量6列數(shù)據(jù)字段表示零擔(dān)貨運的6個特征數(shù)據(jù),其中發(fā)貨省份代表該零擔(dān)貨物要求發(fā)往的省份;配送時效代表貨物要求配送的時間包括當(dāng)日達、次日達和正常送達3種不同的要求;發(fā)貨數(shù)量代表零擔(dān)貨物的發(fā)貨數(shù)量;發(fā)貨品種數(shù)代表零擔(dān)貨運中所發(fā)貨物的品種數(shù);出庫包裹數(shù)代表貨物打包完成后的包裹數(shù)量;稱重重量代表包裹的最終稱重的重量,單位是kg。最后一列“快遞公司”,是根據(jù)快遞需求,人工匹配的快遞公司的匹配結(jié)果,包含EMS-落地配、晟邦快消、建華快遞、山東遞速、萬象-自營、韻達快遞、重貨-吉林黃馬甲、重貨-遼寧黃馬甲8家公司,分析表1數(shù)據(jù)可知,EMS-落地配服務(wù)水平較高,服務(wù)范圍較廣,成本低,但速度相對較慢;晟邦快消和建華快遞運送效率高,但發(fā)貨前等待時間較長;山東遞速、重貨-吉林黃馬甲和重貨-遼寧黃馬甲運送范圍小,集散過程少;萬象-自營運送時間短,范圍廣,但成本較高;韻達快遞服務(wù)范圍較廣,成本低,但速度相對較慢且服務(wù)水平相對較低。
人工匹配快遞公司的方法,是人工從可供選擇的公司中匹配出適合的快遞公司,在滿足零擔(dān)貨物快遞需求的前提下,根據(jù)公司特點結(jié)合零擔(dān)貨物的6項特征值,對各個快遞公司的費用、服務(wù)水平、服務(wù)范圍進行比較,篩選出相對比較適合的快遞公司,完成零擔(dān)需求與快遞公司的匹配。
但是隨著經(jīng)濟的發(fā)展,零擔(dān)快遞需求數(shù)量和快遞公司數(shù)量不斷增大,這使得人工匹配的工作量增加,匹配時間加長,從而導(dǎo)致匹配工作效率下降、匹配的準(zhǔn)確率下降,所以急需自動匹配方法。
機器學(xué)習(xí)主要研究如何借助已有的數(shù)據(jù),學(xué)習(xí)人類的學(xué)習(xí)行為。應(yīng)用最廣的機器學(xué)習(xí)方法有線性模型、決策樹、神經(jīng)網(wǎng)絡(luò)、貝葉斯分類器、聚類、支持向量機等[1]。線性模型適用于具有線性相關(guān)性的相關(guān)問題[2];決策樹適合于多目標(biāo)逐一分層討論問題;神經(jīng)網(wǎng)絡(luò)適合各因素間相互影響的分類問題,同時由于激活函數(shù)的特性多用于二分類問題;貝葉斯分類器使用范圍較廣但準(zhǔn)確率較低,聚類用于求解分類問題的聚類中心[3]。
支持向量機(support vector machine,SVM)適合于線性非線性的選擇分類問題,是機器學(xué)習(xí)中的一個重要模型,廣泛應(yīng)用于數(shù)據(jù)分析、模式識別和數(shù)據(jù)挖掘等多個領(lǐng)域,并能夠推廣應(yīng)用到函數(shù)擬合等其他機器學(xué)習(xí)問題中[4]。
快遞公司自動匹配問題,可供匹配選擇的快遞公司有多個,已經(jīng)不是簡單的二分類問題,同時影響匹配結(jié)果的特征共有6個,這6個因素隨機分布,且彼此之間相互影響較低或者彼此互不影響。SVM方法在解決小樣本、非線性及高維的分類問題時具有優(yōu)勢,SVM模型分類效果好,可以有效處理高維空間數(shù)據(jù)。因此,本文采用SVM方法研究快遞公司自動匹配。其具體算法如下:
Step1:將A公司已有的人工匹配數(shù)據(jù)計劃分為訓(xùn)練集(X1,Y1)和測試集(X2,Y2)。
Step2:選取核函數(shù)(x,y),構(gòu)造相應(yīng)的凸二次規(guī)劃問題:
為明確各試樣調(diào)制系數(shù)隨電壓的增長速率,對特定激勵超聲頻率的各階模態(tài)調(diào)制系數(shù)曲線進行一元線性回歸分析,即根據(jù)若干實測點確定調(diào)制系數(shù)y與低頻電壓x的關(guān)系,回歸函數(shù)記為
Step5:得到支持向量機模型:
SVM機器學(xué)習(xí)算法訓(xùn)練流程如圖1所示。
圖1 算法訓(xùn)練流程
自動匹配python實現(xiàn),是根據(jù)A公司零擔(dān)貨物快遞服務(wù)信息的原始數(shù)據(jù)表,借助已有的人工匹配數(shù)據(jù)構(gòu)建SVM模型學(xué)習(xí)的數(shù)據(jù)集,利用留出法將數(shù)據(jù)集劃分成互斥的訓(xùn)練集的和測試集,然后通過訓(xùn)練集訓(xùn)練SVM模型,利用測試集對自動匹配模型進行評估。
數(shù)據(jù)集中,發(fā)貨省份和配送時效2個屬性只需要用不同數(shù)字進行區(qū)分,不同省份的數(shù)字之間沒有大小關(guān)系,需要進行獨熱編碼處理,獨熱編碼是借助不同的數(shù)字表示離散屬性的不同表現(xiàn)狀態(tài)。利用獨熱編碼處理數(shù)據(jù)時,處理后的離散屬性沒有大小的含義,只是代表了一種屬性表現(xiàn)形式。利用python編程將數(shù)據(jù)集中發(fā)貨省份和配送時效2個屬性進行獨熱編碼處理,獨熱編碼具體結(jié)果如表2、表3所示。
表2 發(fā)貨省份獨熱編碼表
原數(shù)據(jù)集屬性值獨熱編碼值 山西省0 西藏自治區(qū)1 重慶2 陜西省3 新疆維吾爾自治區(qū)4 吉林省5 四川省6 廣東省7 遼寧省8 青海省9 北京10 河北省11 天津12 湖北省13 浙江省14 貴州省15 云南省16 福建省17 寧夏回族自治區(qū)18 廣西壯族自治區(qū)19 上海20 內(nèi)蒙古自治區(qū)21 安徽省22 山東省23 江西省24 海南省25 河南省26 江蘇省27 湖南省28 黑龍江省29 甘肅省30
表3 配送時效獨熱編碼表
原數(shù)據(jù)集屬性值獨熱編碼值 當(dāng)日達0 次日達1 正常送達2
在進行機器學(xué)習(xí)模型訓(xùn)練時,需要將數(shù)據(jù)集劃分為互斥的訓(xùn)練集與測試集,為了更好地檢測匹配模型的泛化能力,本文采用留出法進行數(shù)據(jù)集劃分,將數(shù)據(jù)集劃分為2個互斥的組合,其中一個作為訓(xùn)練集,一個作為測試集。訓(xùn)練集對模型進行訓(xùn)練,測試集用來對模型進行評估,劃分結(jié)果如表4、表5所示,其中表4為訓(xùn)練集,大小為33 570×6,表5為測試集,大小為8 393×6。
表4 訓(xùn)練集數(shù)據(jù)表
訓(xùn)練集編號原數(shù)據(jù)集編號發(fā)貨省份配送時效發(fā)貨數(shù)量發(fā)貨品種數(shù)出庫包裹數(shù)稱重重量 001202211.41 111401114.043 22902111.511 34718118.095 452208119.56 ························ 1539719200712118.593 15398192011403110.47 15399192021103212.107 1540019203713110.51 15401192062702115.575 ························ 33566419575021226.568 33566419581504210.776 33567419602704411.52 33568419611911114.77 33569419622801114.468
表5 測試集數(shù)據(jù)表
訓(xùn)練集編號原數(shù)據(jù)集編號發(fā)貨省份配送時效發(fā)貨數(shù)量發(fā)貨品種數(shù)出庫包裹數(shù)稱重重量 031102111.41 18712217.474 210714312.83 3191914114.362 4239012512.894 ························ 4058200881102210.876 4059200931402112.422 4060201021401114.653 4061201032801111.189 4062201122201110.74 ····················· 8388419372911110.335 8389419422202111.423 8390419451911110.78 8391419482701117.22 839241959714212.737
用訓(xùn)練集數(shù)據(jù)進行SVM的訓(xùn)練,借助python編程,從sklearn工具庫中直接調(diào)用SVM函數(shù)進行訓(xùn)練[5]。基于每個樣本中包含發(fā)貨省份,發(fā)貨數(shù)量,發(fā)貨品種數(shù),出庫包裹數(shù)和稱重重量工6項特征值,選用高斯核即核函數(shù)(kernel)為rbf,選用停止訓(xùn)練的誤差大小(tol)為0.001,最大迭代次數(shù)(max_iter)為-1,可以使得在訓(xùn)練時只要誤差大于0.001模型就會進行優(yōu)化,且不限制優(yōu)化次數(shù),直至訓(xùn)練的誤差小于0.001,程序代碼與運行結(jié)果如表6所示。
通過python編程,針對最終模型通過測試集數(shù)據(jù)進行評估,機器學(xué)習(xí)自動匹配模型對測試集8 393條數(shù)據(jù)進行匹配時所用時間為1.97 s。人工匹配,人查看需求,選快遞公司,點擊鼠標(biāo),最快按1 s一條數(shù)據(jù)計算人工匹配所需時間,最少需要8 393 s,自動匹配所用時間遠遠小于人工匹配的所用時間,并且8 393條數(shù)據(jù)中,自動匹配的正確匹配的數(shù)據(jù)有7 548條匹配正確,自動匹配的精度可達到0.90。
表1數(shù)據(jù)是公司1周的人工匹配數(shù)據(jù),有41 964條快遞需求,可供選擇的快遞公司有8家,平均1天需要進行匹配的零擔(dān)需求大約為7 000條,工作人員一天需要進行的查看次數(shù)為3.36×105,人工匹配耗費大量的人力資源和物質(zhì)資源,且匹配時間長,效率低下。采用自動匹配方法,可以實現(xiàn)匹配用時少,匹配效率高,從而實現(xiàn)匹配成本降低。
表6 程序代碼與運行結(jié)果
代碼運行結(jié)果 #支持向量機import pandas as pdimport numpy as npfrom sklearn import svmfrom sklearn.model_selection import train_test_splitx=data.iloc[:,0:6]y=data.iloc[:,6]x_train, x_test, y_train, y_test = train_test_split(x, y, random_state = 1 , train_size = 0.8 )ajiao=svm.SVC()ajiao.fit(x_train, y_train.ravel())SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,decision_function_shape='ovr', degree=3, gamma='auto', kernel='rbf',max_iter=-1, probability=False, random_state=None, shrinking=True,tol=0.001, verbose=False)
表7 8393條數(shù)據(jù)自動匹配與人工匹配對比表
匹配方式匹配正確記錄匹配時間匹配精度匹配用時匹配效率匹配成本 人工匹配83938393s1.00多低高 自動匹配75481.97s0.90少高低
本文研究零擔(dān)貨物快遞公司的機器學(xué)習(xí)SVM自動匹配方法,以某公司零擔(dān)貨物快公司人工匹配信息構(gòu)建數(shù)據(jù)集,采用SVM機器學(xué)習(xí)模型方法進行快遞公司自動匹配,并用python編程實現(xiàn)零擔(dān)貨物快遞需求與快遞公司的自動匹配。本文研究表明SVM自動匹配所用時間,遠遠小于人工匹配所需的時間,匹配精度達到0.90,自動匹配方法可有效提高快遞公司匹配效率,降低匹配成本,能有效提高公司競爭力。
[1] 周志華. 機器學(xué)習(xí)[M]. 北京: 清華大學(xué)出版社, 2016. 121-139
[2] 張良均, 譚麗云, 劉明軍, 等. Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)[M]. 2版. 北京: 機械工業(yè)出版社, 2020: 59-62
[3] David Forsyth. Applied Machine Learning[M].Springer Nature Switzerland AG, 2019: 14-20
[4] 莫凡. 機器學(xué)習(xí)算法的數(shù)學(xué)解析與Python實現(xiàn)[M]. 北京: 機械工業(yè)出版社, 2020: 146-153.
[5] Wes McKinney著, 徐敬一譯. 利用Python進行數(shù)據(jù)分析[M]. 2版. 北京: 機械工業(yè)出版社, 2018: 377-380.
Research on Automatic Matching of LCL Express Service Company
RUAN Yong-jiao, CHEN Xin, SUN Cheng-zhen, CHEN Ya-xin
(School of Automobile and Traffic Engineering, Liaoning University of Technology, Jinzhou 121001, China)
Automatic matching of LCL express service company and the SVM automatic matching method are researched. The purpose is to automatically match the most suitable express company according to the service demand of LCL Express. The research method is based on machine learning. with the help of the existing artificial matching data to build the data set. Through python programming, the training set is used to train the machine learning model of the automatic matching of the LCL express service company, and the verification set is used to verify the automatic matching effect. The evaluation results of the verification set show that the automatic matching time of express service company based on the LCL demand is only 1.89 s, and the matching accuracy reaches 0.90. The automatic matching model can efficiently and appropriately match the express service company for the LCL demand. The supply and demand of LCL Express service are suitable. This study can help logistics service companies to save matching costs, improve matching efficiency, and enhance their competitiveness. Meanwhile, it can provide ideas and reference for machine learning application in the era of artificial intelligence.
LCL express; express requirements; express service company; automatic matching; SVM
10.15916/j.issn1674-3261.2022.03.003
U16
A
1674-3261(2022)03-0151-05
2021-06-27
遼寧省先進裝備制造業(yè)基地建設(shè)工程中心項目(LNTH2020122E);遼寧工業(yè)大學(xué)研究生教育改革創(chuàng)新項目經(jīng)費資助(YJG2021003)
阮永嬌(1997-),女,山東臨沂人,碩士生
陳 昕(1972-),女,遼寧鐵嶺人,教授,博士。
責(zé)任編輯:陳 明