馬青云,劉海鷗,劉 鑫
(1. 廣州軟件學院電子系,廣東 廣州 510900;2. 廣州軟件學院計算機系,廣東 廣州 510900;3. 中南大學計算機學院,湖南 長沙 410000)
快遞運輸具有較大的安全風險[1],主要分為兩方面,其一是運輸品為危險品,遭受撞擊很容易引發(fā)腐蝕或者爆炸。購買小批量危險化學品,在和其它正常用品運輸?shù)倪^程中,會導致運輸爆炸風險增加。我國現(xiàn)行危險品運輸狀況比較雜亂[2],存在較多的安全問題,引起該風險因素不是單一的,而且具有多面性,一種是由于大量化學品年運輸數(shù)量和運輸單位的資質(zhì)不完整,另一種是沒有運輸資質(zhì),卻妄想私運物品,所以造成危險。其二是環(huán)境對運輸載體的影響,例如在運輸過程中,雨雪天氣會導致路面摩擦力發(fā)生變化,車輛行駛容易出現(xiàn)打滑側翻的狀況;還有駕駛員休息不夠、注意力不集中,車輛自身產(chǎn)生故障,失去控制能力等各種現(xiàn)象,均會對快遞運輸增添風險。
為進一步分析快遞運輸過程中的風險,確??爝f送達時間,奇格奇等人[3]提出基于語義挖掘的快遞運輸貨品風險評價方法,通過網(wǎng)絡大數(shù)據(jù)資源結合模糊聚類方法,實現(xiàn)對快遞貨品語義風險的劃分。王馨梓等人[4]提出危險貨物運輸風險分級指標評價體系,通過構建風險評價指標體系,對危險貨物運輸風險分級劃分,并提出對應管控策略。以上兩種方法均能實現(xiàn)對運輸風險的劃分,但劃分精準度不穩(wěn)定。
在以上已有方法的基礎上,為降低貨物損失率,提高快遞運輸安全性,本研究提出了基于強化粗糙集屬性的快遞運輸風險挖掘方法。通過對快遞運輸突發(fā)事件數(shù)據(jù)預處理,將相關風險數(shù)據(jù)保存在數(shù)據(jù)庫中,構建快遞運輸風險挖掘模型,找出快遞運輸風險的規(guī)律,利用強化粗糙集方法研究某地區(qū)時間范圍內(nèi),快遞運輸條件屬性決策屬性間的依賴關系,挖掘快遞運輸風險。
在快遞運輸過程中會出現(xiàn)突發(fā)事件,將相關風險數(shù)據(jù)儲存在數(shù)據(jù)庫內(nèi),保存為歷史信息給評估風險奠定基礎。通過突發(fā)事件數(shù)據(jù)庫獲得歷史數(shù)據(jù),但存在信息不完整、被噪聲與冗余干擾等問題,不適合直接作為風險挖掘計算基礎,為此使用粗糙集屬性約簡[5,6],能保證基礎信息存在外,剔除多余重復的屬性,對信息精簡提取。構建相似度矩陣來約簡噪聲和冗余數(shù)據(jù)。其度量方法表述為:
(1)
ηp=(ηp1,…,ηp(p-1),0,ηp(p+1),…,ηpn)
(2)
其中n=|U|,N表示矩陣迭代周期,那么相似度矩陣表達式為
N=(η1,η2,…,ηn)N
(3)
設1/|A|是對象相似度最小值,若xp和剩下任何對象的相似性較小,那么?i∈{1,2,…,n},其中i≠p,均有ηpi<1/|A|時,判斷xp是噪聲數(shù)據(jù)[7,8];假設xp和另外對象在全部屬性上都實現(xiàn)相似關聯(lián)性,便有
ηpi>|Pi|·1/(3|A|)+(|A|-|Pi|)·1/|A|
=1-2|Pi|/(3|A|)
(4)
假設?i∈{1,2,…,n}且i≠p,令ηpi>1-2|Pi|/(3|A|)時,斷定xp和xi都表示為冗余數(shù)據(jù),把xp和xi內(nèi)標記*過多數(shù)據(jù)剔除,能夠增加內(nèi)存[9]。為此獲得判斷區(qū)間范圍(1/|A|,1-2|Pi|/(3|A|)),以此來約簡噪聲和冗余數(shù)據(jù)。
僅考慮國內(nèi)的道路快遞運輸方式,按照全面性[10,11]、代表性與科學性原則,并借鑒其它行業(yè)運輸風險評價因素,構建針對快遞運輸風險挖掘模型。其中,條件屬性為a為技術指標,b為質(zhì)量指標,c為環(huán)境指標,d為主體指標,e為裝載規(guī)范指標,決策屬性為f為事故類型;10個對象分別為10輛快遞運輸車。快遞運輸風險挖掘模型,如表1所示。
表1 快遞運輸風險挖掘模型
通過表1能夠看出,同一對象會被不同占比的多種條件和決策屬性定義,這是因為快遞運輸風險事件的產(chǎn)生和多種屬性間都存在關系,例如路面情況、車輛本身質(zhì)量、外界環(huán)境干擾以及駕駛員狀態(tài)[12,13]。其中路面情況主要是指為城市還是農(nóng)村道路、有沒有隔離帶、是否限制車輛行駛速度、照明情況、交叉路口設計等;外界環(huán)境干擾包括運輸時天氣是否良好,是否會有雨、雪、結冰以及霧等;駕駛員狀態(tài)包括司機的身心健康水平、飲酒吸煙習慣、駕駛員是否經(jīng)過培訓上崗等[14]。這些因素需要根據(jù)約簡后歷史數(shù)據(jù)劃分出當前快遞運輸事件影響的主次因素,即強化粗糙集屬性,便于發(fā)現(xiàn)造成風險的因素與風險間的“原因-結果”關系,找出快遞運輸風險的規(guī)律[15]。
表1中數(shù)據(jù)完成了離散化處理,描述為:屬性a取1表示司機駕駛經(jīng)驗豐富、未飲酒、身體健康,取2表示駕駛員經(jīng)驗不足,取3表示不具備駕駛資格;屬性b為1表示車輛結構完好、車輛容器完整,為2表示汽車結構具有缺陷;屬性c為1表示干燥的路面,為2表示路面存在潮濕、泥濘、結冰或下雪等情況,為3表示有霧的天氣;屬性d為1表示車輛速度符合規(guī)定,為2表示超過規(guī)定速度;屬性e為1表示物品裝載的合理,為2表示裝載不合理、超載、或不按照標準混裝;屬性f為1表示未發(fā)生交通事故,但快遞貨物出現(xiàn)泄露丟失,為2表示偏出路面導致快遞貨物泄露丟失,為3表示翻車引起快遞丟失,為4表示車輛碰撞導致快遞遺失,為5表示車輛翻車碰撞引起的火災甚至爆炸。
計算屬性的重要度為
U/C={{1},{2},{3},{4,6},{5,7,10},{8},{9}}
(5)
U/D={{1,2,4,5,7},{3,8,9},{6},{10}}
(6)
U/C-{a}={{1,3},{2},{4,5,6},{7,10},{8},{9}}
(7)
U/C-={{1},{2},{3},{4,6},{5,7,10},{8},{9}}
(8)
U/C-{c}={{1},{2,4,6,10},{3},{5,7},{8},{9}}
(9)
U/C-syggg00={{1},{2,4,7},{3},{5,7,10},{8},{9}}
(10)
U/C-{e}={{1},{2,4,7},{3},{5,7,10},{8},{9}}
(11)
其中
POSC(D)={1,2,3,8,9},POSC-{a}(D)={2,8,9},POSC-(D)={1,2,3,8,9},POSC-{c}(D)={1,3,8,9},POSC-syggg00(D)={1,3,8,9},POSC-{e}(D)={1,3,8,9},按照γC(D)=card(POSC(D))/card(U)與SGF(a)=γC(D)-γC-{a}(D),能夠得出:SGF(a)=0.25,SGF(b)=0.15,SGF(c)=0.15,SGF(d)=0,SGF(e)=0,再實行歸一化整理,得到:SGF(a)=0.6,SGF(b)=0.2,SGF(c)=0.2,SGF(d)=0,SGF(e)=0。
上述,card表示為基數(shù),POS(·)表示屬性對應的粗糙集正域,C表示條件屬性集,D表示決策屬性集,γC(D)表示兩者之間的依賴程度,SGF(·)表示屬性在風險挖掘中的重要程度,表γC-{a}(D)示條件屬性集C內(nèi)剔除屬性a之后的屬性依賴程度。
強化粗糙集屬性重要度,描述的是條件屬性對決策屬性的影響程度與重要程度,也可以說決策屬性對條件屬性的依賴程度。通過強化粗糙集方法研究某地區(qū)時間范圍內(nèi)快遞運輸條件屬性決策屬性與決策屬性的依賴關系,觀察到此范圍內(nèi)快遞運輸事件的出現(xiàn),挖掘得出最關鍵的因素是屬性a,即為技術指標情況,其次是屬性b與c,即質(zhì)量與環(huán)境指標,屬性d與屬性e,即主體指標和裝載規(guī)范指標?;诖?,利用重要度屬性,得到數(shù)據(jù)不同的風險情況,精準挖掘出風險可能性。這對于快遞運輸風險分類有著重要作用,有助于更好的做出保護措施,完善運輸技術,確保運輸安全。
實驗選擇上海-杭州快遞運輸路線,如圖1所示。運輸過程中具體的實驗參數(shù)如表2所示。
圖1 上海-杭州快遞運輸路線圖
表2 實驗參數(shù)
由于快遞不僅僅要滿足上海-杭州,還要保證快遞公司利潤最大,因此會出現(xiàn)6種完全不同線路,在途中還會配送上海-杭州線路涉及的相關城市。6條快遞線路中,路線1#道路情況較差。路線2#、路線3#會涉及邊緣城市和鄉(xiāng)村,路面主要是水泥窄路或者國道。路線4#最短,平穩(wěn)度也較高,5#和6#偏向沿海城市。
路線1#途徑地區(qū)較多,會經(jīng)過郊區(qū)窄小路面,道路情況較為差。圖2得知車輛A1風險可能性較高,危險程度相對增加,因為車輛速度較快,若是在交叉路口突然出現(xiàn)車輛,會來不及反應,導致事故發(fā)生;A3風險可能性極高,危險程度極高,說明駕駛人員身體疲勞,容易出現(xiàn)事故。
由于路線2#經(jīng)過的區(qū)域多,配送地點多,路程最遠,駕駛員會出現(xiàn)過度勞累。圖3得知,A2的風險可能性雖高,但是危險程度較低;其余類型風險可能性都較高,危險程度升高,在天氣和路面不好的情況下,貨物泄露為其它車輛增添危險,由此說明整體風險很高,需格外關注。
圖2 路線1#的風險挖掘結果
路線3#行駛彎道較多,易在轉彎時發(fā)生危險。圖4所示,可以看出路線3#的A1風險可能性較低,A3較高,說明車輛行駛速度較低,但是駕駛員身體疲勞程度較高,容易行駛中發(fā)生瞌睡,在突發(fā)情況中應急水平較差,容易造成事故;A4與A5的可能性高,證明路面狀況不好,行駛存在困難,天氣情況較差,視線受到影響,危險程度增加。
圖3 路線2#的風險挖掘結果
由于路線4#路程最短,較為平緩,途經(jīng)地區(qū)較少,能夠保證駕駛人員不會長時間行駛。通過圖5中得知,路線4#的車輛A2風險可能性較高,危險程度不高,是由于此風險是運輸車輛存在泄露,只是貨物丟失概率增加,但車輛與駕駛人員不具有危險性;其它風險可能性均較低,說明運行速度合適、駕駛人員休息得當、道路狀況良好、天氣晴朗,各方面都很好,由此說明路線2#的快遞運輸風險僅僅存在快遞丟失的狀況,發(fā)生事故的危險程度極低。
圖4 路線3#的風險挖掘結果
由于路線5#靠近沿海位置,天氣容易突變,產(chǎn)生雨霧;路面濕滑,在車輛行駛時需要注意車速。由圖6可知,路線5#車輛駕駛員經(jīng)驗豐富精神狀態(tài)較好,在運輸過程中,天氣突然發(fā)生變化,路面出現(xiàn)濕滑,為了可以及時配送,速度增加,因此危險程度增加;車輛貨箱發(fā)生泄露,天氣環(huán)境不好,危險程度水平提高。后續(xù)需要對駕駛人員培訓,增強安全意識。
圖5 路線4#的風險挖掘結果
路線6#更加偏向沿海城市,天氣與道路情況可知,車輛速度與貨箱密封性較好,危險程度不高;路面情況較差,是由于前兩天的雨雪導致道路結冰,所以危險程度較高;駕駛員疲勞,在面對緊急狀況時,容易失去反應能力,發(fā)生碰撞或翻車。
圖6 路線5#的風險挖掘結果
圖7 路線6#的風險挖掘結果
快遞運輸種類較多,例如汽車陸運、船只海運以及貨機空運,因此在運輸中的突發(fā)事件風險因素也較多。為減少危險事件產(chǎn)生概率,提出基于強化粗糙集屬性的快遞運輸風險挖掘方法。通過分析歷史記錄信息,去除干擾數(shù)據(jù),構建風險挖掘模型以便更好分析快遞運輸事件因素,并憑借強化粗糙集屬性突出重要影響因素,實現(xiàn)精準和全面的挖掘。