李 莉
(內(nèi)蒙古烏蘭察布市運輸管理處)
公路汽運是一個國家的基礎(chǔ)性和服務(wù)性產(chǎn)業(yè)。在2013年6月20日,我國交通運輸部總規(guī)劃師戴東昌在新聞發(fā)布會上表示,我國公路交通承擔78.2%的貨運量和93.5%的客運量。與改革開放初期相比,我國汽車客運量和貨運量都增長了百倍之多,但我國公路汽運依然存在著基礎(chǔ)設(shè)施差、路網(wǎng)密度低、運輸車輛不合理以及各地區(qū)發(fā)展不均衡等問題。
通過應(yīng)用數(shù)據(jù)挖掘技術(shù),我們通過分析可以為管理者們提供一個科學的管理方法,這對公路汽運是相當重要的,這就可以在同等條件下把公路汽運的安全性、快速性等提高一個水平。
數(shù)據(jù)挖掘技術(shù)指的是從統(tǒng)計過的大量相關(guān)數(shù)據(jù)中搜索出隱藏的有用信息,它通常和計算機技術(shù)、統(tǒng)計學、在線分析處理技術(shù)、情報檢索以及專家系統(tǒng)相結(jié)合來實現(xiàn)目標。
整個工作可分為三個階段:1.數(shù)據(jù)準備;2.數(shù)據(jù)挖掘;3.結(jié)果表達和解釋(下圖1 為數(shù)據(jù)挖掘結(jié)構(gòu)圖)。
圖1 典型的數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)圖
目前我們賦予數(shù)據(jù)挖掘的任務(wù)包括:關(guān)聯(lián)分析、聚類分析、分類分析、特異群組分析和演變分析等。這項技術(shù)已經(jīng)被廣泛應(yīng)用于商務(wù)管理、生產(chǎn)控制、市場分析以及科學探索等領(lǐng)域。下面的這個例子為我們生動的詮釋了數(shù)據(jù)挖掘技術(shù)的獨到之處。
在美國一家沃爾瑪連鎖超市中,貨架員將尿布和啤酒擺在一起出售,雖然讓人不可思議,但結(jié)果卻是尿布和啤酒銷量都增加了。究其原因,主要是數(shù)據(jù)處理技術(shù)的功勞。原來,沃爾瑪擁有龐大的數(shù)據(jù)倉庫系統(tǒng),為了能夠準確了解顧客的購買習慣,沃爾瑪對每個顧客的購物籃進行了分析,結(jié)果發(fā)現(xiàn)跟尿布一起購買最多的商品竟然是啤酒。分析師最終找到了出現(xiàn)這種奇怪現(xiàn)象的原因:原來美國的很多年輕父親下班后經(jīng)常要去超市給自己的孩子買尿布,順帶著把喜歡的啤酒也買了。超市將尿布和啤酒擺在距離不遠的貨架后,成功將那些對啤酒需求欲望不是太高的顧客俘獲。
從上述事例中我們可以看出數(shù)據(jù)挖掘系統(tǒng)可將人們不會想到的事情聯(lián)系到一起,所取得的效果也是出乎意料的。
此前的數(shù)據(jù)挖掘技術(shù)已經(jīng)在交通管理中得到了廣泛的應(yīng)用,并且挖掘出了很多因素潛在的關(guān)聯(lián)性和規(guī)則性。公路汽運作為交通中的主要組成,相應(yīng)的數(shù)據(jù)挖掘技術(shù)建立也會較為簡單,而且很多數(shù)據(jù)還可以和交通管理實現(xiàn)數(shù)據(jù)共享。此項技術(shù)必將能夠帶動我國公路汽運的安全性、合理性更進一步的發(fā)展。
公路汽運線路優(yōu)化可充分利用現(xiàn)有的時間、財務(wù)和資源,以最佳的運輸方式、運輸線路、最低的運輸成本、最高的質(zhì)量和最快的速度來完成最終的運輸目的。目前,我國公路汽運中存在很多不合理之處。
(1)對流運輸:指同類或相互代替的貨物相向運輸,它是最為突出和普遍的一種不合理的運輸形式。其實質(zhì)是出現(xiàn)了額外的車輛行走里程,增加了不必要的運費。
(2)迂回運輸:由于路徑選擇不當導致沒走最短的路徑。
(3)重復運輸:將可以直線運輸?shù)呢浳锝?jīng)不必要的中轉(zhuǎn),這種現(xiàn)象浪費裝卸勞力,增加作業(yè)負擔,而且增加了運送時間和出入手續(xù),這些都增加了運輸成本。這種不合理的運輸形式在當前快遞中最為常見。
(4)回程為空車:運輸目的達到后回程時空車行駛。這種也會浪費很多運力。
下面我們說一下公路汽運線路方案中數(shù)據(jù)挖掘技術(shù)應(yīng)用的大致流程。
①相關(guān)數(shù)據(jù)的采集。
首先,要進行數(shù)據(jù)的采集工作,主要包括:汽車運輸?shù)某杀?、耗時、耗油量、行程量、貨運量(客運量)、行車環(huán)境、貨物種類等。在采集數(shù)據(jù)時應(yīng)符合幾個原則:a 直觀性。即所有的參數(shù)應(yīng)易于理解,記錄時也按照一定順序進行;b 便利性。數(shù)據(jù)的采集工作應(yīng)該在動員人數(shù)、設(shè)備最少的條件下進行,最好是在常規(guī)交通數(shù)據(jù)采集下就可完成的;c 經(jīng)濟性。數(shù)據(jù)的采集量是很大的,其費用開銷也不能過大;d 可靠性。數(shù)據(jù)采集時應(yīng)避免在特殊天氣或背景下進行,保證數(shù)據(jù)的普遍性、可靠性。
②數(shù)據(jù)的挖掘和分析。
通過應(yīng)用數(shù)據(jù)挖掘技術(shù),我們可以挖掘出汽車運輸?shù)某杀?、耗時、耗油量等因素之間的關(guān)系,繪制出它們的擬合曲線,找出各個量之間的關(guān)系。
③結(jié)果的表達
通過進行數(shù)據(jù)挖掘,可以更加全面直觀的了解各個因素之間的相互影響關(guān)系,為決策者提供有效的技術(shù)支持,這樣就可以有效減少公路汽運中線路安排不合理現(xiàn)象的存在。
交通安全始終是人們和各級政府時刻關(guān)注的話題,根據(jù)權(quán)威部門統(tǒng)計:多年以來我國每年的交通事故死亡人數(shù)均超過10 萬人,造成的財產(chǎn)損失超過400 億,高居世界第一。安全性也事關(guān)公路汽運產(chǎn)業(yè)的興亡,而通過使用數(shù)據(jù)挖掘技術(shù),決策者調(diào)整相關(guān)政策,可以使公路汽運安全性有所提高。
(1)數(shù)據(jù)采集。
影響公路汽運安全的因素包括很多,其中各個因素中又包含很多小的因素,例如:人為因素(人為因素又包括年齡、性別、學歷等)、車輛因素(包括車齡、車型、電氣設(shè)備情況等)和環(huán)境因素(包括道路等級、天氣影響、地形地貌等)等等。在數(shù)據(jù)采集時應(yīng)注意分類清楚,便于以后的處理。
(2)數(shù)據(jù)挖掘。
在對公路汽運安全性因素上進行數(shù)據(jù)挖掘時,我們采用的是關(guān)聯(lián)法則中的經(jīng)典算法—Aprior 算法,其核心思想是基于兩階段頻繁集思想的遞推算法。Aprior 算法將發(fā)現(xiàn)關(guān)聯(lián)規(guī)則分兩步進行:①通過迭代,檢索出數(shù)據(jù)庫中的所有頻繁項集(不包括用戶為選擇的范圍);②利用檢索出的頻繁項集構(gòu)造出用戶最小信任度的規(guī)則。其步驟可簡化為:創(chuàng)建數(shù)據(jù)庫→頻繁項集表→交通事故關(guān)聯(lián)規(guī)則→關(guān)聯(lián)規(guī)則結(jié)果。
(3)結(jié)果的表達。
通過數(shù)據(jù)挖掘,我們可以找出影響公路汽運安全性的最大因素,以及這些因素之間的關(guān)聯(lián),其結(jié)果很可能是意想不到的,例如:我們的主觀意念都是覺得駕齡越少,其事故率越高,然而交通管理部門對事故數(shù)據(jù)庫經(jīng)過進行數(shù)據(jù)挖掘,發(fā)現(xiàn)駕齡在6 ~10年的老司機才是名副其實的“馬路殺手”。所以,得到分析結(jié)果后相關(guān)領(lǐng)導應(yīng)及時采取改進措施。
汽運站點的合理與否將會大大影響客運量情況,更加人性化的站點布局也會使“提倡綠色出行,發(fā)展公共交通”的政策實施起來更加容易。在平時我們布局公路汽運站點時,一般是等距離平分這段線路,這就存在很多不合理的地方,例如:在居民較為稠密的地方?jīng)]站點,還得步行一段距離,這必然導致很多人選擇其他的交通方式;而有的站點周圍根本沒有對汽車需求很強烈的群體。這樣公路汽運的作用就會大打折扣,所以對此問題應(yīng)用數(shù)據(jù)挖掘技術(shù)較為緊迫。
對公路汽運的站點布置應(yīng)該由乘客的實際需求度決定。我們可以對乘客(包括身份、年齡、性別等)、周邊居民區(qū)和公共場所(學校、醫(yī)院等)等相關(guān)數(shù)據(jù)進行采集,建立數(shù)據(jù)庫。然后建立相關(guān)算法,對數(shù)據(jù)庫進行數(shù)據(jù)挖掘。
目前,我國各大城市對公交站點、汽車站的位置進行了適當調(diào)整,很多城市實現(xiàn)了交通工具之間的“無縫對接”以及“百米距離內(nèi)換乘”。只有站點布局更為合理了,才可以使得公路汽運在國家提倡“節(jié)能減排”的時候大顯身手。
隨著我國經(jīng)濟的不斷發(fā)展和人們生活品質(zhì)的不斷提高,公路汽運必將會越來越貼近我們的日常生活。八零后、九零后的網(wǎng)購習慣、旅游愛好等無一不是和公路汽運密切相關(guān)的,而隨著更多的年輕人消費能力的提升,公路汽運的發(fā)展前景也會越來越廣闊。數(shù)據(jù)挖掘技術(shù)能夠幫助公路汽運公司的領(lǐng)導者做出更為明智、正確的決策,完全可以作為一種保障企業(yè)科學管理的有效手段。我們應(yīng)積極接受這門先進的管理方法,還要相應(yīng)的引進這方面的人才,為公路汽運事業(yè)的順利發(fā)展保駕護航。
[1]張小利,陳莉.數(shù)據(jù)挖掘在智能交通系統(tǒng)中的應(yīng)用(自然科學版)[J].西北大學學報,2005,(11):26-28.
[2]黃解軍,潘和平,萬幼川.數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究[J].計算機工程與應(yīng)用,2003,(2):45-48.
[3]鄒力鵑,王麗珍.空間數(shù)據(jù)挖掘發(fā)展研究[J].計算機工程與應(yīng)用,2003,(11):186-188.
[4]黃曉霞,蕭蘊詩.數(shù)據(jù)挖掘集成技術(shù)研究[J].計算機應(yīng)用研究,2003,(4):37-39.