張凡
摘要:隨著云計算、物聯(lián)網(wǎng)等的發(fā)展,數(shù)據(jù)已經(jīng)呈現(xiàn)出爆炸式的增長現(xiàn)象,人們的生活正在被各種數(shù)據(jù)包圍,大數(shù)據(jù)時代已經(jīng)到來。軌道交通企業(yè)作為近年來全國的城市青睞的優(yōu)質(zhì)交通工具提供者,每天也產(chǎn)生者各種數(shù)據(jù)信息,這些數(shù)據(jù)有何特點,以及在使用這些大數(shù)據(jù)時又會帶來哪些挑戰(zhàn),本文做出簡要的探討。
關鍵詞:大數(shù)據(jù);應用;軌道交通
中圖分類號:TP3;U23 文獻識別碼:A 文章編號:1001-828X(2017)013-0-01
進入新世紀以來,隨著博客、微信、移動設備以基于位置服務的LBS服務的新型信息發(fā)布方式的發(fā)展,數(shù)據(jù)的種類和數(shù)量正在以幾何級的速度增長和積累,人們的生活已經(jīng)被各種各樣的數(shù)據(jù)包圍,大數(shù)據(jù)時代的到來給人們帶來了更多生活上的便利和行為習慣的改變。學術界、工業(yè)界、政府機構早已對大數(shù)據(jù)開始了各種研究。然而大數(shù)據(jù)的火熱并不意味著對大數(shù)據(jù)的深刻理解,反而可能影響了大數(shù)據(jù)的真正含義的理解。
一、大數(shù)據(jù)的基本概念
大數(shù)據(jù)本身的概念比較抽象,但有一點是確定的,即他表示數(shù)據(jù)的規(guī)模龐大,但是僅從數(shù)量上難以區(qū)分與海量數(shù)據(jù)(massive data)、超大規(guī)模數(shù)據(jù)(very large data)的差別,大數(shù)據(jù)目前的定義并沒有一個公認的說法,但從不同的定義中可以歸納試圖給出定義,而最有代表性的要數(shù)3V定義。即認為大數(shù)據(jù)需滿足三個特點:規(guī)模性(volume)、多樣性(variety)、和高速性(velocity).對于提出4V定義的有國際數(shù)據(jù)公司的價值性(value)和IBM認為的實用性(veracity)。維基百科對大數(shù)據(jù)的定義則更簡單明了:Big data is a term for data sets that are so large or complex that traditional data processing application software is inadequate to deal with them. 大數(shù)據(jù)時指利用常用軟件應用工具已經(jīng)不能夠處理的龐大且復雜的數(shù)據(jù)集。
作者認為,大數(shù)據(jù)的概念不必拘泥于某一個,在面對實際問題時,把握4V(規(guī)模性、多樣性、高速性、價值性)特點的基礎上適當?shù)目紤]數(shù)據(jù)處理的可容忍時間即可。
二、軌道交通企業(yè)大數(shù)據(jù)特點
軌道交通領域涉及專業(yè)多而廣,其中土木、車輛、機電、供電、維保、通信、信號、環(huán)控、AFC等,這些專業(yè)通過人工或自動傳輸?shù)确绞讲杉a(chǎn)生的數(shù)據(jù)數(shù)以百萬計,應用大數(shù)據(jù)處理技術,深入探索軌道交通系統(tǒng)的運行規(guī)律,對于提升軌道交通的運營服務質(zhì)量和水平有著重要的理論指導意義和實踐管理作用。
1.數(shù)據(jù)種類
根據(jù)軌道交通企業(yè)數(shù)據(jù)產(chǎn)生的來源,將大數(shù)據(jù)分為內(nèi)部大數(shù)據(jù)和外部大數(shù)據(jù)。內(nèi)部數(shù)據(jù)包括客流數(shù)據(jù)、各類型設備反饋的數(shù)據(jù)、物資材料消耗數(shù)據(jù)、內(nèi)部管理數(shù)據(jù)(財務、人力、效率數(shù)據(jù));外部數(shù)據(jù)包括天氣數(shù)據(jù)、大型活動數(shù)據(jù)、其他相關公共數(shù)據(jù)等。按照數(shù)據(jù)的產(chǎn)生的過程分為直接數(shù)據(jù)和間接數(shù)據(jù)。大數(shù)據(jù)研究的基本都是直接數(shù)據(jù),對直接數(shù)據(jù)加工處理產(chǎn)生的間接數(shù)據(jù),根據(jù)其家公的程度來確定該數(shù)據(jù)是否還需再處理。亦或是用來指導管理決策。
2.數(shù)據(jù)特點
(1)數(shù)據(jù)動態(tài)性強
以重慶軌道交通開收班時間計算,軌道交通系統(tǒng)每天運轉(zhuǎn)將近17個小時,在運行的這段時間各種數(shù)據(jù)時刻變化,且各數(shù)據(jù)動態(tài)性強、隨機性強、個體間差異明顯,變化粒度多樣,各數(shù)據(jù)間相互聯(lián)系,每一個數(shù)據(jù)的變化都可能帶來其他方面的影響或變化。
(2)數(shù)據(jù)關聯(lián)性強
在列車晚間進站到早班發(fā)車的間隔時間內(nèi),相關的其他工作維保、公務、供電、道岔、橋隧等檢修工作也差生這各種不同的數(shù)據(jù),而這些數(shù)據(jù)將直接影響著第二天軌道交通系統(tǒng)的運轉(zhuǎn)情況。
(3)數(shù)據(jù)分布呈現(xiàn)廣泛的異構性
首先數(shù)據(jù)來源廣泛,軌道交通系統(tǒng)涉獵專業(yè)繁多,業(yè)務復雜,每個部門都產(chǎn)生這各種各樣的數(shù)據(jù);其次,數(shù)據(jù)種類繁多,非結(jié)構化數(shù)據(jù)占比較大;再次,數(shù)據(jù)產(chǎn)生方式多樣,隨著移動終端的快速發(fā)展,數(shù)據(jù)的產(chǎn)生模式也由被動提取轉(zhuǎn)變?yōu)橹鲃赢a(chǎn)生進而發(fā)展為自動發(fā)送、上傳的模式。
(4)數(shù)據(jù)規(guī)律性強
軌道交通系統(tǒng)每天能夠正常運轉(zhuǎn)主要依賴于完善的工作計劃,如列車運行計劃、人員排班計劃、列車檢修計劃、客流組織計劃、設備設施巡檢、檢修計劃等,而完美的計劃需要依賴于對數(shù)據(jù)規(guī)律的掌握。
(5)數(shù)據(jù)的安全保密性要求高
作為支撐企業(yè)長久發(fā)展的核心信息,如新技術的研發(fā)、外來技術的國產(chǎn)化、核心技術、核心指標、管理方法的創(chuàng)新、安全技術的應用、盈利模式的創(chuàng)新、關鍵的財務數(shù)據(jù)等都需要較高的保密性。
三、軌道交通企業(yè)的大數(shù)據(jù)應用挑戰(zhàn)
1.數(shù)據(jù)集成挑戰(zhàn)
軌道交通數(shù)據(jù)的采集方式的多樣性和數(shù)據(jù)類型的多樣性使得數(shù)據(jù)集成成為大數(shù)據(jù)應用面臨的巨大挑戰(zhàn)。首先數(shù)據(jù)得廣泛異構性表現(xiàn)在數(shù)據(jù)類型從結(jié)構化數(shù)據(jù)為主轉(zhuǎn)向結(jié)構化、半結(jié)構化、非結(jié)構化,其次數(shù)據(jù)采集方式的多樣性體現(xiàn)在傳統(tǒng)固定設備的數(shù)據(jù)轉(zhuǎn)向移動設備的快速變動數(shù)據(jù),且產(chǎn)生的數(shù)據(jù)呈爆炸式增長,并有著明顯的時空特性。不同類型、不同方式、不同緯度的各種數(shù)據(jù)形成的大數(shù)據(jù)需要新的集成方法才能發(fā)揮其大數(shù)據(jù)的作用。
2.數(shù)據(jù)清洗挑戰(zhàn)
數(shù)據(jù)量巨大并不代表數(shù)據(jù)的價值大,數(shù)據(jù)量的增加導致數(shù)據(jù)質(zhì)量低劣,噪聲增多,反而會影響有用數(shù)據(jù)的篩選和使用。一方面很難由單個幾系統(tǒng)容納下不同數(shù)據(jù)源集成的海量數(shù)據(jù),另一方面數(shù)據(jù)集成并不是簡單的將數(shù)據(jù)聚集在一起而不作任何清洗,這樣有用數(shù)據(jù)就會被大量的干擾數(shù)據(jù)淹沒。大數(shù)據(jù)時代的數(shù)據(jù)清洗需要更加謹慎,因為有限的、細微的有用信息需要從巨量的數(shù)據(jù)中清洗出來,如果清洗粒度選擇不合適,或大或小,都將無法達到真正的清洗效果。
3.數(shù)據(jù)解釋挑戰(zhàn)
數(shù)據(jù)解釋旨在更好的呈現(xiàn)大數(shù)據(jù)的分析結(jié)果,不恰當?shù)慕忉尫椒赡軐е陆忉尳Y(jié)果晦澀,難以理解。然而傳統(tǒng)的數(shù)據(jù)解釋方式并不能應對大數(shù)據(jù)的分析結(jié)果,尤其是在面對類型復雜、數(shù)量巨大的軌道交通企業(yè)大數(shù)據(jù)時更為如此,外部的大數(shù)據(jù)與內(nèi)部的管理數(shù)據(jù)以何種技術呈現(xiàn)解釋結(jié)果,需要提出全新的大數(shù)據(jù)解釋方式。云計算的發(fā)展為大數(shù)據(jù)的應用奠定了基礎,但是對于大數(shù)據(jù)去粗取精、內(nèi)外數(shù)據(jù)互聯(lián)融通的過程,云計算猶如大海撈針,仍顯得無力。
四、軌道交通企業(yè)大數(shù)據(jù)應用現(xiàn)狀
目前軌道交通系統(tǒng)對大數(shù)據(jù)的應用都尚處于起步階段,查詢知網(wǎng)數(shù)據(jù)庫,也發(fā)現(xiàn)目前的研究應用較少,在少有的應用中主要提及的是地鐵耗能仿真和節(jié)能操縱研究、地鐵乘務技術管理、車在信號設備主動維護研究、地鐵票制創(chuàng)新、地鐵車輛牽引系統(tǒng)故障診斷等,從以上文獻不難發(fā)現(xiàn),行業(yè)內(nèi)真正的大數(shù)據(jù)研究應用還很缺乏,這些數(shù)據(jù)仍處于專項數(shù)據(jù)的集成處理研究,數(shù)據(jù)尚不夠“大”,對于管理決策的支撐研究也很少。
五、結(jié)語
本文通過大數(shù)據(jù)概念,結(jié)合軌道交通行業(yè)目前的數(shù)據(jù)特點、應用挑戰(zhàn)及應用現(xiàn)狀提出簡單的分析,希望助力于大數(shù)據(jù)在軌道交通行業(yè)的深入、廣泛、恰當?shù)膽?,促進大數(shù)據(jù)的良性發(fā)展。
參考文獻:
[1]維基百科:大數(shù)據(jù).(2017-5-22)https://en.wikipedia.org/wiki/Big_data
[2]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):146-169.
[3]李得偉,張?zhí)煊?,周煒騰,尹浩東.軌道交通大數(shù)據(jù)應用現(xiàn)狀及發(fā)展趨勢研究[J].都市快軌交通,2016,12:29(6).