●王宏瑞
信息時代數(shù)據(jù)成為資產(chǎn),數(shù)據(jù)質(zhì)量決定資產(chǎn)優(yōu)劣。如果數(shù)據(jù)質(zhì)量得不到保證,即使數(shù)據(jù)模型再合理,分析工具再先進(jìn),算法再優(yōu)良,系統(tǒng)運行的結(jié)果、作出的分析也可能有誤,甚至影響決策的制定和實行。因此,需要建立一個有效的數(shù)據(jù)質(zhì)量管理體系。
2011年,為加快轉(zhuǎn)變鐵路發(fā)展方式,實施多元化經(jīng)營戰(zhàn)略,不斷提高鐵路發(fā)展的質(zhì)量和效益,鐵路總公司對相關(guān)財務(wù)清算規(guī)則進(jìn)行了調(diào)整。新的清算規(guī)則包括貨物運輸進(jìn)款清算和貨物運輸作業(yè)服務(wù)費清算,其中貨物運輸按票分段清算,發(fā)到運費清算給發(fā)到企業(yè),運行運費按實際徑路比例清算給經(jīng)由企業(yè),接受貨物運輸作業(yè)服務(wù)的企業(yè)向提供服務(wù)企業(yè)支付服務(wù)費用,提供服務(wù)企業(yè)相應(yīng)取得服務(wù)收入。新的清算規(guī)則給鐵路貨物運輸統(tǒng)計工作提出了更高的要求。
2011年,鐵路信息系統(tǒng)經(jīng)過30多年的發(fā)展,從無到有、從小到大,從單機(jī)版本到多層次的網(wǎng)絡(luò)應(yīng)用,擁有規(guī)?;?、先進(jìn)的計算機(jī)設(shè)備,建立了覆蓋鐵道部、鐵路局和站段的計算機(jī)網(wǎng)絡(luò),建立了覆蓋全路的傳輸平臺。先后開發(fā)投產(chǎn)的應(yīng)用系統(tǒng)覆蓋了鐵路運輸組織、客貨營銷、經(jīng)營管理等主要環(huán)節(jié),使鐵路貨物運輸現(xiàn)代化水平得到了大幅提升,已經(jīng)成為鐵路貨物運輸生產(chǎn)組織的重要組成部分,基本上覆蓋了鐵路貨運生產(chǎn)的全過程。但這些信息系統(tǒng)各自為政,信息不共享,其質(zhì)量和數(shù)據(jù)傳遞都不能很好滿足財務(wù)清算需要。主要體現(xiàn)在:一是不能滿足數(shù)據(jù)唯一性。為滿足運輸調(diào)度需要,車站隨意更改車輛發(fā)到站,且同一編組上報鐵路局多份不同報文,且不能覆蓋;二是不能滿足數(shù)據(jù)完整性。編組中缺失貨物運單信息且編組信息傳遞方面主要是沒有覆蓋所有作業(yè)站,數(shù)據(jù)缺失不能從現(xiàn)有的列車編組信息中把車輛的裝車站到卸車站的運行軌跡串聯(lián)起來,使數(shù)據(jù)的應(yīng)用價值大大降低;三是不能滿足數(shù)據(jù)的動態(tài)性。大量的新信息不斷產(chǎn)生,及時采集和傳遞統(tǒng)計信息、更替和補(bǔ)充已經(jīng)積累的統(tǒng)計信息,才能不斷掌握新情況、新問題,保持統(tǒng)計信息的時效性。而相關(guān)信息系統(tǒng)在列車運行中的突發(fā)變更無法及時修正,造成數(shù)據(jù)缺失錯誤。為了保證新清算規(guī)則的順利實施,需要及時掌握列車的編組信息、車輛的裝載情況以及貨物的實際運行徑路,實現(xiàn)與清算相關(guān)的聯(lián)合運輸重車車輛公里、聯(lián)合運輸車輛中轉(zhuǎn)作業(yè)、整列空車排空等相關(guān)統(tǒng)計指標(biāo)和報表?!扒逅氵\統(tǒng)1”成功運用大數(shù)據(jù)整合運單和貨車編組信息。
“清算運統(tǒng)1”數(shù)據(jù)中對每一個車次來講,各個作業(yè)站、分界站的報文是一個連續(xù)的過程,因此對報文中數(shù)據(jù)的準(zhǔn)確性、及時性、完整性具有很高的要求,報文中任何一項數(shù)據(jù)(實際發(fā)車時間、車號、始發(fā)終到站、貨票號碼、使用屬性、作業(yè)種類等)的失誤都會影響本站的數(shù)據(jù)準(zhǔn)確性,并且由于這個失誤造成的影響將會擴(kuò)大到后續(xù)的所有車站,大部分情況下這個影響無法消除,因此要求作業(yè)人員對于作為基礎(chǔ)數(shù)據(jù)的清算運統(tǒng)1數(shù)據(jù)必須高度的重視,對于本站(分界口)發(fā)出的每一列車要仔細(xì)的核對,確認(rèn)無誤后再進(jìn)行上報。程序設(shè)計過于依賴人員錄入數(shù)據(jù)的質(zhì)量,將人的行為成為影響項目成敗重要的因素?!安灰蕾囁耸占蜣D(zhuǎn)換數(shù)據(jù),除非他們無可懷疑地具備這樣的能力,否則很容易破壞你所有的工作和計劃”。全路上報“清算運統(tǒng)1”近6000個車站,程序設(shè)計者完全信任這1萬多名作業(yè)人員上報的近1300萬份報文數(shù)據(jù)質(zhì)量的一致性是完全錯誤的。這些職工素質(zhì)參差不齊,學(xué)歷普遍很低,操作計算機(jī)不熟練,甚至有個別文盲存在。各種考核、各種培訓(xùn)效果不佳,甚至導(dǎo)致更嚴(yán)重的作假行為。這樣的數(shù)據(jù)質(zhì)量整理出的貨車運行軌跡完全亂作一團(tuán)。
為實現(xiàn)鐵路運輸和服務(wù)清算及時、準(zhǔn)確,原鐵道部統(tǒng)計中心和信息技術(shù)中心多次召開專題會議,對現(xiàn)有問題進(jìn)行深入研究,決定再將司機(jī)報單整合到“清算運統(tǒng)1”系統(tǒng)中,開發(fā)“原始記錄綜合應(yīng)用系統(tǒng)”。機(jī)車和貨車統(tǒng)計是運輸生產(chǎn)過程中兩個相鄰的統(tǒng)計環(huán)節(jié),現(xiàn)有機(jī)車統(tǒng)計是一條線,有完整的運輸軌跡但沒有貨車和貨物的信息;“清算運統(tǒng)1”是點的數(shù)據(jù),有完整的貨物編組和貨票信息,但無運輸軌跡。用這一條線將點相連形成軌跡,反映每一輛貨車、每一批貨物從承運、裝車、運行、中轉(zhuǎn)、到達(dá)、卸車各個環(huán)節(jié)的運輸全過程統(tǒng)計。2013年,“原始記錄綜合應(yīng)用系統(tǒng)”運用大數(shù)據(jù)理念成功整合了鐵路貨物運輸三大原始記錄“清算運統(tǒng)1”、司機(jī)報單、貨票信息。
2018年8月,鐵路總公司發(fā)改部領(lǐng)導(dǎo)率領(lǐng)統(tǒng)計執(zhí)法小組來太原局進(jìn)行執(zhí)法檢查,原始記錄綜合應(yīng)用系統(tǒng)所涉及的三大原始記錄零錯誤。這得益于大數(shù)據(jù)下各系統(tǒng)間數(shù)據(jù)的互相檢驗與共享。司機(jī)報單和“清算運統(tǒng)1”通過列車編組通知單(運統(tǒng)1乙)直接關(guān)聯(lián)匹配,使得機(jī)車和貨車統(tǒng)計有機(jī)銜接,共享共用相關(guān)信息:一是通過機(jī)車統(tǒng)計司機(jī)報單,核對車站發(fā)到時間、列車車次等信息,提高貨車統(tǒng)計清算運統(tǒng)1的及時性、完整性和準(zhǔn)確性;二是通過貨車統(tǒng)計“清算運統(tǒng)1”列車重量、重空車數(shù)等信息,檢驗和保證機(jī)車統(tǒng)計司機(jī)報單的編組數(shù)據(jù)質(zhì)量。而被檢查組檢查出的錯誤大多是“數(shù)據(jù)孤島”,這些數(shù)據(jù)與其它系統(tǒng)數(shù)據(jù)不共享、不校驗,很難辨別其準(zhǔn)確性,出錯幾率高。事實證明,大數(shù)據(jù)在數(shù)據(jù)質(zhì)量管理中的效果是顯而易見的。
數(shù)據(jù)質(zhì)量管理貫穿數(shù)據(jù)生命周期的全過程,數(shù)據(jù)源在不斷增多,數(shù)據(jù)量不斷加大,新需求推動的新技術(shù)也不斷誕生,這些都對大數(shù)據(jù)下的數(shù)據(jù)質(zhì)量管理帶來了機(jī)遇和挑戰(zhàn)。數(shù)據(jù)質(zhì)量管理要形成完善的體系,建立持續(xù)改進(jìn)的流程和良性機(jī)制,持續(xù)監(jiān)控各系統(tǒng)數(shù)據(jù)質(zhì)量波動情況及數(shù)據(jù)質(zhì)量規(guī)則分析,適時升級數(shù)據(jù)質(zhì)量監(jiān)控的手段和方法,確保持續(xù)掌握系統(tǒng)數(shù)據(jù)質(zhì)量狀況,最終達(dá)到數(shù)據(jù)質(zhì)量的平穩(wěn)狀態(tài),為業(yè)務(wù)系統(tǒng)提供良好的數(shù)據(jù)保障。