焦梓婷
[摘 要]大數(shù)據(jù)時代將帶來深刻的思維轉(zhuǎn)變,大數(shù)據(jù)不僅將改變每個人的日常生活和工作方式,還將改變商業(yè)組織和社會組織的運行方式。大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型,如何在大數(shù)據(jù)時代挖掘和利用隱蔽于數(shù)據(jù)內(nèi)部未被激發(fā)的潛在價值,從而實現(xiàn)在經(jīng)濟、交通、教育、醫(yī)療、能源、軍事等領(lǐng)域的革新,取決于我們是否能夠從以往的小數(shù)據(jù)思維及時轉(zhuǎn)換成大數(shù)據(jù)思維。本文在研讀文獻基礎(chǔ)上,介紹了大數(shù)據(jù)思維產(chǎn)生的背景,闡述了大數(shù)據(jù)帶來的思維變革,分析展望了建立大數(shù)據(jù)思維促進中國鐵路創(chuàng)新發(fā)展。
[關(guān)鍵詞]大數(shù)據(jù) 大數(shù)據(jù)思維 鐵路創(chuàng)新發(fā)展
中圖分類號:TM76;TM63 文獻標識碼:B 文章編號:1009-914X(2016)25-0373-03
1 引言
半個世紀以來,隨著人類對自然和社會認識的進一步加深及人類活動的進一步擴展,科學研究、互聯(lián)網(wǎng)應(yīng)用、電子商務(wù)、移動通信等諸多應(yīng)用領(lǐng)域產(chǎn)生了多種多樣的數(shù)量巨大的數(shù)據(jù)。這不僅使得世界充斥著比以往更多的信息,而且其增長速度也在加快。信息總量的變化最終導(dǎo)致了質(zhì)變,最先經(jīng)歷信息爆炸的學科,如天文學和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個概念。時至今日,這個概念幾乎已應(yīng)用到了所有人類致力發(fā)展的領(lǐng)域中。大數(shù)據(jù)(BIG DATA)的出現(xiàn)對傳統(tǒng)的數(shù)據(jù)存儲、數(shù)據(jù)處理和數(shù)據(jù)挖掘提出了新的挑戰(zhàn),同時也深刻地影響著人類的生活、工作和思維。
2 什么是大數(shù)據(jù)
2.1 大數(shù)據(jù)的概念
說起大數(shù)據(jù),從字面意思來講就是巨量數(shù)據(jù)集合,到底有多大?可能很多人并沒有很具體的概念。一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當于美國兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達200萬個(相當于《時代》雜志770年的文字量);賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數(shù)量37.1萬。國際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,2009年的數(shù)據(jù)量為0.8ZB,2010年增長為1.2ZB,2011年的數(shù)量更是高達1.82ZB,相當于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說過的所有話的數(shù)據(jù)量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。
然而大數(shù)據(jù)并非一個確切的概念。對于“大數(shù)據(jù)”(Big data)研究機構(gòu)Gartner給出了這樣的定義?!按髷?shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。而麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)、多樣的數(shù)據(jù)類型(Variety)和價值密度低(Value)四大特征,即4V特征。在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》中大數(shù)據(jù)指不用隨機分析法(抽樣調(diào)查)這樣捷徑,而采用所有數(shù)據(jù)進行分析處理。業(yè)界學者楊善林認為在海量數(shù)據(jù)的量化基礎(chǔ)上,同時具備大分析(Big Analytics)、大帶寬(Big Bandwidth)、大內(nèi)容(Big Content)等三大要素的巨大數(shù)據(jù)集。謝國忠則認為大數(shù)據(jù)的本質(zhì)是利用企業(yè)內(nèi)部信息,將龐大的信息進行有效整合,并結(jié)合新的數(shù)據(jù)類型為企業(yè)創(chuàng)造價值。
2.2 大數(shù)據(jù)的特點
大數(shù)據(jù)有有它自己的特征。目前工業(yè)界普遍認為大數(shù)據(jù)具有 4V+1C 的特征:
(1)數(shù)據(jù)量大(Volume)。存儲的數(shù)據(jù)量巨大,拍字節(jié)級別是常態(tài),因而對其分析的計算量也大。
(2)多樣(Variety)。數(shù)據(jù)的來源及格式多樣,數(shù)據(jù)格式除了傳統(tǒng)的格式化數(shù)據(jù)外,還包括半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),比如用戶上傳的音頻和視頻內(nèi)容,而隨著人類的活動的進一步拓寬,數(shù)據(jù)的來源更加多樣。
(3)快速(Velocity)。數(shù)據(jù)增長速度快,同時要求對數(shù)據(jù)的處理速度也要快,以便能夠從數(shù)據(jù)中及時地提取知識,發(fā)現(xiàn)價值。
(4)價值密度低(Value)。需要對大量的數(shù)據(jù)處理挖掘其潛在的價值,因而,大數(shù)據(jù)對我們提出的明確要求是設(shè)計一種在成本可接受的條件下,通過快速采集、發(fā)現(xiàn)和分析從大量、多種類別的數(shù)據(jù)中提取價值的體系架構(gòu)。
(5)復(fù)雜度(Complexity)。對數(shù)據(jù)的處理和分析難度大。
IBM在此基礎(chǔ)上又提出了5V特征,即在4V的基礎(chǔ)上增加了真實性(Veracity)。
3 什么是大數(shù)據(jù)思維
要想大數(shù)據(jù)為人所用, 必須改變原有對數(shù)據(jù)的認識,將大數(shù)據(jù)與創(chuàng)意結(jié)合,并能充分利用數(shù)據(jù)分析技術(shù),為企業(yè)和國家決策提供依據(jù)。大數(shù)據(jù)研究專家維克托·邁爾-舍恩伯格指出,大數(shù)據(jù)時代,人們對待數(shù)據(jù)的思維方式會發(fā)生如下三個變化:第一,人們處理的數(shù)據(jù)從樣本數(shù)據(jù)變成全部數(shù)據(jù);第二,由于是全樣本數(shù)據(jù),人們不得不接受數(shù)據(jù)的混雜性,而放棄對精確性的追求;第三,人類通過對大數(shù)據(jù)的處理,放棄對因果關(guān)系的渴求,轉(zhuǎn)而關(guān)注相關(guān)關(guān)系。事實上,大數(shù)據(jù)時代帶給人們的思維方式的深刻轉(zhuǎn)變遠不止上述三個方面。我認為,大數(shù)據(jù)思維最關(guān)鍵的轉(zhuǎn)變在于從自然思維轉(zhuǎn)向智能思維,使得大數(shù)據(jù)像具有生命力一樣,獲得類似于“人腦”的智能,甚至智慧。
大數(shù)據(jù)思維是一種總體思維。過去,人們對搜集數(shù)據(jù)、處理數(shù)據(jù)形成了一個思維定勢,那就是我們不可能搜集到相當多數(shù)量的數(shù)據(jù),我們只能在力所能及的條件下選擇一小部分去分析和處理,為了讓數(shù)據(jù)處理變得更簡單,對數(shù)據(jù)的選擇就盡可能到最少,也由于當時信息處理水平的限制,導(dǎo)致所選的數(shù)據(jù)不具備代表性,盲目因素太多。當我們進行抽樣調(diào)查來分析數(shù)據(jù)的時候,往往會以調(diào)查問卷的形式選擇一部分樣本進行分析,這為人們提供了不少的便捷,但相應(yīng)的缺點也是一覽無余,這種樣本分析法不管你有多深入的去挖掘,它都只能代表總體數(shù)據(jù)中的一小部分,不能代表全部數(shù)據(jù),也許樣本調(diào)查的準確性會達到90%以上,但是依然會遺漏一些很有價值的數(shù)據(jù),就會導(dǎo)致數(shù)據(jù)的失真。但是隨著大數(shù)據(jù)時代的到來,我們可能還沒有意識到我們已經(jīng)具備處理和分析大數(shù)據(jù)的能力,我們的思維正在一點點的改變,首先,我們不能一直依靠對小部分數(shù)據(jù)樣本進行分析,而是轉(zhuǎn)向為分析全部數(shù)據(jù)。
大數(shù)據(jù)思維是一種容錯思維。在小數(shù)據(jù)時代,由于收集的樣本信息量比較少,所以必須確保記錄下來的數(shù)據(jù)盡量結(jié)構(gòu)化、精確化,否則,分析得出的結(jié)論在推及總體上就會“南轅北轍”,因此,就必須十分注重精確思維。然而,在大數(shù)據(jù)時代,得益于大數(shù)據(jù)技術(shù)的突破,大量的非結(jié)構(gòu)化、異構(gòu)化的數(shù)據(jù)能夠得到儲存和分析,這一方面提升了我們從數(shù)據(jù)中獲取知識和洞見的能力,另一方面也對傳統(tǒng)的精確思維造成了挑戰(zhàn)。維克托·邁爾-舍恩伯格指出,“執(zhí)迷于精確性是信息缺乏時代和模擬時代的產(chǎn)物。只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無法利用,只有接受不精確性,我們才能打開一扇從未涉足的世界的窗戶”。也就是說,在大數(shù)據(jù)時代,思維方式要從精確思維轉(zhuǎn)向容錯思維,當擁有海量即時數(shù)據(jù)時,絕對的精準不再是追求的主要目標,適當忽略微觀層面上的精確度,容許一定程度的錯誤與混雜,反而可以在宏觀層面擁有更好的知識和洞察力。
大數(shù)據(jù)思維是一種相關(guān)思維。在小數(shù)據(jù)世界中,人們往往執(zhí)著于現(xiàn)象背后的因果關(guān)系,試圖通過有限樣本數(shù)據(jù)來剖析其中的內(nèi)在機理。小數(shù)據(jù)的另一個缺陷就是有限的樣本數(shù)據(jù)無法反映出事物之間的普遍性的相關(guān)關(guān)系。而在大數(shù)據(jù)時代,人們可以通過大數(shù)據(jù)技術(shù)挖掘出事物之間隱蔽的相關(guān)關(guān)系,獲得更多的認知與洞見,運用這些認知與洞見就可以幫助我們捕捉現(xiàn)在和預(yù)測未來,而建立在相關(guān)關(guān)系分析基礎(chǔ)上的預(yù)測正是大數(shù)據(jù)的核心議題。通過關(guān)注線性的相關(guān)關(guān)系,以及復(fù)雜的非線性相關(guān)關(guān)系,可以幫助人們看到很多以前不曾注意的聯(lián)系,還可以掌握以前無法理解的復(fù)雜技術(shù)和社會動態(tài),相關(guān)關(guān)系甚至可以超越因果關(guān)系,成為我們了解這個世界的更好視角。維克托·邁爾-舍恩伯格指出,大數(shù)據(jù)的出現(xiàn)讓人們放棄了對因果關(guān)系的渴求,轉(zhuǎn)而關(guān)注相關(guān)關(guān)系,人們只需知道“是什么”,而不用知道“為什么”。我們不必非得知道事物或現(xiàn)象背后的復(fù)雜深層原因,而只需要通過大數(shù)據(jù)分析獲知“是什么”就意義非凡,這會給我們提供非常新穎且有價值的觀點、信息和知識。也就是說,在大數(shù)據(jù)時代,思維方式要從因果思維轉(zhuǎn)向相關(guān)思維,努力顛覆千百年來人類形成的傳統(tǒng)思維模式和固有偏見,才能更好地分享大數(shù)據(jù)帶來的深刻洞見。
大數(shù)據(jù)思維是一種智能思維。大數(shù)據(jù)使得人可以被量化,但卻讓計算機更具智能。工業(yè)革命使得需要人完成的工作只用機器就可以完成了,但大數(shù)據(jù)卻可以使得機器有了分析問題的能力。衛(wèi)星定位系統(tǒng)積累的大量數(shù)據(jù),可以制作電子地圖和導(dǎo)航,還可以通過分析數(shù)據(jù)開發(fā)出無人駕駛汽車,讓機器變得擁有智慧。如何讓計算機擁有智慧,除了要擁有大數(shù)據(jù)外,必須變革思維,創(chuàng)新分析思路與過程,不斷探索新的方法,讓堆積如山的數(shù)據(jù)不斷創(chuàng)造新的價值。例如手機上常用的地圖軟件,可以搜索很多路況同步數(shù)據(jù),為用戶提供出行信息。這只是大數(shù)據(jù)最基礎(chǔ)的應(yīng)用,繼續(xù)延伸, 是否可以根據(jù)上下班時段的交通流量估算失業(yè)率;是否可以通過對主要商圈的監(jiān)控估算消費情況;是否可以將廢棄的數(shù)據(jù)重新創(chuàng)造價值;是否可以利用用戶在拼寫過程中的拼寫錯誤讓拼寫檢查軟件更優(yōu)化;是否可以通過分析各實體和產(chǎn)業(yè)之間的關(guān)聯(lián)關(guān)系,預(yù)測各行業(yè)發(fā)展趨勢,找出關(guān)鍵影響因素;是否可以分析顧客的偏好,量體裁衣式的為顧客提供更好的服務(wù); 是否可以運用大數(shù)據(jù)模擬現(xiàn)實情境,發(fā)掘出新的需求和更好的回報;是否可以創(chuàng)新大數(shù)據(jù)的使用模式,將大數(shù)據(jù)深加工,用戶可以很方便地結(jié)合自身情況選擇適合自己的產(chǎn)品。
4 建立大數(shù)據(jù)思維促進中國鐵路創(chuàng)新
4.1 以數(shù)據(jù)為核心
大數(shù)據(jù)時代,計算模式也發(fā)生了轉(zhuǎn)變,從“流程”核心轉(zhuǎn)變?yōu)椤皵?shù)據(jù)”核心。Hadoop體系的分布式計算框架已經(jīng)是“數(shù)據(jù)”為核心的范式。非結(jié)構(gòu)化數(shù)據(jù)及分析需求,將改變IT系統(tǒng)的升級方式:從簡單增量到架構(gòu)變化。例如:IBM將使用以數(shù)據(jù)為中心的設(shè)計,目的是降低在超級計算機之間進行大量數(shù)據(jù)交換的必要性。大數(shù)據(jù)下,云計算找到了破繭重生的機會,在存儲和計算上都體現(xiàn)了數(shù)據(jù)為核心的理念。大數(shù)據(jù)和云計算的關(guān)系:大數(shù)據(jù)與云計算是一個問題的兩面,一個是問題,一個是解決問題的方法。而大數(shù)據(jù)比云計算更為落地,可有效利用已大量建設(shè)的云計算資源,最后加以利用。中國鐵路信息化歷經(jīng)50余年的發(fā)展,取得廣泛的應(yīng)用,擁有海量的資源,大數(shù)據(jù)將成為推動中國鐵路創(chuàng)新發(fā)展的新引擎。隨著中國鐵路信息化的到來,中國鐵路發(fā)展的戰(zhàn)略需求也發(fā)生了改變,數(shù)據(jù)的處理分析成為了一個關(guān)注重點,軟件也將從編程為主轉(zhuǎn)變?yōu)橐詳?shù)據(jù)為中心。如何高效地從海量數(shù)據(jù)中分析、挖掘所需的信息和規(guī)律,結(jié)合已有經(jīng)驗和數(shù)學模型等生成更高層次的決策支持信息,獲得各類分析、評價數(shù)據(jù),為設(shè)備管理、網(wǎng)絡(luò)狀態(tài)評估等提供決策支持,為鐵路工作人員提供有用信息,成為鐵路未來發(fā)展的趨勢。
4.2 全樣本考慮
統(tǒng)計學里頭最基本的一個概念就是,全部樣本才能找出規(guī)律。為什么能夠找出行為規(guī)律?一個更深層的概念是人和人是一樣的,如果是一個人特例出來,可能很有個性,但當人口樣本數(shù)量足夠大時,就會發(fā)現(xiàn)其實每個人都是一模一樣的。在大數(shù)據(jù)時代,無論是商家還是信息的搜集者,會比我們自己更知道你可能會想干什么?,F(xiàn)在的數(shù)據(jù)還沒有被真正挖掘,如果真正挖掘的話,通過信用卡消費的記錄,可以成功預(yù)測未來5年內(nèi)的情況。大數(shù)據(jù)的核心就是預(yù)測,大數(shù)據(jù)能夠預(yù)測體現(xiàn)在很多方面。大數(shù)據(jù)不是要教機器像人一樣思考,相反,它是把數(shù)學算法運用到海量的數(shù)據(jù)上來預(yù)測事情發(fā)生的可能性。正因為在大數(shù)據(jù)規(guī)律面前,每個人的行為都跟別人一樣,沒有本質(zhì)變化。例如:大數(shù)據(jù)助微軟準確預(yù)測世界懷。微軟大數(shù)據(jù)團隊在2014年巴西世界足球賽前設(shè)計了世界懷模型,該預(yù)測模型正確預(yù)測了賽事最后幾輪每場比賽的結(jié)果,包括預(yù)測德國隊將最終獲勝。預(yù)測成功歸功于微軟在世界杯進行過程中獲取的大量數(shù)據(jù),到淘汰賽階段,數(shù)據(jù)如滾雪球般增多,常握了有關(guān)球員和球隊的足夠信息,以適當校準模型并調(diào)整對接下來比賽的預(yù)測。世界杯預(yù)測模型的方法與設(shè)計其它事件的模型相同,訣竅就是在預(yù)測中去除主觀性,讓數(shù)據(jù)說話。利用大數(shù)據(jù)技術(shù)可以從鐵路的客票系統(tǒng)、貨票系統(tǒng)、貨運電子商務(wù)平臺、運輸信息集成平臺等信息系統(tǒng)采集海量的原始信息,這些信息可以為市場分析和預(yù)測提供有力的支撐。與傳統(tǒng)方法側(cè)重于對調(diào)查抽樣統(tǒng)計數(shù)據(jù)的分析不同,基于大數(shù)據(jù)技術(shù)的市場分析和預(yù)測技術(shù)既能夠利用上述海量數(shù)據(jù),分析客、貨運量完整全面的變化過程,深入挖掘運量變化的規(guī)律性,進而預(yù)測市場的未來走勢;還能夠利用GPS、傳感器等物聯(lián)網(wǎng)手段采集獲取精細的運輸數(shù)據(jù),并且通過互聯(lián)網(wǎng)接入的政治、經(jīng)濟、其他交通方式、氣候等影響因素數(shù)據(jù),將旅客和貨物流量流向的精細化分析與影響因素關(guān)聯(lián)性分析相結(jié)合,挖掘各影響因素對鐵路運量變化影響的方向和時滯,量化各因素對運量變化的影響。在對典型設(shè)備故障診斷與狀態(tài)預(yù)測方面,可以綜合利用GSM-R接口監(jiān)測數(shù)據(jù)、網(wǎng)絡(luò)管理信息、場強和服務(wù)質(zhì)量動態(tài)檢測數(shù)據(jù)、無線干擾檢測監(jiān)測數(shù)據(jù)等數(shù)據(jù)源,采用數(shù)據(jù)挖掘技術(shù),研究監(jiān)測檢測數(shù)據(jù)綜合分析方法、多源數(shù)據(jù)關(guān)聯(lián)分析方法和適用于通信業(yè)務(wù)數(shù)的故障診斷分析方法,建立典型故障診斷模型、GSM-R網(wǎng)絡(luò)QoS測試綜合評價模型、CTCS-3列控系統(tǒng)降級故障表示模型等,對列車控制的車載系統(tǒng)、地面控制系統(tǒng)、無線通信網(wǎng)絡(luò)交互作用進行可靠性評估和故障綜合診斷,為列車控制系統(tǒng)降級原因分析、GSM-R網(wǎng)絡(luò)維護、網(wǎng)絡(luò)優(yōu)化等提供支持。
4.3 用信息找人
互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,是一個從人找信息,到信息找人的過程。先是人找信息,人找人,信息找信息,現(xiàn)在是信息找人的這樣一個時代。信息找人的時代,就是說一方面我們回到了一種最初的,廣播模式是信息找人,我們聽收音機,我們看電視,它是信息推給我們的,但是有一個缺陷,不知道我們是誰,后來互聯(lián)網(wǎng)反其道而行,提供搜索引擎技術(shù),讓我知道如何找到我所需要的信息,所以搜索引擎是一個很關(guān)鍵的技術(shù)。例如:從搜索引擎——向推薦引擎轉(zhuǎn)變。今天,后搜索引擎時代已經(jīng)正式來到,什么叫做后搜索引擎時代呢?使用搜索引擎的頻率會大大降低,使用的時長也會大大的縮短,為什么使用搜索引擎的頻率在下降?時長在下降?原因是推薦引擎的誕生。就是說從人找信息到信息找人越來越成為了一個趨勢,推薦引擎就是說它很懂我,知道我要知道的東西。例如,我們結(jié)合12306網(wǎng)站數(shù)據(jù)及實名制購票資料,對出行旅客的個人信息、出行線路、出行時間周期進行的統(tǒng)計分析,同時借助互聯(lián)網(wǎng)大數(shù)據(jù)預(yù)報人員遷徙情況,最后完全勾勒出旅客的需求,使鐵路可以充分了解每一位旅客,實時的知道他們旅行目的地,以及出發(fā)時間及需要的服務(wù)層次,有針對性地推送一些旅游服務(wù)、餐飲、住宿、景觀等方面的產(chǎn)品,使得營銷工作更加精準,營銷效率也更高。
5 大數(shù)據(jù)思維帶來的挑戰(zhàn)
大數(shù)據(jù)的發(fā)展速度有目共睹,想要在競爭社會中走的更遠,人人都需要建立大數(shù)據(jù)思維。那么在建立大數(shù)據(jù)思維中,有哪些挑戰(zhàn)呢?
第一,大數(shù)據(jù)應(yīng)用和商業(yè)回報間的矛盾。未來的大數(shù)據(jù)應(yīng)用一定是可定制的、可在云上打包的服務(wù),即將業(yè)務(wù)、數(shù)據(jù)、分析能力多面定制,一起打包。企業(yè)需要可快速部署和有明確投資回報率的應(yīng)用,這涉及到數(shù)據(jù)的質(zhì)量和豐富度及業(yè)務(wù)人員對數(shù)據(jù)的依賴度。這需要企業(yè)內(nèi)各個部門的有效協(xié)作,并規(guī)避無法確定的風險,比如分析結(jié)果的不確定性,業(yè)務(wù)場景的復(fù)雜性,人員的能力缺失等。傳統(tǒng)手段,比如通過社交媒體、郵件、網(wǎng)絡(luò)文本等獲得的數(shù)據(jù)量非常龐大,但解破這些數(shù)據(jù)的關(guān)系和價值卻給企業(yè)帶來巨大挑戰(zhàn)。企業(yè)希望成為數(shù)據(jù)的主人,但在辨析數(shù)據(jù)的有效性、能帶來哪些商業(yè)回報,以及如何幫助決策等方面卻缺乏有效工具。
第二,海量數(shù)據(jù)與核心數(shù)據(jù)間的矛盾。要做大數(shù)據(jù),首先要了解自己的企業(yè),或者企業(yè)所在的行業(yè)的核心是什么。我們發(fā)現(xiàn),有很多企業(yè)在競爭過程中,最終不是被現(xiàn)有競爭對手打敗,而是被很多潛在未知的競爭對手打敗的。舉例來說,大部分人都認為亞馬遜是做電商的,但其實亞馬遜現(xiàn)在最主要的收入來自云服務(wù),也就意味著亞馬遜的核心數(shù)據(jù)(價值)是云服務(wù)。只有在此基礎(chǔ)上,亞馬遜建立的大數(shù)據(jù)才是有效的、服務(wù)于戰(zhàn)略的。
第三,內(nèi)部數(shù)據(jù)與外圍數(shù)據(jù)間的矛盾。企業(yè)所獲取的數(shù)據(jù),很大一部分是內(nèi)部數(shù)據(jù),這讓企業(yè)面對另一個挑戰(zhàn),如何讓內(nèi)部數(shù)據(jù)與外圍相關(guān)數(shù)據(jù)產(chǎn)生聯(lián)系并使之成長。只有讓內(nèi)外部數(shù)據(jù)的交融在用戶場景中,才能為業(yè)務(wù)用戶描繪更精準的業(yè)務(wù)發(fā)展空間。
第四,規(guī)律發(fā)現(xiàn)和規(guī)律失效間的矛盾。調(diào)研顯示,從大數(shù)據(jù)應(yīng)用總結(jié)出的規(guī)律來看,建立失效預(yù)警是特別必要的。當企業(yè)通過大數(shù)據(jù)分析發(fā)現(xiàn)一個規(guī)律,并在現(xiàn)實中應(yīng)用時,必須要設(shè)立一些預(yù)警指標。當指標達到一定程度,既表明之前發(fā)現(xiàn)的規(guī)律已經(jīng)失效,必須發(fā)現(xiàn)新的規(guī)律、建立新相關(guān)指標,這稱為數(shù)據(jù)價值的有效性。沒有根據(jù)實際應(yīng)用場景的變化而及時更新的數(shù)據(jù),挖掘得再多都是無謂的浪費,熟練應(yīng)用失效預(yù)警,企業(yè)才能培養(yǎng)起團隊對數(shù)據(jù)真實有效的敏感性。
6 結(jié)語
大數(shù)據(jù)思維把人們從舊的發(fā)展觀、價值觀中解放出來,復(fù)雜技術(shù)的涌現(xiàn)和科技進步促使人們開始從大數(shù)據(jù)思維視角重新審視世界,從而獲取正確理解世界的角度性工具。大數(shù)據(jù)思維是客觀存在,大數(shù)據(jù)思維是新的思維觀。用大數(shù)據(jù)思維方式思考問題,解決問題是當下企業(yè)潮流。中國鐵路正處于加快轉(zhuǎn)變發(fā)展方式的新形勢下,為了適應(yīng)市場化經(jīng)營要求,構(gòu)建鐵路運輸企業(yè)的核心競爭力,提升鐵路的持續(xù)發(fā)展能力和盈利能力,應(yīng)用大數(shù)據(jù)思維去推動鐵路創(chuàng)新發(fā)展具有極其重要的現(xiàn)實意義。
參考文獻:
[1]李國杰,程學旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考[J].中國科學院院刊.2012(06)
[2]孟小峰,慈祥.大數(shù)據(jù)管理: 概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1)
[3]王衛(wèi)東,徐貴紅,劉金朝,張文軒,邢小琴.鐵路基礎(chǔ)設(shè)施大數(shù)據(jù)的應(yīng)用與發(fā)展[J].2015(05)
[4]維克托·舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2013.
[5]王元卓,靳小龍,程學旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計算機學報. 2013(06)
[6]劉婷,徐寰春.淺析大數(shù)據(jù)時代背景下智慧城市規(guī)劃[J].智能城市.2016(09)
[7]李藝杰.淺談大數(shù)據(jù)時代數(shù)據(jù)信息現(xiàn)狀及發(fā)展[J].中國新技術(shù)新產(chǎn)品. 2014(15)
[8]馮永強,張良,馮怡,朱尚杰.大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J].信息化建設(shè). 2015(12)
[9]張保國.淺議大數(shù)據(jù)在公交經(jīng)營管理中的應(yīng)用[J].城市公共交通.2016(03)
[10]方巍,鄭玉,徐江.大數(shù)據(jù):概念、技術(shù)及應(yīng)用研究綜述[J].南京信息工程大學學報(自然科學版).2014(05)
[11]鄔賀銓.大數(shù)據(jù)時代的機遇與挑戰(zhàn)[J].求是.2013(04)
[12]王浩,張怡.大數(shù)據(jù)時代下人類思維方式變革的趨勢[J]. 新西部(理論版). 2015(02)
[13]張康之,張桐.大數(shù)據(jù)中的思維與社會變革要求[J]. 理論探索. 2015(05)
[14]黃欣榮.大數(shù)據(jù)時代的思維變革[J]. 重慶理工大學學報(社會科學). 2014(05)
[15]代明睿,朱克非,鄭平標.我國鐵路應(yīng)用大數(shù)據(jù)技術(shù)的思考[J]. 鐵道運輸與經(jīng)濟. 2014(03)