呂梅 沙劍青
從硅谷到北京,大數(shù)據(jù)的話題正在被傳播,我們的行為、位置,甚至身體生理數(shù)據(jù)等每一點(diǎn)變化都成為了可被記錄和分析的數(shù)據(jù)。馬云說(shuō),大家還沒(méi)搞清PC時(shí)代的時(shí)候,移動(dòng)互聯(lián)網(wǎng)來(lái)了,還沒(méi)搞清移動(dòng)互聯(lián)網(wǎng)的時(shí)候,大數(shù)據(jù)時(shí)代來(lái)了。那么,什么是大數(shù)據(jù)?大數(shù)據(jù)時(shí)代有什么特點(diǎn)?大數(shù)據(jù)會(huì)帶來(lái)什么改變?大數(shù)據(jù)在世界已得到了怎樣的應(yīng)用?
大數(shù)據(jù)帶來(lái)新變革
大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理,并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。
國(guó)際數(shù)據(jù)公司還定義了大數(shù)據(jù)的四大特征:海量的數(shù)據(jù)規(guī)模(vast)、快速的數(shù)據(jù)流轉(zhuǎn)和動(dòng)態(tài)的數(shù)據(jù)體系(velocity)、多樣的數(shù)據(jù)類型(variety)和巨大的數(shù)據(jù)價(jià)值(value)。僅從海量的數(shù)據(jù)規(guī)模來(lái)看,全球IP流量達(dá)到1EB所需的時(shí)間,在2001年需要1年,在2013年僅需1天,到2016年則僅需半天。全球新產(chǎn)生的數(shù)據(jù)年增40%,全球信息總量每?jī)赡昃涂煞?/p>
而根據(jù)2012年互聯(lián)網(wǎng)絡(luò)數(shù)據(jù)中心發(fā)布的《數(shù)字宇宙2020》報(bào)告,2011年全球數(shù)據(jù)總量已達(dá)到1.87ZB(1ZB=10萬(wàn)億億字節(jié)),如果把這些數(shù)據(jù)刻成DVD,排起來(lái)的長(zhǎng)度相當(dāng)于從地球到月亮之間一個(gè)來(lái)回的距離,并且數(shù)據(jù)以每?jī)赡攴环乃俣蕊w快增長(zhǎng)。預(yù)計(jì)到2020年,全球數(shù)據(jù)總量將達(dá)到35~40ZB,10年間將增長(zhǎng)20倍以上。需要強(qiáng)調(diào)的是:所謂大數(shù)據(jù)并不僅僅是指海量數(shù)據(jù),而更多是指這些數(shù)據(jù)都是非結(jié)構(gòu)化的、殘缺的、無(wú)法用傳統(tǒng)的方法進(jìn)行處理的數(shù)據(jù)。
在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》中,作者肯尼思·庫(kù)克耶和維克托·邁爾-舍恩伯格指出,大數(shù)據(jù)時(shí)代,數(shù)據(jù)的方式出現(xiàn)了3個(gè)變化:第一,人們處理的數(shù)據(jù)從樣本數(shù)據(jù)變成全部數(shù)據(jù);第二,由于是全樣本數(shù)據(jù),人們不得不接受數(shù)據(jù)的混雜性,而放棄對(duì)精確性的追求;第三,人類通過(guò)對(duì)大數(shù)據(jù)的處理,放棄對(duì)因果關(guān)系的渴求,轉(zhuǎn)而關(guān)注相互聯(lián)系。這一切代表著人類告別總是試圖了解世界運(yùn)轉(zhuǎn)方式背后深層原因的態(tài)度,而走向僅僅需要弄清現(xiàn)象之間的聯(lián)系以及利用這些信息來(lái)解決問(wèn)題。
就像電力技術(shù)的應(yīng)用不僅僅是發(fā)電、輸電那么簡(jiǎn)單,而是引發(fā)了整個(gè)生產(chǎn)模式的變革一樣,基于互聯(lián)網(wǎng)技術(shù)而發(fā)展起來(lái)的“大數(shù)據(jù)”應(yīng)用,將會(huì)對(duì)人們的生產(chǎn)過(guò)程和商品交換過(guò)程產(chǎn)生顛覆性影響,數(shù)據(jù)的挖掘和分析只是整個(gè)變革過(guò)程中的一個(gè)技術(shù)手段,而遠(yuǎn)非變革的全部。大數(shù)據(jù)的本質(zhì)是基于互聯(lián)網(wǎng)基礎(chǔ)上的信息化應(yīng)用,其真正的“魔力”在于信息化與工業(yè)化的融合,使工業(yè)制造的生產(chǎn)效率得到大規(guī)模提升。
隨著大數(shù)據(jù)、云計(jì)算日益進(jìn)入公眾視野,我們對(duì)其的關(guān)注也從技術(shù)、經(jīng)濟(jì)領(lǐng)域,拓展到更多的領(lǐng)域。在政治方面,大數(shù)據(jù)的發(fā)展程度和利用方式改變傳統(tǒng)的政治生態(tài),促進(jìn)網(wǎng)絡(luò)政治、網(wǎng)絡(luò)民主的全面升級(jí),并直接導(dǎo)致現(xiàn)實(shí)政治的轉(zhuǎn)型;在經(jīng)濟(jì)方面,大數(shù)據(jù)已經(jīng)成為一種強(qiáng)大的經(jīng)濟(jì)資源,備受企業(yè)界關(guān)注,也催生出了新的經(jīng)濟(jì)形態(tài);在社會(huì)方面,大數(shù)據(jù)促進(jìn)了社會(huì)結(jié)構(gòu)轉(zhuǎn)型,改變了社會(huì)成員的生活方式,對(duì)于社會(huì)階層和結(jié)構(gòu)的流動(dòng)起著重要的推動(dòng)作用;在文化方面,大數(shù)據(jù)越來(lái)越成為文化發(fā)展的承載系統(tǒng),促使文化生產(chǎn)、傳播方式的徹底變革,促進(jìn)文化資源的產(chǎn)業(yè)化和事業(yè)性發(fā)展;在軍事方面,現(xiàn)代軍事發(fā)展越來(lái)越依賴大數(shù)據(jù)的開發(fā)和運(yùn)用,大數(shù)據(jù)成為衡量一個(gè)國(guó)家軍事國(guó)防能力的關(guān)鍵要素;在科技方面,大數(shù)據(jù)的發(fā)掘和運(yùn)用成為現(xiàn)代科技水平的重要衡量標(biāo)準(zhǔn),也成為國(guó)際競(jìng)爭(zhēng)力的重要標(biāo)志。
各國(guó)大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展
世界經(jīng)濟(jì)論壇的一份報(bào)告稱,“大數(shù)據(jù)為新財(cái)富,價(jià)值堪比石油”。大數(shù)據(jù)將成為未來(lái)提高競(jìng)爭(zhēng)力的關(guān)鍵要素。當(dāng)前,大數(shù)據(jù)所蘊(yùn)含的戰(zhàn)略價(jià)值已經(jīng)引起多數(shù)發(fā)達(dá)國(guó)家政府重視,相繼出臺(tái)大數(shù)據(jù)戰(zhàn)略規(guī)劃和配套法規(guī)促進(jìn)大數(shù)據(jù)應(yīng)用與發(fā)展。在政府大數(shù)據(jù)戰(zhàn)略部署和政策推動(dòng)下,發(fā)達(dá)國(guó)家的政府部門、企業(yè)、高校及研究機(jī)構(gòu)都開始積極探索大數(shù)據(jù)應(yīng)用。
美國(guó)將大數(shù)據(jù)視為強(qiáng)化國(guó)家競(jìng)爭(zhēng)力的關(guān)鍵因素之一,他們把大數(shù)據(jù)研究和生產(chǎn)計(jì)劃提高到了國(guó)家戰(zhàn)略的層面。自上世紀(jì)以來(lái)美國(guó)國(guó)會(huì)、政府先后出臺(tái)一系列法規(guī),對(duì)數(shù)據(jù)的收集、發(fā)布、使用和管理等諸環(huán)節(jié)都做出了具體的規(guī)定。經(jīng)過(guò)幾十年的修改完善,如今美國(guó)數(shù)據(jù)、信用和隱私已形成較為成熟的法律框架和道德規(guī)范。2013年5月,奧巴馬政府更是宣布了“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”,提出“通過(guò)提高我們從大型復(fù)雜的數(shù)字?jǐn)?shù)據(jù)集中提取知識(shí)和觀點(diǎn)的能力,承諾幫助加快在科學(xué)與工程中的步伐,加強(qiáng)國(guó)家安全,并改變教學(xué)研究”。根據(jù)這一計(jì)劃,美國(guó)希望利用大數(shù)據(jù)技術(shù)在多個(gè)領(lǐng)域?qū)崿F(xiàn)突破。開放數(shù)據(jù)、創(chuàng)新驅(qū)動(dòng)以及技術(shù)研發(fā)支持下,美國(guó)大數(shù)據(jù)的研究和應(yīng)用已是走在全球前列。
日本面臨著由于長(zhǎng)期經(jīng)濟(jì)低迷導(dǎo)致國(guó)際地位下降、人口老齡化以及日益增大的社會(huì)保險(xiǎn)費(fèi)用和社會(huì)基礎(chǔ)設(shè)施老化等諸多問(wèn)題。為了扭轉(zhuǎn)這一現(xiàn)狀,日本政府決定通過(guò)大力發(fā)展IT產(chǎn)業(yè),特別是大數(shù)據(jù)及開發(fā)數(shù)據(jù)和云計(jì)算。2013 年6 月,日本第二次安倍內(nèi)閣正式公布了新 IT 戰(zhàn)略——“創(chuàng)建最尖端 IT 國(guó)家宣言”。全面闡述以發(fā)展開放公共數(shù)據(jù)和大數(shù)據(jù)為核心的日本新IT 國(guó)家戰(zhàn)略,提出要把日本建設(shè)成為一個(gè)具有“世界最高水準(zhǔn)的廣泛運(yùn)用信息產(chǎn)業(yè)技術(shù)的社會(huì)”,并且,將其發(fā)展成就擴(kuò)展到國(guó)際范圍內(nèi)。目前,無(wú)論在大數(shù)據(jù)技術(shù)還是企業(yè)實(shí)際應(yīng)用方面,日本都在亞洲占據(jù)明顯優(yōu)勢(shì)。
以英國(guó)為首的歐洲國(guó)家,雖然經(jīng)濟(jì)不景氣,財(cái)政收緊,但大數(shù)據(jù)依然是他們重點(diǎn)發(fā)展的科技領(lǐng)域。2013年年初,英國(guó)商業(yè)、創(chuàng)新和技能部宣布,將注資6 億英鎊發(fā)展8 類高新技術(shù),大數(shù)據(jù)獨(dú)攬其中的1.89 億英鎊,將近三成。另外,2013年,英國(guó)首個(gè)綜合運(yùn)用大數(shù)據(jù)技術(shù)的醫(yī)藥衛(wèi)生科研中心在牛津大學(xué)成立。同時(shí),以英國(guó)為首的歐洲核子中心(CERN)將在匈牙利科學(xué)院魏格納物理學(xué)研究中心建設(shè)一座超寬帶數(shù)據(jù)中心。建成后,魏格納數(shù)據(jù)中心將成為連接CERN 且具有歐洲最大傳輸能力的數(shù)據(jù)處理中心,未來(lái)該設(shè)施在處理大型強(qiáng)子對(duì)撞機(jī)(LHC)的數(shù)據(jù)以及實(shí)驗(yàn)方面發(fā)揮重要作用。
發(fā)展大數(shù)據(jù)及其相關(guān)服務(wù)業(yè)將成為新興經(jīng)濟(jì)體,特別是我國(guó)在戰(zhàn)略性新興產(chǎn)業(yè)領(lǐng)域發(fā)揮后發(fā)優(yōu)勢(shì)趕超發(fā)達(dá)國(guó)家的重要機(jī)遇。只要條件具備,發(fā)展中經(jīng)濟(jì)體能夠利用大數(shù)據(jù)發(fā)揮巨大的潛力,中國(guó)發(fā)展大數(shù)據(jù)產(chǎn)業(yè)機(jī)遇可貴潛力巨大。IDC發(fā)布的報(bào)告預(yù)測(cè),中國(guó)大數(shù)據(jù)技術(shù)與服務(wù)市場(chǎng)規(guī)模將從2011年的7760萬(wàn)美元增長(zhǎng)到2016年的6.17億美元,5年的復(fù)合增長(zhǎng)率達(dá)51.4%。中國(guó)市場(chǎng)的規(guī)模之大為大數(shù)據(jù)發(fā)展提供了大空間、大平臺(tái)。但是,由尚普咨詢產(chǎn)業(yè)投資決策網(wǎng)發(fā)布的《2015—2020年中國(guó)大數(shù)據(jù)行業(yè)深度研究及前景預(yù)測(cè)報(bào)告》顯示,我國(guó)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展目前還處于起步階段,業(yè)界對(duì)于大數(shù)據(jù)產(chǎn)業(yè)的立法保護(hù)呼聲甚高。一些專家認(rèn)為,目前就大數(shù)據(jù)單獨(dú)立法條件尚不成熟,政府部門應(yīng)在推進(jìn)規(guī)劃引導(dǎo)、完成標(biāo)準(zhǔn)制定、優(yōu)化完善大數(shù)據(jù)發(fā)展環(huán)境等方面發(fā)力。
對(duì)于大數(shù)據(jù)的探索和發(fā)展,歐美和日本已經(jīng)走在世界的前列。而我國(guó)政府也已將大數(shù)據(jù)發(fā)展提升至戰(zhàn)略高度,創(chuàng)造積極的政策、法律環(huán)境;增加產(chǎn)業(yè)發(fā)展的財(cái)政投入,加強(qiáng)人才培養(yǎng)和核心技術(shù)的研發(fā),建立先進(jìn)、巨大的數(shù)據(jù)中心,促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展。endprint