葉雷
“大數(shù)據(jù)時代的預(yù)言家”、牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授維克托·邁爾·舍恩伯格在《大數(shù)據(jù)時代》一書中,首先給出了“大數(shù)據(jù)”的含義:你的一個習慣動作,你的一次消費行為,你的一份就診記錄……文字、方位、溝通等一切事物皆可以量化為數(shù)據(jù),不僅人類生產(chǎn)和生活中“有意義”的信息海量產(chǎn)生,相比以往呈幾何數(shù)級的爆炸式增長,“無意義”的數(shù)據(jù)的膨脹速度也同樣驚人。
數(shù)據(jù)采集存儲技術(shù)讓所有的一切信息都可能被數(shù)據(jù)化,互聯(lián)網(wǎng)特別是移動互聯(lián)網(wǎng)技術(shù)讓所有的數(shù)據(jù)可以串聯(lián)起來,無遺漏數(shù)據(jù)分析技術(shù)幾乎可以讓所有的數(shù)據(jù)都派上用場?!按髷?shù)據(jù)時代”,沒有了“有意義”信息和“無意義”信息的邊界,誰能得到信息并善于利用信息,誰就會搶占先機?!按髷?shù)據(jù)時代”不僅影響著我們每一個人,甚至連世界經(jīng)濟格局也在醞釀著巨大變革。因此,《大數(shù)據(jù)時代》的作者認為,大數(shù)據(jù)從根本上改變我們認識世界和改變世界的方式,開啟了一次重大的時代轉(zhuǎn)型。
歷史是一面鏡子,照向未來。毫無疑問,已有的大數(shù)據(jù)也屬于歷史的范疇,但大數(shù)據(jù)時代卻是指向未來的。大數(shù)據(jù)時代,我們分析的數(shù)據(jù)因為“大”,擺脫了傳統(tǒng)對隨機采樣的依賴,而是面對全體數(shù)據(jù);因為所有信息都是“數(shù)”,可以不再糾結(jié)具體數(shù)據(jù)的精確度,而是坦然面對信息的混雜;信息之“大”之“雜”,讓我們分析的“據(jù)”也由傳統(tǒng)的因果關(guān)系變?yōu)橄嚓P(guān)關(guān)系。
人們在大規(guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無法完成的。全球新產(chǎn)生數(shù)據(jù)年增40%,即信息總量每兩年就可以翻番,而且這一趨勢還在加速。倘若能夠更有效地組織和使用大數(shù)據(jù),人類將得到更多的機會發(fā)揮數(shù)據(jù)對社會發(fā)展的巨大推動作用。研究證明,通過大數(shù)據(jù)和冪律分布分析,人類行為93%是可以預(yù)測的,成為“已經(jīng)發(fā)生的未來”。
大數(shù)據(jù)時代,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗和直覺。雖然目前大數(shù)據(jù)預(yù)測的還只是參考答案,不是最終答案,但其威力已經(jīng)顯現(xiàn)。在《大數(shù)據(jù)時代》中,作者舉的3個例子令人印象特別深刻。
一是谷歌僅憑網(wǎng)民留下的相關(guān)痕跡,就能得出與事實相符度高達97%的結(jié)論,2009年比疾控中心提前兩周、具體到了特定的地區(qū)和州、準確預(yù)測了甲型H1N1流感的爆發(fā)。2013年,又成功預(yù)測了美國流感的暴發(fā)。
二是奧巴馬2008年的選舉,競選團隊里設(shè)置了首席數(shù)據(jù)科學(xué)家,他利用Facebook和Twitter進行數(shù)據(jù)分析,不但利用社交媒體來發(fā)布信息,幫助奧巴馬團隊定位目標選民,甚至篩選出一些潛在的競選志愿者。
三是微軟公司通過大數(shù)據(jù)分析處理,對新一屆奧斯卡金像獎作出“預(yù)言”,結(jié)果除“最佳導(dǎo)演”外,其余13項大獎全部命中。
正如維克托教授所說,我們目前看到的大數(shù)據(jù)和大數(shù)據(jù)應(yīng)用,還只是“冰山的一角”。一定程度上,大數(shù)據(jù)就是新財富,價值堪比石油,正因為如此,賽門鐵克公司的調(diào)研報告顯示,全球企業(yè)的信息存儲總量年增67%。目前包括谷歌、IBM、微軟、EMC、惠普,以及我國的百度、騰訊、阿里巴巴等眾多巨頭,已早早開始布局大數(shù)據(jù),為在即將來臨的大數(shù)據(jù)時代做好競爭鋪墊。
大數(shù)據(jù)已經(jīng)滲入到了生活的方方面面,將逐漸成為現(xiàn)代社會基礎(chǔ)設(shè)施的一部分,就像公路、鐵路、港口、水電和通信網(wǎng)絡(luò)一樣不可或缺。更有人說,大數(shù)據(jù)是繼邊防、海防、空防之后的第四個大國博弈的空間。美國奧巴馬政府已經(jīng)把“大數(shù)據(jù)”上升到了國家戰(zhàn)略的層面,投資2億美元啟動“大數(shù)據(jù)研究和發(fā)展計劃”。我國的國家973計劃中已經(jīng)部署相關(guān)的科研項目,有中國硅谷之稱的中關(guān)村,大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)納入《中關(guān)村戰(zhàn)略性新興產(chǎn)業(yè)集群創(chuàng)新引領(lǐng)工程(2013-2015年)》。
大數(shù)據(jù)時代,可以讓人成為上帝,通過各數(shù)據(jù)匯總,俯瞰世界中你想知道的任何一面。大數(shù)據(jù)時代,也可以讓你困擾不堪,因為你面臨個人隱私被不斷泄露和基于數(shù)據(jù)預(yù)測偏見的麻煩和危機。維克托教授在《大數(shù)據(jù)時代》中表達了“數(shù)據(jù)主宰一切”的隱憂,并提出了“責任與自由并舉”的信息管理設(shè)想,這也是我們在擁抱大數(shù)據(jù)時代時必須思考和解決的問題。