牛祿青
“11·11”購物狂歡節(jié)當(dāng)天,天貓和淘寶共吸引了2.13億獨立用戶訪問,其中第一分鐘就有1000萬獨立用戶加入搶購,當(dāng)天訂單數(shù)達(dá)到1億筆,通過支付寶完成的總銷售額達(dá)到191億元,是去年的3倍多,創(chuàng)造了中國電商行業(yè)日銷售的一個新記錄,并超過2011年美國“網(wǎng)購星期一”12.5億美元(約合人民幣78億元)的單日最高銷售額。
這是一組魔咒般的數(shù)據(jù),它讓網(wǎng)商和消費者為之震驚,讓其他電商平臺和線下零售艷羨不已,也讓身在其中的阿里人倍感意外。
“這么大的能量,我們都沒有想到,但我有一個預(yù)感就是,所有人對我說的預(yù)測都是錯的。當(dāng)天看完第一個小時的成交后,我跟我的同事說應(yīng)該能達(dá)到160億,高層瞪了我一眼,你覺得靠譜嗎?我說可以的。最終比我的預(yù)測還要高?!惫夤鞴?jié)當(dāng)天,一直在數(shù)據(jù)監(jiān)測直播室的大數(shù)據(jù)研究專家、淘寶網(wǎng)商業(yè)智能部資深總監(jiān)車品覺告訴本刊記者。
如此龐大的訪問量和交易量對電商平臺和網(wǎng)銀系統(tǒng)也是一次巨大的考驗,盡管阿里巴巴在技術(shù)上和管理上進(jìn)行了充分準(zhǔn)備,并且破天荒地打破了“百花齊放”的主流企業(yè)文化,有效發(fā)揮了天貓、淘寶和支付寶的協(xié)同性,總體保持順暢,但還是有一家銀行的網(wǎng)銀系統(tǒng)抵擋不住潮水般交易數(shù)據(jù)的攻勢,而敗下陣來。
數(shù)據(jù)可以分析歷史,也可以觀測未來?!半p11留給我們一組寶貴的數(shù)據(jù)?!避嚻酚X說,“它告訴我們許多不經(jīng)常來的用戶都在同一時間涌過來了,這些用戶群至少在未來一年內(nèi)應(yīng)該去觸發(fā)他(她)們。以前不活躍的用戶在當(dāng)天活躍了,這些用戶看了什么產(chǎn)品?買了什么產(chǎn)品?還對哪些產(chǎn)品感興趣?通過這些豐富的數(shù)據(jù),可以發(fā)現(xiàn)用戶的偏向。”
何為大
光棍節(jié)已讓我們領(lǐng)教了電商大數(shù)據(jù)的潛力和火爆,接下來再帶你看一下更加壯觀的場景:
一秒鐘內(nèi),互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)量,比20年前整個互聯(lián)網(wǎng)儲存的數(shù)據(jù)還多;一分鐘內(nèi),微博、Twitter上新發(fā)布的數(shù)據(jù)量超過10萬,社交網(wǎng)站Facebook的瀏覽量超過600萬;兩分鐘內(nèi),全球上傳的照片數(shù)量超過19世紀(jì)照片數(shù)量總和;一天內(nèi),百度要處理幾十PB數(shù)據(jù);一個月內(nèi),Google處理的數(shù)據(jù)量超過400PB;2011年,全球被創(chuàng)建和復(fù)制的數(shù)據(jù)總量遠(yuǎn)遠(yuǎn)超過人類有史以來所有印刷材料的數(shù)據(jù)總量……
當(dāng)你把想要去的目的地輸入手機(jī)地圖或互聯(lián)網(wǎng)地圖,或者開著車對著“語音助手”說:“我要在附近找一家素食餐廳”,短短一兩秒就能讓你得到滿意的答案。其背后向您提供服務(wù)所涉及到的導(dǎo)航定位、資料檢索、存取計算、數(shù)據(jù)交換等一系列動作是何等地復(fù)雜。
這就是“大數(shù)據(jù)”,一個不知不覺被數(shù)據(jù)包裹和滲透的時代。每個人都是數(shù)據(jù)的創(chuàng)造者和傳播者,每個人也是數(shù)據(jù)的接收者和分享者。手機(jī)、平板電腦、桌面電腦、數(shù)字電視、智能電視、數(shù)字眼鏡、傳感器、衛(wèi)星定位系統(tǒng)等終端設(shè)備,如雨后春筍,遍布各個角落,海量數(shù)據(jù)就這樣源源不斷地噴薄而出……
中國工程院院士李國杰用4個“V”來描述大數(shù)據(jù)的特征:體量浩大(Volume)、類型復(fù)雜(Variety)、生成迅速(Velocity)、價值巨大但利用密度低(Value)。
互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)上產(chǎn)生的數(shù)據(jù),如文本、視頻、圖片、動漫、地理位置等,大多是非結(jié)構(gòu)信息,據(jù)預(yù)測,到2012年末非結(jié)構(gòu)化數(shù)據(jù)將達(dá)到整個數(shù)據(jù)量的75%以上。
涂子沛在《大數(shù)據(jù)》一書中認(rèn)為,“大數(shù)據(jù)”之“大”,不僅僅在于“容量之大”,更大的意義在于,通過對海量數(shù)據(jù)的交換、整合和分析,發(fā)現(xiàn)新的知識,創(chuàng)造新的價值,帶來“大知識”、“大科技”、“大利潤”和“大發(fā)展”。
“如果每天有一兩百個G以上的數(shù)據(jù),就可以算是一個大數(shù)據(jù)公司了?!泵脶樝到y(tǒng)創(chuàng)始人、首席技術(shù)官吳明輝表示,面對海量數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)庫軟件Oracle等,已無法進(jìn)行處理。目前新的數(shù)據(jù)庫結(jié)構(gòu)又不像傳統(tǒng)的數(shù)據(jù)庫軟件那么靈活。“傳統(tǒng)的Oracle好比自行車,大街小巷都可以騎,但它很慢;新的數(shù)據(jù)庫結(jié)構(gòu)相當(dāng)于高鐵,它只能沿著軌道走,但它很快,承載的量也很大?!?/p>
盡管美國的大數(shù)據(jù)應(yīng)用已如水銀瀉地,無孔不入,但美國GE公司的人這樣抱怨,“我們的數(shù)據(jù)僅整理清楚都需要3年,3年后再玩數(shù)據(jù)已經(jīng)落伍了,更別說挖掘價值了。越老的企業(yè),玩數(shù)據(jù)的難度越大?!?/p>
車品覺認(rèn)為,用數(shù)據(jù)之前,需要先會“養(yǎng)數(shù)據(jù)”,但是把數(shù)據(jù)收集起來,不代表你在養(yǎng),只有知道如何養(yǎng)大它,那才叫養(yǎng)。假如今天下午一點多給你兩樣?xùn)|西:面包和五塊錢,由于你吃過飯了,可能五塊錢對你的吸引力更大。這個例子告訴我們?nèi)说臎Q定會受到當(dāng)時環(huán)境的影響。所以,收集數(shù)據(jù)的時候,如果不把環(huán)境數(shù)據(jù)收集過來,這個數(shù)據(jù)過幾年后就沒有價值了,而且很難研究。十幾年后,再看“11·11”的191億元的數(shù)據(jù),如果不了解促銷五折的背景,人們會說,不可能,那天可能有異常。
而且,車品覺表示,數(shù)據(jù)會斷裂的,即過去是這個意思,未來可能不是這個意思;過去可以這樣用,未來不一定能這樣用。如果不用數(shù)據(jù),只是養(yǎng)它,兩年之后就會斷裂,這些數(shù)據(jù)就是一潭死水。
有多神
2012年美國總統(tǒng)大選雖然塵埃落定,但與歷屆選舉不同。此次大選伊始,美國總統(tǒng)的競選團(tuán)隊就紛紛利用數(shù)據(jù)分析方法來尋找和鎖定潛在的己方選民,并使用最前沿的數(shù)字化策略定位拉攏那些中間派選民。整個過程,大數(shù)據(jù)應(yīng)用的威力可謂發(fā)揮得淋漓盡致。最終,奧巴馬團(tuán)隊技高一籌,贏得連任。
全球零售巨頭沃爾瑪,是最早一批利用數(shù)據(jù)賺錢的企業(yè)。早在1969年,沃爾瑪就開始利用計算機(jī)來跟蹤存貨,通過分析數(shù)據(jù)來挖掘銷售“秘籍”。最經(jīng)典的案例莫過于“啤酒+尿布”的銷售。沃爾瑪?shù)难芯繂T通過對消費者的行為數(shù)據(jù)進(jìn)行分析,得到了“男性顧客會在購買尿布的同時,購買啤酒來犒賞自己”的顧客消費偏好信息。最終,沃爾瑪?shù)摹捌【?尿布”捆綁式銷售取得了兩種商品的銷售雙贏。
今年光棍節(jié)淘寶和天貓之所以牛氣沖天,一個重要因素是全場5折促銷的“大紅包”。而美國公司早就利用大數(shù)據(jù)為用戶發(fā)紅包,國內(nèi)的B2C公司還沒有這樣做。美國的電商公司進(jìn)行過用戶問卷調(diào)查:你喜歡這個企業(yè)嗎?將數(shù)據(jù)收集回來發(fā)現(xiàn),最喜歡的人對這個企業(yè)的交易貢獻(xiàn)不是最大的。所以,需要定位這個人的回頭率和價值,就知道如果失去了他(她)會損失多少。
英國有個教授做了一個數(shù)據(jù)試驗,把好運和不好運的人分為兩類,然后對這兩類人進(jìn)行跟蹤測試,發(fā)現(xiàn)有一個元素可以區(qū)分出這兩類人,那就是笑。好運的人每天都在笑,不好運的人很少笑。
物以類聚,人以群分。淘寶的數(shù)據(jù)科學(xué)家也用這種聚類法,計算一個網(wǎng)店如何做到小而美。首先對用戶進(jìn)行線上和線下的問卷調(diào)查:請告訴淘寶的哪些網(wǎng)店是小而美?通過數(shù)據(jù)分析發(fā)現(xiàn),小而美的店,網(wǎng)上用戶評價不一定高。而且有一個數(shù)據(jù)太聰明了,小而美的店,熟客的“客單價”(指每一個顧客平均購買商品的金額,客單價=銷售額÷顧客數(shù))不一定高,因為熟客率高對新人吸引力不夠,不一定做成小而美。原來這是一個變種的錢包分享——小而美的店需要一個很好的連接關(guān)系,熟客經(jīng)常逛這個網(wǎng)店,而且對網(wǎng)店的收入貢獻(xiàn)是穩(wěn)定的。淘寶還對小而美開發(fā)了一個“美指數(shù)”,這個指數(shù)可以屏蔽或過濾掉網(wǎng)店的作弊數(shù)據(jù)。
一組數(shù)據(jù)能讓人們做一個更好的決定的時候,這組數(shù)據(jù)可以稱之為聰明的數(shù)據(jù)連接。美國玩大數(shù)據(jù)的人都會談到“OODA”,即觀察Observe,定位Orient,決定Decision,行動Act。這是美國的一個空軍教練發(fā)明的,為了減少戰(zhàn)斗中的傷亡。
企業(yè)經(jīng)過觀察拿到數(shù)據(jù),然后對數(shù)據(jù)進(jìn)行定位,繼而做出決定和行動。這是數(shù)據(jù)挖掘法。最有意思的是挖掘購物性別,某人在淘寶網(wǎng)上注冊的性別是男,但購物的時候買的都是女性的東西,這可以推測出他的一部分購物行為是為老婆買的。這些數(shù)據(jù)表明,在營銷的時候,這個賬號雖然是女的,但不代表不能把男的商品推薦給她。還有,通過一些行為數(shù)據(jù)很容易判斷出某個人的性別,比如購買母嬰產(chǎn)品的用戶基本是女的,而且結(jié)婚了,所以她就會為丈夫和孩子買東西。這時候,就要偏向于家庭營銷,不能太注重個性化。
企業(yè)要經(jīng)營一個用戶,本質(zhì)上要看這個用戶有沒有錢,愛不愛這個企業(yè),用戶所處的生命周期:畢業(yè)了嗎?有男(女)朋友嗎?結(jié)婚了嗎?有孩子嗎?根據(jù)生命周期來估計用戶需要的產(chǎn)品和偏好。通過大數(shù)據(jù)就可以推斷出這三個方面。
車品覺強調(diào),大數(shù)據(jù)最重要的不是知道你的財富和生命周期,而是有多少穩(wěn)定數(shù)據(jù),如果有20%的穩(wěn)定數(shù)據(jù),完全可能猜到其余80%的未知數(shù)據(jù)。例如知道身份證號就可以了解到你的出生年月日和籍貫,只要寄過東西就可以知道你所處的地區(qū),如果你在學(xué)校又是20歲左右,那你基本就是大學(xué)生,等等。僅有行為數(shù)據(jù)是不行的,因為行為數(shù)據(jù)飄忽不定。
專家認(rèn)為,數(shù)據(jù)科學(xué)時代,不能有什么數(shù)據(jù)就用什么,要主動地去尋找原材料,而且還要把原材料提煉得更好一些。比如,一個人在某個網(wǎng)站的閑逛指數(shù)和購買指數(shù),需要迅速計算出來,這個很重要。因為絕大多數(shù)電子商務(wù)網(wǎng)站都是設(shè)計給購買的人,而不是給逛的人。蘑菇街之所以能成功,是因為它專為逛而設(shè)計。今天的電子商務(wù)網(wǎng)站一定要能區(qū)分出用戶的兩種行為,這樣,逛時讓用戶看更多商品,買時進(jìn)行精準(zhǔn)推薦,讓用戶趕緊買單走人,提高購物效率。
中國的企業(yè)與亞馬遜相比,在大數(shù)據(jù)管理和應(yīng)用方面還有較大差距,前者以結(jié)果導(dǎo)向數(shù)據(jù)為主,后者的數(shù)據(jù)大部分是以客戶為中心。例如,招商銀行在今天下午2點鐘,平均有20人排隊,這是業(yè)務(wù)導(dǎo)向。如果進(jìn)入到招商銀行的每個客戶,平均需要2分鐘能等上服務(wù),這是以客戶為中心的指標(biāo)。
所以,中國的企業(yè)要努力把數(shù)據(jù)指標(biāo)轉(zhuǎn)為以客戶為中心。B2C雙邊市場比較簡單,以消費者為中心。而電商平臺淘寶是一個三邊市場,這樣客戶就比較多,有銷售者、合作方、消費者,三邊市場很復(fù)雜。通常以消費者來考核銷售者,用銷售者來觀察消費者。
車品覺告訴記者,采用網(wǎng)絡(luò)分析法研究關(guān)聯(lián)數(shù)據(jù)對淘寶等平臺類公司很重要,可以知道一個類目是不是存在過度競爭。如果競爭很密集,關(guān)聯(lián)銷售者的客單價都會下降,重復(fù)購買率就變低,可以知道惡性循環(huán)來了。
數(shù)據(jù)礦
大數(shù)據(jù)將是下一個社會發(fā)展階段的石油和金礦,已成為業(yè)內(nèi)人士的共識。但數(shù)據(jù)如果不加以利用,那就是閑置的資源,不僅占用更多虛擬空間,而且影響效率。所以,如何挖掘開發(fā)出其中的價值,已成為投資界、企業(yè)界以及政府和科研部門普遍關(guān)注的問題。
中國工程院院士李國杰對大數(shù)據(jù)的市場前景價值充滿信心。他認(rèn)為,目前人們開發(fā)和利用的價值還只是冰山一角。大數(shù)據(jù)的興起與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的蓬勃發(fā)展有很大關(guān)系,根本原因是經(jīng)濟(jì)利益驅(qū)動,IBM、亞馬遜、Google、Facebook等國際知名企業(yè)是大數(shù)據(jù)的主要推動者,國內(nèi)的大數(shù)據(jù)代表性企業(yè)是百度、騰訊、阿里巴巴。
“大數(shù)據(jù)就是金礦,誰挖掘得好就可以成為競爭壁壘。而今天最好的大數(shù)據(jù)都在大公司。我的預(yù)測:互聯(lián)網(wǎng)大公司大部分會學(xué)會駕馭大數(shù)據(jù),越做越強;而大部分非互聯(lián)網(wǎng)公司(電信、銀行、保險)雖擁有大數(shù)據(jù),卻不知其珍貴,或用之不當(dāng)?!?創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)在微博中如是說。
作為中國大數(shù)據(jù)的先行者,阿里巴巴集團(tuán)主席馬云對大數(shù)據(jù)格外重視。他在一次公開演講中表示,“阿里積累的大量數(shù)據(jù)可以告訴我們,世界經(jīng)濟(jì)在發(fā)生什么,中國經(jīng)濟(jì)在發(fā)生什么。我們可以給宏觀經(jīng)濟(jì)以指導(dǎo),數(shù)據(jù)將會影響世界。”阿里不想占有數(shù)據(jù),數(shù)據(jù)不用來分享,就是一堆數(shù)字,沒有一點意義。為了自己和下一代商人,必須思考這些問題,并且為之而努力。
目前,國內(nèi)大數(shù)據(jù)領(lǐng)頭羊阿里巴巴、騰訊、百度都在大數(shù)據(jù)的技術(shù)、管理與應(yīng)用上進(jìn)行探索,努力縮小與“硅谷”的大數(shù)據(jù)公司的差距。百度雖然擁有龐大數(shù)據(jù),但數(shù)據(jù)缺少身份信息,在開掘上需要另辟蹊徑;騰訊擁有大數(shù)據(jù)三大殺手锏:PC端的QQ和Qzone,移動端的微信,如果開發(fā)利用好,能量驚人,不過目前動作有點慢;在馬云的重視下,阿里巴巴提出大數(shù)據(jù)戰(zhàn)略,發(fā)揮電商平臺的集群優(yōu)勢,內(nèi)外雙管齊下,打造數(shù)據(jù)平臺和數(shù)據(jù)產(chǎn)品,實現(xiàn)數(shù)據(jù)資源的最大共享。
其他電商網(wǎng)站京東、社交網(wǎng)站人人網(wǎng),也利用自己的數(shù)據(jù)資源做用戶行為分析。此外,一些新興的大數(shù)據(jù)創(chuàng)業(yè)公司蓬勃崛起,如廣告營銷領(lǐng)域的秒針系統(tǒng),幫助客戶分析廣告投入是否有效;提供工具系統(tǒng)的公司友友系統(tǒng);提供數(shù)據(jù)存儲和銷售的天云科技;提供地理信息云服務(wù)的超圖軟件等。
“大數(shù)據(jù)時代,企業(yè)關(guān)注的重點將轉(zhuǎn)向數(shù)據(jù)?!崩顕鼙硎荆嬎銠C(jī)行業(yè)從追求計算速度轉(zhuǎn)變?yōu)榇髷?shù)據(jù)處理能力,軟件從編程為主轉(zhuǎn)變?yōu)橐詳?shù)據(jù)為中心,云計算進(jìn)入以分析即服務(wù)(AaaS)為主要標(biāo)志的Cloud2.0時代。生物制藥、新材料研制生產(chǎn)的流程會發(fā)生革命性的變化?!拔磥韺⑿纬蓴?shù)據(jù)服務(wù)、數(shù)據(jù)探礦、數(shù)據(jù)化學(xué)、數(shù)據(jù)材料、數(shù)據(jù)制藥等一系列戰(zhàn)略性新興產(chǎn)業(yè)?!眰鹘y(tǒng)信息技術(shù)企業(yè),如華為、聯(lián)想、浪潮等都在順應(yīng)大數(shù)據(jù)需要而轉(zhuǎn)型。華為本來是一家通信企業(yè),現(xiàn)在也在開拓數(shù)字醫(yī)療市場。
中國每年的就診患者是世界上最多的,如果對這些醫(yī)療數(shù)據(jù)進(jìn)行系統(tǒng)的分析,對治療疑難病癥,以及開發(fā)新藥都將產(chǎn)生積極的影響。據(jù)麥肯錫咨詢公司的研究,“大數(shù)據(jù)”技術(shù)可能為美國的醫(yī)療保健業(yè)每年創(chuàng)造3000億美元的價值,如此大的市場在中國同樣不可小覷。
未來,線下零售將是線上零售的最大競爭對手。比如,京東和天貓,兩個對手旁邊,還有更大的潛在競爭對手是線下,如沃爾瑪、家樂福、蘇寧、國美、物美。因為以前線上零售占線下零售的份額非常小,如同小石子扔到大海里,但如果比例逐漸擴(kuò)大,就會產(chǎn)生市場沖突了。
例如,到移動網(wǎng)站充值繳費的人附近10公里有沒有營業(yè)廳,有和沒有,差異挺大。另有企業(yè)做過試驗,對住在沃爾瑪旁邊的人做廣告,基本不起作用,因為這個竟?fàn)帉κ痔嫶罅恕?/p>
所以,為電商喝彩的同時,對線下零售的競爭實力不可低估。不過,挖掘線下交易數(shù)據(jù)的價值,需要下很大功夫,因為許多數(shù)據(jù)不知道顧客的身份。如果顧客都采用經(jīng)過注冊的會員卡交易,那情形就不一樣了。
移動互聯(lián)網(wǎng)將是一個數(shù)據(jù)金礦,運營商可以拿到大量用戶數(shù)據(jù),包括生活半徑數(shù)據(jù)。如果能計算出客戶一直都在這個生活圈,那么這個圈里分布的商店、飯店及娛樂設(shè)施都可以知道。這樣對于線上和線下營銷就具有很大參考價值。
對于電商是否可以與銀行、電信開展數(shù)據(jù)合作,車品覺認(rèn)為,“與銀行、運營商開發(fā)數(shù)據(jù)產(chǎn)品的時代有點遙遠(yuǎn),涉及法律、政策、數(shù)據(jù)安全等問題,以及公眾是否可以接受這些數(shù)據(jù)產(chǎn)品。美國對個人隱私很在意,但對數(shù)據(jù)產(chǎn)品可以接受?!?/p>
以Facebook為代表的社交網(wǎng)站,數(shù)據(jù)量比電子商務(wù)網(wǎng)站還要豐富,如果找到挖掘和提煉的鑰匙,SNS將產(chǎn)生巨大價值。
大數(shù)據(jù)浪潮,不單單為企業(yè)帶來商業(yè)價值,也提供了千載難逢的創(chuàng)業(yè)和就業(yè)機(jī)會。新興的創(chuàng)業(yè)公司通過出售數(shù)據(jù)產(chǎn)品和服務(wù),有針對性地提供技術(shù)解決方案,把大數(shù)據(jù)賦予了商品特性。例如,美國的Cloudera公司和Factual公司,中國的秒針系統(tǒng)、百分點、友友系統(tǒng)、天云科技等。它們?nèi)缧切侵?,有助于大?shù)據(jù)市場的建立和大數(shù)據(jù)商業(yè)的繁榮。
除了創(chuàng)業(yè),大量的就業(yè)機(jī)會也隨之產(chǎn)生。作為新興產(chǎn)業(yè),大數(shù)據(jù)人才的匱乏,國內(nèi)外大同小異,這無疑為年輕人提供了馳騁的舞臺。數(shù)據(jù)工程師、數(shù)據(jù)產(chǎn)品經(jīng)理、數(shù)據(jù)分析師、數(shù)據(jù)咨詢師、首席數(shù)據(jù)官等,各種不同的崗位為你招手。當(dāng)然,最頂尖的也是21世紀(jì)“最性感的職業(yè)”是數(shù)據(jù)科學(xué)家。這到底是個什么樣的職業(yè)?誰才能如愿以償?
車品覺告訴記者,現(xiàn)在淘寶培養(yǎng)了5個數(shù)據(jù)科學(xué)家,都是博士,屬于尖端人才,具備敏銳的商業(yè)感覺和出色的專業(yè)技能,對數(shù)據(jù)的嚴(yán)謹(jǐn)性超出常人的想象。做數(shù)據(jù)挖掘很容易,但達(dá)到數(shù)據(jù)科學(xué)家的水平很難。
“數(shù)據(jù)科學(xué)家”是交叉學(xué)科產(chǎn)生的頂級數(shù)據(jù)人才,既懂?dāng)?shù)學(xué)和統(tǒng)計,也懂編程和業(yè)務(wù),能夠不斷地探索、創(chuàng)新和預(yù)測未來。秒針也在培養(yǎng)“數(shù)據(jù)科學(xué)家”,“已經(jīng)有幾個了,但整個行業(yè)里太缺乏了?!眳敲鬏x表示。
成功的數(shù)據(jù)科學(xué)家應(yīng)該具備什么素質(zhì)和能力呢?哈佛商學(xué)院客座教授、德勤分析部門高級顧問托馬斯達(dá)文波特和格雷洛克風(fēng)投公司數(shù)據(jù)科學(xué)家D.J.帕蒂爾認(rèn)為,應(yīng)該是數(shù)據(jù)黑客、分析師、傳播者和靠譜顧問的綜合體,這樣的組合可謂極其強大,同時也極其罕見。
有人說,數(shù)據(jù)是西方人的專利,東方人不適合玩數(shù)據(jù),因為中國的文化是“差不多先生”。對于東西方數(shù)據(jù)的差異,經(jīng)常與美國數(shù)據(jù)專家和行業(yè)人士交流的車品覺表示,東方的數(shù)據(jù)滋味好,有全局觀,喜歡通過現(xiàn)象看本質(zhì),通過本質(zhì)推演現(xiàn)象。西方是追著現(xiàn)象跑,喜歡把數(shù)據(jù)進(jìn)行逐一分解,但看出的問題不是全部。不過,中國也要克服“馬馬虎虎”的缺點。
據(jù)美國權(quán)威信息技術(shù)研究與咨詢公司Gartner最新發(fā)布的《2012-2013年技術(shù)曲線成熟度報告》指出,大數(shù)據(jù)成為市場的主流產(chǎn)品需要2~5年。