文 | 王東東
大數(shù)據(jù)是一個(gè)既傳統(tǒng)又時(shí)髦的名詞。說(shuō)它傳統(tǒng),因?yàn)閺娜祟?lèi)用數(shù)字計(jì)量開(kāi)始,早已把數(shù)據(jù)融入我們的生活中,身高、體重、視力等等都和數(shù)據(jù)相關(guān)。說(shuō)它時(shí)髦,是因?yàn)榻鼛啄陣@大數(shù)據(jù)開(kāi)發(fā)的新產(chǎn)品和新技術(shù),如IP影視劇火熱、AI技術(shù)井噴等都和它息息相關(guān)。
隨著智能手機(jī)的普及,電商追求流量、企業(yè)開(kāi)發(fā)新品、商家促銷(xiāo)設(shè)計(jì)等都把大數(shù)據(jù)放在活動(dòng)項(xiàng)目之初,甚至到了“無(wú)數(shù)據(jù),不成立”的地步。大數(shù)據(jù),真的面面俱到嗎?
以一年一度的奧斯卡為例,人們?cè)敢庀嘈?,根?jù)觀影的好評(píng)度、票房的數(shù)據(jù)統(tǒng)計(jì)等大數(shù)據(jù)分析,我們是可以預(yù)測(cè)獎(jiǎng)項(xiàng)的。也正如之前預(yù)測(cè)的那樣,2018年第90屆奧斯卡開(kāi)幕和落幕,《水形物語(yǔ)》《三塊廣告牌》等熱門(mén)影片不出所料斬獲了多項(xiàng)大獎(jiǎng),這正是大數(shù)據(jù)的魅力所在。
然而,現(xiàn)實(shí)并不是都可以實(shí)現(xiàn)統(tǒng)計(jì)和預(yù)測(cè)的。在2018年奧斯卡頒獎(jiǎng)的同時(shí),號(hào)稱“東方野獸”的西伯利亞寒流卻意外地持續(xù)橫掃歐洲,威力由北歐直至地中海岸,暴風(fēng)雪甚至造成56人死亡。寒流如此兇猛,這讓擁有豐富氣象大數(shù)據(jù)的預(yù)測(cè)部門(mén)始料不及。
現(xiàn)實(shí)告誡我們,在結(jié)果發(fā)生之前,數(shù)據(jù)是存在的,但卻不是萬(wàn)能的,更不是近乎完美的,有時(shí)候甚至大相徑庭。能夠采集的數(shù)據(jù),都已經(jīng)發(fā)生,是過(guò)去,來(lái)路有痕,但未來(lái)的數(shù)據(jù),今天未知。對(duì)氣象部門(mén)而言,用昨天的溫度推測(cè)今天的溫度,兩者之間或有關(guān)聯(lián),但換個(gè)領(lǐng)域,用昨天的彩票中獎(jiǎng)號(hào)碼推測(cè)今天的中獎(jiǎng)號(hào)碼,兩者之間卻不會(huì)有任何聯(lián)系。差別在哪?時(shí)間和邏輯。
過(guò)去發(fā)生的歷史是有價(jià)值的,但由過(guò)去的大數(shù)據(jù)推斷尚未發(fā)生的未來(lái),這種由此及彼的關(guān)聯(lián)性和邏輯性,卻不是大數(shù)據(jù)能夠提供的。好比開(kāi)庭審判,大數(shù)據(jù)可以幫助提供多樣證據(jù),但罪名是否成立,還得靠法官和法庭對(duì)證據(jù)的綜合分析,才能公正地宣判。
前不久有新聞?wù)f,有人發(fā)現(xiàn)用自己的賬號(hào)在經(jīng)常使用的旅游網(wǎng)站訂酒店是380元,換個(gè)手機(jī)就變成了300元,“殺熟”成了無(wú)良商家的秘密武器。暫且拋開(kāi)商家的商業(yè)道德,僅從技術(shù)層面解釋?zhuān)浖?shù)據(jù)已經(jīng)將該熟客認(rèn)定為“價(jià)格不敏感者”,顧客曾經(jīng)消費(fèi)380元房間,大數(shù)據(jù)認(rèn)為顧客偏愛(ài)這個(gè)價(jià)位,高于或低于該價(jià)位匹配度不高,于是投其所好,繼續(xù)推薦,這就是大數(shù)據(jù)的簡(jiǎn)單循環(huán),老百姓說(shuō)的“一根筋”。
不單是旅游APP,經(jīng)常上淘寶、京東等平臺(tái)購(gòu)物的顧客也會(huì)發(fā)現(xiàn),不同登錄人打開(kāi)的首頁(yè)內(nèi)容是很不一樣的。假如上次瀏覽襯衫,下次再打開(kāi),鋪天蓋地的襯衫鏈接和圖片迎面而來(lái),不管你已經(jīng)買(mǎi)了還是沒(méi)買(mǎi),一次又一次的強(qiáng)制循環(huán)推介??葱侣凙PP也是,上次多看了兩眼體育新聞,下次會(huì)有更多的體育新聞讓你應(yīng)接不暇,哪怕是你點(diǎn)錯(cuò)鏈接,誤操作而打開(kāi)的,大數(shù)據(jù)也會(huì)認(rèn)為你是認(rèn)真的,矢志不渝地推介下去。
這些都如經(jīng)濟(jì)學(xué)中的馬太效應(yīng),因?yàn)槎喽?,因?yàn)樯俣伲髷?shù)據(jù)的最后結(jié)果只會(huì)將過(guò)去發(fā)揚(yáng)光大,卻不會(huì)改弦更張,另起爐灶。大數(shù)據(jù)留給了互聯(lián)網(wǎng)包括聲音、圖片、視頻、文字等在內(nèi)的海量數(shù)據(jù),可謂應(yīng)有盡有,卻不會(huì)自主生成一部電影、一篇小說(shuō)。正如經(jīng)濟(jì)學(xué)鼻祖亞當(dāng)·斯密提出分工創(chuàng)造價(jià)值理論,大數(shù)據(jù)的分工職能在于記錄和計(jì)算數(shù)據(jù),在單維軌道上不斷迭代升級(jí),而實(shí)現(xiàn)單維空間的突破,完成多維空間的組合,這些是大數(shù)據(jù)最欠缺和無(wú)助的,而這恰恰是人類(lèi)生命體的職能分工范疇,即創(chuàng)新。
很多人直觀面對(duì)企業(yè)會(huì)計(jì)報(bào)表,第一感覺(jué)是枯燥乏味,畢竟數(shù)據(jù)是冰冷的,靜靜地躺在那里,毫無(wú)聲息,企業(yè)CFO的職能之一就是把財(cái)務(wù)數(shù)據(jù)信息轉(zhuǎn)化為企業(yè)運(yùn)營(yíng)狀態(tài)信息,供決策者使用。教師的存在也是如此。學(xué)生面對(duì)教材上文字冰冷的羅列,茫然無(wú)措,只有搭配上抑揚(yáng)頓挫、聲情并茂的講解才能獲得真知(從這一點(diǎn)講,在線教育并不能替代課堂教育)??偨Y(jié)來(lái)說(shuō),大數(shù)據(jù)可以提供劇本、臺(tái)詞和角色,但無(wú)法塑造一個(gè)立體感的靈魂。
我們常驚訝于沙畫(huà)藝術(shù)家的精妙絕倫,能夠用幾把沙子畫(huà)出連貫的場(chǎng)景,講述一個(gè)完整的故事。其實(shí),每粒沙子就是一個(gè)數(shù)據(jù),數(shù)據(jù)的整合只有在藝術(shù)家的創(chuàng)作中才能體現(xiàn)非凡的價(jià)值。否則,沙子還是沙子,成為不了藝術(shù)。因此,動(dòng)態(tài)條件下的數(shù)據(jù)能夠創(chuàng)作更大的價(jià)值空間。
再舉個(gè)例子,20年前,馮小剛導(dǎo)演的《甲方乙方》《不見(jiàn)不散》等喜劇電影深受歡迎。20年后,馮小剛導(dǎo)演的《1942》《芳華》這樣的悲情影片也有極好的口碑。那么,從大數(shù)據(jù)的分析,喜劇和悲情電影會(huì)是同一批觀眾嗎?答案是:會(huì)的!因?yàn)?,?dāng)年的嘻哈青年20年后已人到中年,早已深刻體會(huì)到生活的沉重和艱辛。而這些,是冰冷的大數(shù)據(jù)計(jì)算不出來(lái)的。因?yàn)閺臄?shù)據(jù)上看,喜劇和悲情劇面對(duì)的是完全迥異的兩個(gè)細(xì)分人群。只有把數(shù)據(jù)與時(shí)間、空間相結(jié)合后的四維動(dòng)態(tài)演繹,才能透析市場(chǎng)真實(shí)的演進(jìn)和隱藏的商機(jī)。
為了精準(zhǔn)投放廣告,電視臺(tái)曾經(jīng)推廣了數(shù)字機(jī)頂盒,通過(guò)機(jī)頂盒數(shù)據(jù)的采集,電視臺(tái)能夠精準(zhǔn)地知道,觀眾在什么時(shí)間打開(kāi)電視,看什么節(jié)目,看多久。據(jù)此再投放廣告,能夠讓廣告企業(yè)收益最大化。但事實(shí)并非如此,原因在于機(jī)頂盒能夠統(tǒng)計(jì)開(kāi)機(jī)、關(guān)機(jī)和節(jié)目收視率,但無(wú)法統(tǒng)計(jì)收看電視的人是誰(shuí);是主動(dòng)看,還是被動(dòng)看;是購(gòu)買(mǎi)者,還是使用者;是看了廣告買(mǎi),還是看了后決定再也不買(mǎi)了。這樣的收視率統(tǒng)計(jì),只能反映廣告播出了多少,至于廣告效果的宏觀總賬永遠(yuǎn)是個(gè)謎。
因此,我們知道,數(shù)據(jù)在很多時(shí)候只能反映單一的、局部的數(shù)量效果,對(duì)整體的、宏觀的體系顧及不到,簡(jiǎn)單的數(shù)據(jù)分析有時(shí)候甚至得出誤導(dǎo)的結(jié)論。還是以電影為例,有數(shù)據(jù)表明:2017年票房第一的《戰(zhàn)狼2》,觀眾觀影時(shí)消費(fèi)的冷飲數(shù)量,要遠(yuǎn)遠(yuǎn)超過(guò)2016年的前票房冠軍《美人魚(yú)》,因此得出結(jié)論,激烈的戰(zhàn)爭(zhēng)場(chǎng)面能夠極大提升消費(fèi)者對(duì)冷飲的需求。但把背景放大會(huì)發(fā)現(xiàn),美人魚(yú)上映時(shí)是春節(jié)正月初一,而《戰(zhàn)狼2》是7月底,暑期賣(mài)的冷飲比春節(jié)多,正常得不能再正常了??梢?jiàn),微觀的數(shù)據(jù)再完備,脫離宏觀的框架,也顯得毫無(wú)意義。
市場(chǎng)經(jīng)濟(jì)是理性經(jīng)濟(jì),而每個(gè)經(jīng)濟(jì)個(gè)體都是在自身的利益最大化假設(shè)前提下,做出最符合自身利益的行為判斷,大數(shù)據(jù)也是基于此邏輯的數(shù)理分析,給出最優(yōu)化的建議。然而,每個(gè)人的最優(yōu)化,合并在一起,未必是宏觀的最優(yōu)化。假設(shè)每個(gè)人聽(tīng)從個(gè)人專(zhuān)屬的智能設(shè)備的數(shù)據(jù)分析結(jié)論來(lái)行動(dòng),那么大數(shù)據(jù)給董存瑞的建議應(yīng)該是“爆炸當(dāng)量巨大,生命有危險(xiǎn),撤”;給雷鋒做好事時(shí)的建議應(yīng)該是“只有成本,無(wú)收益,拜拜”。一味地相信大數(shù)據(jù)的結(jié)論,忽視大數(shù)據(jù)產(chǎn)生的背景和假設(shè)前提,最終的微觀結(jié)論極可能導(dǎo)致一葉障目,置宏觀整體和公共利益于不顧,出現(xiàn)“公地悲劇”。因此,如何規(guī)避大數(shù)據(jù)的微觀片面化,是一個(gè)值得時(shí)刻警惕和思考的問(wèn)題。
大數(shù)據(jù)的精準(zhǔn)和高效是人類(lèi)無(wú)法超越的,這毋庸置疑。但即使是再先進(jìn)的數(shù)據(jù)庫(kù)、再高能的計(jì)算機(jī),甚至勝過(guò)阿爾法狗數(shù)倍,也都依賴一定的物理系統(tǒng)本身,比如存儲(chǔ)設(shè)備、電能消耗、數(shù)據(jù)采集和輸出工具等,也得通過(guò)互聯(lián)網(wǎng)和手機(jī)信號(hào)的收集和整理形成數(shù)據(jù)源。一旦離開(kāi)這些條件,大數(shù)據(jù)就無(wú)能為力。
假如阿爾法狗和柯潔對(duì)弈時(shí)停電了,后果可想而知。再比如以GPS手機(jī)定位為例,當(dāng)驢友深入無(wú)信號(hào)地帶,再高能的導(dǎo)航定位裝置也只能廢棄,只能靠人對(duì)自然環(huán)境的經(jīng)驗(yàn)來(lái)判斷方位。所以說(shuō),數(shù)據(jù)對(duì)物理環(huán)境的依賴決定了其只能按照自有體系運(yùn)行,而一旦脫離原有體系,數(shù)據(jù)則無(wú)能為力。
換種場(chǎng)景,當(dāng)我向谷歌或百度提出一個(gè)沒(méi)有原數(shù)據(jù)或解決方案的問(wèn)題時(shí),比如問(wèn)人類(lèi)怎么才能飛向火星并返回?大數(shù)據(jù)只能告訴我:第一,過(guò)去沒(méi)有人曾飛向火星;第二,更不可能返回。但這并不意味著,從此人類(lèi)就放棄飛向火星的夢(mèng)想,仍然有馬斯克這樣的開(kāi)拓者創(chuàng)造著一個(gè)又一個(gè)嘗試飛向火星的大數(shù)據(jù),突破原有系統(tǒng)認(rèn)知并不斷創(chuàng)新。
大數(shù)據(jù)是工具,可以增大我們勝算的概率,提升我們工作的效率,讓我們享受更美好的生活。大數(shù)據(jù)也是屏障,無(wú)原則的依賴和信任,會(huì)讓我們故步自封,更可能南轅北轍。我們可以用大數(shù)據(jù)計(jì)算出來(lái)何時(shí)的月亮最大最圓,但卻計(jì)算不出來(lái),那時(shí)的你會(huì)和誰(shuí)一起花前月下,那時(shí)你的生活是否幸福美滿,因?yàn)檫@些需要個(gè)人的機(jī)緣,更需要你去努力創(chuàng)造。