□黃先超
試論大數(shù)據(jù)價(jià)值特征及價(jià)值構(gòu)成
□黃先超
本文通過批判性地吸收其他學(xué)者對(duì)大數(shù)據(jù)價(jià)值的論述,創(chuàng)新性的提出了大數(shù)據(jù)價(jià)值的兩大特征以及大數(shù)據(jù)價(jià)值釋放所需的三大要素。筆者認(rèn)為大數(shù)據(jù)的價(jià)值具有“隱匿性”和“持續(xù)性”特征,同時(shí)大數(shù)據(jù)價(jià)值的充分釋放需要借由“數(shù)據(jù)、技術(shù)和大數(shù)據(jù)思維”三大要素的協(xié)同發(fā)力。筆者認(rèn)為在對(duì)大數(shù)據(jù)價(jià)值特征及構(gòu)成要素進(jìn)行認(rèn)真研讀之后,才能對(duì)大數(shù)據(jù)時(shí)代下的社會(huì)變革進(jìn)行有效解讀和預(yù)測(cè),進(jìn)而趨利避害,造福社會(huì)。
大數(shù)據(jù)價(jià)值特征云計(jì)算
當(dāng)前學(xué)界和業(yè)界對(duì)大數(shù)據(jù)的研究主要聚焦于大數(shù)據(jù)對(duì)政府服務(wù)、企業(yè)營銷以及傳媒業(yè)的影響方面,這無疑有助于加強(qiáng)服務(wù)型、廉潔高效型政府的建設(shè),幫助企業(yè)實(shí)現(xiàn)精準(zhǔn)營銷和助推傳媒融合轉(zhuǎn)型。但是筆者認(rèn)為除了對(duì)大數(shù)據(jù)的影響進(jìn)行研究之外,還應(yīng)該思考為什么大數(shù)據(jù)能夠?qū)ι鐣?huì)帶來革命性變化,或者說大數(shù)據(jù)價(jià)值釋放的驅(qū)動(dòng)因素是什么。
筆者認(rèn)為,“價(jià)值就是有用性”,即相對(duì)于價(jià)值評(píng)估主體而言客體所具有的有用性或積極意義。具體到本文,大數(shù)據(jù)的價(jià)值就是數(shù)據(jù)的升值效用,即有利于創(chuàng)建廉潔高效的服務(wù)型政府,有利于提升企業(yè)營銷水平。
隱匿性。大數(shù)據(jù)的“隱匿性”是說大數(shù)據(jù)的價(jià)值潛藏在線性和非線性多類型數(shù)據(jù)之中,它需要“提純”技術(shù)的介入才能被挖掘出來。我們通常說大數(shù)據(jù)價(jià)值密度低,其實(shí)就是大數(shù)據(jù)價(jià)值隱匿性的體現(xiàn)。大數(shù)據(jù)的價(jià)值并不是只要擁有了足夠多的數(shù)據(jù),價(jià)值就自然而然地顯現(xiàn)出來,也不是說數(shù)據(jù)越多價(jià)值就越大。它隱藏在數(shù)據(jù)堆中,需要經(jīng)歷高效的存儲(chǔ)、挖掘之后,再通過可視化技術(shù)才能加以呈現(xiàn)。如果不對(duì)數(shù)據(jù)進(jìn)行處理分析,不把隱藏的價(jià)值挖掘出來,就會(huì)造成越來越多的“僵尸數(shù)據(jù)”或“數(shù)據(jù)墳?zāi)埂?。在大?shù)據(jù)時(shí)代之前的數(shù)字化時(shí)代,數(shù)據(jù)往往僅作為交易的對(duì)象,交易過程的結(jié)束也就意味著數(shù)據(jù)價(jià)值的轉(zhuǎn)移和分解。而在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的真正效用在于它未來的潛在價(jià)值,現(xiàn)在看似沒有價(jià)值的雜亂數(shù)據(jù),也許在不久的將來就會(huì)顯示出非凡的社會(huì)效益和商業(yè)用途。
持續(xù)性。大數(shù)據(jù)價(jià)值的持續(xù)性特征就是強(qiáng)調(diào)數(shù)據(jù)價(jià)值通過二次利用或多次利用仍不衰減,仍然具備指導(dǎo)現(xiàn)實(shí)和預(yù)測(cè)未來的效用。在筆者看來,大數(shù)據(jù)這種能預(yù)測(cè)未來的能力儼然建立在大數(shù)據(jù)價(jià)值持續(xù)性的特征之上。也就是說,大數(shù)據(jù)的價(jià)值不像普通產(chǎn)品的價(jià)值,一次性消費(fèi)后就蕩然無存,大數(shù)據(jù)的價(jià)值是開發(fā)不盡、用之不竭的,我們完全可以通過調(diào)取存儲(chǔ)設(shè)備中的數(shù)據(jù),對(duì)其加以重復(fù)利用、縱深挖掘,實(shí)現(xiàn)價(jià)值總量的疊加。對(duì)數(shù)據(jù)的挖掘越深入,價(jià)值呈現(xiàn)越明顯;對(duì)數(shù)據(jù)的重復(fù)利用越多,價(jià)值的持續(xù)效應(yīng)就會(huì)越強(qiáng),就會(huì)發(fā)現(xiàn)不同事物之間更多的相關(guān)性,對(duì)未來的預(yù)測(cè)也就更加準(zhǔn)確,這就是經(jīng)濟(jì)學(xué)家所言的“非競(jìng)爭性”的好處。
和君商學(xué)院趙國棟等人在《大數(shù)據(jù)時(shí)代的歷史機(jī)遇》中提出的一個(gè)核心的觀點(diǎn)就是:缺少數(shù)據(jù)資源,無以談產(chǎn)業(yè);缺少數(shù)據(jù)思維,無以言未來。這個(gè)觀點(diǎn)強(qiáng)調(diào)了“數(shù)據(jù)”以及數(shù)據(jù)“思維”的重要性。但筆者認(rèn)為,大數(shù)據(jù)價(jià)值的釋放還需要增加“技術(shù)”要義,三者缺一不可。其中數(shù)據(jù)是根本,技術(shù)是手段,大數(shù)據(jù)思維是催化劑。
數(shù)據(jù)。占有大量數(shù)據(jù)或者能夠收集到可觀的數(shù)據(jù)是大數(shù)據(jù)價(jià)值發(fā)揮的根本前提,沒有達(dá)到研究需要的數(shù)據(jù)資源,一切將無從談起。
首先,占有大量數(shù)據(jù)。數(shù)據(jù)的產(chǎn)生不是憑空的,而是在人類計(jì)量和記錄的基礎(chǔ)之上逐步誕生的。從無數(shù)據(jù)到有數(shù)據(jù)、從小眾數(shù)據(jù)到今天的大數(shù)據(jù),數(shù)據(jù)價(jià)值才得到更進(jìn)一步顯現(xiàn)。大數(shù)據(jù)的典型特征之一就是數(shù)據(jù)量的無界性,小范圍的數(shù)據(jù)采樣已不合時(shí)宜,大數(shù)據(jù)價(jià)值的發(fā)揮要建立在大量數(shù)據(jù)之上,能不能占有大量數(shù)據(jù)可供專業(yè)人員挖掘是大數(shù)據(jù)價(jià)值發(fā)揮的首要前提。
其次,數(shù)據(jù)思維的變革。思維決定行動(dòng),大數(shù)據(jù)時(shí)代下思維的創(chuàng)新與變革和數(shù)據(jù)價(jià)值的釋放休戚相關(guān)。我們所追求的數(shù)據(jù)并不僅僅局限在數(shù)量之上,還應(yīng)該在數(shù)據(jù)質(zhì)量、數(shù)據(jù)相關(guān)性、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)模型等方面,因?yàn)槲覀儾辉賰H僅通過數(shù)據(jù)來獲得因果關(guān)系,而更傾向于相關(guān)性和關(guān)聯(lián)性;不僅追求隨機(jī)抽樣,而更想要達(dá)到樣本等于總體的效果;不僅追究結(jié)論的精確性而更注重混雜性,因?yàn)樵谟邢迺r(shí)間里獲得事物發(fā)展的方向和脈絡(luò)比追求嚴(yán)密的數(shù)據(jù)結(jié)構(gòu)和模型要重要得多。
第三,無所不在的數(shù)據(jù)。“數(shù)據(jù)無處不在,一切皆可量化”是大數(shù)據(jù)時(shí)代的典型特征,文字、圖片、喜好、位置、溝通甚至意圖都可以量化。一切皆可量化才造就大數(shù)據(jù)時(shí)代,才能夠?qū)ι鐣?huì)、商業(yè)和人類生活帶來根本性變革。占有或者能夠收集大量的數(shù)據(jù)在當(dāng)今的商業(yè)競(jìng)爭中有兩大優(yōu)勢(shì):第一就是通過大數(shù)據(jù)的分析可為企業(yè)戰(zhàn)略決策提供參考;第二就是對(duì)數(shù)據(jù)的“打包”出售,再次獲利。
技術(shù)。百度CEO李彥宏在2015年百度聯(lián)盟峰會(huì)上首次提出要收集“新數(shù)據(jù)”,“找到有價(jià)值的信息,而不是看收集了多少信息”,強(qiáng)調(diào)要通過企業(yè)級(jí)軟件和人工智能實(shí)現(xiàn)數(shù)據(jù)價(jià)值的最大化。而企業(yè)級(jí)軟件的設(shè)計(jì)和人工智能的實(shí)現(xiàn)都需要相關(guān)技術(shù)的突破,因此技術(shù)對(duì)于大數(shù)據(jù)的價(jià)值釋放舉足輕重。
首先,技術(shù)發(fā)展能減少“數(shù)據(jù)墳?zāi)埂?。隨著數(shù)據(jù)以PB級(jí)別的翻倍速增以及數(shù)據(jù)挖掘技術(shù)的滯后,“數(shù)據(jù)墳?zāi)埂焙汀敖┦瑪?shù)據(jù)”大量出現(xiàn)。同時(shí)受制于存儲(chǔ)器的效能,我們不得不刪除大量數(shù)據(jù)以釋放存儲(chǔ)空間。然而大數(shù)據(jù)的價(jià)值是潛在的、未來的,是隱匿的和持續(xù)的,我們刪除數(shù)據(jù)的過程也是數(shù)據(jù)價(jià)值的貶值和損耗過程。數(shù)據(jù)一旦被刪除,就會(huì)造成某個(gè)數(shù)據(jù)節(jié)點(diǎn)的斷裂,進(jìn)而導(dǎo)致數(shù)據(jù)價(jià)值鏈的殘缺。因此占有大量數(shù)據(jù)或者能收集到大量數(shù)據(jù)只是數(shù)據(jù)價(jià)值釋放的第一步,而通過相關(guān)技術(shù)手段挖掘有效信息,并通過可視化手段對(duì)數(shù)據(jù)加以呈現(xiàn)和利用才是關(guān)鍵。通過大數(shù)據(jù)的技術(shù)挖掘,讓潛藏在“墳?zāi)埂敝械臄?shù)據(jù)重見天日,也就為數(shù)據(jù)價(jià)值的釋放和利用提供了更多可能。
其次,數(shù)據(jù)價(jià)值釋放依賴技術(shù)的發(fā)展。對(duì)數(shù)據(jù)價(jià)值的提取主要涉及到存儲(chǔ)、挖掘和可視化技術(shù),大數(shù)據(jù)價(jià)值的提取也正是經(jīng)歷類似三個(gè)步驟。隨著大數(shù)據(jù)產(chǎn)業(yè)對(duì)技術(shù)的依賴性增強(qiáng),新催生的大數(shù)據(jù)分析師、數(shù)據(jù)管理專家和數(shù)據(jù)科學(xué)家等專門數(shù)據(jù)人才的工作范圍和影響將會(huì)進(jìn)一步擴(kuò)大,大數(shù)據(jù)價(jià)值的釋放對(duì)技術(shù)的依賴也會(huì)越來越強(qiáng)。
分布式存儲(chǔ)技術(shù)與大數(shù)據(jù)價(jià)值:通過多個(gè)節(jié)點(diǎn)和多個(gè)CPU核數(shù)來分擔(dān)存儲(chǔ)負(fù)荷,利用位置服務(wù)器定位存儲(chǔ)信息,解決了傳統(tǒng)存儲(chǔ)方式中存儲(chǔ)性能和安全瓶頸問題。存儲(chǔ)效能的提高和存儲(chǔ)空間的擴(kuò)展,減少我們刪除數(shù)據(jù)的概率,間接地增加了數(shù)據(jù)的潛在價(jià)值。同時(shí)依靠大量的數(shù)據(jù)存儲(chǔ),實(shí)現(xiàn)對(duì)多密度、多層次數(shù)據(jù)的占有,也就為進(jìn)一步的技術(shù)挖掘和可視化提供可能。
數(shù)據(jù)挖掘技術(shù)與大數(shù)據(jù)價(jià)值:通過先進(jìn)的云分析和處理平臺(tái)的運(yùn)用,大數(shù)據(jù)價(jià)值的提取和釋放機(jī)會(huì)將進(jìn)一步增加,大數(shù)據(jù)潛在的、持續(xù)的價(jià)值將會(huì)被機(jī)器更加智能和高效地挖掘出來。
可視化技術(shù)與大數(shù)據(jù)價(jià)值:關(guān)鍵是如何把挖掘到的稍顯復(fù)雜的數(shù)據(jù)信息通過可視化方式(信息圖、可視化視頻和互動(dòng)圖表)最終展現(xiàn)出來,讓政府決策者、企業(yè)管理人員等在閱覽之后能夠?qū)κ挛镏g的關(guān)聯(lián)性有著較為明確的認(rèn)知,從而輔助科學(xué)決策,彰顯大數(shù)據(jù)的社會(huì)價(jià)值和商業(yè)價(jià)值。
大數(shù)據(jù)思維。根據(jù)舍恩伯格的定義,大數(shù)據(jù)思維就是指一種意識(shí),認(rèn)為公開的數(shù)據(jù)一旦處理得當(dāng)就能為千百萬人急需解決的問題提供答案。通過占有大量數(shù)據(jù)和掌握關(guān)鍵技術(shù),大數(shù)據(jù)的價(jià)值在很大程度上已經(jīng)釋放出來。但筆者認(rèn)為,我們只看到了大數(shù)據(jù)價(jià)值的冰山一角,仍然有一部分甚至是大部分價(jià)值被雪藏。日益增多的“數(shù)據(jù)墳?zāi)埂闭侨鄙贁?shù)據(jù)思維的表現(xiàn),面對(duì)千方百計(jì)搜集來的寶貴數(shù)據(jù),要不就是因?yàn)槿鄙偌夹g(shù)手段無法提取數(shù)據(jù)價(jià)值而無可奈何,要不就是缺少創(chuàng)新思維而對(duì)數(shù)據(jù)無動(dòng)于衷。
首先,要先人一步。大數(shù)據(jù)挖掘和可視化技術(shù)通常掌握在咨詢公司、技術(shù)供應(yīng)商和分析公司手中,但是掌握了專業(yè)的數(shù)據(jù)技術(shù)并不意味著能提出創(chuàng)新性用途的方案,關(guān)鍵是要具備大數(shù)據(jù)思維。舍恩伯格強(qiáng)調(diào)了具備大數(shù)據(jù)思維的人或企業(yè)能夠先人一步的發(fā)現(xiàn)機(jī)遇,雖然自身并不占有大量數(shù)據(jù)或掌握專業(yè)技能。如布拉德福德·克羅斯的團(tuán)隊(duì)通過分析過去十年航班的情況來預(yù)測(cè)航班是否會(huì)晚點(diǎn),這讓掌握航班信息數(shù)據(jù)的美國運(yùn)輸局和美國聯(lián)邦航空局大驚失色。這是典型的用大數(shù)據(jù)思維“改造社會(huì)”的實(shí)例。
其次,要數(shù)據(jù)公開。從舍恩伯格對(duì)大數(shù)據(jù)思維的定義中我們還能發(fā)現(xiàn)數(shù)據(jù)思維的另外一層屬性即“公開”或“共享”。筆者認(rèn)為,通過開放式思維,建立數(shù)據(jù)共享聯(lián)盟或?qū)iT的開發(fā)平臺(tái)已成為未來大數(shù)據(jù)價(jià)值繼續(xù)釋放的關(guān)鍵。美國有data.gov網(wǎng)站和陽光基金會(huì),英國有政府倡議的開放式數(shù)據(jù)中心和開放知識(shí)基金會(huì),澳大利亞、巴西和智利也相續(xù)出臺(tái)并實(shí)施了開發(fā)數(shù)據(jù)策略。這些開放數(shù)據(jù)的舉措定能促進(jìn)大數(shù)據(jù)相關(guān)研究的蓬勃發(fā)展,進(jìn)而繼續(xù)改造社會(huì),提高國家和企業(yè)競(jìng)爭力。
以上所講的數(shù)據(jù)、技術(shù)和大數(shù)據(jù)思維三要素既是大數(shù)據(jù)價(jià)值釋放的前提條件,也是未來企業(yè)競(jìng)爭的法寶,如世界科技巨頭谷歌公司就是三者兼?zhèn)涞牡湫?,它既占有大量的?shù)據(jù)(通過谷歌瀏覽器搜集到的數(shù)據(jù)),也掌握著尖端的數(shù)據(jù)挖掘技術(shù),同時(shí)還具備超前的大數(shù)據(jù)創(chuàng)新思維(如向公眾開放免費(fèi)谷歌地圖為制造無人駕駛汽車做準(zhǔn)備),因此谷歌公司作為世界科技巨擘的位置不易撼動(dòng)。
因此從大數(shù)據(jù)價(jià)值釋放的影響因素來看,政府能否把大數(shù)據(jù)提升為國家戰(zhàn)略,能否開放數(shù)據(jù)為社會(huì)所用直接關(guān)系到廉潔、高效、服務(wù)型政府的構(gòu)建;企業(yè)能否做到在有限時(shí)間內(nèi)搜集有效數(shù)據(jù),并分析和可視化數(shù)據(jù)直接關(guān)系到營銷水平高低和藍(lán)海市場(chǎng)的開辟;對(duì)于傳統(tǒng)媒體來說能否跟上大數(shù)據(jù)時(shí)代的步伐,如轉(zhuǎn)變經(jīng)營方式、人才培養(yǎng)模式、運(yùn)作流程,更是關(guān)乎生死存亡的大事。
(作者單位:河北大學(xué))
欄目責(zé)編:陳道生
①鄔賀銓:《大數(shù)據(jù)思維》[J],《科學(xué)與社會(huì)》,2014,01:1-13。
②維克托·邁爾-舍恩伯格,肯尼思·庫克耶著,盛楊燕,周濤譯:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》[M],杭州:浙江人民出版社,2013年。