郭晨晨
【摘要】 從大數(shù)據(jù)的提出到現(xiàn)在僅僅幾年時(shí)間,但已經(jīng)成為整個(gè)社會(huì)各個(gè)領(lǐng)域的熱門(mén)話題。從事大數(shù)據(jù)工作的人才更是受到了包括百度、騰訊、阿里巴巴等互聯(lián)網(wǎng)掌舵公司的追捧。但是需要注意的是任何技術(shù)或者科學(xué)成果都有的局限性,讓大數(shù)據(jù)更好的為人類(lèi)服務(wù)需要我們更多的理性。
【關(guān)鍵詞】 大數(shù)據(jù) 局限性 理性
一、大數(shù)據(jù)時(shí)代的到來(lái)
提到“大數(shù)據(jù)”,需要對(duì)“數(shù)據(jù)”的重要性做簡(jiǎn)單的分析。本質(zhì)上數(shù)據(jù)都是人創(chuàng)造的,它伴隨人類(lèi)歷史的發(fā)展,從古至今一直影響著人類(lèi)的思考、行為,改變著人類(lèi)的世界觀、價(jià)值觀。
大數(shù)據(jù)時(shí)代的核心仍然是數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)是一個(gè)個(gè)數(shù)字或者可以進(jìn)行編碼的簡(jiǎn)單文本,是一種結(jié)構(gòu)化的信息量,分析起來(lái)要簡(jiǎn)單很多。
而大數(shù)據(jù)卻包羅萬(wàn)象,以文本、圖片、視頻、音頻等等眾多形式出現(xiàn)。它包含很多非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。
麥肯錫是研究大數(shù)據(jù)的先驅(qū),在其報(bào)告中給出的大數(shù)據(jù)定義是:大數(shù)據(jù)指的是大小超出常規(guī)的數(shù)據(jù)庫(kù)工具獲取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集。但它同時(shí)強(qiáng)調(diào),并不是說(shuō)一定要超過(guò)特定TB 值的數(shù)據(jù)集才能算是大數(shù)據(jù)。
維基百科對(duì)于大數(shù)據(jù)的描述是在無(wú)法容許的時(shí)間里,用常規(guī)軟件對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。
大數(shù)據(jù)時(shí)代的到來(lái)與其說(shuō)是人類(lèi)智慧的創(chuàng)造性成果,不如說(shuō)是對(duì)于信息爆炸時(shí)代處理海量信息的一種無(wú)奈的解決方法。
二、大數(shù)據(jù)的技術(shù)特點(diǎn)
任何一種新技術(shù)的應(yīng)用都是水到渠成的結(jié)果,假如環(huán)境沒(méi)有準(zhǔn)備好,無(wú)論什么樣的技術(shù)想取得預(yù)期的效果都是極為困難的,大數(shù)據(jù)應(yīng)用對(duì)于環(huán)境的要求是極其苛刻的。
Volume、Velocity、Variety、Veracity是大數(shù)據(jù)的4V特點(diǎn),處理數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類(lèi)型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合自然不能僅僅使用單一簡(jiǎn)單的技術(shù)來(lái)完成。
大數(shù)據(jù)是基于云計(jì)算的移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、電子商務(wù)、智慧城市的跨界融合。云計(jì)算廣泛應(yīng)用了分布式技術(shù),它是一個(gè)體系架構(gòu),包含分布是數(shù)據(jù)處理技術(shù)、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫(kù)等。
正是云技術(shù)給了人們廉價(jià)獲取海量計(jì)算和存儲(chǔ)的能力,使大數(shù)據(jù)處理技術(shù)成為可能。
三、大數(shù)據(jù)應(yīng)用的副作用
3.1大數(shù)據(jù)應(yīng)用需要更多理性思考
大數(shù)據(jù)的熱潮其提出之初就被人們所預(yù)料到。
麥肯錫稱(chēng):“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)。”
然而,在大數(shù)據(jù)熱一浪高過(guò)一浪之時(shí),很需要給大數(shù)據(jù)潑一盆涼水降降溫。
信息化宣傳言過(guò)其實(shí)已經(jīng)是“新常態(tài)”,人們宣傳數(shù)據(jù)庫(kù)、信息共享、物聯(lián)網(wǎng)、云計(jì)算,發(fā)布會(huì)和研討會(huì)上這些新事物、往往賦予了它超過(guò)現(xiàn)實(shí)本身的意義。
每次都會(huì)描述一個(gè)無(wú)限樂(lè)觀的前景,然而現(xiàn)實(shí)的發(fā)展和人們本來(lái)的預(yù)期并不是同樣的軌跡。信息化效益不是一個(gè)短期工程,技術(shù)亦不是最關(guān)鍵的因素,理性的思考才是長(zhǎng)久之計(jì)。
3.2大數(shù)據(jù)熱產(chǎn)生的浮躁社會(huì)氛圍
縱觀人類(lèi)歷史,人們對(duì)于預(yù)測(cè)未知的熱衷從未消失過(guò)?,F(xiàn)實(shí)世界中,缺少實(shí)時(shí)記錄的工具,許多行為看起來(lái)是“人似秋鴻有來(lái)信,事如春夢(mèng)了無(wú)痕”,互聯(lián)網(wǎng)“處處行跡處處痕”的特點(diǎn)確實(shí)為人們發(fā)現(xiàn)規(guī)律,預(yù)測(cè)未來(lái)提供可能。
非理性的宣傳夸張了大數(shù)據(jù)的成果,增大了大數(shù)據(jù)的迷惑性,大數(shù)據(jù)在這種影響下變得無(wú)所不能。我們不能盲目神化大數(shù)據(jù)。
3.3大數(shù)據(jù)應(yīng)用的局限性和危害
“大數(shù)據(jù)”,簡(jiǎn)單來(lái)說(shuō)就是無(wú)限規(guī)模的數(shù)據(jù)量。需要正確認(rèn)識(shí)的是接收海量的信息帶來(lái)的并不一定是可以高效利用的信息。
在這個(gè)信息爆炸的時(shí)代,整個(gè)互聯(lián)網(wǎng)充斥著大量負(fù)面、虛假的信息。在利用大數(shù)據(jù)技術(shù)分析數(shù)據(jù)時(shí),這些信息可能會(huì)使“規(guī)律”變得“非規(guī)律”。
例如在教育方式的選擇問(wèn)題上,如果利用大數(shù)據(jù)分析,我們貌似從海量數(shù)據(jù)中把握出了多數(shù)人接收知識(shí)的“規(guī)律”,然而對(duì)于那些并不適合的孩子來(lái)說(shuō)就應(yīng)該被所謂的“規(guī)律”所限定發(fā)展,被“規(guī)律”所拖垮嗎?
數(shù)據(jù)的增長(zhǎng)并不意味著有用信息的增長(zhǎng),更不意味著人們放棄獨(dú)立思考、獨(dú)立決策的能力。過(guò)度膨脹的數(shù)據(jù)讓人們?cè)谟龅骄唧w問(wèn)題時(shí)過(guò)分依賴(lài)網(wǎng)絡(luò)搜索查詢(xún),這在一定程度上限制了人們智慧的創(chuàng)造性。
大數(shù)據(jù)規(guī)律始于分析者的感覺(jué)和猜測(cè),是一種人為創(chuàng)新和思想成果,分析結(jié)果除了技術(shù)層面還受分析者本身文化層次和悟性的影響,規(guī)律的主觀性不可避免,大數(shù)據(jù)的虛假規(guī)律也不可避免。
這在很大程度上構(gòu)成了大數(shù)據(jù)的局限性。大數(shù)據(jù)說(shuō)到底僅僅是一種工具,走向成功,獨(dú)立思考,發(fā)揮思維的創(chuàng)造性是關(guān)鍵問(wèn)題。