□杜 偉
“大數(shù)據(jù)”建立在互聯(lián)網(wǎng)技術(shù)基礎(chǔ)上,指的是信息量巨大的統(tǒng)計(jì)及技術(shù)操作。簡單來說,“大數(shù)據(jù)”其實(shí)就是海量資料巨量資料,這些巨量資料來源于世界各地隨時(shí)產(chǎn)生的數(shù)據(jù)。
在“大數(shù)據(jù)”時(shí)代,任何微小的數(shù)據(jù)都可能產(chǎn)生不可思議的價(jià)值?!按髷?shù)據(jù)”有4個(gè)特點(diǎn),為別為:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價(jià)值),一般被稱之為4V。
大數(shù)據(jù)的特征首先就體現(xiàn)為“大”。隨著時(shí)間的推移,存儲(chǔ)單位從過去的GB到TB,乃至現(xiàn)在的PB、EB級別。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)式增長。社交網(wǎng)絡(luò)(微博、推特、臉書)、移動(dòng)網(wǎng)絡(luò)、智能工具、服務(wù)工具等,都成為數(shù)據(jù)的來源。迫切需要智能的算法、強(qiáng)大的數(shù)據(jù)處理平臺(tái)和新的數(shù)據(jù)處理技術(shù),來統(tǒng)計(jì)、分析、預(yù)測和實(shí)時(shí)處理如此大規(guī)模的數(shù)據(jù)。
廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性。任何形式的數(shù)據(jù)都可以產(chǎn)生作用,目前應(yīng)用最廣泛的就是推薦系統(tǒng)。日志數(shù)據(jù)是結(jié)構(gòu)化明顯的數(shù)據(jù),還有一些數(shù)據(jù)結(jié)構(gòu)化不明顯,例如圖片、音頻、視頻等,這些數(shù)據(jù)因果關(guān)系弱,就需要人工對其進(jìn)行標(biāo)注。
大數(shù)據(jù)的產(chǎn)生非常迅速,主要通過互聯(lián)網(wǎng)傳輸。生活中每個(gè)人都離不開互聯(lián)網(wǎng),也就是說每個(gè)人每天都在向大數(shù)據(jù)提供大量的資料,并且這些數(shù)據(jù)是需要及時(shí)處理的。大數(shù)據(jù)對處理速度有非常嚴(yán)格的要求,服務(wù)器中大量的資源都用于處理和計(jì)算數(shù)據(jù),很多平臺(tái)都需要做到實(shí)時(shí)分析。數(shù)據(jù)無時(shí)無刻不在產(chǎn)生,誰的速度更快,誰就有優(yōu)勢。
這也是大數(shù)據(jù)的核心特征?,F(xiàn)實(shí)世界所產(chǎn)生的數(shù)據(jù)中,有價(jià)值的數(shù)據(jù)所占比例很小。相比于傳統(tǒng)的小數(shù)據(jù),大數(shù)據(jù)最大的價(jià)值在于通過從大量不相關(guān)的各種類型的數(shù)據(jù)中,挖掘出對未來趨勢與模式預(yù)測分析有價(jià)值的數(shù)據(jù),并通過機(jī)器學(xué)習(xí)方法、人工智能方法或數(shù)據(jù)挖掘方法深度分析,發(fā)現(xiàn)新規(guī)律和新知識,并運(yùn)用于新聞等各個(gè)領(lǐng)域。
“大數(shù)據(jù)”時(shí)代的到來,改變了人們?nèi)粘5纳詈凸ぷ鞣绞?,對企業(yè)經(jīng)營、媒體傳播及政府管理有重要意義。應(yīng)該如何去對“大數(shù)據(jù)”加以分析和運(yùn)用值得我們思考。
在“大數(shù)據(jù)”時(shí)代下,人們可以迅速得到實(shí)時(shí)發(fā)生的信息,能夠?qū)ξ磥砜赡馨l(fā)生的事進(jìn)行預(yù)測并對突發(fā)事件進(jìn)行有效防范。對新聞媒體而言,運(yùn)用好“大數(shù)據(jù)”也很重要。它有助于新聞媒體工作人員迅速獲取信息,第一時(shí)間將信息傳播出去。
世界上的任何事物都是具有兩面性的,“大數(shù)據(jù)”也不例外。
“大數(shù)據(jù)”的積極作用在于:如果能夠科學(xué)、合理地使用“大數(shù)據(jù)”,那么就能推動(dòng)社會(huì)科學(xué)和經(jīng)濟(jì)的發(fā)展。然而,實(shí)現(xiàn)這一目標(biāo)和任務(wù)并不容易,需要廣大新聞工作者的共同努力。顯然,現(xiàn)在很多大眾媒體或社交媒體都應(yīng)用了“大數(shù)據(jù)“技術(shù)??茖W(xué)地發(fā)展“大數(shù)據(jù)”產(chǎn)業(yè),實(shí)現(xiàn)“大數(shù)據(jù)”的積極作用,將會(huì)為人們的生活和工作帶來巨大益處。
當(dāng)然,“大數(shù)據(jù)”也有一定的消極影響,實(shí)際上“大數(shù)據(jù)”并不是萬能的,如果過度地依賴“大數(shù)據(jù)”技術(shù)而忽略其他信息技術(shù)的話,將造成傳播信息方式單一。要想有所建樹,就一定要保持理智,對“大數(shù)據(jù)”進(jìn)行理性分析,使它能夠?yàn)樾侣勑袠I(yè)服務(wù),提高工作效率。一定要冷靜對待“大數(shù)據(jù)”,需從技術(shù)、法律等多方面降低新技術(shù)產(chǎn)生的負(fù)面效應(yīng)。
此外,數(shù)據(jù)安全利用和隱私保護(hù)是目前大數(shù)據(jù)商業(yè)化的一大挑戰(zhàn),我們必須重視這個(gè)問題,進(jìn)一步加強(qiáng)和規(guī)范科學(xué)數(shù)據(jù)管理,保障科學(xué)數(shù)據(jù)安全,提高開放共享水平。
現(xiàn)在的新聞信息可以說是海量的,更新速度極快,新聞媒體對這些新聞信息的獲取基本上是通過“大數(shù)據(jù)”技術(shù),這些技術(shù)確保新聞工作者可以源源不斷地接收新聞信息,并有效進(jìn)行分析、判斷。新聞媒體對這些龐大的新聞信息一定要學(xué)會(huì)整理和取舍。新聞信息不斷產(chǎn)生,如何在繁雜的新聞信息中找尋到新聞媒體需要的信息值得我們思考。一起事件是否能成為新聞、值不值得報(bào)道,依據(jù)的不僅僅是“大數(shù)據(jù)”,更重要的是要根據(jù)新聞價(jià)值作出判斷,這就需要新聞工作者提高新聞判斷力。
此外,記者若想對一起新聞事件進(jìn)行完整的報(bào)道,就需要對這起事件從不同角度展開調(diào)查,全面分析才能形成一個(gè)完整的故事,這同樣也要依據(jù)“大數(shù)據(jù)”技術(shù)。數(shù)據(jù)庫可以幫助記者搜索與此新聞事件相關(guān)聯(lián)的背景等數(shù)據(jù)信息。當(dāng)然,一個(gè)優(yōu)秀的新聞報(bào)道是不能僅僅依靠“大數(shù)據(jù)”技術(shù)的,新聞媒體可以對關(guān)鍵新聞點(diǎn)進(jìn)行深入思考并寫出獨(dú)家評論,這才是競爭制勝的法寶。
綜上所述,如今“大數(shù)據(jù)”已經(jīng)被廣泛應(yīng)用到人們的日常生活、工作中,雖然“大數(shù)據(jù)”技術(shù)的發(fā)展還不夠完善,數(shù)據(jù)庫也不完整,新聞行業(yè)對“大數(shù)據(jù)”技術(shù)成功運(yùn)用的實(shí)際案例也不多,但是從長遠(yuǎn)的角度來看,要是新聞行業(yè)及其他行業(yè)都能夠科學(xué)、合理地運(yùn)用“大數(shù)據(jù)”技術(shù),并對它進(jìn)行創(chuàng)新,那么有朝一日,“大數(shù)據(jù)”技術(shù)肯定能夠使人類社會(huì)發(fā)生翻天覆地的變化。因此,討論新聞媒體如何駕馭好“大數(shù)據(jù)”具有十分重要的現(xiàn)實(shí)意義。