陳艷
[摘 ? ? ? ? ? 要] ?隨著當(dāng)前大數(shù)據(jù)發(fā)展趨勢的不斷加快,對傳播學(xué)的研究產(chǎn)生了重要的影響,傳播學(xué)研究的主要方法逐步由以抽樣調(diào)查為主的傳統(tǒng)方式向綜合利用大數(shù)據(jù)參與的新方法轉(zhuǎn)變。將重點(diǎn)展示數(shù)據(jù)挖掘技術(shù)在傳播學(xué)研究領(lǐng)域內(nèi)的應(yīng)用案例,并將之與傳統(tǒng)研究方法進(jìn)行比較,對二者在研究目的、研究手段、研究過程及其邏輯等方面進(jìn)行區(qū)別,從而說明大數(shù)據(jù)處理信息方式對傳播學(xué)在方法論上的積極影響。
[關(guān) ? ?鍵 ? 詞] ?大數(shù)據(jù)方法;傳播學(xué);影響研究
[中圖分類號] ?G206 ? ? ? ? ? ? ? ? [文獻(xiàn)標(biāo)志碼] ?A ? ? ? ? ? ?[文章編號] ?2096-0603(2019)18-0134-02
一、大數(shù)據(jù)時代的特征
現(xiàn)如今,大數(shù)據(jù)這個說法已經(jīng)在各個行業(yè)領(lǐng)域中得到了廣泛運(yùn)用,并且還被承載于各種類型的概念中,包括海量數(shù)據(jù)、實(shí)時數(shù)據(jù)、社交媒體分析以及下一代數(shù)據(jù)管理能力等。對大數(shù)據(jù)的概念也存在著多種多樣的說法,當(dāng)前業(yè)界比較認(rèn)可的是由IBM公司提出的大數(shù)據(jù)4V特性,即數(shù)量(Volume)、多樣性(Variety)、速度(Velocity)和真實(shí)性(Veracity)。但是這種對特性的解讀也使無論業(yè)界還是學(xué)界都把不同的數(shù)據(jù)往里嵌套,這樣的局面使大數(shù)據(jù)成為一個空洞的名詞,對開展科學(xué)研究并沒有實(shí)質(zhì)性的擴(kuò)展和推動作用。筆者認(rèn)為大數(shù)據(jù)不僅需要從數(shù)據(jù)量上考量,更需要從數(shù)據(jù)結(jié)構(gòu)上進(jìn)行區(qū)分。數(shù)據(jù)大是一個相對概念,一般意義上,大數(shù)據(jù)是指無法在可容忍的時間內(nèi)用傳統(tǒng)IT技術(shù)和軟硬件工具對其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合。傳統(tǒng)意義中的僅幾個服務(wù)器存儲的數(shù)據(jù)庫是不能稱其為“大數(shù)據(jù)”的??傊髷?shù)據(jù)并不是這個星球上所有數(shù)據(jù)的統(tǒng)稱,也不是把傳統(tǒng)業(yè)務(wù)進(jìn)行簡單的數(shù)據(jù)化錄入而形成的。它在達(dá)到一定的數(shù)據(jù)規(guī)模之上還需要呈現(xiàn)出非結(jié)構(gòu)化的特征。
二、大數(shù)據(jù)背景下傳播學(xué)研究方式的轉(zhuǎn)變
(一)傳統(tǒng)抽樣隨機(jī)樣本轉(zhuǎn)變?yōu)榇髷?shù)據(jù)方法下的全體數(shù)據(jù)
在新聞傳播學(xué)領(lǐng)域,針對一般受訪者測量其認(rèn)知、態(tài)度與行為選擇時,傳統(tǒng)的研究方法以隨機(jī)抽樣或固定樣本為主,具體通過深度訪談、問卷調(diào)查、實(shí)驗(yàn)法等方式。隨著社交媒體深入人們的生活,人們表現(xiàn)自我的方式更為個性化、多元化,展現(xiàn)的渠道也日益多樣化。在此背景下,研究人員可以通過在網(wǎng)絡(luò)上對研究對象的“電子蹤跡”進(jìn)行搜索、采集、分析、發(fā)掘和利用,即可獲得足以反饋其心理動向與行為舉止的海量數(shù)據(jù),這就是將大數(shù)據(jù)方法引入傳播學(xué)研究領(lǐng)域的重要表現(xiàn)。并且,大數(shù)據(jù)研究方法可以輕松捕捉與處理一些傳統(tǒng)抽樣方法無法采集的細(xì)節(jié)信息。
(二)傳統(tǒng)方法與大數(shù)據(jù)方式在研究目的上的區(qū)別
在傳播學(xué)研究領(lǐng)域,過去常用的抽樣調(diào)查方法是以追求因果關(guān)系為第一研究目標(biāo)的。這種因果關(guān)系的成立,必須首先滿足由因及果的時間順序關(guān)系,結(jié)果隨原因的變化而變化的共變關(guān)系,因果二者之外無其他影響變量的非虛假關(guān)系。相較于此,大數(shù)據(jù)方法之下,研究人員首先著眼的是研究因素的相關(guān)性,如電影票房與網(wǎng)絡(luò)搜索數(shù)量之間不存在邏輯上的因果聯(lián)系,但是存在著一定的相關(guān)性。因此,傳播學(xué)的傳統(tǒng)研究方法可以描述事情的狀況,也可以表述傳播理論,但應(yīng)用數(shù)據(jù)發(fā)掘與分析技術(shù)的方法則可以更多傾向于對事件發(fā)展的預(yù)測,在現(xiàn)代商業(yè)市場之中具備更高的實(shí)際價值與利用潛力。而在理論研究領(lǐng)域,大數(shù)據(jù)方法也能夠解釋一些長期未有定論或進(jìn)展的話題。
(三)大數(shù)據(jù)方法放棄了追求處理信息的精確性
與傳統(tǒng)處理方法后能夠保證并追求數(shù)據(jù)的精確性不同,大數(shù)據(jù)方法處理現(xiàn)代數(shù)字信息時往往需要降低或放棄這種精確度。傳統(tǒng)抽樣調(diào)查之中,可供搜集研究的樣本往往有限,研究人員在客觀條件下需保證樣本數(shù)據(jù)的精確度,其中采用一些能夠減少錯誤產(chǎn)生概率的方法,對數(shù)據(jù)進(jìn)行整理和補(bǔ)充,都是具備可操作性的。但是這種清理數(shù)據(jù)的方式,在大數(shù)據(jù)方法之下無法實(shí)行,首要原因就是樣本數(shù)量龐大,人工復(fù)查不現(xiàn)實(shí),其次就是大數(shù)據(jù)方法搜羅的信息無法保證標(biāo)準(zhǔn)完全一致,最重要的是,當(dāng)今市場交易中,數(shù)據(jù)量的龐大在商業(yè)領(lǐng)域上能夠創(chuàng)造的價值遠(yuǎn)高于傳統(tǒng)調(diào)查之中的一點(diǎn)精確性,才能為應(yīng)用數(shù)據(jù)挖掘與分析技術(shù)提供可能性。
三、大數(shù)據(jù)下傳播學(xué)研究的代表性問題
首先,大數(shù)據(jù)對信息分析的主要依據(jù)下的網(wǎng)民行為無法代表全體受眾的行為。根據(jù)相關(guān)的調(diào)查數(shù)據(jù)現(xiàn)實(shí),截至2018年,我國的網(wǎng)民總數(shù)達(dá)到了12.76億,但是網(wǎng)絡(luò)使用普及率則僅為57.9%,從該數(shù)據(jù)可以看出我國還有將近一半的人群不能上網(wǎng),這些人自然也就被大數(shù)據(jù)分析排除在外。
其次,關(guān)鍵性的問題在于網(wǎng)民與非網(wǎng)民之間在結(jié)構(gòu)性上還存在著明顯的差異。如農(nóng)村地區(qū)的網(wǎng)民與城鎮(zhèn)地區(qū)的網(wǎng)民分布嚴(yán)重不均衡,由于受到經(jīng)濟(jì)、文化、網(wǎng)絡(luò)等諸多因素的影響,農(nóng)村偏遠(yuǎn)地區(qū)的人們還無法方便地使用網(wǎng)絡(luò),并且我國的網(wǎng)民還呈現(xiàn)出明顯的年輕化特征。
最后,大數(shù)據(jù)分析存在明顯重技術(shù)輕理論的現(xiàn)象?;诖髷?shù)據(jù)的傳播學(xué)研究對理論的關(guān)注嚴(yán)重不足,明顯存在重?cái)?shù)據(jù)輕理論、重相關(guān)輕因果、重挖掘輕闡釋、重軟件輕開發(fā)的“四重四輕”現(xiàn)象。目前基于大數(shù)據(jù)來研傳播現(xiàn)象的主要研究者是傳播學(xué)者和計(jì)算機(jī)學(xué)者,前者雖對傳統(tǒng)受眾理論比較熟悉,但多忽視了理論驗(yàn)證或建構(gòu),只專注于用新穎的數(shù)據(jù)挖掘技術(shù),后者往往對數(shù)據(jù)挖掘較熟悉,但缺乏傳播學(xué)理論,難以對人類的傳播規(guī)律進(jìn)行深入的因果闡釋。目前,大數(shù)據(jù)在傳播學(xué)中的應(yīng)用也多以實(shí)踐應(yīng)用為主,這種重技術(shù)輕理論的傳播研究在受眾至上的傳播業(yè)界或許有一定的商業(yè)價值,但對傳播學(xué)學(xué)術(shù)研究則不可取。傳播學(xué)研究的最主要目的是發(fā)現(xiàn)人類傳播行為的規(guī)律,增加這方面的知識,一個有理論價值的傳播研究,也一定是有應(yīng)用價值的,反之,僅做實(shí)踐應(yīng)用而缺乏理論視角的傳播研究難以產(chǎn)生理論貢獻(xiàn)。
四、大數(shù)據(jù)中傳播學(xué)研究的方法和路徑
(一)數(shù)據(jù)采集方式變革
大數(shù)據(jù)時代下對傳播學(xué)所產(chǎn)生的最根本的影響在于數(shù)據(jù)生產(chǎn)方式的變革。人們無意識的網(wǎng)絡(luò)搜索行為習(xí)慣成為主要的數(shù)據(jù)來源。其中無意識的網(wǎng)絡(luò)行為并不是說人們對自己的行為完全不知曉,而是指這種網(wǎng)絡(luò)行為的初始目的不是為了給相關(guān)的企業(yè)或者是研究機(jī)構(gòu)留下記錄。延伸到傳播學(xué)領(lǐng)域,指的是針對客戶信息數(shù)據(jù)的搜集不再依靠傳統(tǒng)的問卷調(diào)查以及電話訪問等方式,讓受訪者明確獲知自己填寫的答案將會被運(yùn)用到數(shù)據(jù)分析中。并且傳統(tǒng)的數(shù)據(jù)收集方式下樣本的總量是有限的,無法實(shí)現(xiàn)全面的覆蓋。而在大數(shù)據(jù)時代下所適用的研究方法則是借助開放式的平臺,引導(dǎo)受診者主動填寫相關(guān)的資料與信息并且加以記錄。以自媒體所進(jìn)行的新聞生產(chǎn)為例,絕大多數(shù)的新聞信息來源都是個體在生產(chǎn),并且將其發(fā)送到微博和微信公眾號上,其中微博與微信公眾號就是這種開放式的平臺,上面的信息內(nèi)容都是由用戶主動地進(jìn)行資料與信息不斷地填充。因此對傳播學(xué)研究而言,需要借助這種形式的平臺來搜集相關(guān)的數(shù)據(jù),不僅可以與現(xiàn)有的開放式平臺進(jìn)行合作,同時還可以自行搭建平臺。
(二)抽樣方法的前景
大數(shù)據(jù)會提高抽樣研究的準(zhǔn)確性,但是抽樣方式會發(fā)生改變。在傳統(tǒng)的抽樣研究中,會假設(shè)一個全樣本,然后進(jìn)行抽樣設(shè)計(jì),但在實(shí)際操作過程中,往往會受限于數(shù)據(jù)易得性,而使研究樣本的代表性和信度受到質(zhì)疑。而在大數(shù)據(jù)環(huán)境中,首先,我們需要厘清大數(shù)據(jù)本身已經(jīng)是數(shù)據(jù)的前端采集結(jié)果,這是大數(shù)據(jù)的本質(zhì),而它就是一個全樣本。抽樣的時候,其實(shí)是對數(shù)據(jù)后端的一次再處理。也就是說,大數(shù)據(jù)本身是伴隨著分析處理方法的開發(fā)而誕生的,如mapreduce等,運(yùn)用這些方法直接分析數(shù)據(jù)的準(zhǔn)確性最高,但是需要傳播學(xué)者進(jìn)行計(jì)算機(jī)相關(guān)知識的學(xué)習(xí),或者跨學(xué)科間學(xué)者進(jìn)行合作。只有在無法使用大數(shù)據(jù)分析工具的情況下,傳播學(xué)者才會使用抽樣分析方法。抽樣方法的改變指的是樣本來源的改變。原本的樣本是在現(xiàn)實(shí)生活中采集,而大數(shù)據(jù)下的樣本是在大數(shù)據(jù)里面進(jìn)行抽樣,這樣一方面使數(shù)據(jù)可得性大大提高,按照科學(xué)抽樣方式設(shè)計(jì)的可執(zhí)行度高;另一方面,由于操作層面中的數(shù)據(jù)易得性也能促進(jìn)抽樣方法的發(fā)展和更新,使抽樣方法更準(zhǔn)確。
(三)非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化分析
如前文分析,傳播學(xué)者對大數(shù)據(jù)的運(yùn)用是對數(shù)據(jù)后端的再運(yùn)用,那么這個再次的運(yùn)用分析,就是把數(shù)據(jù)的“大”往“小”的分析,也是把“非結(jié)構(gòu)化”的數(shù)據(jù)進(jìn)行“結(jié)構(gòu)化”的分析。換言之,就是要從這些看似雜亂無章的數(shù)據(jù)中尋找到有價值的關(guān)系鏈和運(yùn)用前景。不同于自然科學(xué)數(shù)據(jù)的特點(diǎn),社會科學(xué)的數(shù)據(jù)不僅非結(jié)構(gòu)化數(shù)據(jù)多,而且實(shí)時性強(qiáng),大量數(shù)據(jù)都是隨機(jī)動態(tài)產(chǎn)生,根據(jù)網(wǎng)絡(luò)數(shù)據(jù)做經(jīng)濟(jì)形勢、安全形勢、社會群體事件的預(yù)測卻成為可能。傳播學(xué)者不是要獲取更多的數(shù)據(jù),而是要首先得到大數(shù)據(jù),然后做去冗分類、去粗取精,科學(xué)合理地二次抽樣采集數(shù)據(jù),進(jìn)一步進(jìn)行數(shù)據(jù)挖掘。
(四)可視化分析:數(shù)據(jù)藝術(shù)家的誕生
伴隨著大量數(shù)據(jù)分析處理后的結(jié)果需要展示給客戶或普通受眾,那么普通的圖表已經(jīng)無法展示大數(shù)據(jù)的數(shù)據(jù)處理結(jié)果,只有可視化的結(jié)果才可以被接受。但是單就可視化的方法來看,它的展現(xiàn)程度也不盡相同。好的可視化展示應(yīng)該是通過清晰美觀的圖示,能讓人理解數(shù)據(jù)的真正含義或者它的真實(shí)面貌。而這對科學(xué)傳播和視覺傳播的學(xué)者來說,都是一個可探索的領(lǐng)域。能美觀地、有趣地、便于理解地展示和分享有關(guān)計(jì)算的數(shù)據(jù)和故事,是未來數(shù)據(jù)藝術(shù)家的努力方向。
五、結(jié)語
大數(shù)據(jù)技術(shù)給整個新聞傳播領(lǐng)域帶來了革命性的變化,尤其是深刻地改變了傳統(tǒng)的傳播學(xué)研究方法和理念。但如同任何新事物一樣,基于大數(shù)據(jù)的傳播研究并非一帆風(fēng)順,在實(shí)際中是一把“雙刃劍”,基于大數(shù)據(jù)的傳播研究面臨新的技術(shù)、倫理、理論等挑戰(zhàn),同傳統(tǒng)的傳播學(xué)研究一樣,基于大數(shù)據(jù)的傳播研究只是一種工具和手段,只有趨利避害,充分利用新技術(shù)拓展研究的領(lǐng)域和問題,發(fā)展新媒體環(huán)境下的傳播研究理論,才能充分發(fā)揮大數(shù)據(jù)在傳播學(xué)研究中的價值。
參考文獻(xiàn):
[1]倪寧,金韶.大數(shù)據(jù)時代的精準(zhǔn)廣告及其傳播策略:基于場域理論視角[J].現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào)),2015(2).
[2]楊雅.大數(shù)據(jù)分析與可視化技術(shù):新聞傳播的新范式:“大數(shù)據(jù)與新聞傳播創(chuàng)新”研討會綜述[J].國際新聞界,2016(3).
[3]劉義昆.大數(shù)據(jù)時代的數(shù)據(jù)新聞生產(chǎn):現(xiàn)狀、影響與反思[J].現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào)),2015(11).
[4]胥琳佳.大數(shù)據(jù)對于傳播學(xué)研究內(nèi)容和方法的影響:基于社交媒體和移動互聯(lián)網(wǎng)的思考[J].中國出版,2015(18).
編輯 陳鮮艷