摘要:
大數(shù)據(jù)技術(shù)正在對(duì)今天的新聞業(yè)形成沖擊,它在一定程度上將對(duì)現(xiàn)有的新聞生產(chǎn)的模式與機(jī)制產(chǎn)生影響,這主要體現(xiàn)在:大數(shù)據(jù)技術(shù)滲透到新聞生產(chǎn)的核心環(huán)節(jié),大數(shù)據(jù)技術(shù)重樹新聞質(zhì)量標(biāo)桿,大數(shù)據(jù)技術(shù)進(jìn)一步提升受眾反饋的價(jià)值,大數(shù)據(jù)技術(shù)拓展用戶分析廣度與深度。在大數(shù)據(jù)技術(shù)等因素的推動(dòng)下,新聞業(yè)務(wù)將實(shí)現(xiàn)一些方向性調(diào)整,如趨勢(shì)預(yù)測(cè)性新聞和數(shù)據(jù)驅(qū)動(dòng)型深度報(bào)道分量的增加,數(shù)據(jù)呈現(xiàn)、分析與解讀能力的提高,新聞生產(chǎn)中跨界合作的增強(qiáng)。
關(guān)鍵詞:
大數(shù)據(jù) 信息圖表 計(jì)算機(jī)輔助報(bào)道 數(shù)據(jù)驅(qū)動(dòng)型新聞
今天的新聞業(yè)正在受到前所未有的挑戰(zhàn)。一方面,社會(huì)化媒體的興起使得公民新聞在一定程度上侵蝕著過去專業(yè)媒體的領(lǐng)地;另一方面,在大數(shù)據(jù)技術(shù)等的支持下,計(jì)算機(jī)這樣一種“機(jī)器”,也在對(duì)媒體人形成直接的沖擊。關(guān)于社會(huì)化媒體的影響,學(xué)界和業(yè)界已有很多關(guān)注,但對(duì)于大數(shù)據(jù)時(shí)代技術(shù)對(duì)媒體的影響,我們的關(guān)注還遠(yuǎn)遠(yuǎn)不夠。而在未來,它的影響將超乎我們的想象。
一、從“計(jì)算機(jī)輔助報(bào)道”到大數(shù)據(jù)時(shí)代
計(jì)算機(jī)數(shù)據(jù)分析技術(shù)與新聞報(bào)道的結(jié)緣并非新鮮事。20世紀(jì)50年代,美國(guó)就有媒體記者利用大型計(jì)算機(jī)對(duì)政府提供的數(shù)據(jù)庫(kù)中的信息進(jìn)行分析,以發(fā)現(xiàn)和調(diào)查新聞事實(shí)。[1]之后,在西方,計(jì)算機(jī)輔助報(bào)道(Computer Aided Reporting,簡(jiǎn)稱CAR)逐漸興起,在這樣一個(gè)新的領(lǐng)域內(nèi),人們不斷探討著以數(shù)據(jù)為基礎(chǔ)挖掘新聞、解釋新聞的方法。那些或公開或隱蔽的數(shù)據(jù),成為記者發(fā)現(xiàn)新聞選題、拓展新聞深度的重要資源。
但在計(jì)算機(jī)輔助報(bào)道技術(shù)啟動(dòng)之初,媒體能利用的資源是有限的,來源主要是政府機(jī)構(gòu)、企業(yè)等發(fā)布的數(shù)據(jù)。而互聯(lián)網(wǎng)、手機(jī)等新媒體的發(fā)展,使得計(jì)算機(jī)輔助報(bào)道能獲得的數(shù)據(jù)日益豐富。
今天的時(shí)代已經(jīng)被稱為“大數(shù)據(jù)”時(shí)代?!按髷?shù)據(jù)”(Big Data)這一概念,首先是指信息或數(shù)據(jù)量的巨大。數(shù)據(jù)的單位,已經(jīng)從G和T發(fā)展到P、E、Z、Y等為計(jì)量單位。計(jì)算機(jī)中存儲(chǔ)信息的基本單位是字節(jié)(Byte)。一個(gè)西文字符用一個(gè)字節(jié)存儲(chǔ),一個(gè)漢字需要兩個(gè)字節(jié)存儲(chǔ)。其他單位及其相互間的關(guān)系分別為:1K=1024Byte,1M=1024K,1G=1024M,1T=1024G,1P=1024T,1E=1024P,1Z=1024E,1Y=1024Z。有資料稱,2011年全球的數(shù)據(jù)量達(dá)到1.8Z。[2]
大數(shù)據(jù)時(shí)代的出現(xiàn),與很多因素相關(guān),除了政府機(jī)構(gòu)、媒體、企業(yè)等提供了更多的數(shù)據(jù)外,用戶數(shù)據(jù)、社會(huì)化媒體平臺(tái)上的UGC、移動(dòng)終端的地理信息、物聯(lián)網(wǎng)技術(shù)的發(fā)展等,也使信息的數(shù)量急劇增長(zhǎng),而后者是大數(shù)據(jù)時(shí)代更重要的數(shù)據(jù)來源。
這樣的新環(huán)境,對(duì)大型數(shù)據(jù)的挖掘、處理、分析、分享等能力提出了全新的要求,此外,“大數(shù)據(jù)”時(shí)代也意味著不同行業(yè)、不同領(lǐng)域的數(shù)據(jù)之間的交換和相互利用也變得十分頻繁。大數(shù)據(jù)時(shí)代,強(qiáng)調(diào)的是對(duì)大規(guī)模數(shù)據(jù)的綜合處理能力。
提到大數(shù)據(jù)特點(diǎn),業(yè)界通常會(huì)將其歸納為四個(gè)“V”,即多樣性(Variety)、體量(Volume)、速度(Velocity)和價(jià)值(Value)。IBM網(wǎng)站關(guān)于大數(shù)據(jù)四個(gè)特點(diǎn)的界定中,則用真實(shí)性(Veracity)替代了“價(jià)值”。(參見http://www-01.ibm.com/software/data/bigdata/)總體來看,大數(shù)據(jù)意味著多樣化的數(shù)據(jù)來源、巨大的數(shù)據(jù)量、快速的處理。而對(duì)于大數(shù)據(jù)的價(jià)值,人們的解釋角度不盡相同。雖然對(duì)大數(shù)據(jù)進(jìn)行有效加工會(huì)產(chǎn)生巨大的價(jià)值,但大數(shù)據(jù)本身卻有著價(jià)值密度低的特點(diǎn),也就是說單位數(shù)據(jù)的價(jià)值并不高,要在大量的數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的數(shù)據(jù)或者將低價(jià)值的微小數(shù)據(jù)集聚成有價(jià)值的大數(shù)據(jù),也是大數(shù)據(jù)技術(shù)要解決的一個(gè)主要問題。
目前,“大數(shù)據(jù)”的概念及其價(jià)值更多的是被IT業(yè)和企業(yè)營(yíng)銷領(lǐng)域所關(guān)注,但事實(shí)上,傳媒業(yè)也將是受到大數(shù)據(jù)時(shí)代沖擊的主要行業(yè)之一。
二、大數(shù)據(jù)技術(shù)對(duì)新聞生產(chǎn)模式與機(jī)制的影響
大數(shù)據(jù)技術(shù)不僅使數(shù)據(jù)成為新聞報(bào)道的更重要的資源,而且在全面地影響現(xiàn)有的新聞生產(chǎn)模式與機(jī)制。
(一)大數(shù)據(jù)技術(shù)滲透到新聞生產(chǎn)的核心環(huán)節(jié)。在大數(shù)據(jù)及相關(guān)技08468d79a9b09c4d5f78d3f8bcbf61ea0f139ddcf4142669c6c2b79b15c4a962術(shù)的影響下,過去只有受過專業(yè)訓(xùn)練的人才能承擔(dān)的新聞報(bào)道工作,開始部分地轉(zhuǎn)移到了計(jì)算機(jī)身上。
Narrative是一家擁有大約30名員工的美國(guó)公司,它運(yùn)用Narrative Science算法,大約每30秒就能夠撰寫出一篇新聞報(bào)道。2011年該軟件通過收集相關(guān)信息寫出了大約40萬則關(guān)于少年棒球聯(lián)盟的新聞報(bào)道。2012年這一數(shù)字預(yù)計(jì)將達(dá)到150萬。Narrative 的新聞撰寫的基本模式為:首先,通過系統(tǒng)的搜索引擎收集大量高質(zhì)量的數(shù)據(jù);其次根據(jù)報(bào)道題材決定文章的風(fēng)格模式,再按照元作者提供的詞匯來組成句子。所謂元作者是由資深記者組成的團(tuán)隊(duì),他們負(fù)責(zé)創(chuàng)建一系列報(bào)道題材的模板,他們同Narrative技術(shù)工程師密切合作,使計(jì)算機(jī)能夠從不同“角度”來識(shí)別相應(yīng)數(shù)據(jù)。[3]
Narrative聯(lián)合創(chuàng)始人兼首席技術(shù)官(CTO)克里斯蒂安·哈蒙德(Kristian Hammond)認(rèn)為,未來機(jī)器生成的新聞將占到媒體新聞的90%,并且在未來5年之內(nèi),這樣的新聞?dòng)锌赡塬@得普利策新聞獎(jiǎng)。[4]
盡管目前我們還無法判斷哈蒙德的說法是虛妄的豪言,還是有遠(yuǎn)見的預(yù)測(cè),但是,Narrative公司的實(shí)踐至少說明,新聞采訪寫作這樣一個(gè)過去被“人”壟斷的領(lǐng)域,開始受到機(jī)器的“入侵”。
當(dāng)然,機(jī)器進(jìn)行新聞的采集與撰寫,目前還局限于特定的領(lǐng)域,在Narrative,機(jī)器生產(chǎn)的新聞目前僅限于金融業(yè)和體育產(chǎn)業(yè)。這兩個(gè)產(chǎn)業(yè)都涉及大量波動(dòng)性很強(qiáng)的數(shù)據(jù),新數(shù)據(jù)總是源源不斷。另一方面,體育和金融題材,在新聞寫作中已經(jīng)有若干固定模式,建立相應(yīng)文章模板,也就比較簡(jiǎn)單。
事實(shí)上,2004年開始,谷歌、百度的新聞(或資訊)頻道,就已經(jīng)依賴搜索技術(shù)和計(jì)算機(jī)算法來進(jìn)行新聞的整合以及在網(wǎng)頁上的呈現(xiàn)。它們可以說是計(jì)算機(jī)技術(shù)用于新聞生產(chǎn)的更早的探索。
無論未來技術(shù)如何發(fā)達(dá),計(jì)算機(jī)也不會(huì)完全取代人完成一切新聞報(bào)道,但兩者之間的結(jié)合一定會(huì)更加緊密,正如哈蒙德指出的,計(jì)算機(jī)的優(yōu)勢(shì)在于記憶無差錯(cuò),并能夠快速訪問各類數(shù)據(jù)。而人工記者在進(jìn)行采訪過程中,能夠做到“直奔主題”,在獲得相關(guān)材料后,再將撰寫文章的任務(wù)交給計(jì)算機(jī)。隨著計(jì)算機(jī)處理此類任務(wù)次數(shù)的增長(zhǎng)并能夠獲得更多數(shù)據(jù),計(jì)算機(jī)的“敘事”技巧也將越來越高。[5]
Narrative生成新聞報(bào)道的很多數(shù)據(jù)來自于社會(huì)化媒體,這也反映了未來一個(gè)主要趨勢(shì),大數(shù)據(jù)技術(shù)與社會(huì)化媒體的結(jié)合,是未來新聞生產(chǎn)的一種重要方式,它們將成為專業(yè)媒體的人工式新聞生產(chǎn)的一種重要補(bǔ)充。
普通用戶在社會(huì)化媒體中生產(chǎn)的內(nèi)容,是專業(yè)媒體需要充分利用的一種重要的資源,但目前媒體和受眾面臨的一個(gè)共同困境是,來自于個(gè)體的內(nèi)容往往是碎片式的。盡管這些碎片中存在著很多具有重要價(jià)值的內(nèi)容,它們一旦被發(fā)掘出來并且與專業(yè)媒體的內(nèi)容整合在一起,將能發(fā)揮重要的作用,但是,由于信息量的巨大,碎片的篩選、挖掘和整合,也變成一件難事。大數(shù)據(jù)技術(shù),也許可以在一定程度上解決這一問題。
大數(shù)據(jù)時(shí)代的發(fā)展,與物聯(lián)網(wǎng)技術(shù)也密切相關(guān)。作為物物相連的網(wǎng)絡(luò),物聯(lián)網(wǎng)技術(shù)意味著,在未來,只要需要,任何物體的狀態(tài)數(shù)據(jù)可以由它們自身所攜帶的裝置向互聯(lián)網(wǎng)傳送,這些數(shù)據(jù)也將成為未來新聞報(bào)道的重要來源——無論是從新聞線索的提供還是新聞要素的揭示角度來看。與記者的個(gè)人觀察得出的判斷相比,這些直接的采集自物體本身的數(shù)據(jù),將更為精確。
因此,在社會(huì)化媒體、物聯(lián)網(wǎng)以及其他相關(guān)技術(shù)的共同作用下,新聞生產(chǎn)的幾個(gè)基礎(chǔ)環(huán)節(jié),都可能會(huì)發(fā)生一定的變化。
從新聞線索與選題的發(fā)現(xiàn)的角度看,記者與編輯需要更多地利用媒體自身或合作機(jī)構(gòu)的數(shù)據(jù)庫(kù),來發(fā)現(xiàn)重要的新聞。也有些情況下,新聞的發(fā)現(xiàn),甚至可能是由“機(jī)器”來完成的。專業(yè)媒體人需要的是在計(jì)算機(jī)提供的線索基礎(chǔ)上,進(jìn)行更深層次的采訪與數(shù)據(jù)挖掘。
從新聞信息的采集、新聞要素的發(fā)現(xiàn)角度看,對(duì)于那些具有持續(xù)的數(shù)據(jù)形成機(jī)制的行業(yè)或領(lǐng)域(如上文提到的體育、金融業(yè)等以及未來物聯(lián)網(wǎng)技術(shù)廣泛運(yùn)用的那些行業(yè)),信息(包括核心要素信息)的采集將在較大程度上實(shí)現(xiàn)自動(dòng)化,媒體人的職責(zé),需要從梳理事實(shí)更多地轉(zhuǎn)向解釋事實(shí)發(fā)生的原因及分析影響方面。
從新聞作品的角度看,機(jī)器寫作的稿件將在常態(tài)的新聞報(bào)道中占據(jù)越來越大的比重,而重大題材的報(bào)道中,媒體人仍扮演主要角色。對(duì)于圖片、音視頻類的新聞報(bào)道來說,媒體人的角色可能在短期內(nèi)難以被計(jì)算機(jī)替代。
從新聞編輯的角度看,對(duì)日常的新聞稿件的篩選與整合,類似谷歌新聞、百度新聞這樣的自動(dòng)整合模式,具有一定的價(jià)值,當(dāng)然,它們不會(huì)取代人工編輯。但是一部分受眾會(huì)逐步接受這樣一種新聞?wù)夏J健?/p>
(二)大數(shù)據(jù)技術(shù)重樹新聞質(zhì)量標(biāo)桿。在專業(yè)媒體壟斷傳媒業(yè)的時(shí)代,人們對(duì)媒體的要求往往是能作出報(bào)道就行,至于報(bào)道的客觀性、全面性、深刻性等,由于缺乏相應(yīng)的參照系,受眾往往難以作出評(píng)價(jià),所以相應(yīng)的要求也相對(duì)較低。
而今天,專業(yè)媒體的周圍已經(jīng)出現(xiàn)了多個(gè)參照物,其中最主要的一個(gè)是社會(huì)化媒體。社會(huì)化媒體在某些事件的反應(yīng)速度、內(nèi)容的豐富度等方面甚至?xí)^專業(yè)媒體。專業(yè)媒體雖然總是聲稱自己可以做得更專業(yè),但是,僅靠豪言壯語并不能真正解決問題。媒體要在社會(huì)化媒體的包圍下突圍,需要在報(bào)道模式、報(bào)道手段方面找到突破。
大數(shù)據(jù)技術(shù)是檢驗(yàn)專業(yè)媒體質(zhì)量的另一個(gè)參照物,在大數(shù)據(jù)技術(shù)面前,無論是在反映全局性事實(shí)還是趨勢(shì)性規(guī)律方面,媒體現(xiàn)有報(bào)道方式與報(bào)道成果的缺陷都日漸暴露。
但大數(shù)據(jù)技術(shù)既是參照物,又可以成為專業(yè)媒體未來的方法與工具,利用大數(shù)據(jù)技術(shù),專業(yè)媒體的報(bào)道水準(zhǔn)將得到有效的提升。
無論多么優(yōu)秀的記者,他對(duì)于事物的觀察都只能是受制于個(gè)人的視野與立場(chǎng),即使是相對(duì)深入的,也未必是全面的、充分的。而與記者在某一個(gè)視野有限的觀察點(diǎn)上對(duì)事物進(jìn)行的觀察與分析不同的是,有效加工的大規(guī)模數(shù)據(jù)可以揭示更大范圍內(nèi)的或更接近事實(shí)的情狀,從而也為報(bào)道的深入提供了基礎(chǔ)。
2011年夏天英國(guó)的騷亂發(fā)生后,Twitter等社會(huì)化媒體被認(rèn)為是導(dǎo)致騷亂的“罪魁禍?zhǔn)住敝?。但英?guó)《衛(wèi)報(bào)》進(jìn)行的一項(xiàng)調(diào)查結(jié)果顯示,實(shí)際上在此期間Twitter在應(yīng)對(duì)騷亂事件方面也扮演了重要角色。《衛(wèi)報(bào)》對(duì)250多萬條Twitter消息進(jìn)行了分析,發(fā)現(xiàn)有20.6萬條消息是市民呼吁清理騷亂后的大街上的雜物,占所發(fā)送消息總量的8%。[6]雖然這一分析并不能排除Twitter在騷亂中的負(fù)面影響,但至少它推動(dòng)人們更全面地認(rèn)識(shí)Twitter在騷亂中扮演的角色。
大數(shù)據(jù)不僅在某種程度上比媒體的個(gè)別角度、個(gè)別層面的觀察更為有效,也在一定意義上比傳統(tǒng)的問卷調(diào)查更為客觀。例如,基于社會(huì)化媒體數(shù)據(jù)的分析,是以人們自發(fā)的信息與情緒披露為基礎(chǔ)的,盡管這些信息與情緒未必百分之百真實(shí),但是,相對(duì)人們被動(dòng)接受調(diào)查的情形,人們自發(fā)的披露,通常還是更能反映他們的狀態(tài)與意愿。
對(duì)于趨勢(shì)的預(yù)測(cè),也是大數(shù)據(jù)技術(shù)的價(jià)值所在。
科學(xué)家的研究,已經(jīng)越來越清晰地揭示出,人類行為多數(shù)是可以預(yù)測(cè)的,正如《爆發(fā)——大數(shù)據(jù)時(shí)代預(yù)見未來的新思維》書中所指出的:
各種各樣的記錄人類行為的數(shù)據(jù)庫(kù),雖然給人類帶來了前所未有的風(fēng)險(xiǎn),但“同時(shí)也創(chuàng)造了一個(gè)歷史性機(jī)遇——它第一次毫無偏見地為我們提供了成千上萬人,而不是少數(shù)人的詳細(xì)行為記錄。在過去幾年里,這些數(shù)據(jù)庫(kù)為各大實(shí)驗(yàn)室提供了不少幫助,使很多計(jì)算機(jī)學(xué)家、物理學(xué)家、數(shù)學(xué)家、社會(huì)學(xué)家、心理學(xué)家以及經(jīng)濟(jì)學(xué)家得以在強(qiáng)大的計(jì)算機(jī)和新技術(shù)的支持下,對(duì)某些問題進(jìn)行仔細(xì)研究。實(shí)驗(yàn)的結(jié)果令人振奮。他們有充分的證據(jù)證明,人類的大部分行為都受制于規(guī)律、模型以及原理法則,而且它們的可重現(xiàn)性和可預(yù)測(cè)性與自然科學(xué)不相上下”。[7]
同時(shí),在人類行為與社會(huì)的變化之間,也存在著密切的關(guān)聯(lián)。大數(shù)據(jù)分析有可能將那些隱藏著的深層關(guān)聯(lián)揭示出來。
社交媒體監(jiān)測(cè)平臺(tái)DataSift監(jiān)測(cè)了Facebook IPO當(dāng)天Twitter上的情感傾向與Facebook股價(jià)波動(dòng)的關(guān)聯(lián)。例如,在Facebook開盤前Twitter上的情感逐漸轉(zhuǎn)向負(fù)面,25分鐘之后,F(xiàn)acebook的股價(jià)便開始下跌。而當(dāng)Twitter上的情感轉(zhuǎn)向正面時(shí),F(xiàn)acebook股價(jià)在8分鐘之后也開始了回彈。最終,當(dāng)股市接近收盤時(shí),Twitter上的情感轉(zhuǎn)向負(fù)面,10分鐘后Facebook的股價(jià)又開始下跌。最終的結(jié)論是:Twitter上每一次情感傾向的轉(zhuǎn)向都會(huì)影響Facebook股價(jià)的波動(dòng),延遲情況只有幾分鐘到20多分鐘。[8]
聯(lián)合國(guó)推出了一個(gè)名為“全球脈動(dòng)”(Global Pulse)的項(xiàng)目,希望利用數(shù)據(jù)分析來了解人們的生存狀況,對(duì)可能發(fā)生的危機(jī)進(jìn)行預(yù)警。這個(gè)項(xiàng)目著重對(duì)實(shí)時(shí)的數(shù)字化的信息進(jìn)行分析,用來了解某些地區(qū)人們的境遇,有關(guān)政策或項(xiàng)目的執(zhí)行情況,并以相關(guān)信息指導(dǎo)援助項(xiàng)目。(參見http://www.unglobalpulse.org/)其中一個(gè)嘗試是,項(xiàng)目組與技術(shù)公司SAS進(jìn)行合作,SAS用軟件自動(dòng)提取了2009年6月至2011年6月間含有“失業(yè)、被解雇”等關(guān)鍵詞的博客、論壇和新聞網(wǎng)站內(nèi)容,過濾精選后歸入“住房”“交通”“教育”等多個(gè)類別中,再借助語言分析工具對(duì)每一條目表達(dá)的“情緒”定性,比如“焦慮”“疑惑”“快樂”等,然后將人們情緒和討論話題的逐月變化趨勢(shì)與官方失業(yè)率統(tǒng)計(jì)數(shù)字進(jìn)行比較。SAS發(fā)布的研究結(jié)果顯示,在美國(guó)失業(yè)率出現(xiàn)上升趨勢(shì)的4個(gè)月之前,網(wǎng)民的“郁悶”情緒就開始上升;在愛爾蘭,“焦慮”情緒和“疑惑”情緒上升分別出現(xiàn)在失業(yè)率出現(xiàn)上升的5個(gè)月和3個(gè)月之前。另外,在美國(guó),失業(yè)率出現(xiàn)上升2個(gè)月和3個(gè)月后,網(wǎng)民討論住房不保和汽車置換開始增多;在愛爾蘭,失業(yè)率出現(xiàn)上升的同時(shí),網(wǎng)民討論改換交通方式開始增多,3個(gè)月和8個(gè)月之后則取消旅行和置換住房的討論開始增多。[9]
目前媒體報(bào)道中關(guān)于某一事物走向的判斷主要來自于個(gè)別專家的分析,但這種方法的局限性顯而易見。如果媒體能廣泛借助大數(shù)據(jù)技術(shù)來進(jìn)行重大趨勢(shì)的預(yù)測(cè)與分析,那么,它的預(yù)測(cè)的準(zhǔn)確程度可能得到有效提升,它對(duì)社會(huì)的影響力就能得到提升。
(三)大數(shù)據(jù)技術(shù)進(jìn)一步提升受眾反饋的價(jià)值。對(duì)于媒體內(nèi)容的受眾反饋,在很多時(shí)候,也是以大規(guī)模數(shù)據(jù)的形式體現(xiàn)的。對(duì)于這些數(shù)據(jù)的挖掘,可以使受眾的意見、態(tài)度得到更充分的呈現(xiàn),也可以使得這些反饋的價(jià)值得到更好的發(fā)揮與利用。
在印度,有一個(gè)非常受歡迎的電視節(jié)目—— Satyamev Jayate(《真相訪談》)。該節(jié)目談?wù)摰亩际怯《犬?dāng)?shù)乇容^受關(guān)注的社會(huì)話題,每期播出之后都會(huì)在網(wǎng)絡(luò)上引發(fā)激烈討論。為了讓節(jié)目產(chǎn)生更大的社會(huì)影響力,節(jié)目組找到了一家名為Persistent System的IT 咨詢公司來幫助管理和分析“大數(shù)據(jù)”。該公司設(shè)計(jì)了一個(gè)系統(tǒng),幫助搜集網(wǎng)DLVtr7/15z2yKBftaEiTQvPtIgZdRx6aOba5lK+e7tA=絡(luò)上與每期節(jié)目話題相關(guān)的信息,并對(duì)其進(jìn)行分類、貼標(biāo)簽,以及根據(jù)興趣水平和情感指數(shù)評(píng)分,這些數(shù)據(jù)都會(huì)以信息圖的形式公布在節(jié)目的官網(wǎng)上。這些數(shù)據(jù)并不只是揭示了受眾的整體情緒與意見,還作為社會(huì)輿論的反映被政府所關(guān)注。在以女性墮胎(將未出生的女嬰作流產(chǎn)處理)為話題的第一期節(jié)目播出后,有 99.8% 的觀眾認(rèn)為執(zhí)行這類手術(shù)的醫(yī)生應(yīng)該受到懲處。這一結(jié)果被提交給印度政府之后,據(jù)節(jié)目組的人稱,政府“幾乎立即就同意了改善審判系統(tǒng)”。[10]
大數(shù)據(jù)技術(shù)有可能使受眾反饋直接轉(zhuǎn)化為民意,這將使媒體在反映與傳達(dá)民意方面的功能進(jìn)一步增強(qiáng)。
(四)大數(shù)據(jù)技術(shù)拓展用戶分析廣度與深度。雖然受眾分析早就成為媒體的基本工作,但以往的受眾分析是以傳統(tǒng)的抽樣調(diào)查手段為主,由于調(diào)查對(duì)象的有限性,這樣得出的研究結(jié)論,未必能全面反映受眾市場(chǎng),且它們更多地關(guān)注的是“受眾”語境下的孤立的媒介使用習(xí)慣(如閱讀、收看、點(diǎn)擊等),而忽略了用戶的綜合行為習(xí)慣以及這些習(xí)慣對(duì)他們的媒介使用的影響,例如人們的社交關(guān)系圈子或者人們的網(wǎng)上購(gòu)物行為對(duì)于他們?cè)谛侣剝?nèi)容消費(fèi)方面的影響等。
而大數(shù)據(jù)技術(shù)基礎(chǔ)上的用戶分析,將不僅關(guān)注媒介行為習(xí)慣本身,還會(huì)關(guān)注用戶的整體行為,并從中尋找影響他們內(nèi)容消費(fèi)行為的相關(guān)因素。同樣,這樣的研究不是強(qiáng)迫用戶對(duì)他們的行為習(xí)慣以問卷的方式作出回答,而是對(duì)他們?nèi)粘5淖园l(fā)行為本身進(jìn)行分析,因此,能更真實(shí)地反映用戶的需求、偏好以及行為模式。
大數(shù)據(jù)也不僅僅將注意力放在用戶整體分析上,它同樣注重對(duì)于每一個(gè)用戶的個(gè)性化需求的分析,未來媒體所要提供的個(gè)性化服務(wù),也需要對(duì)用戶在各種平臺(tái)各種行為中產(chǎn)生的數(shù)據(jù)進(jìn)行整體連接并在此基礎(chǔ)上進(jìn)行挖掘與分析。
2012年,騰訊發(fā)布了面向營(yíng)銷的大數(shù)據(jù)戰(zhàn)略,它將調(diào)動(dòng)騰訊7億活躍賬戶數(shù)據(jù)去服務(wù)門戶,來打造基于用戶社交關(guān)系鏈的“下一代騰訊網(wǎng)”。騰訊將從這些海量數(shù)據(jù)中挖掘、分辨出用戶的行為模式、興趣偏好等,更準(zhǔn)確地向用戶推薦合適內(nèi)容。[11]在這樣一個(gè)戰(zhàn)略中,我們看到的是,社會(huì)化媒體中的用戶活動(dòng)等看上去與門戶平臺(tái)上內(nèi)容消費(fèi)相對(duì)分離的行為數(shù)據(jù),已成為影響門戶網(wǎng)站的發(fā)展模式的重要依據(jù),以數(shù)據(jù)分析為基礎(chǔ)的個(gè)性化的信息服務(wù)也成為門戶網(wǎng)站發(fā)展的目標(biāo)。騰訊的做法也將被越來越多的媒體借鑒。
三、大數(shù)據(jù)時(shí)代的新聞業(yè)務(wù)發(fā)展趨向
在大數(shù)據(jù)技術(shù)以及社會(huì)化媒體的共同作用下,專業(yè)媒體需要重新尋找自身的定位,謀求新的價(jià)值。而新的定位與新的價(jià)值,必將通過業(yè)務(wù)形態(tài)的變革體現(xiàn)。在未來,新聞業(yè)務(wù)的主要調(diào)整方向也許會(huì)體現(xiàn)在如下方面:
(一)趨勢(shì)預(yù)測(cè)性新聞和數(shù)據(jù)驅(qū)動(dòng)型深度報(bào)道分量的增加。以往媒體的選題更多地來源于正在發(fā)生或已經(jīng)發(fā)生的事實(shí),但公民新聞已在這個(gè)方面對(duì)專業(yè)媒體形成強(qiáng)有力的沖擊。如果媒體能夠利用大數(shù)據(jù)技術(shù),把更多的注意力放在對(duì)未來趨勢(shì)的預(yù)測(cè)上,那么,就有可能在公民新聞難以達(dá)到的高度上,來實(shí)現(xiàn)媒體價(jià)值的重塑。
此外,深度報(bào)道仍然會(huì)是媒體的主要追求,但與以往建立在個(gè)體記者的調(diào)查、采訪能力基礎(chǔ)上的調(diào)查性報(bào)道不同的是,未來越來越多的深度報(bào)道將是數(shù)據(jù)驅(qū)動(dòng)的,是基于大型數(shù)據(jù)的挖掘與分析實(shí)現(xiàn)的對(duì)新聞事實(shí)的深度揭示與解析。
這意味著,媒體要成立專門的部門,或者依靠與外部的合作,建立起一個(gè)數(shù)據(jù)積累與分析的常規(guī)機(jī)制。數(shù)據(jù)分析師或數(shù)據(jù)挖掘師這樣的職位,也應(yīng)該成為媒體的一個(gè)常設(shè)崗位,當(dāng)然他們的職責(zé)不僅僅是對(duì)已經(jīng)形成的數(shù)據(jù)進(jìn)行分析解讀,更需要提出選題方向和數(shù)據(jù)采集、處理的方案。無論是對(duì)于只習(xí)慣文字、圖像等思維的傳統(tǒng)新聞人,還是只習(xí)慣于數(shù)據(jù)思維的技術(shù)人,這都會(huì)是新的挑戰(zhàn)。進(jìn)行跨學(xué)科的人才培養(yǎng),是未來的必然。
盡管不少媒體已經(jīng)開設(shè)了諸如“精確新聞”這樣的以問卷調(diào)查為基礎(chǔ)的數(shù)據(jù)新聞欄目,但大數(shù)據(jù)技術(shù)的運(yùn)用,將使這類數(shù)據(jù)新聞欄目面臨挑戰(zhàn),它們也需要升級(jí)。
(二)數(shù)據(jù)呈現(xiàn)、分析與解讀能力的提高。 大數(shù)據(jù)時(shí)代使數(shù)據(jù)成為新聞報(bào)道中的重要資源,但這并不意味著新聞報(bào)道是數(shù)據(jù)的堆積,信息爆炸時(shí)代需要的是對(duì)信息更明晰的呈現(xiàn)、更準(zhǔn)確的分析和更深層的解讀。
在這樣一種背景下,在國(guó)內(nèi)外的媒體中,信息圖表(Infographic)開始扮演越來越重要的角色。信息圖表是將數(shù)值型和文本型的信息形象化、可視化的一種方式。信息圖表的作用主要表現(xiàn)為呈現(xiàn)數(shù)據(jù)、提示要點(diǎn)、圖解過程、梳理進(jìn)程、揭示關(guān)系、展現(xiàn)情狀、整合內(nèi)容、表達(dá)意見、分析解讀等。
信息圖表使得媒體進(jìn)入一個(gè)新的“讀圖時(shí)代”。與20世紀(jì)90年代中國(guó)紙質(zhì)媒體提出的以新聞?wù)掌瑸橹攸c(diǎn)的“讀圖時(shí)代”不同的是,今天的讀圖時(shí)代,更多的是通過信息的視覺化再加工,更好地傳達(dá)、解釋甚至解讀信息。信息的視覺化再加工,對(duì)于媒體人來說,是一種全新的思維與能力,要全面提高媒體人在這方面的素質(zhì),需要一個(gè)較長(zhǎng)的過程。
(三)新聞生產(chǎn)中跨界合作的增強(qiáng)。新聞媒體要運(yùn)用大數(shù)據(jù)技術(shù)面臨著很多新的挑戰(zhàn),數(shù)據(jù)的來源、數(shù)據(jù)分析與加工的技術(shù)與人才,以及支持相應(yīng)數(shù)據(jù)運(yùn)行的設(shè)備等,無一不給媒體帶來新的課題。盡管有實(shí)力的媒體可以通過自己的力量來解決這些問題,但是,利用外部力量,進(jìn)行跨界合作,也許是更為切實(shí)可行的方式。
大數(shù)據(jù)時(shí)代的數(shù)據(jù)處理,需要“云計(jì)算”等技術(shù)支持,也需要大型的數(shù)據(jù)處理的服務(wù)器集群,同樣,在這些方面,媒體更多地應(yīng)該走外部合作的道路。
當(dāng)然,這也會(huì)意味著數(shù)據(jù)處理的權(quán)力將日益集中于相應(yīng)的硬件與軟件服務(wù)的提供者那里,這也使得技術(shù)對(duì)于媒體的制約能力進(jìn)一步增強(qiáng)。
大數(shù)據(jù)時(shí)代不僅意味著機(jī)會(huì)與挑戰(zhàn),也會(huì)意味著更多的風(fēng)險(xiǎn)與新的外部制約力量,但無論如何,這是媒體必須面對(duì)的一個(gè)新的時(shí)代。
基金項(xiàng)目:本文為國(guó)家社科基金特別委托項(xiàng)目“三網(wǎng)融合相關(guān)問題研究”(10@zh002)研究成果
參考文獻(xiàn):
[1] 卜衛(wèi).計(jì)算機(jī)輔助新聞報(bào)道:信息時(shí)代記者培訓(xùn)的重要課程[J].新聞與傳播研究,1998(1).
[2] 鄭重.大數(shù)據(jù)時(shí)代我們?nèi)绾巫龇治鯷EB/OL].http://bizsoft.yesky.com/377/30424377.shtml.
[3] [4] [5] 中濤.連線雜志:未來新聞90%以上將為電腦化新聞[EB/OL].http://tech.qq.com/a/20120503/000271.htm.
[6] 李明,彥飛.英國(guó)《衛(wèi)報(bào)》:Twitter在騷亂中利大于弊[EB/OL].http://tech.sina.com.cn/i/2011-08-26/18285986351.shtml.
[7] 艾伯特-拉斯洛,巴拉巴西.爆發(fā)——大數(shù)據(jù)時(shí)代預(yù)見未來的新思維[M].馬慧,譯.北京:中國(guó)人民大學(xué)出版社,2012:13.
[8] 深度剖析互聯(lián)網(wǎng)“大數(shù)據(jù)”的特點(diǎn)[EB/OL].http://www.100ec.cn/detail--6042391.html.
[9] 陳慧稚.研究稱網(wǎng)民留言能透露經(jīng)濟(jì)趨勢(shì) "失業(yè)"是關(guān)鍵詞[N].文匯報(bào),2012-03-30.
[10] 王崇旭.大數(shù)據(jù) 大影響[EB/OL].http://www.ifanr.com/134145.
[11] 辛苑薇.騰訊玩“大數(shù)據(jù)”[N].21世紀(jì)經(jīng)濟(jì)報(bào)道,2012-07-05.
(作者單位:中國(guó)人民大學(xué)新聞學(xué)院
作者為中國(guó)人民大學(xué)“新聞與社會(huì)發(fā)展研究中心”研究員)