編者按:2013年被認(rèn)為是中國的“大數(shù)據(jù)元年”,年初,不管是信息領(lǐng)域?qū)<覍W(xué)者還是一些嗅覺敏銳的媒體,都將焦點(diǎn)放到了大數(shù)據(jù)領(lǐng)域,從硅谷到北京,大數(shù)據(jù)的話題被傳播,在普通人還不知道大數(shù)據(jù)究竟為何物時(shí),它就猛然躥到了我們的面前。而在太平洋的另一邊,目前,美國政府已將大數(shù)據(jù)視為“未來的新石油”。
2012年年末,被視為國外大數(shù)據(jù)研究先河之作的《大數(shù)據(jù)時(shí)代》認(rèn)為:大數(shù)據(jù)開啟了一次重大的時(shí)代轉(zhuǎn)型,就像望遠(yuǎn)鏡能夠感受宇宙、顯微鏡觀察微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式……大數(shù)據(jù)時(shí)代作為信息傳播、知識傳播的傳媒業(yè),與今天有什么不同,傳媒業(yè)在大數(shù)據(jù)時(shí)代如何轉(zhuǎn)型?為此,本刊特邀學(xué)界和業(yè)界的專家解讀其心目中的大數(shù)據(jù)及其所期待的傳媒業(yè)。(以下嘉賓以姓氏拼音為序)
本刊記者:哈佛大學(xué)社會學(xué)教授加里·金說:“龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這個(gè)進(jìn)程……”也就是說大數(shù)據(jù)不是針對某一領(lǐng)域,但適用于每一領(lǐng)域;就傳媒業(yè)來說大數(shù)據(jù)到底意味著什么?大數(shù)據(jù)會給傳媒業(yè)帶來哪些期待?這個(gè)大數(shù)據(jù)時(shí)代與以前的數(shù)據(jù)庫有何不同?
石長順:首先要弄清與大數(shù)據(jù)相關(guān)的幾個(gè)概念:數(shù)據(jù)、數(shù)據(jù)庫與大數(shù)據(jù)。
數(shù)據(jù),是對信息數(shù)字化的記錄,本身并無意義,只有將其放在一定背景下解釋才被賦予意義。數(shù)據(jù)倉庫,是一個(gè)面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用以運(yùn)營性系統(tǒng)保存、查詢和決策管理。大數(shù)據(jù),是一個(gè)相對概念,一般認(rèn)為是傳統(tǒng)的軟件工具難以捕捉、存儲、管理和分析的數(shù)據(jù),其數(shù)量是“太字節(jié)”,即2的40次方。
2010年,美國總統(tǒng)科技顧問委員會在給奧巴馬總統(tǒng)和國會的報(bào)告《規(guī)劃數(shù)字化的未來》中,首次從國家發(fā)展層面提出了大數(shù)據(jù)戰(zhàn)略。接著,2011年,麥肯錫公司推出了研究報(bào)告《大數(shù)據(jù):下一個(gè)創(chuàng)新、競爭和生產(chǎn)率的前沿》。
大數(shù)據(jù)適用于社會各個(gè)領(lǐng)域,從政府層面看,包括三大數(shù)據(jù)來源,即業(yè)務(wù)工作的管理數(shù)據(jù)、民意民情的調(diào)查數(shù)據(jù),以及對大自然、動植物的特點(diǎn)和變化所監(jiān)控而產(chǎn)生的環(huán)境數(shù)據(jù)。嚴(yán)格來說,這些都是傳媒關(guān)注、報(bào)道的領(lǐng)域,都應(yīng)成為傳媒的信息數(shù)據(jù)庫。從專業(yè)角度看,傳媒業(yè)也應(yīng)當(dāng)建立中國與世界傳媒“業(yè)務(wù)”數(shù)據(jù)庫,其量化進(jìn)程從收集、保存、維護(hù)、管理開始,繼而對之進(jìn)行分析、共享。傳媒業(yè)務(wù)將通過對數(shù)據(jù)的挖掘,進(jìn)行專題報(bào)道、深度分析、闡釋報(bào)道等,特別是通過對民意調(diào)查、市場分析等數(shù)據(jù)的運(yùn)用,實(shí)現(xiàn)政治傳播、民生報(bào)道中的新聞專業(yè)主義。
柯惠新:大數(shù)據(jù)是一種時(shí)代現(xiàn)象,主要是商業(yè)概念,還未形成嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)定義。
按照以往的看法,大數(shù)據(jù)通常用來形容一個(gè)公司創(chuàng)造或收集的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),如網(wǎng)絡(luò)日志、社會關(guān)系網(wǎng)絡(luò)上的用戶活動數(shù)據(jù)、互聯(lián)網(wǎng)搜索引擎上的詳細(xì)搜索記錄,甚至天文學(xué)、大氣科學(xué)、基因組學(xué)等學(xué)科、跨學(xué)科的科研記錄等。對于電視媒體,大數(shù)據(jù)一般指跨媒體或全媒體數(shù)據(jù),如電視機(jī)頂盒的回路數(shù)據(jù)、電腦或移動終端收看視頻的數(shù)據(jù)、社交媒體上對所收看節(jié)目的相關(guān)評論等等。
而現(xiàn)在提及大數(shù)據(jù),通常還指一種解決問題的方法,即通過收集、整理生活中方方面面的海量數(shù)據(jù),并對其進(jìn)行分析挖掘,從中獲得有價(jià)值的信息。這種對大數(shù)據(jù)應(yīng)用的期待和實(shí)踐,已衍化出一種新的商業(yè)模式。在這種商業(yè)模式下,一個(gè)公司的核心競爭力不但取決于它擁有的數(shù)據(jù)規(guī)模,更取決于它分析運(yùn)用手頭數(shù)據(jù)來解決問題的能力。
陳昌鳳:大數(shù)據(jù)時(shí)代各領(lǐng)域皆可量化,而量化的核心是使信息準(zhǔn)確描述,包括模糊性的準(zhǔn)確,目的則是使我們認(rèn)知不清晰的方面變得清晰,幫助我們?nèi)ヅ袛喱F(xiàn)狀和趨勢、確定未來戰(zhàn)略,在記錄、描述,并分析、重組后讓它帶來效率、效益。
就傳媒業(yè)而言,要融入這個(gè)時(shí)代,利用大數(shù)據(jù)發(fā)展自己。大數(shù)據(jù)的前提是加入這個(gè)游戲圈,首先數(shù)字化,讓電腦可以處理那些數(shù)據(jù),也就是建立數(shù)據(jù)庫;在數(shù)字化基礎(chǔ)上進(jìn)行數(shù)據(jù)化,變成軟件可識別的數(shù)據(jù)化文本;智慧地使用已有的理論和方法,讓這些數(shù)據(jù)發(fā)揮價(jià)值——內(nèi)容提取、分享、互動,讓它們更好地服務(wù)于使用者,發(fā)掘其中的商業(yè)性創(chuàng)新價(jià)值。
大數(shù)據(jù)帶來了各方面的創(chuàng)新和期待,在國際傳統(tǒng)媒體中正在發(fā)揮越來越重要的作用。但坦率而言,大數(shù)據(jù)對中國傳統(tǒng)媒體的影響難以看見。我國除少數(shù)傳統(tǒng)媒體有些許實(shí)驗(yàn),但多數(shù)既沒看到機(jī)會,也沒看到危險(xiǎn)。而對于互聯(lián)網(wǎng)媒體,這個(gè)領(lǐng)域的實(shí)踐已走在了前面。
鄧光和:大數(shù)據(jù)時(shí)代的來臨是大信息時(shí)代的內(nèi)在要求和必然結(jié)果。當(dāng)今世界,經(jīng)濟(jì)、科技、文化、教育高度發(fā)達(dá),國家之間、地區(qū)之間、人與人之間交往互動日益密切頻繁,相關(guān)信息被報(bào)紙雜志、廣播電視、互聯(lián)網(wǎng)絡(luò)捕捉整合傳播,信息數(shù)量呈爆炸式增長。社會越進(jìn)步,信息越增多,人們對信息的需求甚至依賴程度越高。但面對海量信息,單個(gè)的個(gè)體或組織很難全面準(zhǔn)確地理解和把握,甚至可能陷于信息的海洋而迷失自我。這就需要專業(yè)人員、專門機(jī)構(gòu)來對信息進(jìn)行測量、統(tǒng)計(jì)、整合、分類,其結(jié)果就是數(shù)據(jù)。由于這些數(shù)據(jù)涉及社會生活的所有領(lǐng)域,數(shù)量和影響非常大,故稱大數(shù)據(jù)。
數(shù)據(jù)即信息,大數(shù)據(jù)即大信息。信息是商品,是財(cái)富,是生產(chǎn)力。人們之所以關(guān)注數(shù)據(jù),實(shí)質(zhì)上就是關(guān)注信息的內(nèi)在價(jià)值,關(guān)注信息在生產(chǎn)生活中的巨大作用。
傳媒業(yè)本身就是生產(chǎn)和傳播信息的產(chǎn)業(yè)。大數(shù)據(jù)時(shí)代,傳媒業(yè)大有可為。首先,信息源更加豐富。傳媒機(jī)構(gòu)可充分利用數(shù)據(jù)資源,搜集、整合、加工、傳播各類信息。其次,對受眾需求的把握更加準(zhǔn)確。傳媒機(jī)構(gòu)可根據(jù)受眾需求確定傳播內(nèi)容和傳播策略,實(shí)現(xiàn)精準(zhǔn)傳播。再次,傳播效果反饋更加全面。傳媒機(jī)構(gòu)可根據(jù)反饋數(shù)據(jù),及時(shí)調(diào)整自己的內(nèi)容和策略,不斷擴(kuò)大受眾規(guī)模,提高品牌影響力。
本刊記者:《紐約時(shí)報(bào)》2012年2月的一篇專欄稱:“大數(shù)據(jù)時(shí)代已經(jīng)降臨,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析,而并非基于經(jīng)驗(yàn)和直覺……”一般認(rèn)為經(jīng)歷才會產(chǎn)生經(jīng)驗(yàn)和直覺,這一論述是否意味著在大數(shù)據(jù)時(shí)代,數(shù)據(jù)就是一切,經(jīng)歷在從業(yè)中是無足輕重的或居于次要地位?數(shù)據(jù)和經(jīng)歷在決策中的比值將出現(xiàn)什么現(xiàn)象?
陳昌鳳:大數(shù)據(jù)是世界的另一半,也許是較新的一半吧,但不是全部。經(jīng)驗(yàn)和因果關(guān)系,仍然是人類的寶貴財(cái)富;數(shù)據(jù)和相關(guān)關(guān)系,是一種思維的創(chuàng)新,但它也是建立在經(jīng)驗(yàn)和知識基礎(chǔ)上的判斷。兩者并非對立或獨(dú)立。
石長順:在美國有句話流傳極廣,這就是愛德華·戴明的名言:除了上帝,任何人都必須用數(shù)據(jù)來說話。這句話將數(shù)據(jù)與上帝并論。事實(shí)上,美國是一個(gè)崇尚數(shù)據(jù)、用數(shù)據(jù)說話的國度。從傳播學(xué)的誕生來看,許多經(jīng)典理論和學(xué)說,也是來源于經(jīng)驗(yàn)學(xué)派的量化分析。近年來,隨著大數(shù)據(jù)時(shí)代的來臨,“用數(shù)據(jù)決策”“用數(shù)據(jù)管理”“用數(shù)據(jù)創(chuàng)新”“用數(shù)據(jù)……”成為未來社會的助推器,但這并不排斥傳播者的經(jīng)歷、經(jīng)驗(yàn)對傳播的促進(jìn)作用。因?yàn)榻?jīng)歷實(shí)際上是人生的數(shù)據(jù)庫,并且是經(jīng)過人的長時(shí)間篩選、歸納、積累下來的活化數(shù)據(jù),能觸發(fā)人的靈感、智慧的數(shù)據(jù)。因此,二者互補(bǔ),不可偏廢。
鄧光和:數(shù)據(jù)并不是萬能的,一是數(shù)據(jù)反映的可能只是事物的表象,二是對同一數(shù)據(jù)也可能有不同的解讀,三是每個(gè)單位或個(gè)人的實(shí)際情況千差萬別。所以,唯數(shù)據(jù)論是沒有根據(jù)的。人們在長期從業(yè)經(jīng)歷中形成的經(jīng)驗(yàn)和直覺,仍然有著重要作用。
本刊記者:也有人質(zhì)疑,大數(shù)據(jù)是一個(gè)新機(jī)遇,但不是所有行業(yè)、所有人都有機(jī)會,有人才才有機(jī)會、有設(shè)備才有機(jī)會、有技術(shù)才有機(jī)會,這些條件對媒體來說都是新的課題、新的挑戰(zhàn),媒體將怎樣面對新時(shí)代?
陳昌鳳:打個(gè)比方:每個(gè)人的生活都有自己的哲學(xué),但他不一定是哲學(xué)家。未來每個(gè)人的生活,都幾乎與大數(shù)據(jù)相關(guān),但他不一定要直接使用或掌握大數(shù)據(jù)。當(dāng)你被說服到京東網(wǎng)買一架相機(jī)、到淘寶網(wǎng)買一件衣服時(shí),你知道他們是如何通過信息把你作為客戶瞄準(zhǔn)的嗎?大數(shù)據(jù)。大數(shù)據(jù)正在帶來政治、經(jīng)濟(jì)、文化等各方面的變化,生活在其中的個(gè)體能獨(dú)立其外嗎?但是,我們并非要把大家都變成精通或擁有大數(shù)據(jù)的人。大數(shù)據(jù)也并非由個(gè)人能掌握的資源,它是一種共享時(shí)代由公眾共同生產(chǎn)出來的產(chǎn)品,通常由少數(shù)大公司掌控。每個(gè)人幾乎都是貢獻(xiàn)者。
不過,有一點(diǎn)大致可以確定:未來一個(gè)人或機(jī)構(gòu)擁有信息,即數(shù)據(jù)的多少,確實(shí)決定了其獲取權(quán)力和財(cái)富的大小。
鄧光和:媒體人必須重視數(shù)據(jù),掌握分析運(yùn)用數(shù)據(jù)的能力:一是善于從各類數(shù)據(jù)中尋找具有重要傳播價(jià)值的信息資源;二是具備對海量信息進(jìn)行科學(xué)整合和深度加工的能力;三是密切關(guān)注受眾需求,重視受眾反饋,不斷增強(qiáng)傳播效果。
數(shù)據(jù)意識實(shí)際上就是受眾意識、市場意識、經(jīng)營意識。中國傳媒業(yè)面向市場經(jīng)營已經(jīng)30多年,電視收視率數(shù)據(jù)使用也有20年,傳媒人已經(jīng)具備了數(shù)據(jù)意識,但是,分析和運(yùn)用數(shù)據(jù)的實(shí)際能力卻還有待提高。
石長順:大數(shù)據(jù)時(shí)代對國家、企業(yè)、個(gè)體既是一種挑戰(zhàn),也是一種機(jī)遇,但這種機(jī)遇只留給那些有準(zhǔn)備、有識別能力、善于駕馭數(shù)據(jù)的人。這種機(jī)遇甚至可能改變傳媒人的角色,未來將會出現(xiàn)新的傳媒職業(yè),即“篩選者”“數(shù)據(jù)分析者”角色。
本刊記者:大數(shù)據(jù)開發(fā)在首創(chuàng)地美國也只是剛剛開始,其標(biāo)志是2011年的《規(guī)則數(shù)字化未來》報(bào)告和2012年3月美國政府發(fā)布的《大數(shù)據(jù)研究與發(fā)展倡議》。
就大數(shù)據(jù)來說,我國還在路上,據(jù)統(tǒng)計(jì),我國數(shù)字化的數(shù)據(jù)資源遠(yuǎn)遠(yuǎn)低于歐美,每年新增數(shù)據(jù)量僅為美國的7%、歐洲的12%;就已有的有限數(shù)據(jù)資源來說,還存在標(biāo)準(zhǔn)化、準(zhǔn)確性、完整性低及利用率不高等情況。也有一組名為“互聯(lián)網(wǎng)上的一天”的數(shù)據(jù)顯示:一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當(dāng)于美國兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子200萬個(gè)(相當(dāng)于《時(shí)代》雜志770年的文字量),賣出的手機(jī)為37.8萬臺,高于全球每天出生的嬰兒數(shù)量37.1萬。這一系列驚人的數(shù)據(jù),都是新媒體產(chǎn)生的。大數(shù)據(jù)時(shí)代的媒體轉(zhuǎn)型和發(fā)展,需要結(jié)合自身的特色,走一條符合傳播規(guī)律、符合自身實(shí)際、符合受眾需求的發(fā)展之路。您認(rèn)為我國進(jìn)入大數(shù)據(jù)時(shí)代的條件是否已成熟?我們距離大數(shù)據(jù)時(shí)代還有多遠(yuǎn)?
陳昌鳳:中國在大數(shù)據(jù)的認(rèn)知方面,大概落后于美國四五年;實(shí)踐方面,落后更多。路遙遙。
柯惠新:大數(shù)據(jù)的分析方法、技術(shù)和軟件等目前尚不能適應(yīng)需要,還有待深入研究和開發(fā)。
對大數(shù)據(jù)的分析需掌握多方面的知識與方法,一些相應(yīng)的技術(shù)和軟件都得配套。例如數(shù)據(jù)如何分類、提取、轉(zhuǎn)化、分析、呈現(xiàn);如何分析非結(jié)構(gòu)化的數(shù)據(jù),如社交媒體上的海量文字、圖片;還有如何分析視頻、音頻數(shù)據(jù)等等。
我的一位研究生畢業(yè)之后一直在某媒體研究公司工作,該公司最近推出了一個(gè)“網(wǎng)絡(luò)影響力”的收視測評?!斑@個(gè)東西如果擴(kuò)展出去的話,很多電視臺都會很感興趣”,最近我從負(fù)責(zé)進(jìn)行這個(gè)測評的畢業(yè)生那里了解到其在分析相關(guān)大數(shù)據(jù)時(shí)的感受,“實(shí)際上大都是手工分析的,非常辛苦,因?yàn)楝F(xiàn)有的文本分析軟件根本不好用”。
由此筆者聯(lián)想到兩年前所主持的一個(gè)關(guān)于《重大事件輿情監(jiān)測指標(biāo)體系與預(yù)警模型》的“211課題”,雖得到了澳門“易研網(wǎng)絡(luò)研究實(shí)驗(yàn)室(ERS, e-Research Lab)”的大力幫助,得到了所需的大數(shù)據(jù)(海量帖子等)和文本分析軟件,但對于帖子傾向性等方面的分析,最終還是不得不通過傳統(tǒng)的內(nèi)容分析方法在人工編碼后進(jìn)行。
鄧光和:從某種意義上講,大數(shù)據(jù)是信息高度發(fā)達(dá)社會的需要,也是市場經(jīng)濟(jì)的必然要求。我國早已進(jìn)入市場經(jīng)濟(jì)和信息社會,但市場經(jīng)濟(jì)還不完善,數(shù)據(jù)市場發(fā)育程度不高,對數(shù)據(jù)市場的規(guī)范管理還不到位,數(shù)據(jù)的準(zhǔn)確性、公信度還有待提高。以電視收視率調(diào)查為例,國內(nèi)收視率調(diào)查市場造假等亂象較突出。因此,如果說現(xiàn)在已進(jìn)入大數(shù)據(jù)時(shí)代可能還不夠確切。但大數(shù)據(jù)時(shí)代已迎面向我們走來,我們已經(jīng)能夠感受到這個(gè)新時(shí)代的呼吸。
王寧:大數(shù)據(jù)首先強(qiáng)調(diào)的是“大”,了解數(shù)據(jù)分析一般原理和方法,或有過一些市場、社會、媒體研究經(jīng)歷的人,都能懂得或理解,其實(shí)數(shù)據(jù)并不一定是越多越好,關(guān)鍵是如何借助相關(guān)的理論,針對研究問題去設(shè)計(jì)、分析和應(yīng)用。
針對設(shè)計(jì)良好的“小數(shù)據(jù)”,如有代表性的樣本數(shù)據(jù),小的切入點(diǎn)、小而具體的研究問題、科學(xué)的研究框架、合理的分析和適當(dāng)?shù)慕庾x等,也能作出深入而有用的分析。
本刊記者:從硅谷到北京,大數(shù)據(jù)的話題被傳播,一個(gè)大規(guī)模生產(chǎn)、分享和應(yīng)用數(shù)據(jù)的時(shí)代正在開啟,大數(shù)據(jù)的真實(shí)價(jià)值就像浮在海洋上的冰,我們能看到的只是冰山一角。2013年“兩會”上,有代表提出構(gòu)建“數(shù)據(jù)中國”的建議,認(rèn)為數(shù)據(jù)將成為國家競爭的前沿、企業(yè)創(chuàng)新的來源。數(shù)據(jù)的占有和使用會不會形成新一輪競爭?
柯惠新:大數(shù)據(jù)的質(zhì)量參差不齊,需慎重使用。不同公司、機(jī)構(gòu)所掌握的大數(shù)據(jù)在質(zhì)量方面可能會有很大的差異。在“全球化下的社交媒體與數(shù)字網(wǎng)絡(luò):2012中國網(wǎng)絡(luò)傳播學(xué)年會澳門國際會議”的專題討論——“基于大數(shù)據(jù)挖掘的行為和方法”中,一位演講嘉賓在探討如何充分挖掘互聯(lián)網(wǎng)社區(qū)大數(shù)據(jù)社會化營銷的效果時(shí),提到了“僵尸”和“水軍”問題,估計(jì)“有一半網(wǎng)民的信息是真實(shí)的”。也就是說,可能有一半的信息是不真實(shí)的。
帶著這個(gè)疑問,我曾請教過一位幾年前曾經(jīng)在某網(wǎng)站工作過的企業(yè)高管,是否“有一半網(wǎng)民的信息是不真實(shí)的”?這位先生堅(jiān)定地說:“100%都是假的!”
雖理解他是在強(qiáng)調(diào)問題的嚴(yán)重程度,應(yīng)不會是“100%都是假的”,但還是很感意外,盡管目前由于沒有實(shí)證研究的數(shù)據(jù),無法作出準(zhǔn)確的判斷,但根據(jù)這幾位業(yè)內(nèi)專家的判斷,起碼網(wǎng)絡(luò)上的大數(shù)據(jù)質(zhì)量堪憂。
此外,拋開網(wǎng)絡(luò)上大數(shù)據(jù)的真實(shí)性問題,借助大多沒有細(xì)節(jié)和深度的大數(shù)據(jù),如網(wǎng)上的評論,能否分析得到比較有價(jià)值的東西?也使一些想使用大數(shù)據(jù)的研究者止步不前。
陳昌鳳:“數(shù)據(jù)中國”這樣的話不是過于超前,就是罔顧中國現(xiàn)實(shí)。大數(shù)據(jù)并非一場全民運(yùn)動,它是由有技術(shù)優(yōu)勢的大型公司和創(chuàng)新精英挖掘出來的。
鄧光和:信息是人們用來消除對周圍世界的未知性和不確定性,增強(qiáng)預(yù)見性和安全感的重要手段。市場經(jīng)濟(jì)條件下,市場的不穩(wěn)定性和風(fēng)險(xiǎn)性進(jìn)一步強(qiáng)化了人們獲取信息的內(nèi)在要求。信息在社會生產(chǎn)生活中的價(jià)值進(jìn)一步提升。需求就是市場,采集、整理、分類、出售各方面的信息數(shù)據(jù),自然而然成為一個(gè)有利可圖、具有廣闊市場前景的產(chǎn)業(yè)。事實(shí)上,人口調(diào)查、商品零售調(diào)查、廣播電視收聽收視率調(diào)查等,就是專門的數(shù)據(jù)生產(chǎn)。在中國,隨著市場經(jīng)濟(jì)的深入發(fā)展,對數(shù)據(jù)的需求量會越來越大,這必然推動數(shù)據(jù)產(chǎn)業(yè)的大發(fā)展。數(shù)據(jù)產(chǎn)業(yè)屬于信息產(chǎn)業(yè),不僅空間巨大,且很多數(shù)據(jù)關(guān)系到國計(jì)民生,甚至關(guān)系到國家信息安全??梢灶A(yù)計(jì),未來中國數(shù)據(jù)產(chǎn)業(yè)會形成一輪新的競爭,對數(shù)據(jù)生產(chǎn)的管理和規(guī)范也將逐步走向成熟。
本刊記者:隨著大數(shù)據(jù)時(shí)代的來臨,媒體人將受到前所未有的挑戰(zhàn)。西方媒體越來越重視數(shù)據(jù)挖掘,認(rèn)為數(shù)據(jù)挖掘的新聞往往比傳統(tǒng)新聞報(bào)道更有力度。著名學(xué)者彭蘭在為本刊的撰文中也指出:“過去只有受過專門訓(xùn)練的人才能承擔(dān)的新聞報(bào)道工作,開始部分地轉(zhuǎn)移到計(jì)算機(jī)身上?!笔欠窨梢赃@樣猜想:記者的職業(yè)即將消失,或者說大數(shù)據(jù)時(shí)代記者的職能要轉(zhuǎn)型?
朱川燕:新聞工作者的職業(yè)不會因大數(shù)據(jù)時(shí)代的來臨而消失,但新聞工作者的技能和使用的工具需要升級換代,從這個(gè)意義上講,新聞工作者的職能可能會轉(zhuǎn)型。
對大數(shù)據(jù)時(shí)代新聞工作者的技能發(fā)展可做簡要總結(jié)。一、如何從數(shù)據(jù)中發(fā)現(xiàn)和挖掘新聞。大數(shù)據(jù)時(shí)代的新聞工作者需更多依賴數(shù)據(jù)庫和數(shù)據(jù)分析來發(fā)現(xiàn)新聞、報(bào)道新聞。但大數(shù)據(jù)時(shí)代新聞工作者傳播新聞信息的根本職能不會變,而新聞工作者所應(yīng)遵守的新聞標(biāo)準(zhǔn)和所應(yīng)具備的新聞敏感也不會變。大數(shù)據(jù)時(shí)代產(chǎn)生的海量數(shù)據(jù)并不都適合媒體報(bào)道,正如每日正在發(fā)生的海量事件中只有少量成為新聞事件一樣。因此,大數(shù)據(jù)時(shí)代的新聞工作者更要善于從尚未引起人們注意的冰山一角挖掘出隱藏的新聞。這對新聞工作者和新聞事業(yè)都是一個(gè)新的挑戰(zhàn)。二、如何將數(shù)據(jù)可視化。除發(fā)現(xiàn)新聞以外,大數(shù)據(jù)時(shí)代新聞事業(yè)所面臨的另一個(gè)重要挑戰(zhàn),是如何用數(shù)據(jù)講故事。在傳統(tǒng)的新聞寫作課上老師會傳授給學(xué)生一條不成文的規(guī)則,新聞導(dǎo)語中最好不要有數(shù)字,因數(shù)字抽象,受教育程度低的讀者或聽眾觀眾不好理解。而大數(shù)據(jù)時(shí)代中通過數(shù)據(jù)挖掘產(chǎn)生的新聞報(bào)道的主要事實(shí)就是數(shù)據(jù)。如何解決數(shù)字抽象枯燥不好理解的難題呢?這就要求新聞工作者不僅要善于從數(shù)據(jù)中挖掘新聞,還要善于用數(shù)據(jù)講故事。三、如何保證數(shù)據(jù)新聞的真實(shí)性和準(zhǔn)確性。這要求新聞工作者不僅要有新聞鼻而且要有統(tǒng)計(jì)專家的火眼金睛,能夠洞悉具有新聞價(jià)值的大數(shù)據(jù)來源是否可靠、數(shù)據(jù)收集手段是否科學(xué)、數(shù)據(jù)是否有代表性和可比性。舉個(gè)例子,如果某位記者拿到了教育部部屬大學(xué)的學(xué)生最近5年的就業(yè)統(tǒng)計(jì)數(shù)據(jù),那么該記者在寫稿前需冷靜審核這些數(shù)據(jù),檢查各大學(xué)對就業(yè)的定義是否一致、采用的統(tǒng)計(jì)指標(biāo)是否一致、歷年的統(tǒng)計(jì)指標(biāo)和定義是否一致。只有在這些指標(biāo)和定義都一致的情況下,才能夠進(jìn)行大學(xué)之間的橫向比較或不同年份之間的縱向趨勢比較。而負(fù)責(zé)審稿的編輯,也同樣需要具備統(tǒng)計(jì)知識,以保證數(shù)據(jù)新聞的數(shù)據(jù)來源、數(shù)據(jù)分析方法和數(shù)據(jù)呈現(xiàn)方式都符合真實(shí)性和準(zhǔn)確性的原則。
石長順:與其說大數(shù)據(jù)時(shí)代給新聞業(yè)帶來了挑戰(zhàn),倒不如說是帶來了更大的機(jī)遇。因?yàn)閿?shù)據(jù)就是一個(gè)巨大的信息庫,這種信息與一般新聞報(bào)道中的信息有所不同,后者是一種事實(shí)信息,僅供客觀的報(bào)道與傳播,而前者是一種數(shù)據(jù)信息,通過挖掘分析,不但可作為現(xiàn)在的事實(shí)報(bào)道,還可作為未來的預(yù)測報(bào)道,甚至可通過數(shù)據(jù)洞察社會問題,影響公眾參與公共事務(wù),影響公共政策決策,發(fā)揮建設(shè)者作用。
鄧光和:大數(shù)據(jù)時(shí)代,新聞業(yè)既有挑戰(zhàn),更有機(jī)遇。挑戰(zhàn)在于在媒體高度發(fā)達(dá)的情況下,傳統(tǒng)的“搶頭條”“爭獨(dú)家”的新聞競爭模式難以為繼。新聞媒體須依靠自身高素質(zhì)的人才隊(duì)伍,充分利用數(shù)據(jù)資源,從海量信息中尋找、整合、加工新聞信息,滿足受眾需求。機(jī)遇在于可供媒體選擇使用的信息資源更加豐富,媒體對受眾結(jié)構(gòu)的了解更加方便透徹,對自身傳播效果的評估更加全面準(zhǔn)確。大數(shù)據(jù)時(shí)代,記者職業(yè)顯然不會消失,但記者的思維方式和工作方式需要及時(shí)調(diào)整轉(zhuǎn)型,更加重視對數(shù)據(jù)的分析使用,更加重視對信息的深度整合和加工。
陳昌鳳:記者消失了,誰去挖掘數(shù)據(jù)呢?
其實(shí)記者的部分采集信息的手段會改變,但記者仍然是在采集信息、解讀信息,因此職能并不真的轉(zhuǎn)變。但長期下來,信息的結(jié)構(gòu)和內(nèi)涵會發(fā)生一定程度的改變。
本刊記者:Narrative聯(lián)合創(chuàng)始人兼首席技術(shù)官克里·哈蒙德認(rèn)為未來機(jī)器生成的新聞將占到媒體新聞的90%,是否意味著新聞要機(jī)械化、復(fù)制化?未來大批量產(chǎn)生的新聞是否會更刻板?
王寧:長久以來,分析、整理和理解數(shù)據(jù),都是專業(yè)人士,如統(tǒng)計(jì)學(xué)家、人口學(xué)家、經(jīng)濟(jì)學(xué)家等,才會涉足的領(lǐng)域。而通過將數(shù)據(jù)可視化,可大大簡化數(shù)據(jù)的可讀性。隨著數(shù)據(jù)可視化技術(shù)的蓬勃發(fā)展,越來越多的新聞從業(yè)者開始在報(bào)道中使用這項(xiàng)技術(shù)。2010年,拉斯維加斯太陽報(bào)(Las Vegas Sun)發(fā)表了《杜絕事故》(Do No Harm)的報(bào)道,在這個(gè)專題報(bào)道中,記者分析了2008年至2009年間,拉斯維加斯地區(qū)的290萬條醫(yī)療記錄,從中梳理出3689件可避免的傷亡、感染或手術(shù)事故。為幫助讀者理解,記者把這個(gè)龐大的數(shù)據(jù)庫轉(zhuǎn)化成簡單易明的互動圖表,讓即便是完全沒有任何數(shù)據(jù)分析基礎(chǔ)的普通民眾,也能輕松解讀,甚至利用圖表的互動功能對數(shù)據(jù)作進(jìn)一步的考察。如讀者可按照醫(yī)院可視化,讓患者了解各醫(yī)院的運(yùn)作狀況;也可將傷亡按照事故性質(zhì)可視化,讓患者了解不同事故的普遍程度,所有這些都只需讀者點(diǎn)擊頁面上方的兩個(gè)小下拉菜單即可輕松完成。這個(gè)報(bào)道產(chǎn)生了重要的社會影響,直接促成內(nèi)華達(dá)州的立法機(jī)構(gòu)通過了5條關(guān)于醫(yī)療系統(tǒng)運(yùn)作公開化的法案。
陳昌鳳:不知克里說此話的語境是什么,機(jī)器生成的信息是一種編輯手段、組織信息的方式,還是指信息的來源?總得有人把信息從現(xiàn)實(shí)中移到機(jī)器上吧?復(fù)制的新聞現(xiàn)在就有,不是非要機(jī)器時(shí)代,但它的價(jià)值有多大?
想要有質(zhì)量的信息,判斷力是必不可少的,即使是機(jī)器操作,也是要人設(shè)置了程序,才能判斷出哪段文字、哪張圖片是有價(jià)值的。
鄧光和:大數(shù)據(jù)時(shí)代,數(shù)據(jù)是媒體可資利用的新聞素材,但不是新聞本身。媒體從業(yè)者可通過計(jì)算機(jī)使用、分析、處理各種數(shù)據(jù),制作新聞作品。新聞作品包含新聞工作者的勞動創(chuàng)造,體現(xiàn)了媒體的傳播意圖,這是任何機(jī)器無法代替的。即計(jì)算機(jī)不可能代替新聞工作者批量生產(chǎn)新聞作品。新聞強(qiáng)調(diào)新鮮性,是易碎品,復(fù)制的新聞不是新聞。
本刊記者:大數(shù)據(jù)時(shí)代似乎對新聞行業(yè)影響更直接,對于圖書出版、期刊出版,其影響有多大?學(xué)術(shù)圖書、小說、散文在大數(shù)據(jù)時(shí)代的出版將是怎樣的模式?
鄧光和:大數(shù)據(jù)是社會方方面面的數(shù)據(jù),也包含圖書、期刊方面的數(shù)據(jù),故圖書出版、期刊出版同樣會受到大數(shù)據(jù)時(shí)代的影響。圖書、期刊及其內(nèi)容、形式、讀者、銷量等數(shù)據(jù),顯然是圖書、期刊出版管理者在經(jīng)營管理過程中重要的決策依據(jù)。
陳昌鳳:從目前的情形看,大數(shù)據(jù)對出版的影響大于對新聞的影響。Google從數(shù)字化轉(zhuǎn)向數(shù)據(jù)化的實(shí)踐就是例證。
本刊記者:受眾分析是媒體的基本工作,在大數(shù)據(jù)時(shí)代,抽樣調(diào)查的有限性是否成為歷史?大數(shù)據(jù)時(shí)代受眾的整體分析、個(gè)性化分析將成為可能,個(gè)性化信息服務(wù)也容易實(shí)現(xiàn),是否意味著每個(gè)人都可收到適合的信息,不再為海量信息、垃圾信息而煩惱?也有人認(rèn)為大數(shù)據(jù)的個(gè)性化分析也會包括人們的行為、位置、喜好,甚至心理、生理數(shù)據(jù)等,也會給人造成很多隱憂。大數(shù)據(jù)到底是一個(gè)寶藏,還是一個(gè)隱憂?我們?nèi)绾芜M(jìn)入一個(gè)安全的數(shù)據(jù)共享時(shí)代?
石長順:對這個(gè)問題的擔(dān)憂不能簡單用是與否回答。先講一個(gè)故事。美國20世紀(jì)初期有一本暢銷雜志《文學(xué)文摘》,因其準(zhǔn)確地預(yù)測了1920、1924、1928、1932年4屆總統(tǒng)大選的結(jié)果。但在1936年第32任美國總統(tǒng)羅斯福謀求連任與蘭登的競選中,該雜志對240萬普通民眾進(jìn)行了調(diào)查,把“寶”壓在了蘭登身上,而蓋洛普研究所則只抽樣了5000人進(jìn)行調(diào)查,宣布羅斯福會勝出。結(jié)果《文學(xué)文摘》失敗,導(dǎo)致破產(chǎn)。此后,在18次美國總統(tǒng)競選中,蓋洛普民調(diào)成功預(yù)測了16次,這說明科學(xué)的抽樣方法并不遜色于大面積訪談的大數(shù)據(jù)。當(dāng)然,也不能以此而否定大數(shù)據(jù)時(shí)代整體分析和個(gè)性化分析的準(zhǔn)確率,關(guān)鍵還在于掌握大數(shù)據(jù)的人如何科學(xué)地運(yùn)用大數(shù)據(jù)。
柯惠新:大數(shù)據(jù)對傳統(tǒng)的抽樣調(diào)查提出了挑戰(zhàn),但并不能相互替代。
傳統(tǒng)抽樣調(diào)查方法的理念是希望通過調(diào)查分析一個(gè)具有代表性的樣本,進(jìn)而對我們感興趣的研究總體進(jìn)行推斷。隨著大數(shù)據(jù)的出現(xiàn),有些學(xué)者認(rèn)為,既然可以直接分析所有的,也就是總體的數(shù)據(jù),自然就不再需要抽樣了。維克托·邁爾-舍恩伯格和肯尼思·庫克耶在其著作《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書中,甚至激動地宣告:“統(tǒng)計(jì)抽樣其實(shí)只是為在技術(shù)受限的特定時(shí)期,解決當(dāng)時(shí)存在的一些特定問題而產(chǎn)生的……在大數(shù)據(jù)時(shí)代進(jìn)行抽樣分析就像在汽車時(shí)代騎馬……慢慢地,我們會完全拋棄樣本分析。”
但對具體的研究者和具體的研究項(xiàng)目來說,很難做到真正意義上的擁有和分析“所有的數(shù)據(jù)”。當(dāng)研究者抓取新浪微博的數(shù)據(jù)時(shí),也許可獲取所有公開的關(guān)系和博文,但無法獲取那些“悄悄關(guān)注”的關(guān)系,也無法讀取有隱私設(shè)置的博文,如密友微博。又比如,由于分析技術(shù)和時(shí)間精力的限制,研究者選擇只分析所有文本格式的微博內(nèi)容,而忽略其他格式,如視頻、圖片等的數(shù)據(jù)。在以上這兩個(gè)例子里,研究者都只采集和分析了一部分的數(shù)據(jù),無論這是一個(gè)主動的還是被動的選擇,都可看做是一個(gè)非隨機(jī)的抽樣過程,它得到的數(shù)據(jù)的代表性很可能并不如一個(gè)設(shè)計(jì)良好的隨機(jī)樣本。也就是說,研究者能夠收集或分析的,常常只是一部分?jǐn)?shù)據(jù),無論這一部分?jǐn)?shù)據(jù)是多么龐大,研究者必須明白:擁有海量的數(shù)據(jù)不等于擁有所有的數(shù)據(jù)。
陳昌鳳:進(jìn)入互聯(lián)網(wǎng)時(shí)代,就進(jìn)入了沒有安全的時(shí)代。創(chuàng)新是需要代價(jià)的,互聯(lián)網(wǎng)的歷史,其實(shí)就是冒險(xiǎn)的歷史。
大數(shù)據(jù)時(shí)代的個(gè)性化,并不意味著信息進(jìn)入單一時(shí)代,它提供的選擇更多了,突出的信息更明確了,服務(wù)更個(gè)性化了。你的信息需求本身,就有成百上千個(gè)相關(guān)的鏈接信息。前工業(yè)時(shí)代的人是心安理得進(jìn)入工業(yè)社會的嗎?工業(yè)社會的人是安全無憂地進(jìn)入信息時(shí)代的嗎?人類的發(fā)展過程中,從來沒有任何東西能保證一切都安全。不開放的心態(tài),才是最大的危險(xiǎn),了解它、認(rèn)識它、適應(yīng)它、利用它,并且改造它,我們才能走下去。
鄧光和:任何事物都有兩面性,不能因噎廢食。面對大數(shù)據(jù)可能帶來的問題,國家須加強(qiáng)立法,通過法律法規(guī)規(guī)范數(shù)據(jù)生產(chǎn)、出售、傳播等各主體的行為,切實(shí)保障國家、社會利益,保障個(gè)人和組織的合法權(quán)利。
本刊記者:大數(shù)據(jù)時(shí)代的種種變化告訴我們,專業(yè)媒體需要重新尋找自身的位置和自身的價(jià)值,而新的定位、新的價(jià)值必將通過業(yè)務(wù)形態(tài)的變革體現(xiàn),未來媒體的主要調(diào)整方向會體現(xiàn)在哪些方面?
石長順:一是加快確立大數(shù)據(jù)媒體戰(zhàn)略,爭奪世界全媒體傳播前沿。二是加快建立中國傳媒數(shù)據(jù)倉庫,在全國推行“最小數(shù)據(jù)集”的概念,并從國家層面強(qiáng)制收集某個(gè)媒體的數(shù)據(jù)指標(biāo),在國家信息與文化安全的前提下,更好地管理和共享數(shù)據(jù)資源。三是加快實(shí)現(xiàn)傳媒業(yè)的轉(zhuǎn)型。從新聞采訪者向數(shù)據(jù)挖掘者轉(zhuǎn)型,從事實(shí)報(bào)道者向未來預(yù)測者轉(zhuǎn)變,從數(shù)據(jù)識別者向數(shù)據(jù)可視化轉(zhuǎn)化。
朱川燕:大數(shù)據(jù)時(shí)代所面臨的諸多挑戰(zhàn)要求新聞工作者具有綜合性技能。除因媒體的發(fā)展要求新聞工作者具備跨媒體平臺工作的專業(yè)技能外,從事數(shù)據(jù)新聞的記者還要具備一定的統(tǒng)計(jì)技能和比較高的數(shù)據(jù)軟件和圖表軟件應(yīng)用技能。如何培養(yǎng)優(yōu)秀的數(shù)據(jù)新聞記者成為國內(nèi)外媒體關(guān)注的一個(gè)普遍問題。是培訓(xùn)新聞記者使其具備統(tǒng)計(jì)技能和軟件應(yīng)用技能,還是培訓(xùn)數(shù)據(jù)分析能力強(qiáng)的研究工作者或信息圖表設(shè)計(jì)工作者使其具備新聞報(bào)道的技能?國外在數(shù)據(jù)新聞報(bào)道上領(lǐng)先的媒體如《紐約時(shí)報(bào)》《衛(wèi)報(bào)》、英國廣播公司等兩種途徑都有采用。不過,在最近一次英美兩國數(shù)據(jù)新聞專業(yè)工作者組織的視頻會議上,與會者認(rèn)為從新聞記者中培養(yǎng)出來的數(shù)據(jù)新聞從業(yè)者更容易做出故事性強(qiáng)的吸引人的數(shù)據(jù)新聞。
柯惠新:國際媒體研究機(jī)構(gòu)對于是否可以提供、如何提供多屏、全媒體的收視數(shù)據(jù),還在探討和測試階段,還沒有行業(yè)認(rèn)可的統(tǒng)一做法和標(biāo)準(zhǔn)。
新媒體的快速發(fā)展和市場的需求,促使我們不能再等待猶豫,要盡快開展大數(shù)據(jù)的相關(guān)研究和應(yīng)用。但這不是一件輕而易舉的事情,不要炒作,不要將不成熟的東西急于推向市場。
期待解決的行業(yè)問題:
如何保證或檢驗(yàn)大數(shù)據(jù)的真實(shí)性?如何界定大數(shù)據(jù)擁有方與研究方的關(guān)系?如何保證大數(shù)據(jù)擁有方的中立性?
如何界定有關(guān)大數(shù)據(jù)的“四方”問題。傳統(tǒng)的市場、社會研究國際準(zhǔn)則(ESOMAR CODE)和我國前年出臺的國家標(biāo)準(zhǔn)《市場、民意和社會調(diào)查 服務(wù)要求》及《市場、民意和社會調(diào)查 術(shù)語標(biāo)準(zhǔn)”》中,都僅涉及三方:數(shù)據(jù)提供方,如調(diào)查研究機(jī)構(gòu);數(shù)據(jù)使用方、客戶方,如電視臺、廣告公司等;被調(diào)查方,如某項(xiàng)研究中的調(diào)查對象。但在大數(shù)據(jù)時(shí)代,出現(xiàn)了擁有大數(shù)據(jù)資源的第四方,如網(wǎng)絡(luò)運(yùn)營商。如何界定四者的關(guān)系、權(quán)利和義務(wù),對保證研究的中立性和客觀性至關(guān)重要。