李陽冉
大數(shù)據(jù)環(huán)境下新聞編輯模式探究
李陽冉
隨著數(shù)字技術突飛猛進的發(fā)展,大數(shù)據(jù)滲透社會生活的各方面,新聞業(yè)態(tài)也悄然發(fā)生改變,一種新興的新聞生產(chǎn)方式——數(shù)據(jù)新聞應運而生。基于這種新興的數(shù)據(jù)新聞運作模式,新聞編輯的工作模式也發(fā)生了很大改變,不再只是對稿件進行后期選擇、加工,而是變被動為主動,從海量的數(shù)據(jù)中提取有價值的信息進行搜集整理、獨立編發(fā)新聞、將新聞可視化,為受眾提供科學闡釋。
數(shù)據(jù)新聞;編輯模式;新聞可視化
[作 者]李陽冉,河南大學新聞與傳播學院碩士研究生。
隨著大數(shù)據(jù)在新聞編輯出版領域的廣泛運用,新聞生產(chǎn)方式也悄然發(fā)生著變化。以美國為例,2014年最令行業(yè)內(nèi)外矚目的標志性事件是上半年幾大專業(yè)化數(shù)據(jù)新聞平臺的相繼建立。從《紐約時報》轉(zhuǎn)投獨立門戶的Nate Silver在新東家ESPN的支持下建立了FiveThirtyEight.com,專注政治選舉、體育賽事預測;前《華盛頓郵報》編輯在Vox Media旗下成立了vox.com,為公眾提供簡潔明了能看懂的新聞;《紐約時報》新欄目Upshot整合上線,意在滿足時報讀者對嚴肅準確的數(shù)據(jù)新聞的需求?!盎ヂ?lián)網(wǎng)之父”蒂姆·伯納斯·李曾對新聞未來發(fā)展方面做出設想:“新聞的未來,是分析數(shù)據(jù)?!本C觀近年來新聞業(yè)發(fā)展的現(xiàn)狀,新聞的數(shù)據(jù)化、可視化越來越受人們關注并作為一種全新的新聞生產(chǎn)模式能夠科學有效地對新聞事件做出預判。
數(shù)據(jù)新聞(data-journalism),又稱數(shù)據(jù)驅(qū)動新聞(data-driven journalism),指的是對廣泛龐雜的數(shù)據(jù)進行挖掘、分析、發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的錯綜復雜的相關關系,以可視化的方式進行新聞報道。它涉及了傳統(tǒng)的新聞報道、數(shù)據(jù)挖掘、數(shù)據(jù)分析以及交互可視化等多個領域。由歐洲新聞學中心(European Joumalism Centre)和開放知識基金會(Open Knowledge Foundation)共同編寫《數(shù)據(jù)新聞學手冊》認為:“數(shù)據(jù)新聞把傳統(tǒng)的新聞敏感性和有說服力的敘事能力,與海量的數(shù)字信息相結合,創(chuàng)造了新的可能。”[1]簡單來說,數(shù)據(jù)新聞是在對數(shù)據(jù)集的收集、過濾、整理、分析的基礎上,發(fā)掘數(shù)據(jù)關系,以此發(fā)現(xiàn)有價值的新聞主題,并以可視化的方式呈現(xiàn)。
“醫(yī)保解密”是美國《華爾街日報》所做的一系列數(shù)據(jù)驅(qū)動的調(diào)查報道,內(nèi)容有關美國信息透明度極低的醫(yī)保系統(tǒng):6000億美金的醫(yī)保賬單是如何被花出去的?這一系列報道最終使得美國政府被迫于2014年4月首次公開了自1979年以來一直保密的重要醫(yī)保數(shù)據(jù),《華爾街日報》還在數(shù)據(jù)公開后繼續(xù)跟進一系列全面調(diào)查,分析和披露醫(yī)保體系如何濫用納稅人的錢。《華爾街日報》利用這些新公布的數(shù)據(jù),勾勒出醫(yī)療與貪婪在美國醫(yī)保體系中的勾結,美國納稅人每年至少掏出600億美金為偽造的醫(yī)保款項買單。“醫(yī)療解密”系列并非簡單呈現(xiàn)所獲得的數(shù)據(jù),而是由一個調(diào)查記者和數(shù)據(jù)專家所組成的團隊分析和搞懂這些數(shù)字背后的聯(lián)系,并制作了一系列互動圖和表格,條理清晰,有大量細節(jié)呈現(xiàn)。
《華爾街日報》的整套數(shù)據(jù)由兩部分組成:一部分是政府公開的數(shù)據(jù)表格,總共包含大概1000萬條記錄;另一部分則是政府公開信息前,由《華爾街日報》向CMS花錢申請的數(shù)據(jù),多達幾十億條記錄,其中有過去六年多里大量記賬人每一條賬目的細節(jié)。為了確保工作內(nèi)容的可重復性,數(shù)據(jù)記者們通常用R寫代碼來進行分析。他們利用了大量分析工具研究這些數(shù)據(jù),包括線性回歸、邏輯回歸、主成分分析、K均值算法和多種期望最大化算法?!度A爾街日報》的交互圖表團隊在數(shù)據(jù)被公開當天也同時發(fā)布了一個可供搜索的醫(yī)保供應商數(shù)據(jù)庫。隨后的幾周乃至幾個月時間里,團隊不斷在該數(shù)據(jù)庫上添加新的功能和深度,并最終將這個項目叫作“醫(yī)保解密:數(shù)字背后”。這個交互現(xiàn)在是“醫(yī)保解密”系列報道的封面,它呈現(xiàn)了88萬醫(yī)保系統(tǒng)中的醫(yī)生和供應商的信息,讓任何人都能很容易查到每一地理位置和專業(yè)科室中的最大受益人。
根據(jù)《華爾街日報》的新聞運作模式可歸納出數(shù)據(jù)新聞具有以服務公眾利益為出發(fā)點,以公開的數(shù)據(jù)為基礎,運用專業(yè)的軟件程序?qū)?shù)據(jù)進行分類處理,對宏觀抽象的數(shù)據(jù)背后隱藏的新聞信息進行挖掘,以形象互動的可視化方式呈現(xiàn)新聞的特點,而這對于傳統(tǒng)新聞報道是一種全新的顛覆,也為數(shù)字化浪潮沖擊下的新聞業(yè)帶來了活力。
與傳統(tǒng)新聞報道方式相比,數(shù)據(jù)新聞的出現(xiàn)不僅改變了新聞生產(chǎn)與傳播的方式,而且對編輯工作產(chǎn)生了深遠影響。
(一)編輯角色發(fā)生改變,由被動選擇加工到主動獨立編發(fā)新聞
傳統(tǒng)的新聞編輯是以滿足受眾的需要的出發(fā)點,以他人的新聞作品為工作對象,按照媒體的編輯原則,對新聞信息進行選擇、加工、評價、傳播,協(xié)作組織版面并根據(jù)受眾的反饋意見不斷改進新聞工作。但隨著大數(shù)據(jù)時代的到來,信息陡增且信源廣泛多樣,面對這種態(tài)勢,如何對信息進行采集、對數(shù)據(jù)進行深層次開發(fā),對有價值的新聞信息進行分析整合、對新聞事件做出準確科學的預判,是新聞編輯所要掌握的基本技能。數(shù)據(jù)新聞的出現(xiàn)使得新聞編輯的角色地位發(fā)生改變?!霸跀?shù)據(jù)新聞運作模式中,編輯工作可以變被動為主動,編輯在數(shù)據(jù)搜集和加工的基礎上可以獨立編發(fā)新聞,可以為受眾提供基于數(shù)據(jù)分析的科學洞見和內(nèi)容闡釋?!盵2]
(二)用數(shù)據(jù)講述新聞事實,將新聞可視化呈現(xiàn)
在傳統(tǒng)的新聞報道中,數(shù)據(jù)只是作為文本的輔助,為報道文章提供理論支撐。但近些年,隨著互聯(lián)網(wǎng)技術的革新,“大數(shù)據(jù)”的概念越來越受人們關注,運用“大數(shù)據(jù)”分析社會現(xiàn)象,利用數(shù)據(jù)信息預測事態(tài)發(fā)展趨向的受眾意愿也越來越強烈。與此同時,受眾對數(shù)據(jù)的理解和運用有了更多且更為復雜的要求,這種要求最終帶來了新聞業(yè)對海量復雜數(shù)據(jù)深入挖掘并對數(shù)據(jù)可視化敘述的大爆發(fā)。
數(shù)據(jù)可視化是指以圖形、圖像、地圖、動畫等更為生動、易為理解的方式來展現(xiàn)數(shù)據(jù)的大小,詮釋數(shù)據(jù)之間的關系和發(fā)展的趨勢,以期更好地理解、使用數(shù)據(jù)分析的結果。[3]與傳統(tǒng)的新聞報道不同,數(shù)據(jù)新聞報道不僅需要新聞編輯具備嫻熟的新聞寫作、多媒體技術運用、數(shù)據(jù)信息甄別等幾項基本能力,還需要編輯熟練運用數(shù)據(jù)可視化技術,在邏輯思維的基礎之上通過可視化圖像進一步激發(fā)新聞受眾的形象思維和空間想象能力,吸引、幫助受眾洞察數(shù)據(jù)之間隱藏的關系和規(guī)律。因此,大數(shù)據(jù)時代的新聞編輯只有不斷拓寬知識視野,增加知識儲備,形成立體化、多元化的知識結構,才能準確有效地把握新聞信息,最終贏得數(shù)據(jù)新聞報道的主動權。
數(shù)據(jù)新聞通常是一個合作的過程。即使是一個小小的新聞發(fā)布,數(shù)據(jù)可視化也能將新聞變得更加生動有趣?!皵?shù)據(jù)可視化”的概念最早出現(xiàn)在1987年,由布魯斯·麥考梅克、托馬斯·德房蒂和瑪克辛·布朗所編寫的美國國家科學基金會報告《Visualization in Scientific Computing》(意為“科學計算之中的可視化”)中提出,是指將數(shù)據(jù)庫中每一個數(shù)據(jù)項作為單個圖元元素表示,大量的數(shù)據(jù)集構成數(shù)據(jù)圖像,同時將數(shù)據(jù)的各個屬性值以多維數(shù)據(jù)的形式表示,可以從不同的維度觀察數(shù)據(jù),從而對數(shù)據(jù)進行更深入的觀察和分析。[4]但是,這并不就意味著,數(shù)據(jù)可視化就一定因為要實現(xiàn)其功能用途而令人感到枯燥乏味,或者是為了看上去絢麗多彩而顯得極端復雜。正如涂子沛先生在《大數(shù)據(jù)》一書中所說:“一幅好的數(shù)據(jù)圖像不僅能有效地傳達數(shù)據(jù)背后的知識和思想,而且華美精致,如一只只振動翅膀的彩蝶,刺激視覺神經(jīng),調(diào)動美學意識,令人過目不忘,留下栩栩如生的印象。”[3]
一部優(yōu)秀的數(shù)據(jù)新聞作品,最大的功勞莫過于創(chuàng)作設計了它的視覺藝術家。傳統(tǒng)的新聞報道中,數(shù)據(jù)展示的只不過是一些數(shù)字的羅列或一張簡單的Excel表格。但數(shù)據(jù)新聞的表現(xiàn)方式是多種多樣的,它擁有專業(yè)的數(shù)據(jù)可視化工具,報表類如JReport、Excel、水晶報表、FineReport等;BI分析工具如Style Intelligence、BO、BIEE、Yonghong Z-Suite等。更為專業(yè)的新聞報道與編輯模式,加上不斷創(chuàng)新的設計理念使得受眾易于理解,給予其充分的視覺刺激,更能使受眾深入閱讀,從而將新聞價值最大化凸顯。
數(shù)據(jù)新聞報道是媒介融合環(huán)境下興起的一種跨領域的新聞報道方式,新聞用數(shù)據(jù)代替文字講述事實,數(shù)據(jù)新聞的可視化也使得抽象的事實更加直觀形象,這是新聞業(yè)面對數(shù)字新媒體技術沖擊做出的努力轉(zhuǎn)型,改變了傳統(tǒng)新聞業(yè)的格局,為其注入了新鮮的血液。數(shù)據(jù)新聞的發(fā)展也對新聞采編人員提出了更高的要求,不同于傳統(tǒng)新聞生產(chǎn),數(shù)據(jù)新聞生產(chǎn)更加需要編輯具有嫻熟的技術操作能力以對數(shù)據(jù)進行挖掘、分析,更加注重用戶的需求。數(shù)據(jù)本身無意義,但如何在數(shù)據(jù)之間探索新聞價值,明晰隱藏在抽象信息背后的新聞規(guī)律與社會發(fā)展趨勢,是每一位新聞工作者義不容辭的責任。
(一)提升對數(shù)據(jù)的搜集、加工與整合能力,用數(shù)據(jù)創(chuàng)造價值
新聞編輯進行數(shù)據(jù)新聞報道首先必須以公開的數(shù)據(jù)為基礎。由于互聯(lián)網(wǎng)為人類提供了海量的數(shù)據(jù),一方面意味著人類的記錄范圍、測量范圍和分析范圍在不斷擴大,知識的邊界在不斷延伸;另一方面也使得信息接受者的注意力變得匱乏,一不留神就會迷失在浩如煙海的信息海洋中。因此,如何從各個獨立的信息系統(tǒng)中提取、整合有價值的數(shù)據(jù),從而實現(xiàn)從數(shù)據(jù)到信息、從信息到知識、從知識到利潤的轉(zhuǎn)化以及如何為受眾提供更加精準有效的新聞信息是編輯所面臨的難題。目前,數(shù)據(jù)搜集的渠道主要分為三種:一是利用搜索引擎,如谷歌使用PageRank技術對網(wǎng)頁進行超文本匹配分析,最終將最為可靠的搜索結果放在首位,其他類似的還有雅虎、百度等;二是通過專業(yè)數(shù)據(jù)庫將有價值的數(shù)據(jù)信息進行挖掘提取,再進行多維度分析;三是新聞編輯通過網(wǎng)絡論壇及其他數(shù)據(jù)站點將分散隱匿的數(shù)據(jù)加工處理,最終將零散的數(shù)據(jù)整合起來。整合是在篩選和整理基礎上的組合,不是將單個的新聞信息簡單相加或隨意拼湊,而是根據(jù)優(yōu)化原則,將有用信息從龐雜的數(shù)據(jù)中分析提煉出來,對它們進行“去粗取精、去偽存真、由此及彼、由表及里”的加工和配置,這樣就能夠為用戶提供新的有價值的新聞內(nèi)容,彰顯和發(fā)掘它們各自的內(nèi)涵,形成“量變效應”,使數(shù)據(jù)新聞報道總體升值并得以最大化發(fā)揮。
(二)充分運用數(shù)字技術,將數(shù)據(jù)團隊納入新聞編輯新格局
一則優(yōu)秀的數(shù)據(jù)新聞與其數(shù)據(jù)團隊挖掘和分析數(shù)據(jù)的能力密不可分。他們既懂得數(shù)據(jù)分析,又精通構圖藝術,既擁有敏銳的新聞嗅覺,又獨具審美眼光,他們集故事講述和藝術家的特質(zhì)于一身,將會成為大數(shù)據(jù)時代的導航員,同時也是大數(shù)據(jù)時代新聞生產(chǎn)核心競爭力的關鍵。
由于互聯(lián)網(wǎng)使得人與人之間的界限日漸模糊,因此一個優(yōu)秀的數(shù)據(jù)新聞團隊應是跨領域的,不同行業(yè)、不同學科的人們通過頭腦風暴產(chǎn)生創(chuàng)意,團隊中的相互協(xié)作顯得尤為重要。英國《衛(wèi)報》數(shù)據(jù)博客編輯西蒙·羅杰斯強調(diào)了這一觀點:“新聞編輯部的布局很有講究,如果你越靠近新聞編輯部,就更方便對報道進行交流,成為新聞策劃進程中的一部分;反之則兩者距離越來越遠?!盵5]
(三)以用戶需求為導向,合力挖掘數(shù)據(jù)新聞人性化元素
傳播學領域中的“使用與滿足”理論認為受眾成員是有著特定需求的個人,其媒介接觸活動是基于特定的需求,從而使需求得到滿足。在大數(shù)據(jù)時代,用數(shù)據(jù)為用戶創(chuàng)造價值,滿足用戶個性化、多樣化的信息需求是編輯做好數(shù)據(jù)新聞的根本策略。編輯對數(shù)據(jù)的選擇實際上代表著一種觀念、一種價值、一種文化,具有選擇性、科學性、時代性。這就要求數(shù)據(jù)新聞團隊需要站在受眾的角度闡明數(shù)據(jù)新聞的價值所在,在設計可視化呈現(xiàn)方式時融入更多的人性化元素,幫助受眾通過有效互動快速定位所需信息,最終使數(shù)據(jù)新聞的價值實現(xiàn)最大化。
(四)把握全媒體、立體化的編輯理念
當前,在媒介融合環(huán)境下,信息傳播渠道愈加多元化和復合化,編輯出版活動與移動終端、社交媒體平臺等多個領域聯(lián)系更為密切。為了適應這種變化,新聞編輯的思維方式也應從平面走向立體,堅持全媒體開發(fā)、立體化運作的全新理念。隨著社交媒體的發(fā)展,社交平臺上數(shù)據(jù)的聲音也變得豐富起來,留下的海量數(shù)據(jù)與痕跡,顯示出不同事物之間隱秘的聯(lián)系。數(shù)據(jù)新聞與社交媒體的結合,則可以豐富、擴展新聞報道范圍,使新聞獲得更為廣泛的傳播與關注。
[1]郭欽.數(shù)據(jù)新聞:大數(shù)據(jù)時代新聞報道新模式[D].武漢:華中師范大學,2014.
[2]張炯.基于數(shù)據(jù)新聞學的編輯理念與編輯能力的創(chuàng)新研究[J].中國編輯,2015(1).
[3]涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學出版社,2014.
[4]陳書悅.數(shù)據(jù)可視化:一圖勝前言[DB/OL].http://mp.weixin.qq.com/s?__biz.
[5]徐銳.數(shù)據(jù)新聞:大數(shù)據(jù)時代新聞生產(chǎn)的核心競爭力[J].編輯之友,2013(12).