馮志浩
摘 要:大數據開啟了一個全新的時代引發(fā)各行各業(yè)的巨變,新聞業(yè)也不例外。近幾年興起的數據新聞被新聞譽為新聞業(yè)的未來,在數據新聞尚在萌芽發(fā)展階段說清楚其內涵外延是十分困難的,所以本文采用管中窺豹的方式著重從大數據時代新聞的新變化入手,思維方式、采編流程、呈現(xiàn)模式等幾方面進行探究
關鍵詞:大數據;數據新聞;新變化
英國學者維克托·邁爾一舍恩伯格(V ictor M aver-Schonbezger)在《大數據時代:生活、工作思維的大變革》一書中提出,大數據將是人們獲得新知、創(chuàng)造新價值的源泉,也是改變市場與組織的結構以及政府與公民關系的有效途徑。傳統(tǒng)新聞業(yè)也在緊跟時代浪潮加快數字化進程,并展開了大數據新聞的實踐。在傳統(tǒng)新聞業(yè)升級換代進軍數據新聞的過程中,呈現(xiàn)出了許多前所未有的新變化,筆者將從一下幾個方面探討。
一、新聞的思維方式
近年來大數據技術的快速發(fā)展深刻改變了我們的生活、工作和思維方式。大數據思維主要包括三個方面,即:總體樣本取代隨機樣本;對不精確的容忍度增加;相關關系取代因果關系[1]。在大數據的時代環(huán)境下,新聞思維模式也相應的出現(xiàn)了新的變化。
一是與傳統(tǒng)新聞思維模式重視事件的因果關系相比,數據新聞更多的考慮事件背后的相關關系。數據新聞通過對眾多數據的分析,尋找不同數據間的相關性揭示兩組數據間的變化規(guī)律從而發(fā)現(xiàn)新的新聞報道點,而且根據數據的相關關系一組數據發(fā)生變化時可以對另一組數據做出預測性報道。二是技術的發(fā)展使得獲取總體樣本的數據成為可能,數據新聞因此更加強調信息的結構化拋開故事中心,而傳統(tǒng)新聞一直追求的是故事化在數據時代就要做好思維轉化。三大數據對不精確性有更大的包容度,這與傳統(tǒng)新聞思維強調精確形成一隊矛盾。對不精確的容忍度增加,是因為統(tǒng)計全體樣本數據不得不接受數據的混雜性,但通過分析數據找出事物發(fā)展的規(guī)律才是目的,這一點與傳統(tǒng)新聞強調精確性是一致的,因此筆者認為在新聞實踐中不必糾結這對矛盾。
二、新聞采編流程
數據新聞也被稱為數據驅動新聞,是基于數據的抓取、挖掘、統(tǒng)計、分析和可視化呈現(xiàn)的新聞報道方式[2]。大數據時代不僅意味著海量的數據信息更是對于數據的收集、挖掘、分析等能力的提升提出了更高的要求,與傳統(tǒng)新聞的采寫相比數據新聞更注重數據的挖掘和處理。
數據挖掘。數據挖掘是數據新聞采編流程的第一步,邁好這一步至關重要它是后面流程的基礎直接影響到新聞報道的真實性。數據記者可以從政府、企業(yè)、社會機構等公開的數據庫中獲取所需要的數據,隨著全球數據開放意識的不斷發(fā)展記者獲取數據將會變得越來越順暢。數據記者也可以從互聯(lián)網上抓取數據,互聯(lián)網上數據之豐富前所未有,采用專業(yè)的抓取軟件記者可以方便的獲得想要的數據,同時數以億計的網民每天都會在互聯(lián)網留下信息痕跡包括所使用的社交平臺,雖然有零散、碎片的特征但認真加以整合便能挖到信息的金礦。記者還可引用專業(yè)數據庫公司的數據或者與生產數據的企業(yè)合作。
數據處理。在收集到足夠多的原始數據之后,需要對數據進行處理以便保證數據的真實準確。事實上數據符號是客觀的,但數據是如何產生的,采用哪種統(tǒng)計模型卻非天然中立。因此,不能直接使用收集的第一手數據而是要建立一套數據處理的客觀準則。
布拉德肖把數據處理環(huán)節(jié)概括為數據清洗、情境化和綜合等3個步驟。數據清洗一般采用兩種做法:一是檢查數據的一致性,二是處理無效值和缺失值等。記者要將獲取的數據轉化成統(tǒng)一的格式,對存在的重復條目、損壞條目、空白條目、錯誤格式、重復命名、數據丟失等問題借助Excel、Goole Docs、Goole Refine等軟件工具進行整理、清洗。
數據情境化就是將收集的數據放到具體的語境中去理解,而不為了分析數據而分析數據。數據情景化還要理順數據間的邏輯關系,根據事件的發(fā)展脈絡清理數據,這樣做就不至于在數據搜集階段喪失焦點或錯過有趣的報道角度。這就要求記者對事件的發(fā)生背景有較深的了解,做到按圖索驥對遠離客觀事實的數據及時清除對關鍵環(huán)節(jié)缺失的數據及時補足。
數據綜合可以簡單的理解為數據的縱橫比較將不同的信息圖重復疊加到一起,即將一個數據庫中的信息合并到另一信息圖的數據之中,實時呈現(xiàn)事物的時空分布狀況,實現(xiàn)信息的整合與導航。數據地圖、時間線、交互性圖表已成為不同時間、不同來源的數據信息整合的框架:或對比、肴加數據,挖掘“數據關系”;或延展時空跨度,揭不總體規(guī)律,或以超鏈接的形式,向用戶提供原始素材的來源。通過對不同維度的數據肴加、比較、相互關聯(lián),可看到每個數據更深層的含義,加深對新聞事實真相與意義的理解。
三、新聞的呈現(xiàn)方式
快節(jié)奏的生活里,冗長的文字表述常常會讓讀者望而生畏,而將信息進行可視化處理,可以比文字報道更直觀反映新聞事件的過程和發(fā)展趨勢,讓讀者更容易接受也更喜歡。而且如今的新聞可是化已不僅僅是餅圖、柱狀圖那么簡單,而是多采用如下幾種呈現(xiàn)方式。
信息圖。所謂信息圖,就是用圖像的形勢將數據、信息表述出來,信息圖通常是靜態(tài)的。信息圖通俗易懂、簡潔明了、趣味性強,是現(xiàn)在讀者新聞樂見的新聞呈現(xiàn)方式。制作信息圖主要分三個步驟,第一個步,明確主題收集與之相關的原始數據,第二步,全面理解數據構思邏輯框架;第三步,設計最適合表達主題的表現(xiàn)方式,或表格或圖表。
交互式圖表。交互式圖表是動態(tài)的表達形式,更具有靈活性和互動性。信息圖常用于紙媒,而交互式圖表更多適應于網絡媒體也只有在網上才能更好的發(fā)揮其優(yōu)勢。但從外觀設計方面來看,交互式圖表和信息圖區(qū)別不大,都是由文字、圖表、圖形、列表等組合在一起形成的。
數據地圖簡單的說就是數據和地圖的結合,但它是兩者結合的質變,承載著豐富的數據信息不僅讓數據的表現(xiàn)方式更加多樣還為簡單是的空間地圖帶來了生機,所產生的表達效果是以往文字報道不能比擬的。數據地圖作為新聞的呈現(xiàn)方式,尤其是涉及地域報道時不僅空間感強還能讓讀者對數據有更加全面立體的把握,將空間的大跨度與事件的多樣性濃縮到一張“地圖”使人一目了然?,F(xiàn)在,國外很多媒體經常采用這一可視化方式進行報道,如英國《衛(wèi)報》關于伊拉克戰(zhàn)爭的報道就是用數據地圖來呈現(xiàn)的。
動態(tài)氣泡圖。氣泡圖是一個將點表示為氣泡(或圓圈)的散點圖,與XY散點圖類似,但可表現(xiàn)的數據信息量更多,最多可以表示五維(x位置、y位置、大小、顏色和時間),通過更改氣泡的大小和顏色,按時間變化將氣泡制成動畫視覺效果,能使數據探索更加方便。以2006年漢斯·羅斯林在TED的演講為例,漢斯·羅斯林用氣泡圖向人們展示了1962年以后全球各個國家家庭規(guī)模及壽命的變化軌跡,以此來判斷國家的經濟發(fā)展水平。(作者單位:重慶工商大學-重慶市高校網絡輿情與思想動態(tài)研究資政中心)
參考文獻:
[1] [英]維克托·邁爾舍恩伯格、肯尼思·庫克耶著:《數據時代》,盛楊燕、周濤譯,浙江人民出版社,第27-96頁。
[2] 方潔、彥東,《全球視野下的數據新聞:理念與實踐》,《國際新聞界》,2012第6期,74頁。