喻國(guó)明+劉界儒+李陽(yáng)
在人工智能各項(xiàng)技術(shù)的發(fā)展下,數(shù)據(jù)新聞生產(chǎn)的各個(gè)環(huán)節(jié)都獲得了更成熟的技術(shù)支撐,從數(shù)據(jù)收集到數(shù)據(jù)分析再到數(shù)據(jù)展示,人工智能技術(shù)雖然不能解決數(shù)據(jù)新聞在發(fā)展過(guò)程中面對(duì)的所有問(wèn)題,但是AI時(shí)代的數(shù)據(jù)新聞,勢(shì)必獲得前所未有的發(fā)展機(jī)會(huì)。更強(qiáng)有力的信息存儲(chǔ)平臺(tái)、更智能的信息識(shí)別與采集系統(tǒng)和更人性化的可視化技術(shù),都為數(shù)據(jù)新聞的未來(lái)發(fā)展拓寬了道路。
同時(shí),機(jī)器人寫(xiě)作、傳感器新聞和可視化新聞等人工智能時(shí)代下發(fā)展起來(lái)的新聞生產(chǎn)創(chuàng)新模式也昭示著:AI時(shí)代下的新聞生產(chǎn)和傳播領(lǐng)域?qū)⑹侵腔叟c智能的共同參與,人與機(jī)器合作建構(gòu)的。
喻國(guó)明 劉界儒 李陽(yáng)
【摘要】依靠數(shù)據(jù)的采集、挖掘和展示所形成的數(shù)據(jù)新聞已經(jīng)以其獨(dú)有的功能和價(jià)值在新聞傳播領(lǐng)域嶄露頭角。但是由于受大數(shù)據(jù)技術(shù)發(fā)展的限制,還存在一系列問(wèn)題亟待解決。從人工智能背景下大數(shù)據(jù)方法的關(guān)鍵性改善入手,探討人工智能對(duì)于大數(shù)據(jù)技術(shù)在新聞傳播領(lǐng)域中的應(yīng)用所能提供的關(guān)鍵性技術(shù)支撐,分析和預(yù)測(cè)數(shù)據(jù)新聞生產(chǎn)的三個(gè)重要環(huán)節(jié)(數(shù)據(jù)新聞、傳感器新聞和可視化新聞)的技術(shù)改善之道。
【關(guān)鍵詞】人工智能;大數(shù)據(jù)方法;數(shù)據(jù)新聞;數(shù)據(jù)價(jià)值挖掘
雖然,數(shù)據(jù)新聞已經(jīng)在既往的實(shí)踐中有了長(zhǎng)足的發(fā)展,但數(shù)據(jù)挖掘(Data mining)不足仍然是數(shù)據(jù)新聞發(fā)展必須面對(duì)的主要問(wèn)題。數(shù)據(jù)挖掘指的是對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行探索的一個(gè)過(guò)程,是在海量數(shù)據(jù)中挖掘有效數(shù)據(jù)的重要技術(shù)。一般而言,數(shù)據(jù)挖掘在概念的層面分為三個(gè)階段:數(shù)據(jù)源數(shù)據(jù)的收集、對(duì)于數(shù)據(jù)源數(shù)據(jù)的處理以及最終的有效數(shù)據(jù)的表示。如圖1所示,數(shù)據(jù)挖掘主要通過(guò)四個(gè)步驟實(shí)現(xiàn):源數(shù)據(jù)的收集階段、數(shù)據(jù)預(yù)處理階段、數(shù)據(jù)處理階段、數(shù)據(jù)評(píng)估以及知識(shí)表示階段[1]。具體來(lái)說(shuō),數(shù)據(jù)挖掘不足可以體現(xiàn)在以下三個(gè)方面:數(shù)據(jù)收集來(lái)源單一、數(shù)據(jù)處理能力有限和數(shù)據(jù)可視化表達(dá)程度有限。
一、現(xiàn)階段數(shù)據(jù)新聞的實(shí)操所存在的主要問(wèn)題
(一)數(shù)據(jù)收集來(lái)源單一
目前數(shù)據(jù)新聞面臨的首要問(wèn)題就是缺乏可收集的數(shù)據(jù)信息源,或者數(shù)據(jù)庫(kù)信息過(guò)于單一,缺乏全面、結(jié)構(gòu)性的數(shù)據(jù)源數(shù)據(jù)庫(kù)。從我國(guó)的情況來(lái)看,作為常用來(lái)源的商業(yè)數(shù)據(jù)庫(kù)中的數(shù)據(jù),通常只集中在某一個(gè)方面,其所能描述的用戶(hù)特征也只是片面和單一角度的認(rèn)識(shí)。騰訊作為目前擁有最大即時(shí)通信工具的互聯(lián)網(wǎng)巨頭公司,掌握著大量用戶(hù)的社交關(guān)系數(shù)據(jù),雖然通過(guò)微信線(xiàn)上支付(紅包)的功能,占據(jù)了一定移動(dòng)支付的市場(chǎng),但比起支付寶(阿里巴巴旗下的個(gè)人第三方支付平臺(tái))來(lái)說(shuō),騰訊對(duì)于用戶(hù)消費(fèi)習(xí)慣和財(cái)務(wù)狀況的洞察和了解又遠(yuǎn)不及后者。圖2是2016年第二季度的第三方互聯(lián)網(wǎng)支付市場(chǎng)交易份額,財(cái)付通(騰訊在線(xiàn)支付平臺(tái))雖然僅次于支付寶占據(jù)了移動(dòng)支付市場(chǎng)的第二位,但仍然無(wú)法與支付寶等量齊觀(guān)。從整體的數(shù)據(jù)庫(kù)類(lèi)型的情況看是這樣,落實(shí)到具體的依靠數(shù)據(jù)挖掘?qū)崿F(xiàn)個(gè)性化新聞生產(chǎn)的實(shí)踐中時(shí),依然面對(duì)著信息來(lái)源單一的挑戰(zhàn)。
以今日頭條為國(guó)內(nèi)個(gè)性化推送新聞的媒體為例,作為國(guó)內(nèi)第一個(gè)個(gè)性新聞化推送新聞的產(chǎn)品類(lèi)實(shí)踐者,今日頭條自2012年創(chuàng)建后,到2016年8月,已經(jīng)擁有裝機(jī)用戶(hù)超過(guò)5.5億,日活躍人數(shù)超過(guò)6000萬(wàn)。從其CEO對(duì)今日頭條有關(guān)用戶(hù)的數(shù)據(jù)信息來(lái)源的介紹來(lái)看,主要是三個(gè)方面:第一,今日頭條通過(guò)對(duì)用戶(hù)的行為,如點(diǎn)擊、停留、評(píng)論、轉(zhuǎn)發(fā)等數(shù)據(jù)的搜集和聚合分析,獲得用戶(hù)對(duì)新聞信息的個(gè)人喜好和需求的推算。第二,根據(jù)用戶(hù)所處的環(huán)境特征,上網(wǎng)環(huán)境是Wi-Fi還是付費(fèi)流量、GPS所在地,是在常駐地還是旅游,是白天還是晚上等獲得用戶(hù)地理方面的數(shù)據(jù)信息。第三,基于用戶(hù)使用社交網(wǎng)絡(luò)賬號(hào)關(guān)聯(lián)登錄后,系統(tǒng)對(duì)于用戶(hù)社交圈和社交關(guān)系的分析,來(lái)得到關(guān)于用戶(hù)更清楚的社會(huì)化畫(huà)像,從職業(yè)身份或共同愛(ài)好入手計(jì)算用戶(hù)的興趣和需求。最后,系統(tǒng)通過(guò)把用戶(hù)行為、地理、社交三方面特征組合,利用算法綜合實(shí)現(xiàn)對(duì)用戶(hù)偏好和個(gè)性需要的挖掘。
但是,伴隨著個(gè)性化推送新聞的發(fā)展,也出現(xiàn)了“信息繭房”這種對(duì)現(xiàn)代人接收信息弊大于利的問(wèn)題。有學(xué)者認(rèn)為出現(xiàn)“信息繭房”的主要原因是,在互聯(lián)網(wǎng)時(shí)代,人們可以完全根據(jù)自己的愛(ài)好定制信息,從海量信息中隨意選擇自己關(guān)注的話(huà)題,久而久之,這種“個(gè)人日?qǐng)?bào)”式的信息選擇行為會(huì)導(dǎo)致網(wǎng)絡(luò)繭房的出現(xiàn)。當(dāng)商業(yè)信息服務(wù)利用個(gè)人定制的需求開(kāi)始為個(gè)人提供個(gè)性化新聞時(shí),人們會(huì)不自覺(jué)地失去了解不同事物的能力和接觸機(jī)會(huì),深陷個(gè)人“信息繭房”之中。減輕“信息繭房”負(fù)面影響的方法首先是要提高算法對(duì)個(gè)人信息需求的構(gòu)面了解,不但要滿(mǎn)足受眾顯性的,比如根據(jù)行為特征收集到的需求,還要結(jié)合其社交圈子,綜合改善個(gè)性化推送新聞對(duì)用戶(hù)需求的完整定義和把握,盡可能避免越推送越窄,越推送越偏的現(xiàn)象。
(二)數(shù)據(jù)處理能力有限
除了數(shù)據(jù)來(lái)源單一以外,數(shù)據(jù)新聞目前存在的第二個(gè)問(wèn)題是,處理數(shù)據(jù)能力有限。而數(shù)據(jù)處理和分析能力是決定數(shù)據(jù)挖掘的關(guān)鍵環(huán)節(jié)。目前,我們所使用的數(shù)據(jù)處理工具和算法都還比較傳統(tǒng),不適用大數(shù)據(jù)規(guī)模大、體量大的特點(diǎn)。祝建華教授說(shuō)過(guò),雖然大數(shù)據(jù)正在發(fā)生,但是我們對(duì)大數(shù)據(jù)的了解、處理能力還處在早期階段。這就勢(shì)必會(huì)影響數(shù)據(jù)新聞未來(lái)的發(fā)展。有學(xué)者認(rèn)為成熟的數(shù)據(jù)處理技術(shù)涉及三個(gè)方面:存儲(chǔ)、提取和統(tǒng)計(jì)分析[2]。
目前,在存儲(chǔ)方面,我們計(jì)算機(jī)的存儲(chǔ)水平還是遠(yuǎn)遠(yuǎn)跟不上大數(shù)據(jù)的規(guī)模,分析數(shù)據(jù)前先要把數(shù)據(jù)讀到內(nèi)存里,而現(xiàn)在功能比較強(qiáng)大的計(jì)算機(jī)內(nèi)存也遠(yuǎn)遠(yuǎn)滿(mǎn)足不了一個(gè)大型網(wǎng)站一天所產(chǎn)生的數(shù)據(jù),這樣一來(lái),這個(gè)過(guò)程就需要耗費(fèi)大量的時(shí)間,影響數(shù)據(jù)處理速度[3]。根據(jù)2014年萬(wàn)璞和王麗莎的總結(jié),目前常見(jiàn)的分析數(shù)據(jù)的算法和模型有:①傳統(tǒng)統(tǒng)計(jì)方法:抽樣技術(shù)、多元統(tǒng)計(jì)分析和統(tǒng)計(jì)預(yù)測(cè)方法等。②決策樹(shù):它利用一系列規(guī)則劃分,建立樹(shù)狀圖,用樹(shù)形結(jié)構(gòu)來(lái)表示決策集合,可用于分類(lèi)和預(yù)測(cè),常用的算法有CART、CHAID、ID3、C4.5、C5.0等。③人工神經(jīng)網(wǎng)絡(luò):它模擬人的神經(jīng)元功能,從結(jié)構(gòu)上模仿生物神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)輸入層、隱藏層、輸出層等,對(duì)數(shù)據(jù)進(jìn)行調(diào)整、計(jì)算,最后得到結(jié)果,是一種通過(guò)訓(xùn)練來(lái)學(xué)習(xí)的非線(xiàn)性預(yù)測(cè)模型,它可以完成分類(lèi)、聚類(lèi)、特征挖掘、回歸分析等多種數(shù)據(jù)挖掘任務(wù)。④遺傳算法:它是基于自然進(jìn)化理論,在生物進(jìn)化概念的基礎(chǔ)上設(shè)計(jì)的一種優(yōu)化技術(shù),它包括基因組合、交叉、變異和自然選擇等一系列過(guò)程,通過(guò)這些過(guò)程以達(dá)到優(yōu)化的目的,是模擬基因聯(lián)合、突變、選擇等過(guò)程的一種優(yōu)化技術(shù)。⑤關(guān)聯(lián)規(guī)則挖掘算法:關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)之間存在關(guān)系的規(guī)則,形式為“A1∧A2∧…∧An→B1∧B2∧…∧Bn,一般分為兩個(gè)步驟:第一步,求出頻繁數(shù)據(jù)項(xiàng)集;第二步,用頻繁數(shù)據(jù)項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則。⑥最近鄰技術(shù):這種技術(shù)通過(guò)已辨別歷史記錄的組合來(lái)辨別新的記錄,它可以用來(lái)做聚類(lèi)和偏差分析[4]。
根據(jù)以上方法我們可以看出,現(xiàn)有的大數(shù)據(jù)分析技術(shù)都是基于計(jì)算機(jī)技術(shù)輔助統(tǒng)計(jì)技術(shù)實(shí)現(xiàn)的,除了遺傳算法和人工神經(jīng)網(wǎng)絡(luò)外,都是經(jīng)典的統(tǒng)計(jì)學(xué)算法,這些算法從19世紀(jì)七八十年代開(kāi)始發(fā)展,到20世紀(jì)20年代初成型,距今已有80—120年的歷史[5]。雖然它們具有極高的穩(wěn)定性且較為成熟,但它們是為分析普通數(shù)據(jù)設(shè)計(jì)的,對(duì)于大數(shù)據(jù)的特點(diǎn)來(lái)說(shuō),難免有不能契合的方面。
(三)數(shù)據(jù)可視化表達(dá)程度有限
數(shù)據(jù)挖掘的第三個(gè)環(huán)節(jié)是數(shù)據(jù)展示,即可視化表達(dá)數(shù)據(jù)處理結(jié)果。米爾科·勞倫茲于2010年在阿姆斯特丹召開(kāi)的第一屆國(guó)際數(shù)據(jù)新聞圓桌會(huì)議中指出,數(shù)據(jù)新聞要以可視化的呈現(xiàn)數(shù)據(jù)并合成新聞故事為最后一個(gè)流程[6]。
數(shù)據(jù)可視化,在今天已經(jīng)是一個(gè)固定的概念,指的是將數(shù)據(jù)信息的“量值”或“關(guān)系”等轉(zhuǎn)變?yōu)橹庇^(guān)的圖形。數(shù)據(jù)的可視化加工,目前主要包括將數(shù)值型、文本型的數(shù)據(jù)及其關(guān)系用視覺(jué)化手段,例如圖片、動(dòng)畫(huà)等形式呈現(xiàn)出來(lái)[7]。
可視化新聞是隨著數(shù)據(jù)在新聞中的廣泛運(yùn)用出現(xiàn)并發(fā)展起來(lái)的,它是以數(shù)據(jù)為核心、信息為支撐、可視化為基本載體的跨媒體新聞報(bào)道形式。可視化新聞的價(jià)值一方面取決于它的表現(xiàn)形式,另一方面取決于它對(duì)隱藏在宏觀(guān)、抽象數(shù)據(jù)背后的新聞故事性的展示。
然而,并不是所有的新聞事實(shí)都適合用數(shù)字或數(shù)字化的方式來(lái)表現(xiàn)。數(shù)據(jù)的可視化表達(dá)一方面受表達(dá)形式的局限,在告訴受眾“發(fā)生了什么”的方面要強(qiáng)于告訴受眾“為什么發(fā)生”。當(dāng)數(shù)據(jù)的可視化僅限于告知事實(shí)時(shí),可視化新聞或者數(shù)據(jù)可視化手段就只能用于最基礎(chǔ)的新聞報(bào)道。像深度報(bào)道這一類(lèi)的新聞,就不能很好地涉足。另一方面,即便可視化技術(shù)有所改善,也很難改變數(shù)據(jù)本身不擅長(zhǎng)表現(xiàn)復(fù)雜因素和關(guān)系的特點(diǎn)。學(xué)者丁柏銓說(shuō)過(guò):“個(gè)人與個(gè)人或群體之間的關(guān)系多涉及政治、經(jīng)濟(jì)、文化等各種因素,涉及現(xiàn)實(shí)中的利害關(guān)系和歷史上的恩恩怨怨?!盵8]
二、人工智能時(shí)代數(shù)據(jù)新聞的發(fā)展之道
在人工智能時(shí)代,人工智能和大數(shù)據(jù)形成了相互推動(dòng)的關(guān)系,一方面人工智能需要大量的知識(shí)和豐富的經(jīng)驗(yàn),使機(jī)器獲得足夠的數(shù)據(jù)量;另一方面,大數(shù)據(jù)技術(shù)在人工智能時(shí)代獲得了前所未有的發(fā)展機(jī)會(huì),我們就以上有關(guān)數(shù)據(jù)挖掘的三個(gè)環(huán)節(jié),來(lái)看人工智能帶給數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析和數(shù)據(jù)展示三個(gè)方面的機(jī)遇和挑戰(zhàn),作為探討傳感器新聞和可視化新聞未來(lái)發(fā)展的技術(shù)基礎(chǔ)。
(一)云服務(wù)平臺(tái)——夯實(shí)數(shù)據(jù)存儲(chǔ)基礎(chǔ)
在人工智能時(shí)代,伴隨云計(jì)算的飛速發(fā)展,關(guān)于數(shù)據(jù)存儲(chǔ)的技術(shù)能力邁上了新的臺(tái)階。云計(jì)算指的是在技術(shù)上可以理解為將眾多能力較弱的服務(wù)器,通過(guò)網(wǎng)絡(luò)有機(jī)集在一起,形成一個(gè)能力超強(qiáng)的、可動(dòng)態(tài)伸縮的資源池以完成大任務(wù)。它是一種按需提供的網(wǎng)絡(luò)訪(fǎng)問(wèn),用戶(hù)通過(guò)付費(fèi)進(jìn)入計(jì)算機(jī)資源共享池,這些資源包括網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)和應(yīng)用軟件等。而云平臺(tái)的出現(xiàn),使得云計(jì)算成為互聯(lián)網(wǎng)上一項(xiàng)成熟的公共服務(wù),它的優(yōu)勢(shì)在于,平臺(tái)性的收集、聚合和儲(chǔ)存海量碎片化的數(shù)據(jù),為進(jìn)一步分析數(shù)據(jù)提供可靠基礎(chǔ),是挖掘和處理大數(shù)據(jù)的操作平臺(tái)。從整體上來(lái)看,這降低了個(gè)體儲(chǔ)存、計(jì)算、分析數(shù)據(jù)的成本,使整個(gè)互聯(lián)網(wǎng)上的數(shù)據(jù)存儲(chǔ)和計(jì)算通過(guò)云平臺(tái)獲得了規(guī)模效應(yīng)。
不管是技術(shù)上還是經(jīng)濟(jì)上,云平臺(tái)都將為我們應(yīng)對(duì)持續(xù)出現(xiàn)的海量數(shù)據(jù)提供最基礎(chǔ)的技術(shù)保障,使人們能更游刃有余地應(yīng)對(duì)數(shù)據(jù)洪流。未來(lái)新聞媒體建立自己獨(dú)立的數(shù)據(jù)庫(kù)是大勢(shì)所趨,面對(duì)可能到來(lái)的海量數(shù)據(jù),大型云服務(wù)平臺(tái)的出現(xiàn),將緩解有關(guān)大數(shù)據(jù)存儲(chǔ)的困境。谷歌于2015年年底已正式建立谷歌云平臺(tái),綜合其他服務(wù)為用戶(hù)提供一體化解決方案。
(二)智能感知——傳感器新聞:提高數(shù)據(jù)收集質(zhì)量
隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,裝配在大量終端上的各類(lèi)傳感器可以采集到海量且種類(lèi)豐富的實(shí)時(shí)數(shù)據(jù);不斷升級(jí)的通信網(wǎng)絡(luò)技術(shù),又使這些數(shù)據(jù)可以完整地回傳到云端服務(wù)器上;而應(yīng)用廣泛的云計(jì)算技術(shù),令網(wǎng)絡(luò)和設(shè)備運(yùn)營(yíng)商又有途徑去進(jìn)行實(shí)時(shí)存儲(chǔ)和高效并行處理[9]。這些都為解決數(shù)據(jù)新聞來(lái)源缺乏的問(wèn)題提供了希望,同時(shí)也為傳感器新聞的發(fā)展奠定了基礎(chǔ)。
傳感器新聞來(lái)源于2013年6月成立于哥倫比亞大學(xué)托爾數(shù)字中心的“傳感器新聞”工作小組,根據(jù)該中心的定義,傳感器新聞指“利用傳感器生成或收集數(shù)據(jù),然后分析、可視化、使用數(shù)據(jù)來(lái)支持新聞報(bào)道”[10]。目前,在新聞?lì)I(lǐng)域應(yīng)用傳感器還屬于比較新的探索,僅有美國(guó)的個(gè)別媒體在進(jìn)行嘗試。
雖然伴隨著移動(dòng)通信網(wǎng)絡(luò)以及智能終端的發(fā)展,采集到的數(shù)據(jù)呈指數(shù)型爆發(fā),但以傳感器收集到的現(xiàn)場(chǎng)數(shù)據(jù)作為新聞數(shù)據(jù)源,卻無(wú)法避免量化優(yōu)勢(shì)背后的數(shù)據(jù)體積大、結(jié)構(gòu)復(fù)雜、冗余度高且價(jià)值隱匿等問(wèn)題。這些問(wèn)題都會(huì)使數(shù)據(jù)分析和提取格外耗費(fèi)成本,并考驗(yàn)新聞從業(yè)者的綜合素質(zhì)[11]。
在人工智能時(shí)代,具有智能識(shí)別和學(xué)習(xí)能力的分析系統(tǒng)可以幫助媒體有效挖掘大數(shù)據(jù)中最有價(jià)值的信息。比如通過(guò)進(jìn)行有效的數(shù)據(jù)分類(lèi),提高數(shù)據(jù)資源的利用率和匹配程度。一個(gè)常見(jiàn)的情形是,當(dāng)傳感器采集到大量數(shù)據(jù)進(jìn)行數(shù)據(jù)匯聚和初步處理時(shí),如果入網(wǎng)網(wǎng)關(guān)具備智能感知的功能,就可以過(guò)濾掉重復(fù)冗余的信息、只上傳必要和價(jià)值高的數(shù)據(jù),這樣不僅可以節(jié)省大量的傳輸帶寬,也可以在第一時(shí)間收集到敏感信息[12]。新聞媒體在篩選第一系統(tǒng)的數(shù)據(jù)時(shí),如果能配合智能算法,也可以淘汰掉不符合新聞生產(chǎn)標(biāo)準(zhǔn)的低價(jià)值數(shù)據(jù),并依據(jù)新聞生產(chǎn)的要求,篩選敏感信息和關(guān)鍵部分。最理想的情況是還能做到根據(jù)具體的應(yīng)用場(chǎng)景和需求合理配置數(shù)據(jù),提高數(shù)據(jù)資源的利用效率。
這樣既緩解了數(shù)據(jù)新聞缺乏有效數(shù)據(jù)源的問(wèn)題,又幫助數(shù)據(jù)新聞從生產(chǎn)源頭起就提高了分析數(shù)據(jù)的操作效率,從數(shù)據(jù)的結(jié)構(gòu)和質(zhì)量?jī)蓚€(gè)方面作出有益的技術(shù)支持。
(三)智能展示——可視化新聞:完善數(shù)據(jù)展示功能
從米爾科·勞倫茲于2010年提出可視化新聞的概念到現(xiàn)在,雖然這一新聞形式誕生還不到十年,但是借助新媒體在信息傳播中的主導(dǎo)地位以及數(shù)據(jù)采集和分析技術(shù)的不斷突破,它已經(jīng)表現(xiàn)出了強(qiáng)勁的發(fā)展勢(shì)頭。[13]在以大數(shù)據(jù)技術(shù)為核心基礎(chǔ)上形成的新聞可視化,關(guān)鍵在于如何通過(guò)可視化的方式傳遞、通過(guò)數(shù)據(jù)挖掘,產(chǎn)生有價(jià)值的信息。
目前,數(shù)據(jù)新聞在發(fā)布過(guò)程中倚重圖表表達(dá)和數(shù)說(shuō)新聞的方式,在數(shù)據(jù)新聞的最終作品上,自然的科學(xué)性是它最大的特點(diǎn),不擅長(zhǎng)講故事和缺乏傳統(tǒng)新聞特有的人文主義關(guān)懷精神是它的局限所在。
人工智能(AI)時(shí)代,伴隨著視覺(jué)技術(shù)的進(jìn)一步發(fā)展和新聞打開(kāi)方式的不斷創(chuàng)新,數(shù)據(jù)展示技術(shù)也在不斷提高,受眾對(duì)數(shù)據(jù)成果的可接觸程度也將獲得新的深度。一方面數(shù)據(jù)分析后的結(jié)果可以最大限度地以最方便受眾的方式呈現(xiàn)出來(lái),另一方面數(shù)據(jù)挖掘出的意義關(guān)系也可以體現(xiàn)得更明顯。近年興起的虛擬現(xiàn)實(shí)(VR)/增強(qiáng)現(xiàn)實(shí)(AR)技術(shù),都代表了未來(lái)智能展示技術(shù)的發(fā)展方向。以2015年媒體對(duì)9·3閱兵的報(bào)道為例來(lái)看,利用VR技術(shù)進(jìn)行新聞現(xiàn)場(chǎng)直播和全景展示已經(jīng)逐步進(jìn)入新聞媒體的報(bào)道中,全景式報(bào)道和基于數(shù)據(jù)分析的可視化新聞已經(jīng)成為新聞報(bào)道創(chuàng)新的一大亮點(diǎn)。日后,新聞+VR/AR的模式將幫助受眾更清晰地進(jìn)入時(shí)間或空間跨度大的環(huán)境中,在物理形式不受限的條件下認(rèn)識(shí)到數(shù)據(jù)背后更長(zhǎng)期、總體的規(guī)律。比起過(guò)去傳統(tǒng)的可視化手段,大數(shù)據(jù)與視覺(jué)技術(shù)的結(jié)合帶來(lái)的沉浸式新聞不僅是新技術(shù)手段下新的新聞革新方式,更是數(shù)據(jù)可視化新的發(fā)展機(jī)會(huì)。
數(shù)據(jù)可視化技術(shù)的創(chuàng)新不能解決可視化新聞的所有問(wèn)題,在數(shù)據(jù)新聞發(fā)展的同時(shí),我們不能放棄對(duì)新聞事實(shí)做質(zhì)性分析和文字描述的工作,畢竟文字記錄才具有表達(dá)豐富性和敘事故事性的特征,更能體現(xiàn)新聞產(chǎn)品的人文關(guān)懷和新聞活動(dòng)的本質(zhì)。
三、結(jié)語(yǔ)
隨著人工智能各項(xiàng)技術(shù)的發(fā)展,數(shù)據(jù)新聞生產(chǎn)的各個(gè)環(huán)節(jié)都獲得了更成熟的技術(shù)支撐,從數(shù)據(jù)收集到數(shù)據(jù)分析再到數(shù)據(jù)展示,人工智能技術(shù)雖然不能解決數(shù)據(jù)新聞在發(fā)展過(guò)程中面對(duì)的所有問(wèn)題,但是AI時(shí)代的數(shù)據(jù)新聞,勢(shì)必會(huì)獲得前所未有的發(fā)展機(jī)會(huì)。更強(qiáng)有力的信息存儲(chǔ)平臺(tái)、更智能的信息識(shí)別和采集系統(tǒng)、更人性化的可視化技術(shù),都為數(shù)據(jù)新聞的未來(lái)發(fā)展拓寬了道路。
同時(shí),機(jī)器人寫(xiě)作、傳感器新聞和可視化新聞等人工智能時(shí)代發(fā)展起來(lái)的新聞生產(chǎn)創(chuàng)新模式也昭示著:AI時(shí)代的新聞生產(chǎn)和傳播領(lǐng)域?qū)⑹侵腔叟c智能的共同參與、人與機(jī)器的合作建構(gòu)的。
參考文獻(xiàn):
[1]萬(wàn)璞,王麗莎.數(shù)據(jù)挖掘與人工智能技術(shù)研究[J].無(wú)線(xiàn)互聯(lián)科技,2016(5).
[2]祝建華.從大數(shù)據(jù)到數(shù)據(jù)新聞[J].新媒體與社會(huì),2014(11).
[3]祝建華.從大數(shù)據(jù)到數(shù)據(jù)新聞[J].新媒體與社會(huì),2014(11).
[4]萬(wàn)璞,王麗莎.數(shù)據(jù)挖掘與人工智能技術(shù)研究[J].無(wú)線(xiàn)互聯(lián)科技,2016(5).
[5]祝建華.從大數(shù)據(jù)到數(shù)據(jù)新聞[J].新媒體與社會(huì),2014(11).
[6]王傳寶,滕瀚.新媒體時(shí)代的“新聞可視化”初探[J].新聞研究導(dǎo)刊,2014(3).
[7]彭蘭.“信息是美的”:大數(shù)據(jù)時(shí)代下信息圖表的價(jià)值及運(yùn)用[J].新聞?dòng)浾撸?013(6).
[8]丁柏銓.數(shù)據(jù)新聞的價(jià)值與局限[J].編輯之友,2014(7).
[9]孫松林,陳娜.大數(shù)據(jù)助推人工智能[J].郵電設(shè)計(jì)技術(shù),2016(8).
[10]許向東.大數(shù)據(jù)時(shí)代新聞生產(chǎn)新模式:傳感器新聞的理念、實(shí)踐與思考[J].國(guó)際新聞界,2015(10).
[11]許向東.大數(shù)據(jù)時(shí)代新聞生產(chǎn)新模式:傳感器新聞的理念、實(shí)踐與思考[J].國(guó)際新聞界,2015(10).
[12]孫松林,陳娜.大數(shù)據(jù)助推人工智能[J].郵電設(shè)計(jì)技術(shù),2016(8).
[13]葉文宇.大數(shù)據(jù)時(shí)代可視化新聞的特點(diǎn)及發(fā)展趨勢(shì)[J].傳播與版權(quán),2015(9).
(喻國(guó)明為教育部長(zhǎng)江學(xué)者特聘教授,北京師范大學(xué)新聞傳播學(xué)院執(zhí)行院長(zhǎng),中國(guó)人民大學(xué)新聞與社會(huì)發(fā)展研究中心主任;劉界儒、李陽(yáng)為北京師范大學(xué)新聞傳播學(xué)院碩士生)
編校:王 謙