本刊實習(xí)記者/陳鑫胤
姜進章:計算新聞的特征與趨勢
本刊實習(xí)記者/陳鑫胤
2016年6月23日,在英國關(guān)于是否脫歐的公投中,脫歐派以3.8%的微弱優(yōu)勢獲勝,并在世界范圍內(nèi)引起了一系列的“蝴蝶效應(yīng)”。然而這次脫歐事件的結(jié)果,很多西方媒體在結(jié)果出爐前10天就非常準確地預(yù)測到了,多數(shù)金融市場并沒有發(fā)生重大災(zāi)難的原因,是因為在一個月前幾乎都做了防備。
這是數(shù)據(jù)新聞所帶來的社會效益。數(shù)據(jù)新聞會預(yù)測公投脫歐的結(jié)果,也會預(yù)測后脫歐時代的英國人口將經(jīng)歷怎樣的流動,以及英國的GDP會產(chǎn)生怎樣的改變。如果這些統(tǒng)統(tǒng)叫做數(shù)據(jù)新聞,那計算新聞是怎樣的呢?
在中國新聞技術(shù)工作者聯(lián)合會2016年學(xué)術(shù)年會上,來自上海交通大學(xué)的姜進章教授帶來了關(guān)于《計算新聞的特征與趨勢》的演講。計算新聞如何引導(dǎo)新聞報道回歸本質(zhì),如何更全面地預(yù)防災(zāi)難以及如何在新一輪的廣告市場爭奪戰(zhàn)中,變被動為主動,形成真正的賣方廣告市場?姜進章教授進行層層抽絲剝繭,揭開計算新聞的核心價值。
1.1計算新聞的定義
關(guān)于什么是計算新聞?哈密頓和特納的定義是“社會科學(xué)的算法、數(shù)據(jù)和知識的結(jié)合,以補充新聞的責任與義務(wù)的功能?!弊孕侣?wù)Q生以來,新聞的任務(wù)和責任是永恒的,計算新聞業(yè)則是建立在兩種方法——計算機輔助報告和社會科學(xué)工具在新聞業(yè)中的應(yīng)用。其通過利用一些模型和算法,旨在幫助記者探索結(jié)構(gòu)性和他們尋找故事的非結(jié)構(gòu)化信息。
姜進章表示,在過去,學(xué)界為新聞界提供的數(shù)據(jù)都是表格化的,這顯然不符合記者對文字的偏好。多媒體時代來臨后,大量的非結(jié)構(gòu)化數(shù)據(jù)通過認知計算得以解決,避免了異常龐大的統(tǒng)計學(xué)數(shù)據(jù)所做出來的報道。
從傳播學(xué)的角度,僅僅看統(tǒng)計學(xué)的應(yīng)用對記者來說很不適用,而未來的計算新聞和各種表格已經(jīng)沒有太多聯(lián)系,更重要的是非結(jié)構(gòu)化數(shù)據(jù)的處理和可視化。
1.2計算新聞廣義的應(yīng)用
把計算新聞擴大化來講,計算新聞的定義將包括計算工具和他們與定量方法、定性方法的結(jié)合。美國對計算新聞的研究已經(jīng)確定的方法包括統(tǒng)計分析、調(diào)查、測量和觀察、收集和解釋各種信息,如公共記錄、訪談和直接參與的事件。
現(xiàn)階段中國新聞報道的方面已經(jīng)逐步開始變化,政治新聞、財經(jīng)新聞、娛樂新聞以及各種社會新聞層出不窮,娛樂化、個性化的趨勢明顯。在這種情況下,計算新聞可以在主題的檢測、視頻的分析、個性化、聚合、可視化等方面發(fā)力,當認知計算的技術(shù)鏈完成以后,對記者最大的改變就是——技術(shù)不僅成為手段,而且可以建構(gòu)意義。
在技術(shù)支撐下,記者、編輯的工作方式發(fā)生顛覆性的變化。信息的采集和存儲、分析、挖掘和展示,都由技術(shù)來解決了,那么記者或者是人類還能做哪些事呢?姜進章認為有兩個方向:
第一,設(shè)計數(shù)據(jù)內(nèi)含和反饋系統(tǒng),設(shè)計適應(yīng)人類的數(shù)據(jù)指標與標志,與自然環(huán)境數(shù)據(jù)互動。今后記者和編輯的第一線工作就是設(shè)計向這個社會要貢獻的數(shù)據(jù),設(shè)計媒體用什么樣的反饋系統(tǒng)去反映人類的社會生活。
第二,當技術(shù)已經(jīng)能夠完全把思想都展現(xiàn)出來的時候,最重要的是能夠把它放到不同的領(lǐng)域,放到不同的分眾當中進行應(yīng)用,創(chuàng)新其應(yīng)用。
1.3計算機技術(shù)助力新聞領(lǐng)域
計算新聞有這樣的應(yīng)用取決于計算機技術(shù)能在新聞報道領(lǐng)域,以數(shù)據(jù)推動報道,以故事的展示方式來完成,同時進行大量的信息篩選。這個篩選就是各類媒體對自己反饋系統(tǒng)的設(shè)計,借助反饋系統(tǒng),才能讓技術(shù)扮演篩選信息的角色,以形成每一個媒體自己的特色。除此以外,技術(shù)也將影響跟蹤。
姜進章說,技術(shù)將影響所有發(fā)生事件的跟蹤水平,在一個強大的跟蹤系統(tǒng)下,記者過去在事情發(fā)生的背景、發(fā)展的過程等方面的大量的注意力,可以轉(zhuǎn)移到事件發(fā)展的未來,也就是反饋系統(tǒng)要完成對任何一個新聞事件的未來預(yù)測。舉例,上海水上飛機撞橋事件,如果航拍人員提前對飛行路線進行分析,則可以預(yù)測評估飛機撞橋的可能性,從而預(yù)防重大事故的發(fā)生。
現(xiàn)在正值美國大選,美國媒體對競選的過程都進行著實時計算新聞的報道,鎖定特朗普和希拉里二人間的選舉會發(fā)生怎樣的變化。計算新聞在事件發(fā)生之前不斷地捕捉、不斷地進行互動,且大量的新聞報道是跟現(xiàn)場融合的。姜進章認為新聞媒體報道真正的融合是讓受眾跟現(xiàn)場完全融合在一起,給人巨大的現(xiàn)場感和參與感。
就如電影的本質(zhì)是沉浸性,新聞報道的特質(zhì)是新聞事件現(xiàn)場的參與性。實現(xiàn)參與性,呈現(xiàn)現(xiàn)場感受并預(yù)測未來,才是新聞報道回到了自己的本原。大眾媒體的組織一定會煥發(fā)青春,而這個青春是在重人才、重技術(shù)、重裝備、重場景、重未來的情況下實現(xiàn)的。
1.4數(shù)據(jù)與計算新聞的趨勢:預(yù)測性
要搭建前文所說的反饋系統(tǒng)并創(chuàng)造參與性,就要利用數(shù)據(jù)與計算新聞的趨勢——預(yù)測性。
大數(shù)據(jù)的聚集可以使人們在事情發(fā)生之前準確預(yù)測。數(shù)據(jù)新聞依靠數(shù)據(jù)創(chuàng)建和填充新聞內(nèi)容已被廣泛使用,而計算新聞依靠機器人及程序創(chuàng)建新聞報道,也已在新聞界進行更多的嘗試。籍此,通過大數(shù)據(jù)技術(shù)的應(yīng)用,新聞工作者將能夠準確地做出預(yù)測并據(jù)此生產(chǎn)出第二天或未來的新聞頭條和相關(guān)內(nèi)容。
正如很多財經(jīng)報道在討論的,能否預(yù)測到下一次股災(zāi)的來臨,世界新聞對預(yù)測性的討論更多,人類思維習(xí)慣于根據(jù)歷史和經(jīng)驗,判斷和重建未來。大量的事件都是人類自身的重建,所以它是可預(yù)測性的。
2.1計算機輔助報道和精確新聞
要深入認識計算新聞就要從其歷史的進程中去尋找。歷來在討論人類的發(fā)展進程時會討論基因,與環(huán)境的適應(yīng)性交互形成了今天的人類。同樣在討論一個事物的時候,也要看它的基因是什么,從而在基因的鏈條上來與環(huán)境交互,這也是每個媒體組織發(fā)展的根源。
自1952年以來,計算機被用于記者生產(chǎn)新聞故事的這種做法,往往被標注為“計算機輔助報告”,并得到了國際社會的支持。1967年,美國聯(lián)邦信息自由法案開始實行,民眾有權(quán)要求政府公開信息,信息的流傳性開始極大增長,需求越來越大。
70年代初,人們都認為計算機輔助報道是在小數(shù)據(jù)下完成的,是在封閉的量化狀態(tài)下完成的,因此人們認為檢驗數(shù)據(jù)是否準確是最重要的,從而進入“精確新聞”時代。但是精確新聞的概念很快被淘汰,因為大數(shù)據(jù)側(cè)重于多維性而不是個別數(shù)字的精確,多維性的交叉驗證可自動產(chǎn)生精確性。70年代以后,新聞界引入了社會科學(xué)調(diào)查方法。
從90年代開始,計算機輔助報道開始在全美編輯室穩(wěn)定發(fā)展。
2.2數(shù)據(jù)新聞
到了21世紀初,互聯(lián)網(wǎng)成為主導(dǎo)力量。“數(shù)據(jù)新聞”一詞最早并不是出自美國而是英國,用于英國政府報道當中。當時計算機輔助報道明顯具有技術(shù)驅(qū)動的背景,隨后技術(shù)逐漸從每個人的工作界面退出,進入后臺,新聞記者也更易于接受和運用。人們開始用數(shù)據(jù)來驅(qū)動新聞報道,不是技術(shù)驅(qū)動。
2002年,借助數(shù)據(jù)驅(qū)動,這一階段稱為的“資料新聞、數(shù)據(jù)新聞或數(shù)據(jù)庫新聞”都開始發(fā)展起來,人們習(xí)慣于把數(shù)據(jù)看做小數(shù)據(jù),即結(jié)構(gòu)化數(shù)據(jù)。這一階段數(shù)據(jù)只能起到支持性的作用,無法成為主流。
一直到2010年末2011年初,全球掀起大數(shù)據(jù)熱潮,“數(shù)據(jù)新聞”開始從邊緣走向人們視野的中心。根據(jù)谷歌趨勢,記者可以挖掘政府發(fā)布的海量數(shù)據(jù)。數(shù)據(jù)新聞則被定義為收集、清洗、組織、分析、可視化并發(fā)布數(shù)據(jù)以此來支持事件的一種新聞形式,并且數(shù)據(jù)新聞和計算機輔助報道在實踐當中的發(fā)展與數(shù)據(jù)開放的進程密不可分。
由于數(shù)據(jù)新聞起源于計算機報道,互聯(lián)網(wǎng)的趨勢是逐步走向交互性,所以交互性成為數(shù)據(jù)新聞的核心。即使在沒有可視化的情況下,交互性也是可以進行的,這是如今騰訊新聞發(fā)展的一個重要標志。
2.3計算新聞
當然,數(shù)據(jù)新聞從業(yè)者常常會運用一些非結(jié)構(gòu)化信息,如文本、音頻、視頻,而不僅僅是那些老舊形式的信息,如充斥著行列數(shù)字的電子表格和數(shù)據(jù)庫。
在社會管理越來越復(fù)雜的情況下,新聞報道可以預(yù)測并增加人類未來的確定性,從而讓人類避免各種各樣的災(zāi)難和不幸,姜進章認為,新聞報道在未來一定會迸發(fā)出更加強大的力量。
3.1計算新聞的辨識
在計算新聞的辨識上,很多人把它和計算機輔助報道、數(shù)據(jù)新聞混為一談。一般來說,區(qū)分出計算新聞可以從四個方面著手。
第一,計算新聞帶來了一個嶄新發(fā)展的新聞領(lǐng)域,不是以更多的技術(shù)手段進行“業(yè)務(wù)照?!?。當下新聞界存在誤區(qū),即使物理方面的設(shè)施得到更新,業(yè)務(wù)照常依然是行不通的。技術(shù)需要顛覆整個業(yè)務(wù),只要是業(yè)務(wù)照常,都是十分危險的。
第二,計算新聞是一個記者如何工作的新認識,是新的經(jīng)濟體的分布式和共同創(chuàng)造性的知識生產(chǎn),協(xié)同創(chuàng)新將成為計算新聞的核心。
現(xiàn)在市場上流行三個關(guān)鍵詞,第一,共享經(jīng)濟,第二協(xié)同創(chuàng)新,第三眾包合作。姜進章教授認為這三種方式一方面將在未來十年摧毀一半以上的制造業(yè),另一方面將誕生強大的新的經(jīng)濟組織,包括新聞媒體。這三者中,被擺在第一位的是協(xié)同創(chuàng)新,姜進章認為所有的記者、編輯未來將在一個與外界完全鏈接的平臺上工作,任何一個報道都是對整個媒體價值的反映,是局部融入到整體的工作方式。
第三,計算新聞預(yù)示著一個擴展視野、擴展管理、擴展生產(chǎn)經(jīng)營和擴展協(xié)同創(chuàng)作的新聞價值網(wǎng)。雖然當前大量的媒體組織還在價值鏈上生存,但需要意識到價值鏈正在逐漸被價值網(wǎng)摧毀,而價值網(wǎng)就是一個眾包合作的模式。同質(zhì)的內(nèi)容意味著沒落,整個社會都要進行價值網(wǎng)絡(luò)的再分配,每個媒體擁有自己唯一的核心業(yè)務(wù),而且是其他組織的非核心業(yè)務(wù),這樣才能獲得長期競爭力。
第四,協(xié)調(diào)記者基于數(shù)據(jù)的分布式任務(wù)而進行的元數(shù)據(jù)報道。大量的策劃,整體性的平臺策劃將成為計算新聞的核心。數(shù)據(jù)新聞是在開放、開源運動的推動下生產(chǎn)的,它融合了統(tǒng)計分析、計算機科學(xué)、可視化與網(wǎng)頁設(shè)計等用于新聞報道;計算新聞則似乎無所不包,它綜合使用算法、數(shù)據(jù)和社會科學(xué)方法。
3.2數(shù)據(jù)報道、可視化與交互
在數(shù)據(jù)報道的要求當中,一定要知道數(shù)據(jù)報道是獲取、清洗和分析數(shù)據(jù),以此來為新聞報道服務(wù)。其要求包括:有效利用計算機輔助報道或分析,來進行新聞寫作;運用各種精確新聞,包括出于新聞的考慮使用社會科學(xué)研究方法;可視化數(shù)據(jù)(包括繪制地圖和圖表),以服務(wù)問題的深化和分析;進行編程來獲取和分析數(shù)據(jù),最終完成新聞故事等。
在技術(shù)要求方面,數(shù)據(jù)報道要求援引公共記錄法、發(fā)送請求、獲取數(shù)據(jù);具有使用網(wǎng)絡(luò)爬蟲工具的能力、使用相關(guān)數(shù)據(jù)庫軟件的能力、理解統(tǒng)計概念及軟件的能力以及使用繪圖及可視化工具的能力。
數(shù)據(jù)可視化一定是一個交互的過程,所以要通過代碼來做數(shù)字出版,以及通過編程及數(shù)據(jù)庫管理來建立交互式數(shù)據(jù)新聞作品。可視化與交互的要求有:利用可視化中的交互式圖表與信息圖來進行展示;交互式應(yīng)用,包括檢索數(shù)據(jù)庫、幫助讀者深入理解新聞故事的游戲等。這些應(yīng)用都可能成為數(shù)據(jù)新聞項目的一部分。
3.3計算新聞的績效:賣方廣告為例
計算新聞技術(shù)可以提供調(diào)查新聞的新基礎(chǔ),增加新形式的范圍與讀者互動,并吸引和留住在線的受眾。因為其增強了讀者的經(jīng)驗和參與度,同時更好地利用新的信息環(huán)境,降低調(diào)查報告的成本。
在計算新聞中,實時性廣告、賣方廣告將占主導(dǎo)。眾所周知,新聞媒體長期處于買方廣告為主的商業(yè)模式,所以媒體的經(jīng)營方式日趨固化——通過廣告主的委托進行廣告銷售。在這樣的情況下,媒體的工作能力和傳播市場的感受是被動發(fā)生的狀態(tài),并且顯然廣告主對傳播效果的把握一定不及媒體機構(gòu),也有極大的不確定性和不可測量性。
未來的營銷方式是賣方廣告,即在新聞事實中植入廣告,回頭根據(jù)廣告主的持續(xù)要求和實際效果收取費用。姜進章預(yù)測賣方廣告10年后將占據(jù)80%的比重,因此要求媒體不能沉浸在往日的輝煌中。正如社會最中堅的力量來源于民智——民間智慧,可以用以對抗未來一切的不確定性,因此智庫、思想市場在2017年將在全國范圍內(nèi)建立起來,智庫的核心就是賣方研究。
供給側(cè)改革一定是把買方主導(dǎo)的社會轉(zhuǎn)化為賣方,才能讓精英和專業(yè)成為社會主導(dǎo)。從前是粗放的買方的市場經(jīng)濟,現(xiàn)在則必須顛覆。與此關(guān)聯(lián)的廣告也需要進行轉(zhuǎn)型升級,不需要通過談判來委托買方,而是通過優(yōu)質(zhì)效果的廣告讓企業(yè)自愿掏腰包。
另外,由于計算新聞可以提高用戶的參與度,并使更大化的互動通過新的傳播形式,包括網(wǎng)絡(luò)社區(qū)和社會網(wǎng)絡(luò)工具提供給讀者。因為參與性不僅包含了受眾,也包含了廣告業(yè)主,所以基于這樣的互動性,在播放的過程中,就會有廣告主在平臺上請求添加廣告內(nèi)容,這也要求媒體在傳播過程中有實時的傳播效果報道,如觀看人數(shù)等,可以形成實時的賣方廣告。由此發(fā)展出來的實時性的眾包營利模式將成為市場經(jīng)濟的主體。
4.1計算新聞的機會
美聯(lián)社做了這樣的一個設(shè)想,因為將來的技術(shù)是可以生成思想的,因此某些已經(jīng)被定義好了的問題通過算法一次開發(fā),可以進入無限次低成本的撰寫新聞,還能用不同的語言適應(yīng)不同讀者的個性化需求,并且相比于記者,算法可以更快速地輸出。
這些明顯的經(jīng)濟效益,完全符合新聞機構(gòu)的訴求:降低成本的同時,增加新聞數(shù)量、提供個性化的內(nèi)容。正如中國現(xiàn)在出現(xiàn)的很多網(wǎng)紅、播客等直播視頻,這些產(chǎn)品很快會植入更多的計算新聞的內(nèi)容。
計算新聞的核心是協(xié)同創(chuàng)作,根據(jù)目前媒體發(fā)展的趨勢,對于計算新聞來說存在五大機會:
第一,不同的數(shù)字來源的信息結(jié)合;
第二,信息大量的提取,全方位的提取。如果做到這樣的提取,一定能在過去的文檔中探索,在冗余的信息中進行再利用,形成突破性的創(chuàng)新。
第三,就是文檔探索和冗余,包括尋找新的和累積的文檔,并自動探索和消除冗余。
第四,音頻和視頻索引。當觸摸媒體發(fā)展到一定程度以后,語音智能將成為第二個時代。Siri的發(fā)展就是一個前提,今后許多記者將通過計算新聞的語音識別來解決大量的影像、視頻問題。
第五,提取表單和報表數(shù)據(jù)的作用。今后可以對照excel等表單直接提取內(nèi)容發(fā)表言論,不需要記者再調(diào)用數(shù)據(jù)函數(shù)。這樣的軟件開發(fā)將大大提高記者的生產(chǎn)效率,同時開拓記者廣大的視野。
4.2常見的數(shù)據(jù)陷阱與預(yù)防
當然,姜進章教授也表示,只要是利用了數(shù)據(jù),就會存在一定的數(shù)據(jù)陷阱。常見的數(shù)據(jù)陷阱有,第一,相關(guān)性不等于因果;第二,數(shù)據(jù)源使用不當會帶來結(jié)果偏差,草率代入無法代表真相,第三,忽略數(shù)據(jù)背景,個體無法指代全體;第四,遺漏方法論,在報道中沒有注明是使用什么方法。這些都會是使報道受質(zhì)疑詬病的因素。
因此,對于完成數(shù)據(jù)新聞報道的記者來說,需要具備一定的數(shù)據(jù)素養(yǎng),以預(yù)防此類陷阱,每個記者不僅僅要做人文的內(nèi)容還要具備批判性的思維,對數(shù)據(jù)要有一定的敏感性。現(xiàn)在學(xué)界提倡三大思維,第一科學(xué)思維,第二人文思維,第三個是2012年國際上出現(xiàn)的叫偶然觀思維,也就是人類對于該系統(tǒng)為什么能夠避免風險,把環(huán)境的變量引入到系統(tǒng)中來再分析。記者探究的領(lǐng)域需要擴大,與環(huán)境不斷交互一定會發(fā)現(xiàn)更多的東西。
除此以外,數(shù)據(jù)素養(yǎng)還有對數(shù)據(jù)搜索能力,有數(shù)據(jù)分析處理能力,利用數(shù)據(jù)進行最終的決策等。正如前面提到的上海金山水上飛機首航撞橋事件,如果在報道現(xiàn)場不是采用傳統(tǒng)報道的方式,不是僅僅帶著攝像機上飛機,而是通過無人機計算出航行路線和目的地,無人機的攝像可以在飛機的上方做出大面積的扇形掃描,可以發(fā)現(xiàn)橋梁,慘案也是可以避免的。
“最偉大的新聞是預(yù)測并拯救人類的一切危機,給人類不斷提供確定性”,媒體改革的最終目的還是服務(wù)于人類社會的發(fā)展,計算新聞不僅是手段,也將成為人腦的一部分,將成為媒體產(chǎn)業(yè)的部分主體。
(以上內(nèi)容根據(jù)姜進章教授在中國新聞技術(shù)工作者聯(lián)合會2016年學(xué)術(shù)年會上的主題演講整理。)