陶萌萌 南京傳媒學院新聞傳播學院
自動化新聞可以定義為通過算法有目的地挖掘現有數據來創(chuàng)建新聞內容。自然語言生成技術很大程度上支持了新聞自動化,它可以幫助記者進行新聞采集及新聞傳播,在描述性報道中大幅提升寫作效率。當下,自動化新聞在社交網絡及事實核查中都起到了重要作用。這種新技術在傳媒領域的大量應用對業(yè)界及社會影響深遠。在實踐中,自動化新聞與記者的互動使得其定位逐步清晰,其在文化傳媒領域的發(fā)展前景也會更為廣闊。
近年來,記者們開始學習多媒體報道、網頁設計、數據分析以及算法編程,這些對生產自動化新聞尤為重要。自動化新聞可以定義為通過算法有目的地挖掘現有數據來創(chuàng)建新聞內容[1]。盡管人們擔心自動化的新聞報道可能會被用于傳播錯誤信息,甚至會讓文化傳媒專業(yè)人士失去工作,但如果做得合乎情理及規(guī)范,這種報道方式也會帶來諸多好處。其中包括推動事件講述進程、信息收集及協(xié)助核查基本事實等,這些是新聞業(yè)最基本且最關鍵的社會功能[2]。
盡管人們并不能完全理解其運行機制,算法和自動化在當代生活中已經變得無處不在。人們的日常生活越來越受到背后的數學模型及數據系統(tǒng)的影響。從計算機和信息科學中的概念可以看出,算法遵循一系列預先設計的步驟或規(guī)則來解決問題。實際上,算法和自動化技術已經導致人類決策被軟件增強,甚至部分被軟件所取代。這種增強和替代現象已經很普遍,甚至在一些行業(yè)中占據主導地位。這一趨勢同樣在新聞媒體中出現,以至于從初始階段的新聞生產到后期的新聞消費,算法已經開始影響新聞業(yè)的諸多方面。
數字化新聞的理念出現在2000年之后,數據、代碼、軟件作為新概念來到新聞業(yè)當中,全面地發(fā)掘算法和自動化在傳媒工作中的潛在影響。到2010年代中期,完全自動化和半自動化的新聞收集、過濾、編輯和分享已經在新聞編輯部占據越來越重要的位置[3]。也就是說,新聞生產的規(guī)范、模式和管理正在發(fā)生變化,甚至在更根本的層面上,關于誰(人還是機器)來從事新聞工作的問題也開始被探討。例如,一些算法被用來過濾社交媒體平臺上發(fā)布的大量信息并從中挑選出具有潛在新聞價值的內容。
此外,通過將體育成績和財務報告的結構化數據轉化為敘事新聞文本,在較少或沒有人工干預的情況下,相關算法可被用于生成多篇自動化新聞報道。自動化過程還可以被用來傳播信息,使得消費者更多地接觸他們所喜歡的事物,這基于算法對他們行為特征和社交網絡的總結歸納?,F在看來,在算法倫理及其問責機制等課題被充分討論的基礎上,算法更需要被理解為人類和機器的結合。在這個進程中,自動語言生成技術在自動化新聞中也體現出其重要作用。
具體說,自然語言生成技術是從結構化數據中自動生成文本的技術。它在過去十年已經被諸多公司產品化、商業(yè)化。這項技術最早出現在20世紀50年代,是機器翻譯工作的一部分,其使用范圍在最近幾年迅速擴大。當代自動語言生產類產品主要以企業(yè)工具的形式銷售,這些工具可以幫助沒有專業(yè)知識的人從大數據中獲益?,F在,這些技術也越來越多地用于新聞機構例行寫作任務的自動化,即自動化新聞。
以往對自動化新聞的研究將其歸類為定量新聞的一種形式,有時也被稱為“算法新聞”或“機器人新聞”[4]。有關研究關注的是記者對自動化的專業(yè)使用、受眾對自動化內容的看法、自動化新聞對社會和經濟的影響以及關于文化、倫理的問題。由于新聞機構需要可持續(xù)的商業(yè)模式,對于媒體來說,在提高新聞內容生產效率方面存在著巨大的經濟壓力,故在新聞編輯部中對自動化新聞的使用一直呈上升之勢。
早期使用自然語言生成技術實現新聞自動化的例子大多局限于相對較短的文本,其生成的文本通常與人工寫作難以區(qū)分,文檔的數量也大大超過了人工編輯可能達到的數量。盡管自動化的寫作工具在被整合到出版工作的過程中取得了一定程度上的成功,但人們普遍認為,自動語言生成技術在實現新聞寫作自動化方面的潛力僅限于以數據呈現的簡單描述,其中最明顯的例子是體育和財經類新聞的寫作。這種描述性報道可成為新聞的重要組成部分,也可以是大多數新聞編輯部的選擇之一,但自動語言生成技術尚未被證明適合生產長篇新聞作品,而且目前它無法做到將新聞中的故事更加精彩而生動地展現出來[5]。
具體說,自動化新聞是指使用算法來完成可能由人類操作的新聞相關任務。自動化可以幫助記者進行新聞采集及新聞傳播。在新聞采集方面,有學者認為,自動化新聞能夠節(jié)省記者的時間,從而使其專業(yè)水平有更多提升空間[6]。比如在體育比賽及商業(yè)服務中,自動統(tǒng)計重要事件并匯編呈現已被證明是卓有成效的操作方式。將這些事件做自動化處理能夠為記者提供時間和機會,將人文背景元素引入相關事件。此外,像聊天機器人可以就某些話題來接受受眾的提問并作出簡要回答,最大程度上節(jié)省人力、物力。
研究表明,到目前為止,受眾尚無法從根本上區(qū)分人和電腦制作的新聞[7]。傳媒人對自動化新聞也有復雜的認知。有來自新聞報道一線的記者看到了自動化新聞的潛力,可用其擴大信息的深度、范圍和即時性。但也有人認為這可能會對他們的職業(yè)生涯造成影響,因為自動化的應用會減少對人類記者的需求,進而引發(fā)大量裁員。其他擔憂如數據存儲、隱私權、軟件更新及許可等,這些也被時常提及。在新聞領域,使用自動化最大的挑戰(zhàn)在于算法的可靠性以及所用數據的可靠性。質量較差的數據可能會導致不夠理想的結果,而自動化卻可以擴大其傳播的速度和規(guī)模。
盡管自動化新聞通常是由實踐所驅動的,學術界也開始圍繞自動化新聞的理論進行思考。例如,有學者建議將人機互動作為重心來理解機器成為傳播源的理由。這樣,關于自動化新聞的研究就可被納入學術研究框架。具體講,與自動化新聞有關的人工智能技術的功能、外部關聯(lián)及其原始用途的研究可以被區(qū)分,以便后續(xù)討論能夠更加專業(yè)化。
聊天機器人是自動化新聞的新穎表現形式。它是一種會話式用戶界面,在諸如客戶服務等環(huán)境中很常見,但它作為新聞傳播的媒介應用卻比較稀有。現在,這種情況已經開始改變,英國廣播公司(BBC)等公共服務新聞機構正在開發(fā)聊天機器人,用戶如果想要了解王室婚禮新聞的細節(jié),可以選擇與機器人對話,直接而迅速地獲取婚禮日期、儀式細節(jié)等一系列滿足用戶需求的信息,從而避免了其他無用信息對用戶的干擾。聊天機器人的使用在一定程度上是被社交媒體平臺的演變推動的,因為當下人們獲取信息的渠道已開始由公域社交媒體轉向私域社交媒體,BBC等公共服務媒體認為有義務讓它們的報道在受眾所選擇的平臺上出現。
研究顯示,聊天機器人的受眾普遍對其持積極態(tài)度,并欣賞這種非正式、口語化的新聞獲取模式,包括獲取信息的便利程度[8]。為聊天機器人提供支持的記者也普遍對其持積極態(tài)度,認為這是更優(yōu)質的服務受眾的方式。盡管有這些積極的反饋,也有學者談到了聊天機器人依賴社交媒體平臺的網絡基礎設施可能帶來的影響和后果,包括它是否有權使用公眾數據等問題。
報道及事實核查被認為是一則優(yōu)秀新聞的基本要素。自動化新聞的重要潛在用途就是提供事實核查服務。在信息化社會中,人們對錯誤信息傳播的擔憂使得自動化的使用恰逢其時。從理論上講,自動驗證可以用來檢查社交媒體上發(fā)布及轉發(fā)的聲明。有專業(yè)人士創(chuàng)制軟件用以分辨社交媒體上信息的真?zhèn)?,他們發(fā)現盡管自動驗證可以對社交媒體上的虛假內容加以限制,但信息準確性的最終判斷仍然需要人工介入。就目前而言,大多數的事實核查工作還是由人工和電腦配合完成的。
自動化新聞中的算法可以說是人類能力在機器上的增強表現形式。但到目前為止,完全可靠算法的實踐例證并不多見。與此同時,大型科技公司用來幫助用戶的算法卻客觀上助長了諸如性別歧視和偏見等社會負面因素。盡管有新聞工作者認為技術的進一步發(fā)展是現存問題的解決方案,可人們解決技術問題的能力卻是有限且不確定的。新聞業(yè)在傳統(tǒng)意義上提倡客觀,而科技公司在回應對其算法的批評時,往往聲稱它是客觀的。現在來看僅僅做到客觀仍然不夠,業(yè)界和學界需要更加適應并熟悉自動化新聞工作中的新規(guī)律及其影響,只有這樣,對其傳播效果的討論才能更加公允。
計算機在新聞領域的應用并不新鮮,人們也不斷強調在計算和新聞的交叉點上描繪最新的趨勢和技術。半個世紀以來,一直有記者在嘗試使用計算機進行數據分析。利用軟件為讀者選擇新聞并做呈現,也有幾十年的歷史。自20世紀80年代以來,新聞出版商就開始使用推薦系統(tǒng)進行新聞個性化。如今,自動化新聞已經被一系列新聞機構所采用,在大規(guī)模信息收集等方面起到重要作用。
隨著時間的推移,新聞業(yè)開始全面使用計算技術,包括利用自動化和算法來撰寫各類新聞文本。起初,傳統(tǒng)靜態(tài)新聞文本的自動化是研究的主要對象。隨著新聞聊天機器人的開發(fā)和部署,一些新穎的交互式界面也受到了各界的重視。學界和業(yè)界都在探討這些模仿人類交流和行為的自動化技術形式在社會、文化、規(guī)范及制度等方面的深層含義。
學者桑斯坦認為,無論是由于自己的選擇還是他人的選擇,網民被孤立在信息回音室中(在網絡空間內,人們經常接觸相對同質化的人群、信息和評論,會窄化自己的眼界和理解),可能會導致信息獲取障礙,從而形成對社會的錯誤認知[9]。既然計算技術的應用不可避免地依賴出版商、網絡平臺和社會組織,故以上擔憂會在一定范疇內持續(xù)存在。
隨著媒體和社會的數字化以及數據新聞的不斷發(fā)展,以計算技術為基礎的新聞報道已日臻成熟。如今,在新聞的組織、生產以及分發(fā)等方面,算法和相關自動化形式也逐漸顯示出其重要性。記者們相信這種新技術的發(fā)展將改變他們的工作方式,并幫助他們重新審視自己的核心技能。他們認為,來自機器新聞的競爭將使得記者專注于只有人類能做的工作。創(chuàng)造力、分析能力和個性將變得更加重要,而專業(yè)的日常工作將逐漸被自動化。當日常的新聞工作可以自動化時,記者在壓力下就必須提供更好的產品。在這種情形下,記者需要專注于自己的比較優(yōu)勢,而不是在自動化新聞占優(yōu)的領域里競爭。
具體說,自動化新聞的優(yōu)點是邊際成本低、文章撰寫速度快。這種計算機生成的語言被認為可讀性相對較差。記者的寫作能力、幽默感、哲學思維和呈現較為復雜且多樣化句子的潛力是他們的主要競爭優(yōu)勢。人類記者具有較強的分析能力、創(chuàng)造技能以及自己的個性,這使他們能夠以獨特的視角對事件進行深入分析,仔細觀察后完成文章寫作。他們的反應靈敏,專業(yè)能力較強,使其能夠精準報道突發(fā)性新聞、做調查性報道及完成深度分析,而當下的算法還無法涉獵這些有關高質量新聞報道的技能。
在自動化新聞不斷發(fā)展的今天,記者的優(yōu)勢更多地體現在文本寫作的分析力以及創(chuàng)造性上,而不僅是客觀性和時效性。記者需要在工作中提供更深入的新聞報道和背景解析。現在來看,專欄、突發(fā)新聞報道、特寫和新聞分析等文章類型是人類記者的優(yōu)勢領域。
總體而言,因為要完成的任務及滿足的受眾需求相似,人類記者和自動化新聞寫手可以是競爭的關系,但他們在各自完成不同任務的時候,因其特性能夠互補,故亦可被視為合作關系。此外,當專業(yè)記者利用自動化新聞的元素完成報道任務時,二者即達成了融合的狀態(tài)。日常工作自動化之后,記者將會擁有更多的時間進行深度報道。越來越多的案例顯示,新聞業(yè)的這種人機分工合作已經日趨主流。隨著自動化新聞在當代文化傳媒領域的定位逐步清晰,其發(fā)展前景也將會更為廣闊。