王 勇 王 磊 孟光升
美國技術(shù)史學家魯斯·施瓦茨·柯望曾指出:“電子傳播的整個歷史,都遵循著在20世紀最初幾十年的廣播歷史中建立起來的模式”;“在無線電廣播出現(xiàn)的早期,許多人認為這將是人類傳播的最終形式,……但有些善于發(fā)明創(chuàng)造的人已經(jīng)開始嘗試設(shè)計新的傳播介質(zhì)”;“電子界的變化步伐一直是相當快的,而且沒有哪個單獨的人、公司、元器件或媒介能夠長時間地占據(jù)主導地位”[1]。特別是近年來,隨著計算機技術(shù)、互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,傳播技術(shù)更是呈現(xiàn)出加速度發(fā)展趨勢,新的傳播工具、傳播手段不斷涌現(xiàn),并帶來了新聞生產(chǎn)方式的不斷變革。就在數(shù)據(jù)新聞方興未艾,被認為是“新聞發(fā)展趨勢”“新聞改革方向”,甚至是“新聞業(yè)的未來”時,機器人新聞又橫空出世了?!懊缆?lián)社、紐約時報用機器人寫新聞的消息一度充斥媒體,最近騰訊財經(jīng)也用機器人寫新聞了”[2];“近兩年來,‘機器人記者’以迅猛之勢進入了大眾視野”[3],“國內(nèi)外新聞業(yè)界和學界都在熱議‘機器人新聞’”[4]。
機器人新聞是在數(shù)據(jù)新聞的基礎(chǔ)上發(fā)展起來的,是對數(shù)據(jù)新聞的超越,擁有一些數(shù)據(jù)新聞所不可比擬的優(yōu)勢。但作為一種新的新聞報道方式和傳播手段,機器人新聞并不完美,它不但繼承了數(shù)據(jù)新聞的一些“基因缺陷”,而且還存在一些新技術(shù)所帶來的不足。
數(shù)據(jù)新聞與機器人新聞都是計算機時代、互聯(lián)網(wǎng)時代、大數(shù)據(jù)時代的產(chǎn)物,都是通過計算機技術(shù)、互聯(lián)網(wǎng)技術(shù)搜集、過濾、統(tǒng)計、分析數(shù)據(jù)信息,發(fā)現(xiàn)有價值的新聞事實,產(chǎn)制新聞。數(shù)據(jù)信息是數(shù)據(jù)新聞和機器人新聞共同的基礎(chǔ)和核心內(nèi)容。
數(shù)據(jù)新聞(data journalism),“是指采用計算機技術(shù)、網(wǎng)絡(luò)技術(shù)抓取、挖掘、過濾、統(tǒng)計、分析數(shù)據(jù)和可視化呈現(xiàn)數(shù)據(jù)來報道具有新聞價值的事實的新聞報道形式”[5]。2009年,英國《衛(wèi)報》率先嘗試進行數(shù)據(jù)新聞的生產(chǎn)實踐;2010年,全球第一屆國際數(shù)據(jù)新聞圓桌會議在荷蘭阿姆斯特丹召開;2011年,第一本數(shù)據(jù)新聞專業(yè)書籍《數(shù)據(jù)新聞手冊》在歐洲新聞學中心和開放知識基金會的倡導下編寫面世;2012年,首個國際數(shù)據(jù)新聞獎由谷歌與全球編輯網(wǎng)合作設(shè)立并進行了首次評獎頒獎。此后數(shù)據(jù)新聞風靡世界許多大大小小的新聞媒體,成為一種非常熱門的新聞報道方式和傳播手段。
數(shù)據(jù)新聞的關(guān)鍵和核心是“數(shù)據(jù)”,它是通過抓取、分析數(shù)據(jù)信息和可視化呈現(xiàn)數(shù)據(jù)來報道新聞的,所以數(shù)據(jù)新聞又被稱為“數(shù)據(jù)驅(qū)動的新聞”(data driven journalism)?!皵?shù)據(jù)新聞的產(chǎn)生,是社會的進步、媒介環(huán)境的變化、技術(shù)的發(fā)展、受眾的需求、新聞界的追求等多種因素共同影響、共同作用的結(jié)果”[6],其中有兩個最關(guān)鍵的推動因素:
一是社會的發(fā)展進步帶來了大量可獲取的數(shù)據(jù)資源。進入21世紀后,民主理念進一步普及,加之“維基解密事件”等一些重要事件的推動和倒逼,使信息公開特別是涉及公共利益的信息的公開成為時代共識和社會強烈要求,信息公開以及信息收集、加工、存儲、傳播技術(shù)的發(fā)展帶來了大量可公開獲取的數(shù)據(jù)資源;而互聯(lián)網(wǎng)、手機等新媒體和博客、論壇、播客、微博、微信、推特、臉譜等社交媒體的不斷普及,成為人們學習、工作、娛樂、社交的重要工具和發(fā)表意見、交流感情、表達思想的重要平臺,它們記錄下了人們的思想、態(tài)度、行為方面的海量信息;還有物聯(lián)網(wǎng)時代遍布社會各個角落的傳感器記錄下的海量信息等,這些都使可挖掘、獲取、分析的數(shù)據(jù)資源前所未有的豐富。
二是科學技術(shù)的發(fā)展進步提高了挖掘、抓取和處理數(shù)據(jù)的技術(shù)。近年來,隨著科學技術(shù)的發(fā)展,特別是計算機技術(shù)、互聯(lián)網(wǎng)技術(shù)的發(fā)展,數(shù)據(jù)挖掘、抓取、過濾、統(tǒng)計、分析和可視化技術(shù)得到了長足進步,從而為新聞媒體獲取數(shù)據(jù)、處理數(shù)據(jù)、可視化呈現(xiàn)數(shù)據(jù)奠定了技術(shù)基礎(chǔ)。
總之,正是社會的進步帶來了大量可獲取的數(shù)據(jù)資源,科技的發(fā)展帶來了挖掘、抓取和處理數(shù)據(jù)的技術(shù),從而促發(fā)了數(shù)據(jù)新聞的產(chǎn)生。
機器人新聞(robot journalism),又稱自動化新聞(automated journalism)、計算機生成內(nèi)容(computer-generated content)等等,“是指由新聞機器人自動搜集、分析數(shù)據(jù)信息,發(fā)現(xiàn)有價值的新聞事實,并套用既有的新聞模板自動撰寫而成的新聞”[7]。機器人新聞與傳統(tǒng)新聞或者說一般新聞最大的區(qū)別是,直接從事機器人新聞生產(chǎn)的主角不是人類記者,而是新聞機器人,即“一套軟件或算法語言”,“它自動采集數(shù)據(jù),然后撰寫成人類可讀的內(nèi)容”[4]。
機器人新聞與數(shù)據(jù)新聞一樣,也是利用計算機技術(shù)、互聯(lián)網(wǎng)技術(shù)挖掘、抓取、過濾、統(tǒng)計、分析數(shù)據(jù)信息來報道具有新聞價值的事實,數(shù)據(jù)也是機器人新聞的基礎(chǔ)和核心內(nèi)容。早在1968年,美國明尼阿波利斯《明星論壇報》的編輯兼出版商Otto Silha在一次公開演講中,曾設(shè)想了未來的編輯機,它能“用數(shù)值確定故事中每個單詞的價值,并通過數(shù)學公式確定故事中最重要的是什么,然后按照指示,重新生成故事”[8]。這是對新聞機器人的較早構(gòu)想,這一構(gòu)想的重要意義在于它較早地認識到“數(shù)值”轉(zhuǎn)變在自動化寫作中的重要性,在于它向人們提示了數(shù)據(jù)是機器人新聞的基礎(chǔ)和核心?!敖裉?,正是來自商業(yè)報道的財報、體育報道的賽事、醫(yī)療的臨床數(shù)據(jù)、天氣預(yù)報的氣象指標、教育的升學和就業(yè)指數(shù)、交通路況的行車流量等不同領(lǐng)域的信息,經(jīng)過數(shù)據(jù)化處理后成為驅(qū)動機器自動撰寫新聞報道的不竭‘原油’”;“數(shù)據(jù)是機器新聞生產(chǎn)的‘原油’”[8]。如美國Autamated Insights公司開發(fā)的新聞機器人Wordsmith,將它與相關(guān)的數(shù)據(jù)平臺連接,就能自動即時獲取數(shù)據(jù),迅速完成數(shù)據(jù)處理和信息發(fā)布?!皺C器之所以能運用數(shù)據(jù)快速進行自動化新聞生產(chǎn),不僅取決于Wordsmith之類的自動寫作軟件已具備對數(shù)據(jù)進行快速處理的能力,更重要的是數(shù)據(jù)本身具有規(guī)?;⒉僮魍该骰?、獲取開放性等‘媒介性’”[8];“適合通過機器或算法進行的新聞寫作,一般是以各種數(shù)據(jù)、圖表的引用和分析為基礎(chǔ)的硬新聞,新聞的主體來源于對數(shù)據(jù)的引用、解釋和分析,具有明顯的‘數(shù)據(jù)處理’色彩”[9];“機器人新聞的產(chǎn)生基于日益龐大的數(shù)據(jù)庫,是數(shù)據(jù)新聞的延伸和應(yīng)用。”[10]
機器人新聞雖然與數(shù)據(jù)新聞一樣通過利用計算機、互聯(lián)網(wǎng)技術(shù)抓取、處理數(shù)據(jù)來報道新聞,但機器人新聞是在數(shù)據(jù)新聞的基礎(chǔ)上的進一步發(fā)展。數(shù)據(jù)新聞是人類記者確立新聞選題后,設(shè)計數(shù)據(jù)挖掘、抓取、過濾、統(tǒng)計、分析程序,并操作程序來挖掘、抓取、過濾、統(tǒng)計、分析相關(guān)數(shù)據(jù),發(fā)現(xiàn)新聞故事,并由人類記者撰寫新聞,用可視化技術(shù)呈現(xiàn)新聞,人在其中起關(guān)鍵作用,計算機程序只起輔助作用,所以數(shù)據(jù)新聞也被人稱之為“計算機輔助報道”[11];而機器人新聞是人類根據(jù)某類基于數(shù)據(jù)化事實的新聞,設(shè)計一套“搜集數(shù)據(jù)——分析數(shù)據(jù)——套用模板——撰寫稿件”程序,并讓其自動與相關(guān)數(shù)據(jù)平臺相連,自動運行,一旦有數(shù)據(jù)生成,它就自動抓取、分析數(shù)據(jù),并按既有模板撰寫稿件。這其中除了設(shè)計程序以及有些在最后設(shè)有人工審核把關(guān)環(huán)節(jié)外,全部都是由計算機程序自動完成。“機器人新聞最大的特征是新聞生產(chǎn)的全自動化。在具體新聞寫作過程中,人工參與并不是新聞產(chǎn)品產(chǎn)出的關(guān)鍵和決定性環(huán)節(jié),新聞生產(chǎn)的主體實現(xiàn)了由人向機器的轉(zhuǎn)變?!盵10]因此,機器人新聞是在數(shù)據(jù)新聞的基礎(chǔ)上的進一步發(fā)展,是在數(shù)據(jù)新聞的基礎(chǔ)上引入了自然語言生成技術(shù),是“數(shù)據(jù)新聞+自然語言生成技術(shù)”,使人工撰寫新聞稿件變成機器(程序)自動生成新聞稿件,實現(xiàn)了新聞的全自動化生產(chǎn),它是技術(shù)不斷進步特別是人工智能技術(shù)發(fā)展的產(chǎn)物。
美國媒介理論家保羅·萊文森曾提出過“補救性媒介”理論。他認為任何媒介都是不完美的,都需要不斷地進行改進;后續(xù)媒介通常在某些方面對前面的媒介進行了改進,可看作是對前續(xù)媒介的“補救”。“整個的媒介演化進程都可以看作是補救措施”,“因特網(wǎng)可以看作是補救性媒介的補救性媒介,因為它是對報紙、書籍、電臺和電話等等媒介的改進”[12]。機器人新聞作為在數(shù)據(jù)新聞基礎(chǔ)上發(fā)展起來的一種后續(xù)新聞報道方式和傳播手段,在某種意義上也可以說,它是對本身存在不足的數(shù)據(jù)新聞的一種“補救”,具體表現(xiàn)在機器人新聞對數(shù)據(jù)新聞的以下超越:
數(shù)據(jù)新聞是人類記者確定一個新聞選題后,根據(jù)報道構(gòu)思設(shè)計編制程序搜集數(shù)據(jù),過濾、統(tǒng)計、分析數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)中的新聞故事,撰寫新聞并利用可視化技術(shù)呈現(xiàn)數(shù)據(jù)。數(shù)據(jù)新聞的生產(chǎn),雖然利用了計算機技術(shù)、互聯(lián)網(wǎng)技術(shù),但從確定選題,進行報道構(gòu)思,到設(shè)計編制搜集、過濾、統(tǒng)計、分析數(shù)據(jù)的程序,再到操作程序搜集、過濾、統(tǒng)計、分析數(shù)據(jù),發(fā)現(xiàn)新聞故事,最后撰寫新聞,并利用或設(shè)計編制程序可視化呈現(xiàn)數(shù)據(jù),都離不開人的親力親為,都需要耗費人的大量腦力、體力,而且這中間人是起主導作用和主要作用的,計算機只起到一個輔助工具的作用,因此最多只是一種半自動化生產(chǎn)。
而機器人新聞不同,它一般是針對某一類基于數(shù)據(jù)生成或變動的新聞,如地震報道、體育報道、財經(jīng)報道等,設(shè)計一套程序,一旦具有新聞價值的數(shù)據(jù)發(fā)生或變動,這套程序就自動搜集、分析數(shù)據(jù),并撰寫新聞稿件。整個新聞稿件的產(chǎn)制過程都是由電腦程序也就是寫稿機器人自動完成的,除了最初的設(shè)計、編制、安裝程序和一些媒體安排的最后審稿把關(guān)環(huán)節(jié)外,沒有也不需要人的參與。例如美國時間2014年3月17日早上6時25分,洛杉磯發(fā)生4.1級地震?!堵迳即墪r報》的地震新聞機器人Quakebot,在搜集到美國地質(zhì)勘探局電腦發(fā)出的地震信息后,自動將數(shù)據(jù)輸入新聞模板寫好新聞并提交采編系統(tǒng),被震醒的記者大致審閱后,按下發(fā)布命令,這則地震報道就在地震發(fā)生后的3分鐘內(nèi)發(fā)布了。整個過程除了最后的審核發(fā)布環(huán)節(jié)外,都是由新聞機器人自動完成的。實際上目前許多媒體對新聞機器人撰寫的新聞甚至不加審核,從數(shù)據(jù)采集到稿件撰寫再到發(fā)布全部由新聞機器人自動完成。如《今日頭條》就是將新聞機器人“小明”撰寫的新聞稿件不經(jīng)編輯審核直接發(fā)布的??傊瑱C器人新聞實現(xiàn)了新聞生產(chǎn)的全自動化,這是人類歷史上第一次實現(xiàn)全自動化新聞內(nèi)容的生產(chǎn)。
因此,數(shù)據(jù)新聞是人類借助電腦程序的協(xié)助來報道新聞,機器人新聞則是人類完全委托電腦程序(新聞機器人)來報道新聞。從數(shù)據(jù)新聞到機器人新聞,一個非常大的進步就是實現(xiàn)了新聞生產(chǎn)從半自動化到全自動化的跨越。
作為一種半自動化的新聞生產(chǎn)方式,數(shù)據(jù)新聞的生產(chǎn)效率比較低。從已有的數(shù)據(jù)新聞生產(chǎn)實踐來看,每制作一篇新聞,一般首先需要編輯、記者確定新聞選題;然后根據(jù)報道構(gòu)思設(shè)計編制搜集、過濾、統(tǒng)計、分析數(shù)據(jù)的程序;再接著操作程序搜集、過濾、統(tǒng)計、分析數(shù)據(jù),發(fā)現(xiàn)新聞故事;最后由人工來撰寫新聞稿件,并利用已有的可視化程序或設(shè)計編制可視化程序來呈現(xiàn)數(shù)據(jù)。一般每生產(chǎn)一篇數(shù)據(jù)新聞,就需要設(shè)計編制一次數(shù)據(jù)搜集、處理程序,稿件還需要人工撰寫并要進行數(shù)據(jù)的可視化呈現(xiàn),導致新聞生產(chǎn)難度大,耗時長,需要花費比較多的人力,效率比較低。目前,在數(shù)據(jù)新聞生產(chǎn)方面走在前面的媒體大都是一天刊發(fā)一篇數(shù)據(jù)新聞,甚至數(shù)天刊發(fā)一篇。據(jù)統(tǒng)計,2012年全球首屆“數(shù)據(jù)新聞獎”收到的286件參賽作品,平均每個作品由3.96個人完成,參與制作人數(shù)最多的作品的人數(shù)達30人之多,作品耗時最長的達7年,最短的也用了8個小時,平均耗時約達160天。[13]數(shù)據(jù)新聞的生產(chǎn)難度之大、效率之低由此可見一斑。
而機器人新聞,它是一種完全自動化的新聞報道方式和傳播手段,而且是一種批量化生產(chǎn),它針對某一類主要基于數(shù)據(jù)生成或變動的新聞設(shè)計編制一套“搜集數(shù)據(jù)——分析數(shù)據(jù)——套用模板——撰寫稿件”的程序后,就交由這套程序全天候24小時自動搜集、分析數(shù)據(jù),撰寫新聞。它充分發(fā)揮了電腦快速、高效的特點,只要一產(chǎn)生有新聞價值的數(shù)據(jù),它就以“一觸即發(fā)式的新聞生產(chǎn)速度”源源不斷地生產(chǎn)新聞,生產(chǎn)效率非常高。如敘述科學公司利用新聞機器人完成一篇體育報道只需要30秒,生成一個新聞標題只需要2秒;Automated Insights公司的新聞機器人Wordsmifh每秒能生產(chǎn)2000篇文章,每周可以寫出上百萬篇文章;在美聯(lián)社,相同的時間內(nèi),人類記者只能產(chǎn)出300條新聞,而機器人記者能產(chǎn)出4400條新聞,差不多是人類記者的15倍;2013年,美聯(lián)社使用Automated Insights公司的新聞機器人Wordsmifh自動撰寫了3億條新聞,是世界上其他所有新聞媒體所生產(chǎn)的新聞數(shù)量的總和,2014年的數(shù)量則達到驚人的10億條。[4]機器人新聞生產(chǎn)速度之快、效率之高令人嘆為觀止。
因此,雖然數(shù)據(jù)新聞與機器人新聞都是基于數(shù)據(jù)的新聞報道方式和傳播手段,但從數(shù)據(jù)新聞發(fā)展到機器人新聞,在生產(chǎn)效率方面實現(xiàn)了非常大的飛躍。這是人類在新聞行業(yè)不斷改進生產(chǎn)技術(shù)、提高生產(chǎn)效率、追求“更快”“更多”的結(jié)果。
作為在數(shù)據(jù)新聞基礎(chǔ)上發(fā)展起來的機器人新聞,雖然它成功引入了人工智能技術(shù),實現(xiàn)了全自動化生產(chǎn),在生產(chǎn)效率方面實現(xiàn)了非常大的飛躍,但正如保羅·萊文森指出的那樣,“技術(shù)有其固有的問題,因為創(chuàng)造技術(shù)的人是不完美的”[12](88);“所有的技術(shù)進步——的確,是所有的進步——并不是沒有缺陷?!盵14]機器人新聞作為一種利用最新傳播技術(shù)的新聞報道方式和傳播手段,也存在許多不足,包括“數(shù)據(jù)”作為核心內(nèi)容所帶來的局限和人工智能技術(shù)本身的不足所帶來的缺陷。
機器人新聞與數(shù)據(jù)新聞一樣,都是利用計算機技術(shù)、網(wǎng)絡(luò)技術(shù)搜集和處理數(shù)據(jù)來報道新聞,只不過數(shù)據(jù)新聞最終需要人工撰寫,而機器人新聞則完全由計算機程序自動完成,但數(shù)據(jù)是數(shù)據(jù)新聞和機器人新聞共同的基礎(chǔ)和核心內(nèi)容?!皼]有大數(shù)據(jù)采集和挖掘、分析系統(tǒng)的支撐,機器自動新聞寫作就成了無源之水、無本之木?!盵9]因此,機器人新聞與數(shù)據(jù)新聞一樣,既擁有數(shù)據(jù)作為內(nèi)容所帶來的優(yōu)勢,也存在數(shù)據(jù)作為內(nèi)容所帶來的局限,即受“數(shù)據(jù)”所限,最突出的就是新聞報道選題有限。主要原因有以下方面:
一是數(shù)據(jù)化的新聞題材有限。數(shù)據(jù)化的新聞題材是指用數(shù)據(jù)來表達的新聞事實,或者說量化的新聞事實,但“許多新聞題材沒有數(shù)據(jù)化或無法數(shù)據(jù)化或沒有必要數(shù)據(jù)化”[15]。目前社會上的絕大多數(shù)新聞事實是沒有數(shù)據(jù)化的,而且許多新聞事實是無法數(shù)據(jù)化的;此外還有許多新聞事實也沒有必要數(shù)據(jù)化,比如人物故事,采用文字講述相比數(shù)據(jù)表達更生動鮮活,更能寫出人情味,就沒有必要進行數(shù)據(jù)化。對沒有數(shù)據(jù)化的新聞事實,機器人新聞還難有用武之地。目前數(shù)據(jù)化的新聞事實主要集中在經(jīng)濟、體育、教育、災(zāi)難、氣象、交通等有限的領(lǐng)域。
二是數(shù)據(jù)質(zhì)量不高。如有些數(shù)據(jù)比較簡單、粗糙、膚淺,有的殘缺不全;有些數(shù)據(jù)不準確,或受到了污染,不“干凈”;有些數(shù)據(jù)格式不規(guī)范等等,導致在機器人新聞生產(chǎn)中無法使用。“如果無法取得結(jié)構(gòu)化的數(shù)據(jù),或者數(shù)據(jù)質(zhì)量較差時,機器人新聞幾無用武之地?!盵16]因此,機器人新聞還受到數(shù)據(jù)質(zhì)量的限制。
三是數(shù)據(jù)收集困難。數(shù)據(jù)收集的困難也會導致機器人新聞生產(chǎn)受到限制。數(shù)據(jù)不開放,不聯(lián)網(wǎng),格式不統(tǒng)一,乃至人為設(shè)置障礙,人為阻撓,都會導致數(shù)據(jù)收集困難,從而無法進行機器人新聞的生產(chǎn)。目前“在全球數(shù)據(jù)開放的進程不一,數(shù)據(jù)供應(yīng)商尚未專業(yè)化,各信息單位的數(shù)據(jù)結(jié)構(gòu)化尚在起始階段,數(shù)據(jù)處理尚未形成一個統(tǒng)一的公開標準的情勢下,數(shù)據(jù)資源獲取的局限愈加凸顯?!盵8]因此,“算法新聞依賴社會整體數(shù)據(jù)化水平”[4]。
總之,機器人新聞對“數(shù)據(jù)”的依賴,導致機器人新聞在新聞報道題材方面受到限制?!爸挥心切?shù)字比較敏感的領(lǐng)域,如天氣、金融、政治選舉、交通、體育等領(lǐng)域的數(shù)據(jù)才易于被標準化,容易清洗,變形的概率較低,可能提取出有價值的信息。”[8]因此當前的機器人新聞主要局限于金融、天氣、交通、體育、政治選舉等數(shù)據(jù)化水平較高的領(lǐng)域,而且由于不同國家的信息公開程度、數(shù)據(jù)化水平不同,機器人新聞報道選題的寬窄也不一樣。
保羅·萊文森認為,后續(xù)媒介雖然是對前面媒介的“補救”,但在彌補前面媒介的某些缺陷時,也產(chǎn)生了新的缺陷。“當補救性的媒介起作用時,結(jié)果通常是一方面帶來純粹的進步,一方面帶來新的挑戰(zhàn),如何去補救這一補救可能帶來的新問題。新的補救性媒介解決了這些問題,必然又會產(chǎn)生更新的問題,永遠沒有結(jié)束的時候?!盵14](111)機器人新聞作為數(shù)據(jù)新聞的一種“補救”,它在克服數(shù)據(jù)新聞的半自動化、低效率等缺陷時,所采用的新技術(shù)——人工智能技術(shù)也帶來了一些新的缺陷,主要有以下幾方面:
一是可讀性問題。機器人新聞主要依靠計算機程序?qū)⑺鸭臄?shù)據(jù)套用現(xiàn)成的新聞報道模板來實現(xiàn)新聞報道的自動化批量生產(chǎn),它在新聞線索的發(fā)現(xiàn)和新聞撰寫角度的選擇上完全依靠算法得出的數(shù)值變化進行自動取舍,這種方式對于新聞報道模板和公式化的語詞樣本庫的依賴非常大,因此機器人新聞從結(jié)構(gòu)到內(nèi)容到用詞容易模式化。而且計算機程序不像生活在社會中的有血有肉的記者那樣擁有自己的立場和情感,能聯(lián)系社會背景和新聞?wù)Z境,甚至揣摩不同受眾的喜好,采用自己的寫作風格和語言來報道新聞,因此,相比人類記者所撰寫的新聞報道,機器人新聞在人性化、個性化、創(chuàng)新性、聯(lián)系性、分析性、人情味、生活味以及細節(jié)等方面還存在很大差距。新聞機器人開發(fā)公司Autamated Insights就認為,“讓機器人寫新聞其真正的難點在于怎么讓它看起來像人類寫的。雖然該公司目前擁有超過3億種模板可以供不同類型的新聞來套用,但如何讓其看起來像人寫的則著實大費周章”;美聯(lián)社副總裁兼總編輯費拉拉認為,“通過機器人撰寫的稿件會因為內(nèi)容的生硬和重復(fù)而影響稿件的質(zhì)量,讓稿件失去人性化和個人風格,不能帶來閱讀快感?!盵17]雖然目前人們在設(shè)計機器人新聞程序時注意到了可讀性問題,大量增加所套用的新聞寫作模版數(shù)量,甚至設(shè)計模仿一些知名記者的用詞習慣和寫作風格,但目前人工智能本身的缺陷導致機器人新聞在報道框架和角度上存在固定化、模式化、機械化、重復(fù)性等問題,在報道風格上存在生硬、呆板、枯燥、單調(diào)、乏味等不足?!霸诳勺x性方面,記者報道比自動化新聞更具優(yōu)勢?!盵18]有關(guān)實驗也證實了這一點。據(jù)NPR所做的調(diào)查顯示,人類記者Scott和機器人記者Wordsmifh就同一題材所撰寫的兩篇報道,前者得到了9916名讀者認可,而后者僅得到912名讀者認可。[19]一份來自德國、瑞典和荷蘭等三個國家的實驗也發(fā)現(xiàn),人類寫的新聞比機器人新聞在可讀性上得分更高。[20]
二是報道深度問題。機器人新聞的運作過程,簡單地說就是通過程序搜集、分析數(shù)據(jù),發(fā)現(xiàn)新聞故事并利用自然語言生成技術(shù)生成新聞稿件。機器人新聞的報道角度和寫作模板都是事先設(shè)計好的,只要有價值的數(shù)據(jù)發(fā)生,它就自動抓取并進行分析,然后套用報道角度和寫作模板生成新聞稿件。這種新聞生產(chǎn)方式?jīng)Q定了它主要是對相關(guān)數(shù)據(jù)進行置換以及進行一些簡單的分析,不可能對新聞事件再進行深入采訪,也難以對新聞事件發(fā)生的前因后果、來龍去脈進行深入挖掘,對事件之間的錯綜復(fù)雜的關(guān)系進行深入分析,對事件的發(fā)展趨勢以及社會影響等進行深入解讀,因此,機器人新聞總的來看缺乏報道深度。機器人新聞“如同流水線工作般,通過收集數(shù)據(jù)、整理數(shù)據(jù)而形成新聞稿件,并以最快的速度發(fā)布新聞。但簡單的數(shù)據(jù)疊加讓新聞報道停留在表面,未能進行新聞的深度加工和挖掘”;“盡管機器寫稿已滿足新聞寫作的基本要素,但與人類記者相比,它仍停留在要素表象敘述,缺乏新聞信息深度挖掘能力和處理加工能力”[21];參與開發(fā)《今日頭條》新聞機器人“小明”、《南方都市報》新聞機器人“小南”、《廣州日報》新聞機器人“阿同”的北京大學計算機科學技術(shù)研究所研究員萬小軍也坦承:“目前寫稿機器人還是很難替代深度報道的”,“跟記者比深度報道寫稿機器人會輸”[22]。
總之,人工智能技術(shù)本身的缺陷導致機器人新聞存在可讀性、報道深度不足等問題。