那福忠
近來,有些報紙與雜志在特定的內(nèi)容上開始使用軟件自動寫稿,一般讀者也沒有察覺到有什么不同。于是引發(fā)一個敏感的議題,計算機(jī)能否替代記者寫稿?運(yùn)用計算機(jī)寫稿有兩大類:一是把從網(wǎng)絡(luò)上獲取的數(shù)據(jù)自動寫成文稿,比如地震實時報道;二是分析龐大數(shù)據(jù)找出關(guān)鍵信息,比如財務(wù)分析報道。計算機(jī)軟件能發(fā)展到什么程度的寫作能力?寫出來的內(nèi)容值得信賴嗎?對新聞從業(yè)人員構(gòu)成威脅嗎?這些問題引起了學(xué)術(shù)界的興趣。
荷蘭Tilburg大學(xué)Hille van der Kaa與Emiel Krahmer兩位學(xué)者,為此做了一個實驗,選擇兩個題目給計算機(jī)軟件,一個是關(guān)于一場球賽的體育類題目,另一個是報道一只股票價格的財經(jīng)類題目,讓計算機(jī)用荷蘭文各寫兩篇報道,兩篇報道的內(nèi)容完全相同,差別在作者的署名,一篇署名是記者寫的,另一篇注明是計算機(jī)寫的,然后以323名荷蘭當(dāng)?shù)厝藶閷嶒瀸ο螅渲?4人為新聞從業(yè)人員。
實驗的方法是從4篇報道(2篇球賽、2篇股價)隨機(jī)取出一篇,展示給一名實驗對象,讓他就報道的專業(yè)程度與內(nèi)容的可信度,作1分到5分的評估。這個實驗有幾個巧妙的運(yùn)用,首先是看作者的影響,也就是計算機(jī)與記者有什么區(qū)別,因為“記者”也是計算機(jī),如果有區(qū)別就可能是受名稱的感覺影響。另外是要看一般讀者與新聞從業(yè)者的差異,以及新聞從業(yè)者對文稿作者、計算機(jī)或是記者的差異。
實驗的結(jié)果是,一般讀者就寫作的專業(yè)與可信度上,對計算機(jī)與記者兩種作者的評估幾乎相同,僅覺得計算機(jī)作者的可靠度略高,而記者的專業(yè)略低,但都不構(gòu)成統(tǒng)計上的差異。
但新聞從業(yè)人員有不同的看法,對寫作的專業(yè),不分計算機(jī)與記者都給予較高的評分,但對可信度則有明顯的差異,給記者的評分顯著高于給計算機(jī)的評分。
至于一般讀者與新聞從業(yè)人員的差異,在可信度上沒有計算機(jī)與記者的區(qū)分,但在專業(yè)程度上,新聞從業(yè)人員給計算機(jī)的評分高于一般讀者給計算機(jī)的評分。
在題目的選擇上也影響內(nèi)容的可靠度,大家對財經(jīng)股票議題的信任度高于對運(yùn)動球賽的信任度。
實驗的結(jié)果讓研究人員發(fā)現(xiàn)了更多的問題。新聞從業(yè)人員在可信度上認(rèn)為記者高于計算機(jī),實際上兩篇文稿完全相同,而且都是計算機(jī)制作的,那新聞從業(yè)人員是不是高估了自己的可信度?如果是,又是什么原因?新聞從業(yè)人員在專業(yè)程度的認(rèn)知上高于一般讀者,是否因為有專業(yè)訓(xùn)練使然?什么類別的內(nèi)容會讓讀者產(chǎn)生較高的可信度?學(xué)者們表示這些問題都會納入下一次研究。
為什么新聞稿件可以用計算機(jī)軟件寫作,專家說新聞報道的寫作思維與計算機(jī)的“自然語言處理”(Nature Language Processing, NLP) 極為相似。首先選擇要表達(dá)的信息,下一步組織既有的信息與文稿的結(jié)構(gòu),再下一步?jīng)Q定文稿里的信息以及使用適當(dāng)?shù)脑~匯,最后是表達(dá)與文法的修飾。這幾個基本的NLP步驟,可以最終建構(gòu)文法正確、文字整潔的文稿。
NLP技術(shù)的發(fā)展,會增強(qiáng)計算機(jī)寫作的能力,讓文稿更人性化,加入情緒用字,避免重復(fù)等修辭技巧。有人說計算機(jī)軟件不會制作諷刺幽默的文稿,現(xiàn)在當(dāng)然不會,但若說以后還是不會,計算機(jī)科學(xué)家就有所保留。
那計算機(jī)會不會替代記者寫稿?瑞典Karstad大學(xué)Christer Clerwall教授說在于經(jīng)濟(jì)因素,也就是雇用并訓(xùn)練記者、與購買維護(hù)計算機(jī)軟件之間的選擇,而寫作的數(shù)量成為關(guān)鍵因素。他說善用計算機(jī)軟件,可以把節(jié)省的人力資源用到計算機(jī)做不到的地方,特別是創(chuàng)意性與非例行必須靠人力寫作的文稿。而計算機(jī)的優(yōu)勢在快速精確地更新,也更適合個人化的新聞制作,同一則新聞用不同的語句寫給不同的讀者。
計算機(jī)會替代記者寫稿嗎?我想最好先了解一點是計算機(jī)軟件的功能與可能發(fā)展的方向,從中找出計算機(jī)的弱項,變成自己的強(qiáng)項。至于計算機(jī)已經(jīng)在做的,像是簡短的例行報道與復(fù)雜的數(shù)據(jù)分析,再跟計算機(jī)搶著做,意義就不大了。