——基于Dreamwriter報道與人工報道的對比分析"/>
1956年,人工智能在美國達(dá)特茅斯會議上誕生,經(jīng)探索、產(chǎn)業(yè)化逐步發(fā)展成熟,成為各行業(yè)發(fā)展的核心驅(qū)動力。2019年上半年,全球人工智能核心產(chǎn)業(yè)市場規(guī)模超過335.9億美元,我國人工智能核心產(chǎn)業(yè)市場規(guī)模超過49.6億美元。在國內(nèi)新聞生產(chǎn)領(lǐng)域,自動化新聞、虛擬主播、智能生產(chǎn)平臺等均有所應(yīng)用。
“自動化新聞中常提的‘機(jī)器人’實(shí)際上是一種稿件的自動生成軟件,通過軟件應(yīng)用實(shí)現(xiàn)機(jī)器取代人力,提高發(fā)稿的速度和數(shù)量?!?006年,美國湯姆森公司用AI撰寫財經(jīng)新聞。2009年,AI軟件“StatsMonkey”在美國職業(yè)棒球大聯(lián)盟季后賽上生成體育報道。隨后Narrative?Science公司、《洛杉磯時報》、美聯(lián)社等均涉足該領(lǐng)域。在國內(nèi),2015年9月,騰訊推出“Dreamwriter”;同年11月,新華社“快筆小新”正式上線。2016年第一財經(jīng)“DT稿王”、今日頭條“小明”、封面新聞“小封”等AI陸續(xù)上崗,應(yīng)用于體育賽事、財經(jīng)播報、天氣預(yù)報、地震信息等多個領(lǐng)域,承擔(dān)了原屬于人類記者的部分工作。
截至2020年年底,中國知網(wǎng)中以“機(jī)器人”和“記者”為主題的文獻(xiàn)共157篇,與本研究相關(guān)度較高的有136篇。已有研究在研究思路上可劃分為三個路徑。一是對某一具體寫稿機(jī)器人或某類報道的情況進(jìn)行描述,分析智能寫作的優(yōu)劣勢。王悅等“對體育賽事機(jī)器新聞寫作的作品進(jìn)行分析,指出在語義理解、數(shù)字沖突、非結(jié)構(gòu)化數(shù)據(jù)等方面面臨的現(xiàn)實(shí)困境”。二是智能寫作的應(yīng)用對新聞出版業(yè)的影響。在生產(chǎn)流程方面,喻國明等提出“機(jī)器人加入新聞生產(chǎn)者的陣營,加快了新聞生產(chǎn)速度,增加了新聞生產(chǎn)內(nèi)容,提高了新聞質(zhì)量,減少了寫作成本”,周政華等提出“機(jī)器人替代普通勞動力進(jìn)入了智力密集的新聞業(yè),新聞的編輯發(fā)布權(quán)正在從有血有肉的個體逐步讓渡給算法”;在新聞倫理方面,楊保軍等提出“智能新聞的倫理風(fēng)險主要表現(xiàn)為失實(shí)風(fēng)險、侵權(quán)風(fēng)險和算法權(quán)力濫用的風(fēng)險”。三是聚焦于技術(shù)與人文關(guān)系的思考。丁柏銓提出“智媒并非萬能之媒,媒體和記者過分依賴和迷信傳播技術(shù),將會削弱媒體和新聞作品所應(yīng)該具有的人文力量”。
總體來看,學(xué)者們更多從技術(shù)哲學(xué)、文化人類學(xué)等視角進(jìn)行理論觀照。有學(xué)者提出,應(yīng)對人機(jī)關(guān)系的技術(shù)倫理之爭,“秉持折中互濟(jì)的新聞生態(tài)觀將是一種可替代性的選擇”?;诤5赂駹柤夹g(shù)哲學(xué)觀,可以“以‘互構(gòu)’與‘互馴’為切入點(diǎn),反思當(dāng)下‘人技’關(guān)系新走向”?;谥黧w性研究提出應(yīng)“充分體現(xiàn)‘人是媒介的尺度’這一新聞倫理觀念”。趙鑫提出“人工智能新聞是人類創(chuàng)造出來的用以輔佐新聞記者的一種物質(zhì)文化……應(yīng)各自發(fā)揮其在客位視角和主位視角上的長處”。
問題在于,現(xiàn)有研究存在著兩種截然不同的論斷。著眼當(dāng)下,有學(xué)者持技術(shù)樂觀主義,提出“在對時效性和精準(zhǔn)性要求非常高的新聞領(lǐng)域,機(jī)器人的作用明顯超越了人類記者的工作效能”。也有學(xué)者提出,AI寫作仍處于弱人工智能階段,“智能化在新聞業(yè)領(lǐng)域的應(yīng)用還相當(dāng)初級……新聞的專業(yè)性,尤其是人類的判斷力、價值判斷體現(xiàn)出來的力量,機(jī)器新聞尚難以企及”。對于未來,有學(xué)者認(rèn)為“未來新聞寫作的全面智能化趨勢毋庸置疑”,“未來隨著技術(shù)的發(fā)展,機(jī)器新聞也會更有溫度和質(zhì)感”。也有學(xué)者認(rèn)為“AI新聞寫作無法具備人的情感和創(chuàng)造力……只會充斥著模塊化的陳詞濫調(diào),失去受眾的支持”。這似乎回到了20世紀(jì)強(qiáng)效果論、有限效果論研究的循環(huán)。這與智能媒體的發(fā)展階段、學(xué)者所持立場、研究方法都相關(guān),但論據(jù)采納是重要的影響因素。大量研究缺乏一手?jǐn)?shù)據(jù),直接采信媒體報道或者開發(fā)者的陳述。如“美國敘述科學(xué)公司的聯(lián)合創(chuàng)始人克里斯·哈蒙德在接受《連線》雜志采訪時預(yù)測,到2027年,美國超過90%的新聞將會由機(jī)器人來完成”;“麥肯錫全球研究所的報告預(yù)測,到2055年,現(xiàn)存的工作中有接近一半將被機(jī)器人所取代”。此類論據(jù)能夠展示愿景,但缺乏從實(shí)際出發(fā)的準(zhǔn)確性和可信度。
新聞報道中的邏輯深度是評價新聞表達(dá)有效性和可靠性的重要因素,也是衡量思維能力、主體性的指標(biāo)之一。在136篇文獻(xiàn)中,有50篇提到AI報道的邏輯層級與人類存在差異,但并未對其邏輯發(fā)展階段進(jìn)行準(zhǔn)確界定,也沒有進(jìn)一步解釋邏輯層級的深度和具體差異。因此,本文采用內(nèi)容分析法,選取相同主題的AI報道和人工報道進(jìn)行對比分析,分析其邏輯特征。一方面試圖定位AI新聞的發(fā)展進(jìn)程,回答現(xiàn)階段AI的邏輯分析能力與人類記者相比有哪些優(yōu)勢和不足;另一方面,重新審視人類記者如何在實(shí)際業(yè)務(wù)中發(fā)揮主體性等問題。
Dreamwriter是國內(nèi)首個成功應(yīng)用于自動化新聞的寫稿機(jī)器人,早在2015年9月便發(fā)布題為《8月CPI同比上漲2.0%?創(chuàng)12個月新高》的財經(jīng)新聞,評論數(shù)遠(yuǎn)高于同期其他報道?!耙荒陼r間,Dreamwriter從1.0發(fā)展到5.0。每一版都會加入一項(xiàng)復(fù)雜的技術(shù),每一次的技術(shù)迭代都會給內(nèi)容生產(chǎn)帶來改變?!薄?017騰訊媒體+峰會”上,騰訊副總裁陳菊紅發(fā)布《2017中國新媒體趨勢報告》,Dreamwriter在一秒鐘內(nèi)現(xiàn)場完成摘要提取、自動配圖、自動剪輯?!敖刂?019年,Dreamwriter每年大約寫50萬篇稿子,總計(jì)8?000萬字。某月日均產(chǎn)量,僅財經(jīng)體育類就有兩三千篇?!逼湓谔鞖?、交通、房產(chǎn)、車展、4S店保養(yǎng)數(shù)據(jù)及優(yōu)惠信息等領(lǐng)域均有涉獵。
筆者以“本文由騰訊機(jī)器人Dreamwriter撰寫”為關(guān)鍵詞在百度中進(jìn)行檢索,利用爬蟲軟件抓取從2020年1月1日至7月20日發(fā)布的全部報道,經(jīng)人工篩查及數(shù)據(jù)清洗,去掉重復(fù)稿件、汽車報價等非新聞體裁的稿件,得到三類主題的報道。體育類發(fā)布于“騰訊體育”,時間集中在2020年1月1日至3月12日;財經(jīng)類發(fā)布于“騰訊財經(jīng)”,時間在2020年5月14日至7月9日;天氣類發(fā)布于“看點(diǎn)快報”,時間在2020年5月9日至7月14日。每類報道各抽取30個樣本,采取等距抽樣法,隔天抽取,選擇其中的第一條,得到有效樣本共90條。
為與AI新聞形成有效對比,選擇與AI報道類型最為相近的人工報道為研究對象,分別為騰訊體育2020年1月1日至3月12日的NBA賽況報道,騰訊新聞2020年5月9日至7月18日的天氣預(yù)報。由于AI財經(jīng)報道均為基金凈值信息,而2020年除Dreamwriter外尚無此類人工報道,因此在與Dreamwriter報道時間不重合且跨度相同的時間范圍內(nèi)(2020年2月1日至4月30日),檢索發(fā)布于騰訊財經(jīng)且含“基金”關(guān)鍵詞的全部報道,以此評估凈值報道未出現(xiàn)時基金類內(nèi)容的整體情況。每類報道抽取30個樣本,采取等距抽樣法,隔天抽取,選擇其中的第一條,得到有效樣本共90條。
根據(jù)《邏輯學(xué)基礎(chǔ)教程》,普通邏輯中的構(gòu)成單位包括概念、判斷與推理。概念包含概念內(nèi)涵與外延,判斷分為簡單判斷、復(fù)合判斷、必然判斷、可能判斷。邏輯分為非模態(tài)推理及模態(tài)推理,非模態(tài)推理包括演繹推理、歸納推理以及類比推理。根據(jù)胡華濤《新聞推理與論證的語用邏輯研究》,“新聞推理與論證絕不是處于封閉狀態(tài)下的純思維形式的推演,而是日常特定新聞?wù)Z境中的思維表述活動,也包括記者在新聞現(xiàn)場直接感知的人和事等經(jīng)驗(yàn)信息,構(gòu)成邏輯認(rèn)識的起點(diǎn)”。據(jù)此,基于對樣本的細(xì)致觀察,本文在基本邏輯元素基礎(chǔ)上增設(shè)延伸內(nèi)容、詳細(xì)敘述兩個類目,確立了最終的測量指標(biāo)。
對報道內(nèi)容的邏輯層級、延伸情況2個維度共12個變量進(jìn)行編碼與測量。邏輯層級包括文中是否(1/0)含有概念內(nèi)涵、概念外延、簡單判斷、復(fù)合判斷、必然判斷、可能判斷、演繹推理、歸納推理、類比推理、模態(tài)推理等10個二分變量。延伸情況包括是否(1/0)包含詳細(xì)敘述和延伸內(nèi)容。
表1 AI寫作邏輯分析的研究類目指標(biāo)體系
對180個樣本進(jìn)行內(nèi)容分析,得出各項(xiàng)變量在30個樣本中的比例數(shù)據(jù),通過三類AI新聞間的縱向比對、與人工新聞的橫向比對,得出AI報道的優(yōu)劣特征以及人工寫作的獨(dú)特價值。
整體數(shù)據(jù)表明,AI寫作有兩個特點(diǎn)。
一是邏輯程式固定。AI報道各類目的百分比呈0和100%兩極化分布,說明同類報道語言模板的相似度極高,所包含的邏輯元素具有一致性,不同報道之間的差別在于概念和數(shù)據(jù)的替換。
表2 Dreamwriter報道與人工報道對比
(續(xù)表)
內(nèi)容結(jié)構(gòu)相同是邏輯程式一致的前提。體育類樣本均為NBA賽況報道,內(nèi)容由比賽結(jié)果、球員技術(shù)統(tǒng)計(jì)、比賽回顧、雙方陣容四部分構(gòu)成。多以簡單判斷為主,如“熱火內(nèi)線優(yōu)勢巨大,本節(jié)共搶下16個籃板,包括7個前場籃板,其中阿德巴約一人就貢獻(xiàn)5個籃板球,憑借籃下優(yōu)勢取得3分領(lǐng)先優(yōu)勢”。多個“籃板球”判斷形成歸納推理,得出“優(yōu)勢巨大”的判斷,并按照新聞的倒金字塔結(jié)構(gòu)將其前置。諸如此類的歸納類詞語在文中頻繁出現(xiàn),如表3所示。
表3 Dreamwriter撰寫的體育報道中歸納類詞語詞頻統(tǒng)計(jì)
其余兩類報道同樣由固定的寫作模板生成。天氣預(yù)報的30個樣本均由時間、地點(diǎn)、天氣、穿衣建議、溫馨提示五部分構(gòu)成,天氣為陰晴、多云、風(fēng)力的簡單判斷,據(jù)此歸納穿衣建議和體感舒適度。財經(jīng)報道為基金凈值、漲跌趨勢、基金介紹,不存在推理。
二是邏輯元素有限,每類報道中判斷和推理的種類較少。推理是由已知判斷推出的新判斷,具有擴(kuò)充知識、鑒別信息、理性論證的作用。體育類AI報道僅有概念外延(雙方陣容)、簡單判斷、復(fù)合判斷、歸納推理等4種,而人工報道含有9種;財經(jīng)類AI報道僅有概念內(nèi)涵、簡單判斷2種,而人工報道含有10種;天氣類AI報道含概念內(nèi)涵、歸納推理等5種,而人工報道含有10種。這與“機(jī)器人擅長撰寫涉及大量數(shù)據(jù)、連接邏輯簡單、數(shù)據(jù)準(zhǔn)確度很高的結(jié)構(gòu)化稿件”有關(guān),模板種類貧乏造成邏輯元素較少。
從上述兩個特征出發(fā),AI報道有以下優(yōu)勢。
一是基礎(chǔ)數(shù)據(jù)詳實(shí),阻斷邏輯謬誤的源頭。概念是符號的定義,主要用于消除歧義。概念的模糊性和不確定性是引起報道邏輯謬誤的源頭,常源于記者對概念內(nèi)涵及外延的錯誤認(rèn)知。如2020年3月1日湖人對戰(zhàn)灰熊的人工報道中提到“詹姆斯拿到皮球后,面對布魯克斯的防守,像坦克一樣推著布魯克斯到籃下”,“籃球”被誤寫為“皮球”。而對于AI新聞來說,數(shù)據(jù)庫保障了概念的正確性?!皬?5—16賽季開始,騰訊買斷了五年NBA在中國大陸市場新媒體的獨(dú)播權(quán),同時采購了NBA的全套數(shù)據(jù)。”Dreamwriter負(fù)責(zé)人劉康表示,“官方數(shù)據(jù)默認(rèn)是權(quán)威的。他們在使用時會有一個權(quán)重評級,如果總是不權(quán)威,他們會下調(diào)權(quán)重評級……與自己的備用庫數(shù)據(jù)比對核實(shí)”。在海量的資訊素材中,只要機(jī)器學(xué)習(xí)和程序邏輯正確,通過規(guī)格化、模式化處理,便可精準(zhǔn)無誤地調(diào)取概念,較少出現(xiàn)數(shù)據(jù)的遺漏、誤用等問題。本文樣本中,每篇體育類報道的文末都附有成員構(gòu)成信息,每篇財經(jīng)報道都附有公司介紹及業(yè)績報告,在概念準(zhǔn)確的前提下實(shí)現(xiàn)了信息詳實(shí)。
二是邏輯推理嚴(yán)謹(jǐn)高效。正確的推理過程是得出可靠性結(jié)論的堅(jiān)實(shí)基礎(chǔ),AI的推理過程是在程序的支配下完成的,“首先購買或自己創(chuàng)建數(shù)據(jù)庫;然后讓Dreamwriter學(xué)習(xí)數(shù)據(jù)庫內(nèi)的各項(xiàng)數(shù)據(jù),并生成相對應(yīng)的寫作手法”。寫作全程受算法控制,摒棄冗余信息,甄選相關(guān)信息,在固定模板中完成報道。模板的規(guī)定性決定了推理的可控性。而人類報道則受記者的知識背景、價值判斷、主觀情感等個人因素影響,且謬誤具有迷惑性,極易以一種看似正確的論證過程出現(xiàn),較難保證邏輯推理的正確。以股市報道為例,其多為簡訊,但卻耗費(fèi)人力,難窺全貌,“需要即時監(jiān)控滬市和深市2?400多家上市公司的異動情況……人均監(jiān)控股票通常在100只左右,對深滬股市的全面監(jiān)控需要20多人的團(tuán)隊(duì)來綜合處理”,AI則可將人類記者從繁復(fù)的基礎(chǔ)工作中解放出來。僅2020年7月9日,Dreamwriter發(fā)布于騰訊財經(jīng)的基金凈值報道就有380條。“對于規(guī)格化新聞資訊……的生成和發(fā)布,時間一般不超過30秒,且差錯率遠(yuǎn)低于人工寫作。”
三是適應(yīng)人類邏輯習(xí)慣。在語句方面,體現(xiàn)在AI對復(fù)合判斷的應(yīng)用上。復(fù)合判斷通常由支判斷和邏輯連接詞組成,如“雖然……但是……”“如果……那么……”“不僅……而且……”等,代表復(fù)合判斷的邏輯性質(zhì),表明支判斷間的邏輯關(guān)系,是人類日常表達(dá)中較常出現(xiàn)的習(xí)慣用語。與簡單判斷相比,復(fù)雜判斷的邏輯層級更為深入,除事實(shí)信息外,更能體現(xiàn)關(guān)系信息。數(shù)據(jù)表明,體育類中含復(fù)合判斷的AI報道有76.67%,人工報道有96.67%,二者數(shù)量差并不懸殊,表明AI報道的語法結(jié)構(gòu)與人類邏輯習(xí)慣具有一定匹配度,并不存在不可打破的技術(shù)壁壘。在語料方面,“通過擬人的口語化表述做詞組和段落之間的聯(lián)系……這樣就可以由不同的比賽、不同的分?jǐn)?shù)形成不同的表述”。AI報道中出現(xiàn)“三分如雨”28次,“瘋狂進(jìn)攻”21次,“筑起銅墻鐵壁”14次,“掉進(jìn)失誤陷阱”13次,此類表達(dá)還原了運(yùn)動員的行為軌跡和評委的話語習(xí)慣。2020年1月17日爵士對陣鵜鶘的AI報道中提到,“費(fèi)沃斯此節(jié)得到7分,還在最后時刻封蓋了爵士試圖扭轉(zhuǎn)局面的上籃,對老東家進(jìn)行了‘完美復(fù)仇’”?!巴昝缽?fù)仇”是對特定意義詞語的使用,體現(xiàn)了人格化的邏輯延伸。
AI報道的劣勢在于其與其他事件建立聯(lián)系的能力較弱。首先,這體現(xiàn)在類比推理上,類比推理是將過去的經(jīng)驗(yàn)作用于對未來的判斷中,常用于得出日常推論。運(yùn)用生動的表述創(chuàng)造鮮活的畫面,輔助受眾理解陌生文本,并將報道傾向寓于類比對象中,AI寫作在這一方面有所欠缺。人工報道中,40%的體育類和16.67%的財經(jīng)類報道含類比推理,如將球員及動作比作“機(jī)器人”“坦克”“靈蛇出洞”“過清晨無人的馬路”等,將某公司及境況類比為“雷曼兄弟”“患感冒”等。而與之對應(yīng)的AI報道均不含類比推理。
表4 人工報道中的類比文本
(續(xù)表)
但不可否認(rèn)的是,類比不具備邏輯必然性,前提并非確定地作用于結(jié)論,且人工報道中也存在類比誤用的情況。2020年1月9日獨(dú)行俠對戰(zhàn)掘金的報道中有這樣的表述——“小庫里替補(bǔ)上場過后,微波爐一般,連續(xù)2次投籃得分”。微波爐與多次投籃并無相同屬性和相似特點(diǎn),在此構(gòu)成聯(lián)系是錯誤的比喻,在后續(xù)的報道實(shí)踐中應(yīng)有所規(guī)避。
其次體現(xiàn)為演繹推理和延伸情況的缺失。演繹推理是在一般性知識的大前提下,得出個別性知識。演繹結(jié)論是否有效,取決于前提是否可證明。在內(nèi)容生成過程中,其意味著調(diào)用除主體信息外的其他信息,包括背景材料。如“國際油價史無前例暴跌,油氣基金的凈值也創(chuàng)出歷史新低記錄”“湖人和雄鹿的對決,被看作是總決賽預(yù)演,也被看作是詹姆斯和字母哥兩個人的MVP之爭”“河南迎來大范圍強(qiáng)降雨,河南大部都被大雨所覆蓋,其中在河南中部還分布著范圍不小的暴雨天氣”等。60%的財經(jīng)類人工報道含演繹推理,而AI報道不含。體育、財經(jīng)、天氣類分別有56.67%、63.33%、43.33%的人工報道含延伸情況,而AI報道僅有1篇。與AI新聞頻繁使用的簡單判斷相比,演繹推理和延伸資料暗含因果,有助于讀者把握報道主題,提升新聞可信度,而AI在這一方面的不足導(dǎo)致其報道缺乏縱深。
AI報道的劣勢還體現(xiàn)為研判和預(yù)測的能力較弱。微觀層面體現(xiàn)為可能判斷、必然判斷極少。在人工報道中,含必然判斷的樣本,體育類有16.67%,財經(jīng)類有10%,天氣類有13.33%;含可能判斷的樣本,體育類有6.67%,財經(jīng)類有50%,天氣類有30%。而AI報道方面,僅天氣預(yù)報中有1篇含必然判斷,其余均為0。
記者呈現(xiàn)新聞是一個結(jié)構(gòu)化組合與觀念提煉的過程,其中包括對事件趨勢進(jìn)行預(yù)測。財經(jīng)報道中的可能和必然判斷可提高新聞價值?!皩τ谙胭徺I該新基金的投資者,接下來大半天時間里,必須要以‘比例配售’的思維認(rèn)購”“這些基金可能又在進(jìn)一步加倉”等研判話語具有指導(dǎo)意義,但“更多需要細(xì)節(jié)描述、理性判斷、歸因說明的新聞報道……往往難以設(shè)計(jì)普適的寫作模塊,寫稿機(jī)器人無能為力”,只能依靠人類輔助完成。
中觀層面,AI報道無法進(jìn)行詳略取舍。在天氣預(yù)報中,40%的人工報道對節(jié)氣特征、氣流運(yùn)動等進(jìn)行詳細(xì)敘述,而AI報道均無此類內(nèi)容。以2020年7月16日的兩則報道為例,Dreamwriter撰寫的全文如下:
天津西青07月16日天氣預(yù)報
時間:07月16日
地點(diǎn):天津西青
天氣:陰,最低氣溫24℃,最高氣溫34℃,西南風(fēng)3級
穿衣建議:天氣炎熱,建議著短衫、短裙、短褲、薄型T恤衫等清涼夏季服裝
溫馨提示:白天天氣以多云到陰為主,日照雖然不強(qiáng),但仍會使您感到有些熱,不很舒適
而人工報道中含有此類表述:
今天開始入伏了,俗話說“熱在三伏,冷在三九”,三伏天通常出現(xiàn)在小暑與處暑之間。三伏是初伏、中伏和末伏的統(tǒng)稱,是一年中最熱的時節(jié),其氣候特點(diǎn)是氣溫高、氣壓低、濕度大、風(fēng)速小。三伏為什么熱?因?yàn)楣庹諘r間長,地面輻射累積多……
人類記者具備人文素養(yǎng),可結(jié)合社會經(jīng)驗(yàn)對重要性進(jìn)行判斷,有選擇地對某些內(nèi)容展開敘述。AI新聞在此方面不做調(diào)整則會千篇一律,缺乏溫度。
宏觀層面,AI的選題過程并非完全自動化。許向東認(rèn)為,“判定新聞價值,提煉報道選題……人工智能會提出一些建設(shè)性的創(chuàng)作意見……這一過程中可能需要人工的協(xié)助”。因此,盡管AI新聞有阻斷邏輯謬誤、邏輯推理嚴(yán)謹(jǐn)、適應(yīng)人類邏輯習(xí)慣等優(yōu)勢,但類比、演繹、延伸、預(yù)測、研判的能力較弱,邏輯元素均以散點(diǎn)狀分布于報道中,作用于得分、氣溫等細(xì)節(jié)上,而并未通過連貫的邏輯鏈條層層深入、生成觀點(diǎn)、提煉主題進(jìn)而應(yīng)用于整體報道中。
在邏輯推演方面,AI受算法和程序支配,而人類則靠意識完成,這是二者信息生成機(jī)制的根本差別。AI的邏輯層級能否向人類靠近,主要取決于智能系統(tǒng)的開發(fā)程度。目前,國內(nèi)外的AI多以模板寫稿和自動摘要為主,自主生成模式尚未普及。模板寫稿是在固定結(jié)構(gòu)中填充數(shù)據(jù)的稿件生成模式。首先根據(jù)題材、篇幅確定敘事框架及表達(dá)方式,由此定制多種模板;其次根據(jù)數(shù)據(jù)類別進(jìn)行模板檢索及判斷,選定目標(biāo)模板;最后導(dǎo)入新聞現(xiàn)場或數(shù)據(jù)庫中的數(shù)據(jù),生成新聞文本。該模式多用于數(shù)據(jù)庫完整、格式可復(fù)制的消息類報道,如地震、球賽、財經(jīng)簡訊等。美聯(lián)社的Quakebot,《華盛頓郵報》的Heliograf,國內(nèi)的Dreamwriter、快筆小新、DT稿王等,均采用該生成機(jī)制。
自動摘要是在給定文本的基礎(chǔ)上提取關(guān)鍵信息。百度的自動摘要的形成過程是:首先將搜索所得的全部文本進(jìn)行分詞、分句處理,得到詞、句集合;其次通過算法對各句的重要性進(jìn)行排序,提取關(guān)鍵信息,計(jì)算相似度,篩除冗余信息,并通過懲罰因子評估句子的新穎程度;最后按照相關(guān)性順序?qū)⒕渥咏M合起來,形成摘要。“截至2018年,微軟小冰已自動生成滬深兩市26類上市企業(yè)的公告摘要,中國金融機(jī)構(gòu)的交易員已經(jīng)有90%在使用小冰生成的摘要?!?/p>
自主生成是通過深度學(xué)習(xí),“讓人工智能程序全方位地學(xué)習(xí)和模仿人進(jìn)行寫作。從新聞采集、信息加工、數(shù)據(jù)分析到最終的文本寫作都由人工智能程序來完成”,但目前尚未廣泛應(yīng)用。目前所采用的深度學(xué)習(xí)技術(shù)多為Seq2Seq模型結(jié)合Attention策略。Seq2Seq包括編碼和解碼兩個階段,分別由兩個遞歸神經(jīng)網(wǎng)絡(luò)(RNN)構(gòu)成?!熬幋a是將輸入序列壓縮成一個固定長度的語義向量,解碼階段的RNN神經(jīng)網(wǎng)絡(luò)會一個一個字符地解碼……將前一步解碼的輸出作為下一步解碼的輸入?!盇ttention機(jī)制用于保障語義的準(zhǔn)確度,鎖定關(guān)鍵詞,避免過擬合。Seq2Seq+Attention的本質(zhì)是機(jī)器翻譯,是基于已有文本生成新文本,并非原創(chuàng)。
以上三種寫稿模式的核心原理均為自然語言處理,分為自然語言理解和自然語言生成。AI寫作之所以無法達(dá)到人類的邏輯深度,一是因?yàn)闄C(jī)器學(xué)習(xí)能力有限。模板寫稿只需要機(jī)器理解數(shù)據(jù)及寫作模板,而自主生成則是對字符進(jìn)行處理。二是因?yàn)閷懽髂0逵邢蕖E袛?、推理的種類與模板樣式一一對應(yīng),AI報道能夠?qū)崿F(xiàn)歸納推理,是因?yàn)槠浼夹g(shù)邏輯正是以點(diǎn)信息為起點(diǎn)來生成判斷的。Dreamwriter負(fù)責(zé)人劉康表示:“報道奧運(yùn)會的跳水比賽……每一個運(yùn)動員都有一套專業(yè)得分,包含了走板、空中姿態(tài)、入水水花效果等。在Dreamwriter學(xué)習(xí)過程中,它把每一步的得分都打散了,在數(shù)據(jù)庫里隨意組合抓取,同時綜合賽事本身的規(guī)則,最終把這些分?jǐn)?shù)還原成一套表述?!睂W(xué)者對自動寫作方法的創(chuàng)新也基于“歸納”的思路。“針對NBA賽事,首先根據(jù)兩支球隊(duì)的比分差,構(gòu)建比分差函數(shù),并提出基于比分差函數(shù)性質(zhì)的數(shù)據(jù)分片算法和數(shù)據(jù)合成算法。”根據(jù)合并數(shù)據(jù)的特征撰寫不同結(jié)論,生成模板。演繹、類比、模態(tài)推理等則需要研發(fā)者不斷豐富算法來實(shí)現(xiàn),但“開發(fā)針對性的機(jī)器人寫作很難找到足夠多的模型”。三是深度學(xué)習(xí)的應(yīng)用領(lǐng)域有限。微軟小冰已具備生成比喻句的能力,微軟小冰首席科學(xué)家宋睿華表示,比喻句的通用原則是通過本體、喻體、解釋三個要素構(gòu)建的?!氨倔w一般是抽象的,比如說愛情,而喻體是具體的。這兩個概念之間的聯(lián)系用Word?Embedding來表達(dá),將其變成一個向量,經(jīng)過降維之后,投影在這個二維的空間上。通過自然語言形態(tài)的連接詞將其結(jié)合起來,組成一個比喻?!钡壳氨扔骷寄苌形磻?yīng)用在新聞寫作中。此外,人類的語言表達(dá)常暗含因果,將模態(tài)推理或常識性內(nèi)容隱去。微軟小冰團(tuán)隊(duì)開發(fā)AI的聯(lián)想性能,試圖讓其擁有捕捉文本以外信息的能力,但止步于跨模態(tài)理解,根據(jù)文字調(diào)動畫面實(shí)現(xiàn)場景模擬,并未在新聞寫作中實(shí)現(xiàn)同模態(tài)的背景信息調(diào)取、演繹推理、類比推理等。
曾有學(xué)者提出:“人工智能機(jī)器人存在‘不是物’的立法需求,該類機(jī)器人不是普通物,它具有思維性,是擁有部分主體性的特殊主體?!薄爸黧w的本質(zhì)屬性是具有獨(dú)立意識?!被贏I寫作的特征分析及歸因分析可知,現(xiàn)階段AI邏輯能力的開發(fā)仍存在技術(shù)局限,較難實(shí)現(xiàn)高度類人的思維性。在目前的新聞生產(chǎn)中,人類應(yīng)在人機(jī)協(xié)同中憑借其獨(dú)有價值充分發(fā)揮主體性。
“主體性是在‘主體—客體’關(guān)系中的主體屬性,即作為認(rèn)識活動與實(shí)踐活動的主體所具有的本質(zhì)屬性,主要體現(xiàn)為自主性?!睆目谡Z傳播時代至今,人類在新聞生產(chǎn)中的主體性地位未曾改變,變化的是媒介交互形式及主體角色構(gòu)成。AI寫作中,人類也并未將創(chuàng)作權(quán)讓渡給機(jī)器,從機(jī)器學(xué)習(xí)到信息生成,AI始終體現(xiàn)為物的屬性,其承擔(dān)的“類主體”角色實(shí)為被人馴化的物的角色,“是利用數(shù)字計(jì)算機(jī)或數(shù)字計(jì)算機(jī)控制的機(jī)器模擬、延伸和擴(kuò)展人的智能,感知環(huán)境,獲取知識并使用知識獲得最佳結(jié)果的理論、方法、技術(shù)及應(yīng)用系統(tǒng)”,暫不具備主體性或主體間性。
人機(jī)協(xié)同過程中,人類應(yīng)在思維運(yùn)用中保持主體性。首先是邏輯結(jié)構(gòu)在新聞生產(chǎn)中的靈活歸化。AI報道的本質(zhì)是重復(fù),用統(tǒng)一模板加工同一主題的信息,語言形式呆板僵化,以致新聞產(chǎn)品化。而“新聞推理最明顯的特征是不拘一格的形式……本質(zhì)上是實(shí)踐的推理,它就沒有必要受到邏輯語言形式的桎梏”。人類的主體性體現(xiàn)于新聞產(chǎn)品的差異化程度,記者在規(guī)范中開拓新意,避免機(jī)械復(fù)制,根據(jù)內(nèi)容特性增減推理類型,運(yùn)用省略、置換等進(jìn)行邏輯程式的創(chuàng)新。
其次是邏輯元素與現(xiàn)實(shí)環(huán)境的交互擬合?!靶侣勍评碜顬楸举|(zhì)的特征是在特定的新聞情境中推理?!蓖评磉^程較難預(yù)知,結(jié)論在不斷變動的思考中形成,因此需要儲備多種邏輯元素。目前,受制于技術(shù)條件,AI的邏輯元素較為有限。“程序”的底層邏輯為“預(yù)設(shè)”,“推理”為已知的模式化過程,與新聞推理的本質(zhì)相悖。而人類記者與其他事件建立聯(lián)系的能力較強(qiáng),可運(yùn)用多種邏輯元素完成推演,如調(diào)度與報道對象關(guān)聯(lián)度高的信息以進(jìn)行類比推理,調(diào)度背景信息以進(jìn)行說明及演繹等,且能夠?qū)⒍鄠€推理串聯(lián)為連貫的邏輯鏈條,對新聞事實(shí)的掌控力較強(qiáng),凸顯主體性。
人類把控主體性的深層含義在于調(diào)動讀者“思維的具身性”。新聞的意義不僅是告知、對話,更是“社會知覺”,“是一種意識和安全感,可以建構(gòu)人們知覺任何重大、有趣之事的信心”。新聞的邏輯結(jié)構(gòu)促使受眾在閱讀中層層深入,與新聞情境融合,在邏輯的同頻共振中解構(gòu)話語,在參與中實(shí)現(xiàn)社會建構(gòu),同時也促成大眾邏輯思維能力的提升?!靶侣勥壿嫹椒ㄉ捎谟浾叩娜粘K季S,通過反思經(jīng)驗(yàn)進(jìn)而抽象、概括出具有普遍意義的非日常思維結(jié)構(gòu),繼而又以此內(nèi)化于廣大受眾的日常思維之中。”此般新聞意義的回歸,是依賴程序框架的AI寫作所不能實(shí)現(xiàn)的。
隨著AI的發(fā)展,“人機(jī)博弈”一詞被頻繁提及,逐漸出現(xiàn)了AI將擬合人類思維、獨(dú)立完成寫作的聲音,甚至引發(fā)了對于“AI是否會取代人類記者”問題的探討。根據(jù)研究結(jié)果及業(yè)內(nèi)現(xiàn)狀來看,AI的新聞生產(chǎn)能力在一定程度上被夸大了。李國杰在《人工智能的三大悖論》中提出,“計(jì)算機(jī)的運(yùn)行可以歸結(jié)為已有符號的形式變換,結(jié)論已經(jīng)蘊(yùn)涵在前提中,本質(zhì)上不產(chǎn)生新知識,不會增進(jìn)人類對客觀世界的認(rèn)識”。現(xiàn)階段,AI的作用為輔助人類勞動、簡化工序,起決定性作用的是工程師和新聞從業(yè)者。此外,雖然AI在情感、聯(lián)想、預(yù)測等方面均有涉獵,但或技術(shù)稚嫩,或?qū)S驅(qū)S茫形闯蔀椴煌瑘鼍爸械耐ㄓ眉夹g(shù)。面對AI浪潮,人類需對自身的主體性保持理性與清晰的認(rèn)知。
注釋
① 2019年度“人工智能時代媒體變革與發(fā)展”研究報告[R/OL].[2020-07-20].http://www.xinhuanet.com/politics/download/2019ndrgznsdmtbgyfzyjbgqwjwjdcjg.pdf.
②?? 許向東,郭萌萌.智媒時代的新聞生產(chǎn):自動化新聞的實(shí)踐與思考[J].國際新聞界,2017(5):29-41.
③ 王悅,支庭榮.機(jī)器人寫作對未來新聞生產(chǎn)的深遠(yuǎn)影響——兼評新華社的“快筆小新”[J].新聞與寫作,2016(2):12-14.
④ 喻國明,蘭美娜,李瑋.智能化:未來傳播模式創(chuàng)新的核心邏輯——兼論“人工智能+媒體”的基本運(yùn)作范式[J].新聞與寫作,2017(3):41-45.
⑤ 周政華,練紫嫣.人工智能時代新聞業(yè)的謝幕與重生[J].新聞研究導(dǎo)刊,2017(11):1-4.
⑥? 楊保軍,杜輝.智能新聞:倫理風(fēng)險·倫理主體·倫理原則[J].西北師大學(xué)報(社會科學(xué)版),2019(1):27-36.
⑦ 丁柏銓.智媒時代的新聞生產(chǎn)和新聞傳播——對技術(shù)與人文關(guān)系的思考[J].編輯之友,2019(5):6-12.
⑧ 許加彪,韋文娟,高艷陽.技術(shù)哲學(xué)視角下A I新聞生產(chǎn)的倫理審視[J].當(dāng)代傳播,2019(1):89-91+99.
⑨ 蔣曉麗,賈瑞琪.論人工智能時代技術(shù)與人的互構(gòu)與互馴——基于海德格爾技術(shù)哲學(xué)觀的考察[J].西南民族大學(xué)學(xué)報(人文社科版),2018(4):130-135.
⑩? 薛寶琴.人是媒介的尺度:智能時代的新聞倫理主體性研究[J].現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報),2020(3):66-70.
? 趙鑫,趙盼超.文化人類學(xué)視野下人工智能新聞內(nèi)容生產(chǎn)再思考[J].中國出版,2017(9):46-49.
? 沈正賦.智媒時代信息傳播領(lǐng)域技術(shù)賦能與人文精神傳承的關(guān)系建構(gòu)[J].編輯之友,2019(5):20-26.
? 陳昌鳳.價值引領(lǐng),讓AI新聞業(yè)有能更有智[J].新聞與寫作,2017(11):1.
? 周思.智能新聞寫作前景初探——論AI量化時代對新聞冗余的篩選與整合[J].出版廣角,2019(19):75-77.
? 王雨妍,陳丹.人工智能時代記者如何融入“智能化生產(chǎn)”[J].傳媒,2020(3):39-41.
? 李政.人工智能時代新聞記者的價值定位[J].出版廣角,2019(10):61-63.
? 牟怡,夏凱,NOVOZHILOVA E,許坤.人工智能創(chuàng)作內(nèi)容的信息加工與態(tài)度認(rèn)知——基于信息雙重加工理論的實(shí)驗(yàn)研究[J].新聞大學(xué),2019(8):30-43+121-122.
??? 陳鐘昊,崔燦,王睿路,張研.騰訊Dreamwriter:自動化新聞發(fā)展之路媒體調(diào)研報告之六[R/OL].[2020-07-20].https://mp.weixin.qq.com/s/fF9v9YRkJsPzgA2HtlnSfQ.
? 劉康.人工智能如何助力媒體生產(chǎn)和運(yùn)營[J].新聞記者,2019(03):8-9.
? 南開大學(xué)哲學(xué)系邏輯學(xué)教研室.邏輯學(xué)基礎(chǔ)教程(第二版)[M].天津:南開大學(xué)出版社,2008:33-58.
???? 胡華濤.新聞推理與論證的語用邏輯研究[J].國際新聞界,2012(2):58-63.
? 解學(xué)芳,張佳琪.AI賦能:人工智能與媒體產(chǎn)業(yè)鏈重構(gòu)[J].出版廣角,2020(11):26-29.
?? 何芳明.寫稿機(jī)器人對新聞生產(chǎn)的影響及應(yīng)用前景[J].青年記者,2018(33):77-79.
? 喻國明.人工智能的發(fā)展與傳媒格局變化的邏輯[J].新聞與寫作,2016(2):1.
? 劉康.未來AI可以提供個人定制[J].新聞?wù)搲?2017(4):22-23.
? 曾慶香,陸佳怡.新媒體語境下的新聞生產(chǎn):主體網(wǎng)絡(luò)與主體間性[J].新聞記者,2018(4):75-85.
?? 申屠曉明,甘恬.機(jī)器人寫稿的技術(shù)原理及實(shí)現(xiàn)方法[J].傳媒評論,2017(9):15-19.
? 靳松.史上最大規(guī)模全面升級微軟小冰第六代在華發(fā)布[EB/OL].(2018-07-28)[2020-07-23].http://news.cri.cn/20180728/cb8049ca-1b9b-bdb0-3bb3-82e4938ef7d3.html.
? 郭琪.“AI+記者”:智媒時代人機(jī)協(xié)同寫作模式的局限性與可能性[J].出版廣角,2019(24):67-69.
? 陳鐘昊,崔燦,王睿路,張研.騰訊Dreamwriter:自動化新聞發(fā)展之路媒體調(diào)研報告之六[R/OL].[2020-07-20].https://mp.weixin.qq.com/s/fF9v9YRkJsPzgA2HtlnSfQ.
? 陳玉敬,呂學(xué)強(qiáng),周建設(shè),李寧.NBA賽事新聞的自動寫作研究[J].北京大學(xué)學(xué)報(自然科學(xué)版),2017(2):211-218.
? 歐陽宏宇.騰訊網(wǎng)A I項(xiàng)目總監(jiān)劉康:機(jī)器人寫作倒逼媒體從業(yè)準(zhǔn)入門檻提高[EB/OL].(2018-05-05)[2020-07-23].https://baijiahao.baidu.com/s?id=1599605471852132642&wfr=spider&for=pc.
? IT之家.微軟小冰的星辰大海:會對話,唱歌,比喻,還有想象[EB/OL].(2019-11-24)[2020-07-24].https://tech.ifeng.com/c/7rsDIaYIQ2a.
? 葛許越.寫作機(jī)器人“作者”主體地位辨析[J].探索與爭鳴,2019(8):192-196+200.
? 崔自鐸.主體性與主體性原則的科學(xué)涵義[J].人文雜志,1993(1):19-20.
? 中國電子技術(shù)標(biāo)準(zhǔn)化研究院.人工智能標(biāo)準(zhǔn)化白皮書(2018)[R/O L].[2020-12-17].http://www.cesi.cn/images/editor/20180124/20180124135528742.pdf.
? 斯蒂芬斯.新聞的歷史[M].陳繼靜,譯.北京:北京大學(xué)出版社,2014:10-11.
? 李國杰.人工智能的三大悖論[J/OL].中國計(jì)算機(jī)學(xué)會通訊,2017(11).