薛 可 李亦飛
(1. 上海交通大學(xué)媒體與傳播學(xué)院,上海 200240; 2. 上海交通大學(xué)中國(guó)城市治理研究院,上海 200030)
1968年,“議程設(shè)置”理論的提出使人們開始相信大眾媒體能夠?qū)娮h程和輿論產(chǎn)生決定性的影響。電視、報(bào)紙等大眾傳播媒介通過設(shè)置不同信息展示的先后順序、篇幅大小、所處位置,以“對(duì)事實(shí)的選擇性報(bào)道”來“控制”人們所關(guān)注的內(nèi)容及其對(duì)待信息的想法與態(tài)度,“不僅決定了人們想什么,還可以決定人們?cè)趺聪搿薄?1)范紅霞、葉君浩: 《基于算法主導(dǎo)下的議程設(shè)置功能反思》,《當(dāng)代傳播》2018年第4期,第28—32頁。20世紀(jì)90年代,協(xié)同過濾技術(shù)首次被提出,推薦系統(tǒng)由此成為熱門的研究話題。軟件技術(shù)發(fā)展至今,將基于內(nèi)容和基于協(xié)同過濾技術(shù)的雙重機(jī)制同時(shí)納入算法評(píng)估模型,綜合考慮內(nèi)容標(biāo)簽、用戶歷史行為、背景信息以及用戶瀏覽動(dòng)機(jī),更深入分析用戶偏好的組合算法推薦已成為明顯的應(yīng)用趨勢(shì)。(2)Gediminas Adomavicius, Alexander Tuzhilin, “Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions,” IEEE Transactions on Knowledge and Data Engineering, vol.17, no.5(2005), pp.734-749.網(wǎng)絡(luò)媒介中信息傳播機(jī)制也發(fā)生了顛覆性的變革,大眾媒介不再是唯一承擔(dān)信息生產(chǎn)者和傳播者雙重身份的媒介,主流媒體信息與自媒體信息一起進(jìn)入流量池由算法進(jìn)行選擇并采用。“媒體—受眾”的線性關(guān)系隨之轉(zhuǎn)變?yōu)榱恕懊襟w—算法—用戶”的三者互動(dòng)關(guān)系,傳統(tǒng)大眾媒介的議程設(shè)置功能被算法推薦所取代,使之在一定程度上擁有了信息“把關(guān)人”的權(quán)力。不同于傳統(tǒng)大眾媒介擁有具有職業(yè)道德素養(yǎng)、能對(duì)內(nèi)容進(jìn)行把關(guān)的記者與編輯,應(yīng)用算法進(jìn)行推薦的商業(yè)平臺(tái)缺少內(nèi)容審核的“把關(guān)人”,導(dǎo)致不經(jīng)篩選的自媒體內(nèi)容通過算法被分發(fā)給用戶,形成了認(rèn)知價(jià)值引領(lǐng)的誤區(qū)和圈層化傳播的壁壘;算法技術(shù)的精準(zhǔn)性和適配性增加了信息接收主體的構(gòu)成寬度,使得危害性信息的擴(kuò)散變得更為便捷,網(wǎng)絡(luò)輿情的影響更加廣泛,(3)夏夢(mèng)穎: 《算法推薦可能引致的公共風(fēng)險(xiǎn)及綜合治理路徑》,《天府新論》2022年第2期,第124—129頁。對(duì)網(wǎng)絡(luò)信息生態(tài)環(huán)境構(gòu)成了嚴(yán)重挑戰(zhàn)。
為了更好地探究算法推薦所引致的網(wǎng)絡(luò)信息傳播秩序失控問題,筆者在2021年5月至2021年10月間通過半結(jié)構(gòu)化訪談和公開資料整理方式分別收集了一手?jǐn)?shù)據(jù)和二手?jǐn)?shù)據(jù)。一手?jǐn)?shù)據(jù)來源于對(duì)中央網(wǎng)信辦法治局、中國(guó)社科院新聞與傳播研究所、中國(guó)社科院政治學(xué)研究所、上海市網(wǎng)信辦輿情處、上海市網(wǎng)信辦技術(shù)處、上海市網(wǎng)信辦傳播處、新華社上海分社、嗶哩嗶哩技術(shù)部、東方衛(wèi)視、東方網(wǎng)視訊等10家政府管理部門、主流媒體單位、網(wǎng)絡(luò)媒體平臺(tái)相關(guān)負(fù)責(zé)人的半結(jié)構(gòu)化訪談。政府管理部門訪談問題主要集中于“算法推薦技術(shù)應(yīng)用所帶來的社會(huì)問題”“算法推薦內(nèi)容的管控措施與評(píng)估工具”“算法推薦治理的困境及針對(duì)性舉措”及“未來算法推薦治理重點(diǎn)及發(fā)展規(guī)劃”四個(gè)維度;主流媒體的訪談則聚焦于“算法推薦為信息傳播帶來的影響”“算法推薦賦能官方媒體傳播的方式與途徑”及“主流媒體輿論引導(dǎo)能力的提升策略”三個(gè)方面;網(wǎng)絡(luò)媒體平臺(tái)的訪談則從“算法推薦的內(nèi)容評(píng)估指標(biāo)與技術(shù)原理”“算法推薦的用戶反饋及意見”“算法推薦失控所致社會(huì)問題的解決方案”及“算法推薦技術(shù)遇到的困境及優(yōu)化方向”四個(gè)角度展開。每位受訪者的訪談時(shí)間為1—2小時(shí),共計(jì)訪談時(shí)間為16.3小時(shí),形成7.8萬字文本資料。二手?jǐn)?shù)據(jù)主要來源于網(wǎng)絡(luò)的公開文獻(xiàn)、新聞報(bào)道、訪談對(duì)象提供的內(nèi)部資料等,共整理成約5萬字文本。本文以不同的資料來源、同類型受訪群體中不同的受訪者、不同的受訪者立場(chǎng)等多種數(shù)據(jù)相互補(bǔ)充,形成三角驗(yàn)證增加研究結(jié)論的可靠性。
根據(jù)訪談結(jié)果,算法推薦提高了媒介的先進(jìn)生產(chǎn)力,有效滿足了民眾對(duì)個(gè)性化信息的需求,但也引發(fā)了一系列社會(huì)問題:
第一,算法推薦引領(lǐng)價(jià)值偏差致使算法社會(huì)責(zé)任缺失。根據(jù)半結(jié)構(gòu)化訪談,諸多媒體平臺(tái)以獲取用戶關(guān)注、爭(zhēng)取更長(zhǎng)的用戶停留時(shí)間作為算法推薦評(píng)判的核心標(biāo)準(zhǔn),其本質(zhì)是對(duì)“用戶注意力”進(jìn)行最大限度的追求。以技術(shù)為導(dǎo)向的媒體平臺(tái)當(dāng)前僅使用關(guān)鍵詞篩查等內(nèi)容審查方法,未將大量違背社會(huì)倫理道德的信息進(jìn)行前置性剔除,使得隱藏在各類“震驚體”背后的數(shù)據(jù)崇拜主義在商業(yè)利益的驅(qū)使下,不斷滿足著人們的獵奇心理而實(shí)現(xiàn)著平臺(tái)的“流量最大化”。另一方面,基于半監(jiān)督學(xué)習(xí)的算法推薦模型雖通過內(nèi)容與用戶的標(biāo)簽化實(shí)現(xiàn)了精準(zhǔn)匹配,但缺乏與之適配的評(píng)估體系與方法,僅以“流量”與“興趣”為評(píng)估指標(biāo),其推送的信息在價(jià)值導(dǎo)向上便容易出現(xiàn)“偏軌”,形成錯(cuò)誤的價(jià)值導(dǎo)向。關(guān)于企業(yè)社會(huì)責(zé)任的履行,各媒體平臺(tái)的負(fù)責(zé)人均提到了“公益項(xiàng)目”“賬號(hào)實(shí)名認(rèn)證”等,對(duì)自媒體正能量?jī)?nèi)容生產(chǎn)的關(guān)注較少。算法推薦的社會(huì)責(zé)任,不僅在于維護(hù)自媒體創(chuàng)作者的價(jià)值,更在于關(guān)注平臺(tái)內(nèi)容對(duì)網(wǎng)絡(luò)健康生態(tài)系統(tǒng)的影響。因此,如何對(duì)算法推薦以“技術(shù)”與“流量”為追求的價(jià)值取向進(jìn)行糾偏,使其更好地?fù)?dān)負(fù)起對(duì)網(wǎng)絡(luò)環(huán)境的社會(huì)責(zé)任,是筆者在訪談中發(fā)現(xiàn)的第一個(gè)有待解決的問題。
第二,買賣流量操縱公眾情緒盛行引發(fā)網(wǎng)絡(luò)集群行為。筆者通過訪談發(fā)現(xiàn),在以流量為導(dǎo)向的商業(yè)平臺(tái)利益模式下,形成了一個(gè)“流量買賣”市場(chǎng),數(shù)據(jù)注水、流量造假已經(jīng)成為不成文的市場(chǎng)規(guī)則。面對(duì)危機(jī)事件,部分企業(yè)也會(huì)通過“撤熱搜”“刪帖”“控評(píng)”等方式減少和降低公眾的探討與對(duì)真實(shí)情況的獲取,達(dá)成操縱輿論的目的。幾位主流媒體主編及運(yùn)營(yíng)者均提到:“在我們的認(rèn)知中,社會(huì)熱點(diǎn)、突發(fā)事件等內(nèi)容會(huì)更加吸引用戶,一些低俗虛假的內(nèi)容往往還能獲得很高的流量……主流媒體發(fā)布的新聞和時(shí)評(píng)也就很難會(huì)被推送到更多的用戶面前。”“熱搜的文娛榜單中,買頭條、買熱點(diǎn)的現(xiàn)象也常有發(fā)生?!痹诖诉^程中,權(quán)力邏輯介入導(dǎo)致了信息的失真?zhèn)鞑?公眾的自我意識(shí)和多元化信息內(nèi)容選擇力的逐漸喪失。公開的新聞報(bào)道也驗(yàn)證了這一觀點(diǎn),如娛樂經(jīng)紀(jì)公司通過購買熱搜榜資源,將錯(cuò)誤的輿論導(dǎo)向置入信息碎片化傳播過程中,操縱公眾情緒使其形成對(duì)信息認(rèn)知的偏見,讓粉絲群體將偶像“神化”。當(dāng)出現(xiàn)反對(duì)意見的聲音時(shí),即引發(fā)了在微博評(píng)論區(qū)的“飯圈罵戰(zhàn)”“人肉網(wǎng)暴”等網(wǎng)絡(luò)集群行為,擾亂了網(wǎng)絡(luò)生態(tài)的秩序。因此,如何轉(zhuǎn)變以流量為單一評(píng)價(jià)要素的算法推薦,并形成對(duì)網(wǎng)絡(luò)情緒的實(shí)時(shí)監(jiān)測(cè)避免集群行為的發(fā)生,成為本文第二個(gè)擬解決的核心問題。
第三,技術(shù)不對(duì)等的治理現(xiàn)狀造成對(duì)算法監(jiān)管的空缺。2021年12月31日國(guó)家互聯(lián)網(wǎng)信息辦公室等四部委聯(lián)合出臺(tái)的《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(以下簡(jiǎn)稱《規(guī)定》),成為世界上第一部專門針對(duì)算法的法律文件,填補(bǔ)了世界數(shù)字制度建設(shè)的空白,實(shí)現(xiàn)了對(duì)算法的全面性、系統(tǒng)性規(guī)制。然而面對(duì)商業(yè)平臺(tái)構(gòu)建的算法“黑箱”,其科技含量高、利益牽扯復(fù)雜的特征使其治理不同于傳統(tǒng)的網(wǎng)絡(luò)治理,涉及了個(gè)人隱私、商業(yè)機(jī)密等多維問題,《規(guī)定》的出臺(tái)為算法做出了原則性的規(guī)定,但技術(shù)監(jiān)管的落地實(shí)施仍存在操作性困境。一位政府相關(guān)主管部門負(fù)責(zé)人指出,“面對(duì)算法推薦機(jī)制的不完善,以及算法帶來的這些社會(huì)問題,我們其實(shí)并沒有相應(yīng)的技術(shù)手段能夠從源頭進(jìn)行監(jiān)管。目前只能進(jìn)行事后懲罰,暫時(shí)技術(shù)上還達(dá)不到事先的預(yù)防”。可見,技術(shù)治理的及時(shí)跟進(jìn)才是政策落到實(shí)處的基礎(chǔ)保證。如何構(gòu)建具有可操作性的算法推薦機(jī)制優(yōu)化方案及監(jiān)管技術(shù),是訪談中發(fā)現(xiàn)的第三個(gè)迫切需解決的問題。
以“流量”為判斷核心的機(jī)器評(píng)判標(biāo)準(zhǔn)使得“算法價(jià)值觀”出現(xiàn)偏差,從而導(dǎo)致了算法社會(huì)責(zé)任的缺失。如何以社會(huì)責(zé)任為基石,根據(jù)推薦算法技術(shù)的底層運(yùn)行邏輯與公眾信息認(rèn)知的深層機(jī)理,構(gòu)建算法推薦引發(fā)社會(huì)風(fēng)險(xiǎn)的有效評(píng)估治理路徑,將是本文重點(diǎn)探索的核心問題。
Resniek等學(xué)者在1994年以GroupLens系統(tǒng)為例,指出算法可以幫助用戶根據(jù)其他人的偏好和評(píng)價(jià)來做出選擇。(4)P. Resnick, N. Iacovou, M. Suchak, et al., “An Open Architecture for Collaborative Filtering of Netnews,” Proceedings of the 1994 ACM Conference on Computer Supported Cooperative Work, 1994, pp.175-186.算法被定義為一種“決策規(guī)則”,“描述了如何利用數(shù)據(jù)和模型來解決特定的問題”。(5)John Danaher, et al., “Algorithmic Governance: Developing a Research Agenda through the Power of Collective Intelligence,” Big Data &Society, vol.4, no.2(2017), DOI: 10.1177/2053951717726554.在智能傳播媒體語境中,算法成為了媒體平臺(tái)建立海量用戶數(shù)據(jù)庫進(jìn)行信息過濾的技術(shù)基礎(chǔ),對(duì)此Resniek認(rèn)為“推薦系統(tǒng)”(Recommender System)的概念相比“過濾”更為準(zhǔn)確地指出系統(tǒng)不僅能夠排除無用信息,還能有效地呈現(xiàn)用戶感興趣的內(nèi)容。(6)Paul Resnick, Hal R. Varian,“Recommender Systems,” Communications of the ACM, vol.40, no.3(1997), pp.56-58.此后“推薦系統(tǒng)”的概念開始在計(jì)算機(jī)科學(xué)、電子信息等先進(jìn)技術(shù)研發(fā)領(lǐng)域得到廣泛應(yīng)用。推薦系統(tǒng)最核心的部分是推薦算法,從其運(yùn)作邏輯出發(fā),可分為“內(nèi)容評(píng)分”與“用戶聚類”兩大核心部分。其中內(nèi)容推薦的評(píng)分算法研究,以貝葉斯模型為主要評(píng)分法,即將“內(nèi)容流量”作為對(duì)用戶吸引能力的綜合評(píng)價(jià)標(biāo)準(zhǔn),(7)李旭然、丁曉紅: 《機(jī)器學(xué)習(xí)的五大類別及其主要算法綜述》,《軟件導(dǎo)刊》2018年第7期,第4—9頁。其核心熱度加權(quán)指標(biāo)包括了停留時(shí)間、評(píng)論量、點(diǎn)贊量、收藏量、訪問量、轉(zhuǎn)發(fā)量等。算法用戶聚類的相關(guān)研究則指出,推薦算法技術(shù)基于內(nèi)容評(píng)分和內(nèi)容特征畫像(Item Profile)分析用戶的信息偏好、搜索行為等歷史互動(dòng)數(shù)據(jù)構(gòu)建用戶畫像(User Profile),進(jìn)而考察兩者的相似度,為用戶推薦與其瀏覽記錄結(jié)果相近的內(nèi)容。(8)陳昌鳳、師文: 《個(gè)性化新聞推薦算法的技術(shù)解讀與價(jià)值探討》,《中國(guó)編輯》 2018年第10期,第9—14頁。協(xié)同過濾算法則以“具有相似行為數(shù)據(jù)用戶具有相似的特征”為基本假設(shè),一般分為基于記憶(Memory-Based)的算法和基于模型(Model-Based)的算法。通過聚類分析收集用戶在內(nèi)容平臺(tái)上留下的各類偏好信息,將原本沒有聯(lián)系的用戶群體聯(lián)結(jié)在一起,可形成具有相似特征的用戶群并進(jìn)行近似主題內(nèi)容的算法推薦。(9)Robin Burke, “Hybrid Recommender Systems: Survey and Experiments,” User Modeling and User-Adapted Interaction, vol.12, no.4(2002), pp.331-370.可見,“內(nèi)容評(píng)分”與“用戶聚類”對(duì)內(nèi)容的分發(fā)機(jī)制具有重要決定作用,也影響著算法推薦的內(nèi)容傳播效果。據(jù)此,算法內(nèi)容分發(fā)機(jī)制管理問題的研究將是本文關(guān)注的核心聚焦點(diǎn)。
隨著計(jì)算機(jī)技術(shù)日漸成熟,算法推薦的商業(yè)應(yīng)用不斷拓寬,學(xué)界研究也從關(guān)注技術(shù)優(yōu)化、傳播效果等逐漸轉(zhuǎn)向關(guān)注由之引發(fā)的社會(huì)問題。對(duì)個(gè)體而言,算法推薦在個(gè)體選擇性接觸和媒體平臺(tái)“千人千面”的信息分發(fā)機(jī)制的共同作用下導(dǎo)致個(gè)體存在信息獲取的困境;對(duì)群體而言,算法推薦施加于個(gè)體的“信息繭房”加劇了受眾群體“千人一面”的回音室效應(yīng),(10)李亦飛、梁巧稚、薛可: 《智能算法推薦的治理困境及提升路徑研究》,《新聞愛好者》2021年第11期,第41—44頁。將同質(zhì)化群體與外界隔離。因?yàn)槿狈ν獠啃畔⒌倪M(jìn)入,回音室內(nèi)部的觀點(diǎn)將會(huì)不斷趨同,并排斥異己以致觀點(diǎn)極端化,可能誘發(fā)內(nèi)群體極化的形成與融合,最終導(dǎo)致群體間沖突及網(wǎng)絡(luò)集群行為的發(fā)生。(11)陳宇、張麗、王洛忠: 《網(wǎng)絡(luò)時(shí)代鄰避集群行為演化機(jī)理——基于信息繭房的分析》,《中國(guó)行政管理》2021年第10期,第106—114頁。網(wǎng)絡(luò)集群行為(Internet Collective Behavior)是傳統(tǒng)集群行為在網(wǎng)絡(luò)環(huán)境下的復(fù)制和衍生,是基于互聯(lián)網(wǎng)產(chǎn)生的相對(duì)自發(fā)、不可預(yù)料、無組織以及不穩(wěn)定的情況下對(duì)某一共同影響或刺激產(chǎn)生的網(wǎng)絡(luò)互動(dòng)行為。(12)鄧希泉: 《網(wǎng)絡(luò)集群行為的主要特征及其發(fā)生機(jī)制研究》,《社會(huì)科學(xué)研究》2010年第1期,第103—107頁。在互聯(lián)網(wǎng)媒介環(huán)境中,網(wǎng)絡(luò)集群行為往往與群體性事件(Crowd Event)密切關(guān)聯(lián),其反社會(huì)性、破壞性、違法性等負(fù)面屬性被重點(diǎn)強(qiáng)調(diào),(13)樂國(guó)安、薛婷: 《網(wǎng)絡(luò)集群行為的理論解釋模型探索》,《南開學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》2011年第5期,第116—123頁。成為算法推薦所致網(wǎng)絡(luò)失序帶來的突出問題。
面對(duì)算法推薦所帶來的網(wǎng)絡(luò)失序問題,學(xué)界也從技術(shù)治理、倫理法規(guī)、社會(huì)責(zé)任等角度展開對(duì)算法治理的相關(guān)研究。從技術(shù)治理的角度,眾多學(xué)者認(rèn)為必須加強(qiáng)監(jiān)管者的介入程度,通過算法有限公開、算法備案等方式從技術(shù)角度降低算法的透明度風(fēng)險(xiǎn)。(14)黃博文: 《算法不完備性及其治理——以互聯(lián)網(wǎng)金融消費(fèi)者保護(hù)為中心》,《西南金融》2018年第8期,第49—56頁。從倫理法規(guī)視角,學(xué)界通常從更微觀的視角關(guān)注算法的外部監(jiān)管與法律體系的完善(15)彭晴菲: 《網(wǎng)絡(luò)環(huán)境下用戶隱私權(quán)的憲法保護(hù)探析》,《北京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào)》2019年第18卷第4期,第104—108頁。,以及算法所引發(fā)的倫理危機(jī)及其法律規(guī)制。(16)鄭智航: 《人工智能算法的倫理危機(jī)與法律規(guī)制》,《法律科學(xué)(西北政法大學(xué)學(xué)報(bào))》2021年第39卷第1期,第14—26頁。從社會(huì)責(zé)任視角,以羅伯特·哈欽斯提出的“媒介社會(huì)責(zé)任理論”為核心基礎(chǔ),形成了學(xué)者們對(duì)算法社會(huì)責(zé)任的研究。該理論指出,大眾傳播媒介要以公共利益服務(wù)為目標(biāo),以教育與啟蒙大眾為己任,強(qiáng)調(diào)在新聞自由的背景下仍不能忽視媒介所應(yīng)承擔(dān)的社會(huì)責(zé)任與義務(wù)。(17)嚴(yán)曉青: 《媒介社會(huì)責(zé)任研究: 現(xiàn)狀、困境與展望》,《當(dāng)代傳播》2010年第2期,第38—41頁。黨的十九大報(bào)告提出要讓“主旋律更加響亮,正能量更加強(qiáng)勁”,“正能量”一詞被黨和國(guó)家領(lǐng)導(dǎo)人多次提及。筆者在前期研究中也專門對(duì)網(wǎng)絡(luò)正能量的概念界定進(jìn)行過細(xì)致探討,提出網(wǎng)絡(luò)中的正能量信息即“符合社會(huì)基本的道德規(guī)范,滿足公眾的信息需求,促使公眾產(chǎn)生全面客觀的信息認(rèn)知、積極健康的社會(huì)情緒,以及與之相應(yīng)的公眾行為, 并最終減弱或消除公共事件的負(fù)面影響,使輿情態(tài)勢(shì)向理性、穩(wěn)定、積極的方向發(fā)展的信息”。(18)薛可、山峰、余明陽等: 《突發(fā)危機(jī)中非官方正能量信息的概念形成與維度分析》,《現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào))》2015年第37卷第10期,第24—29頁。正因其對(duì)網(wǎng)絡(luò)輿情具有正向、積極的引導(dǎo)作用,當(dāng)算法推薦等新技術(shù)出現(xiàn)后,其社會(huì)責(zé)任的治理焦點(diǎn)也轉(zhuǎn)向了數(shù)智化企業(yè)開發(fā)算法以及應(yīng)用算法過程中的負(fù)責(zé)任程度。(19)陽鎮(zhèn)、陳勁: 《數(shù)智化時(shí)代下企業(yè)社會(huì)責(zé)任的創(chuàng)新與治理》,《上海財(cái)經(jīng)大學(xué)學(xué)報(bào)》2020年第22卷第6期,第33—51頁。不同學(xué)科亦從不同角度對(duì)算法所應(yīng)承擔(dān)的社會(huì)責(zé)任提出要求,從法學(xué)視角出發(fā),算法應(yīng)保證公眾的知情權(quán)與隱私權(quán)不受侵犯;(20)湯曉瑩: 《算法技術(shù)帶來的勞動(dòng)者隱私風(fēng)險(xiǎn)及制度因應(yīng)》,《中國(guó)人力資源開發(fā)》2021年第38卷第8期,第65—81頁。公共關(guān)系學(xué)則要求算法推薦通過內(nèi)容監(jiān)測(cè),使用戶關(guān)注重大事件,為用戶解決信息差的問題;(21)Elizabeth Johnson Avery, “Public Information Officers’ Social Media Monitoring during the Zika Virus Crisis, A Global Health Threat Surrounded by Public Uncertainty,” Public Relations Review, vol.43, no.3(2017), pp.468-476.而立足傳播學(xué)視角,網(wǎng)絡(luò)空間需要大量的積極信息, 用以滿足公眾的信息需求、情感維系和人文關(guān)懷,因此傳遞正能量信息,維護(hù)清朗的網(wǎng)絡(luò)秩序也成為了算法所應(yīng)肩負(fù)的重要社會(huì)責(zé)任。(22)位云玲、馮廣圣: 《算法新聞推薦的社會(huì)責(zé)任反思》,《新聞知識(shí)》2020年第9期,第23—26頁。目前算法與社會(huì)責(zé)任的研究更多偏向于治理理念指導(dǎo)與治理機(jī)制的思考性探索,較少在社會(huì)責(zé)任理論指導(dǎo)下關(guān)注對(duì)于媒體平臺(tái)而言具有可操作性的治理工具?;诖?本文立足傳播學(xué)視角,提出如下研究問題1: 如何優(yōu)化算法推薦內(nèi)容分析模型,使其推送正能量信息,更好地承擔(dān)社會(huì)責(zé)任?
通過半結(jié)構(gòu)化訪談與文獻(xiàn)研究發(fā)現(xiàn),個(gè)體網(wǎng)絡(luò)輿情表達(dá)并不足以構(gòu)成引發(fā)集群行為的影響力,網(wǎng)絡(luò)情境下個(gè)體認(rèn)同向群體認(rèn)同轉(zhuǎn)移、個(gè)體間的情緒感染產(chǎn)生的心理力量才是集群行為的強(qiáng)大動(dòng)力。(23)許志紅: 《網(wǎng)絡(luò)集群行為的社會(huì)心理機(jī)制分析》,《學(xué)術(shù)論壇》2013年第36卷第3期,第181—185頁。這一心理機(jī)制闡明了個(gè)體現(xiàn)實(shí)中的情緒體驗(yàn),在網(wǎng)絡(luò)環(huán)境中發(fā)展為網(wǎng)絡(luò)集群行為的路徑。情緒并非獨(dú)立存在,而是伴隨著信息傳播產(chǎn)生,情緒對(duì)傳播效果的影響不僅在于它左右人們對(duì)所傳播的信息的認(rèn)知,還在于它對(duì)行為具有指導(dǎo)作用。(24)隋巖、李燕: 《論群體傳播時(shí)代個(gè)人情緒的社會(huì)化傳播》,《現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào))》2012年第34卷第12期,第10—15頁。
互動(dòng)儀式鏈理論中提出了“情感能量”的概念,情感能量是社會(huì)互動(dòng)的根本動(dòng)力,能夠驅(qū)動(dòng)個(gè)體參加或規(guī)避某項(xiàng)活動(dòng)。(25)Norman K. Denzin, “On Understanding Emotion: The Interpretive-Cultural Agenda,” in Theodore D. Kemper, ed., Research Agendas in the Sociology of Emotions, New York: SUNY Press, 1990, pp.85-116.網(wǎng)絡(luò)輿情信息亦需通過數(shù)字化情緒感染才能間接對(duì)網(wǎng)絡(luò)集體行為意向產(chǎn)生影響。(26)謝泗薪、李春華: 《應(yīng)急救援情景下航空物流企業(yè)社交媒體印象管理策略研究——基于數(shù)字化情緒感染視角》,《價(jià)格月刊》2022年第5期,第76—88頁。算法推薦的應(yīng)用與助推,使得這些情感能量充斥于網(wǎng)絡(luò)平臺(tái),而內(nèi)容信息中的情感外溢則是這種情感結(jié)構(gòu)可被觀察與測(cè)量的最直觀的外化表現(xiàn)??梢?網(wǎng)絡(luò)信息所含的“情緒”也是引發(fā)網(wǎng)絡(luò)輿情事件的關(guān)鍵動(dòng)機(jī)。在算法推薦視閾下具有相同“標(biāo)簽”的受眾群體共享相同的內(nèi)容,其情緒更容易得到相互刺激,形成同質(zhì)化的情緒狀態(tài)和共通性的情緒集聚共鳴,群體興奮力量隨群體中個(gè)體的數(shù)目呈幾何級(jí)上升,最終促成群體內(nèi)部凝聚力的提升,引發(fā)公眾輿情事件。目前相關(guān)研究均側(cè)重于算法推薦的內(nèi)容“文本”端,而對(duì)內(nèi)容中含有的“情緒”端較少關(guān)注。因此本文提出如下研究問題2: 如何使算法推薦在評(píng)估內(nèi)容文本的基礎(chǔ)上,增加對(duì)文本情緒的評(píng)估,形成對(duì)網(wǎng)絡(luò)輿情事件更全面的監(jiān)測(cè)?
情緒傳播并非單向的輸出,社交媒體平臺(tái)的內(nèi)容通過評(píng)論等方式可將簡(jiǎn)單的情緒轉(zhuǎn)變?yōu)楣差I(lǐng)域的對(duì)話和交流。受到算法推薦的歸類,相似特征的用戶會(huì)收到相同的推薦內(nèi)容,在評(píng)論區(qū)中將自己和他人體驗(yàn)到的情緒宣泄表達(dá)出來,而情緒的流動(dòng)和交換即形成了網(wǎng)絡(luò)情緒的集體釋放,(27)許志紅: 《網(wǎng)絡(luò)集群行為的社會(huì)心理機(jī)制分析》,《學(xué)術(shù)論壇》2013年第36卷第3期,第181—185頁。加之群體間的社會(huì)認(rèn)同,在情感上進(jìn)一步激發(fā)了公眾參與現(xiàn)實(shí)集體行動(dòng)的動(dòng)機(jī),從而引發(fā)網(wǎng)絡(luò)集群事件。(28)薛婷、陳浩、樂國(guó)安等: 《社會(huì)認(rèn)同對(duì)集體行動(dòng)的作用: 群體情緒與效能路徑》,《心理學(xué)報(bào)》2013年第45卷第8期,第899—920頁。有研究指出相比內(nèi)容本身,其評(píng)論更影響輿論的走向,眾多重大微博輿情事件的爆發(fā)均源于用戶的大量負(fù)面評(píng)論。(29)諶志群、鞠婷: 《基于BERT和雙向LSTM的微博評(píng)論傾向性分析研究》,《情報(bào)理論與實(shí)踐》2020年第43卷第8期,第173—177頁。可見,媒體平臺(tái)在維持用戶信息交流功能的同時(shí),也承載著用戶的情感交流。信息只是可見的結(jié)構(gòu)表象,在其之下隱含著不可見的情感結(jié)構(gòu),以一定策略分配、調(diào)整、生產(chǎn)著情感。評(píng)論區(qū)的用戶互動(dòng)使得原本隱匿于文本信息之中、不可見的情感信息,迅速聚集纏繞成具象化的情緒共振體,它成為了網(wǎng)絡(luò)輿情中最為活躍和易變的因子,(30)蔣艷艷: 《網(wǎng)絡(luò)倫理事件輿論傳播中的情緒倫理風(fēng)險(xiǎn)及其應(yīng)對(duì)》,《思想理論教育》2022年第6期,第94—99頁。對(duì)網(wǎng)絡(luò)集群行為起到?jīng)Q定性作用。情緒互動(dòng)所帶來的影響也因此成為算法推薦時(shí)對(duì)內(nèi)容進(jìn)行審核評(píng)估所必須考量的因素?;诖?本文提出如下研究問題3: 如何使算法推薦對(duì)內(nèi)容及評(píng)論的雙向情感互動(dòng)進(jìn)行評(píng)估與預(yù)警,減少由情緒極化引發(fā)的網(wǎng)絡(luò)集群行為?
針對(duì)基于社會(huì)調(diào)查與文獻(xiàn)研究提出的研究問題,本文將運(yùn)用神經(jīng)網(wǎng)絡(luò)計(jì)算方法對(duì)“算法社會(huì)責(zé)任”進(jìn)行具象化表達(dá),以此構(gòu)建具有可操作性的算法內(nèi)容評(píng)價(jià)基準(zhǔn),擬回答研究問題1;在此基礎(chǔ)上,本文擬采用隨機(jī)梯度下降算法(SGD)對(duì)模型進(jìn)行優(yōu)化,提高其分類能力與準(zhǔn)確率,達(dá)到對(duì)文本分析和情感分析的雙重價(jià)值評(píng)估,擬回答研究問題2;基于優(yōu)化后的模型,本文加入了對(duì)內(nèi)容評(píng)論的情感分析,將傳者與受者間雙向情感互動(dòng)納入算法評(píng)估的考量,形成完整的內(nèi)容評(píng)估模型,擬回答研究問題3。文本-情感分析模型搭建與訓(xùn)練過程如下:
筆者運(yùn)用Selenium庫構(gòu)建Python腳本,通過動(dòng)態(tài)網(wǎng)絡(luò)數(shù)據(jù)采集,為數(shù)據(jù)集構(gòu)建提供算法推薦的內(nèi)容文本??紤]到本文的研究范圍僅限于文本類信息,因此筆者選擇了3個(gè)用戶人數(shù)多、推薦算法技術(shù)應(yīng)用成熟的網(wǎng)絡(luò)平臺(tái)(今日頭條、微博、知乎)進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)采集。此外,為了能對(duì)正能量?jī)?nèi)容進(jìn)行更好的評(píng)判,筆者還補(bǔ)充采集了3家中央媒體單位(《人民日?qǐng)?bào)》網(wǎng)絡(luò)版、《光明日?qǐng)?bào)》網(wǎng)絡(luò)版、新華網(wǎng))的網(wǎng)絡(luò)數(shù)據(jù),將它們作為基于社會(huì)責(zé)任的內(nèi)容的參考基準(zhǔn)。為了更準(zhǔn)確地獲取信息內(nèi)容及規(guī)避由于不同用戶標(biāo)簽帶來的算法推薦的偏向性,筆者采集時(shí)均在沙盒中設(shè)置了空白賬號(hào)用于內(nèi)容采集,對(duì)于不同頁面內(nèi)容的瀏覽、點(diǎn)擊等操作均保持一致。筆者每日在六個(gè)平臺(tái)各采集1 000篇內(nèi)容,持續(xù)采集15天。經(jīng)過對(duì)亂碼等采集錯(cuò)誤的數(shù)據(jù)進(jìn)行清洗后,筆者對(duì)缺失的32篇內(nèi)容進(jìn)行數(shù)據(jù)補(bǔ)充采集,最終形成具有15 000篇文章內(nèi)容的原始數(shù)據(jù)集。
根據(jù)本文提出的三個(gè)研究問題,為探究文本的正能量屬性及其情感傾向,本文的數(shù)據(jù)標(biāo)注主要從內(nèi)容正能量屬性、內(nèi)容客觀性、內(nèi)容情感極性三個(gè)方面開展,文章內(nèi)容將根據(jù)標(biāo)注進(jìn)行分類,形成帶有標(biāo)簽的文章數(shù)據(jù)集。其中,內(nèi)容的正能量屬性是指文章內(nèi)容是否存在黃色、暴力或違反社會(huì)倫理道德的觀點(diǎn),結(jié)合“推薦算法社會(huì)責(zé)任評(píng)價(jià)指標(biāo)體系”中B3的下屬相關(guān)指標(biāo)進(jìn)行標(biāo)注;(31)薛可、李亦飛: 《推薦算法的社會(huì)責(zé)任評(píng)價(jià)指標(biāo)建構(gòu)》,《現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào))》2022年第44卷第1期,第146—152頁。客觀性分類是指文章內(nèi)容按其類型和風(fēng)格區(qū)分為客觀和主觀兩類,主要依據(jù)詞性標(biāo)注(POS Tagging)的特征選擇方法開展;(32)Aidan Finn, Nicholas Kushmerick, Barry Smyth, “Genre Classification and Domain Transfer for Information Filtering,” European Conference on Information Retrieval, 2002, pp.353-362.情感極性是針對(duì)內(nèi)容的情感導(dǎo)向加以標(biāo)注,基于Liu等學(xué)者的研究,內(nèi)容將被歸納為六個(gè)基本類別(高興、悲傷、憤怒、恐懼、厭惡和驚奇)。(33)H. Liu, T. Selker, H. Lieberman, “Visualizing the Affective Structure of a Text Document,” CHI: Conference on Human Factors in Computing Systems, April 2003, pp. 740-741.
為確保內(nèi)容標(biāo)注的準(zhǔn)確性,筆者共邀請(qǐng)了5位傳播學(xué)專業(yè)學(xué)者作為標(biāo)注員。一致性檢驗(yàn)的方式為所有標(biāo)注員對(duì)500篇隨機(jī)挑選的文章內(nèi)容(數(shù)量占總文章數(shù)的3.3%)進(jìn)行試標(biāo)注,編碼的一致性檢驗(yàn)數(shù)據(jù)如下: 內(nèi)容正能量屬性(0.83)、內(nèi)容客觀性(0.92)、內(nèi)容情感極性(0.85)。
筆者將帶有上述數(shù)據(jù)標(biāo)注的文章內(nèi)容作為原始訓(xùn)練集,運(yùn)用NLP(Natural Language Process)自然語言處理神經(jīng)網(wǎng)絡(luò)模型進(jìn)行中文分詞,并根據(jù)語言學(xué)特征的元素將文本表達(dá)為特征向量。筆者選擇了word2vec模型中的CBOW模型(Continuous Bag-of-Words Model)進(jìn)行詞向量的訓(xùn)練,用詞w(t)前后的各a個(gè)詞預(yù)測(cè)當(dāng)前詞(本文中令a=2)。其中輸入層為詞w(t)上下文中的2a個(gè)詞向量;發(fā)射層SUM為這2a個(gè)詞向量的累加之和;輸出層以訓(xùn)練中集中出現(xiàn)過的詞作葉子節(jié)點(diǎn),以各詞在訓(xùn)練中集中出現(xiàn)的次數(shù)作為權(quán)重構(gòu)造Hufman樹,則葉子節(jié)點(diǎn)共N(=|X|)個(gè),分別對(duì)應(yīng)訓(xùn)練集X中的詞,非葉子節(jié)點(diǎn)N-1個(gè)。通過隨機(jī)梯度上升算法對(duì)發(fā)射層SUM的結(jié)果進(jìn)行預(yù)測(cè),使得p(w|context (w)) 值最大化,context(w) 指詞的上下文中的2a個(gè)詞。當(dāng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成時(shí),即可求出詞向量w。(34)唐明、朱磊、鄒顯春: 《基于Word2Vec的一種文檔向量表示》,《計(jì)算機(jī)科學(xué)》2016年第43卷第6期,第214—217頁。
依據(jù)向量空間表示模型(VSM),本文以項(xiàng)的出現(xiàn)頻率作為基礎(chǔ)計(jì)算權(quán)重,(35)唐慧豐、譚松波、程學(xué)旗: 《基于監(jiān)督學(xué)習(xí)的中文情感分類技術(shù)比較研究》,《中文信息學(xué)報(bào)》2007年第6期,第88—94頁。假定集合{f1,f2, …,fm}是文本a中出現(xiàn)的m個(gè)特征,令ni(a)為特征fi在文本a中出現(xiàn)的次數(shù),則文本a就可以由一個(gè)特征向量來表示,記為:
通過對(duì)文本內(nèi)容中文分詞以及文章特征向量的表達(dá),可以實(shí)現(xiàn)用計(jì)算機(jī)語言表達(dá)文章內(nèi)容并用于后續(xù)的模型計(jì)算。同時(shí),筆者根據(jù)文本內(nèi)容正能量屬性、內(nèi)容客觀性、內(nèi)容情感極性的三類標(biāo)簽,將正向得分的文本獨(dú)立組合形成基于社會(huì)責(zé)任的語料庫。后期利用網(wǎng)絡(luò)爬蟲得到無標(biāo)簽數(shù)據(jù)并進(jìn)行機(jī)器自動(dòng)化標(biāo)注后,可以形成基于社會(huì)責(zé)任語料庫的自動(dòng)內(nèi)容采集與動(dòng)態(tài)更新?;谠~庫的構(gòu)建,本文通過詞頻熱度分析,運(yùn)用核心高頻詞實(shí)現(xiàn)了對(duì)“算法社會(huì)責(zé)任”的具象化表達(dá),回答了研究問題1。
筆者使用PyTorch搭建機(jī)器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)模型,構(gòu)建模型訓(xùn)練代碼。PyTorch相對(duì)其他框架,可以有效支持GPU、動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)、Python優(yōu)先等特點(diǎn),相對(duì)于Tensorflow, PyTorch更為簡(jiǎn)潔直觀,因此在訓(xùn)練文本-情感分析模型時(shí)選用該框架。(36)李夢(mèng)潔、董巒: 《基于PyTorch的機(jī)器翻譯算法的實(shí)現(xiàn)》,《計(jì)算機(jī)技術(shù)與發(fā)展》2018年第28卷第10期,第160—163頁。本研究選擇的模型結(jié)構(gòu)為SVM與CNN,這兩種模型具備特征表征能力強(qiáng)、應(yīng)用廣泛等優(yōu)勢(shì),常應(yīng)用于自然語言處理領(lǐng)域。這兩種模型乃是監(jiān)督學(xué)習(xí)模型,本研究為獲取最優(yōu)權(quán)重,選擇了隨機(jī)梯度下降算法(SGD)對(duì)模型進(jìn)行優(yōu)化,相關(guān)公式如下:
本文構(gòu)建的文本-情感分析模型是模型整體框架搭建與分析模型功能的集成,包含算法推薦文章數(shù)據(jù)采集、文章分詞分類與特征向量化、文章內(nèi)容文本分析、文章內(nèi)容與評(píng)論情感分析、傳播指數(shù)加權(quán)計(jì)算的五步驟自動(dòng)運(yùn)算。本文應(yīng)用該模型能夠?qū)λ惴ㄍ扑]的文章進(jìn)行內(nèi)容和情感的雙重價(jià)值評(píng)估,實(shí)現(xiàn)對(duì)內(nèi)容發(fā)布者和內(nèi)容評(píng)論者的雙向情感互動(dòng)的評(píng)估?;谏鲜瞿P蜆?gòu)建,本文從文本分析、情感分析與數(shù)據(jù)集虛擬仿真三個(gè)維度開展對(duì)模型的驗(yàn)證分析。
遷移學(xué)習(xí)是一種新的機(jī)器學(xué)習(xí)范式,是通過給定的源域(Source Domain)和源域的學(xué)習(xí)任務(wù),以及目標(biāo)域(Target Domain)和目標(biāo)域的學(xué)習(xí)任務(wù),將一種場(chǎng)景下已經(jīng)學(xué)習(xí)到的知識(shí)“遷移”到另一個(gè)場(chǎng)景中以更高效解決實(shí)際問題的技術(shù)方法。(38)Sinno Jialin Pan, Qiang Yang, “A Survey on Transfer Learning,” IEEE Transactions on Knowledge and Data Engineering, vol.22, no.10(2010), pp.1345-1359.通過計(jì)算機(jī)的遷移學(xué)習(xí),本研究將文章主體內(nèi)容、標(biāo)題、評(píng)論內(nèi)容作為輸入端,運(yùn)用上述已完成預(yù)訓(xùn)練的基準(zhǔn)模型對(duì)其內(nèi)容進(jìn)行中文文本分詞和特征向量構(gòu)建。得益于遷移學(xué)習(xí)方式,本研究能夠快速實(shí)現(xiàn)對(duì)于文本的分詞,以及特征向量的構(gòu)建,從而通過已訓(xùn)練好的SVM與CNN模型,即文本-情緒分析模型,生成其文本分析的置信度,并根據(jù)置信度進(jìn)行線性變換后得到文本評(píng)估分?jǐn)?shù),實(shí)現(xiàn)對(duì)文本的量化分析。在進(jìn)行神經(jīng)網(wǎng)絡(luò)計(jì)算時(shí)運(yùn)用多維數(shù)組,以實(shí)現(xiàn)并行計(jì)算,加速計(jì)算過程。
情感分析又被稱為傾向性分析(Tendency Analysis),其本質(zhì)是對(duì)文本中蘊(yùn)含的情感傾向性進(jìn)行抽取和分類。(39)姚天昉、程希文、徐飛玉等: 《文本意見挖掘綜述》,《中文信息學(xué)報(bào)》2008年第3期,第71—80頁。本研究使用TF-IDF算法將經(jīng)過基準(zhǔn)模型處理后的詞向量轉(zhuǎn)化成詞矩陣模型,對(duì)于文本的評(píng)論則運(yùn)用K-Means算法對(duì)其數(shù)據(jù)進(jìn)行聚類,綜合文本數(shù)據(jù)和評(píng)論數(shù)據(jù)后,采用SNOWNLP進(jìn)行情感分析。經(jīng)算法計(jì)算所得的情感程度將以0—1來表達(dá),即判斷句子消極、積極的概率。(40)李慧、柴亞青: 《基于屬性特征的評(píng)論文本情感極性量化分析》,《數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)》2017年第1卷第10期,第1—11頁。筆者于2021年6月1日至8月31日從由網(wǎng)絡(luò)爬蟲自動(dòng)采集的數(shù)據(jù)中隨機(jī)抽取2 550條進(jìn)行單獨(dú)情感分析測(cè)試(如圖1所示,橫坐標(biāo)X軸表示不同的數(shù)據(jù)序號(hào),縱坐標(biāo)Y軸表示數(shù)據(jù)的情感得分),根據(jù)情感程度散點(diǎn)分布可以判斷單位時(shí)間內(nèi)不同平臺(tái)的文本傾向性走勢(shì),形成對(duì)平臺(tái)內(nèi)容的預(yù)警判斷。從數(shù)據(jù)點(diǎn)狀圖可以清晰地評(píng)判網(wǎng)絡(luò)內(nèi)容中情緒互動(dòng)的極性分布,實(shí)現(xiàn)了對(duì)傳者受者間雙向情緒的價(jià)值評(píng)估,回答了研究問題3。
圖1 不同平臺(tái)的情感程度散點(diǎn)分布
評(píng)估指標(biāo)的效用性驗(yàn)證是確保構(gòu)建文本-情感分析模型科學(xué)性與合理性的重要過程。本研究因此采用機(jī)器計(jì)算驗(yàn)證的方式,分別對(duì)各大媒體平臺(tái)基于流量的推薦算法和本文提出的基于文本正能量?jī)A向和文本及評(píng)論情緒傾向的推薦算法進(jìn)行了試驗(yàn)性比較。
算法系統(tǒng)作為媒體企業(yè)的核心技術(shù),屬于私有財(cái)產(chǎn),且因其算法內(nèi)容龐大復(fù)雜,難以直接運(yùn)用于本研究的試驗(yàn)性驗(yàn)證中。因此,本研究首先基于深度訪談及網(wǎng)絡(luò)公開信息,自行構(gòu)建了一套以“流量”為核心評(píng)判標(biāo)準(zhǔn)的算法模擬運(yùn)行機(jī)制,隨后根據(jù)本文提出的文本-情感分析模型,建立了一套文本-情感分析算法模擬。構(gòu)建完成后,本研究采集真實(shí)數(shù)據(jù)并通過機(jī)器計(jì)算驗(yàn)證的形式進(jìn)行了數(shù)據(jù)集實(shí)驗(yàn),對(duì)模型的實(shí)踐效用性進(jìn)行了科學(xué)檢驗(yàn)。
目前主流媒體的網(wǎng)站多以時(shí)間為序列進(jìn)行新聞內(nèi)容的推送和呈現(xiàn),算法推薦主要應(yīng)用于智能媒體商業(yè)平臺(tái)。為了更好地模擬商業(yè)平臺(tái)的推薦算法系統(tǒng),本研究根據(jù)訪談資料以及網(wǎng)絡(luò)中唯一公開的商業(yè)平臺(tái)算法架構(gòu),即今日頭條工程師曹歡歡在網(wǎng)絡(luò)平臺(tái)公開的今日頭條算法原理,(41)Marcel Caraciolo, “Crab — A Recommendation Engine Library for Python,” https://github.com/muricoca/crab, March 16, 2023.對(duì)商業(yè)平臺(tái)的推薦算法進(jìn)行了模擬,建構(gòu)了當(dāng)下以流量為導(dǎo)向的信息分發(fā)模型(Traffic-Oriented Algorithm, TOA)。
kn為對(duì)應(yīng)的傳播效果權(quán)重值,權(quán)重值由專家打分確定。
n為一賬號(hào)統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容的數(shù)量。
Tn為第n篇新聞稿在數(shù)據(jù)項(xiàng)Tn上的值。
Tn采用單篇文章閱讀量、點(diǎn)贊量、評(píng)論量、轉(zhuǎn)發(fā)量等傳播效果指標(biāo)數(shù)據(jù)。
t為指標(biāo)計(jì)算過程中采用的傳播效果指標(biāo)的個(gè)數(shù)。
不同于商業(yè)平臺(tái)的推薦算法,本研究依據(jù)文本-情感分析模型能夠?qū)ξ恼聰?shù)據(jù)進(jìn)行文本分析和情感分析,并將兩個(gè)分析結(jié)果所得分值輸出作為內(nèi)容定量評(píng)估的得分。綜合考慮文章推送順序?qū)ξ恼聜鞑バЧ挠绊?本研究建立了如下公式簇來根據(jù)文章的推送位置、轉(zhuǎn)發(fā)點(diǎn)贊評(píng)論數(shù)量、文本分析得分、情感分析得分、評(píng)論情感傾向的數(shù)據(jù)綜合計(jì)算文章的推薦排序,以此形成以文本-情感雙重價(jià)值為導(dǎo)向的信息分發(fā)模型(Value-Oriented Algorithm, VOA)。
Energepaper=Energyorigin×(Sigmoid(Lk,a)×wlike+Sigmoid(Cm,b)×wcomment)
Scorepaper=Energypaper×wenergy+Emotiontitle×wtitle+Emotionc×wc
參數(shù)解釋與說明:
ScorePlatform指平臺(tái)內(nèi)容正能量分析得分,即評(píng)估系統(tǒng)對(duì)算法平臺(tái)的最終評(píng)價(jià)結(jié)果。
Scorepaper指每篇文章的內(nèi)容正能量分析得分。
Energeorigin指文章特征向量經(jīng)過神經(jīng)網(wǎng)絡(luò)計(jì)算后得到的內(nèi)容正能量得分。
Energepaper指文章的綜合內(nèi)容得分,涵蓋了內(nèi)容正能量得分與內(nèi)容情感分析得分。
Emotiontitle指文章題目的情感分析得分。
Emotionc指文章評(píng)論內(nèi)容的情感分析得分。
Sigmoid(x,rate)為一個(gè)增長(zhǎng)平滑的輔助函數(shù)。
C指在該平臺(tái)順序采集的文章總數(shù)。
n指推送文章的序號(hào)。
Lk指文章的點(diǎn)贊數(shù),Cm指文章的評(píng)論數(shù)。
a和b為預(yù)設(shè)值的超參數(shù)。
wlike為點(diǎn)贊所占權(quán)重,wcomment為評(píng)論所占權(quán)重,其中wlike+wcomment=1。
wenergy,wtitle,wc分別為神經(jīng)網(wǎng)絡(luò)計(jì)算所得內(nèi)容正能量得分所占權(quán)重、標(biāo)題情感分析所占權(quán)重、評(píng)論情感分析所占權(quán)重,其中wenergy+wtitle+wc=1。
在虛擬仿真中,本研究使用了協(xié)同過濾算法對(duì)算法推薦系統(tǒng)進(jìn)行了機(jī)器模擬,在此基礎(chǔ)上分別構(gòu)建了基于流量導(dǎo)向,以及基于文本-情感價(jià)值導(dǎo)向的信息分發(fā)模型,以計(jì)算機(jī)代碼的方式進(jìn)行了高效、大規(guī)模的計(jì)算驗(yàn)證。為了將VOA與TOA的推薦結(jié)果進(jìn)行對(duì)比驗(yàn)證,本研究基于百萬級(jí)內(nèi)容數(shù)據(jù)構(gòu)建了驗(yàn)證分析的測(cè)試數(shù)據(jù)集。在對(duì)原始數(shù)據(jù)集進(jìn)行數(shù)據(jù)清洗、特征提取后,本研究分別對(duì)VOA和TOA進(jìn)行了優(yōu)化模擬和代碼構(gòu)建,并根據(jù)其計(jì)算結(jié)果進(jìn)行排名,最終部分實(shí)驗(yàn)結(jié)果展示如下。
表1 TOA與VOA兩類系統(tǒng)機(jī)器模擬的計(jì)算結(jié)果
通過虛擬仿真驗(yàn)證結(jié)論可見,TOA的推薦排名除了對(duì)涉及敏感關(guān)鍵詞的內(nèi)容進(jìn)行屏蔽外,是以內(nèi)容的傳播熱度為核心評(píng)估標(biāo)準(zhǔn)。然而,基于算法推薦與媒體平臺(tái)的技術(shù)特征,資本能夠輕易通過社交機(jī)器人的機(jī)械化“轉(zhuǎn)贊評(píng)”制造“虛假熱度”,或直接通過“流量尋租”的方式影響內(nèi)容的傳播熱度與推薦排序。(42)張愛軍、朱歡: 《智媒時(shí)代資本影響輿論的方式、邏輯及其風(fēng)險(xiǎn)規(guī)制》,《公共治理研究》2022年第34卷第3期,第14—21頁。因此,傳播熱度并不能直接反映網(wǎng)絡(luò)公眾的觀看意愿及其對(duì)信息的偏好程度。本研究依據(jù)文本-情感分析模型構(gòu)建的VOA則在傳播熱度的基礎(chǔ)上,對(duì)文本進(jìn)行了社會(huì)責(zé)任的評(píng)估,并對(duì)文本內(nèi)容及文本評(píng)論的情感進(jìn)行分析和賦值,共同影響推薦排名。不同于TOA的排序結(jié)果,VOA的推薦結(jié)果中流量熱度大但情感導(dǎo)向較為負(fù)向的內(nèi)容排名被后置,如《中年女星整容后遺癥一堆!演戲沒法看》等文娛類圖文信息,雖然具有較高的傳播熱度,但其評(píng)論中充斥著大量不同明星粉絲間的爭(zhēng)吵與謾罵,其VOA綜合內(nèi)容指數(shù)較低而不被推薦在前列。相反,部分傳遞正能量的自媒體內(nèi)容,則基于其已有的傳播熱度被前置,例如冬奧吉祥物、熱門電影、體育賽事等。在VOA的推薦中,內(nèi)容的正能量屬性、網(wǎng)民的評(píng)論均被當(dāng)作排序的重要評(píng)估指標(biāo),在一定程度上對(duì)當(dāng)前的流量算法排序提出了新的優(yōu)化路徑。
本文基于社會(huì)責(zé)任理論創(chuàng)建了優(yōu)化算法內(nèi)容的評(píng)估標(biāo)尺,提出在弱監(jiān)督學(xué)習(xí)的大框架下引入遷移學(xué)習(xí)的方法,將內(nèi)容正能量屬性納入對(duì)文本的算法評(píng)估中,通過人工標(biāo)注形成粗略的內(nèi)容評(píng)估基準(zhǔn),運(yùn)用動(dòng)態(tài)更新的基于社會(huì)責(zé)任的語料庫進(jìn)行無監(jiān)督學(xué)習(xí),形成了與社會(huì)責(zé)任理論和算法學(xué)習(xí)相適配的內(nèi)容評(píng)估體系,為算法進(jìn)行正能量?jī)?nèi)容識(shí)別與定量判斷提供了具有可操作性的工具。
社會(huì)責(zé)任理論強(qiáng)調(diào)新聞媒介的自由須以責(zé)任為前提,是在堅(jiān)守對(duì)社會(huì)公眾的義務(wù)基礎(chǔ)上的“積極自由”。(43)David Barrat, Media Sociology, London and New York: Routledge, 2008, pp.83-89.其中不僅包括了媒介應(yīng)對(duì)傳播內(nèi)容的真實(shí)性和客觀性擔(dān)負(fù)一定的把關(guān)職責(zé),(44)Jacob Groshek, Edson Tandoc, “The Affordance Effect: Gatekeeping and (non) Reciprocal Journalism on Twitter,” Computers in Human Behavior, vol.66(2017), pp.201-210.也強(qiáng)調(diào)了新媒體應(yīng)運(yùn)用好技術(shù)優(yōu)勢(shì),形成主流聲音,傳播正能量。(45)胡劍慧: 《拓寬社會(huì)主義核心價(jià)值觀傳播的主渠道——以新媒體傳播正能量為例》,《毛澤東鄧小平理論研究》2014年第3期,第15—19頁。正能量是積極向上的社會(huì)動(dòng)力,是給予人力量、希望的人和事。(46)薛可、何佳、山峰: 《突發(fā)危機(jī)中非官方正能量信息傳播的影響因素研究》,《新聞大學(xué)》2017年第4期,第101—109頁。因此,對(duì)算法推薦的內(nèi)容文本進(jìn)行正能量屬性的評(píng)判,并非限制自媒體的內(nèi)容生產(chǎn),亦非對(duì)大眾喜聞樂見的生活化內(nèi)容加以限制,而是以社會(huì)責(zé)任為基準(zhǔn),以廣大人民群眾所認(rèn)可和接受的評(píng)價(jià)標(biāo)尺對(duì)內(nèi)容導(dǎo)向進(jìn)行衡量,在流量排序的基礎(chǔ)上形成以正能量屬性為依據(jù)的重新排序。2022年冬奧會(huì)吉祥物冰墩墩在社交媒體平臺(tái)的走紅,即是內(nèi)容正能量屬性與受眾吸引力雙重評(píng)判的結(jié)果,冰墩墩身具我國(guó)獨(dú)有的中華文化底蘊(yùn),構(gòu)成了傳統(tǒng)文化和現(xiàn)代特色共融的文化符號(hào),因而形成了海內(nèi)外受眾自發(fā)擴(kuò)散的漣漪傳播效果。本文提出的算法評(píng)估標(biāo)尺,打破了傳統(tǒng)算法推薦廣泛采用的半監(jiān)督學(xué)習(xí)的框架,不再單一地利用數(shù)據(jù)的統(tǒng)計(jì)特征與標(biāo)注樣本分布特征存在的相關(guān)特性,對(duì)內(nèi)容進(jìn)行標(biāo)注、分類、排序與分發(fā),而是通過遷移學(xué)習(xí)的方式,以人工標(biāo)注形成判斷規(guī)則來實(shí)現(xiàn)對(duì)內(nèi)容評(píng)估的“糾偏”,以此形成社會(huì)責(zé)任理論下算法推薦內(nèi)容的評(píng)價(jià)標(biāo)尺,從理論到實(shí)踐實(shí)現(xiàn)了對(duì)算法推薦技術(shù)的優(yōu)化,它可以成為算法社會(huì)新的社會(huì)責(zé)任履行范式。
情緒作為信息的一部分,成為網(wǎng)絡(luò)時(shí)代輿情引爆的重要支點(diǎn)?;谇榫w即社會(huì)信息理論,本文在現(xiàn)有以內(nèi)容為評(píng)估對(duì)象的算法推薦模型基礎(chǔ)上,構(gòu)建了將內(nèi)容文本與內(nèi)容情緒整合的文本-情緒分析模型,并通過運(yùn)用情感分析算法實(shí)現(xiàn)對(duì)內(nèi)容情緒傾向的定量計(jì)算,使之作為算法推薦的重要指標(biāo)。文本-情緒分析模型將內(nèi)容中的“文本”與“情緒”雙重價(jià)值同時(shí)納入算法推薦評(píng)估指標(biāo)體系,相比于當(dāng)前算法對(duì)內(nèi)容關(guān)鍵詞的單因素考察,能夠形成對(duì)網(wǎng)絡(luò)信息內(nèi)容更客觀、更完整的評(píng)估結(jié)論,更好地防止情緒在特定圈層中快速異化,有助于聚焦網(wǎng)絡(luò)情緒傳播研判網(wǎng)絡(luò)輿情事件。
社會(huì)信息理論指出,情緒是具有社會(huì)效應(yīng)的,不僅對(duì)情緒表達(dá)者本存在影響,也能夠通過文本等方式傳遞給他人并影響他人的認(rèn)知、態(tài)度與行為。(47)Gerben A.Van Kleef, “How Emotions Regulate Social Life: The Emotions as Social Information (EASI) Model,” Current Directions in Psychological Science, vol.18, no.3(2009), pp.184-188.因而情緒在社會(huì)影響的過程中扮演著“信息”的角色,個(gè)體在表達(dá)情緒的同時(shí)也反映了其認(rèn)知與態(tài)度?!扒楦小弊鳛槿藗儍?nèi)心對(duì)外界事物、社會(huì)事件所持的肯定或否定態(tài)度的心理體現(xiàn),會(huì)先于其載體文字中的觀點(diǎn)被受者所感知,因而形成了“情感在先、理性在后”的輿情特征。(48)郁樂: 《當(dāng)前道德輿論中的情感、事實(shí)與理性——多重視野下的不良道德情緒及其反思》,《哲學(xué)動(dòng)態(tài)》2015年第6期,第70—75頁。然而,傳統(tǒng)的輿情治理研究多關(guān)注內(nèi)容中可被邏輯理性分析的文本信息,常常忽略網(wǎng)絡(luò)人際互動(dòng)中非邏輯、非理性的情感因素。本文研究還發(fā)現(xiàn),社交媒體平臺(tái)的“標(biāo)簽”欄目為情緒的分享與傳遞提供了技術(shù)基礎(chǔ),如“冰桶挑戰(zhàn)”就是由標(biāo)簽所激發(fā)的一種超越本地的共同情感體驗(yàn),參與其中的公眾也即成為了“情感公眾(Affective Publics)”。(49)常江: 《互聯(lián)網(wǎng)、技術(shù)可供性與情感公眾》,《青年記者》2019年第25期,第92頁。公眾的情緒會(huì)隨著輿論事件的發(fā)展或新信息的出現(xiàn)不斷發(fā)生變化,情緒的不穩(wěn)定性和易變性在由理性討論而形成的輿論空間中更易凸顯,因而情緒也成為在網(wǎng)絡(luò)輿情中主導(dǎo)情感傾向的重要信息。因此,本文聚焦網(wǎng)絡(luò)空間中的情緒傳播,將文本信息中所涵蓋的豐富情感納入評(píng)估指標(biāo),以對(duì)信息內(nèi)容形成有效把關(guān)并達(dá)成“1+1>2”的評(píng)估效果,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)輿情事件的準(zhǔn)確分析與研判。
網(wǎng)絡(luò)集群行為的形成并非源自單向的情感輸出,現(xiàn)實(shí)中,往往是由情緒互動(dòng)引發(fā)受眾形成不穩(wěn)定的感知與評(píng)價(jià),最終使其萌生采取行動(dòng)的動(dòng)機(jī)。本文基于情緒傳染理論,在對(duì)算法推薦內(nèi)容評(píng)估模型優(yōu)化時(shí),聚焦存在于內(nèi)容“評(píng)論區(qū)”的情感傾向,通過對(duì)內(nèi)容評(píng)論的情感進(jìn)行分析與審核,將之納入評(píng)價(jià)指標(biāo),綜合考察文本中的情感單向傳播與評(píng)論中的情緒雙向互動(dòng)。當(dāng)網(wǎng)絡(luò)社會(huì)輿情信息出現(xiàn)明顯極端化負(fù)向情緒場(chǎng)域時(shí),算法推薦系統(tǒng)能夠?qū)崿F(xiàn)及時(shí)預(yù)警,避免網(wǎng)絡(luò)集群行為的發(fā)生。
Hatfield等學(xué)者在情緒傳染理論中提出情緒的傳播遵循模仿-反饋機(jī)制,且在很大程度上是自動(dòng)的和潛意識(shí)的。(50)Elaine Hatfield, John T. Cacioppo, Richard L. Rapson, “Emotional Contagion,” Current Directions in Psychological Science, vol.2, no.3(1993), pp.96-100.算法技術(shù)的誕生及其在社交媒體中的廣泛運(yùn)用,消除了情緒表達(dá)的“私域”與“公域”的分野,個(gè)體的情緒會(huì)被算法通過同質(zhì)化的信息分發(fā)向公共領(lǐng)域擴(kuò)散。網(wǎng)絡(luò)輿論不僅是公眾通過網(wǎng)絡(luò)平臺(tái)對(duì)特定事件表達(dá)的觀點(diǎn)和意見的總和,也是因各類觀點(diǎn)聚集和傳播而引發(fā)的情緒的總和。因?yàn)榍榫w的傳染性,相同的情緒在輿論事件中以評(píng)論、點(diǎn)贊、轉(zhuǎn)發(fā)的互動(dòng)方式大量復(fù)制疊加,由此形成的情感傾向或?qū)⑸縿?dòng)公眾產(chǎn)生各類網(wǎng)絡(luò)行為,最終滑向網(wǎng)絡(luò)暴力等不可控的集群行為。(51)李春雷、陳瑞華: 《社會(huì)公共事件中微媒介與公眾情緒聯(lián)動(dòng)機(jī)制研究》,《現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào))》2019年第41卷第4期,第76—81頁。因此,算法推薦的內(nèi)容評(píng)估在關(guān)注文本情感單向輸出的同時(shí),需要關(guān)注評(píng)論區(qū)的雙向情感互動(dòng)。本研究在虛擬仿真對(duì)比驗(yàn)證時(shí)也發(fā)現(xiàn),在自媒體博主、網(wǎng)絡(luò)紅人高點(diǎn)贊、高評(píng)論傳播內(nèi)容中,不乏極端負(fù)向情緒的宣泄并引發(fā)了其他網(wǎng)友的跟風(fēng)。高度的情緒化和非理性的主張?jiān)趥髡吲c受者的雙向強(qiáng)互動(dòng)中,會(huì)快速傳染受眾,激化或改變公眾對(duì)事物的認(rèn)知和態(tài)度。而由互動(dòng)產(chǎn)生的情感積聚若發(fā)生于特定的負(fù)向社會(huì)輿論事件之中,其所帶來的影響和可能引發(fā)的網(wǎng)絡(luò)集群行為將嚴(yán)重影響網(wǎng)絡(luò)環(huán)境的穩(wěn)定。因此,僅將單一輸出的內(nèi)容情感作為指標(biāo)不足以形成有效的預(yù)警性判斷,只有將評(píng)論的情感傾向納入內(nèi)容傳播效果的評(píng)估中,才能形成對(duì)信息傳受雙方情感的實(shí)時(shí)有效監(jiān)測(cè)。基于此,本文提出的雙向情感監(jiān)測(cè)的算法推薦模型優(yōu)化策略,可深度把控情緒傳播的模仿-反饋機(jī)制,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)集群行為的預(yù)警,降低其發(fā)生概率,維護(hù)網(wǎng)絡(luò)生態(tài)的良性發(fā)展。