陳龍 朱俊松
【摘? ?要】為探究“浙江宣傳”的內(nèi)容生產(chǎn)特點,以便其他政務(wù)新媒體借鑒學(xué)習(xí),研究采用計算機輔助內(nèi)容分析的方法,特別以TF-IDF算法和LDA主題模型分析為主,對“浙江宣傳”2022年5月30日至12月31日的316條閱讀量為10萬+的公眾號文章進行內(nèi)容分析。研究發(fā)現(xiàn),“浙江宣傳”的內(nèi)容生產(chǎn)特點在于:立足浙江,面向全國,放眼世界;堅持黨性與人民性相統(tǒng)一。研究建議我國政務(wù)新媒體充分挖掘地域特色,及時就國內(nèi)外熱點時事發(fā)聲,掌握輿論引導(dǎo)主動權(quán),并重視互動與反饋,維系好與用戶之間的關(guān)系。
【關(guān)鍵詞】浙江宣傳;政務(wù)新媒體;計算機輔助;內(nèi)容分析;內(nèi)容生產(chǎn);LDA主題模型
【基金項目】本文系寧夏西風(fēng)傳媒有限公司與寧夏大學(xué)橫向課題“基于5G網(wǎng)絡(luò)的媒體融合研究、產(chǎn)品開發(fā)與人才培養(yǎng)創(chuàng)新”的階段性成果(項目編號:XFCM2020YF01)。
2022年5月30日,由浙江省委宣傳部打造的公眾號“浙江宣傳”正式上線,10月15日“浙江宣傳”入選“2022中國應(yīng)用新聞傳播十大創(chuàng)新案例”。截至12月31日,“浙江宣傳”共發(fā)表466篇微信公眾號文章,其中閱讀量為10萬+的文章共有316篇,占全部文章的67.8%。“浙江宣傳”火熱出圈,其內(nèi)容不僅在浙江人的朋友圈中廣泛傳播,更是引起全國各地網(wǎng)友的共鳴與點贊。“浙江宣傳”無論閱讀量、點贊量還是評論數(shù),都在同類政務(wù)新媒體中名列前茅,值得同行學(xué)習(xí)借鑒。那么“浙江宣傳”究竟何以出圈,其內(nèi)容生產(chǎn)有何特點?這些都值得研究。
一、文獻綜述
因為政務(wù)新媒體作為社會治理的一個重要環(huán)節(jié),往往涉及社會各個層面,包括政府、社會、群體以及個人等,因此,對其的研究牽涉跨學(xué)科問題,目前對于政務(wù)新媒體的研究大致可分為以下幾類:
第一類側(cè)重于經(jīng)驗總結(jié)與對策研究。早期研究者例如殷俊等人從宏觀視角總結(jié)了國內(nèi)主要政務(wù)新媒體的實踐經(jīng)驗,建議我國的政務(wù)新媒體要打破不平衡發(fā)展局面,加強矩陣體系建設(shè),創(chuàng)新網(wǎng)絡(luò)媒體融合新業(yè)態(tài)[1];有研究者則聚焦更為具體的時空背景下政務(wù)新媒體面臨的問題與未來進路。例如,禹衛(wèi)華等人以31個省區(qū)市衛(wèi)健委的政務(wù)微信賬號的13158條數(shù)據(jù)為研究對象,分析總結(jié)了新冠肺炎疫情下政務(wù)傳播的功能定位與問題,并提出了建議[2]。
第二類重點研究影響政務(wù)新媒體傳播效果的要素。如陳強等學(xué)者以共青團中央政務(wù)B站號等471個樣本為基礎(chǔ),利用內(nèi)容分析與回歸分析等方法,考察其B站賬號信息傳播效果受內(nèi)容主題、視頻類別、封面圖類型、畫面形式、字幕、組織形式、剪接率、時長等因素的影響[3]。
第三類有少量研究關(guān)注政務(wù)新媒體的內(nèi)容和傳播特征。通過大數(shù)據(jù)挖掘,王玲寧等在2011年至2016年間采集了“上海發(fā)布”微博、微信賬號的文字內(nèi)容,對政務(wù)新媒體的內(nèi)容生產(chǎn)和傳播特點進行全文本分析[4]。
文獻梳理顯示,目前有關(guān)政務(wù)新媒體內(nèi)容生產(chǎn)與傳播特征的研究相對較少,尤其是以計算輔助內(nèi)容分析(Computer-assisted content analysis)作為研究方法的則更少。大多以質(zhì)性研究為主,主觀介入較為明顯,如一項研究通過分析文章內(nèi)容和讀者評論,以及用訪談的形式,來對“浙江宣傳”進行分析[5],雖然涉及了“浙江宣傳”的主旨內(nèi)容、立場原則、文風(fēng)作風(fēng)、人才機制等方方面面,但一是相關(guān)統(tǒng)計分析手段不足,二是關(guān)于主旨內(nèi)容的論述相對簡略,未能充分反映“浙江宣傳”的內(nèi)容生產(chǎn)特征。為了更加客觀,有必要采用計算輔助內(nèi)容分析方法,對“浙江宣傳”的內(nèi)容生產(chǎn)特征進行探討。
二、研究設(shè)計
(一)研究樣本
本研究選取“浙江宣傳”2022年5月30日至2022年12月31日期間的316篇閱讀量10萬+的公眾號推文為研究對象,之所以特別選取10萬+的文章,主要從傳播效果的角度考慮樣本的代表性以及結(jié)論的參考價值,10萬+是一個較為典型的指標。
本研究采用Goseeker第三方數(shù)據(jù)抓取應(yīng)用程序來完成數(shù)據(jù)采集工作,采集上述時段內(nèi)的所有閱讀量10萬+的“浙江宣傳”公眾號推文。之后對數(shù)據(jù)進行預(yù)處理,包括對所有數(shù)據(jù)樣本去重,對特殊符號等格式內(nèi)容的清洗,并刪除一些數(shù)字串或空缺值等無實質(zhì)意義的內(nèi)容,最終獲取316篇公眾號推文。
(二)研究方法
計算輔助內(nèi)容分析能夠避免傳統(tǒng)質(zhì)性研究因為主觀判斷所引起的誤差,保證研究信度,解決人工統(tǒng)計速度慢、效率低,難以全面快速掌握文本內(nèi)容的問題。本研究在計算機輔助下,綜合運用了基于詞頻統(tǒng)計的TF-IDF算法,以及LDA主題模型兩種分析方法。
1.基于詞頻統(tǒng)計的TF-IDF算法
TF-IDF(Term frequency-inverse document frequency)是一種統(tǒng)計方法,是信息檢索與文本挖掘的常用加權(quán)技術(shù)。它是對傳統(tǒng)高頻關(guān)鍵詞分析方法的升級,有助于我們在詞頻之外有更多手段對文本主題加以把握。本研究運用TF-IDF算法對“浙江宣傳”公眾號文章提取主題詞,并通過分析文章主題詞,探討“浙江宣傳”公眾號文章的議題指向,為下一步進行LDA主題分析做鋪墊。
2.LDA主題分析模型
LDA(Latent Dirichlet Allocation)是BLEI等人于2003年提出的無監(jiān)督學(xué)習(xí)模型,指的是無需對文章進行人工標注,便能夠識別文章的主題,挖掘語料中的關(guān)鍵信息。該模型由文章、主題、詞三層貝葉斯構(gòu)成。他認為每篇文章包含多個主題,而每個主題又由詞語按照一定概率分布,根據(jù)主題對應(yīng)的詞語進行聚類分析[6]。
有研究指出,LDA算法常用于分析結(jié)構(gòu)良好的文本文檔,如報紙和學(xué)術(shù)期刊論文,因為文章經(jīng)過審查、編輯和語法及拼寫檢查,便于計算機進行文本分析和處理[7]。LDA的應(yīng)用場景十分廣泛,如有學(xué)者將其應(yīng)用于新聞主題挖掘[8]、期刊研究熱點分析[9]等場景。本研究運用LDA主題模型來自動提取“浙江宣傳”公眾號文章的主題,以此來分析其內(nèi)容生產(chǎn)及傳播特征,節(jié)省人工編碼時間。
三、研究發(fā)現(xiàn)
(一)TF-IDF分析
TF-IDF算法認為,“如果一個詞在當前文檔中出現(xiàn)的頻率高,而在其他文檔中很少出現(xiàn),則它更能代表該文檔的主題”[10]。如果“浙江宣傳”的每一篇文章都出現(xiàn)“浙江”“中國”等詞語,那么它們在頻次上會很高,但是TF-IDF指數(shù)會非常低。TF-IDF算法有助于我們跳出傳統(tǒng)高頻關(guān)鍵詞的維度,以全新的角度對文本主題進行把握,也是對下面LDA主題分析的鋪墊。
如表1所示,從TF-IDF指數(shù)來看,10萬+的文章中,最為重要的選題是有關(guān)溫州部分的文章。當我們結(jié)合第二個關(guān)鍵詞“文化”一起分析時可以發(fā)現(xiàn),這些文章打破了對溫商的傳統(tǒng)刻板印象,而文化類的內(nèi)容恰恰就是溫州類文章的重要主題。這類文章打破了外界對于溫州重商、輕文化的固有認知,吸引了眾多網(wǎng)友閱讀。典型文章如細數(shù)溫州歷史上的文人騷客與悠久文化底蘊的《誰說溫州人重商不重文?》,追溯文化之源的海上絲綢之路古遺址的《溫州古港遺址揭開面紗,讓世界看到什么》,介紹溫州美學(xué)文化代表“青燈市集”的《一盞“青燈”為啥這么亮?》等。
除此之外,“浙江宣傳”作為中共浙江省委宣傳部官方公眾平臺,對國家領(lǐng)導(dǎo)人重要思想的宣傳不遺余力,如對《之江新語》等著作的解讀闡發(fā),這類選題收獲了諸多關(guān)注;烏鎮(zhèn)作為世界互聯(lián)網(wǎng)大會舉辦地,與人工智能等現(xiàn)代數(shù)字經(jīng)濟已然緊密相連,站在風(fēng)口之上的烏鎮(zhèn)自然引來各界目光,這類文章流量顯著增加,如《烏鎮(zhèn)的三張面孔》《走過8年,烏鎮(zhèn)峰會留下了什么》等;而介紹中國傳統(tǒng)“和合”文化、“繪畫大系”以及越劇的文章非常獨特,同樣引人矚目。
(二)LDA主題模型分析
進行LDA主題分析之前,在對數(shù)據(jù)進行預(yù)處理和數(shù)據(jù)清洗的基礎(chǔ)上,還需要依次進行文本分詞(Tokenization)、去除停用詞(Dropping common terms,如去除“進行”等無意義動詞)、構(gòu)建同義詞典(Normalization)等操作,最后通過困惑度、可視化等多次實驗,提取形成相應(yīng)主題并開展分析。根據(jù)文章特點,將文本特征值設(shè)置為1000,最后計算困惑度(Perplexity),確定主題的最優(yōu)數(shù)量。困惑度越低,則說明文本分析的主題聚類效果越好。通過困惑度變化的分析,確定研究文本的最優(yōu)主題數(shù)量。
經(jīng)過困惑度計算,當主題數(shù)為7時,困惑度達到一個低點,在7到8之間有一個反彈,根據(jù)困惑度的原理,拐點位置就是最優(yōu)主題數(shù),因此確定最優(yōu)主題數(shù)為7。通過可視化呈現(xiàn),可以更加直觀地分析主題分布,具體做法是在python中導(dǎo)入一個交互式LDA可視化軟件包——pyLDAvis。氣泡圖是“浙江宣傳“公眾號文章內(nèi)容的主題分布,頻率圖是該階段主題密切相關(guān)的詞語。通過調(diào)整λ值,研究人員可以獲得主題相關(guān)性最高的詞語。本研究依據(jù)主題相關(guān)性和詞頻,選取較有代表性的15個關(guān)鍵詞。
根據(jù)LDA主題模型的分析結(jié)果,可以將“浙江宣傳”公眾號文章的內(nèi)容主題分為以下7類,下面將分別論述這7大主題。
1.政治思想(主題權(quán)重18.7%):主題詞習(xí)近平、人民、現(xiàn)代化、同志、社會主義、理論、思想、總書記、政治、工作、建設(shè)、革命、全面、馬克思主義、特色。
“浙江宣傳”以習(xí)近平新時代中國特色社會主義思想為引領(lǐng),深入闡釋國家領(lǐng)導(dǎo)人的重要思想,尤其是對與浙江有關(guān)的論述與著作進行全面解讀,代表性文章如《歸根到底的兩個“行”有何深意》。結(jié)合了具體實例,如《這本書值得好好讀》《再讀<之江新語>里的三個“錦囊妙計”》等文章,深入淺出地將習(xí)近平總書記的三條“錦囊妙計”用于文旅融合創(chuàng)新。
2.藝術(shù)創(chuàng)作(主題權(quán)重17.7%):主題詞包括電影、作品、創(chuàng)作、藝術(shù)、大系、故事、觀眾、劇本、人生、研究、繪畫、傳統(tǒng)、音樂、孩子、文學(xué)。
這部分內(nèi)容主要是“浙江宣傳”跟網(wǎng)友們一起討論時下熱門電影、音樂、文學(xué)、繪畫等藝術(shù)作品,以及探討孩子的閱讀等教育問題,兼具生活與藝術(shù)氣息。如《孤勇者憑啥站上世界杯》一文,就以十分接地氣的口吻分析了“小學(xué)生進行曲”何以突破語言界限;在《文藝作品是城市的最好代言》一文中,以浙產(chǎn)劇《縣委大院》為引子,細數(shù)了電視劇、電影、歌曲等各種文藝作品對提升地方影響力的積極作用,希冀開啟更多藝術(shù)與城市的雙向奔赴之路。
3.共同富裕(主題權(quán)重16.6%):主題詞包括經(jīng)濟、建設(shè)、全國、改革、共同富裕、數(shù)字化、企業(yè)、群眾、數(shù)字、農(nóng)村、習(xí)近平、工程、禮堂、戰(zhàn)略、浙江人。
浙江省作為建設(shè)“共同富裕示范區(qū)”的“先行地”,“浙江宣傳”著力從國家大局與浙江地方實際兩方面進行分析解讀。一方面是在“二十大”“兩會”等重要時間節(jié)點向網(wǎng)友解讀重要指示精神,另一方面則是俯下身去,從農(nóng)村、企業(yè)發(fā)展實際出發(fā),介紹浙江省共同富裕發(fā)展現(xiàn)狀。代表性文章,如《這件事,浙江要比全國先一步》《為什么共同富裕等不得也急不得》等。
4.媒體與輿論(主題權(quán)重14.8%):主題詞包括媒體、傳播、平臺、新聞、內(nèi)容、輿論、視頻、信息、技術(shù)、評論、社會、讀者、網(wǎng)絡(luò)、網(wǎng)友、互聯(lián)網(wǎng)。
這部分內(nèi)容,一方面為傳統(tǒng)媒體融合轉(zhuǎn)型出謀劃策,強調(diào)傳統(tǒng)媒體的堅守與突破,包括“說人話、切熱點、有態(tài)度”,也承認文藝批評面臨的種種困難;另一方面從本主題下的“輿論”“評論”“讀者”“網(wǎng)友”等關(guān)鍵詞可以發(fā)現(xiàn),“浙江宣傳”非常重視網(wǎng)友的互動與反饋,推出了許多討論文章,如《沒有互動的新媒體就沒有靈魂》等。
5.文旅產(chǎn)業(yè)(主題權(quán)重13.9%):主題詞包括品牌、傳統(tǒng)、博物館、故事、全屏、文物、遺址、活動、游客、視頻、地方、版本、味道、考古、旅游。
從這部分內(nèi)容不難發(fā)現(xiàn),“浙江宣傳”旨在提升浙江本土文旅項目知名度,打造文旅品牌,吸引游客觀光。得益于浙江本土濃厚的歷史文化底蘊,隨著考古活動的進行,不少文章對此進行集中介紹,如《沉睡三千年,神秘古國重見天日?》一文,向讀者揭秘沉睡了幾千年的神秘姑蔑古國;此外,浙江的文化亦是多元的——“味道”代表著浙江獨特的飲食文化,而“博物館”等基礎(chǔ)文化設(shè)施在不斷完善,其中“版本館”最為特殊,在《剛剛亮相的版本館是個啥館?》一文中,便生動介紹了這一中華文明種子基因庫。
6.數(shù)字經(jīng)濟(主題權(quán)重9.6%):主題詞包括數(shù)字、互聯(lián)網(wǎng)、全球、國際、世界杯、人類、大會、價值、網(wǎng)絡(luò)、峰會、貿(mào)易、經(jīng)濟、命運、技術(shù)、產(chǎn)業(yè)。
通過對數(shù)字經(jīng)濟主題下的關(guān)鍵詞進行分析可知,“浙江宣傳”公眾號文章的內(nèi)容生產(chǎn)基于本土特色,圍繞數(shù)字產(chǎn)業(yè)、烏鎮(zhèn)互聯(lián)網(wǎng)大會、世界杯經(jīng)濟、全球數(shù)字貿(mào)易博覽會等議題來展開的同時,也極為關(guān)注數(shù)字技術(shù)發(fā)展前沿。具體而言,有分析人工智能前沿技術(shù)的《虛擬數(shù)字人憑什么與真人“搶鏡”》,也有介紹在杭州舉辦的首屆全球數(shù)字貿(mào)易博覽會的《數(shù)貿(mào)會是個什么會》,還有《元宇宙的盛宴背后》一文從發(fā)展現(xiàn)狀、潛在問題與應(yīng)對策略三個角度系統(tǒng)分析了元宇宙這一最新的前沿技術(shù)。
7.疫情防控(主題權(quán)重8.7%):主題詞包括疫情、工作、群眾、防控、人民、政策、防疫、風(fēng)險、地方、社會、新冠、基層、病毒、科學(xué)、生命。
面對疫情防控這一較為敏感的議題,“浙江宣傳”并沒有退縮,而是力圖從生命至上、人民至上以及科學(xué)防疫的角度,凝聚社會共識“最大公約數(shù)”,爭取人民對疫情防控政策理解、支持的同時,也批評了不少地方、基層政府的防控工作搞“一刀切”等亂象。典型文章如《“人民至上”不是“防疫至上”》《“層層加碼”與“動態(tài)清零”完全相悖》等,及時介入并引導(dǎo)社會輿論,既有效紓解了抵觸情緒,也為防疫政策的正常實施提供了較好的輿論環(huán)境。
四、結(jié)論與討論
在經(jīng)過TF-IDF算法統(tǒng)計分析與LDA主題模型分析的基礎(chǔ)上,本研究從以下四方面總結(jié)“浙江宣傳”熱門文章的內(nèi)容生產(chǎn)特點。
一是立足浙江?!罢憬麄鳌绷⒆阌谡憬恼?、經(jīng)濟、文化、社會等各方面實際,大力展示宣傳浙江省動人實踐。二是面向全國。作為浙江省的政務(wù)新媒體,“浙江宣傳”并沒有局限于地區(qū)議題,而是時刻關(guān)注國內(nèi)大事。三是放眼世界。自俄烏沖突爆發(fā)以來,國際輿論戰(zhàn)、認知戰(zhàn)愈演愈烈,“浙江宣傳”及時回應(yīng)了國際熱點話題。四是堅持黨性與人民性相統(tǒng)一。黨的各級宣傳機關(guān)面對重大社會熱點問題,如何堅持黨性與人民性的統(tǒng)一,成為檢驗其宣傳能力強弱的試金石?!罢憬麄鳌备矣谥泵鎲栴},善于引導(dǎo)輿論,通過與網(wǎng)友平等且相互尊重的互動來獲得認可。
政務(wù)新媒體發(fā)展至今,除了個別如“浙江宣傳”等迅速出圈,贏得了社會各方的廣泛認可,不少政務(wù)新媒體仍未形成較為廣泛的社會影響,存在著輿情應(yīng)對不當?shù)确N種問題。由此,經(jīng)過上述分析,本文試對我國政務(wù)新媒體的發(fā)展提出一些建議。
第一,充分挖掘地域特色。通過對“浙江宣傳”的研究發(fā)現(xiàn),政務(wù)新媒體要吸引更多用戶的關(guān)注,除了要充分發(fā)揮在地性優(yōu)勢,緊緊圍繞本地信息展開傳播以外,對于外地用戶而言,還要以“反常識”的角度進行內(nèi)容生產(chǎn),在打破外地人刻板印象的同時,吸引更多用戶關(guān)注,使政務(wù)新媒體的影響力不局限于本地。
第二,就國內(nèi)外熱點時事及時發(fā)聲,掌握輿論引導(dǎo)主動權(quán)。在面對社會各界廣泛關(guān)注的熱點問題時,政務(wù)新媒體不應(yīng)顧慮重重而陷入“失語”境地。作為新媒體,對時效性的追求顯然要擺在極為重要位置,只有及時發(fā)聲、介入并掌握熱點事件的輿論引導(dǎo)權(quán),才能獲得用戶的信賴與認可,形成媒體自身最為寶貴的公信力。
第三,維系好與用戶之間的關(guān)系,重視互動與反饋。這需要政務(wù)新媒體改進文風(fēng)。“浙江宣傳”受到網(wǎng)友追捧,因為其在《“百日”了,我們想到了9個字》中總結(jié)的文風(fēng):“說人話、切熱點、有態(tài)度”。它的文章標題短小精悍,內(nèi)涵豐富,正文部分也恰到好處地把握住了網(wǎng)絡(luò)潮流,很好地平衡了趣味性與深刻性;“切熱點”則是帶著責(zé)任與思考而來,而不是單純?yōu)榱肆髁浚蛔詈?,態(tài)度上一方面以高度的黨性批判各種丑惡現(xiàn)象,同時充分尊重網(wǎng)友表達的多元性,為他們提供交流平臺。
總體而言,“浙江宣傳”的成功出圈,對于黨的宣傳工作有著重要的啟示意義。當前國際輿論斗爭愈發(fā)激烈,輿論戰(zhàn)與認知戰(zhàn)早已無處不在。在結(jié)合各地實際情況的基礎(chǔ)之上,黨的各級宣傳機關(guān)應(yīng)當從“浙江宣傳”的案例中借鑒經(jīng)驗,提升輿論影響力,為我國應(yīng)對國際輿論戰(zhàn)、認知戰(zhàn)做好充分準備。
注釋:
[1]殷俊,姜勝洪.政務(wù)新媒體發(fā)展現(xiàn)狀及對策探析[J].新聞界,2015(05):40-43+48.
[2]禹衛(wèi)華,黃陽坤.重大突發(fā)公共衛(wèi)生事件的政務(wù)傳播:響應(yīng)、議題與定位[J].新聞與傳播評論,2020,73(05):22-33.
[3]陳強,張楊一,馬曉悅 等.政務(wù)B站號信息傳播效果影響因素與實證研究[J].圖書情報工作,2020,64(22):126-134.
[4]王玲寧,禹衛(wèi)華.全文本視野下政務(wù)新媒體的內(nèi)容生產(chǎn)和傳播特征——以“上海發(fā)布”為例[J].新聞界,2017(09):27-31.
[5]趙月枝,王欣鈺.“手握筆桿當戰(zhàn)士”:“浙江宣傳”的輿論引領(lǐng)創(chuàng)新實踐[J].青年記者,2022(23):60-63.
[6]BLEI D M,NG A Y,JORDAN M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003(3):993-1022.
[7]GUO L,VARGO C J,PANZ,et al.Big Social Data Analytics in Journalism and Mass Communication:Comparing Dictionary-Based Text Analysis and Unsupervised TopicModeling[J].Journalism & Mass Communication Quarterly,2016,93(2):332-359.
[8]金苗,自國天然,紀嬌嬌.意義探索與意圖查核——“一帶一路”倡議五年來西方主流媒體報道LDA主題模型分析[J].新聞大學(xué),2019(05):13-29+116-117.
[9]巢乃鵬,韓少卿,吳興桐.數(shù)字新聞學(xué)研究主題發(fā)現(xiàn)及其演化分析:基于Web of Science文獻的考察[J].新聞界,2021(09):4-13.
[10]牛萍,黃德根.TF-IDF與規(guī)則相結(jié)合的中文關(guān)鍵詞自動抽取研究[J].小型微型計算機系統(tǒng),2016,37(04):711-715.
(作者:陳龍,寧夏大學(xué)新聞傳播學(xué)院碩士研究生;朱俊松,寧夏大學(xué)新聞傳播學(xué)院副教授)
責(zé)編:姚少寶