国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于豆瓣短評(píng)數(shù)據(jù)的情感認(rèn)同狀況分析

2021-08-16 14:55張乃芳張鈺彬
新媒體研究 2021年9期
關(guān)鍵詞:數(shù)據(jù)分析

張乃芳 張鈺彬

摘 要 隨著中國(guó)電影行業(yè)和社交網(wǎng)絡(luò)的高速發(fā)展,公眾平臺(tái)匯聚了大量用戶對(duì)于電影的評(píng)論。2021年春節(jié)檔獲得高票房的電影《你好,李煥英》引起了網(wǎng)友的高度關(guān)注。文章主要運(yùn)用LDA主題模型對(duì)豆瓣網(wǎng)站上網(wǎng)友對(duì)《你好,李煥英》的短評(píng)文本進(jìn)行數(shù)據(jù)分析,定量分析與定性分析相結(jié)合,挖掘觀眾對(duì)這部電影的態(tài)度和評(píng)論的焦點(diǎn)與特點(diǎn)。分析發(fā)現(xiàn),觀眾對(duì)該電影有高度的情感認(rèn)同,討論主要聚焦在典型情節(jié)和主演的演技;關(guān)于喜劇電影是否應(yīng)該笑中帶淚的問題,成為對(duì)該電影評(píng)價(jià)的主要分歧點(diǎn)。《你好,李煥英》產(chǎn)生了良好的娛樂效果和社會(huì)教育效果。

關(guān)鍵詞 LDA主題模型;數(shù)據(jù)分析;電影評(píng)論;可視化呈現(xiàn)

中圖分類號(hào) G2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-0360(2021)09-0113-05

2021年2月12日電影《你好,李煥英》上映,截至2021年3月26日豆瓣評(píng)分為8.1分,是2021年春節(jié)檔上映電影中唯一超過8分的電影,這一成績(jī)好于89%的喜劇片,好于77%的劇情片。這部講述母女親情的喜劇電影,熱度持續(xù)上漲,主演張小斐的演技備受好評(píng),導(dǎo)演賈玲備受關(guān)注。作為一部現(xiàn)象級(jí)電影,《你好,李煥英》的成功必然是多方面因素共同作用的結(jié)果,電影獲得超高票房的背后,契合觀眾需求是最重要的一點(diǎn)。從消費(fèi)者角度評(píng)價(jià)電影,貼近大眾生活,才能創(chuàng)作出人民群眾喜聞樂見的電影。

1 研究數(shù)據(jù)與研究方法介紹

1.1 研究思路

本研究先從豆瓣網(wǎng)友評(píng)價(jià)的整體態(tài)度入手,然后分析網(wǎng)友短評(píng)中的高頻詞,之后分析最受關(guān)注的熱評(píng),最后對(duì)采集到的所有短評(píng)進(jìn)行主題聚類。分析對(duì)象由態(tài)度,到詞語,再到段落,最后是對(duì)所有短評(píng)的數(shù)據(jù)分析,整個(gè)過程是對(duì)網(wǎng)友觀后感的逐漸深入的分析過程。

具體來說:第一步,根據(jù)豆瓣網(wǎng)友的評(píng)價(jià)星級(jí)分布,從整體上把握觀眾對(duì)這部電影的推薦指數(shù);第二步,分析觀眾的短評(píng)高頻詞有哪些,從總體把握觀眾對(duì)于這部電影關(guān)注的側(cè)重角度;第三步,提取觀眾短評(píng)里最受關(guān)注的熱評(píng),分析這些認(rèn)同度最高的短評(píng)都是從哪些角度評(píng)價(jià)電影,以及其中包含的情感態(tài)度如何;最后,運(yùn)用LDA主題模型,將觀眾的短評(píng)進(jìn)行數(shù)據(jù)分析,根據(jù)數(shù)據(jù)結(jié)果劃分內(nèi)容主題,細(xì)致把握觀眾的關(guān)注點(diǎn)。

1.2 研究方法

一直以來,廣大導(dǎo)演、演員、自媒體都將豆瓣網(wǎng)評(píng)分、評(píng)論內(nèi)容作為評(píng)論電影的重要依據(jù)并采用各種方式對(duì)豆瓣評(píng)論的內(nèi)容進(jìn)行分析。但是,時(shí)代發(fā)展使得越來越多的觀眾在網(wǎng)站發(fā)表自己對(duì)電影的看法,有一定知名度的電影在豆瓣上都有數(shù)量龐大的網(wǎng)友評(píng)論。傳統(tǒng)影評(píng)分析方法無法應(yīng)對(duì)海量的大眾媒體新聞報(bào)道和公共輿論,如何利用自動(dòng)化的方式對(duì)網(wǎng)友影評(píng)進(jìn)行分析在此情況下顯得尤為重要。

本研究主要采用LDA主題模型對(duì)電影短評(píng)內(nèi)容進(jìn)行分析,并利用詞云圖對(duì)電影短評(píng)內(nèi)容中詞頻較高的詞進(jìn)行可視化呈現(xiàn)。作為一種基于機(jī)器學(xué)習(xí)的文本內(nèi)容分析技術(shù),主題模型是一種使用概率的產(chǎn)生式模型來挖掘文本主題的新方法[1]。LDA是Blei等在2003年提出的一種統(tǒng)計(jì)主題模型[2],是近年發(fā)展起來的一種重要提取潛在主題的建模方法[3],該模型已經(jīng)得到研究人員廣泛認(rèn)可,并被運(yùn)用至各個(gè)研究領(lǐng)域。“LDA主題模型的主要作用是將語料庫中大量非結(jié)構(gòu)化的文本數(shù)據(jù)轉(zhuǎn)換為可供研究人員進(jìn)行分析的數(shù)據(jù),并依據(jù)選定的參數(shù)進(jìn)行文檔-主題、主題-詞的聚類工作,從而使研究者能夠在較短時(shí)間內(nèi)從語料庫中得到一組可供解讀的主題?!盵4]

相較于單純的統(tǒng)計(jì)數(shù)據(jù)而言,LDA主題模型輸出結(jié)果為一段包含各類意義的詞群,人文研究者能夠利用這些詞群進(jìn)行證偽、定性與定量相結(jié)合等方面的研究。這種技術(shù)方法在人文社科領(lǐng)域具有傳統(tǒng)研究方法難以企及的優(yōu)勢(shì)?!赌愫?,李煥英》影評(píng)屬于帶有主題性質(zhì)的大規(guī)模文本,適合用此方法。

2 研究結(jié)果

首先,根據(jù)豆瓣937 198名網(wǎng)友對(duì)《你好,李煥英》打出的星級(jí)分?jǐn)?shù),統(tǒng)計(jì)出各星級(jí)所占比例,從總體上初步了解觀眾對(duì)這部電影的推薦態(tài)度。其比例分布如圖1所示,其中1星和2星的評(píng)價(jià)只占2.8%,4星和五星占比高達(dá)77.6%,可見大多數(shù)觀眾對(duì)此電影持推薦態(tài)度,認(rèn)為該電影值得一看。

其次,以豆瓣網(wǎng)友的觀后短評(píng)為分析對(duì)象,刪除重復(fù)評(píng)價(jià)、無意義的短評(píng)以及星級(jí)評(píng)分為空值的短評(píng)后,共獲得492條熱度最高的有效短評(píng)。計(jì)算其詞頻,取詞頻最高的前50個(gè)詞進(jìn)行高頻詞分析。在這一部分的分析中,輸出了圖2的詞云圖和表1正負(fù)面評(píng)價(jià)高頻詞。為從可視化角度透視短評(píng)的熱詞分布,本文根據(jù)詞頻數(shù)值降序排列,截取排名前50的詞組制作詞頻云圖。在詞云圖中,我們可以看到表達(dá)態(tài)度類的詞匯較多,因此將帶有明顯正負(fù)面態(tài)度的評(píng)論高頻詞整理成表1。

詞云圖如2圖所示,從圖2可以看出提及較多的詞匯是電影內(nèi)容以及觀眾對(duì)電影的情感態(tài)度。進(jìn)一步區(qū)分詞云圖中的高頻詞,可以看到觀眾討論的熱點(diǎn)主要集中三個(gè)方面:其一集中在電影母女親情的代入感,體現(xiàn)詞匯有“母親”“遺憾” “年代”“年輕”;同時(shí),能夠體現(xiàn)觀眾情感態(tài)度的詞匯也有很多,既有正面詞匯,如“真誠(chéng)”“真摯”“喜歡”等,也有“尷尬”這樣的負(fù)面詞匯;也有部分觀眾從喜劇的形式與深度加以探討,主要表現(xiàn)在對(duì)“煽情”的把握和喜劇電影里表達(dá)悲劇內(nèi)核“反轉(zhuǎn)”的藝術(shù)技巧。

3.4 “喜劇是否應(yīng)該笑中帶淚”成為爭(zhēng)議的一大焦點(diǎn)

大部分觀眾認(rèn)為這部電影前期輕松、笑點(diǎn)密集,后半部分淚點(diǎn)和痛點(diǎn)并存,讓觀眾體會(huì)到了滿滿的母愛。但也有觀眾評(píng)論:“前期可能期待值太高,本來以為淚點(diǎn)低的我,會(huì)哭的稀里嘩啦,死去活來,結(jié)果并沒有,劇情稍顯平淡,反轉(zhuǎn)也在意料之中,煽情比較老套,笑點(diǎn)包袱有點(diǎn)尬,年代感也沒有讓人懷念逝去時(shí)光,總之 我還是更喜歡夏洛特?zé)馈?。喜劇作品里的煽情,向來是觀眾爭(zhēng)議的焦點(diǎn)。能做到讓觀眾身臨其境的感同身受而不是流于表面的個(gè)人情感宣泄,是考驗(yàn)導(dǎo)演和編劇能力之處。喜劇的“內(nèi)核”是悲劇,但這個(gè)“內(nèi)核”如何包裹更是喜劇作品應(yīng)該反復(fù)打磨的地方。

《你好,李煥英》作為現(xiàn)象級(jí)的高票房電影,獲得了巨大的商業(yè)成功,也贏得了觀眾的廣泛認(rèn)可。同時(shí),電影熱映后還引發(fā)人們一系列的“跟帖式”活動(dòng),如“#我和我媽的閨蜜照#”的接龍式曬圖,可見它輸出了正能量,為今天的親子關(guān)系和諧發(fā)展貢獻(xiàn)了力量,事實(shí)上起到了良好的社會(huì)教育效果。因此,對(duì)電影以及觀眾短評(píng)的分析,有助于在電影中注入教育因素的探索,也有助于將電影教育的成功因素引入思想政治教育。

參考文獻(xiàn)

[1]Lukins S K,Kraft N A,Etzkorn L H.Source code retrieval for bug localization using Latent Dirichlet Allocation[C].Proceedings of the 15th Working Conference on Reverse Engineering.Los Angeles:IEEE,2008:155-164.

[2]Blei D M,Ng A Y,Jordan M I.Latent dirichlet allocation[J].J Machine Learning Research Archive,2003(3):993-1022.

[3]唐曉波,房小可.基于文本聚類與LDA相融合的微博主題檢索模型研究[J].情報(bào)理論與實(shí)踐,2013,36(8):85-90.

[4]鄭石明,蘭雨瀟,黎楓.網(wǎng)絡(luò)公共輿論與政府回應(yīng)的互動(dòng)邏輯:基于新冠肺炎疫情期間“領(lǐng)導(dǎo)留言板”的數(shù)據(jù)分析[EB/OL].(2021-03-11)[2021-03-25].公共管理學(xué)報(bào),https://doi.org/10.16149/ j.cnki.23-1523.20210311.002.

猜你喜歡
數(shù)據(jù)分析
電子物證檢驗(yàn)的數(shù)據(jù)分析與信息應(yīng)用研究
基于matlab曲線擬合的數(shù)據(jù)預(yù)測(cè)分析
分眾媒體趨勢(shì)下場(chǎng)景營(yíng)銷的商業(yè)前景
佛山某給水管線控制測(cè)量探討
SPSS在環(huán)境地球化學(xué)中的應(yīng)用
大數(shù)據(jù)時(shí)代高校數(shù)據(jù)管理的思考
新常態(tài)下集團(tuán)公司內(nèi)部審計(jì)工作研究
淺析大數(shù)據(jù)時(shí)代對(duì)企業(yè)營(yíng)銷模式的影響
基于讀者到館行為數(shù)據(jù)分析的高校圖書館服務(wù)優(yōu)化建議