鮑磊 曾子濟(jì) 閆瑾
摘要:?jiǎn)袅▎袅ǎㄒ韵潞?jiǎn)稱B站)作為近幾年快速發(fā)展的視頻網(wǎng)站,吸引了大量的年輕人將時(shí)間與精力投入其中,使其用戶年輕人居多,B站用戶平均年齡在21歲左右。以對(duì)B站的熱門視頻的評(píng)論進(jìn)行分析,探究青少年使用智慧媒體的情況及智慧媒體對(duì)青少年的影響。通過爬蟲爬取B站的熱門視頻的評(píng)論作為數(shù)據(jù)集,對(duì)這些數(shù)據(jù)處理通過聚類分析和神經(jīng)網(wǎng)絡(luò)處理得出結(jié)論?,F(xiàn)階段網(wǎng)絡(luò)智慧媒體平臺(tái)的評(píng)論區(qū)存在明顯的網(wǎng)絡(luò)水軍行為,這些網(wǎng)絡(luò)水軍行為極易誘導(dǎo)青少年的情緒和思考方式,這種影響可能比學(xué)校和家庭對(duì)青少年的影響更加嚴(yán)重。因此,在青少年教育中如何避免網(wǎng)絡(luò)水軍對(duì)青少年產(chǎn)生不良影響需要政府,教育工作者和網(wǎng)絡(luò)智慧媒體平臺(tái)共同使用技政策和教育手段來遏制網(wǎng)絡(luò)水軍對(duì)青少年產(chǎn)生不良影響。
關(guān)鍵詞:聚類分析;智慧媒體;青少年行為;網(wǎng)絡(luò)水軍
1緒論
本研究的目的在于使用神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)的方法探索和發(fā)現(xiàn)青少年在使用智慧媒體時(shí)的行為模式,為研究青少年受智媒影響的行為模型的建立和定量分析智媒對(duì)青少年行為影響的數(shù)據(jù)建模與算法提供基礎(chǔ)。
本研究的意義在于通過使用聚類分析和神經(jīng)網(wǎng)絡(luò)的方法研究智媒中與青少年相關(guān)內(nèi)容的產(chǎn)生機(jī)制和傳播方式以及青少年受智媒影響的行為模型,從中發(fā)掘出對(duì)青少年教育。
2研究過程
2.1數(shù)據(jù)收集
本文研究所采用的評(píng)論數(shù)據(jù)使用的是B站排名前一百的熱門視頻評(píng)論,由于B站的活躍用戶平均年齡在23歲左右;因此,B站熱門視頻的很大程度上反映了年輕人的行為模式,故選擇其排名前一百的熱門視頻評(píng)論作為研究數(shù)據(jù)。
2.2數(shù)據(jù)預(yù)處理
將收集到的評(píng)論進(jìn)行分詞,然后根據(jù)每個(gè)評(píng)論的分詞結(jié)果計(jì)算每個(gè)詞的詞向量,并將每個(gè)評(píng)論里每個(gè)詞的詞向量進(jìn)行加和為每個(gè)評(píng)論的特征向量進(jìn)行后續(xù)的數(shù)據(jù)分析。
2.3數(shù)據(jù)分析
將處理過評(píng)論根據(jù)其特征向量進(jìn)行聚類分析。本研究使用的是K-means聚類分析,本次研究采用同時(shí)評(píng)估手肘法和輪廓系數(shù)這兩種指標(biāo)來確定最佳k值。
手肘法評(píng)估k值是否合適的標(biāo)準(zhǔn)為SSE,評(píng)估方法為,當(dāng)k值小于最佳聚類數(shù)時(shí),SSE的下降幅度會(huì)很大,而當(dāng)k值到達(dá)最佳聚類數(shù)時(shí),SSE的下降幅度會(huì)減小,然后隨著k值的繼續(xù)增大而趨于平緩。將本研究的數(shù)據(jù)進(jìn)行K-means聚類分析并輸出SSE值后,根據(jù)手肘法評(píng)估最佳k值應(yīng)為3。
輪廓系數(shù)法:使用輪廓系數(shù)來確定,選擇使系數(shù)較大所對(duì)應(yīng)的k值。公式:
其中,a表示質(zhì)心與同一簇中其他點(diǎn)的相似度;b表示樣本點(diǎn)與下一個(gè)最近簇中其他點(diǎn)的相似度。將數(shù)據(jù)進(jìn)行K-means聚類分析并計(jì)算輸出輪廓系數(shù)后,根據(jù)輪廓系數(shù)評(píng)估最佳k值應(yīng)為2。
根據(jù)上述的評(píng)估結(jié)果,會(huì)發(fā)現(xiàn)手肘法計(jì)算和根據(jù)輪廓系數(shù)計(jì)算出的k值不一樣,可能是b和a都很大的情況下b相對(duì)a大的更多,從而導(dǎo)致SSE較大,所以,綜合評(píng)估輪廓系數(shù)得到的k值和手肘法得到的k值,最終確定最優(yōu)k值為3,將樣本分為3類。
3結(jié)果分析
根據(jù)上述數(shù)據(jù)分析可以將所獲取的約18萬條評(píng)論分為3大類。其中第一類占比最多約為51.65%,第二類占比約為31.13%,第三類占比約為17.22%,同時(shí)使用神經(jīng)網(wǎng)絡(luò)對(duì)評(píng)論進(jìn)行情感傾向判斷,其中33.65%的評(píng)論情感傾向?yàn)榉e極,41.13%的評(píng)論情感傾向?yàn)橹辛ⅲ?5.22%的評(píng)論情感傾向?yàn)橄麡O。
第一類評(píng)論(圖3.1)中42.98%的評(píng)論情感傾向?yàn)榉e極,25.65%的評(píng)論情感傾向?yàn)橹辛ⅲ?1.36%的評(píng)論情感傾向?yàn)橄麡O,帶有情感傾向的評(píng)論占比明顯高于未分類的占比,因此,對(duì)“積極”和“消極”的評(píng)論所屬的用戶名進(jìn)行聚類分析,發(fā)現(xiàn)“積極”和“消極”的評(píng)論其所屬的用戶名格式存在大量雷同現(xiàn)象,約占第一類評(píng)論中帶有情感傾向的評(píng)論的32.15%,如:一串字母+數(shù)字,xx+在+地區(qū)名和一串隨機(jī)字母等組合,因此可以判斷存在水軍刷評(píng)論的可能性;然后對(duì)“中立”的評(píng)論的用戶名進(jìn)行上述聚類分析,發(fā)現(xiàn)其中用戶名格式雷同的數(shù)量約占其總體的5.45%,存在水軍刷評(píng)論誘導(dǎo)輿論的可能性較小。
第二類評(píng)論(圖3.2)中25.86%的評(píng)論情感傾向?yàn)榉e極,54.87%的評(píng)論情感傾向?yàn)橹辛ⅲ?9.27%的評(píng)論情感傾向?yàn)橄麡O,第二類評(píng)論中的情感傾向占比較弱,無情感傾向的評(píng)論增加;對(duì)第二類評(píng)論中“積極”和“消極”的評(píng)論所屬用戶名和“中立”的評(píng)論所屬用戶名分別進(jìn)行聚類分析,結(jié)果為“積極”和“消極”的評(píng)論所屬用戶名中用戶名雷同的情況約占其總體的12.78%;“中立”的評(píng)論所屬用戶名中用戶名雷同的情況約占其總體的2.63%,因此可以判斷水軍刷評(píng)論的可能性較小。
第三類評(píng)論(圖3.3)中19.74%的評(píng)論情感傾向?yàn)榉e極,62.72%的評(píng)論情感傾向?yàn)橹辛ⅲ?7.54%的評(píng)論情感傾向?yàn)橄麡O,由此可知第三類評(píng)論中評(píng)論情感傾向積極和消極的占比大幅度低于未分類時(shí)的占比。使用聚類算法對(duì)第三類評(píng)論中“積極”和“消極”的評(píng)論所屬用戶名和“中立”的評(píng)論所屬用戶名分別進(jìn)行分析,結(jié)果為“積極”和“消極”的評(píng)論所屬用戶名中用戶名雷同的情況約占其總體的5.28%;“中立”的評(píng)論所屬用戶名中用戶名雷同的情況約占其總體的0.86%,因此可以判斷水軍刷評(píng)論的可能性很小。
4結(jié)論
根據(jù)上述分析結(jié)果可知,b站絕大多數(shù)評(píng)論多帶有較重的情感因素,與此同時(shí),在有明顯情感傾向的評(píng)論中容易混雜網(wǎng)絡(luò)水軍發(fā)言,網(wǎng)絡(luò)水軍通過眾多的小號(hào)可以大量發(fā)表明顯情感傾向的評(píng)論煽動(dòng)他人。青少年的三觀正處于成型的關(guān)鍵階段,且更加頻繁的接觸網(wǎng)絡(luò),容易受到他人在網(wǎng)絡(luò)上發(fā)言的影響,因此網(wǎng)絡(luò)水軍對(duì)青少年的影響也更加顯著,青少年也容易在自己不知情的情況下情緒被誘導(dǎo),從而忽視了自己想法,為網(wǎng)絡(luò)水軍所造成的事態(tài)推波助瀾。
綜上所述,現(xiàn)階段網(wǎng)絡(luò)智慧媒體平臺(tái)(如:B站)的評(píng)論區(qū)存在明顯的網(wǎng)絡(luò)水軍行為,由于B站等智慧媒體平臺(tái)的用戶平均年齡較為年輕,且青少年更容易受到網(wǎng)絡(luò)上的言論影響,這種影響可能比學(xué)校和家庭對(duì)青少年的影響更加嚴(yán)重;因此,在青少年教育中如何避免網(wǎng)絡(luò)水軍對(duì)青少年產(chǎn)生不良影響需要政府,教育工作者和網(wǎng)絡(luò)智慧媒體平臺(tái)共同使用技術(shù),政策和教育手段來遏制網(wǎng)絡(luò)水軍對(duì)青少年產(chǎn)生不良影響。
本論文為國(guó)家社會(huì)科學(xué)基金項(xiàng)目《數(shù)據(jù)賦能的智慧媒體對(duì)青少年行為模式變化影響的研究》(項(xiàng)目編號(hào):19BXW120)支持的階段性研究成果。
參考文獻(xiàn):
[1]田海燕.智慧媒體對(duì)青少年價(jià)值觀影響探析[J].傳播力研究,2020,4(11):171-172.
[2]杜建民.智媒時(shí)代青少年傳統(tǒng)文化閱讀推廣策略[J].中國(guó)出版,2018(14):29-31.
[3]王柳涵.基于內(nèi)容分析法的科普視頻內(nèi)容與彈幕解讀——以B站“羅翔說刑法”系列視頻為例[J].新聞研究導(dǎo)刊,2022,13(08):82-84.
[4]何苑,張洪忠,蘇世蘭.基于算法推動(dòng)的文化傳播“破圈”機(jī)制研究——以B站“法國(guó)音樂劇”的傳播為例[J].福建師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2022(03):113-126+172.
[5]孫強(qiáng).基于Word2Vec詞向量維度媒體與公眾潛在語(yǔ)義的網(wǎng)絡(luò)議程設(shè)置研究[J].長(zhǎng)江師范學(xué)院學(xué)報(bào),2021,37(05):56-63.DOI:10.19933/j.cnki.ISSN1674-3652.2021.05.007.