任琳
摘 要: 為了掌握學(xué)生思想動(dòng)態(tài),針對性的提供思想政治教育策略,提出了一種基于網(wǎng)絡(luò)媒體和數(shù)據(jù)挖掘的大學(xué)生思想動(dòng)態(tài)評估方法。利用網(wǎng)絡(luò)爬蟲抓取官方微博內(nèi)容和評論內(nèi)容,提取和分析關(guān)鍵詞;其次,通過詞云展示和K-means聚類分析及時(shí)掌握大學(xué)生的思想動(dòng)態(tài)。研究結(jié)果表明,通過詞云展示和聚類分析可以有效獲取一段時(shí)間內(nèi)大學(xué)生所關(guān)注的熱點(diǎn)話題,為大學(xué)生思想政治教育提供有針對性的方法和策略,幫助大學(xué)生樹立正確的價(jià)值取向和思想觀念具有重要的指導(dǎo)意義。
關(guān)鍵詞: 網(wǎng)絡(luò)媒體; 數(shù)據(jù)挖掘; 聚類分析; 思想政治教育; 網(wǎng)絡(luò)爬蟲
中圖分類號: G 641 ? ? ?文獻(xiàn)標(biāo)志碼: A
Abstract: In order to grasp the university student thought varying in time, and provide a pertinence ideological and political education strategy, this paper presents a method of dynamic evaluation of college students thoughts based on network media and data mining. First, the Web crawler is used to capture the content of official Weibo and comments, and to extract and analyze key words. Second, the word cloud display and K-means cluster analysis are used to grasp the ideological trends of college students. The results show that the word clouds display and cluster analysis can effectively capture the hot topics that college students have been concerned about for a time period, and provide targeted methods and strategies for college students ideological and political education, it is of great significance to help college students set up correct value orientation and ideological concept.
Key words: network media; data mining; cluster analysis; ideological and political education; Web crawler
0 引言
對大學(xué)生思想動(dòng)態(tài)進(jìn)行評估有助于學(xué)校和輔導(dǎo)員開展學(xué)生工作。目前這個(gè)階段,1995年以后出生的大學(xué)生是校園大學(xué)生的主力,他們思想活躍、開放、好奇心強(qiáng)和內(nèi)心較脆弱敏感,思想狀態(tài)較難及時(shí)地掌控。傳統(tǒng)思政教育以課堂教育為主,更多的是教授思想政治方面的理論知識,無法掌握學(xué)生的思想動(dòng)態(tài)[1-2]。
為了幫助學(xué)校和輔導(dǎo)員及時(shí)掌握大學(xué)生的思想狀態(tài),有針對性地開展大學(xué)生思想政治教育工作,本文提出一種基于網(wǎng)絡(luò)媒體和數(shù)據(jù)挖掘的大學(xué)生思想動(dòng)態(tài)評估模型。通過抓取大學(xué)生微博發(fā)布的內(nèi)容,結(jié)合情感分析、特征詞提取和自然語言處理等技術(shù),運(yùn)用聚類、主題檢測和關(guān)聯(lián)分析等數(shù)據(jù)挖掘方法,構(gòu)建大學(xué)生思想動(dòng)態(tài)和微博內(nèi)容之間的關(guān)系。
1 技術(shù)方法和實(shí)驗(yàn)流程
1.1 技術(shù)方法
本文涉及的技術(shù)方法主要包括抓取微博數(shù)據(jù)和話題聚類技術(shù)[3-4]。抓取微博數(shù)據(jù)主要通過網(wǎng)絡(luò)爬蟲計(jì)算程序?qū)崿F(xiàn),主要抓取官方微博用戶數(shù)據(jù),如學(xué)生社團(tuán)微博、高校官方微博、各學(xué)院官方微博以及班級微博等,這類用戶社會(huì)影響力和傳播效果較大。
話題聚類技術(shù)主要將抓取到的微博數(shù)據(jù)提取出關(guān)鍵詞,之后運(yùn)用其技術(shù)來進(jìn)行聚類分析獲得話題類型,依照話題類型能夠掌握其思想狀態(tài)和思想波動(dòng)狀態(tài)。通過聚類將話題提取的關(guān)鍵詞分成若干個(gè)類別,可以掌握大學(xué)生關(guān)心的話題類型,從而掌握大學(xué)生的思想動(dòng)態(tài)情況。
1.2 實(shí)驗(yàn)流程
基于網(wǎng)絡(luò)媒體和數(shù)據(jù)挖掘的大學(xué)生思想動(dòng)態(tài)評估流程包含三部分,分別為微博信息及評論抓取、微博內(nèi)容的解析與關(guān)鍵詞的可視化。微博信息和評論抓取主要抓取高校微博、班級微博和社團(tuán)微博等;微博內(nèi)容的解析主要包括微博網(wǎng)頁內(nèi)容的解析、關(guān)鍵詞存儲等;關(guān)鍵詞可視化主要是實(shí)現(xiàn)聚類關(guān)鍵詞的展示,實(shí)驗(yàn)流程圖如圖1所示。
2 K-means聚類算法
3 實(shí)驗(yàn)與結(jié)果分析
3.1 抓取微博內(nèi)容
文中通過URL鏈接和網(wǎng)絡(luò)爬蟲設(shè)計(jì),抓取陜西省2016年7月~2016年10月4個(gè)月內(nèi)部分大學(xué)官方微博、社團(tuán)微博等所發(fā)布的內(nèi)容和評論,抓取部分關(guān)鍵詞:
研究生入學(xué)考試、北京郵電大學(xué)、上海交通大學(xué)、招生簡章、考研、創(chuàng)業(yè)、面試、就業(yè)率、思想政治教育、道德、愛情、計(jì)算機(jī)組成原理、數(shù)據(jù)結(jié)構(gòu)、通信原理、學(xué)生超市、法律、奧運(yùn)會(huì)、211、985、雙一流、競賽、高校等。
3.2 環(huán)境平臺
文中編程操作系統(tǒng)為Windows 7,內(nèi)存8 GB、中央處理器為Intel(R)Core(TM)i5-2400 4-core,CPU的主頻為2.60 GHz,編程軟件平臺為Matlab2015(a)。網(wǎng)絡(luò)爬蟲基于Matlab軟件平臺設(shè)計(jì),主要運(yùn)用urlread函數(shù)和regexp函數(shù)讀取和解析網(wǎng)頁數(shù)據(jù)。
3.3 結(jié)果分析
由模型動(dòng)態(tài)來分析,能夠比較快的掌握大學(xué)生思想動(dòng)態(tài),幫助其解決心理困擾,疏導(dǎo)他們的行為規(guī)范。文中通過詞云圖和K-means聚類分析等模型[8-9],預(yù)測他們的思想狀態(tài),提高思政教育工作的及時(shí)性和可靠性。
(1) 詞云圖與思想動(dòng)態(tài)預(yù)測
通過抓取微博內(nèi)容、提取關(guān)鍵詞,將關(guān)鍵詞通過詞云圖展示出來,其中出現(xiàn)頻率越高字體相對較大,也就是該詞匯是大學(xué)生群體所討論的熱點(diǎn)話題,詞云圖如圖3所示。
由圖3可得,這段時(shí)間出現(xiàn)頻率比較高的詞匯有奧運(yùn)會(huì)、金牌榜、馬蓉和里約等,說明這段時(shí)間大學(xué)主要關(guān)注馬蓉出軌事件和里約奧運(yùn)會(huì)。與學(xué)習(xí)相關(guān)的詞匯有考試、招生簡章、教育和圖書館等,但是這些詞匯的出現(xiàn)頻率不是太高,說明這些問題尚未成為熱點(diǎn)話題。通過詞云圖分析,可以及時(shí)掌握大學(xué)生的思想狀態(tài),開展有針對性性的大學(xué)生思想政治教育。
(2) 聚類結(jié)果分析
由于詞云圖只能宏觀的查看話題關(guān)鍵詞,無法查看一段時(shí)間內(nèi)的大學(xué)生所關(guān)注的話題熱點(diǎn),運(yùn)用K-means進(jìn)行聚類分析,分析結(jié)果如圖4所示。
由圖4可知,這段時(shí)間大學(xué)生主要關(guān)注如下幾個(gè)話題。
1) 討論較多的話題為里約奧運(yùn)會(huì)開幕,他們關(guān)心的話題有體育明星等,說明奧運(yùn)會(huì)在他們中間的歡迎程度,從側(cè)面可以看出這些學(xué)生的思想是積極向上的,喜歡運(yùn)動(dòng)并關(guān)心國家時(shí)事。
2) 討論較多的話題為王寶強(qiáng)與馬蓉離婚案,說明他們的好奇心與圍觀心理較強(qiáng)[10-11],喜歡看娛樂新聞。觀看這類新聞?dòng)欣谑婢弻W(xué)習(xí)壓力;但如若大學(xué)生過分關(guān)注這類新聞將影響大學(xué)生的思想觀念和價(jià)值取向。因此,需要及時(shí)幫助大學(xué)生樹立正確的價(jià)值取向和思想觀念。
3) 討論較多的話題與學(xué)習(xí)息息相關(guān)的話題,如圖書館、招生簡章、考研、就業(yè)等。這段時(shí)間說明大學(xué)生們比較關(guān)心自己的前途和未來。因此,可以加強(qiáng)大學(xué)生的考研輔導(dǎo)和畢業(yè)生就業(yè)工作指導(dǎo)等,為大學(xué)生提供相關(guān)指導(dǎo)和服務(wù),消除大學(xué)生內(nèi)心的擔(dān)憂和恐懼。
4 總結(jié)
本文運(yùn)用網(wǎng)絡(luò)爬蟲抓取官方微博內(nèi)容和評論內(nèi)容,提取和分析關(guān)鍵詞,通過詞云展示和K-means聚類分析及時(shí)掌握思想動(dòng)態(tài),獲得一段時(shí)間內(nèi)他們所關(guān)注的熱點(diǎn)話題,為大學(xué)生思政教育提供有針對性的方法和策略,幫助大學(xué)生樹立正確的價(jià)值取向和思想觀念具有重要的指導(dǎo)意義。
參考文獻(xiàn)
[1] 鄭永廷. 大學(xué)生思想政治教育質(zhì)量提升的理論研究[J]. 思想教育研究, 2013(6):14-16.
[2] 鄒興平, 艾楚君. 基于層次分析法的"年級主題+基礎(chǔ)"大學(xué)生思想政治教育模式的構(gòu)建[J]. 湘潭大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版), 2008, 31(6):157-160.
[3] 姚運(yùn)肖, 武宇清. 基于層次分析法對大學(xué)生思想政治工作的探索[J]. 山西農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2011, 10(6):541-544.
[4] 黃曉麗, 曹硯輝. 大學(xué)生思想動(dòng)態(tài)監(jiān)測指標(biāo)體系初探[J]. 創(chuàng)新與創(chuàng)業(yè)教育, 2016, 7(4):143-146.
[5] 趙光華, 鐘京鳳. 基于AHP的大學(xué)生思想政治教育有效性評價(jià)[J]. 中國成人教育, 2010(4):59-61.
[6] 劉愛榮, 宋子君, 黃妍. 層次分析法在高等學(xué)校學(xué)生工作績效評價(jià)中的應(yīng)用[J]. 遼寧科技學(xué)院學(xué)報(bào), 2011, 13(3):97-99.
[7] 張彥坤, 李航, 韓萌. 基于AHP-Fuzzy模型的輔導(dǎo)員工作精品項(xiàng)目的評價(jià)[J]. 科技與管理, 2016, 18(2):109-113.
[8] 于紀(jì)航. 基于AHP的大學(xué)生心理障礙誘發(fā)行為評價(jià)模型[J]. 金融理論與教學(xué), 2013(2):104-106.
[9] 許慧遠(yuǎn). 基于AHP和BP神經(jīng)網(wǎng)絡(luò)理論的大學(xué)生綜合素質(zhì)測評研究[J]. 思想教育研究, 2009,11(1):200-204.
[10] 孟祥瑞. 基于RAGA的投影尋蹤的大數(shù)據(jù)時(shí)代的大學(xué)生思想政治與日常表現(xiàn)評價(jià)研究[J]. 經(jīng)濟(jì)師, 2018(3):65-68.
[11] 易云飛, 黃澤, 李林. 改進(jìn)K-means聚類算法在高校團(tuán)組織建設(shè)中的應(yīng)用研究[J]. 軟件導(dǎo)刊, 2009(10):72-74.
(收稿日期: 2020.02.25)