国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高校網(wǎng)絡(luò)輿情獲取方法研究

2018-01-19 11:35徐明磊趙博文諸葛福民
軟件導(dǎo)刊 2018年10期
關(guān)鍵詞:文本分析

徐明磊 趙博文 諸葛福民

摘 要:高校輔導(dǎo)員是高校管理的一線工作人員,研究高校網(wǎng)絡(luò)輿情獲取方法,對高校輔導(dǎo)員進(jìn)行學(xué)生思想引導(dǎo)工作以及維護(hù)高校網(wǎng)絡(luò)健康發(fā)展具有重要意義。從高校輔導(dǎo)員視角出發(fā),運(yùn)用對比分析方法,對近年來網(wǎng)絡(luò)輿情獲取方法和文本分析方法進(jìn)行研究,進(jìn)而根據(jù)高校網(wǎng)絡(luò)輿情的內(nèi)涵和特點,改進(jìn)TF-IDF算法對高校網(wǎng)絡(luò)輿情進(jìn)行文本分析,最后給出該算法的實現(xiàn)過程,既可為分析高校網(wǎng)絡(luò)輿情發(fā)展方向提供依據(jù),也可為高校管理工作順利進(jìn)行提供技術(shù)保障。

關(guān)鍵詞:高校網(wǎng)絡(luò)輿情;文本分析;TF-IDF算法

DOIDOI:10.11907/rjdk.182045

中圖分類號:TP301

文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2018)010-0048-03

英文摘要Abstract:College counselors are the front-line staff in the management of colleges and universities. It is of great significance to study the access methods of colleges and universities to obtain the guidance of students′ ideological work and to maintain the healthy development of colleges and universities. Based on the perspective of college counselors, through the method of comparison and analysis, this paper studies the acquisition methods and text analysis methods of online public opinion in recent years, and then improves the TF-IDF algorithm to college network according to the connotation and characteristics of college network public opinion. The text analysis of the public opinion, and finally the implementation process of the algorithm. It provides a basis for analyzing the development direction of college network public opinion, and also provides technical support for the smooth progress of university management.

英文關(guān)鍵詞Key Words:university network public opinion;text analysis;TF-IDF algorithm

0 引言

2018年1月31日,中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)在北京發(fā)布第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》,該報告顯示,截至2017年12月,中國網(wǎng)民規(guī)模已高達(dá)7.72億,普及率達(dá)到55.8%,超過全球平均水平(51.7%)4.1個百分點\+\{[1]\},其中,20-29歲的網(wǎng)民數(shù)量最多,占比30.0%。而高校大學(xué)生群體年齡正處于17-29歲之間,數(shù)量龐大又具有個性化的成長特點,成為高校網(wǎng)絡(luò)輿情的受眾主體,具有一定影響力。因此,高校網(wǎng)絡(luò)輿情獲取和治理研究顯得尤為重要,而輔導(dǎo)員作為高校管理的一線工作人員,對此應(yīng)更加關(guān)注。

近年來,對于網(wǎng)絡(luò)輿情的文本分析,國內(nèi)外學(xué)者提出了很多不同方法,如馬海兵等\+\{[2]\}針對文本分類技術(shù)在網(wǎng)絡(luò)輿情分析系統(tǒng)中的應(yīng)用,提出并實現(xiàn)了KNN和SVM分類算法,證明了該方法的有效性;彭浩等\+\{[3]\}針對未從全局層面進(jìn)行微博文本特征分析的問題,提出一種基于主題發(fā)現(xiàn)的微博網(wǎng)絡(luò)輿情分析模型;唐曉波等\+\{[4]\}采用LDA聚類算法挖掘檢測微博話題,并通過實證分析證明了該方法的可行性。同時,TF-IDF算法也被經(jīng)常用于文本分析中,如曹姍\+\{[5]\}提出基于TF-IDF特征提取的短文本分類方法就很好地保證了文本特征的表達(dá)效果。TF-IDF也被一些學(xué)者進(jìn)行改進(jìn)和優(yōu)化,如龔靜等\+\{[6]\}提出一種基于k-最近鄰(k-NN)和詞頻-逆文檔詞頻(TF-IDF)改進(jìn)的文本分類方法,并驗證此方法可以得到更精確的分類結(jié)果。但是TF-IDF在高校網(wǎng)絡(luò)輿情關(guān)鍵詞分類方面的研究較少,因此本文結(jié)合高校網(wǎng)絡(luò)輿情特點,重點將TF-IDF算法運(yùn)用于高校網(wǎng)絡(luò)輿情的文本分析中,以提高高校網(wǎng)絡(luò)輿情分析準(zhǔn)確度,為高校管理工作提供技術(shù)保障。

1 TF-IDF算法

2 高校網(wǎng)絡(luò)輿情內(nèi)涵及改進(jìn)TF-IDF算法應(yīng)用

2.1 高校網(wǎng)絡(luò)輿情與高校輔導(dǎo)員

高校網(wǎng)絡(luò)輿情,顧名思義就是在高??臻g內(nèi),高校學(xué)生在互聯(lián)網(wǎng)平臺上的傾向性態(tài)度和情緒總和。主要是指對國內(nèi)外重大事件、社會事件、時政等公共事務(wù)以及高校和學(xué)生管理中出現(xiàn)的與自身利益相關(guān)事件等\+\{[10]\}。

高校輔導(dǎo)員,是高校進(jìn)行管理工作的一線教職工,其與高校學(xué)生接觸最多,交流最頻繁,決定了其對構(gòu)建和諧校園起到至關(guān)重要的作用。所以,高校輔導(dǎo)員應(yīng)及時關(guān)注高校網(wǎng)絡(luò)輿情,采用相應(yīng)的技術(shù)和方法獲取輿情信息并及時治理?;诟咝]o導(dǎo)員視角,高校的網(wǎng)絡(luò)輿情是一把“雙刃劍”,也是高校的“晴雨表”\+\{[11]\}。

任何事物的形成和發(fā)展都有一定規(guī)律,高校網(wǎng)絡(luò)輿情也不例外。隨著信息的開放,大學(xué)生關(guān)注時事政治,比如中共十九大會議;關(guān)注社會事件,比如劉歡案件;關(guān)注全國高校新聞事件,比如校園貸等。當(dāng)高校學(xué)生將關(guān)注點放在某些事件中時就會引發(fā)對該事件的討論,于是在高校論壇等平臺上發(fā)布自己的觀點和看法,不同學(xué)生間意見沖突和思想碰撞就會引發(fā)高校網(wǎng)絡(luò)輿情的形成\+\{[12]\}。

2.2 高校網(wǎng)絡(luò)輿情事件關(guān)鍵詞獲取過程

(1)切詞。選定可以代表高校網(wǎng)絡(luò)輿情的文章并將其切成一個個可以作為關(guān)鍵詞的詞語,目前包含3種切詞方法\+\{[13]\}:基于字符串匹配的分詞、基于理解的分詞、基于統(tǒng)計的分詞。目前還無法證明3種方法哪種最優(yōu),但第一種方法出現(xiàn)最早、最成熟,算法難度也低,因此本文選用基于字符串匹配的分詞方法。

(2)計算詞頻。詞頻(TF)=某個詞在文中出現(xiàn)的次數(shù),鑒于文本長短之異,對詞頻的計算進(jìn)行標(biāo)準(zhǔn)化改動。

3 結(jié)語

互聯(lián)網(wǎng)不斷發(fā)展使得高校網(wǎng)絡(luò)輿情的形成、傳播和發(fā)展更加復(fù)雜多變\+\{[18]\}。本文從高校輔導(dǎo)員角度出發(fā),分析了高校網(wǎng)絡(luò)輿情的內(nèi)涵,在理解關(guān)鍵詞提取算法TF-IDF思想的基礎(chǔ)上,將其運(yùn)用于高校網(wǎng)絡(luò)輿情的實際中。但是,僅僅用詞頻衡量關(guān)鍵詞的重要性還不夠全面,且TF-IDF算法也不能體現(xiàn)詞的位置信息,所以下一步需將TF-IDF算法與余弦相似性或更多方法相結(jié)合作文本分析研究。

參考文獻(xiàn):

[1] 中國互聯(lián)網(wǎng)絡(luò)信息中心.第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》[EB/OL]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201803/t20180305_70249.htm.

[2] 馬海兵,畢久陽,郭新順.文本分類方法在網(wǎng)絡(luò)輿情分析系統(tǒng)中的應(yīng)用研究[J].情報科學(xué),2015(5):97-101.

[3] 彭浩,周杰,周豪,等.微博網(wǎng)絡(luò)中基于主題發(fā)現(xiàn)的輿情分析[J].電訊技術(shù),2015(6):611-617.

[4] 唐曉波,童海燕,嚴(yán)承希.基于話題情感強(qiáng)度的微博輿情分析[J].圖書館學(xué)研究,2014(17):85-93.

[5] 曹姍.基于TF-IDF特征提取的短文本分類方法[J].工業(yè)控制計算機(jī),2018(4):109-110.

[6] 龔靜,黃欣陽.基于k最近鄰和改進(jìn)TF-IDF的文本分類框架[J].計算機(jī)工程與設(shè)計,2018(5):1340-1344.

[7] 胡改蝶,樊孝仁,崔藝馨.文本分類中基于改進(jìn)特征選擇方法的研究[J].計算機(jī)與數(shù)字工程,2016(7):1290-1292.

[8] 覃世安,李法運(yùn).文本分類中TF-IDF方法的改進(jìn)研究[J].現(xiàn)代圖書情報技術(shù),2013(10):27-30.

[9] 王俊芳,王中龍,劉建,等.電力企業(yè)供應(yīng)商疑似圍標(biāo)串標(biāo)行為分析[J].經(jīng)營與管理,2018(5):121-123.

[10] 李青.高校網(wǎng)絡(luò)輿情話題熱度趨勢預(yù)測研究[D].青島:山東科技大學(xué),2017.

[11] 劉昊.網(wǎng)絡(luò)輿論的形成機(jī)制與調(diào)控策略研究[D].成都:電子科技大學(xué),2007.

[12] 張義庭.信息化環(huán)境下高校網(wǎng)絡(luò)輿情與危機(jī)管理研究[J].情報雜志,2011(8):51-54+60.

[13] 沈靜.淺析中文分詞方法[J].漳州職業(yè)技術(shù)學(xué)院學(xué)報,2016(3):45-48.

[14] 范小麗,劉曉霞.文本分類中互信息特征選擇方法的研究[J].計算機(jī)工程與應(yīng)用,2010(34):123-125.

[15] 管瑞霞,陸蓓.TFLD:一種中文文本關(guān)鍵詞自動提取方法[J].機(jī)電工程,2010(9):124-125.

[16] 徐萍.大數(shù)據(jù)在高校網(wǎng)絡(luò)輿情應(yīng)急處置中的應(yīng)用探討[J].圖書館工作與研究,2016(5):55-58.

(責(zé)任編輯:何 麗)

猜你喜歡
文本分析
投資者情緒短期對股票市場的影響研究
文本情感計算系統(tǒng)“小菲”的設(shè)計及其在教育領(lǐng)域文本分析中的應(yīng)用
初中英語聽說課教學(xué)實踐探索
經(jīng)合組織成員體教師隊伍現(xiàn)狀、特點及發(fā)展趨勢
以符號矩陣?yán)碚摐\析《鬼魅丹青》
《化學(xué):概念與應(yīng)用》專題作業(yè)設(shè)計分析及啟示
論20世紀(jì)初期刊中的科學(xué)觀念