国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于社交媒體大數(shù)據(jù)的大學(xué)生情感分析研究*

2021-03-12 05:25黃靜玉李彤彤李坦郭栩?qū)?/span>葛慧欣
中國教育信息化·高教職教 2021年2期
關(guān)鍵詞:情感分析社交媒體大數(shù)據(jù)

黃靜玉 李彤彤 李坦 郭栩?qū)? 葛慧欣

摘? ?要:對大學(xué)生特定時間的社交媒體評論文本進(jìn)行情感傾向分析,不僅可以幫助教師更好地了解該群體的情感特點(diǎn),還可以為有關(guān)部門針對該群體的決策提供科學(xué)參考。文章采用SVM、KNN、DT和NB四種機(jī)器學(xué)習(xí)算法分別構(gòu)建情感分類模型,同時采用查準(zhǔn)率P、召回率R和F值作為評估指標(biāo)對情感分類模型進(jìn)行對比,最終選擇SVM模型對157名大學(xué)生2019年1月至2020年2月期間的13048條微博文本數(shù)據(jù)進(jìn)行了情感分析。研究結(jié)果表明,負(fù)向情感出現(xiàn)的時間段集中在2019年11月和2020年1至2月。在這兩個時間段內(nèi),研究群體更關(guān)注“軍訓(xùn)”“期末”“疫情”等事件,由此,學(xué)校管理者可針對這些話題或事件進(jìn)行有針對性的干預(yù),從而在一定程度上緩解學(xué)生的負(fù)向情緒,保障大學(xué)生的心理健康。

關(guān)鍵詞:大學(xué)生;情感分析;社交媒體;大數(shù)據(jù)

中圖分類號:G434 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-8454(2021)03-0052-05

一、引言

隨著互聯(lián)網(wǎng)的普及,微博、朋友圈、知乎等社交媒體平臺為廣大網(wǎng)民獲取信息、發(fā)表觀點(diǎn)提供了新的途徑。人們會對事件、人物、產(chǎn)品等相關(guān)內(nèi)容發(fā)表帶有個人情感傾向與情感色彩的文本評論信息,這些主觀性的文本信息往往蘊(yùn)含著巨大的價值。企業(yè)通過挖掘并分析購物網(wǎng)站上商品客戶評論中蘊(yùn)含的情感傾向和態(tài)度,不斷調(diào)整和改善自己的銷售策略以優(yōu)化消費(fèi)者的購物體驗(yàn),從而提升企業(yè)實(shí)力。通過對此類文本信息進(jìn)行情感傾向分析,可以及時獲取公眾對特定事件的價值觀點(diǎn)與情感傾向,幫助有關(guān)部門準(zhǔn)確把握輿論發(fā)展趨勢并輔助其進(jìn)行決策分析,從而更有效地干預(yù)和引導(dǎo)輿論方向。

2019年發(fā)布的《第44次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,受過大學(xué)??啤⒋髮W(xué)本科及以上教育的網(wǎng)民群體占比分別為10.5%、9.7%。大學(xué)生是網(wǎng)民群體的重要組成部分,并且大學(xué)生們熱衷于在社交媒體平臺發(fā)布自己的意見、看法[1]。通過對特定時間大學(xué)生的社交媒體評論文本進(jìn)行情感分析,不僅可以幫助我們更好地了解該群體的情感特點(diǎn),情感分析結(jié)果也可以為有關(guān)部門針對該群體的決策提供參考。

本研究基于SVM、KNN、DT和NB四種算法,分別構(gòu)建情感分類模型。采用查準(zhǔn)率、召回率和F值作為評估指標(biāo)對情感分類模型進(jìn)行評估,發(fā)現(xiàn)基于SVM算法的情感分類模型表現(xiàn)優(yōu)于其他三種算法模型。本研究采用SVM算法構(gòu)建的情感分類模型,對天津某大學(xué)學(xué)生2019年1月至2020年2月發(fā)布的微博文本進(jìn)行情感分析,關(guān)注不同時間段、不同事件背景下用戶的情緒反映,以期為相關(guān)高校管理部門提供及時有效的反饋。

二、研究設(shè)計

1.概念界定

(1)社交媒體

社交媒體,也被稱為社會媒體,是能夠支持人們寫作、分享、評論、討論和交流的網(wǎng)站和技術(shù)[2]。社交媒體是建立在互聯(lián)網(wǎng)技術(shù),特別Web2.0技術(shù)基礎(chǔ)之上的互動社區(qū)。社交媒體賦予每個人創(chuàng)造并傳播內(nèi)容的能力,是用來進(jìn)行社會互動的媒體,是一種通過無處不在的交流工具進(jìn)行社會交往的方式。它能夠給予用戶極大的參與空間,不僅能夠滿足網(wǎng)民個人基礎(chǔ)資料存放的需求,更重要的是能夠滿足用戶“被人發(fā)現(xiàn)”和“受到崇拜”的心理感受需求,以及用戶“關(guān)系建立”和“發(fā)揮影響”的需求[3]。大學(xué)生熱衷于在社交媒體平臺發(fā)布自己的意見、看法[1],社交媒體上的文本數(shù)據(jù)一定程度上能夠真實(shí)地反映大學(xué)生的情感狀態(tài)。社交媒體種類繁多,本研究以社交媒體中的主流媒體“微博”為例展開研究。

(2)文本情感分析

文本情感分析,又被稱為觀點(diǎn)識別、意見挖掘等,是指對文本中的觀點(diǎn)、情感極性、主客觀性進(jìn)行識別、提取、分類、歸納及推理的分析過程[4]。其中,情感分類應(yīng)用最為普遍,其主要任務(wù)是對主觀性文本進(jìn)行情感分類[5]。

國內(nèi)外對于情感的劃分較為普遍的觀點(diǎn)有以下幾種:有些研究將情感分為積極情感、消極情感兩類;有些研究將情感劃分為積極、消極和中立三個類別[6];有些研究為了表達(dá)情感的強(qiáng)度將情感分為五級,0為最大消極情感,4為最大積極情感[7];也有研究根據(jù)人們的情緒表達(dá)將情感劃分為“快樂、悲哀、褒揚(yáng)、貶斥、信心和意外”等類型[8]。本研究采用了二維分類:正向情感與負(fù)向情感。正向情感指代積極情感,負(fù)向情感指代消極情感。

情感分析最常用的方法是機(jī)器學(xué)習(xí)方法和情感詞典法。相較于情感詞典法,機(jī)器學(xué)習(xí)方法不需要過多人工干預(yù)和成本投入,偏差更小[9],并且在更新速度上占據(jù)一定優(yōu)勢[10]。本研究采取機(jī)器學(xué)習(xí)的有監(jiān)督算法構(gòu)建情感分類模型,對微博文本進(jìn)行情感傾向分析。

2.研究思路

本研究實(shí)驗(yàn)思路如圖1所示,主要分為兩個部分。第一部分是情感分類模型的構(gòu)建,是將公開語料庫劃分為訓(xùn)練集與測試集,對測試集部分進(jìn)行文本預(yù)處理、文本向量化,然后調(diào)用算法函數(shù)訓(xùn)練情感分類模型。通過對當(dāng)前機(jī)器學(xué)習(xí)的主流算法進(jìn)行模型查準(zhǔn)率、召回率和F值比較,選取分類效果最佳的模型。第二部分是大數(shù)據(jù)的采集與分析,通過爬蟲技術(shù)爬取微博中相關(guān)用戶的信息數(shù)據(jù)并依次進(jìn)行文本預(yù)處理和文本向量化,然后運(yùn)用情感分類模型對信息數(shù)據(jù)進(jìn)行分析。

三、情感分類模型構(gòu)建

1.實(shí)驗(yàn)數(shù)據(jù)集

本實(shí)驗(yàn)采用代碼托管平臺“github”上的公開語料庫進(jìn)行模型訓(xùn)練。該語料庫是對一些評論進(jìn)行正負(fù)情感標(biāo)注的數(shù)據(jù)集合,其建設(shè)時間較新,在數(shù)據(jù)標(biāo)注期間采取多人核驗(yàn)保證數(shù)據(jù)質(zhì)量。將該語料庫劃分為訓(xùn)練集和測試集兩個部分。訓(xùn)練集用于對情感分類模型的訓(xùn)練評估;測試集用于檢驗(yàn)構(gòu)建的模型能否準(zhǔn)確得出正確分類標(biāo)簽。公開語料庫的具體情況如表1所示。

2.預(yù)處理

對文本數(shù)據(jù)進(jìn)行預(yù)處理,使計算機(jī)識別自然語言形式的語料[11]。常見的預(yù)處理包括以下內(nèi)容:①信息抽取,去除文本含有的“噪聲”。②將提取出來的有用數(shù)據(jù)借助已有的分詞工具進(jìn)行中文分詞。③借助已有的停用詞詞典,過濾掉文本中的停用詞,降低停用詞對分析結(jié)果的影響[12]。本研究主要使用預(yù)處理技術(shù)的分詞處理與去停用詞處理。使用北京理工大學(xué)研發(fā)的分詞工具“NLPIR”對采集到的微博文本數(shù)據(jù)進(jìn)行分詞處理;使用哈爾濱工業(yè)大學(xué)停用詞詞庫去除干擾實(shí)驗(yàn)的停用詞。

3.文本向量化

文本向量化即通過算法模型將文本轉(zhuǎn)化為一系列能夠表示文本的語義向量,研究中通常是以詞為基本單位進(jìn)行文本向量化。數(shù)據(jù)容量的大小能夠直接影響算法模型的準(zhǔn)確性、計算效率、計算時間等多個方面性能。文本向量化不僅在提高模型效率、減少計算時間、減少空間維度發(fā)揮著重要作用,同時也是提高算法性能至關(guān)重要的一環(huán)。

本研究使用了Google公司2013年提出的生成詞向量的神經(jīng)網(wǎng)絡(luò)算法“Word2vec”[13]。該算法通過給定對語料庫的學(xué)習(xí),可以生成維度不同的詞向量空間。該算法是基于上下文對詞語進(jìn)行分析處理,因而能夠達(dá)到本文需要達(dá)到的情感傾向性分類目的。這些詞向量可被放置于各類 NLP的計算任務(wù)中[14]?!癢ord2vec”采用的模型有CBOW和Skip-gram兩種,如圖2所示。兩者的組成部分均有輸入層、投影層和輸出層。CBOW模型的原理是根據(jù)位于當(dāng)前詞前后的詞語來預(yù)測出當(dāng)前詞語,而Skip-gram模型是以詞向量空間中的當(dāng)前詞語來預(yù)測位于其前后的詞語。

在此基礎(chǔ)上,采用“Word2vec”中的Skip-gram方法對訓(xùn)練集中的文本數(shù)據(jù)進(jìn)行詞語向量化,使得每個詞都有特定的數(shù)值來代表其特征,構(gòu)建了特征空間。Skip-gram方法主要是以詞向量空間中的當(dāng)前詞語來預(yù)測位于其前后的詞語,為模型訓(xùn)練打下基礎(chǔ)。

4.模型構(gòu)建

當(dāng)前機(jī)器學(xué)習(xí)的主流算法有支持向量機(jī)算法(SVM)、K臨近算法(KNN)、決策樹算法(DT)、樸素貝葉斯法(NB)等。

SVM算法一般來說可用于線性分類與非線性分類,其最重要的任務(wù)是選擇最優(yōu)的決策邊界,能夠?qū)崿F(xiàn)得到的兩類數(shù)據(jù)點(diǎn)之間距離最大化分割的直線。在二維空間中,決策邊界就是一條直線,將特征空間劃分正類與負(fù)類。但現(xiàn)實(shí)中很多數(shù)據(jù)分布是非線性的,可以借助核函數(shù)將二維數(shù)據(jù)空間向高維轉(zhuǎn)化,從而可以找到一個決策平面將不同類別的數(shù)據(jù)點(diǎn)距離最大化分割[15]。SVM最大的優(yōu)勢是能夠在計算機(jī)性能欠缺、樣本數(shù)不高的情況下取得不錯的結(jié)果。

KNN算法是經(jīng)典的文本分類算法,其基本過程是將訓(xùn)練樣本映射成空間中的點(diǎn),再計算相似度,按照計算結(jié)果進(jìn)行排序,找出訓(xùn)練集D中與待分類文本x相似度最高或距離最近的k個文本。根據(jù)找出的k個文本的分類結(jié)果來對待分類文本x進(jìn)行判定[16]。在樣本數(shù)據(jù)集大或訓(xùn)練樣本分布不均勻的情況下,分類的準(zhǔn)確度會受到影響[17]。

DT算法所用的DP矩陣可以基于抽象層次的結(jié)果及統(tǒng)計意義的度量層次結(jié)果來建立。但是當(dāng)面臨樣本類別較多或訓(xùn)練樣本數(shù)量較少的情況時,通常很難做出準(zhǔn)確的估計。

NB算法由概率論中的貝葉斯公式得來,具有實(shí)現(xiàn)簡單、計算高效等優(yōu)勢。貝葉斯算法本身具有增量學(xué)習(xí)的特性,可有效降低學(xué)習(xí)算法的復(fù)雜性。但數(shù)據(jù)增長的爆炸式趨勢限制了該算法的可擴(kuò)展性和泛化性[18]。

將經(jīng)過預(yù)處理及文本向量化的訓(xùn)練集數(shù)據(jù),分別使用前文介紹的SVM、KNN、DT、NB算法調(diào)用已有庫函數(shù)編寫相應(yīng)的算法程序,逐條讀取訓(xùn)練集中的數(shù)據(jù),對數(shù)據(jù)及其蘊(yùn)含的情感傾向進(jìn)行學(xué)習(xí),分別構(gòu)建了四種算法所對應(yīng)的情感分類模型。

5.模型選擇

本研究采用的模型需要通用評估標(biāo)準(zhǔn)評價和衡量其效率。目前通用的文本分類評估標(biāo)準(zhǔn)有查準(zhǔn)率、召回率(也叫查全率)和F值等。

(1)查準(zhǔn)率P

準(zhǔn)確分類的測試組與該類數(shù)據(jù)總和之比的百分化,具體計算方法如公式1。

p=■公式1

其中,x代表某類一個測試組分類正確的樣本個數(shù);C代表某類數(shù)據(jù)總和;P代表查準(zhǔn)率 Precision。

(2)召回率R

從被分類領(lǐng)域中,召回目標(biāo)類別的比例,具體計算方法如公式2。

R=■公式2

其中,m代表標(biāo)簽“1”數(shù)據(jù)的總數(shù);x代表分類器預(yù)測標(biāo)簽為“1”的正確樣本個數(shù);R代表查全率 Recall。

(3)F值

P和R指標(biāo)有時候會出現(xiàn)互相制約的情況。P值和R值不可能同時正增長,這樣就需要綜合考慮它們。最常見的方法就是F-Measure(又稱為F-Score,簡稱F值)。F值綜合反映整體的指標(biāo),由上面得到的 P 與 R 進(jìn)行加權(quán)調(diào)和,具體計算方法如公式3。

F1=■公式3

在具體評估過程中,查準(zhǔn)率與召回率有一定的制約關(guān)系。查準(zhǔn)率、召回率和F值的值越高,模型越有效。

本研究構(gòu)建的四種模型分別對經(jīng)過文本預(yù)處理及文本向量化的測試集進(jìn)行情感傾向判定,即正向情感標(biāo)記為“1”,負(fù)向情感標(biāo)記為“-1”。使用程序分別統(tǒng)計分類器將輸入文本正確地分類到某個類別的個數(shù)、錯誤地分類到某個類別的個數(shù)、錯誤地排除在某個類別之外的個數(shù)、正確地排除在某個類別之外的個數(shù)。采用查準(zhǔn)率、召回率和F值等評估標(biāo)準(zhǔn)對構(gòu)建的情感分類模型進(jìn)行評估,結(jié)果如表2所示??梢园l(fā)現(xiàn),SVM、KNN、DT、NB等四種算法構(gòu)建的分類模型分析效率相對較高,其中SVM算法的P、R、F三個標(biāo)準(zhǔn)的值均為最高。因此,本研究最終選擇SVM算法構(gòu)建的情感分類模型進(jìn)行情感傾向分析。

四、基于微博文本大數(shù)據(jù)的情感分析

1.數(shù)據(jù)采集

本研究追蹤了半年內(nèi)曾定位在天津師范大學(xué)的賬戶204個,并人工篩選獲取157名學(xué)生的ID。使用“github”上公開的新浪微博爬蟲程序,通過不斷更新config.json中的學(xué)生ID列表,再利用Spyder執(zhí)行weiboSpider.py程序來爬取已知微博ID學(xué)生2019年1月1日至2020年2月29日的微博文本。

本次爬取微博數(shù)據(jù)取得了較好的結(jié)果。共計爬取157名學(xué)生的13048條數(shù)據(jù),分別存放在157個CSV文件中。其格式如表3所示,主要由微博ID、正文、發(fā)布時間、位置、點(diǎn)贊數(shù)等組成。文本及發(fā)布時間作為本文主要的實(shí)驗(yàn)數(shù)據(jù)。

2. 數(shù)據(jù)分析

本研究對2019年1月至2020年2月期間157名學(xué)生的13048條文本數(shù)據(jù)進(jìn)行分詞、去停用詞等文本預(yù)處理及文本向量化,選擇基于SVM算法的情感分類模型對其情感極性進(jìn)行了分類。本研究使用SVM算法構(gòu)建的情感分類模型對實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行情感傾向判定。輸出判定結(jié)果為“-1”的文本,即負(fù)向情感文本;輸出判定結(jié)果為“1”的文本,即正向情感文本。統(tǒng)計結(jié)果如下。

(1)正負(fù)向情感文本數(shù)量統(tǒng)計

首先,本研究對正負(fù)情感的文本以月份為單位進(jìn)行了數(shù)量統(tǒng)計,結(jié)果如表4所示。可見,每個月份正向文本的數(shù)量均明顯多于負(fù)向文本,表明該校學(xué)生在微博社交媒體平臺上發(fā)布的文本在情感傾向上相對偏正向。

(2)負(fù)向情感文本比例分布情況

其次,本研究對每個月份負(fù)向情感所占比例進(jìn)行了分析,結(jié)果如圖3所示??梢园l(fā)現(xiàn),2019年1月的群體負(fù)向情感比重最小,2019年9月的群體負(fù)向情感比重最大。

(3)負(fù)向情感文本時間序列分布情況

再次,本研究對負(fù)向情感文本的時間序列分布情況進(jìn)行了分析,以時間為橫軸,負(fù)向情感文本數(shù)目為縱軸,繪制出負(fù)向情感文本數(shù)量時間序列分布圖,如圖4所示。2019年9月至2020年2月時間段的負(fù)向情感文本數(shù)量相對于2019年1至8月時間段更高,尤其是在2019年9月及2020年1至2月負(fù)向情感文本數(shù)目急劇增長。因此,本研究推測研究群體的負(fù)向情感與相應(yīng)時間段發(fā)生的社會事件存在某些關(guān)聯(lián)。

(4)負(fù)向文本內(nèi)容分析

本研究按照時間段對負(fù)向文本內(nèi)容進(jìn)行了分析與討論。在2019年9月期間,負(fù)向情感和正向情感文本內(nèi)容中,“軍訓(xùn)”出現(xiàn)的頻率都比較高,推測研究群體在這個時間段對“軍訓(xùn)”的關(guān)注度較高。2019年11月,負(fù)向情感文本內(nèi)容中,“課業(yè)”“考研”“學(xué)生會”三個話題出現(xiàn)的頻率較高,說明這三個話題可能與研究群體在這一階段的負(fù)向情緒有關(guān)聯(lián)。相比之下,“課業(yè)”“考研”“學(xué)生會”在同一時間段正向文本中出現(xiàn)的頻率較低。由此推測,在這個時間段內(nèi),“課業(yè)”“考研”“學(xué)生會”對于研究群體的負(fù)向情感有直接影響。2020年初的負(fù)向文本內(nèi)容中,“期末”“疫情”這兩個話題出現(xiàn)的頻率較高,話題與學(xué)生負(fù)向情緒出現(xiàn)的時間段基本吻合,推測研究群體在這個時間段的負(fù)向情緒與“期末”及“疫情”事件有一定程度的關(guān)聯(lián)。

研究群體在社交媒體上表現(xiàn)出的情感傾向整體偏于正向,而負(fù)向情感傾向所占比例較小。負(fù)向情感比較集中的時間段主要有兩個,即2019年9月與2020年初(1月和2月)。在這兩個時間段中,學(xué)生比較關(guān)心的事件分別是“軍訓(xùn)”“期末”“疫情”。其中“疫情”為突發(fā)事件,而“軍訓(xùn)”“期末”是該群體比較普遍的話題。這表明該群體除日常生活以外,也會關(guān)注社會事件。

五、結(jié)語

本研究構(gòu)建了基于SVM算法的情感分類模型。利用該模型對采集到的文本數(shù)據(jù)進(jìn)行情感分類,得出負(fù)向情感出現(xiàn)比較集中的時間段及期間發(fā)生的相關(guān)事件。針對產(chǎn)生負(fù)向情感的話題,學(xué)校相關(guān)管理部門可以針對性地采取一些措施來緩解學(xué)生的負(fù)向情緒。例如:一方面,針對該群體的軍訓(xùn)和期末考試等日常生活,可以適度組織心理培訓(xùn),培養(yǎng)學(xué)生應(yīng)對大學(xué)生活的積極心態(tài);組織關(guān)于專業(yè)學(xué)習(xí)的講座,增強(qiáng)該群體的學(xué)習(xí)興趣和專業(yè)信心;開展具有積極意義的團(tuán)日活動,幫助該群體樹立理想信念;積極開展體育鍛煉活動,幫助學(xué)生增強(qiáng)體魄等。另一方面,面對類似“疫情”等突發(fā)社會事件,有關(guān)管理部門應(yīng)該高度關(guān)注學(xué)生群體的心理狀況,積極開展心理健康教育培訓(xùn),提升學(xué)生心理抗壓能力;針對突發(fā)事件,加大相應(yīng)的防控知識普及力度。

參考文獻(xiàn):

[1]劉世權(quán).中華優(yōu)秀傳統(tǒng)文化在高校中的傳播路徑研究——基于社交媒體大數(shù)據(jù)視角[J].重慶科技學(xué)院學(xué)(社會科學(xué)版),2018(6):104-106.

[2]孟恒玥,閆水華,尹永奎.移動互聯(lián)網(wǎng)社交媒體使用行為對大學(xué)生社會化行為的影響及策略研究[J].中國市場,2020(11):190-191.

[3]曹博林.社交媒體:概念、發(fā)展歷程、特征與未來——兼談當(dāng)下對社交媒體認(rèn)識的模糊之處[J].湖南廣播電視大學(xué)學(xué)報,2011(3):65-69.

[4]楊鑫,楊云帆,焦維等.基于領(lǐng)域詞典的民宿評論情感分析[J].科學(xué)技術(shù)與工程,2020,20(7):2794-2800.

[5]楊立公,朱儉,湯世平.文本情感分析綜述[J].計算機(jī)應(yīng)用,2013,33(6):1574-1607.

[6]Li S T, Tsai F C. A Fuzzy Conceptualization Model for Text Mining with Application in Opinion Polarity Classification[J].Knowledge-Based Systems,2013(39):23-33.

[7]Socher R, Perelygin A, Wu J Y, et al. Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank[C].Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing,2013:1631-1642.

[8]楊小平,張中夏,王良等.基于Word2Vec的情感詞典自動構(gòu)建與優(yōu)化[J].計算機(jī)科學(xué),2017,44(1):42-47.

[9]V. Ha-Thu, J. Renders. Large-scale hierarchical text classification without labeled data[C].Proceedings of the fourth ACM international conference on Web search and data mining. ACM, New York, USA,2011:685-694.

[10]A. Kennedy, D. Inkpen. Sentiment classification of movie reviews using contextual valence shifters[J].Computational intelligence,2006,22(2):110-125.

[11]沈芬.基于SVM的電商評論文本情感傾向性分析[D].秦皇島:燕山大學(xué),2019.

[12]劉家鋒,趙巍,朱海龍.模式識別[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2014:51-55.

[13]Mikolov T,Chen K, Corrado G,et al. Efficient estimation of word representations in vector space[J].Computer Science,2013(1):47-61.

[14]Zhang D,Xu H,Su Z,et al.Chinese comments sentiment classification based on word2vec and SVMperf[J].Expert Systems with Applications,2015,42(4):1857-1863.

[15]李蒼柏,肖克炎,李楠等.支持向量機(jī)、隨機(jī)森林和人工神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法在地球化學(xué)異常信息提取中的對比研究[J].地球?qū)W報,2020(2):309-319.

[16]劉述昌,張忠林.基于中心向量的多級分類KNN算法研究[J].計算機(jī)工程與科學(xué),2017,39(9):1758-1764.

[17]王志華,劉紹廷,羅齊.基于改進(jìn)K-modes聚類的KNN分類算法[J].計算機(jī)工程與設(shè)計,2019,40(8):2228-2234.

[18]韓素青,成慧雯,王寶麗.三支決策樸素貝葉斯增量學(xué)習(xí)算法研究[J].計算機(jī)工程與應(yīng)用,2020(3):15-16.

(編輯:王曉明)

猜你喜歡
情感分析社交媒體大數(shù)據(jù)
在線評論情感屬性的動態(tài)變化
“雙微時代”的危機(jī)傳播趨勢和影響因素研究
永顺县| 明水县| 蒲江县| 新津县| 文成县| 高淳县| 新源县| 岗巴县| 海宁市| 古蔺县| 托克托县| 邓州市| 叶城县| 安阳县| 武定县| 平遥县| 广德县| 萨迦县| 安康市| 鸡西市| 浙江省| 南丰县| 浦县| 景洪市| 石棉县| 镇原县| 新平| 华阴市| 康平县| 泸州市| 安图县| 西和县| 淮安市| 黄陵县| 上饶市| 丘北县| 宝山区| 富顺县| 遂平县| 英山县| 西宁市|