国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于輿情數(shù)據(jù)的群體性事件識(shí)別研究

2024-12-08 00:00:00李艷艷李曉群居強(qiáng)黃虹
關(guān)鍵詞:群體性事件

摘 要:針對(duì)國(guó)網(wǎng)客服中心客戶重復(fù)訴求問(wèn)題,面對(duì)輿情群體性事件的沖擊,須了解輿情群體性事件的演化規(guī)律,確定事件類別,提煉事件特征?;诓煌悇e的網(wǎng)絡(luò)群體性事件,基于海量的95598工單數(shù)據(jù)集,通過(guò)LDA主題模型與高斯混合聚類算法相結(jié)合,利用LDA模型實(shí)現(xiàn)文本潛在語(yǔ)義的識(shí)別構(gòu)建的網(wǎng)絡(luò)群體性事件動(dòng)態(tài)識(shí)別模型,通過(guò)大量的文本訓(xùn)練,當(dāng)事件聚類數(shù)為6時(shí)有良好的解釋性。利用LDA主題模型和高斯混合聚類算法,減少了模型的迭代次數(shù),確定最佳主題數(shù),提高了網(wǎng)絡(luò)群體性事件識(shí)別結(jié)果的準(zhǔn)確性。

關(guān)鍵詞:高斯聚類;輿情數(shù)據(jù);群體性事件;主題模型;動(dòng)態(tài)識(shí)別

中圖分類號(hào):TP 39 " " " 文獻(xiàn)標(biāo)志碼:A

網(wǎng)絡(luò)輿情是指利用互聯(lián)網(wǎng)對(duì)輿情事件表達(dá)相關(guān)言論。當(dāng)發(fā)生群體性輿情事件時(shí),相關(guān)職能部門需要迅速收集網(wǎng)絡(luò)輿情信息,跟蹤事態(tài)變化,這是亟待解決的問(wèn)題[1]。本文基于95598工單和其龐大的用戶數(shù)據(jù),構(gòu)建一種對(duì)公眾輿論進(jìn)行實(shí)時(shí)監(jiān)測(cè)和分析的輿情監(jiān)測(cè)機(jī)制。通過(guò)95598熱線工單采集用戶訴求信息,結(jié)合數(shù)據(jù)分析和挖掘技術(shù),對(duì)公眾輿論進(jìn)行全面、客觀、精準(zhǔn)地監(jiān)測(cè)和分析。

1 模型架構(gòu)設(shè)計(jì)

對(duì)網(wǎng)絡(luò)輿情群體性事件的研究主要結(jié)合文本處理技術(shù),目前國(guó)內(nèi)已有眾多學(xué)者在相關(guān)領(lǐng)域的研究取得進(jìn)展。張君第等通過(guò)使用TF-IDF算法對(duì)文本特征提取,使用徑向量函數(shù)的神經(jīng)網(wǎng)絡(luò)模型以及自然語(yǔ)言處理算法對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,來(lái)進(jìn)行輿情分析與預(yù)警[2]。學(xué)者秦洋等通過(guò)自然語(yǔ)言處理等技術(shù)流程,得到熱度和情感傾向分析,并將其應(yīng)用于輿情監(jiān)測(cè)[3]。學(xué)者趙明輝采用文本挖掘技術(shù)進(jìn)行數(shù)據(jù)爬取,再結(jié)合情感分析、主題模型等方法對(duì)文本評(píng)論中的隱性知識(shí)做顯性挖掘[4]。陳謙等通過(guò)對(duì)文本數(shù)據(jù)做降維處理后,結(jié)合感知機(jī)技術(shù)對(duì)文本做進(jìn)一步聚類[5]。周忠寶等使用文本挖掘技術(shù)對(duì)彈幕數(shù)據(jù)進(jìn)行爬取,然后進(jìn)行動(dòng)態(tài)主題分析,并使用CNN對(duì)文本進(jìn)行情感分析[6]。2022年田永承等將每個(gè)聚類中心代表一個(gè)話題,將親和傳播算法引入網(wǎng)絡(luò)輿情熱點(diǎn)話題的檢測(cè)中[7]。本文基于國(guó)網(wǎng)客服中心95598數(shù)據(jù)分析平臺(tái),采用網(wǎng)絡(luò)自動(dòng)化技術(shù)將客戶訴求信息數(shù)據(jù)進(jìn)行抓取,采用聚類算法進(jìn)行主題信息聚類??紤]到基礎(chǔ)的聚類算法,因?yàn)椴捎玫椒?,所以聚類結(jié)果往往收斂于局部最優(yōu)而得不到全局最優(yōu)解,且可處理的數(shù)據(jù)類型有限,對(duì)于高維數(shù)據(jù)對(duì)象的聚類效果不佳。本文通過(guò)高斯聚類模型與LDA主題模型的融合,利用LDA主題模型確定聚類點(diǎn)初始位置?;诖?,選取對(duì)網(wǎng)絡(luò)群體性事件文檔集中影響程度排名較高的前N個(gè)主題,根據(jù)確定的N個(gè)主題對(duì)網(wǎng)絡(luò)群體性事件文本信息集開(kāi)始初步聚類,以此定位為初始聚類中心,減少聚類迭代次數(shù),使聚類結(jié)果更準(zhǔn)確。

1.1 主題提取模型

主題模型(Topic Model)是自然語(yǔ)言處理中的一種常用模型,其作用是從大量文檔中自動(dòng)提取主題信息。主題模型的核心思想是每篇文檔都可以看作是多個(gè)主題的混合,而每個(gè)主題則由1組詞構(gòu)成。LDA(Latent Dirichlet Allocation)是一種文檔主題生成模型,作為一種非監(jiān)督機(jī)器學(xué)習(xí)技術(shù),可以用來(lái)識(shí)別大規(guī)模文檔集或語(yǔ)料庫(kù)中潛藏的主題信息。LDA模型是基于概率潛在語(yǔ)義分析PLAS模型的改進(jìn)。PLSA是基于概率潛在語(yǔ)義分析的,它假設(shè)文檔和主題共同生成詞語(yǔ),PLSA的主題是由潛在語(yǔ)義向量構(gòu)成的,解釋性較差。有學(xué)者通過(guò)引入對(duì)狄利克雷先驗(yàn)參數(shù),解決了PLAS模型在文檔層概率模型缺失的問(wèn)題,實(shí)現(xiàn)了主題的詞匯概率分布和文檔主題概率分布。LDA模型是一種全概率主題生成模型,被廣泛應(yīng)用于文本處理任務(wù),在語(yǔ)料規(guī)模較大的文本上表現(xiàn)良好。有學(xué)者基于LDA模型對(duì)2006—2017年的研究文獻(xiàn)中的主題演化趨勢(shì)進(jìn)行分析,得到了圖書(shū)情報(bào)研究的熱門主題并總結(jié)了演化趨勢(shì)[8]。

LDA假設(shè)每個(gè)文檔定義了一個(gè)主題(topic)的概率分布,而每個(gè)主題定義了一個(gè)詞(word)的概率分布。它還假設(shè)在文檔中的每個(gè)詞是這樣被產(chǎn)生的:先從文檔中抽出一個(gè)主題(例如金融),然后再?gòu)闹黝}中抽出一個(gè)詞(例如貨幣)。每個(gè)詞的產(chǎn)生過(guò)程彼此獨(dú)立。LDA算法有訓(xùn)練和測(cè)試兩個(gè)階段 , 當(dāng)訓(xùn)練時(shí)輸入許多文檔,輸出這兩個(gè)概率分布的參數(shù);當(dāng)測(cè)試時(shí)輸入一個(gè)新文檔,輸出它的主題分布。LDA可以從一篇文檔中提取少數(shù)幾個(gè)主題,與人們?cè)谡砦募倪^(guò)程中打上標(biāo)簽相似,為信息檢索提供了便利。

其基本步驟如下:首先,從主題分布中隨機(jī)選擇一個(gè)主題;其次,從該主題的單詞分布中隨機(jī)選擇一個(gè)單詞;重復(fù)上述過(guò)程,直到生成整個(gè)文本。將文檔—詞語(yǔ)由高維度的向量空間矩陣映射轉(zhuǎn)換為2個(gè)低維度的矩陣:文檔—主題矩陣、主題—詞語(yǔ)矩陣,其中文檔—主題及主題—詞語(yǔ)均服從多項(xiàng)式分布。一篇文檔中每個(gè)詞語(yǔ)出現(xiàn)的條件概率公式如公式(1)所示。

P(詞語(yǔ)|文檔)=∑主題P(詞語(yǔ)|主題)P*(主題|文檔) " (1)

式中:P(詞語(yǔ)|文檔)為該詞語(yǔ)在文檔中出現(xiàn)的概率值,是已知的,P(詞語(yǔ)|主題)與P(主題|文檔)是未知的,P(詞語(yǔ)|主題)為詞語(yǔ)在對(duì)應(yīng)主題下的概率,如果概率值越大就說(shuō)明特征詞與該主題的關(guān)聯(lián)性越大。P(主題|文檔)為文檔對(duì)應(yīng)主題下的概率值,如果概率值越大就說(shuō)明主題與文檔的聯(lián)系更緊密,這樣可以反映主題構(gòu)成情況。假設(shè)共有M篇文檔,可提取K個(gè)主題。每個(gè)文檔都是獨(dú)立的主題分布,主題概率分布參數(shù)α服從狄利克雷分布。θ為每篇文章的主題分布,對(duì)于第i篇文檔的主題分布是θi。每個(gè)主題都有各自的詞項(xiàng)分布,詞項(xiàng)分布概率參數(shù)β也服從于狄利克雷分布,α、β與主題數(shù)目K都是建模前需要確定的超參數(shù)。

針對(duì)文檔內(nèi)第n個(gè)詞語(yǔ),首先,完成從相應(yīng)的文檔中主題分布進(jìn)行主題抽取的步驟,其次,再去完成詞項(xiàng)分布中主題抽取的步驟,最后,持續(xù)重復(fù)上述步驟,直到完成文檔的所有遍歷過(guò)程,其聯(lián)合概率如公式(2)所示。

(2)

式中:t為主題topic;w為文檔中的詞word;α為主題概率分布;β為詞項(xiàng)概率分布;θ、t為隱含變量;N為文檔中全部詞的數(shù)量。

1.2 高斯混合模型聚類

1.2.1 高斯混合模型(GMM)

高斯混合模型(Gaussian Mixed Model,GMM)是一種基于概率密度函數(shù)的概率建模技術(shù),它假設(shè)每個(gè)聚類都是由多個(gè)高斯分布組成的混合分布。GMM的目標(biāo)是通過(guò)最大化似然函數(shù)來(lái)估計(jì)模型參數(shù),包括每個(gè)高斯分布的均值、方差和混合系數(shù),以及數(shù)據(jù)點(diǎn)屬于每個(gè)聚類的概率。當(dāng)聚類時(shí),GMM將數(shù)據(jù)點(diǎn)分配到概率最大的聚類中,而不是像K-Means那樣將數(shù)據(jù)點(diǎn)硬性分配到某個(gè)聚類中。GMM在許多應(yīng)用中都表現(xiàn)出色,當(dāng)數(shù)據(jù)點(diǎn)沒(méi)有明顯分離時(shí),可以對(duì)復(fù)雜的多維數(shù)據(jù)進(jìn)行建模。高斯混合模型基于一個(gè)假設(shè):數(shù)據(jù)點(diǎn)x=(x1,x2,...,xn)T服從高斯分布;Xi為d維隨機(jī)變量,則其模型的概率分布如公式(3)所示。

(3)

式中:xi為第i個(gè)觀測(cè)數(shù)據(jù);k為子高斯模型的數(shù)量;ak為觀測(cè)數(shù)據(jù)屬于第k個(gè)子模型的概率;?(x|θ)為第k個(gè)子模型的高斯分布密度函數(shù)。對(duì)于這個(gè)模型來(lái)說(shuō),參數(shù)θ=(μk,αk,σk)也就是子模型的期望、方差(或協(xié)方差)以及在混合模型的概率。然后需要由觀測(cè)數(shù)據(jù)求混合模型中的參數(shù)θ,對(duì)于參數(shù)估計(jì)來(lái)說(shuō),通常使用的就是極大似然(Maximum-likelihood)估計(jì)方法。對(duì)于高斯混合模型來(lái)說(shuō),它的Log-Likelihood 函數(shù)如公式(4)所示。

(4)

通過(guò)公式(4)中最大化對(duì)數(shù)似然函數(shù)來(lái)得到參數(shù)θ的估計(jì)量,由于不知道每個(gè)數(shù)據(jù)觀測(cè)點(diǎn)是屬于哪個(gè)子分布的隱變量的,因此在log中還有求和,對(duì)于每個(gè)子模型都有未知的(μk,ak,σk),無(wú)法直接進(jìn)行求導(dǎo)計(jì)算,需要采用迭代的方法求解,通常使用EM這種迭代計(jì)算的方法。

1.2.2 期望最大算法(EM)

EM算法屬于迭代優(yōu)化策略,其作用是找到概率模型中參數(shù)的最大似然估計(jì),利用Jensen不等式計(jì)算似然函數(shù)的下界(Lower bound),通過(guò)極大化下界得到極大化似然函數(shù)。期望最大算法的每次迭代都有2個(gè)步驟,即E-step(求期望),M-step(求極大)。其具體步驟如下。對(duì)參數(shù)進(jìn)行初始化。

E-step:基于當(dāng)前狀態(tài)的參數(shù)值,確定每條數(shù)據(jù)來(lái)源各子模型的概率值,如公式(5)所示。

(5)

M-step:計(jì)算新一輪迭代的模型參數(shù),如公式(6)~公式(8)所示。

(6)

(7)

(8)

重復(fù)計(jì)算步驟(2)和步驟(3),直至收斂。

式中:xj為第j個(gè)觀測(cè)數(shù)據(jù);?(xj|θk)為第k個(gè)子模型的高斯分布密度函數(shù);θk也就是第k個(gè)子模型的期望、方差(或協(xié)方差)以及在混合模型的概率;rjk為數(shù)據(jù)j來(lái)自子模型k的概率;μk為第k個(gè)高斯分量的期望向量;∑k為第k個(gè)高斯分量的協(xié)方差矩陣;ak為新一輪迭代后的數(shù)據(jù)j來(lái)自子模型k的概率。

EM聚類步驟如下:在E步中根據(jù)給定的觀測(cè)變量與當(dāng)前的參數(shù)估計(jì)值計(jì)算完整數(shù)據(jù)對(duì)數(shù)似然函數(shù)的條件期望值;在M步中根據(jù)E步得到的后驗(yàn)概率,計(jì)算使對(duì)數(shù)似然函數(shù)值最大的參數(shù)估計(jì)量。E步與M步之間交替迭代,當(dāng)公式(8)收斂到某一確切值時(shí)停止迭代,最終每個(gè)樣本的聚類結(jié)果由其后驗(yàn)概率最大值所在的下標(biāo)決定。通過(guò)以上部分獲取高斯混合模型的參數(shù)。雖然EM算法具備收斂性,但是仍然需要通過(guò)初始化幾次不同的參數(shù)進(jìn)行迭代,取結(jié)果最好的那次,保證找到全局最大值,而不是局部最大值。

1.2.3 算法優(yōu)化

根據(jù)上述算法步驟可知,當(dāng)模型在開(kāi)始階段估計(jì)參數(shù)時(shí),初始值非常敏感,設(shè)置不同的初始值導(dǎo)致模型可能產(chǎn)生南轅北轍的估計(jì)結(jié)果,對(duì)EM算法來(lái)說(shuō),需要找到合理的初始化方法。目前,對(duì)于模型的初始化主要是利用其他聚類算法,雖然能夠獲取較優(yōu)異的結(jié)果,但是這種方法進(jìn)行初始化不僅復(fù)雜,而且還會(huì)造成重復(fù)聚類。由于國(guó)家電網(wǎng)用戶是億級(jí),業(yè)務(wù)自身所生產(chǎn)數(shù)據(jù)是上億級(jí)別的量,為了保證系統(tǒng)穩(wěn)定性,減輕算法運(yùn)算壓力,因此本文對(duì)模型初始值選擇進(jìn)行優(yōu)化。這樣避免了選擇初始值時(shí)重復(fù)聚類的問(wèn)題,也減少了模型運(yùn)算負(fù)荷。本文引入三分位數(shù)優(yōu)化初始值,分位數(shù)本質(zhì)上是一種排序方式,它是連續(xù)分布函數(shù)中的一個(gè)點(diǎn),將其劃分為幾個(gè)等份的數(shù)值點(diǎn),在統(tǒng)計(jì)學(xué)研究中會(huì)經(jīng)常使用中位數(shù)、三分位數(shù)等。三分位數(shù)是在某排序的數(shù)列中存在2個(gè)分位點(diǎn),將該數(shù)列劃分為3個(gè)等值部分。假設(shè)將一列數(shù)據(jù)依據(jù)值得大小進(jìn)行排序,三分位數(shù)可以將這列數(shù)據(jù)分割成高、中、低3個(gè)部分。

根據(jù)高斯混合聚類算法,基于EM模型實(shí)施初始化聚類,主要目的是為了獲得初始分類中經(jīng)驗(yàn)知識(shí)占比較高的狀態(tài)。當(dāng)數(shù)據(jù)服從高斯混合分布時(shí),盡量將組成部分的各個(gè)多維高斯分布進(jìn)行比較明顯的區(qū)分。當(dāng)基于高斯混合聚類算法結(jié)合EM算法開(kāi)始聚類過(guò)程時(shí),其步驟明細(xì)如下。

假設(shè)聚類的對(duì)象是一個(gè)n×p的數(shù)據(jù)樣本,n為樣本的數(shù)據(jù)個(gè)數(shù),p為樣本的維度。

步驟一:首先,對(duì)數(shù)據(jù)樣本的第一列進(jìn)行值排序,其次,計(jì)算該列的三分位數(shù),根據(jù)分位數(shù)C1和C2的將其劃分為3個(gè)等值部分,為3個(gè)初始的分類。對(duì)數(shù)據(jù)樣本中第2,3,…,p列的值進(jìn)行上述過(guò)程,結(jié)合三分位數(shù)法確定剩下的p-1個(gè)初始分類方式。

步驟二:依次計(jì)算p個(gè)初始分類方式的參數(shù)θ,然后計(jì)算每個(gè)初始分類方式中各類別的中心距離dj(j = 1,2,3,…,p),dj為馬氏距離,然后確定dj中最大值,則其為對(duì)應(yīng)的初始分類,同時(shí)該分類方式下的參數(shù)θ={ω1,ω2,...,ωk,μ1,μ2,...,μk,∑1,∑2,...,∑k},作為EM算法聚類的初始值。

2 輿情群體性事件的識(shí)別

首先,本試驗(yàn)利用爬蟲(chóng)抓取95598數(shù)據(jù)分析平臺(tái)的工單數(shù)據(jù),其次,對(duì)訓(xùn)練的文本數(shù)據(jù)集進(jìn)行分詞處理,同時(shí)考慮到具體使用場(chǎng)景對(duì)部分停用詞或者語(yǔ)句進(jìn)行剔除,減少數(shù)據(jù)文本的干擾信息。最后,輿情數(shù)據(jù)文本數(shù)據(jù)處理后,再引入評(píng)價(jià)指標(biāo)衡量最佳主題數(shù),在統(tǒng)計(jì)學(xué)中,常用困惑度來(lái)評(píng)價(jià)LDA模型的性能優(yōu)劣,如公式(9)所示。

(9)

式中:p(w)為每個(gè)詞在文本中出現(xiàn)的概率;N為文本中所有詞的集合。如果困惑度過(guò)小,就說(shuō)明模型對(duì)未見(jiàn)過(guò)的數(shù)據(jù)的預(yù)測(cè)能力強(qiáng),反之表明模型對(duì)未見(jiàn)過(guò)的數(shù)據(jù)的預(yù)測(cè)能力較弱。

本文使用LDA主題模型,模型服從狄利克雷分布,LDA主題模型中的“文檔-主題”和“主題-詞項(xiàng)”的概率分布,即q和j的值。首先,得到q和j的先驗(yàn)分布,其分別有一個(gè)狄利克雷的先驗(yàn)分布,其超參數(shù)分別為a和b。然后,采用Gibbs抽樣法進(jìn)行推斷,推斷出q分布,最后,用LDA主題模型中的“文檔-主題”的概率分布q作為每篇網(wǎng)絡(luò)群體性事件文檔的向量,建立向量空間。LDA主題模型求解包括以下3個(gè)過(guò)程。1)以a為先驗(yàn)超參數(shù),對(duì)每個(gè)文檔初始化“文檔-主題”的概率分布q。2)以b為先驗(yàn)超參數(shù),對(duì)每個(gè)主題初始化“主題-詞項(xiàng)\"的概率分布j。3)輿情文本d中的每個(gè)詞項(xiàng),從該文本的q分布中抽取一個(gè)主題;再?gòu)脑撝黝}的j分布中抽取一個(gè)詞項(xiàng)。經(jīng)過(guò)Nd(Nd表示輿情文本d中的所有詞的集合)重復(fù)抽取,獲取最終輿情文本d。

首先,通過(guò)網(wǎng)格搜索法參數(shù)尋優(yōu)確定最佳主題數(shù)T=50,在曲線的最低拐點(diǎn)附近抽取主題效果最佳。其次,采用高斯混合聚類算法進(jìn)行文本主題聚類,其步驟包括以下5個(gè)。1)采用三份位數(shù)法對(duì)參數(shù)進(jìn)行初始化。2)E-step?;谶x取的參數(shù),確定數(shù)據(jù)集中的每個(gè)j來(lái)源于子模型k的概率。3)M-step。計(jì)算新一輪迭代的模型參數(shù)。4)重復(fù)計(jì)算步驟2)和步驟3),直至收斂。5)利用蘭德指數(shù)(Rand index,RI)評(píng)價(jià)聚類效果,RI取值范圍為[0,1],值的大小能夠直接表明聚類結(jié)果與實(shí)際情況是否一致,值越大,聚類效果越好。當(dāng)試驗(yàn)中聚類個(gè)數(shù)為6時(shí),聚合效果最好(見(jiàn)表1)。

3 結(jié)語(yǔ)

由于高斯聚類算法具有收斂速度快、可以處理非常復(fù)雜的數(shù)據(jù)分布等優(yōu)點(diǎn),因此其在文本聚類的數(shù)據(jù)挖掘中有優(yōu)異的表現(xiàn)。同時(shí)發(fā)現(xiàn)高斯聚類需要預(yù)設(shè)聚類個(gè)數(shù),且其對(duì)于初始值的敏感性較大,不同的初始化方法會(huì)得到不同的聚類結(jié)果。本文結(jié)合95598工單數(shù)據(jù),為了提高網(wǎng)絡(luò)群體性事件識(shí)別結(jié)果的準(zhǔn)確性,結(jié)合LDA主題模型確定初始化主題,然后再利用高斯混合聚類模型完成主題事件聚類。當(dāng)聚類模型估計(jì)參數(shù)時(shí),針對(duì)初始值敏感造成估計(jì)結(jié)果偏差的缺陷引入三分位數(shù)法優(yōu)化初始值,避免了初始值選擇時(shí)重復(fù)聚類的問(wèn)題,也減少了模型運(yùn)算負(fù)荷。采用上述方法減少迭代步驟,提高抗噪聲的能力,提高群體性事件聚類準(zhǔn)確率。目前,95598輿情監(jiān)測(cè)機(jī)制是一個(gè)非常重要的輿情監(jiān)測(cè)工具,及時(shí)發(fā)現(xiàn)潛在的危機(jī),提高公眾形象和公眾信任度。在后續(xù)研究中通過(guò)引入結(jié)果判別方法,使主題分類的結(jié)果更符合實(shí)際情況。

參考文獻(xiàn)

[1]MACLENNAN B, KYPRI K, LANGLEY J, et al.public sentiment

towards alcohol and local government alcohol policies in New Zealand[J].

International Journal of Drug Policy,2014,23(1):45-53.

[2]張君第.基于自然語(yǔ)言處理與智能語(yǔ)義識(shí)別的輿情監(jiān)測(cè)預(yù)警模型研究[J].電子設(shè)計(jì)工程,2022,30(17):165-169.

[3]秦洋,鄭楠昱.基于大數(shù)據(jù)的熱點(diǎn)話題輿情分析系統(tǒng)設(shè)計(jì)[J].無(wú)線互聯(lián)科技,2022,19(2):49-50.

[4]趙明輝,張玲玲.基于網(wǎng)絡(luò)評(píng)論文本挖掘的技術(shù)預(yù)見(jiàn)方法研究[J].科技管理研究,2022,42(16):176-181.

[5]陳謙,徐興梅,陳帥.基于文本挖掘的多用戶投訴數(shù)據(jù)流聚類算法[J].計(jì)算機(jī)仿真,2022,39(5):423-426.

[6]周忠寶,朱文靜,王皓,等.基于彈幕文本挖掘的社交媒體 KOL 研究[J].計(jì)算機(jī)工程與科學(xué),2022,44(3):521-529.

[7]田水承,黃權(quán).基于文本挖掘的煤礦瓦斯事故致因分析[J].煤礦安全,2022,53(5):241-245.

[8]林麗麗,馬秀峰.基于LDA模型的國(guó)內(nèi)圖書(shū)情報(bào)學(xué)研究主題發(fā)現(xiàn)及演化分析[J].情報(bào)科學(xué),2019,37(12):87-92.

猜你喜歡
群體性事件
西部民族地區(qū)城鎮(zhèn)化群體性事件中非正式制度因子分析及化解路徑
高校群體性事件預(yù)警機(jī)制研究
基層政府應(yīng)對(duì)群體性事件的調(diào)查分析研究
西部民族地區(qū)非制度性政治參與研究
新常態(tài)下應(yīng)對(duì)和處置群體性事件的對(duì)策思考
中文信息(2016年10期)2016-12-12 14:34:16
涉警網(wǎng)絡(luò)輿情危機(jī)與群體性事件
高校學(xué)生常見(jiàn)突發(fā)事件情況分析
科技資訊(2016年19期)2016-11-15 10:20:38
淺析征地拆遷群體性事件的成因、特點(diǎn)及管控
群體性事件的成因及對(duì)策研究
商(2016年15期)2016-06-17 15:05:01
警察處置群體性事件中存在問(wèn)題探討
科技視界(2016年11期)2016-05-23 08:11:07
唐山市| 松溪县| 赤城县| 托克托县| 五大连池市| 南京市| 故城县| 卓尼县| 鄂尔多斯市| 鄢陵县| 新泰市| 邵阳市| 宣武区| 德阳市| 襄城县| 徐水县| 印江| 当涂县| 舟曲县| 景宁| 阳原县| 平乡县| 博野县| 大港区| 松潘县| 老河口市| 罗源县| 东明县| 朝阳市| 尼玛县| 饶河县| 涿州市| 蕲春县| 伊通| 政和县| 元朗区| 五常市| 宾阳县| 高台县| 库车县| 宁城县|