国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

<th id="gcqka"><menu id="gcqka"></menu></th>

?

一種融合雙向LSTM和CNN的混合情感分析模型*

2021-11-09 11:53趙星宇范雙南鄧永和

湘潭大學(xué)自然科學(xué)學(xué)報(bào) 2021年4期

關(guān)鍵詞：雙向卷積向量

趙星宇，何浩，范雙南，鄧永和

(1.中南大學(xué) 湘雅護(hù)理學(xué)院，湖南長(zhǎng)沙 410013；2.湘潭大學(xué) 計(jì)算機(jī)學(xué)院·網(wǎng)絡(luò)空間安全學(xué)院，湖南湘潭 411105；3. 湖南交通工程學(xué)院電氣與信息工程學(xué)院，湖南衡陽(yáng) 421009；4.湖南工程學(xué)院計(jì)算科學(xué)與電子學(xué)院，湖南湘潭 411104)

0 引言

人們的生活越來(lái)越多地在互聯(lián)網(wǎng)上進(jìn)行，在COVID-19大流行期間，人們對(duì)社交的需求加劇了這一趨勢(shì).人們更頻繁地使用微博、知乎和淘寶等在線評(píng)論平臺(tái)，通過(guò)了解這些平臺(tái)上產(chǎn)生的情感內(nèi)容類型可以提高業(yè)務(wù)洞察力并提供個(gè)性化的建議.為此，情感分析技術(shù)被應(yīng)用于理解微博、在線評(píng)論(如電影和餐廳評(píng)論)、知識(shí)問(wèn)答和其他在線社交媒體上產(chǎn)生的情感內(nèi)容.

在信息、互聯(lián)網(wǎng)和社交媒體時(shí)代，人們收集和分析情感的需求越來(lái)越強(qiáng)烈.隨著網(wǎng)上海量的數(shù)據(jù)和話題的增加，一個(gè)模型可以在任何時(shí)刻收集和跟蹤成千上萬(wàn)個(gè)話題的民意信息.然后，這些數(shù)據(jù)可以用于商業(yè)、經(jīng)濟(jì)甚至政治目的，這使得情感分析成為一個(gè)極其重要的反饋機(jī)制.

目前對(duì)于情感分析的研究主要從三個(gè)方面開展：基于情感詞匯語(yǔ)義特性的方法、基于統(tǒng)計(jì)自然語(yǔ)言處理的方法和基于神經(jīng)網(wǎng)絡(luò)技術(shù)的方法.

首先是基于情感詞匯語(yǔ)義特性的方法，情感傾向主要是由情感語(yǔ)義詞典確定的.情感語(yǔ)義詞典是指人工構(gòu)造標(biāo)注有情感傾向的詞典[1].王鐵套等[2]利用網(wǎng)絡(luò)輿情評(píng)論數(shù)據(jù)，結(jié)合語(yǔ)義模式和詞匯情感傾向，形成了一種判定算法.

其次是基于統(tǒng)計(jì)自然語(yǔ)言處理的方法，通過(guò)支持向量機(jī)、貝葉斯分類器和神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法對(duì)自然語(yǔ)言進(jìn)行建模.通過(guò)大量的數(shù)據(jù)訓(xùn)練文本的情感特性，并將訓(xùn)練好的模型對(duì)情感特征進(jìn)行識(shí)別和分類.首次將機(jī)器學(xué)習(xí)方法應(yīng)用于自然語(yǔ)言處理領(lǐng)域，分別用支持向量機(jī)(SVM)、貝葉斯分類器和最大熵等模型對(duì)電影影評(píng)數(shù)據(jù)進(jìn)行分類.在分類的結(jié)果中，SVM模型識(shí)別率為82.9%，獲得了最好的實(shí)驗(yàn)效果.

第三是基于神經(jīng)網(wǎng)絡(luò)技術(shù)的方法，是將情感分類視作一種多分類問(wèn)題，該方法能夠處理大規(guī)模的數(shù)據(jù)，并擁有較好的效果，廣泛應(yīng)用于自然語(yǔ)言處理領(lǐng)域.Socher[3]提出Matrix-Vector循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型，這種優(yōu)化后的模型不僅使用詞向量組合句向量的能力，而且通過(guò)添加矩陣對(duì)核心詞的組合詞進(jìn)行記錄和修改.Tai[4]在RNN文本分類模型基礎(chǔ)上進(jìn)一步提出長(zhǎng)短期記憶(LSTM)文本情感分類模型，LSTM通過(guò)門機(jī)制解決了RNN所不能解決的長(zhǎng)期依賴問(wèn)題，因而更加符合文本理解的要求，但是LSTM和RNN模型只具有前向信息記憶能力而不能對(duì)前后向序列信息進(jìn)行記憶，故Brueckner[5]提出了雙向LSTM模型，該模型在LSTM模型上增加了反向?qū)樱沟肔STM能夠同時(shí)考慮上下文信息，對(duì)反向序列信息進(jìn)行記憶，獲得雙向無(wú)損的文本信息.Cao等[6]利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型提取的特征用SVM模型進(jìn)行分類，將機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型相結(jié)合，取得了不錯(cuò)的效果，但情感分析工作中，每個(gè)詞對(duì)整體情感傾向的影響是不同的.Qian等[7]雖然使用了注意力機(jī)制，但是沒(méi)有直接從文本中挖掘重要的信息.最近基于Transformer技術(shù)路線的BERT等預(yù)訓(xùn)練語(yǔ)言模型被廣泛應(yīng)用于提取文本特征，逐漸用于情感分析中.Shi[8]提出了Transformer的魯棒性驗(yàn)證方法，分析了情感分析中不同詞的重要性.

以上文本情感分析方法各有優(yōu)勢(shì)，相比而言，基于情感詞匯語(yǔ)義特性的識(shí)別方法使用情感詞典統(tǒng)計(jì)帶有情感標(biāo)注的短語(yǔ)計(jì)算情感得分，提高了文本情感分析的準(zhǔn)確度.但文本情感分析的準(zhǔn)確率和情感詞典規(guī)模的關(guān)聯(lián)度較大，實(shí)時(shí)性不強(qiáng).基于統(tǒng)計(jì)自然語(yǔ)言處理的方法使用人工標(biāo)注的方式構(gòu)造結(jié)構(gòu)化的文本特征，可以有效地提高文本情感分析的準(zhǔn)確率; 但由于需要較多的人工構(gòu)造特征，實(shí)時(shí)性仍然不強(qiáng).基于神經(jīng)網(wǎng)絡(luò)的方法可以從向量化的文本詞匯中自動(dòng)提取語(yǔ)義特征，不依賴人工構(gòu)造的特征; 但是，使用單一的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行特征提取，不能同時(shí)提取文本上下文信息和局部語(yǔ)義特征.

綜上，針對(duì)現(xiàn)有文本情感分析方法實(shí)時(shí)性不強(qiáng)、難以應(yīng)用到大規(guī)模文本、不能同時(shí)提取文本上下文信息和局部語(yǔ)義特征等問(wèn)題，提出一種融合雙向LSTM和CNN的混合情感分析模型.通過(guò)雙向LSTM和CNN模型對(duì)文本詞向量進(jìn)行訓(xùn)練，運(yùn)用注意力機(jī)制將雙向LSTM模型學(xué)習(xí)到的特征作用于CNN模型上，對(duì)其進(jìn)行特征加權(quán)，最后將雙向LSTM模型和CNN模型得到的結(jié)果進(jìn)行拼接，由softmax分類器得到相應(yīng)的情感分類結(jié)果.

1 BiLSTM-CNN混合情感分析模型

基于BiLSTM-CNN的混合情感分析模型主要分為文本詞匯向量化、特征提取、情感分類等三個(gè)步驟.文本詞匯的向量化首先對(duì)輸入的中文文本進(jìn)行分詞處理，然后利用word2vec模型將文本詞匯轉(zhuǎn)化成含有語(yǔ)義信息的實(shí)數(shù)詞向量.特征提取使用BiLSTM-CNN混合模型，細(xì)分為BiLSTM提取文本的上下文信息和CNN提取局部語(yǔ)義特征.情感分類通過(guò)使用softmax分類器得到不同情感傾向的分類.最后，使用十折交叉驗(yàn)證方法對(duì)基于BiLSTM-CNN的混合模型進(jìn)行訓(xùn)練以及性能評(píng)估.融合雙向LSTM和CNN的混合情感分析模型如圖1所示.

圖1 融合雙向LSTM和CNN的混合情感分析模型Fig.1 Mixed sentiment analysis model combining bidirectional LSTM and CNN

1.1 詞向量表示

2013年Google公司發(fā)布了word2vec深度學(xué)習(xí)框架，它能夠?qū)⒄Z(yǔ)料庫(kù)中詞語(yǔ)以詞向量的形式表示，獲取詞與詞之間的語(yǔ)義相關(guān)性，為神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型在各個(gè)領(lǐng)域的廣泛應(yīng)用提供了更為有效的方法.使用word2vec將文本中每個(gè)詞映射出詞向量的形式，這些詞向量組成了一個(gè)詞向量矩陣M∈Rd.在用詞向量對(duì)文本進(jìn)行表示時(shí)，用wt表示文本的第t個(gè)詞，其中wt∈Rd，則M可表示為

M={w1,w2,w3,…,wn}∈Rn*d,

(1)

式中：n表示詞向量的個(gè)數(shù)；d表示詞向量的維度.

將文本轉(zhuǎn)換為詞向量之后，可作為雙向LSTM模型和CNN模型的輸入.

1.2 雙向LSTM模型

盡管LSTM模型能夠較好地解決RNN模型的梯度消失(gradient Vanishing)和歷史信息損失等問(wèn)題，能夠獲取前文的信息，但該模型缺乏對(duì)下文的信息融合.為此，當(dāng)文本比較復(fù)雜時(shí)，單向的LSTM模型對(duì)詞向量的特征提取不夠全面，而引入雙向的LSTM模型能夠較好地獲取上下文的信息，獲取更豐富的文本特征.

(2)

(3)

1.3 基于注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)模型

卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)合注意力機(jī)制，在訓(xùn)練過(guò)程中以不同的權(quán)重來(lái)關(guān)注目標(biāo)，可以學(xué)習(xí)到文本更多的隱藏信息，從而更好地識(shí)別不同的情感立場(chǎng).傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型一般由一個(gè)或多個(gè)池化層組成.常用的池化層如平均池化層和最大池化層存在一定的缺陷：平均池化層對(duì)通道領(lǐng)域的特征求平均，丟失了特征的強(qiáng)度信息；最大池化層對(duì)通道領(lǐng)域的特征求最大值，丟失了特征的時(shí)序信息和特征強(qiáng)度信息.針對(duì)卷積神經(jīng)網(wǎng)絡(luò)池化層使用注意力機(jī)制，有利于緩解傳統(tǒng)池化層的缺陷.

1.3.1 輸入層使用NLPCC-SCDL評(píng)測(cè)任務(wù)的數(shù)據(jù)集，對(duì)其中的文本進(jìn)行預(yù)處理，并將處理后的文本使用word2vec轉(zhuǎn)化為文本詞匯的詞向量，作為卷積神經(jīng)網(wǎng)絡(luò)模型的輸入.設(shè)定卷積神經(jīng)網(wǎng)絡(luò)模型的輸入為HCNN={〈T〉}，表達(dá)式為式(4)，其中T={x1,x2,x3,…,xn}表示詞向量集合.

(4)

式中：HCNN∈Rn*d(n表示n個(gè)詞向量，d表示每個(gè)詞向量的維度為d).

2.3.2 卷積層獲取到HCNN輸入之后，選取2r個(gè)m×d大小的卷積核，步長(zhǎng)為1，采用“same”模式，對(duì)其進(jìn)行卷積操作.例如，一個(gè)特征Yi可由窗口hi:i+m-1產(chǎn)生，見(jiàn)式(5)

Yi=f(w×hi:i+m-1+b),

(5)

式中：f表示RELU激活函數(shù)，RELU能使模型較快地達(dá)到收斂的狀態(tài)；w表示權(quán)重項(xiàng)；b表示偏置項(xiàng)；hi:i+m-1表示HCNN矩陣的第i行到第i+m-1行的特征.最終形成一個(gè)m×T維的特征矩陣S∈Rm*2r，如式(6)，其中si∈R1*2r.

S=[s0,s1,…,sm]T.

(6)

2.3.3 注意力機(jī)制為了增強(qiáng)模型的表達(dá)能力，更好地捕捉文本中的有效信息，抓住語(yǔ)義的重點(diǎn)，采用注意力機(jī)制，在訓(xùn)練過(guò)程中讓模型關(guān)注部分重要的信息.雙向LSTM模型能很好地保留歷史和未來(lái)的時(shí)序信息.而相對(duì)于LSTM模型來(lái)說(shuō)，CNN模型可以更好地保留文本的局部上下文信息.所以本文通過(guò)計(jì)算雙向LSTM模型提取特征和CNN提取特征的余弦值，來(lái)確定局部特征對(duì)整體特征的重要程度.將雙向LSTM模型得到的詞向量特征Qt∈Rl*2r和卷積層神經(jīng)網(wǎng)絡(luò)得到的詞向量特征si∈R1*2r進(jìn)行余弦運(yùn)算，并用softmax函數(shù)對(duì)其歸一化，可得到注意力權(quán)重值，見(jiàn)式(7).

αi=softmax(cos(Qt,si)).

(7)

將注意力權(quán)重值α∈Rm對(duì)卷積特征矩陣S∈Rm*2r進(jìn)行加權(quán).通過(guò)引入注意力機(jī)制，來(lái)計(jì)算文本的重要程度，進(jìn)而有選擇性地保留有用的特征,見(jiàn)式(8).

(8)

2.3.4 分類器將雙向LSTM模型得到的詞向量特征和卷積層得到的詞向量特征進(jìn)行連接，作為softmax分類器的輸入，如式(9).

inputclassify=[Q,S′].

(9)

輸入每一類的概率值p,見(jiàn)式(10).

(10)

式中：Wclassify為權(quán)重系數(shù)；bclassify為偏置系數(shù).

2.3.5 模型訓(xùn)練采用端對(duì)端的模型訓(xùn)練方法，損失函數(shù)用來(lái)描述模型對(duì)問(wèn)題分類的精度.損失函數(shù)越小，代表模型的分類結(jié)果與真實(shí)數(shù)據(jù)的偏差越小.使用Cross-entropy作為損失函數(shù)，該損失函數(shù)最早出現(xiàn)在信息論里面，廣泛應(yīng)用于多分類問(wèn)題、通信、糾錯(cuò)碼和博弈論等領(lǐng)域.同時(shí)在損失函數(shù)中，加入L2正則化項(xiàng)，來(lái)防止過(guò)擬合的情況，最終的損失函數(shù)的表達(dá)式見(jiàn)式(11).

(11)

3 實(shí)驗(yàn)與分析

3.1 實(shí)驗(yàn)數(shù)據(jù)

采用NLPCC2014深度學(xué)習(xí)技術(shù)情感分類任務(wù)(NLPCC-SCDL)的數(shù)據(jù)集來(lái)評(píng)估所提出的組合式情感分類模型.NLPCC-SCDL任務(wù)被設(shè)計(jì)用來(lái)評(píng)估，旨在評(píng)估基于深度學(xué)習(xí)的情感分析模型.該數(shù)據(jù)集包括中文和英文的產(chǎn)品評(píng)論(簡(jiǎn)稱中方和英方). 該數(shù)據(jù)集包括來(lái)自多個(gè)領(lǐng)域的中文和英文產(chǎn)品評(píng)論(分別為中文和英文)，包括書籍、DVD和電子產(chǎn)品.數(shù)據(jù)集約定的立場(chǎng)類別分為支持(Positive)和反對(duì)(Negative)兩種立場(chǎng)，其中訓(xùn)練集5 000條，測(cè)試集1 250條(如表1所示).使用中文分詞庫(kù)jieba進(jìn)行分詞處理，采用哈爾濱工業(yè)大學(xué)停用詞表去除停用詞.

表1 NLPCC-SCDL數(shù)據(jù)

3.2 評(píng)價(jià)標(biāo)準(zhǔn)

數(shù)據(jù)分類的評(píng)價(jià)標(biāo)準(zhǔn)主要為精準(zhǔn)率P(Precison)、召回率R(Recall)和F1(F1-Measure),見(jiàn)式(12)，準(zhǔn)確率(Accuracy)見(jiàn)式(13).

(12)

(13)

式中：TP表示正確分類中積極立場(chǎng)的數(shù)量；FP表示錯(cuò)誤分類中積極立場(chǎng)的數(shù)量；TN表示正確分類中消極立場(chǎng)的數(shù)據(jù)；FN表示錯(cuò)誤分類中消極立場(chǎng)的數(shù)量.

3.3 參數(shù)設(shè)置

實(shí)驗(yàn)中所涉及的權(quán)重參數(shù)W和偏置參數(shù)b，采用隨機(jī)初始化的方式進(jìn)行初始化，詞向量的維度設(shè)置為200，實(shí)驗(yàn)過(guò)程中的參數(shù)設(shè)計(jì)如表2所示.

表2 模型參數(shù)設(shè)置

3.4 實(shí)驗(yàn)結(jié)果

為了驗(yàn)證融合注意力機(jī)制的雙向LSTM和CNN的混合情感分析模型ATT-BLSTM-CNN方法的有效性，與以下4種方法在中文和英文數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn)，具體實(shí)驗(yàn)數(shù)據(jù)如表3、4所示.

表3 不同模型的中文數(shù)據(jù)集實(shí)驗(yàn)數(shù)據(jù)對(duì)比

表4 不同模型的英文數(shù)據(jù)集實(shí)驗(yàn)數(shù)據(jù)對(duì)比

表中NLPCNN-SCDL-best表示NLPCC-SCDL評(píng)測(cè)任務(wù)中分類效果最好的模型；CNN表示基于卷積神經(jīng)網(wǎng)絡(luò)的文本情感分類模型；CNN-SVM是Cao等[6]提出的結(jié)合卷積神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)的分類模型；BLSTM-CNN表示使用雙向的LSTM和CNN混合模型，但不使用注意力機(jī)制.

實(shí)驗(yàn)結(jié)果表明，無(wú)論是在中文數(shù)據(jù)集，還是在英文數(shù)據(jù)集上，融合注意力機(jī)制的雙向LSTM和CNN的混合情感分析模型ATT-BLSTM-CNN方法都高于NLPCNN-SCDL評(píng)測(cè)任務(wù)中性能最佳的模型.相比于NLPCNN-SCDL-best模型，在中文數(shù)據(jù)集和英文數(shù)據(jù)集上準(zhǔn)確率分別提高了7.3%和9.2%，相比基于卷積神經(jīng)網(wǎng)絡(luò)的文本情感分類模型(CNN)，在中文數(shù)據(jù)集和英文數(shù)據(jù)集上準(zhǔn)確率也分別提高了1.5%和4.1%，這說(shuō)明融合注意力機(jī)制的雙向LSTM和CNN的混合情感分析模型合理有效，它使得分類的性能大幅度提高.相比于NLPCNN-SCDL-best模型，CNN模型在識(shí)別率上有一定的提高，CNN模型能獲取更加豐富的局部特征.引入注意力機(jī)制，通過(guò)不同的權(quán)重來(lái)關(guān)注目標(biāo)，可以學(xué)習(xí)到文本更多隱藏信息，從而更好地識(shí)別不同的情感立場(chǎng).

4 結(jié)論

卷積神經(jīng)網(wǎng)絡(luò)有助于學(xué)習(xí)如何從數(shù)據(jù)中提取特征.然而，它也需要許多卷積層來(lái)捕捉長(zhǎng)期的依賴性，隨著神經(jīng)網(wǎng)絡(luò)中輸入序列長(zhǎng)度的增加，捕捉依賴性變得更差.基本上，它會(huì)導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)的層數(shù)非常深.LSTM模型能夠捕捉詞序列之間的長(zhǎng)期依賴性.在本研究中，我們提出了一種用于情感分析的融合雙向LSTM-CNN模型.本研究提出的融合雙向LSTM-CNN模型在NLPCC-SCDL數(shù)據(jù)集上表現(xiàn)得比較好，與單一CNN和LSTM模型相比，準(zhǔn)確率較高.與傳統(tǒng)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型相比，提出的融合雙向LSTM-CNN模型的準(zhǔn)確率達(dá)到了88%.

猜你喜歡

雙向卷積向量

雙向度的成長(zhǎng)與自我實(shí)現(xiàn)

出版人(2022年11期)2022-11-15

向量的分解

新高考·高一數(shù)學(xué)(2022年3期)2022-04-28

基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)

北京航空航天大學(xué)學(xué)報(bào)(2021年9期)2021-11-02

聚焦“向量與三角”創(chuàng)新題

中學(xué)生數(shù)理化(高中版.高考數(shù)學(xué))(2021年1期)2021-03-19

從濾波器理解卷積

電子制作(2019年11期)2019-07-04

基于傅里葉域卷積表示的目標(biāo)跟蹤算法

北京航空航天大學(xué)學(xué)報(bào)(2018年1期)2018-04-20

向量垂直在解析幾何中的應(yīng)用

高中生學(xué)習(xí)·高三版(2016年9期)2016-05-14

一種軟開關(guān)的交錯(cuò)并聯(lián)Buck/Boost雙向DC/DC變換器

通信電源技術(shù)(2016年5期)2016-03-22

向量五種“變身” 玩轉(zhuǎn)圓錐曲線

新高考·高二數(shù)學(xué)(2015年11期)2015-12-23

一種工作頻率可變的雙向DC-DC變換器

電源技術(shù)(2015年9期)2015-06-05

湘潭大學(xué)自然科學(xué)學(xué)報(bào)2021年4期

湘潭大學(xué)自然科學(xué)學(xué)報(bào)的其它文章: 袖帶-組織-動(dòng)脈系統(tǒng)的數(shù)值和理論求解*; 微乳液耦合微波輻照制備β-半水硫酸鈣*; 碳包覆合金/過(guò)氧化氫非均相Fenton體系高效礦化全氟辛酸*; 基于刀位文件的空間復(fù)雜曲面機(jī)器人加工技術(shù)研究*; 基于部件模型的電氣設(shè)備參數(shù)動(dòng)態(tài)測(cè)量算法研究*; 礦井通風(fēng)系統(tǒng)優(yōu)化改造研究*

<center id="euuy6"></center>

<strike id="euuy6"><abbr id="euuy6"></abbr></strike>