国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進(jìn)CNN的文本情感分析

2021-11-04 10:09楊會(huì)成徐姝琪
關(guān)鍵詞:卷積向量神經(jīng)網(wǎng)絡(luò)

何 野,楊會(huì)成,潘 玥,徐姝琪

(安徽工程大學(xué) 電氣工程學(xué)院,安徽 蕪湖 241004)

0 引言

隨著電子產(chǎn)品及互聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步與革新,包含人們情感評(píng)論的大量文本信息已經(jīng)出現(xiàn)在網(wǎng)絡(luò)平臺(tái)上.在自然語(yǔ)言處理(NLP)領(lǐng)域中,尋找一種有效的數(shù)據(jù)挖掘和分析方法是一項(xiàng)非常重要的研究,這被稱為文本情感分析[1].文本情感分析主要包括文本分類、信息提取和文本生成技術(shù),情感分析是一個(gè)過(guò)程,用于識(shí)別和分類意見(jiàn)、觀點(diǎn)(從文本到特定主題或產(chǎn)品).這些評(píng)估可以是正面、負(fù)面或中立的.分析可以在文檔級(jí)別、句子級(jí)別或單詞級(jí)別執(zhí)行.目前,基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的情感分析在各種應(yīng)用中都取得了良好的效果.然而,機(jī)器學(xué)習(xí)方法中使用的函數(shù)非常簡(jiǎn)單,這可能導(dǎo)致它們?cè)谔幚韽?fù)雜分類問(wèn)題時(shí)對(duì)新的模型的適應(yīng)能力較差,并且在樣本和計(jì)算單位比較少的情況下,表達(dá)復(fù)雜函數(shù)的能力在一定程度上受到限制.

歷年來(lái),情感分類方法發(fā)生了許多變化,最早是基于初始情感詞典的方法, Bengio等[2]最早使用神經(jīng)網(wǎng)絡(luò)構(gòu)建語(yǔ)言模型.Mikolov等[3-4]于2013 年提出了 Word2Vec 技術(shù),推動(dòng)了詞向量的快速發(fā)展.然后再到機(jī)器學(xué)習(xí)方法,例如支持向量機(jī)(SVM)[5]、樸素貝葉斯(NB)、決策樹、邏輯回歸等.盡管某些機(jī)器學(xué)習(xí)方法可以在某些任務(wù)上取得良好的結(jié)果,但是由于特征工程的復(fù)雜性,這些方法的效果非常依賴于特征表示,并且難以獲得可接受的分類結(jié)果.隨著人們對(duì)深度學(xué)習(xí)算法的進(jìn)一步研究與認(rèn)識(shí),許多深度學(xué)習(xí)方法被應(yīng)用于情感分類任務(wù).與機(jī)器學(xué)習(xí)方法相比,深度學(xué)習(xí)則更加側(cè)重于取代人工使用自動(dòng)提取語(yǔ)料特征的方式,這樣可以使文本的特征更加廣泛和豐富.但是,深度學(xué)習(xí)模型的魯棒性和泛化能力在很大程度上取決于訓(xùn)練階段可用的數(shù)據(jù)量,而基于機(jī)器學(xué)習(xí)的分類系統(tǒng)的性能則主要取決于語(yǔ)料庫(kù)中的標(biāo)記訓(xùn)練及其有效特征的選擇.

卷積神經(jīng)網(wǎng)絡(luò)[6](CNN)和遞歸神經(jīng)網(wǎng)絡(luò)是兩個(gè)廣泛使用的用于情感表達(dá)的深度學(xué)習(xí)模型.Yann LeCun在1998年提出的CNN具有很強(qiáng)的適應(yīng)性,并且非常善于從文本中提取局部特征.由于其獨(dú)特的權(quán)重共享結(jié)構(gòu),它可以顯著降低計(jì)算復(fù)雜度以及訓(xùn)練參數(shù)的數(shù)量.對(duì)于句子建模,Kalchbrenner等人提出了動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò),它能夠獲得短時(shí)和長(zhǎng)時(shí)關(guān)系.作為另一個(gè)流行的網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò)[7](RNN)可以處理序列數(shù)據(jù)并了解長(zhǎng)期依賴性.RNN將當(dāng)前輸出和網(wǎng)絡(luò)的上一級(jí)輸出聯(lián)系在一起,這意味著當(dāng)前隱藏層的輸入不僅包括輸入層的輸出,而且還包括先前隱藏層的輸出.當(dāng)RNN學(xué)習(xí)到對(duì)信息的長(zhǎng)期依賴時(shí),它將產(chǎn)生梯度衰減或爆炸.為了解決這個(gè)問(wèn)題,研究人員提出了一種LSTM[8]單元,其中包含一個(gè)可以長(zhǎng)時(shí)間保持狀態(tài)的存儲(chǔ)單元,這樣可以確保結(jié)構(gòu)更準(zhǔn)確地提取情感信息.筆者在研究CNN和LSTM的基礎(chǔ)上,將這兩種框架的部分結(jié)構(gòu)結(jié)合在一起,CNN僅提取本地特征,而LSTM是一種網(wǎng)絡(luò)類型,其網(wǎng)絡(luò)內(nèi)存可以記住輸入中的先前數(shù)據(jù),并根據(jù)該知識(shí)做出決策.因此,LSTM更適合直接輸入文本,因?yàn)榫渥又械拿總€(gè)單詞都具有基于周圍單詞的含義.充分利用了它們各自的優(yōu)勢(shì),彌補(bǔ)了單個(gè)網(wǎng)絡(luò)框架的缺陷,并通過(guò)實(shí)驗(yàn)證明了該網(wǎng)絡(luò)模型對(duì)提高文本情感分析具有較為高效的作用.

1 相關(guān)技術(shù)與概念

1.1 CNN模型

CNN是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network)的簡(jiǎn)稱,它本質(zhì)上是一個(gè)多層感知機(jī).該模型主要由3個(gè)部分構(gòu)成:卷積層、池化層和全連接層(輸出層).結(jié)構(gòu)如圖1所示.

圖1 CNN模型結(jié)構(gòu)

它是一個(gè)具有多個(gè)隱層的人工神經(jīng)網(wǎng)絡(luò).卷積和池化是網(wǎng)絡(luò)中的最關(guān)鍵的操作,也是網(wǎng)絡(luò)進(jìn)行局部和全局特征提取的主要方式.CNN采用梯度下降法,通常都能夠得到最優(yōu)解,經(jīng)過(guò)多次的訓(xùn)練調(diào)整提高網(wǎng)絡(luò)的參數(shù)的合理性.

1.2 長(zhǎng)短時(shí)記憶LSTM模型

在處理時(shí)間序列問(wèn)題上,無(wú)論是分類還是預(yù)測(cè)的問(wèn)題,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)都有著很好的優(yōu)勢(shì).它的神經(jīng)單元經(jīng)過(guò)運(yùn)算輸出結(jié)果后,繼續(xù)將其作為下一個(gè)單元的輸入并循環(huán)往復(fù),這樣可以有效利用前面的信息.在文本處理以及情感分析的問(wèn)題上,循環(huán)神經(jīng)網(wǎng)絡(luò)能夠貫穿全文,利用上下文的信息,從而使分類問(wèn)題變得更加精準(zhǔn).然而,傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)難以對(duì)長(zhǎng)文本進(jìn)行處理,因其容易造成梯度爆炸和消失的問(wèn)題.

長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory Network,LSTM),是一種改進(jìn)之后的循環(huán)神經(jīng)網(wǎng)絡(luò),可以解決RNN無(wú)法處理長(zhǎng)距離的依賴的問(wèn)題,在涉及長(zhǎng)時(shí)間滯后的任務(wù)上,其性能將優(yōu)于RNN.

LSTM網(wǎng)絡(luò)結(jié)構(gòu)由4個(gè)主要部分組成:輸入門、自循環(huán)鏈接、遺忘門和輸出門.

對(duì)于輸入門i、遺忘門f和輸出門o,在t時(shí)刻分別有如下操作:

it=σ(Wixt+Uiht-1),

(1)

ft=σ(Wfxt+Ufht-1),

(2)

ot=σ(Woxt+Uoht-1),

(3)

(4)

(5)

ht=ot·tanh(ct).

(6)

其中Wi、Wf、Wo、Wc、Ui、Uf、Uo、Uc均為權(quán)重矩陣,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示.

圖2 LSTM模型結(jié)構(gòu)

2 基于LSTM-CNN的模型

LSTM-CNN 模型由一個(gè)初始LSTM層構(gòu)成,它將接收詞向量輸入矩陣作為輸入,LSTM層為原始輸入生成一個(gè)新的編碼.然后將LSTM層的輸出緊接著輸入到期望可以提取局部特征的卷積層中.最后卷積層的輸出將被匯集到一個(gè)較小的緯度,最終輸出為正或負(fù)標(biāo)簽.它的結(jié)構(gòu)如圖3所示.

圖3 LSTM-CNN組合網(wǎng)絡(luò)

2.1 文本的詞向量表示

對(duì)于情感分析來(lái)說(shuō),英文和中文存在著差別,即英文一般都是以單詞來(lái)表達(dá)意思,而中文則以詞組來(lái)表達(dá)情感.所以在進(jìn)行中文情感分析之前,首先得對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,即對(duì)句子進(jìn)行分詞,去除無(wú)用符號(hào)和停用詞等,其次將處理好的文本用詞向量表示.

2.2 Word2Vec

Word2Vec是一個(gè)非常有效的工具,可以在無(wú)須人工干預(yù)的情況下提取特定域的功能.另外,對(duì)于太小的文本或單個(gè)詞語(yǔ),它都可以很好地工作.通過(guò)提供龐大的語(yǔ)料庫(kù)上下文并使用Word2Vec,可以創(chuàng)建具有正確意義的詞語(yǔ)并在大型數(shù)據(jù)集上更快地運(yùn)行.

單詞含義是深度學(xué)習(xí)的最終視角,使用Word2Vec對(duì)較大的實(shí)體進(jìn)行分類可以完全滿足單詞的含義.在提出的方法中,數(shù)據(jù)集是在向量上訓(xùn)練的.具有相同情感標(biāo)簽的單詞具有相同的向量,因此可以輕松指定單詞相似度.

2.3 LSTM-CNN網(wǎng)絡(luò)搭建

該網(wǎng)絡(luò)由以下3個(gè)部分組成:

1)卷積神經(jīng)網(wǎng)絡(luò)的輸入矩陣.所有的詞向量都被連接成二維矩陣,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入矩陣.

2)卷積神經(jīng)網(wǎng)絡(luò).在本文模型中,由4層卷積層構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型,以提取句子中的重要特征信息.卷積由卷積內(nèi)核執(zhí)行.對(duì)于長(zhǎng)度為l的內(nèi)核,有:

ci=f(ω·xii+l-1+b).

(7)

式中,ω∈Rl×d是內(nèi)核的權(quán)重矩陣,xii+l-1被用于內(nèi)核嵌入基質(zhì)的字.而對(duì)于長(zhǎng)度為n的句子,則得到特征向量c=[c1,c2,…,ci,cn].

(8)

2.4 模型的訓(xùn)練

該模型訓(xùn)練的損失函數(shù)是通過(guò)反向傳播算法更新參數(shù)的形式得到的,損失函數(shù)如式(9)所示:

(9)

3 實(shí)驗(yàn)結(jié)果與分析

筆者使用電子商務(wù)網(wǎng)站的產(chǎn)品評(píng)論為數(shù)據(jù)集,共20 065條數(shù)據(jù),使用數(shù)字1代表積極情緒,數(shù)字0代表消極情緒.其中,積極評(píng)價(jià)數(shù)據(jù)10 212條,消極評(píng)價(jià)數(shù)據(jù)9 853條.模型中,文本長(zhǎng)度為29,詞向量維度為128,Adam的學(xué)習(xí)率為0.002,dropout 為0.5,批次大小設(shè)置為100.

為了驗(yàn)證模型的性能,本次實(shí)驗(yàn)另外訓(xùn)練了兩種其他模型作為對(duì)比數(shù)據(jù),分別是CNN和LSTM模型,通過(guò)對(duì)比各個(gè)模型的準(zhǔn)確率(accuracy)、精確率(precision)、召回率(recall)和F-measure的值來(lái)判斷優(yōu)化程度.

實(shí)驗(yàn)結(jié)果如表1所示.

表1 模型測(cè)試結(jié)果

通過(guò)模型 1 和模型 2 的實(shí)驗(yàn)對(duì)比,發(fā)現(xiàn)CNN模型在處理文本的各方面均優(yōu)于LSTM模型.

對(duì)以上3種實(shí)驗(yàn)結(jié)果進(jìn)行分析,LSTM-CNN模型相比其他兩種單個(gè)模型,在對(duì)評(píng)論文本情感分析上有著更好的表現(xiàn),它的F-measure值均高于其他兩種模型.

4 結(jié)論

綜上所述,針對(duì)文本情感分析問(wèn)題,在研究了CNN和LSTM模型的基礎(chǔ)上,筆者提出的基于LSTM-CNN算法的文本情感分析模型在各方面數(shù)據(jù)顯示其具有較為優(yōu)異的處理能力,實(shí)驗(yàn)結(jié)果驗(yàn)證了該模型的可行性和有效性.將來(lái),可以嘗試將模型與其他自然語(yǔ)言處理技術(shù)串聯(lián)起來(lái),以期在NLP問(wèn)題中獲得更好的結(jié)果.

猜你喜歡
卷積向量神經(jīng)網(wǎng)絡(luò)
基于全卷積神經(jīng)網(wǎng)絡(luò)的豬背膘厚快速準(zhǔn)確測(cè)定
基于神經(jīng)網(wǎng)絡(luò)的船舶電力系統(tǒng)故障診斷方法
向量的分解
MIV-PSO-BP神經(jīng)網(wǎng)絡(luò)用戶熱負(fù)荷預(yù)測(cè)
基于改進(jìn)Hopfield神經(jīng)網(wǎng)絡(luò)的對(duì)地攻擊型無(wú)人機(jī)自主能力評(píng)價(jià)
一種基于卷積神經(jīng)網(wǎng)絡(luò)的地磁基準(zhǔn)圖構(gòu)建方法
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
一種并行不對(duì)稱空洞卷積模塊①
聚焦“向量與三角”創(chuàng)新題
三次樣條和二次刪除相輔助的WASD神經(jīng)網(wǎng)絡(luò)與日本人口預(yù)測(cè)
东阳市| 固安县| 江陵县| 宁远县| 宁乡县| 平顶山市| 禹州市| 清原| 永宁县| 平武县| 城口县| 林口县| 泰来县| 新化县| 寻甸| 徐汇区| 武鸣县| 普格县| 碌曲县| 南通市| 寻乌县| 西平县| 永川市| 田阳县| 璧山县| 瑞昌市| 呼和浩特市| 洛阳市| 武清区| 盈江县| 东源县| 多伦县| 兴宁市| 河北区| 宜兴市| 靖西县| 康乐县| 哈尔滨市| 文昌市| 大化| 府谷县|