国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進(jìn)狼群算法優(yōu)化LSTM網(wǎng)絡(luò)的輿情演化預(yù)測

2024-04-29 10:22:25李若晨肖人彬
關(guān)鍵詞:狼群輿情種群

李若晨 肖人彬

摘要: 為提高預(yù)測輿情演化趨勢的能力,提出了一種基于改進(jìn)狼群算法(IWPA)優(yōu)化長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)的輿情演化預(yù)測模型。采用Halton Sequence進(jìn)行初始化,提高種群多樣性;設(shè)計(jì)步長因子進(jìn)行高斯-正弦擾動(dòng)變換,提高狼群探索開發(fā)能力;結(jié)合鯨魚優(yōu)化算法中的螺旋改進(jìn)圍攻機(jī)制,增強(qiáng)狼群的局部搜索能力;引入記憶力機(jī)制,使用雙向記憶種群增加狼群協(xié)同合作能力,將改進(jìn)后的狼群算法應(yīng)用到LSTM神經(jīng)網(wǎng)絡(luò)的超參數(shù)預(yù)測。采用“新冠疫情”和“食品安全”等關(guān)鍵詞作為實(shí)例,證明了IWPA-LSTM神經(jīng)網(wǎng)絡(luò)輿情演化預(yù)測模型具有良好的準(zhǔn)確性和普適性,適用于多種輿情演化的預(yù)測。

關(guān)鍵詞: 輿情演化預(yù)測;狼群算法;LSTM神經(jīng)網(wǎng)絡(luò);Halton Sequence;正弦擾動(dòng);鯨魚螺旋圍攻機(jī)制;記憶力機(jī)制

中圖分類號(hào): TP18;TP183文獻(xiàn)標(biāo)識(shí)碼: A

Public Opinion Evolution Prediction Based on LSTM Network Optimized by an Improved Wolf Pack Algorithm

LI Ruochen,XIAO Renbin

(School of Artificial Intelligence and Automation, Hua Zhong University of Science and Technology, Wuhan 430074, China)

Abstract:To improve the ability to predict the evolution trend of public opinion, a public opinion evolution trend prediction model based on an improved wolf pack algorithm and optimized long-short term memory neural network is proposed. Use Halton Sequence to initialization to improve population diversity. Design step factor to perform Gauss-Sine perturbation transformation to improve wolf group exploration and development capabilities. Combine with the spiral in the whale optimization algorithm to improve the siege mechanism to enhance the local search ability of wolves. The bidirectional memory population is used to increase the cooperative ability of the wolf pack. The improved wolf pack algorithm (IWPA) is applied to the hyperparameter prediction of the LSTM neural network. Using keywords such as “COVID-19” and “Food Safety”, the experiment proves that the IWPA-LSTM neural network public opinion evolution prediction model has good accuracy and generality. The model is suitable for the prediction of various public opinion evolution trends.

Keywords: public opinion evolution prediction; wolf pack algorithm; long short-term memory; Halton sequence; sine perturbation; whale spiral siege mechanism; memory mechanism

0 引言

近年來,隨著社交媒體的快速發(fā)展,社交軟件和網(wǎng)絡(luò)平臺(tái)都極大地促進(jìn)了輿情的演化,研究新形勢下的輿情演化情況,對(duì)于營造良好的網(wǎng)絡(luò)環(huán)境至關(guān)重要[1]。在后疫情時(shí)代及時(shí)利用機(jī)器學(xué)習(xí)算法或深度學(xué)習(xí)算法挖掘疫情各種網(wǎng)絡(luò)輿情信息,準(zhǔn)確有效地預(yù)測網(wǎng)絡(luò)輿情的走勢,對(duì)社會(huì)具有重要意義[2]。

在挖掘自身歷史數(shù)據(jù)進(jìn)行趨勢的分析和預(yù)測方面,很多學(xué)者對(duì)輿情的擴(kuò)散演化過程進(jìn)行了研究[3]。目前,輿情演化預(yù)測模型分為3種:自回歸統(tǒng)計(jì)學(xué)模型、傳統(tǒng)機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型。張和平[4]對(duì)百度指數(shù)輿論事件發(fā)展趨勢的時(shí)序指標(biāo)進(jìn)行了幾何平均模型修正預(yù)測。Anjaria M[5]將輿情數(shù)據(jù)進(jìn)行主成分分析降維并用支持向量機(jī)模型(SVM)進(jìn)行輿情預(yù)測。林玲等[6]使用改進(jìn)灰狼算法優(yōu)化的SVM模型采用百度指數(shù)進(jìn)行輿情預(yù)測。由于輿情演化預(yù)測是一個(gè)復(fù)雜的多因素問題,傳統(tǒng)模型具有局限性和主觀性,SVM模型對(duì)核函數(shù)的選擇敏感,大規(guī)模訓(xùn)練樣本難以實(shí)施,越來越多的學(xué)者通過建立深度學(xué)習(xí)模型,利用神經(jīng)網(wǎng)絡(luò)算法來處理輿情演化。Ye[7]描述了基于反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)的輿情趨勢預(yù)測方法,并比較了遺傳算法和模擬退火算法。孫靖超等[8]采用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)來預(yù)測輿情的演化趨勢,提出了自適應(yīng)調(diào)節(jié)學(xué)習(xí)率的方法。傅麗芳[9]引入注意力機(jī)制改進(jìn)LSTM神經(jīng)網(wǎng)絡(luò),來預(yù)測和分析各種話題的熱度。

輿情演化發(fā)展是多因素相互制衡的結(jié)果,表現(xiàn)出了復(fù)雜非線性的特點(diǎn),并且輿情時(shí)序數(shù)據(jù)往往呈現(xiàn)時(shí)序關(guān)聯(lián)和數(shù)據(jù)量大的特點(diǎn),因此神經(jīng)網(wǎng)絡(luò)模型的應(yīng)用優(yōu)勢凸顯。遞歸神經(jīng)網(wǎng)絡(luò)RNN具有處理復(fù)雜數(shù)據(jù)、時(shí)間數(shù)據(jù)記憶效果等優(yōu)點(diǎn)。特別是LSTM,是一種能有效解決數(shù)據(jù)間長時(shí)間依賴的專用RNN,可以通過中間層的信息來預(yù)測和分析輿論演變情況,然而LSTM網(wǎng)絡(luò)模型為隨機(jī)設(shè)置初始權(quán)值和參數(shù),容易陷入局部最優(yōu)解和具有較差的穩(wěn)定性。魏騰飛[10]采用柯西變異策略改進(jìn)的粒子群算法優(yōu)化LSTM模型的參數(shù),提高了預(yù)測準(zhǔn)確率。于永進(jìn)[11]利用鯨魚算法來尋找LSTM模型中的參數(shù),提高了絕緣紙的剩余壽命預(yù)測準(zhǔn)確率。狼群算法(Wolf Pack Algorithm, WPA)[12]具有較高的尋優(yōu)能力,由于狼群算法是一種隨機(jī)概率搜索算法,能夠以較大的概率快速找到最優(yōu)解,具有并行性、較好的全局收斂性和計(jì)算魯棒性。相比其他群智能算法,WPA尤其適合復(fù)雜函數(shù)求解。薛俊杰[13]將改進(jìn)的狼群算法對(duì)多種典型測試函數(shù)進(jìn)行仿真實(shí)驗(yàn),并與多種智能算法進(jìn)行對(duì)比分析,結(jié)果表明改進(jìn)的狼群算法具有全局收斂性強(qiáng)、計(jì)算耗費(fèi)低、尋優(yōu)精度高等優(yōu)勢。葉勇[14]則利用狼群算法解決車輛動(dòng)態(tài)分配問題,對(duì)比經(jīng)典智能優(yōu)化算法比較,表現(xiàn)更為良好。WPA處理復(fù)雜優(yōu)化函數(shù)問題上優(yōu)勢明顯。狼群算法現(xiàn)已成功地在故障預(yù)測[15]、交通信號(hào)配時(shí)[16]、模具組合分配[17]、PID控制[18]等多個(gè)智能領(lǐng)域上廣泛應(yīng)用,因此本文選擇狼群算法改進(jìn)LSTM神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)權(quán)值和初始參數(shù)。

針對(duì)以上研究存在的不足,為了解決輿情演化趨勢預(yù)測問題,并提高輿情演化趨勢的預(yù)測速度和預(yù)測精度,本文結(jié)合多種策略提出了一種改進(jìn)的狼群算法(IWPA),并使用IWPA對(duì)LSTM神經(jīng)網(wǎng)絡(luò)的權(quán)重和初始參數(shù)進(jìn)行優(yōu)化,來解決LSTM神經(jīng)網(wǎng)絡(luò)參數(shù)尋優(yōu)復(fù)雜的問題,提出一種具有更高準(zhǔn)確性和普適性的輿情演化預(yù)測的新方法IWPA-LSTM,最終實(shí)現(xiàn)對(duì)各類輿情演化趨勢的預(yù)測。

1 相關(guān)理論基礎(chǔ)

1.1 LSTM神經(jīng)網(wǎng)絡(luò)

其中,Wo和bo分別為輸出門的權(quán)重系數(shù)矩陣和偏置向量,ot為t時(shí)刻的輸出門。

輿情演化分析數(shù)據(jù)為典型時(shí)序數(shù)據(jù),LSTM模型增加了記憶單元,可以將信息進(jìn)行長期篩選和保存,更加有效地應(yīng)用于輿情演化分析中[21]。LSTM神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練結(jié)果需要制定合適的參數(shù),通常這些參數(shù)是被事先給定的,不能夠隨著訓(xùn)練結(jié)果進(jìn)行反饋調(diào)整,需要對(duì)參數(shù)進(jìn)行組合優(yōu)化。確定一組最適合的參數(shù),可以有效提高LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測性能。由于狼群算法能夠較好地解決非線性、多變量的優(yōu)化問題,因此選擇它來改進(jìn)LSTM參數(shù)選擇的缺陷。本文采用如圖2的流程進(jìn)行狼群算法優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)模型。

1.2 狼群算法

標(biāo)準(zhǔn)狼群算法的標(biāo)準(zhǔn)和流程如下[2223]:

1)狼群初始化:假設(shè)狼群的獵物分布范圍是一個(gè)N×D的歐幾里得空間,其中N為狼群中狼的數(shù)量,D為變量數(shù)。初始狼群是在解空間內(nèi)隨機(jī)分布的,采用式(7)在D維解空間內(nèi)隨機(jī)分布N匹狼:

其中,第d維解空間的上界為xUd,對(duì)應(yīng)著的下界為xLd;rand為(0,1)內(nèi)的隨機(jī)數(shù)。

根據(jù)目標(biāo)函數(shù)值的大小來確定距離獵物的遠(yuǎn)近程度,狼群初始化后,選取適應(yīng)度函數(shù)值最優(yōu)的,記為Ylead。

2 改進(jìn)狼群算法優(yōu)化LSTM模型

2.1 改進(jìn)狼群算法

狼群算法是一個(gè)新生的算法,其智能行為存在有待改進(jìn)的地方,本文提出了一種改進(jìn)狼群算法(Improved Wolf Pack Algorithm, IWPA),以便后續(xù)有效地應(yīng)用于LSTM模型輿情演化分析中。

2.1.1 Halton Sequence初始化

原始的狼群算法采用隨機(jī)初始化的方式來建立初始群體會(huì)導(dǎo)致算法的求解能力不夠穩(wěn)定。Halton Sequence常應(yīng)用于隨機(jī)生成均勻的空間點(diǎn)[24]。因此,本文利用Halton Sequence搜索算法對(duì)原始狼的位置進(jìn)行初始化,從而使其在解空間內(nèi)分配較為均勻,避免陷入局部最優(yōu)解和重復(fù)運(yùn)算。Halton Sequence搜索算法的原理為設(shè)定一個(gè)質(zhì)數(shù)p為基數(shù),以基數(shù)切分區(qū)間,形成不重復(fù)且均勻的初始種群分布位置。

設(shè)定實(shí)驗(yàn)中狼群種群數(shù)為50,解空間維度為二維,得到圖3和圖4。圖3是在二維空間的隨機(jī)位置分布圖,可以發(fā)現(xiàn)圖中存在位置點(diǎn)重合的現(xiàn)象,且存在部分位置空缺;圖4是選取兩個(gè)質(zhì)數(shù)作為基數(shù)base1=2,base2=3的Halton Sequence分布圖,圖4中位置點(diǎn)均勻分散到解空間中,沒有出現(xiàn)位置點(diǎn)重合的現(xiàn)象。

2.1.2 步長因子的高斯-正弦擾動(dòng)變換

基礎(chǔ)狼群算法在初始階段迅速收斂,但是隨著迭代數(shù)的增多,容易陷入局部最優(yōu)值而停止,使整體收斂速度和優(yōu)化精度下降。因此在迭代過程的前中期引入高斯函數(shù)可以增強(qiáng)算法的局部搜索能力;在迭代后期引入一個(gè)正弦步長因子擾動(dòng),有利于算法跳出局部最優(yōu)解。步長因子的高斯-正弦擾動(dòng)變換公式如式(17):

其中,φ1、φ2、ω1、ω2和ρ2為常數(shù)系數(shù),μ和σ2為高斯函數(shù)的均值和方差,ε為步長擾動(dòng)比例。

為尋找合適滿足理想衰減機(jī)制的高斯分布曲線和正弦擾動(dòng)曲線,可以對(duì)核心參數(shù)進(jìn)行仿真分析。仿真實(shí)驗(yàn)表明,當(dāng)t在最大迭代次數(shù)為300,選定ε為0.3時(shí),算法尋優(yōu)效果最好,對(duì)應(yīng)的步長因子變化曲線如圖5所示。

2.1.3 基于鯨魚算法的螺旋圍攻行為

在狼群算法的猛狼圍攻行為中,猛狼直接選擇頭狼位置向頭狼逼近,雖然可以加快圍攻行為,但是沒有全面繼續(xù)探索頭狼周圍的區(qū)域,使得狼群的搜索能力受限。為了給猛狼圍攻行為加以導(dǎo)向,本文結(jié)合鯨魚優(yōu)化算法(Whale Optimization Algorithm, WOA)[25]中的螺旋式位置更新機(jī)制,在鯨魚捕食行為中遇到目標(biāo)獵物會(huì)吐泡泡組成網(wǎng)來攻擊獵物,再通過螺旋搜索的圍攻行為將獵物捕獲,這種螺旋圍攻機(jī)制可以防止獵物從一側(cè)逃竄,應(yīng)用到狼群算法中可以提高狼群局部探索能力,在頭狼周圍尋找更優(yōu)解。加入WOA算法中的螺旋圍攻機(jī)制后,猛狼的位置坐標(biāo)更新如式(18)所示。

其中,α為對(duì)數(shù)螺旋常數(shù),通常取值為1,隨機(jī)數(shù)l∈[-1,1],D′為當(dāng)前第i只狼和頭狼之間的距離,如式(19)所示。

為了加快狼群算法的圍攻搜索速度,猛狼不僅通過螺旋圍攻機(jī)制進(jìn)行圍攻行為,同時(shí)收縮包圍范圍,以Pc為概率向頭狼位置進(jìn)行圍攻,獲得優(yōu)化后的猛狼圍攻機(jī)制如式(20)所示。

構(gòu)造目標(biāo)函數(shù)為y=x21+x22,從圖6中可以看出,當(dāng)頭狼位于hk時(shí),采用螺旋圍攻機(jī)制的猛狼xk可以以頭狼為中心對(duì)周圍的領(lǐng)域進(jìn)行搜索,并且逐步逼近頭狼位置,在搜索過程中就可以探索到更優(yōu)于頭狼位置的h*k,提高狼群發(fā)現(xiàn)最優(yōu)解的能力。

2.1.4 基于Harmonic擁擠距離和記憶機(jī)制的種群更新策略

傳統(tǒng)的狼群算法中僅僅用適應(yīng)度最優(yōu)的狼作為頭狼,對(duì)于搜索過程中的記憶沒有進(jìn)行保存。同時(shí),為了增加狼群之間的協(xié)同作用,基于記憶力機(jī)制提出構(gòu)建記憶種群,包含正向記憶種群和反向記憶種群。利用Harmonic[26]平均距離公式取代了歐式距離,計(jì)算公式:

其中,max_rmd和min_rmd分別為正向記憶狼在d維上的最大值和最小值。

根據(jù)上述構(gòu)建的正向記憶種群和反向記憶種群設(shè)置新的種群更新策略,設(shè)置動(dòng)態(tài)記憶種群更新因子βm,記憶種群替換更新Rm只記憶狼,計(jì)算公式如式(24)、(25)所示。

其中,rand為(0,1)內(nèi)的隨機(jī)數(shù),φ、ω和ρ為常數(shù)系數(shù),t為迭代次數(shù)。

具體方法為:在每次迭代完成后,上一次迭代產(chǎn)生的正向、反向記憶種群按照Harmonic平均距離進(jìn)行排序,若當(dāng)前的頭狼和正向記憶種群中Harmonic距離最大的狼相同,不引入記憶種群;若當(dāng)前頭狼和正向記憶種群中Harmonic距離最大的狼不同,根據(jù)正向記憶種群中Harmonic平均距離排序從大到小的前Rm只記憶狼,進(jìn)行位置替換;在原始種群中隨機(jī)更新Rm只狼,根據(jù)反向記憶種群中Harmonic平均距離排序從大到小的后Rm只記憶狼,進(jìn)行位置更新;在每次種群更新后再更新正反向記憶種群。

2.2 改進(jìn)狼群算法優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)模型

LSTM神經(jīng)網(wǎng)絡(luò)模型的調(diào)參過程復(fù)雜,穩(wěn)定性不足,會(huì)對(duì)預(yù)測結(jié)果產(chǎn)生較大的影響[29]。因此,可以結(jié)合IWPA算法確定一組較好的初始參數(shù),即可以用頭狼的位置作為最優(yōu)解初始權(quán)值和參數(shù)。IWPA-LSTM神經(jīng)網(wǎng)絡(luò)算法流程圖如圖7所示,主要步驟為:

步驟1:進(jìn)行數(shù)據(jù)清洗工作,并且將清洗好的輿情演化數(shù)據(jù)進(jìn)行歸一化處理,根據(jù)時(shí)間順序?qū)?shù)據(jù)集劃分成訓(xùn)練集和測試集。

步驟2:初始化LSTM神經(jīng)網(wǎng)絡(luò)所需參數(shù)和LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括兩層LSTM隱含和一層dropout層。選取需要優(yōu)化的模型的參數(shù)為[L1,L2,lr,batch],分別代表兩層隱含層神經(jīng)元個(gè)數(shù)、學(xué)習(xí)率、批次大小[30]。

步驟3:初始化IWPA狼群算法參數(shù),每只狼的位置代表著LSTM神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,設(shè)置評(píng)價(jià)函數(shù)作為IWPA算法的目標(biāo)函數(shù),其中P代表劃分出的訓(xùn)練集數(shù)量,yp和y′p代表經(jīng)過訓(xùn)練集得到的真實(shí)值和預(yù)測值;Q代表劃分出的測試集數(shù)量,yq和y′q代表測試集得到的真實(shí)值和預(yù)測值。

步驟4:根據(jù)初始種群建立正反向記憶種群,計(jì)算狼群的適應(yīng)度值,根據(jù)適應(yīng)度值Fitnesslead確定頭狼。

步驟5:根據(jù)步長擾動(dòng)策略更新探狼搜索和猛狼圍攻行動(dòng),搜索解空間中的最優(yōu)適應(yīng)度值,且更新頭狼。

步驟6:采用Harmonic擁擠距離和正反向記憶種群重新更新狼群位置坐標(biāo)。

步驟7:當(dāng)判斷條件符合適應(yīng)度函數(shù)的最大精度或超過最大迭代次數(shù),則得到當(dāng)前頭狼坐標(biāo),作為LSTM網(wǎng)絡(luò)的初始權(quán)值和參數(shù),進(jìn)行網(wǎng)絡(luò)訓(xùn)練,否則轉(zhuǎn)步驟4。

3 計(jì)算實(shí)驗(yàn)和案例驗(yàn)證

3.1 輿情演化數(shù)據(jù)來源

預(yù)測輿情演化趨勢都是基于歷史輿情演化值的時(shí)間序列來進(jìn)行,歷史輿情演化值是一種最為常用的預(yù)測來源指標(biāo)[31],輿情演化程度是一個(gè)單位時(shí)間內(nèi)的增量信息[32]。在本文中選取最常用百度指數(shù)作為輿情演化程度的指標(biāo)。所以本文采用python爬蟲技術(shù)獲取百度指數(shù)官網(wǎng)中對(duì)于關(guān)鍵詞的百度指數(shù)趨勢數(shù)據(jù),設(shè)置“新冠疫情”、“食品安全”、“網(wǎng)絡(luò)安全”、“收入分配”和“共同富?!钡汝P(guān)鍵詞,按天獲取到對(duì)應(yīng)的百度指數(shù)作為實(shí)驗(yàn)數(shù)據(jù)。其中,爬取“新冠疫情”2021年2月3日到2022年4月14日共437組數(shù)據(jù);爬取“食品安全”、“網(wǎng)絡(luò)安全”、“收入分配”和“共同富裕”2021年11月14日到2022年4月13日各150組數(shù)據(jù)。

3.2 實(shí)驗(yàn)環(huán)境和數(shù)據(jù)指標(biāo)

本實(shí)驗(yàn)采用AMD銳龍7-5800H芯片,8核心,8G內(nèi)存,Windows 10操作系統(tǒng),MATLAB2020b試驗(yàn)平臺(tái)。采用均方根誤差(RMSE)、平均絕對(duì)百分比誤差(MAPE)作為評(píng)價(jià)標(biāo)準(zhǔn),其公式如式(27),(28)所示。

3.3 單模型預(yù)測建模

“新冠疫情”是當(dāng)今世界的重大公共衛(wèi)生事件,預(yù)測公眾的反映情況是十分必要的工作[33]。從圖8可以看出,“新冠疫情”輿情演化中會(huì)存在平穩(wěn)期和突發(fā)期,在平穩(wěn)期中輿情演化指數(shù)波動(dòng)較小,且呈現(xiàn)一定周期性;在突發(fā)期輿情演化指數(shù)波動(dòng)較大,會(huì)出現(xiàn)峰值。為提高檢驗(yàn)預(yù)測的效果,將輿情演化數(shù)據(jù)進(jìn)行分類[34]。對(duì)于平穩(wěn)期輿情演化預(yù)測數(shù)據(jù),選取2021年2月3日到2021年7月3日共150組數(shù)據(jù),其中30組為測試集,對(duì)2021年6月3日到2021年7月3日“新冠疫情”平穩(wěn)類輿情演化趨勢進(jìn)行預(yù)測。對(duì)于突發(fā)期輿情演化預(yù)測數(shù)據(jù),選取2021年10月31日到2022年3月30日共150組數(shù)據(jù),其中30組為測試集,對(duì)2022年2月28日到2022年3月30日“新冠疫情”突發(fā)類輿情演化趨勢進(jìn)行預(yù)測。

為了測試LSTM模型在輿情演化預(yù)測應(yīng)用上的性能狀況,選取多種機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比分析,包括BP神經(jīng)網(wǎng)絡(luò)模型、SVM支持向量機(jī)模型和LSTM模型[35]。其中BP神經(jīng)網(wǎng)絡(luò)和LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為7-50-50-1,學(xué)習(xí)率為0.001;SVM模型的懲罰因子C=2,核參數(shù)為10。單模型平穩(wěn)期預(yù)測結(jié)果如圖9和表1所示;單模型突發(fā)期結(jié)果如圖10和表2所示。

采用上述3種預(yù)測模型,進(jìn)行10次重復(fù)實(shí)驗(yàn)取平均值。從表1和表2可以看出,3種模型在平穩(wěn)期的表現(xiàn)都好于突發(fā)期,但是LSTM模型的表現(xiàn)是三者中最優(yōu)的。

圖9為平穩(wěn)類輿情演化預(yù)測情況:LSTM模型的預(yù)測曲線更為貼合真實(shí)值。圖10為突發(fā)類輿情演化預(yù)測情況:BP神經(jīng)網(wǎng)絡(luò)模型可能出現(xiàn)滯后性,而SVM模型和LSTM模型的MAPE誤差相近,但LSTM神經(jīng)網(wǎng)絡(luò)模型的RMSE明顯優(yōu)于SVM模型,為4.946 6×103,說明LSTM模型對(duì)于這兩類輿情演化數(shù)據(jù)的預(yù)測精度更高,更符合輿情演化的實(shí)際情況,對(duì)于平穩(wěn)類輿情演化的情況適用性更好,同時(shí)也可以更準(zhǔn)確地預(yù)測突發(fā)類輿情演化情況。

3.4 基于改進(jìn)狼群算法的LSTM模型

根據(jù)單模型LSTM的結(jié)構(gòu),選擇LSTM中的超參數(shù)進(jìn)行不同智能算法的尋優(yōu),設(shè)定隱藏層單元個(gè)數(shù)的范圍L1,L2∈[12,200],學(xué)習(xí)率的范圍lr∈[0.001,0.05],batchsize∈[8,256]。為了測試改進(jìn)后的狼群算法對(duì)于LSTM模型的優(yōu)化性能,選取了原始LSTM模型(記作LSTM)、PSO優(yōu)化的LSTM模型(記作PSO-LSTM)、WPA優(yōu)化的LSTM模型(記作WPA-LSTM)和IWPA優(yōu)化的LSTM模型(記作IWPA-LSTM)分別對(duì)“新冠肺炎”平穩(wěn)期輿情演化趨勢進(jìn)行預(yù)測,將得到的實(shí)驗(yàn)結(jié)果比對(duì)。以上不同的改進(jìn)算法的迭代次數(shù)為100,種群規(guī)模為30,3種不同的智能算法對(duì)LSTM超參數(shù)尋優(yōu)過程如圖11所示。

從圖11中可以看出,IWPA算法相較于以上兩種算法,因?yàn)橐肓擞洃浄N群,所以尋優(yōu)次數(shù)要明顯少于PSO算法和WPA算法,得到的適應(yīng)度函數(shù)值是三者中最小的,說明IWPA算法對(duì)處理LSTM模型預(yù)測輿情演化是有效性的。最終,使用IWPA算法優(yōu)化得到的LSTM超參數(shù)值為:隱藏層神經(jīng)元個(gè)數(shù)分別為L1=83、L2=109,學(xué)習(xí)率lr=1.219×10-3,batch=36。不同模型平穩(wěn)期預(yù)測結(jié)果見圖12和表3;不同模型突發(fā)期結(jié)果如圖13和表4所示。

采用上述3種不同算法優(yōu)化的LSTM模型取平均值,得到預(yù)測輿情演化趨勢圖和預(yù)測誤差表。平穩(wěn)期IWPA-LSTM對(duì)比其余3個(gè)LSTM模型MAPE指標(biāo)都有明顯降低,說明IWPA-LSTM模型具有較高的精確性。突發(fā)期IWPA-LSTM模型的RMSE指標(biāo)為4.946 6×103,小于其他3種模型的RMSE指標(biāo),這說明IWPA算法對(duì)于增加LSTM模型的穩(wěn)定性具有重要作用;IWPA-LSTM模型的MAPE指標(biāo)為6.5%,小于其余3個(gè)LSTM模型,這說明IWPA算法對(duì)于LSTM神經(jīng)網(wǎng)絡(luò)模型可以有效地提升收斂速度和提高預(yù)測精度。

綜合以上分析,IWPA算法對(duì)于LSTM的優(yōu)化效果明顯,并且對(duì)兩類輿情演化時(shí)期都有促進(jìn)作用,在平穩(wěn)期可以增加預(yù)測的精度,在突發(fā)期可以提高穩(wěn)定預(yù)測的能力,可以發(fā)現(xiàn)IWPA-LSTM模型對(duì)于預(yù)測輿情演化趨勢都具有穩(wěn)定性好、精確度高的特點(diǎn),證明使用改進(jìn)狼群算法優(yōu)化LSTM具有更為良好的預(yù)測性能。

根據(jù)數(shù)據(jù)分析,在2021年6月到7月,國內(nèi)疫情防控較為穩(wěn)定,隨著“廣州首例阿婆出院”廣州各地風(fēng)險(xiǎn)逐漸解除,全國各地正常生產(chǎn)生活,輿情演化趨勢也逐漸下降。從2022年2月28日“新冠疫情”輿情演化的趨勢呈現(xiàn)上升現(xiàn)象,直到3月10日后,某學(xué)院學(xué)生發(fā)文稱學(xué)院對(duì)于疫情的管理不當(dāng),引發(fā)人們對(duì)新冠疫情關(guān)注程度突然增高;3月10日到15日各地各部門采取相關(guān)有效措施,各省份對(duì)疫情地區(qū)進(jìn)行點(diǎn)對(duì)點(diǎn)支援,輿情指數(shù)關(guān)注趨勢在3月15日之后有所下降,證明了及時(shí)采取相關(guān)措施,可以有效緩解輿情演化趨勢進(jìn)一步提升。根據(jù)以上實(shí)際情況的分析,可以看出IWPA-LSTM神經(jīng)網(wǎng)絡(luò)對(duì)于社會(huì)輿情的實(shí)際意義明顯,可以有效準(zhǔn)確地預(yù)測輿情演化趨勢,對(duì)于分析輿情演化原因可以提供有力的支持。

3.5 IWPA-LSTM模型泛化性驗(yàn)證

為了進(jìn)一步驗(yàn)證狼群算法改進(jìn)后的LSTM神經(jīng)網(wǎng)絡(luò)模型具有預(yù)測輿情演化趨勢的泛化性,可以適用于其他多種輿情關(guān)鍵詞的趨勢預(yù)測,采用其他輿情進(jìn)行驗(yàn)證。315晚會(huì)后,以“食品安全”和“網(wǎng)絡(luò)安全”為關(guān)鍵詞進(jìn)行輿情演化預(yù)測,同時(shí)從2022年新華網(wǎng)發(fā)布的兩會(huì)熱詞選取了“收入分配”和“共同富?!?。選擇2021年11月14日到2022年4月13日共150組數(shù)據(jù),其中34組為測試集。同時(shí)采用本文提到的LSTM、PSO-LSTM、WPA-LSTM和IWPA-LSTM 4種模型進(jìn)行對(duì)比訓(xùn)練和預(yù)測,得到實(shí)驗(yàn)結(jié)果如圖14和表5所示。

從圖14和表5,分析“食品安全”輿情預(yù)測結(jié)果,IWPA-LSTM模型的MAPE指標(biāo)最小為5.48%,并且RMSE指標(biāo)為1.173 0×103,也是4種模型中最穩(wěn)定的,因?yàn)椤?15晚會(huì)”后曝光了食品相關(guān)事件,造成在3月15日后輿情演化呈一定的上升趨勢。對(duì)于其他3個(gè)相關(guān)輿情的預(yù)測,使用IWPA-LSTM模型的效果最好,在4種LSTM模型中,MAPE指標(biāo)和RMSE指標(biāo)均為最小,并且輿情演化趨勢最為貼近實(shí)際情況。通過以上多個(gè)實(shí)例進(jìn)行驗(yàn)證,使用IWPA算法優(yōu)化的LSTM神經(jīng)網(wǎng)絡(luò)能夠更好地適用于預(yù)測輿情演化趨勢,對(duì)比其他算法優(yōu)化的LSTM模型,具有較好的普適性和準(zhǔn)確性,表現(xiàn)出了對(duì)不同輿情信息的良好適應(yīng)性。

4 總結(jié)與展望

輿情的演化趨勢具有實(shí)時(shí)性、無規(guī)律性,為了解決輿情演化趨勢的預(yù)測問題,本文提出了一種改進(jìn)狼群算法優(yōu)化的長短期記憶神經(jīng)網(wǎng)絡(luò)預(yù)測模型(IWPA-LSTM),在經(jīng)典狼群算法中引入初始化策略、動(dòng)態(tài)高斯-正弦擾動(dòng)步長策略、鯨魚螺旋圍攻策略,并建立正反雙向記憶種群,提出改進(jìn)狼群算法IWPA。LSTM神經(jīng)網(wǎng)絡(luò)模型可以較好地處理不同時(shí)期的“新冠疫情”輿情演化數(shù)據(jù),采用IWPA優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)對(duì)超參數(shù)進(jìn)行尋優(yōu),可以避免人工調(diào)參的不確定性,提高預(yù)測的準(zhǔn)確程度。IWPA-LSTM輿情演化預(yù)測模型應(yīng)用于其他相關(guān)輿情的預(yù)測時(shí),對(duì)比其他算法優(yōu)化的LSTM神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)出了良好的預(yù)測精度和普適性。

未來可以進(jìn)一步探索輿情演化的相關(guān)因素,結(jié)合大數(shù)據(jù)處理方式,擴(kuò)大預(yù)測范圍,融合多種群多模型對(duì)輿情發(fā)展趨勢進(jìn)行更為精確的探索。

參考文獻(xiàn):

[1]于同洋, 肖人彬, 侯俊東. 網(wǎng)絡(luò)輿情結(jié)構(gòu)逆轉(zhuǎn)建模與仿真:基于改進(jìn)Deffuant模型[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2019, 16(3): 30-39.

YU T Y, XIAO R B, HOU J D. Modeling and simulation of network public opinion structure reversal: based on an improved Deffuant model[J]. Complex Systems and Complexity Science, 2019, 16 (3): 30-39.

[2]張軒宇, 陳曦, 肖人彬. 后真相時(shí)代基于敵意媒體效應(yīng)的觀點(diǎn)演化建模與仿真[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2023, 20(3): 44-51,59.

ZHANG X Y, CHEN X, XIAO R B. Modeling and simulation of viewpoint evolution based on hostile media effect in the post truth era [J]. Complex Systems and Complexity Science, 2023, 20(3): 44-51,59.

[3]劉舉勝, 何建佳, 韓景倜, 等. 觀點(diǎn)動(dòng)力學(xué)研究現(xiàn)狀及進(jìn)展述評(píng)[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2021, 18(2): 9-20.

LIU J S, HE J J, HAM J T, et al. Review on the research status and progress of viewpoint dynamics[J]. Complex Systems and Complexity Science, 2021, 18 (2): 9-20

[4]張和平, 陳齊海. 基于灰色馬爾可夫模型的網(wǎng)絡(luò)輿情預(yù)測研究[J]. 情報(bào)科學(xué), 2018, 36(1): 75-79.

ZHANG H P, CHEN Q H. Research on internet public opinion prediction based on grey Markov model [J]. Information Science, 2018, 36(1): 75-79.

[5]Anjaria M, Guddeti R. Influence factor-based opinion mining of twitter data using supervised learning[C]//2014 Sixth International Conference on Communication Systems and Networks (COMSNETS). Bangalore, India: IEEE, 2014.

[6]林玲, 陳福集, 謝加良, 等. 基于改進(jìn)灰狼優(yōu)化支持向量回歸的網(wǎng)絡(luò)輿情預(yù)測[J]. 系統(tǒng)工程理論與實(shí)踐, 2022,42(2): 487-498.

LIN L, CHEN F J, XIE J L,et al. Network public opinion prediction based on improved grey wolf optimization support vector regression[J]. Systems Engineering Theory and Practice, 2022, 42(2): 487-498.

[7]野雪蓮, 楊孔雨. 輿情趨勢預(yù)測中神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法[J]. 網(wǎng)絡(luò)新媒體技術(shù), 2016, 5(1): 33-37,51.

YE X L,YANG K Y. Neural network optimization algorithm in public opinion trends prediction[J]. Journal of Network New Media, 2016, 5(1): 33-37,51.

[8]孫靖超, 周睿, 李培岳, 等. 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情趨勢預(yù)測研究[J]. 情報(bào)科學(xué), 2018, 36(8):118-122,127.

SUN J C, ZHOU R, LI P Y,et al. Research on network public opinion trend prediction based on recurrent neural network[J]. Information Science, 2018, 36(8): 118-122,127.

[9]傅麗芳, 趙菲菲. 基于注意力機(jī)制LSTM模型的農(nóng)業(yè)輿情預(yù)測與分析[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí), 2021, 51(17): 64-76.

FU L F, ZHAO F F. A forecasting method of agricultural public opinion based on Lda-Lstm-Attn model[J]. Journal of Mathematics in Practice and Theory, 2021, 51(17): 64-76.

[10] 魏騰飛, 潘庭龍. 基于改進(jìn)PSO優(yōu)化LSTM網(wǎng)絡(luò)的短期電力負(fù)荷預(yù)測[J]. 系統(tǒng)仿真學(xué)報(bào), 2021, 33(8): 1866-1874.

WEI T F, PAN T L.Short-term power load forecasting based on LSTM neural network optimized by improved PSO[J]. Journal of System Simulation, 2021, 33(8): 1866-1874.

[11] 于永進(jìn), 姜雅男, 李長云. 基于WOA-LSTM模型的機(jī)-熱老化絕緣紙剩余壽命預(yù)測方法[J]. 電工技術(shù)學(xué)報(bào), 2022, 37(12): 3162-3171.

YU Y J, JIANG Y N, LI C Y.Prediction method of insulation paper remaining life with mechanical-thermal synergy based on whale optimization algorithm-Long-Short Term Memory model[J]. Transactions of China Electrotechnical Society, 2022, 37(12):3162-3171.

[12] 吳虎勝, 張鳳鳴, 吳廬山. 一種新的群體智能算法——狼群算法[J]. 系統(tǒng)工程與電子技術(shù), 2013, 35(11): 2430-2438.

WU H S, ZHANG F M, WU L S. A new swarm intelligence algorithm—wolf packalgorithm[J]. Systems Engineering and Electronics, 2013, 35(11): 2430-2438.

[13] 薛俊杰, 王瑛, 李浩, 等. 一種狼群智能算法及收斂性分析[J]. 控制與決策, 2016, 31(12):2131-2139.

XUE JJ, WANG Y, LI H, et al. A smart wolf pack algorithm and its convergence analysis[J]. Control and Decision, 2016, 31 (12): 2131-2139.

[14] 葉勇, 張惠珍. 多配送中心車輛路徑問題的狼群算法[J]. 計(jì)算機(jī)應(yīng)用研究, 2017,34(9):36-39.

YE Y, ZHANG H Z.Wolf pack algorithm for multi-depot vehicle routing problem[J]. Application Research of Computers, 2017,34(9): 36-39.

[15] 尹懷仙, 王凱, 張鐵柱, 等. 基于PSO-BP神經(jīng)網(wǎng)絡(luò)的城軌列車轉(zhuǎn)向架輪對(duì)軸箱故障預(yù)測[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2015, 12(4): 97-103.

YIN H X, WANG K, ZHANG T Z,et al. Fault prediction based on PSO-BP neural network about wheel and axle box of bogie in urban rail train[J]. Complex Systems and Complexity Science, 2015, 12(4): 97-103

[16] 胡亮, 肖人彬, 王英聰. 蜂群激發(fā)抑制算法及其在交通信號(hào)配時(shí)中的應(yīng)用[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2019, 16(2): 9-18,40.

HU L, XIAO R B, WANG Y C.Bee colony activating-inhibition algorithm and its application in traffic signal timing[J]. Complex Systems and Complexity Science, 2019, 16(2): 9-18,40.

[17] 韓忠華, 劉約翰, 李曼, 等. 改進(jìn)狼群算法求解模具在模臺(tái)上組合分配問題[J]. 系統(tǒng)仿真學(xué)報(bào), 2021, 33(1): 127-140.

HAN Z H, LIU Y H, LI M, SUN LL, et al. Improved wolf pack algorithm for distribution of molds on molds table[J]. Journal of System Simulation, 2021, 33(1): 127-140.

[18] WU H S, ZHANG F M. A uncultivated wolf pack algorithm for high-dimensional functions and its application in parameters optimization of PID controller[C]//2014 IEEE Congress on Evolutionary Computation (CEC). Beijing, China: IEEE, 2014.

[19] 劉東陽, 查文文, 陶亮, 等. 基于LSTM和SMC的農(nóng)用履帶機(jī)器人軌跡跟蹤控制[J]. 系統(tǒng)仿真學(xué)報(bào), 2023, 35(4): 747-759.

LIU D Y, ZHA WW, TAO L, et al. Trajectory control of crawler robot based on LSTM and SMC [J]. Journal of System Simulation, 2023, 35(4): 747-759.

[20] EOM G, BYEON H. Development of keyword trend prediction models for obesity before and after the Covid-19 pandemic using RNN and LSTM: analyzing the news big data of South Korea[J]. Frontiers in Public Health, 2022, 10: 894266.

[21] DU B G, HUANG S, GUO J, et al. Interval forecasting for urban water demand usingPSO optimized KDE distribution and LSTM neural networks[J]. Applied Soft Computing, 2022, 122: 108875.

[22] 陳暄, 孟凡光, 吳吉義. 求解大規(guī)模優(yōu)化問題的改進(jìn)狼群算法[J]. 系統(tǒng)工程理論與實(shí)踐, 2021, 41(3): 790-808.

CHEN X, MENG F G, WU J Y.Improved wolf pack algorithm for large-scale optimization problems[J]. Systems Engineering Theory and Practice, 2021, 41(3): 790-808.

[23] GAO Y J, ZHANG F M, ZHAO Y, et al. Quantum-inspired wolf pack algorithm to solve the 0-1 knapsack problem[J]. Mathematical Problems in Engineering, 2018(4): 5327056.

[24] 劉成漢, 何慶. 融合多策略的黃金正弦黑猩猩優(yōu)化算法[J]. 自動(dòng)化學(xué)報(bào), 2023, 49(11): 2360-2373.

LIU C H, HE Q.Golden sine chimp optimization algorithm integrating multiple strategies[J]. Acta Automatica Sinica, 2023, 49(11): 2360-2373.

[25] MIRJALILI S, LEWIS A. The whale optimization algorithm[J]. Advances in Engineering Software, 2016, 95: 51-67.

[26] 羅辭勇, 陳民鈾, 張聰譽(yù). 采用循環(huán)擁擠排序策略的改進(jìn)NSGA-Ⅱ算法[J]. 控制與決策, 2010, 25(2): 227-231.

LUO C Y, CHEN M Y, ZHANG C Y.Improved NSGA-Ⅱ algorithm with circular crowded sorting[J]. Control and Decision, 2010, 25(2): 227-231.

[27] 王艷嬌, 馬春蕾. 基于記憶策略的動(dòng)態(tài)離子運(yùn)動(dòng)優(yōu)化算法[J]. 吉林大學(xué)學(xué)報(bào)(工學(xué)版), 2020, 50(3): 1047-1060.

WANG Y J, MA C L.Dynamic ion motion optimization algorithm based on memory strategy[J]. Journal of Jilin University (Engineering and Technology Edition), 2020, 50(3): 1047-1060.

[28] 汪慎文, 丁立新, 謝承旺, 等. 應(yīng)用精英反向?qū)W習(xí)策略的混合差分演化算法[J]. 武漢大學(xué)學(xué)報(bào)(理學(xué)版), 2013, 59(2): 111-116.

WANG S W, DING L X, XIE C W, et al. A hybrid differential evolution with elite opposition-based learning[J]. Journal of Wuhan University (Natural Science Edition), 2013, 59(2): 111-116.

[29] HUANG Z H, WEI X, KAI Y. Bidirectional LSTM-CRF models for sequencetagging[DB/OL]. [2022-01-30]. https://doi.org/10.48550/arXiv.1508.01991

[30] 王鑫, 吳際, 劉超, 等. 基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的故障時(shí)間序列預(yù)測[J]. 北京航空航天大學(xué)學(xué)報(bào), 2018, 44(4): 772-784.

WANG X, WU J, LIU C, et al.Exploring LSTM-based recurrent neural network for failure time series prediction[J]. Journal of Beijing University of Aeronautics and Astronautics, 2018, 44(4): 772-784.

[31] XIAO R B, YU T Y, HOU J D. Modeling and simulation of opinion natural reversal dynamics with opinion leader based on HK bounded confidence model[J]. Complexity, 2020(1): 7360302.

[32] 劉琪, 肖人彬. 觀點(diǎn)動(dòng)力學(xué)視角下基于意見領(lǐng)袖的網(wǎng)絡(luò)輿情反轉(zhuǎn)研究[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2019, 16(1): 1-13.

LIU Q, XIAO R B. An opinion dynamics approach to public opinion reversion with the guidance of opinion leaders[J]. Complex Systems and Complexity Science, 2019, 16(1): 1-13.

[33] 劉巧玲, 李勁, 肖人彬. 基于參數(shù)反演的網(wǎng)絡(luò)輿情傳播趨勢預(yù)測——以新浪微博為例[J]. 計(jì)算機(jī)應(yīng)用, 2017, 37(5): 1419-1423.

Liu Q L, Li J, Xiao R B.Trend prediction of public opinion propagation based on parameter inversion—an empirical study on Sina micro-blog [J]. Journal of Computer Applications, 2017, 37(5): 1419-1423.

[34] WU H S, XIAO R B.Flexible wolf pack algorithm for dynamic multidimensional knapsack problems[J]. Research, 2020(1): 174-186.

[35] LI J H, ZHU D S, LI C X. Comparative analysis of BPNN, SVR, LSTM, Random Forest, and LSTM-SVR for conditional simulation of non-Gaussian measured fluctuating wind pressures[J]. Mechanical Systems & Signal Processing, 2022, 178: 109285.

(責(zé)任編輯 耿金花)

收稿日期: 2022-05-25;修回日期: 2022-06-30

基金項(xiàng)目: 科技創(chuàng)新 2030—“新一代人工智能”重大項(xiàng)目(2018AAA0101200)

第一作者: 李若晨(1998-),女,山東淄博人,碩士,主要研究方向?yàn)檩浨轭A(yù)測、群智能。

通信作者: 肖人彬(1965-),男,湖北武漢人,博士,教授,主要研究方向?yàn)閺?fù)雜系統(tǒng)、群智能。

猜你喜歡
狼群輿情種群
山西省發(fā)現(xiàn)刺五加種群分布
德國老人 用40年融入狼群
樂活老年(2019年5期)2019-07-25 01:18:18
中華蜂種群急劇萎縮的生態(tài)人類學(xué)探討
紅土地(2018年7期)2018-09-26 03:07:38
狼群之爭
輿情
中國民政(2016年16期)2016-09-19 02:16:48
《重返狼群》
輿情
中國民政(2016年10期)2016-06-05 09:04:16
輿情
中國民政(2016年24期)2016-02-11 03:34:38
崗更湖鯉魚的種群特征
微博的輿情控制與言論自由
黎川县| 马尔康县| 新沂市| 仙桃市| 屏南县| 嘉峪关市| 九寨沟县| 东丰县| 聂拉木县| 镇平县| 曲靖市| 新巴尔虎右旗| 丰县| 兰西县| 库伦旗| 五指山市| 麻江县| 武功县| 广安市| 水富县| 周至县| 天柱县| 仁怀市| 张掖市| 洪雅县| 乾安县| 舟曲县| 宁远县| 长汀县| 民乐县| 巴彦县| 织金县| 仙游县| 丰都县| 三都| 东平县| 长顺县| 舒兰市| 光泽县| 平谷区| 桦川县|