■ 貴州理工學(xué)院 王喜賓 趙 歡 張 森 唐文勇
大學(xué)生對社會熱點和敏感事件關(guān)注度高,轉(zhuǎn)發(fā)速度快,評論度高,網(wǎng)絡(luò)成了他們無障礙轉(zhuǎn)發(fā)與評論的重要共享平臺,導(dǎo)致高校網(wǎng)絡(luò)輿情具有高突發(fā)性、半隱蔽性等特點,并在短時間內(nèi)呈爆炸式增長,具有典型的大數(shù)據(jù)特征,為有效挖掘高校網(wǎng)絡(luò)輿情大數(shù)據(jù)中蘊含的有價值的規(guī)律提供良好機遇。
高校網(wǎng)絡(luò)輿情事件與其他輿情事件非常類似,通常會經(jīng)歷五個發(fā)展階段:潛伏期、發(fā)酵期、高潮期、衰退期和平淡期。輿情的潛伏期和發(fā)酵期是開展輿情防控的關(guān)鍵階段,能夠?qū)⑵淇刂圃诿妊繝顟B(tài),因此研究輿情的產(chǎn)生與傳播機制對輿情監(jiān)控非常有必要。
輿情網(wǎng)絡(luò)屬于一種典型的復(fù)雜社會網(wǎng)絡(luò),其傳播過程與傳染病的病毒傳播過程類似。將參與者抽象為復(fù)雜網(wǎng)絡(luò)的節(jié)點,參與者之間的關(guān)系抽象為節(jié)點之間的邊,就構(gòu)造出了便于分析的網(wǎng)絡(luò)結(jié)構(gòu)?;趶?fù)雜網(wǎng)絡(luò)構(gòu)建的高校網(wǎng)絡(luò)輿情傳播模型,有助于發(fā)現(xiàn)其中的內(nèi)在機制,挖掘輿情的產(chǎn)生和傳播規(guī)律。
首先是輿情數(shù)據(jù)獲取,可以采用網(wǎng)絡(luò)爬蟲的方式獲取,也可以通過網(wǎng)絡(luò)媒體平臺存儲的本地或在線數(shù)據(jù)獲??;其次是輿情數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)的清洗、變換、集成等,然后將處理好的、待分析的數(shù)據(jù)存放在本地或云端便于下一步分析;再次是輿情數(shù)據(jù)挖掘,主要分析輿情參與者的行為特征、輿情傳播路徑等;最后是結(jié)果可視化,將分析得到的結(jié)果以更加容易理解的方式呈現(xiàn)給管理人員。
分析高校熱點輿情數(shù)據(jù)時發(fā)現(xiàn),大部分?jǐn)?shù)據(jù)都是無標(biāo)簽數(shù)據(jù),非常不利于聚類精度的提升。為此,采用基于流形結(jié)構(gòu)的半監(jiān)督混合高斯聚類算法對熱門輿情事件進行分析,其目標(biāo)函數(shù)為:
為了提高算法在處理大規(guī)模熱點事件聚類時的性能,設(shè)計基于MapReduce的分布式并行處理方法實現(xiàn)聚類算法的高性能計算,具體如圖1所示。
圖1 基于MapReduce的半監(jiān)督聚類算法框架
通過半監(jiān)督聚類算法得到熱點輿情事件后,進一步獲得對應(yīng)的熱門話題,然后基于熱點話題研究熱點輿情傳播機制和路徑。考慮到輿情傳播特點,建立基于傳染病理論(微分動力學(xué)方法)的高校網(wǎng)絡(luò)輿情傳播模型。在輿情網(wǎng)絡(luò)中,將參與者看作節(jié)點,將聚類獲得的每個熱點話題劃分為不同區(qū)域,區(qū)域中的人群包括:易感染人群(S)—不知道輿情者、傳染人群(I)—傳播負(fù)面輿情者、潛伏人群(E)—知情者、免疫人群(R)—移除者,這些人群涉及學(xué)生、教師、輔導(dǎo)員、班主任、校領(lǐng)導(dǎo)等。假設(shè)所研究區(qū)域內(nèi)的總?cè)藬?shù)為N個恒定不變,那么隨著熱點輿情事件的公布和傳播,參與者的狀態(tài)可能會發(fā)生遷移,引起傳播過程和網(wǎng)絡(luò)結(jié)構(gòu)的變化,如圖2所示。其中,λ表示易感人群轉(zhuǎn)變成潛伏人群的概率;ω表示潛伏人群轉(zhuǎn)變成傳染人群的概率;γ表示傳染人群轉(zhuǎn)化為免疫人群的概率。從而可得SEIR病毒傳播模型的微分動力學(xué)方程,如式(2)所示。
圖2 傳統(tǒng)SEIR模型
其中,S(t)、E(t)、I(t)、R(t)分別表示t時刻 4 類人群的密度。
分析上述模型可以發(fā)現(xiàn),傳統(tǒng)的SEIR模型不能準(zhǔn)確反映網(wǎng)絡(luò)輿情的傳播規(guī)律,需要對其進行必要改造,引入其他狀態(tài)的人群,提出SEIR-ZF模型。提出的模型不僅考慮了輿情的兩種狀態(tài)(正面和負(fù)面),以及兩種輿情在傳播過程中的相互影響與抑制作用,而且還要確保各類人群在轉(zhuǎn)化時的合理性。于是將潛伏人群(E)進一步細(xì)分為知道是負(fù)面輿情但不傳播的人群(F)和知道是正面輿情但不傳播人群(Z)。理論上,免疫人群(R)到傳染人群(I)轉(zhuǎn)化的概率相對較低,其轉(zhuǎn)化率為γ2;傳染人群(I)轉(zhuǎn)化為易感染人群(S)以及免疫人群(R)轉(zhuǎn)換為易感染人群(S)的情況也可能發(fā)生,其轉(zhuǎn)化率分別為b和p,從而得到改進后的SEIR-ZF模型,如圖3所示,以及對應(yīng)的微分動力學(xué)方程如式(3)所示。
圖3 優(yōu)化后的SEIR模型
其中,F(xiàn)(t)和Z(t)分別表示t時刻知道是負(fù)面輿情但不傳播的人群(F)與知道是正面輿情但不傳播人群(Z)的密度。
根據(jù)分析需要,采用AnyLogic University軟件對優(yōu)化后的SEIR-ZF模型進行模擬仿真,并對其中的參數(shù)進行調(diào)優(yōu),以找出高校網(wǎng)絡(luò)輿情的傳播規(guī)律。通過前面分析,總結(jié)出基于數(shù)據(jù)挖掘技術(shù)和微分動力學(xué)模型的高校網(wǎng)絡(luò)輿情傳播機制分析思路:
第1步,對輿情大數(shù)據(jù)進行預(yù)處理,并采用基于分布式并行處理的半監(jiān)督聚類分析算法獲得熱門話題;
第2步,針對某一熱門話題,建立SEIR-ZF傳播模型,分析輿情傳播機制;
第3步,采用傳播模型分析軟件對所建立的模型進行仿真;
第4步,對分析結(jié)果進行可視化展示與解釋;
第5步,對于其他熱門話題,重復(fù)第2步至第4步,最終獲得所有熱門話題的傳播路徑,并對比分析獲得其中的傳播規(guī)律。
對高校網(wǎng)絡(luò)輿情科學(xué)、合理的分析是建立科學(xué)、高效的高校網(wǎng)絡(luò)輿情應(yīng)對策略的前提,并進而制定出科學(xué)的引導(dǎo)管理策略。通過收集與分析高校網(wǎng)絡(luò)輿情數(shù)據(jù),可以隨時捕獲師生以及行政人員對學(xué)校規(guī)章制度與政策等執(zhí)行效果的最直接反饋,并根據(jù)正面反饋不斷優(yōu)化育人環(huán)境,為人才培養(yǎng)營造良好氛圍。因此,高??梢愿鶕?jù)建立的輿情預(yù)測模型實現(xiàn)從被動應(yīng)對到主動管理轉(zhuǎn)變,預(yù)判網(wǎng)絡(luò)輿情的發(fā)展態(tài)勢,提高應(yīng)對效能,轉(zhuǎn)變教育引導(dǎo)方式。
高校作為培養(yǎng)新時代復(fù)合型人才的主戰(zhàn)場,不可避免地要應(yīng)對網(wǎng)絡(luò)輿情。有效運用前面構(gòu)建的高校輿情分析與預(yù)測模型,能夠提升網(wǎng)絡(luò)輿情管理的技術(shù)防范。在關(guān)鍵時期和敏感階段,深入研究與分析可能發(fā)生的事件或問題的趨勢,可以降低網(wǎng)絡(luò)輿情的發(fā)生率。在初期,提高輿情響應(yīng)的速度和效率,把網(wǎng)絡(luò)輿情扼殺在搖籃中,降低其影響范圍和程度;在爆發(fā)期,利用輿情傳播與演化動力學(xué)預(yù)測模型對網(wǎng)絡(luò)輿情進行分析和研判,做好輿情反饋、危機干預(yù)。
首先,高校作為思想政治與意識形態(tài)教育的主陣地,需要掌握主動權(quán),積極發(fā)揮馬克思主義意識形態(tài)在網(wǎng)絡(luò)陣地中的價值引領(lǐng)作用。其次,針對突發(fā)輿情事件及時分析其演化趨勢,做好通報和回應(yīng),牢牢把握網(wǎng)絡(luò)輿論的主導(dǎo)地位,發(fā)揮輿情管理的教育引導(dǎo)功能。以習(xí)近平新時代中國特色社會主義思想為引領(lǐng),不斷探索和創(chuàng)新高校思想政治教育新路徑,大力弘揚社會主義主旋律,為高校踐行“三全育人”創(chuàng)造積極、正面的網(wǎng)絡(luò)輿論環(huán)境。