摘要:智媒時(shí)代微博、抖音等網(wǎng)絡(luò)社交媒體平臺(tái)成為政府與公眾之間傳遞信息的重要渠道之一,公眾在平臺(tái)上對(duì)教育政策的評(píng)論影響著教育政策的實(shí)施進(jìn)程、效果及后續(xù)政策的出臺(tái)。融合主題模型LDA和深度學(xué)習(xí)模型LSTM,以“雙減”政策為例,挖掘面向教育政策的網(wǎng)絡(luò)社交媒體用戶評(píng)論,并對(duì)其進(jìn)行細(xì)粒度情感分析,剖析用戶對(duì)教育政策的多維主觀情感,為提升教育政策實(shí)施效果提供參考。研究發(fā)現(xiàn),網(wǎng)絡(luò)社交媒體用戶對(duì)“雙減”政策的輿論焦點(diǎn)主要集中在四個(gè)主題下的16個(gè)評(píng)論對(duì)象上,其中在素質(zhì)教育、藝術(shù)活動(dòng)、學(xué)歷3個(gè)方面用戶情感偏向于正向;在校外培訓(xùn)、課后服務(wù)、教育公平、貧富差距、就業(yè)等其余13個(gè)方面用戶情感偏向于負(fù)向。
關(guān)鍵詞:LSTM模型;LDA模型;情感分析;教育政策
中圖分類號(hào):G434 文獻(xiàn)標(biāo)識(shí)碼:A
近年來(lái)隨著微博、抖音等網(wǎng)絡(luò)社交媒體的飛速發(fā)展,國(guó)家的各種教育政策一經(jīng)頒布迅速引起社會(huì)廣泛網(wǎng)絡(luò)輿情關(guān)注,諸如《關(guān)于進(jìn)一步減輕義務(wù)教育階段學(xué)生作業(yè)負(fù)擔(dān)和校外培訓(xùn)負(fù)擔(dān)的意見(jiàn)》《校外培訓(xùn)行政處罰暫行辦法》等。教育政策是由政府及其機(jī)構(gòu)和官員制定的、調(diào)整教育領(lǐng)域社會(huì)問(wèn)題和社會(huì)關(guān)系的公共政策[1],對(duì)實(shí)現(xiàn)教育公平,進(jìn)而實(shí)現(xiàn)社會(huì)公平有很大助益,可以為每個(gè)人提供平等的機(jī)會(huì),使得每個(gè)人都能夠獲得優(yōu)質(zhì)的教育資源,幫助他們更好地適應(yīng)社會(huì)和就業(yè)市場(chǎng)。然而,教育政策在積極推動(dòng)構(gòu)建良好教育體系的同時(shí),也引發(fā)一些現(xiàn)實(shí)問(wèn)題,讓人們對(duì)教育政策的制定及實(shí)施產(chǎn)生負(fù)面輿論,這些輿論導(dǎo)致教育政策執(zhí)行和決策的變化[2],給教育改革帶來(lái)了新的問(wèn)題。因此,挖掘網(wǎng)絡(luò)社交媒體用戶針對(duì)教育政策的評(píng)論文本,從用戶所談及的各方面對(duì)相關(guān)評(píng)論文本做細(xì)粒度情感分析,并及時(shí)針對(duì)用戶輿論調(diào)整教育政策的決策和實(shí)施,對(duì)全面推進(jìn)教育改革具有重要的價(jià)值和意義。
用戶評(píng)論細(xì)粒度情感分析是通過(guò)對(duì)用戶評(píng)論主題抽取、情感分析,實(shí)現(xiàn)更加精準(zhǔn)的情感分類。目前針對(duì)教育政策產(chǎn)生的輿論進(jìn)行情感分析的研究較少,已有研究大多關(guān)注一般領(lǐng)域的輿論情感分析。部分學(xué)者嘗試將主題抽取模型與情感分析模型相結(jié)合對(duì)文本內(nèi)容的情感分析。如彭云等[3]構(gòu)建了一種名為SWS-LDA的主題模型,以期提高對(duì)特征詞、情感詞和它們之間關(guān)系的識(shí)別能力,進(jìn)而提高該主題模型的情感極性分類準(zhǔn)確性。蘇瑩等[4]結(jié)合了樸素貝葉斯模型和隱含狄利克雷分布模型,能夠在不需要篇章和句子級(jí)別的標(biāo)注信息的條件下,只需使用適當(dāng)?shù)那楦性~典就可以分析網(wǎng)絡(luò)評(píng)論的情感傾向。另有部分學(xué)者利用基于機(jī)器學(xué)習(xí)的情感分析方法,包括深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)等[5],通過(guò)在原基礎(chǔ)上不斷改進(jìn)算法以實(shí)現(xiàn)對(duì)評(píng)論的細(xì)粒度情感分類。如王義等[6]提出了一種細(xì)粒度多通道卷積神經(jīng)網(wǎng)絡(luò)模型,以詞性向量和細(xì)粒度字向量為輔助輸入,使用原始詞向量來(lái)捕獲句子間的語(yǔ)義信息,從而實(shí)現(xiàn)更加準(zhǔn)確的文本情感分析。李慧等[7]、蔡慶平等[8]分別基于CNN構(gòu)建了不同的面向產(chǎn)品評(píng)論的細(xì)粒度情感分析模型,從而能夠比較全面地獲得產(chǎn)品評(píng)論中有關(guān)多方面產(chǎn)品特征的情感傾向。針對(duì)教育政策用戶評(píng)論情感分析的研究,偏重于改良或融合已有的理論或技術(shù)進(jìn)行情感分類。例如,李沅靜等[9]利用樸素貝葉斯、支持向量機(jī)等四種模型對(duì)“雙減”短文本評(píng)論進(jìn)行情感分析。辛明遠(yuǎn)等[10]將LDA模型中得到的主題向量與BERT詞向量模型相結(jié)合,并融入CNN卷積層處理,對(duì)“雙減”政策的輿論進(jìn)行分類和提取主題詞。已有相關(guān)研究中,部分與主題抽取相結(jié)合進(jìn)行情感分析,另一部分側(cè)重于從模型入手改進(jìn)具體算法,仍以傳統(tǒng)的情感強(qiáng)度值為依據(jù)劃分情感,從而得到細(xì)粒度情感分析結(jié)果。上述情感分析方法雖然從整體上細(xì)化了用戶對(duì)某一教育政策的態(tài)度,但無(wú)法全面地呈現(xiàn)用戶在特定方面的不同情感。因此,本研究擬將深度學(xué)習(xí)模型中的LSTM(Long ShortTerm Memory,長(zhǎng)短期記憶)模型與LDA(Latent Dirichlet Allocation,隱含狄利克雷分布)主題模型相結(jié)合,挖掘網(wǎng)絡(luò)社交媒體用戶對(duì)某一教育政策的用戶評(píng)論,實(shí)現(xiàn)在各輿論主題下多個(gè)方面的細(xì)粒度情感分類,以期助力政策制定者更深入地了解公眾的需求和關(guān)注點(diǎn),為后續(xù)政策的全面落實(shí)提供參考依據(jù),并通過(guò)情感分析獲得的數(shù)據(jù)調(diào)整政策宣傳和推廣的方式,切實(shí)增強(qiáng)公眾對(duì)教育政策的認(rèn)同感和滿意度。
(一)理論基礎(chǔ)
深度學(xué)習(xí)LSTM模型由Sepp Hochreiter和Jurgen Schmidhuber提出[11],后被Alex Graves、Haim Sak等人逐步改進(jìn)并予以應(yīng)用,是RNN(Recursive Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò))的一種特殊類型,具有記憶長(zhǎng)短期信息能力的神經(jīng)網(wǎng)絡(luò)。相較于RNN,LSTM解決了長(zhǎng)期依賴問(wèn)題,可以學(xué)習(xí)長(zhǎng)期依賴信息。LSTM模型的核心是由一個(gè)記憶單元和三個(gè)門組成的重復(fù)模塊[12],通過(guò)門對(duì)記憶單元狀態(tài)進(jìn)行刪除或添加信息。記憶單元能夠使LSTM模型存儲(chǔ)、讀取、重置和更新長(zhǎng)距離歷史信息,輸入門控制信息是否流入記憶單元中,遺忘門控制上一時(shí)刻記憶單元中的信息是否需要積累到當(dāng)前時(shí)刻的記憶單元中,輸出門則決定當(dāng)前時(shí)刻記憶單元中的信息是否應(yīng)該流入當(dāng)前隱藏狀態(tài)中。這些機(jī)制協(xié)同工作,使LSTM具有更好的處理長(zhǎng)時(shí)間序列數(shù)據(jù)的能力,其結(jié)構(gòu)如圖1所示。
其中,Bt-1是單元狀態(tài),表示長(zhǎng)期記憶,可以控制信息傳遞給下一時(shí)刻;ht-1是上一次的狀態(tài),表示短期記憶;xt指本次輸入;ft、it、ot分別為遺忘門、輸入門和輸出門。
(二)研究設(shè)計(jì)
本研究構(gòu)建了一個(gè)融合深度學(xué)習(xí)LSTM模型和主題抽取LDA模型的教育政策用戶評(píng)論細(xì)粒度情感分析框架,包括用戶評(píng)論采集、評(píng)論文本預(yù)處理、基于LDA模型主題抽取、基于主題詞的評(píng)論文本分類、基于LSTM模型情感分類5個(gè)模塊,具體如圖2所示。
1.教育政策用戶評(píng)論數(shù)據(jù)采集與預(yù)處理
數(shù)據(jù)收集與預(yù)處理主要包括數(shù)據(jù)采集、清洗和預(yù)處理三階段,其中數(shù)據(jù)預(yù)處理分為中文分詞和去停用詞兩個(gè)步驟,從而形成可進(jìn)行情感分析和挖掘文本主題的語(yǔ)料庫(kù)。首先,利用文本采集工具抓取微博、抖音、嗶哩嗶哩、知乎等網(wǎng)絡(luò)社交媒體中用戶有關(guān)某一教育政策的生成內(nèi)容;然后,對(duì)數(shù)據(jù)做如下處理:(1)去重文本數(shù)據(jù)。由于抓取的評(píng)論數(shù)據(jù)會(huì)存在重復(fù)值,需要將重復(fù)的評(píng)論數(shù)據(jù)剔除,確保數(shù)據(jù)的唯一性。此外,對(duì)于評(píng)論中存在連續(xù)重復(fù)的詞匯表達(dá)時(shí),如“支持支持支持支持支持”,將其壓縮為“支持”。(2)清洗文本數(shù)據(jù)。部分評(píng)論可能無(wú)法采集完整,即為缺失評(píng)論;再者,部分評(píng)論文不對(duì)題,或者僅使用特殊符號(hào)、顏文字、表情包等,此視為無(wú)效評(píng)論;另有部分評(píng)論內(nèi)容極為簡(jiǎn)短,使用無(wú)意義的詞匯,如“哈哈”“無(wú)語(yǔ)”等,無(wú)法識(shí)別出其具體表意,本研究也將其視為無(wú)效評(píng)論。清洗數(shù)據(jù)即刪除信息缺失、無(wú)效的評(píng)論。(3)中文分詞。利用Python中的Jieba分詞包對(duì)用戶評(píng)論數(shù)據(jù)進(jìn)行分詞。(4)去停用詞。停用詞是指在不同文本內(nèi)容中出現(xiàn)頻率較高的,但不具備實(shí)質(zhì)性意義的詞語(yǔ)或符號(hào),例如“只是”“如果”“可以”等詞,以及各種標(biāo)點(diǎn)符號(hào)、數(shù)字等,通常在進(jìn)行文本處理任務(wù)如分類、聚類、情感分析等前,需要對(duì)文本進(jìn)行去停用詞處理,減少冗余信息,提高分析的精度和效度。使用基于詞表的去除法,將分詞后的詞語(yǔ)與停用詞表進(jìn)行比較,如果在分詞結(jié)果中有存在于停用詞表中的詞語(yǔ),則將其刪除。
2.基于LDA模型的教育政策用戶評(píng)論主題抽取
LDA模型是一種文檔主題生成模型,屬于無(wú)監(jiān)督學(xué)習(xí)模型,包含詞項(xiàng)、主題和文檔三層結(jié)構(gòu),可以用來(lái)識(shí)別大規(guī)模文檔集或語(yǔ)料庫(kù)中潛藏的主題信息。它采用了詞袋方法,將每一篇文檔視為一個(gè)詞頻向量,從而將文本信息轉(zhuǎn)化為易于建模的數(shù)字信息。將每篇文檔看作各種隱含主題的混合,而每個(gè)主題則表現(xiàn)為與該主題相關(guān)的詞項(xiàng)的概率分布[13]。在實(shí)際分析過(guò)程中,先通過(guò)現(xiàn)有的文章訓(xùn)練出LDA模型,提取出相應(yīng)的主題,再用模型預(yù)測(cè)新的文章所屬主題分類。
基于LDA模型進(jìn)行主題聚類的主要目的是通過(guò)對(duì)網(wǎng)絡(luò)社交媒體用戶評(píng)論的主題挖掘,得到聚類后的主題及每個(gè)主題下的主要關(guān)鍵詞,從中得知網(wǎng)絡(luò)社交媒體用戶在談及某一教育政策時(shí)所關(guān)注的各個(gè)方面,為后續(xù)進(jìn)行細(xì)粒度情感分析劃分多層次維度提供依據(jù)。(1)LDA模型參數(shù)及最佳主題數(shù)選擇。Dirichlet先驗(yàn)α和β常按照經(jīng)驗(yàn)值進(jìn)行設(shè)置,而主題個(gè)數(shù)的取值對(duì)于模型性能和主題挖掘效果有著重要影響。目前相關(guān)研究在確定主題數(shù)時(shí)通常基于先驗(yàn)知識(shí)對(duì)文檔包含的主題數(shù)進(jìn)行初步估計(jì),再結(jié)合困惑度、一致性以及主題間相似度等質(zhì)量評(píng)價(jià)方法做出選擇[14]。困惑度的大小與模型性能成反比,一致性的大小與模型性能成正比。本研究先根據(jù)經(jīng)驗(yàn)判斷主題個(gè)數(shù),進(jìn)而訓(xùn)練LDA模型,計(jì)算一致性數(shù)值,然后使用pyLDAvis包對(duì)模型進(jìn)行可視化,根據(jù)呈現(xiàn)的主題氣泡分布情況,確定最終主題個(gè)數(shù)。(2)LDA模型構(gòu)建。使用TF-IDF算法在文本預(yù)處理后的語(yǔ)料中提取關(guān)鍵詞,生成詞頻矩陣;通過(guò)LdaModel函數(shù)構(gòu)建LDA模型,設(shè)定合適的主題數(shù)、迭代次數(shù)等參數(shù);為了使聚類結(jié)果更加直觀,利用pyLDAvis包對(duì)結(jié)果進(jìn)行可視化,呈現(xiàn)各個(gè)主題在模型空間中的相互關(guān)系和重要性;為提高模型質(zhì)量,可多次調(diào)整參數(shù)迭代訓(xùn)練,完成LDA主題聚類。
3.基于主題詞的教育政策用戶評(píng)論文本細(xì)粒度劃分
根據(jù)得到的最佳主題數(shù)對(duì)已抽取的主題詞進(jìn)行篩選,并據(jù)此對(duì)預(yù)處理后的用戶評(píng)論進(jìn)行歸類,實(shí)現(xiàn)評(píng)論文本的細(xì)粒度劃分,為后續(xù)采用LSTM對(duì)面向教育政策的用戶評(píng)論進(jìn)行細(xì)粒度情感分析做準(zhǔn)備。(1)主題詞篩選。通過(guò)LDA主題模型算法確定最佳的主題數(shù),抽取出與之相關(guān)的主題詞,去除重復(fù)、無(wú)關(guān)、低頻主題詞,構(gòu)建更具意義的主題類別。(2)將評(píng)論切分成短句。對(duì)于每條用戶評(píng)論,根據(jù)標(biāo)點(diǎn)符號(hào)將其拆分成若干個(gè)短句,以達(dá)到更細(xì)粒度的文本表示,提高后續(xù)細(xì)粒度情感分析的精確度。在拆分時(shí)需注意,同一句話內(nèi)部出現(xiàn)多次標(biāo)點(diǎn)符號(hào),需要基于語(yǔ)法規(guī)則進(jìn)行修正,并去除短句中的空格、制表符和回車符等不必要的空白字符。(3)短句文本分類。將切分后的評(píng)論短句按照主題詞進(jìn)行歸類,將包含該類別主題詞的所有短句視為同一個(gè)類別。
4.基于深度學(xué)習(xí)模型LSTM的教育政策用戶文本情感分析
為獲取網(wǎng)絡(luò)社交媒體用戶對(duì)教育政策多層面的情感態(tài)度,本研究采用深度學(xué)習(xí)模型中的LSTM模型對(duì)各主題下的網(wǎng)絡(luò)社交媒體用戶評(píng)論文本進(jìn)行正向、負(fù)向情感極性分析。首先,需要將原評(píng)論文本按主題分類,部分評(píng)論可能出現(xiàn)在不同的主題下;然后,按照上述預(yù)處理步驟再次對(duì)文本內(nèi)容進(jìn)行分詞和去停用詞;最后,構(gòu)建LSTM模型,分別判斷不同主題下各類文本的情感傾向,數(shù)值趨近0為負(fù)向,趨近1為正向。
LSTM模型構(gòu)建過(guò)程:
(1)使用詞向量訓(xùn)練模型Word2Vec訓(xùn)練語(yǔ)料以獲得詞向量。Word2Vec能夠?qū)⒂晌谋巨D(zhuǎn)化為的稀疏矩陣的向量維數(shù)進(jìn)行縮減,從而得到每個(gè)詞所對(duì)應(yīng)的低維向量,即詞嵌入過(guò)程,這種低維向量更適合深度學(xué)習(xí)模型的訓(xùn)練。
(2)導(dǎo)入torch庫(kù)構(gòu)建深度學(xué)習(xí)模型。LSTM模型的參數(shù)中有三個(gè)是必須設(shè)置的:一是輸入特征維度input_size,如果將一個(gè)句子作為輸入,每個(gè)詞都被轉(zhuǎn)換為一個(gè)向量,則該值為每個(gè)詞向量的維度;二是隱藏層狀態(tài)的維度hidden_size,即每個(gè)時(shí)間步長(zhǎng)LSTM單元輸出的狀態(tài)向量的維度,通常會(huì)根據(jù)數(shù)據(jù)集的大小和模型的復(fù)雜度來(lái)設(shè)置該參數(shù);三是LSTM堆疊的層數(shù)num_layers,該值越大,模型的復(fù)雜度越高,但同時(shí)也會(huì)增加訓(xùn)練時(shí)間和計(jì)算資源的消耗。需要注意的是,LSTM還有其他可供設(shè)置的參數(shù),如序列長(zhǎng)度、Dropout率等,這些參數(shù)的設(shè)置要根據(jù)具體任務(wù)需求和數(shù)據(jù)情況進(jìn)行調(diào)整。
(3)定義BCELoss損失函數(shù)和Adam優(yōu)化器。nn.BCELoss()是二分類交叉熵?fù)p失函數(shù),模型只能輸出兩種可能的結(jié)果,如正面情緒和負(fù)面情緒、垃圾郵件和非垃圾郵件等,將數(shù)據(jù)標(biāo)簽定義為0和1,其中0代表第一種輸出,1代表第二種輸出。torch.optim.Adam()是Adam優(yōu)化算法的實(shí)現(xiàn),用于更新模型的權(quán)重和偏置等參數(shù),在使用torch.optim.Adam()時(shí),需要將模型的參數(shù)傳入,同時(shí)可以設(shè)置學(xué)習(xí)率、權(quán)重衰減因子、動(dòng)量參數(shù)等超參數(shù)。
(4)迭代訓(xùn)練LSTM模型,在每個(gè)epoch循環(huán)中,先將數(shù)據(jù)輸入模型進(jìn)行前向計(jì)算,然后根據(jù)預(yù)測(cè)結(jié)果和真實(shí)標(biāo)簽計(jì)算損失,并進(jìn)行反向傳播更新模型參數(shù)。同時(shí)訓(xùn)練過(guò)程中會(huì)輸出測(cè)驗(yàn)后的loss、accuracy等信息,可根據(jù)這些信息重新定義參數(shù),再次訓(xùn)練模型。
5.結(jié)果評(píng)價(jià)
將上述研究框架應(yīng)用于具體教育政策進(jìn)行細(xì)粒度情感分析,并采用各類指標(biāo)對(duì)分析結(jié)果進(jìn)行評(píng)價(jià),包括對(duì)LDA主題抽取結(jié)果和LSTM情感分析結(jié)果的評(píng)價(jià)。
LDA主題抽取的目的是將文本數(shù)據(jù)劃分為多個(gè)主題,并進(jìn)一步了解這些主題的內(nèi)容和特征。評(píng)價(jià)LDA主題抽取結(jié)果的方法和標(biāo)準(zhǔn)具體取決于分析的目的,以下為常用于評(píng)價(jià)LDA主題抽取結(jié)果的指標(biāo)[15]:(1)主題的數(shù)量:主題的數(shù)量影響到了LDA模型的復(fù)雜度和解釋性,如果主題數(shù)量過(guò)多,可能會(huì)使得主題之間的界限變得模糊不清,難以解釋;反之,如果主題數(shù)量過(guò)少,則可能無(wú)法涵蓋所有關(guān)鍵信息。(2)單詞分布:主題中所包含單詞的分布也是一個(gè)重要的指標(biāo),主題內(nèi)部單詞的分布應(yīng)該盡量集中在某些關(guān)鍵詞上,而非分布均勻、散落不定。(3)主題一致性和可解釋性:在各個(gè)主題之間應(yīng)該確保連貫性,即每個(gè)主題所包含的單詞都應(yīng)該與整個(gè)主題相關(guān)聯(lián),對(duì)于每個(gè)主題來(lái)說(shuō),需要檢查其包含的單詞是否能夠解釋該主題所代表的內(nèi)容,如果主題中包含的單詞沒(méi)有明顯的共性,可能會(huì)造成解釋上的困難。
LSTM情感分類的目的是對(duì)文本數(shù)據(jù)進(jìn)行情感判斷,并將其歸類為積極、消極或中性等不同類別。評(píng)價(jià)LSTM情感分類結(jié)果需要根據(jù)具體需求選取適合的評(píng)價(jià)指標(biāo)進(jìn)行綜合考慮,以確保分類結(jié)果的準(zhǔn)確性和可靠性,以下是一些常見(jiàn)的指標(biāo)[16]:(1)準(zhǔn)確率:通過(guò)準(zhǔn)確率可以很好地反映出模型的整體分類效果,但可能會(huì)受到數(shù)據(jù)集分布不均等問(wèn)題的影響,因此需要結(jié)合其他評(píng)價(jià)指標(biāo)進(jìn)行綜合分析。(2)精確率和召回率:用于評(píng)估二元分類模型性能的兩個(gè)重要指標(biāo),這兩個(gè)指標(biāo)結(jié)合使用可以更全面地評(píng)估分類器表現(xiàn),需要根據(jù)具體情況權(quán)衡取舍。(3)F1值:F1值是精確率和召回率的調(diào)和平均值,可以對(duì)分類器的性能進(jìn)行綜合評(píng)估。
(一)數(shù)據(jù)采集與預(yù)處理
使用八爪魚(yú)采集器抓取來(lái)自微博、知乎、抖音、嗶哩嗶哩等網(wǎng)絡(luò)社交媒體有關(guān)“雙減”政策的評(píng)論,具體包括的字段有:評(píng)論內(nèi)容、用戶名、發(fā)表時(shí)間、開(kāi)課階段、點(diǎn)贊數(shù),采集完成后將數(shù)據(jù)導(dǎo)出。共抓取了22876條評(píng)論數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)去重和清洗后獲得有效數(shù)據(jù)18189條,部分采集數(shù)據(jù)如表1所示。
使用jieba庫(kù)進(jìn)行分詞處理。為使分詞結(jié)果更加確切有效,在詞典中添加“雙減政策”“素質(zhì)教育”“培訓(xùn)機(jī)構(gòu)”等自定義詞匯;調(diào)用jieba.cut函數(shù),設(shè)置分詞模式為精準(zhǔn)模式進(jìn)行分詞;由于單字詞包含信息量較少,需將單字詞過(guò)濾掉;在分詞處理后,選用百度停用詞表,剔除分詞結(jié)果中的特殊符號(hào)等無(wú)實(shí)質(zhì)性意義詞匯,得到最終的分詞結(jié)果。部分評(píng)論分詞結(jié)果如圖3所示。
(二)用戶評(píng)論主題抽取
利用Python擬合LDA模型。首先根據(jù)文本內(nèi)容主題分布情況粗略設(shè)定主題數(shù)為10,遍歷語(yǔ)料庫(kù)的次數(shù)為100,列出在線評(píng)論集合中最重要的10個(gè)主題及每個(gè)主題的若干關(guān)鍵詞,進(jìn)而進(jìn)行可視化處理。由于聚類出的主題交疊現(xiàn)象較為嚴(yán)重,為選取最佳主題數(shù),通過(guò)計(jì)算一致性數(shù)值,并繪制主題-coherence曲線,選擇最佳主題數(shù)為4。最終抽取4類主題。
根據(jù)主題聚類結(jié)果,得到表2所示的四個(gè)主題及每個(gè)主題下最重要的10個(gè)主題特征詞。
(三)用戶評(píng)論文本分類
對(duì)上述抽取出的主題詞進(jìn)行篩選,去除無(wú)研究意義的詞匯,將表意重復(fù)的多個(gè)主題詞聚類為一個(gè)詞語(yǔ)作為所要進(jìn)行情感分析的層面之一,最終聚合為每個(gè)主題下的4個(gè)評(píng)論對(duì)象,如表3所示。
將評(píng)論文本切分成短句,對(duì)切分后的句子進(jìn)行修正,并去除短句中的空格、制表符和回車符等不必要的空白字符,同時(shí)設(shè)定短句長(zhǎng)度最小值為5,刪除無(wú)具體意義的過(guò)短語(yǔ)句,從而使每個(gè)短句語(yǔ)義完整且僅涉及對(duì)“雙減”政策一個(gè)方面的意見(jiàn)。具體切分實(shí)例如表4所示。
根據(jù)評(píng)論對(duì)象對(duì)切分后的評(píng)論文本進(jìn)行篩選,包含同一評(píng)論對(duì)象的短句作為一個(gè)類別,從而完成用戶針對(duì)“雙減”政策輿論的細(xì)粒度劃分。
(四)主題文本情感分析
將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,占比為9:1。導(dǎo)入必要的torch、gensim等庫(kù),加載數(shù)據(jù),預(yù)訓(xùn)練得到Word2Vec詞向量。在定義LSTM模型類時(shí),傳入以下參數(shù):learning_rate=5e-4;input_size=768;num_ epoches=5;batch_size=100;embed_size=64;hidden_ size=64;num_layers=2,迭代訓(xùn)練神經(jīng)網(wǎng)絡(luò),并在測(cè)試集進(jìn)行效果檢驗(yàn)。本研究采用準(zhǔn)確率(Precision)、召回率(Recall)和F1值(f1-score)評(píng)估分類模型性能,模型評(píng)估結(jié)果如表5所示。從表5可以看出負(fù)向情感和正項(xiàng)情感分別訓(xùn)練模型結(jié)果在準(zhǔn)確率上分別為0.83和0.89,總體的F1值也達(dá)到了0.87,達(dá)到良好的效果。每個(gè)主題下的準(zhǔn)確率(Precision)、召回率(Recall)和F1值的Macro Average(宏平均)值均在0.8以上,達(dá)到良好的水平。Weighted Average(加權(quán)平均)是指對(duì)每個(gè)主題類別分別計(jì)算指標(biāo),然后取這些指標(biāo)的加權(quán)平均值。從加權(quán)平均值計(jì)算結(jié)果也可以看出均為0.87,達(dá)到了良好的效果。AUC用于衡量分類器對(duì)于區(qū)分兩個(gè)類(正類和負(fù)類)的能力,介于0和1之間,其值越高表示模型的分類性能越好。從表5的計(jì)算結(jié)果看出AUC值為0.931,說(shuō)明模型在進(jìn)行正負(fù)類分類時(shí),效果非常好。綜上所述,本研究構(gòu)建的主題情感細(xì)粒度分類模型具有良好的分類效果。
利用已訓(xùn)練完成的LSTM模型,輸入各類別下的文本內(nèi)容,判斷用戶評(píng)論的情感傾向,統(tǒng)計(jì)四類主題下相關(guān)評(píng)價(jià)對(duì)象正向、負(fù)向情感的評(píng)論比例。如表6所示,得到具體主題詞的情感量化值,例如用戶在“素質(zhì)教育”的話題評(píng)論中明顯的偏向于正向,而在 “升學(xué)考試”話題中的評(píng)論情感則偏向于負(fù)向。因此,出于用戶對(duì)“雙減”政策的情感需求,相關(guān)機(jī)構(gòu)在促進(jìn)政策落實(shí)時(shí),需要重點(diǎn)關(guān)注該政策對(duì)中考高考的消極影響,并在下一步執(zhí)行計(jì)劃中實(shí)施改進(jìn)措施。
(五)結(jié)果討論與分析
1.用戶對(duì)主題1下“校外培訓(xùn)”“中考高考”“社會(huì)工作”“補(bǔ)課家教”四個(gè)方面輿論的評(píng)價(jià)情感傾向均偏向于負(fù)向
首先,“雙減”政策明確規(guī)定了義務(wù)教育階段教育質(zhì)量保障機(jī)制,將禁止校外培訓(xùn)機(jī)構(gòu)開(kāi)展與義務(wù)教育階段內(nèi)容和形式相關(guān)的培訓(xùn)業(yè)務(wù),這意味著校外培訓(xùn)機(jī)構(gòu)無(wú)法再在中小學(xué)教育領(lǐng)域大肆招生,可能會(huì)導(dǎo)致一些校外培訓(xùn)機(jī)構(gòu)生存壓力增加或者面臨關(guān)閉,增加一批失業(yè)人員?!半p減”政策實(shí)施后,不僅校外培訓(xùn)機(jī)構(gòu)會(huì)受到?jīng)_擊,普通中學(xué)升學(xué)考試科目和升學(xué)政策也可能會(huì)有所調(diào)整,這些變化都會(huì)影響到中考和高考的錄取標(biāo)準(zhǔn)和招生政策[17]。對(duì)校外培訓(xùn)有較強(qiáng)依賴性的學(xué)生將會(huì)面臨更大的學(xué)業(yè)困難,許多學(xué)生家長(zhǎng)想通過(guò)讓孩子參加校外培訓(xùn)提高學(xué)習(xí)成績(jī)的計(jì)劃被阻塞,這引起了眾多家長(zhǎng)和學(xué)生的不滿,這也間接導(dǎo)致一批學(xué)生放棄升學(xué),被迫早早地進(jìn)入社會(huì)謀求工作,尤其是家境普通的學(xué)生。對(duì)于家境殷實(shí)的家庭,家長(zhǎng)可能會(huì)采取較為隱蔽的方式,花較高的價(jià)錢聘請(qǐng)學(xué)歷高、能力強(qiáng)的一對(duì)一家教,這在某種程度上加劇了教育資源分配不均衡的現(xiàn)象[18],造成優(yōu)勢(shì)學(xué)生與劣勢(shì)學(xué)生之間的差距進(jìn)一步拉大。特別是在當(dāng)下,學(xué)歷已然成為職業(yè)崗位的敲門磚,那些放棄升學(xué)的人也會(huì)面臨巨大的就業(yè)壓力。
2.用戶對(duì)主題2下“作業(yè)”“課后服務(wù)”“假期周末”“教師負(fù)擔(dān)”四個(gè)方面的輿論均偏向于負(fù)向情感
據(jù)現(xiàn)有調(diào)查研究顯示,該政策實(shí)施后中小學(xué)生作業(yè)量明顯減少。這在一定程度上緩解了學(xué)生焦慮情緒[19]。但研究結(jié)果顯示,61%的家長(zhǎng)和學(xué)生表示政策實(shí)施后在作業(yè)減負(fù)方面并沒(méi)有起到一定的效果。有許多學(xué)校將超負(fù)的部分作業(yè)轉(zhuǎn)化為各種形式發(fā)布給學(xué)生,從表面看學(xué)生的書(shū)面作業(yè)確實(shí)減少了,但學(xué)生的作業(yè)壓力并沒(méi)有減少。在“課后服務(wù)”方面,根據(jù)孟晶等[20]對(duì)小學(xué)教師課后服務(wù)認(rèn)同現(xiàn)狀的調(diào)查,存在教師對(duì)學(xué)校課后服務(wù)的執(zhí)行方式認(rèn)同偏低、學(xué)校課后服務(wù)的執(zhí)行主體單一、學(xué)校課后服務(wù)的內(nèi)容脫離教師實(shí)踐等一系列問(wèn)題。部分人認(rèn)為課后服務(wù)是形存實(shí)亡,例如,學(xué)校利用課后服務(wù)時(shí)間并不是在幫助學(xué)生鞏固復(fù)習(xí)、輔導(dǎo)作業(yè),而是強(qiáng)制要求學(xué)生參加以便于老師講解新課,而且有很多學(xué)生抱怨課后服務(wù)的時(shí)間過(guò)長(zhǎng)。張妍等[21]也認(rèn)為義務(wù)教育學(xué)校課后服務(wù)仍面臨課后服務(wù)制度規(guī)范亟待完善、課后服務(wù)人員權(quán)責(zé)有待厘清、課后服務(wù)保障體系有待健全等現(xiàn)實(shí)難題。若不抓緊解決這些問(wèn)題,不僅不會(huì)減壓,反而會(huì)增加學(xué)生的學(xué)業(yè)壓力。不僅如此,“雙減”政策在某些方面也加重了教師的負(fù)擔(dān),教師在完成日常的教學(xué)任務(wù)之后,會(huì)以監(jiān)督學(xué)生完成作業(yè)的方式參與課后服務(wù)工作,這種延時(shí)工作難免會(huì)讓教師感到時(shí)間緊張,難以合理分配精力。在“假期周末”方面,部分人表示由于早已習(xí)慣了在假期、周末補(bǔ)課,在取消校外培訓(xùn)后自己在放假期間無(wú)所事事;部分人表示原本計(jì)劃在周末的補(bǔ)課被迫調(diào)整到了學(xué)周中,或者有的直接沒(méi)有做任何調(diào)整,仍然利用周末假期進(jìn)行補(bǔ)課,并沒(méi)有達(dá)到減負(fù)的效果。
3.用戶對(duì)主題3下的輿論在“地區(qū)差異”“教育公平”“貧富差距”方面為負(fù)向情感,在“素質(zhì)教育”方面偏向于正向情感
用戶輿論在“地區(qū)差異”“教育公平”“貧富差距”方面的情感偏向于負(fù)面,反映了現(xiàn)有教育資源不均衡、教育不公平等缺陷,引起該現(xiàn)象產(chǎn)生的因素即為地區(qū)差異、貧富差距,而這兩個(gè)因素同時(shí)也是導(dǎo)致用戶負(fù)面情感出現(xiàn)的具體原因。
首先,在一些較為發(fā)達(dá)的一線城市,如北京、上海等地作為政策試點(diǎn)地區(qū),“雙減”政策相對(duì)落實(shí)到位,相關(guān)部門對(duì)政策實(shí)施過(guò)程進(jìn)行全面監(jiān)管,同時(shí)創(chuàng)新各種舉措,不斷探索政策落地途徑。而在其他不同的地區(qū),政策的落實(shí)情況及面對(duì)的難題也各有不同,例如根據(jù)江西省教研室的調(diào)查顯示,97.8%的學(xué)生學(xué)習(xí)及整體狀況呈現(xiàn)出良好的態(tài)勢(shì),但65.31%的教師表示工作負(fù)擔(dān)加重,也要求學(xué)校整體改進(jìn)教育教學(xué)制度[22];據(jù)昆明市相關(guān)部門的調(diào)研,雖然有超過(guò)95%的學(xué)生和家長(zhǎng)對(duì)昆明市“雙減”工作滿意,但僅有29.59%的學(xué)生認(rèn)為沒(méi)有作業(yè)負(fù)擔(dān),47.28%的學(xué)生不參加校外培訓(xùn)[23]。同時(shí),由于城鄉(xiāng)教育發(fā)展的不均衡以及農(nóng)村優(yōu)質(zhì)教學(xué)資源的短缺,使得“雙減”政策在農(nóng)村與城市的實(shí)施無(wú)法一概而論[24],“雙減”工作在鄉(xiāng)鎮(zhèn)學(xué)校的推進(jìn)仍存在問(wèn)題。陸芳等對(duì)比城市和鄉(xiāng)鎮(zhèn)教師就“雙減”政策落實(shí)情況的評(píng)估,采用卡方檢驗(yàn)獲得的結(jié)果表明,城市學(xué)校實(shí)施課后服務(wù)的比例顯著高于鄉(xiāng)鎮(zhèn),而更多的鄉(xiāng)鎮(zhèn)教師認(rèn)為“雙減”實(shí)施后“基本沒(méi)有變化”[25]。由此可知,“雙減”工作的開(kāi)展情況存在一定的城鄉(xiāng)差異。
此外,貧富差距影響著教育資源的獲得。自“雙減”政策發(fā)布以來(lái),我國(guó)對(duì)校外培訓(xùn)機(jī)構(gòu)進(jìn)行了大力壓縮,有證機(jī)構(gòu)積極轉(zhuǎn)型調(diào)整,而無(wú)證機(jī)構(gòu)則完全停止了培訓(xùn)行為,扭轉(zhuǎn)了校外培訓(xùn)過(guò)多過(guò)濫的局面,學(xué)科類培訓(xùn)機(jī)構(gòu)大幅壓減[26]。這就導(dǎo)致大部分平價(jià)且小有成效的校外教育機(jī)構(gòu)要接受改制調(diào)整,同時(shí)引起家長(zhǎng)焦慮,在這種局面的刺激下較為富裕的家庭爭(zhēng)先招聘學(xué)歷高、能力強(qiáng)的私人家教,而一對(duì)一輔導(dǎo)所要花費(fèi)的金額遠(yuǎn)遠(yuǎn)超過(guò)之前的大班授課,大部分普通家庭難以承擔(dān)這筆支出,因此會(huì)在一定程度上拉大貧富兩類家庭孩子的教育水平,引發(fā)了新的教育公平問(wèn)題。
在“素質(zhì)教育”方面用戶評(píng)論的情感傾向偏向于正向,雖然“雙減”政策會(huì)對(duì)素質(zhì)教育的發(fā)展帶來(lái)挑戰(zhàn),但大部分群眾都認(rèn)為“雙減”政策對(duì)于推進(jìn)素質(zhì)教育具有積極的促進(jìn)作用,例如,學(xué)校能夠通過(guò)優(yōu)化課程設(shè)置、增加運(yùn)動(dòng)場(chǎng)地和基礎(chǔ)設(shè)施等方式,開(kāi)展多元化的課外活動(dòng)、設(shè)計(jì)并組織各種形式的文體娛樂(lè)項(xiàng)目以及提供豐富的實(shí)踐機(jī)會(huì)等,以充分發(fā)掘?qū)W生的個(gè)性和特長(zhǎng),培養(yǎng)學(xué)生的創(chuàng)新精神和實(shí)踐能力,從而促進(jìn)學(xué)生的全面發(fā)展?!半p減”政策還會(huì)協(xié)調(diào)家校社共同推進(jìn)素質(zhì)教育發(fā)展。不少學(xué)校為落實(shí)好“雙減”政策進(jìn)行教育教學(xué)改革的實(shí)踐探索。讓“學(xué)?;貧w教育主陣地”是家校社協(xié)同育人的根本前提,因此該政策能夠密切家校社合作關(guān)系,實(shí)現(xiàn)家校社協(xié)同育人功能[27]。此外,也有利于轉(zhuǎn)變教育觀念、改進(jìn)教學(xué)模式,最重要的是遏制了私立教育的無(wú)限發(fā)展,縮小了教育差距。由此看來(lái)“雙減”政策在義務(wù)教育階段的中小學(xué)取得了一定的成效。正基于此,大眾也寄望將該政策推廣到高中階段。
4.用戶對(duì)主題4中 “藝術(shù)體育”“學(xué)歷”方面輿論偏向于正向情感,對(duì)“就業(yè)”“結(jié)婚生育”方面偏向于負(fù)向情感
“雙減”政策的一個(gè)重要目標(biāo)是減輕學(xué)生校外培訓(xùn)的負(fù)擔(dān),為此,該政策規(guī)定在一年內(nèi)有效減輕中小學(xué)生的課外負(fù)擔(dān),并關(guān)閉不合規(guī)的校外學(xué)科類培訓(xùn)機(jī)構(gòu),同時(shí)規(guī)范和完善校內(nèi)教育體系。一方面,這有利于優(yōu)化教育體系結(jié)構(gòu)、促進(jìn)教育改革、全面開(kāi)展素質(zhì)教育,有助于減少青少年兒童的學(xué)業(yè)負(fù)擔(dān),釋放他們活潑好動(dòng)的天性,保護(hù)他們健康成長(zhǎng),這也是部分大眾支持該政策的原因。另一方面,許多人持反對(duì)意見(jiàn),在家長(zhǎng)層面,“讓孩子贏在起跑線上”這句話深入人心,激發(fā)了家長(zhǎng)之間的競(jìng)爭(zhēng)心,又由于各個(gè)家庭的收入水平不同,管制校外輔導(dǎo)機(jī)構(gòu)對(duì)他們來(lái)說(shuō)自然不是一件值得歡喜的事情;在社會(huì)層面,管制校外輔導(dǎo)機(jī)構(gòu)導(dǎo)致一大批從業(yè)者失業(yè)[28],其中師范類專業(yè)畢業(yè)者居多,對(duì)即將畢業(yè)的大學(xué)生來(lái)說(shuō)失去了一條就業(yè)之路,在教師編制門檻十分難過(guò)的現(xiàn)狀下,唯有選擇考研是一個(gè)延緩就業(yè)的最佳道路,然近年考研人數(shù)急劇增長(zhǎng)、考研難度升級(jí),使得這些人群對(duì)“雙減”持有負(fù)面情緒。另外,該政策引起了家長(zhǎng)甚至一個(gè)家庭內(nèi)部的焦慮。一方面,由于家長(zhǎng)對(duì)升學(xué)率高度關(guān)注和家長(zhǎng)間的不斷競(jìng)爭(zhēng),加之人們歷來(lái)對(duì)職業(yè)學(xué)校的不重視,而在就業(yè)時(shí)招聘公司又格外注重應(yīng)聘人員的學(xué)歷,因此人們對(duì)該政策產(chǎn)生了抱怨情緒,認(rèn)為國(guó)家推行“雙減”政策的目的是補(bǔ)給社會(huì)勞動(dòng)力,讓部分大學(xué)生甚至是中學(xué)生直接選擇就業(yè),而非升學(xué)。然而就業(yè)市場(chǎng)競(jìng)爭(zhēng)激烈,許多年輕人需要更長(zhǎng)的時(shí)間來(lái)找到穩(wěn)定的工作,這可能迫使他們推遲結(jié)婚和生育的計(jì)劃。隨著“雙減”政策的推進(jìn),義務(wù)教育質(zhì)量得到提升,家長(zhǎng)更注重子女教育,因此一些家長(zhǎng)希望在子女教育上投入更多的時(shí)間和精力,這也可能導(dǎo)致他們?cè)谳^晚的時(shí)候才考慮結(jié)婚和生育的問(wèn)題,以保證能夠承擔(dān)高額的教育花費(fèi)。
綜上,網(wǎng)絡(luò)社交媒體用戶對(duì)“雙減”政策的輿論焦點(diǎn)主要集中在4個(gè)主題、16個(gè)評(píng)論對(duì)象上,在“素質(zhì)教育”“藝術(shù)活動(dòng)”“學(xué)歷”3個(gè)方面用戶情感偏向于正向;在“校外培訓(xùn)”“課后服務(wù)”“補(bǔ)課家教”“作業(yè)”“假期周末”“教師負(fù)擔(dān)”“中考高考”“社會(huì)工作”“地區(qū)差異”“教育公平”“貧富差距”13個(gè)方面用戶情感偏向于負(fù)向。
針對(duì)教育政策用戶評(píng)論文本的情感分析,本研究提出了融合LSTM深度學(xué)習(xí)情感分析與 LDA主題挖掘的細(xì)粒度情感分析框架,對(duì)從微博、知乎以及抖音等平臺(tái)抓取的教育政策用戶評(píng)論文本數(shù)據(jù)進(jìn)行情感分析。借助LDA模型對(duì)用戶評(píng)論文本進(jìn)行主題分類,為下一步細(xì)粒度情感分析劃分層面提供依據(jù),進(jìn)而利用LSTM模型分析各層面用戶評(píng)論的情感態(tài)度。LSTM模型需要在人工標(biāo)注相關(guān)數(shù)據(jù)的前提下進(jìn)行構(gòu)建才能細(xì)粒度地識(shí)別用戶評(píng)論中的情感傾向,未來(lái)將對(duì)深度學(xué)習(xí)模型進(jìn)行優(yōu)化,利用半監(jiān)督和無(wú)監(jiān)督學(xué)習(xí)方法,進(jìn)一步提高情感分類的速度和準(zhǔn)確度。
目前,我國(guó)正在大力推動(dòng)“雙減”政策的落實(shí),本研究有助于指明進(jìn)一步推動(dòng)“雙減”政策實(shí)施的方向、有針對(duì)性的強(qiáng)化政策操作與執(zhí)行力度。根據(jù)上述分析,筆者提出以下幾點(diǎn)建議:
(1)關(guān)注公眾輿論方向,及時(shí)調(diào)整教育政策實(shí)施重點(diǎn)和方向。政府機(jī)構(gòu)應(yīng)當(dāng)密切關(guān)注社會(huì)各界對(duì)于教育政策執(zhí)行效果和社會(huì)影響的反饋意見(jiàn)和輿情動(dòng)態(tài),及時(shí)收集、分析和應(yīng)對(duì)各種聲音和反饋,以更好地傾聽(tīng)民意,保障教育政策實(shí)施的公正性和透明度。同時(shí),根據(jù)實(shí)際情況和社會(huì)反饋及時(shí)調(diào)整和優(yōu)化教育政策的執(zhí)行重點(diǎn)和方向。在教育政策實(shí)施過(guò)程中不斷完善政策措施,加強(qiáng)督導(dǎo)檢查,并能夠靈活地進(jìn)行調(diào)整,避免產(chǎn)生不利影響,確保教育政策目標(biāo)的順利實(shí)現(xiàn)。
(2)加強(qiáng)教育政策執(zhí)行監(jiān)管、督導(dǎo)力度,保證不同地區(qū)以及同一地區(qū)的城鄉(xiāng)學(xué)校齊頭并進(jìn)。政府機(jī)構(gòu)應(yīng)當(dāng)建立科學(xué)有效的管理制度和監(jiān)管體系,從制定、實(shí)施到評(píng)估各個(gè)環(huán)節(jié)都要健全規(guī)范,落實(shí)責(zé)任制,加強(qiáng)數(shù)據(jù)統(tǒng)計(jì)與分析,確保教育政策執(zhí)行的科學(xué)性、公正性和可行性。增強(qiáng)信息公開(kāi)和溝通機(jī)制,加強(qiáng)與社會(huì)各界的溝通,提高透明度,及時(shí)發(fā)布教育政策信息和執(zhí)行情況,并注重對(duì)“雙減”政策和后續(xù)政策的宣傳和普及,為公眾了解政策目標(biāo)、內(nèi)容和效果提供便利,樹(shù)立政府公信力和形象。有關(guān)部門也應(yīng)該加大對(duì)“雙減”政策的解讀和宣傳力度,提高社會(huì)各界對(duì)政策的認(rèn)知度和支持度。其次,學(xué)校之間的資源配置應(yīng)按照實(shí)際需求和情況進(jìn)行調(diào)整,確保各個(gè)地區(qū)、各個(gè)學(xué)校的教育資源均衡配置。政府要給予學(xué)校更多的自主權(quán)和管理權(quán)限,讓學(xué)校自主管理,依法依規(guī)治理,詳細(xì)制定必要的工作計(jì)劃和標(biāo)準(zhǔn),以規(guī)范化、科學(xué)化的方式推進(jìn)教育政策的實(shí)施。
(3)發(fā)展社會(huì)經(jīng)濟(jì),縮小貧富差距,促進(jìn)教育資源合理分配。實(shí)施“雙減”政策需要配合發(fā)展社會(huì)經(jīng)濟(jì),通過(guò)發(fā)展經(jīng)濟(jì)來(lái)縮小貧富差距,進(jìn)而促進(jìn)教育資源合理分配。政府應(yīng)該制定明確的政策措施,通過(guò)財(cái)政補(bǔ)貼、資源配置等方式,加強(qiáng)教育資源的公平性,確保資源的合理分配,讓每個(gè)學(xué)生都能夠享受到公平的教育機(jī)會(huì),同時(shí)加大對(duì)于貧困地區(qū)的教育投入,提升貧困地區(qū)的教育資源質(zhì)量,讓貧困地區(qū)的學(xué)生也能夠享受到優(yōu)質(zhì)的教育資源。
參考文獻(xiàn):
[1] 劉復(fù)興.教育政策的邊界與價(jià)值向度[J].清華大學(xué)教育研究,2002,(1):70-77.
[2] 蔣建華,崔彥琨,王鐘.輿論、教育政策與教育治理現(xiàn)代化[J].教育研究,2021,42(11):132-137.
[3] 彭云,萬(wàn)紅新,鐘林輝.一種語(yǔ)義弱監(jiān)督LDA的商品評(píng)論細(xì)粒度情感分析算法[J].小型微型計(jì)算機(jī)系統(tǒng),2018,39(5):978-985.
[4] 蘇瑩,張勇等.基于樸素貝葉斯與潛在狄利克雷分布相結(jié)合的情感分析[J].計(jì)算機(jī)應(yīng)用,2016,36(6):1613-1618.
[5] 譚翠萍.文本細(xì)粒度情感分析研究綜述[J].大學(xué)圖書(shū)館學(xué)報(bào),2022,40(4):85-99+119.
[6] 王義,沈洋,戴月明.基于細(xì)粒度多通道卷積神經(jīng)網(wǎng)絡(luò)的文本情感分析[J].計(jì)算機(jī)工程,2020,46(5):102-108.
[7] 李慧,柴亞青.基于卷積神經(jīng)網(wǎng)絡(luò)的細(xì)粒度情感分析方法[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2019,3(1):95-103.
[8] 蔡慶平,馬海群.基于Word2Vec和CNN的產(chǎn)品評(píng)論細(xì)粒度情感分析模型[J].圖書(shū)情報(bào)工作,2020,64(6):49-58.
[9] 李沅靜.基于二階隱馬爾可夫模型的文本情感分析及其在“雙減”政策中的應(yīng)用[D].安慶:安慶師范大學(xué),2023.
[10] 辛明遠(yuǎn),劉繼山.基于BERTCNN-LDA模型的輿情檢測(cè)方法——以雙減政策為例[J].信息與電腦(理論版),2022,34(2):59-6m9uRuPBbEDk6W9AbU1UUUQ==3.
[11] Sepp H.Jurgen S.Long Short-Term Memory.Neural Computation,1997,9 (8):1735-1780.
[12] 朱光,劉蕾,李鳳景.基于LDA和LSTM模型的研究主題關(guān)聯(lián)與預(yù)測(cè)研究——以隱私研究為例[J].現(xiàn)代情報(bào),2020,40(8):38-50.
[13] Blei D M,Ng A Y,Jordan M I.Latent Dirichlet Allocation [J].Journal of Machine Learning Research,2003,3:993-1022.
[14] 張東鑫,張敏.圖情領(lǐng)域LDA主題模型應(yīng)用研究進(jìn)展述評(píng)[J].圖書(shū)情報(bào)知識(shí),2022,39(6):143-157.
[15] 關(guān)鵬,王曰芬,傅柱.不同語(yǔ)料下基于LDA主題模型的科學(xué)文獻(xiàn)主題抽取效果分析[J].圖書(shū)情報(bào)工作,2016,60(2):112-121.
[16] 馮興杰,張志偉,史金釧.基于卷積神經(jīng)網(wǎng)絡(luò)和注意力模型的文本情感分析[J].計(jì)算機(jī)應(yīng)用研究,2018,35(5):1434-1436.
[17] 賈偉,屈宸羽,蔡其勇.“雙減”背景下家長(zhǎng)作業(yè)焦慮問(wèn)題還存在嗎——基于扎根理論對(duì)C市9區(qū)1648名家長(zhǎng)的實(shí)證研究[J].中國(guó)電化教育,2023,(5):95-104.
[18] 朱新卓,駱婧雅.“雙減”背景下初中生家長(zhǎng)教育焦慮的現(xiàn)狀、特征及紓解之道——基于我國(guó)8省市初中生家庭教育狀況的實(shí)證調(diào)查[J].中國(guó)電化教育,2023,(4):49-56.
[19] 寧本濤,楊柳.中小學(xué)生“作業(yè)減負(fù)”政策實(shí)施成效及協(xié)同機(jī)制分析——基于全國(guó)30個(gè)?。ㄊ小^(qū))137個(gè)地級(jí)市的調(diào)查[J].中國(guó)電化教育,2022,(1):9-16+23.
[20] 孟晶,楊寶忠.小學(xué)教師對(duì)課后服務(wù)的認(rèn)同困境與路徑[J].教育理論與實(shí)踐,2023,43(11):28-32.
[21] 張妍,曲鐵華.義務(wù)教育學(xué)校課后服務(wù):功能議題、現(xiàn)實(shí)審思與未來(lái)進(jìn)路[J].當(dāng)代教育科學(xué),2023,(2):73-80.
[22] 徐承蕓,林通.“雙減”政策實(shí)施后師生現(xiàn)實(shí)狀況審思——基于對(duì)江西省部分小學(xué)師生的調(diào)研分析[J].基礎(chǔ)教育課程,2022,(7):14-20.
[23] 杜仲瑩.學(xué)生和家長(zhǎng)對(duì)“雙減”工作滿意度超95%[N].昆明日?qǐng)?bào),2022-04-17(01).
[24] 薛海平,師歡歡.起跑線競(jìng)爭(zhēng):我國(guó)中小學(xué)生首次參與課外補(bǔ)習(xí)時(shí)間分析——支持“雙減”政策落實(shí)的一項(xiàng)實(shí)證研究[J].華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版),2022,40(2):71-89.
[25] 陸芳,張莉等.中小學(xué)校“雙減”實(shí)施情況、存在問(wèn)題及對(duì)策——基于江蘇省的實(shí)證分析[J].天津師范大學(xué)學(xué)報(bào)(基礎(chǔ)教育版),2022,23(4):25-30.
[26] 梁凱麗,辛濤等.落實(shí)“雙減”與校外培訓(xùn)機(jī)構(gòu)治理[J].中國(guó)遠(yuǎn)程教育,2022,(4):27-35.
[27] 陳曉慧.“雙減”時(shí)代智能技術(shù)的可為與能為——基于“家—?!纭眳f(xié)同育人視角[J].中國(guó)電化教育,2022,(4):40-47.
[28] 薛二勇,李健,劉暢.“雙減”政策執(zhí)行的輿情監(jiān)測(cè)、關(guān)鍵問(wèn)題與路徑調(diào)適[J].中國(guó)電化教育,2022,(4):16-25.
作者簡(jiǎn)介:
吳運(yùn)明:副教授,在讀博士,研究方向?yàn)榻逃龜?shù)據(jù)挖掘與應(yīng)用。
張琳:在讀碩士,研究方向?yàn)榻逃龜?shù)據(jù)挖掘與應(yīng)用。
胡凡剛:教授,博士后,博士生導(dǎo)師,副校長(zhǎng),研究方向?yàn)榻逃摂M社區(qū)理論與實(shí)踐、教育大數(shù)據(jù)應(yīng)用。
Fine-Grained Sentiment Analysis of User Comments on Educational Policies Based on Deep Learning
Wu Yunming1,2, Zhang Lin3, Hu Fangang2
1.School of Education, Qufu Normal University, Qufu 273165, Shandong 2.School of Communication, Qufu Normal University, Rizhao 276826, Shandong 3.School of Information Science and Technology, Northeast Normal University, Changchun 130117, Jilin
Abstract: In the era of smart media, online social media platforms such as Weibo and Tiktok have become one of the most important channels to transmit information between the government and the public, and the public’s comments on education policies on these platforms influence the implementation process, effect and subsequent policies. By integrating the LDA model and the LSTM model, and taking the“double reduction” policy as an example, the study mines the users’ comments on education policies on online social medias and finegrainedly analyzes the users’ multidimensional subjective emotions towards education policies, so as to provide a reference for improving the implementation effect of education policies. It is found that the focus of online social media users’ opinions on the “double reduction” policy is mainly concentrated on 16 comment objects under four themes, among which the users’ emotions are positive in three aspects, including quality education, art activities, and academic qualifications; and the remaining 13 aspects are negative, such as out-of-school training, afterschool service, education fairness, rich-poor gap, and employment.
Keywords: LSTM model; LDA model; sentiment analysis; educational policy
責(zé)任編輯:李雅瑄