国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多特征融合的電氣領(lǐng)域主觀題自動(dòng)評(píng)分方法

2022-03-31 12:21王金水郭偉文陳俊巖唐鄭熠
關(guān)鍵詞:專業(yè)術(shù)語(yǔ)主觀題本體

王金水,郭偉文,陳俊巖,唐鄭熠*

(1.福建工程學(xué)院 計(jì)算機(jī)科學(xué)與數(shù)學(xué)學(xué)院,福建 福州 350118;2.福建工程學(xué)院 大數(shù)據(jù)挖掘與應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室,福建 福州 350118)

隨著計(jì)算機(jī)、大數(shù)據(jù)以及人工智能等技術(shù)的興起,智慧教育運(yùn)用現(xiàn)代信息技術(shù)來(lái)實(shí)現(xiàn)教育的信息化和智能化。自動(dòng)評(píng)分作為智慧教育的一項(xiàng)重要環(huán)節(jié),不僅可以減少教師在閱卷過(guò)程中的工作負(fù)擔(dān),而且能夠避免因個(gè)人主觀因素導(dǎo)致的評(píng)分偏差的問(wèn)題。在電氣工程領(lǐng)域中,智慧教育被應(yīng)用到高校教學(xué)、注冊(cè)電氣工程師考試和電網(wǎng)員工入職培訓(xùn)等環(huán)節(jié),有助于學(xué)員完善電氣領(lǐng)域的知識(shí)體系。自動(dòng)評(píng)分作為智慧教育的一項(xiàng)重要環(huán)節(jié),不僅可以減少教師在閱卷過(guò)程中的工作負(fù)擔(dān),而且能夠避免因個(gè)人主觀因素導(dǎo)致的評(píng)分偏差的問(wèn)題。

現(xiàn)階段,客觀題自動(dòng)評(píng)分算法已經(jīng)非常成熟,并廣泛運(yùn)用于各類在線考試系統(tǒng)。另一方面,關(guān)于作文和短文本等領(lǐng)域無(wú)關(guān)的主觀題自動(dòng)評(píng)分的研究也取得很多成果[1-6]。鉉靜等[7]基于卷積神經(jīng)網(wǎng)絡(luò)的方法,使用全維度和單維度的卷積核進(jìn)行卷積,得到詞語(yǔ)之間長(zhǎng)距離依賴信息。李寒[8]提出了基于深度學(xué)習(xí)的中文句子相似度計(jì)算方法,使用大量未標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練模型參數(shù),該模型在自動(dòng)評(píng)分中具有更好的性能。胡艷霞等[9]在依存關(guān)系樹(shù)的基礎(chǔ)上使用深度學(xué)習(xí)的方法,采用多頭注意力機(jī)制Tree-LSTM的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)句子相似度的計(jì)算。彭琦等[10]針對(duì)詞語(yǔ)間信息內(nèi)容的差異性的問(wèn)題,為實(shí)現(xiàn)詞語(yǔ)信息內(nèi)容的相似度計(jì)算方法,提出了一種相似度計(jì)算策略應(yīng)用于改進(jìn)的《同義詞詞林》。但是,將作文或短文本自動(dòng)評(píng)分算法直接應(yīng)用在特定領(lǐng)域主觀題評(píng)分的效果并不好[11]。評(píng)分算法無(wú)法準(zhǔn)確地理解電氣領(lǐng)域的專業(yè)術(shù)語(yǔ),且缺乏對(duì)領(lǐng)域知識(shí)的理解,容易導(dǎo)致語(yǔ)義分析出現(xiàn)較大誤差,進(jìn)而影響評(píng)分結(jié)果的準(zhǔn)確度。

本文以電氣工程學(xué)科為背景,從本校電氣工程研究生的專業(yè)課程中選取部分課程涉及的專業(yè)術(shù)語(yǔ),以此為基礎(chǔ)構(gòu)建電氣領(lǐng)域本體,并提出了一種多特征融合的電氣領(lǐng)域主觀題自動(dòng)評(píng)分方法。該方法借助語(yǔ)義詞典以及電氣工程領(lǐng)域本體,分別完成對(duì)通用詞語(yǔ)和專業(yè)術(shù)語(yǔ)的相似度計(jì)算,此后,方法通過(guò)加權(quán)融合句子的詞形相似度、詞性相似度和搭配詞對(duì)相似度的特征,計(jì)算電氣領(lǐng)域主觀題的評(píng)分。

1 電氣領(lǐng)域本體構(gòu)建

領(lǐng)域本體作為專業(yè)性本體,具有非常強(qiáng)的領(lǐng)域區(qū)分性。通過(guò)構(gòu)建電氣領(lǐng)域本體,能夠更準(zhǔn)確地獲取電氣領(lǐng)域的專業(yè)術(shù)語(yǔ)、數(shù)據(jù)屬性以及術(shù)語(yǔ)間的關(guān)系,進(jìn)而有助于完成領(lǐng)域概念查找以及專業(yè)術(shù)語(yǔ)的相似度計(jì)算等任務(wù)[12]。將電氣領(lǐng)域本體作為主觀題自動(dòng)評(píng)分的知識(shí)庫(kù),能夠提高對(duì)電氣領(lǐng)域?qū)I(yè)術(shù)語(yǔ)的識(shí)別能力和語(yǔ)義理解能力[13]。電氣領(lǐng)域本體構(gòu)建的具體步驟圖1所示。

圖1 電氣領(lǐng)域本體的構(gòu)建步驟

在構(gòu)建領(lǐng)域本體之前,需要結(jié)合本體的使用對(duì)象、應(yīng)用目的和作用等因素,確定構(gòu)建的本體所涉及到專業(yè)領(lǐng)域和范疇。由于電氣領(lǐng)域包含的課程較多,因此本文從本校電氣工程研究生的專業(yè)課程中的課程體系中選取了《電力系統(tǒng)概述》、《電機(jī)與電力拖動(dòng)》、《電力工程基礎(chǔ)》、《發(fā)電廠電氣部分》等核心課程,從中盡可能多地列出課程涉及的概念、專業(yè)術(shù)語(yǔ)、以及概念詳細(xì)的定義等知識(shí)。所構(gòu)建本體所涉及部分概念和術(shù)語(yǔ)如表1所示。

表1 電氣領(lǐng)域概念和術(shù)語(yǔ)示例

完成電氣領(lǐng)域的關(guān)鍵知識(shí)和術(shù)語(yǔ)的獲取后,需要確定本體中概念、屬性以及彼此之間的關(guān)系。其中,關(guān)系類型的確定是構(gòu)建本體過(guò)程中最關(guān)鍵的一個(gè)環(huán)節(jié)。由于電氣領(lǐng)域?qū)I(yè)術(shù)語(yǔ)的同一概念存在多種表述,并且概念之間存在上下位關(guān)系、部分與整體的關(guān)系,導(dǎo)致相關(guān)知識(shí)在通用詞典中難以體現(xiàn)。因此,本文構(gòu)建的本體關(guān)系類型涵蓋了同義關(guān)系、繼承關(guān)系、組成關(guān)系,以盡可能完整地涵蓋相關(guān)領(lǐng)域知識(shí)。

2 電氣領(lǐng)域主觀題自動(dòng)評(píng)分方法

如圖2所示,多特征融合的電氣領(lǐng)域主觀題自動(dòng)評(píng)分模型在獲得學(xué)生答案文本和參考答案文本之后,通過(guò)文本分詞、詞義擴(kuò)充、停用詞過(guò)濾、句法分析等技術(shù)對(duì)文本進(jìn)行預(yù)處理?;陔姎忸I(lǐng)域本體、語(yǔ)義詞典,分別計(jì)算專業(yè)術(shù)語(yǔ)和通用詞語(yǔ)相似度,并結(jié)合三個(gè)特征的加權(quán)計(jì)算結(jié)果,得到學(xué)生答案文本的相似度。最后進(jìn)行分?jǐn)?shù)轉(zhuǎn)換,得到學(xué)生答案的最終得分。

圖2 多特征融合的電氣領(lǐng)域主觀題自動(dòng)評(píng)分模型

2.1 詞語(yǔ)相似度計(jì)算

根據(jù)文本中詞語(yǔ)的所屬類別(通用詞語(yǔ)或?qū)I(yè)術(shù)語(yǔ)),多特征融合的電氣領(lǐng)域主觀題自動(dòng)評(píng)分方法采用以下三種方法計(jì)算詞語(yǔ)的相似度:1)若詞語(yǔ)兩個(gè)詞語(yǔ)都屬于通用詞語(yǔ),采用融合《知網(wǎng)》和《同義詞詞林》的通用詞語(yǔ)相似度計(jì)算方法;2)若兩個(gè)詞語(yǔ)都屬于專業(yè)術(shù)語(yǔ),采用基于電氣領(lǐng)域本體的專業(yè)術(shù)語(yǔ)相似度計(jì)算方法;3)若其中一個(gè)詞語(yǔ)是通用詞語(yǔ),另一個(gè)詞語(yǔ)是專業(yè)術(shù)語(yǔ)。則設(shè)定兩個(gè)詞語(yǔ)的相似度為0。

2.1.1基于《知網(wǎng)》的詞語(yǔ)相似度計(jì)算

與傳統(tǒng)的語(yǔ)義詞典不同,《知網(wǎng)》通過(guò)一系列的義原來(lái)描述義項(xiàng),義項(xiàng)是對(duì)詞匯的進(jìn)一步解釋。影響義原相似度計(jì)算的因素主要有節(jié)點(diǎn)密度、節(jié)點(diǎn)深度和義原距離等。用y1和y2表示兩個(gè)義原,根據(jù)劉群等[14]提出的義原相似度轉(zhuǎn)換成計(jì)算義原距離,y1和y2的相似度計(jì)算如下:

(1)

式中,D(y1,y2)代表y1和y2的語(yǔ)義距離,即y1和y2在義原樹(shù)的路徑長(zhǎng)度;λ為可調(diào)參數(shù)。詞語(yǔ)的不同語(yǔ)義是通過(guò)多個(gè)義項(xiàng)進(jìn)行描述,根據(jù)劉群等對(duì)義項(xiàng)的研究[14], 將義項(xiàng)分為四個(gè)部分,分別為第一基本義原描述、其他基本義原描述、關(guān)系義原描述,以及符號(hào)義原描述。y1和y2在這四個(gè)部分的相似度分別記為S1(y1,y2)、S2(y1,y2)、S3(y1,y2)和S4(y1,y2)。

將Y1和Y2表示為兩個(gè)義項(xiàng),則他們的相似度分別由Y1和Y2在四個(gè)語(yǔ)義表達(dá)式的相似度組合而成,即義項(xiàng)語(yǔ)義相似度計(jì)算公式如下:

(2)

式中,ρi為可調(diào)參數(shù),ρ1+ρ2+ρ3+ρ4=1。由于部分詞語(yǔ)會(huì)包含多個(gè)義項(xiàng),因此應(yīng)取最大義項(xiàng)相似度作為詞語(yǔ)C1和C2最終的語(yǔ)義相似度,計(jì)算如下:

(3)

2.1.2基于《同義詞詞林》的詞語(yǔ)相似度計(jì)算

結(jié)合電氣領(lǐng)域自動(dòng)評(píng)分的特點(diǎn),基于《同義詞詞林》的詞語(yǔ)相似度算法考慮的主要因素是詞語(yǔ)的語(yǔ)義距離,次要因素分別是分支節(jié)點(diǎn)總數(shù)n和分支間距k。按照底層到高層的結(jié)構(gòu)順序,根據(jù)朱新華等[15]提供的試驗(yàn)參數(shù)設(shè)計(jì),本文對(duì)連接上下兩層的有向邊語(yǔ)義距離給予不同權(quán)重,分別設(shè)置為W1=2.5;W2=1;W3=2.5;W4=0.5。詞語(yǔ)C1和詞語(yǔ)C2的語(yǔ)義距離計(jì)算如式(4)所示。

D(C1,C2)=2×∑d≤i≤4Wi

(4)

節(jié)點(diǎn)總數(shù)n和分支間距k屬于詞語(yǔ)相似度計(jì)算的次要因素,作用是對(duì)語(yǔ)義距離進(jìn)行修正,并且該修正只能微調(diào),因此將這兩個(gè)調(diào)節(jié)參數(shù)加入詞語(yǔ)相似度計(jì)算中,從而降低計(jì)算公式對(duì)參數(shù)n和k的敏感度,以此避免修正幅度過(guò)大。由此得到基于《同義詞詞林》的相似度計(jì)算如下:

(5)

2.1.3通用詞語(yǔ)相似度計(jì)算

通過(guò)分析2.1.1和2.1.2小節(jié)中兩種詞語(yǔ)相似度計(jì)算方法,可以發(fā)現(xiàn)各自計(jì)算規(guī)則是不一致的。考慮到兩個(gè)語(yǔ)義詞典的知識(shí)體系是不一致的,其性質(zhì)和結(jié)構(gòu)具有較大的差別,因此有必要設(shè)計(jì)一種融合不同語(yǔ)義詞典的通用詞語(yǔ)相似度算法以彌補(bǔ)單一方法的不足,從而提高詞語(yǔ)相似度計(jì)算結(jié)果的準(zhǔn)確性。該算法根據(jù)詞語(yǔ)在《知網(wǎng)》或《同義詞詞林》的收錄情況計(jì)算兩個(gè)詞語(yǔ)的相似度,算法過(guò)程描述如下。

算法1融合《知網(wǎng)》和《同義詞詞林》的通用詞語(yǔ)相似度算法

輸入:詞語(yǔ)C1和C2

輸出:C1和C2的相似度S(C1,C2)

1 if(C1∈ZandC2∈Z-T)

3 else if(C1∈TandC2∈T-Z)

5 else if(C1∈Z-TandC2∈T-Z)

6 {

7G=getSig(C2) //查找C2的同義詞集合

8M=NULL

9 ForeachwinG:

11M.append(S(C1,w))

12S(C1,C2)=max(M)//取M集合中最大值

13 }

14 else if(C1∈Z∩TandC2∈T∩Z)

15S(C1,C2)=

16else

17S(C1,C2)=0

18 returnS(C1,C2)

2.1.4專業(yè)術(shù)語(yǔ)相似度計(jì)算

專業(yè)詞語(yǔ)相似度計(jì)算通過(guò)引入電氣領(lǐng)域本體作為知識(shí)庫(kù),對(duì)該領(lǐng)域的專業(yè)術(shù)語(yǔ)進(jìn)行相似度計(jì)算。其中專業(yè)術(shù)語(yǔ)的語(yǔ)義相似度是由節(jié)點(diǎn)距離相似度和節(jié)點(diǎn)信息相似度構(gòu)成。在電氣領(lǐng)域本體中,各個(gè)節(jié)點(diǎn)間的有向邊代表的作用是不一致的,對(duì)于電氣領(lǐng)域本體中任意兩個(gè)節(jié)點(diǎn)h和t的節(jié)點(diǎn)距離相似度計(jì)算如下:

(6)

式中,d(h,t)表示節(jié)點(diǎn)h和t之間的語(yǔ)義距離;dmax是電氣領(lǐng)域本體中節(jié)點(diǎn)的最大深度。

節(jié)點(diǎn)信息相似度通過(guò)最低公共祖先進(jìn)行表示,當(dāng)概念間共享的信息量越多,則說(shuō)明概念的相似度越高。當(dāng)上層節(jié)點(diǎn)細(xì)化到下層的多個(gè)節(jié)點(diǎn)時(shí),下層節(jié)點(diǎn)得到了父節(jié)點(diǎn)的信息,因此可以說(shuō)相同的公共祖先是下層節(jié)點(diǎn)間共享信息的表現(xiàn)之一。任意兩個(gè)節(jié)點(diǎn)h和t的節(jié)點(diǎn)信息相似度計(jì)算如下:

(7)

式中,I(c(h,t)),I(h),I(t)分別是最低公共祖先節(jié)點(diǎn)、h節(jié)點(diǎn)、t節(jié)點(diǎn)的信息量。

綜合考慮以上兩個(gè)因素,得到專業(yè)詞語(yǔ)的相似度計(jì)算如下:

sonto(h,t)=λsd(h,t)+ηsi(h,t)

(8)

式中,λ、η表示調(diào)節(jié)因子權(quán)重。

2.2 句子相似度計(jì)算

2.2.1句子的詞序相似度計(jì)算

詞序相似度反映的是參考答案文本A1和學(xué)生答案文本A2之間詞語(yǔ)的相對(duì)位置關(guān)系,根據(jù)詞語(yǔ)的順序來(lái)衡量句子的相似度。本文用m表示文本A1和文本A2中同時(shí)出現(xiàn)且僅出現(xiàn)一次的詞語(yǔ)集合大小。詞序相似度的計(jì)算方法如下:

(9)

式中,C(A1,A2)表示文本A1和文本A2的逆序數(shù)。

2.2.2句子的詞形相似度計(jì)算

詞形的相似度反映的是參考答案文本A1和學(xué)生答案文本A2中所包含的詞語(yǔ)在形態(tài)層次上的語(yǔ)義相似度。當(dāng)兩個(gè)詞語(yǔ)相似度大于指定閾值時(shí),記為相似詞。結(jié)合公式,詞形相似度計(jì)算方法如下:

(10)

式中,W(A1,A2)表示文本A1和文本A2中相似詞的個(gè)數(shù);L(A1)和L(A2)分別表示文本A1和文本A2的詞語(yǔ)總數(shù)。

2.2.3句子的搭配詞對(duì)相似度計(jì)算

搭配詞對(duì)相似度是從中心詞的相似度、依存詞的相似度和詞語(yǔ)間關(guān)系類型三個(gè)維度來(lái)量化句子相似度。搭配詞對(duì)可用采用三元組<中心詞,關(guān)系類型,依存詞>進(jìn)行表示。搭配詞對(duì)雖然丟失了詞語(yǔ)之間的順序關(guān)系,但可以呈現(xiàn)詞語(yǔ)之間的內(nèi)在邏輯關(guān)系和深層語(yǔ)義關(guān)系。

通過(guò)提取文本的搭配詞對(duì),并對(duì)搭配詞對(duì)進(jìn)行簡(jiǎn)化。首先,運(yùn)用詞語(yǔ)相似度計(jì)算方法對(duì)搭配詞對(duì)中的詞語(yǔ)進(jìn)行詞語(yǔ)相似度計(jì)算,進(jìn)一步獲得搭配詞對(duì)的相似度矩陣;其次,遍歷矩陣并取出每行中數(shù)值最大的元素;最后,得到搭配詞對(duì)的相似度。其中,遍歷的元素集合和搭配詞對(duì)相似度計(jì)算方法分別如下:

Nmax(A1,A2)={Amax1,Amax2,…,Amaxp}

(11)

(12)

式中,p表示Nmax(A1,A2)的容量。

考慮到矩陣的不對(duì)稱性,需要進(jìn)一步計(jì)算文本A1和文本A2的搭配詞對(duì)相似度。通過(guò)對(duì)調(diào)文本A1和文本A2的位置,可以得到文本A2和文本A1的搭配詞對(duì)相似度SN(A2,A1)。最終搭配詞對(duì)相似度的計(jì)算方法如下:

(13)

綜合考慮句子的詞序、詞形和搭配詞對(duì)相似度,采用三個(gè)特征全面描述一個(gè)答案文本,以此衡量學(xué)生答案文本和參考答案文本的相似程度,可以得到電氣領(lǐng)域主觀題自動(dòng)評(píng)分計(jì)算方法如下:

S(A1,A2)=αSo(A1,A2)+βSw(A1,A2)+γSN(|A1,A2|)

(14)

式中,α、β、γ是可調(diào)參數(shù),分別代表詞序相似度、詞形相似度和搭配詞對(duì)相似度的權(quán)重值。

3 試驗(yàn)分析

3.1 試驗(yàn)數(shù)據(jù)和評(píng)價(jià)指標(biāo)

為了驗(yàn)證本文提出的主觀題自動(dòng)評(píng)分算法模型的有效性,本文試驗(yàn)引入TF-IDF句子相似度算法的主觀題自動(dòng)評(píng)分方法(方法A)、基于語(yǔ)義樹(shù)的短文本相似度算法的主觀題自動(dòng)評(píng)分方法(方法B)[16]作為對(duì)照試驗(yàn),分別對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行自動(dòng)評(píng)分,統(tǒng)計(jì)三種算法模型的評(píng)分結(jié)果。試驗(yàn)使用的主觀題數(shù)據(jù)來(lái)自于《電力系統(tǒng)分析》、《電機(jī)及拖動(dòng)基礎(chǔ)》和《發(fā)電廠電氣部分》三門(mén)課程的課后習(xí)題。在此之后,我們邀請(qǐng)10個(gè)來(lái)自本校電氣工程專業(yè)的研二學(xué)生進(jìn)行答題,并收集其提交的答題結(jié)果。我們?yōu)樗兄饔^題都提供一份參考答案,并邀請(qǐng)了三位具有相關(guān)專業(yè)助教背景的研究生對(duì)答題結(jié)果進(jìn)行評(píng)分。最終,我們將三位研究生評(píng)分結(jié)果的平均值作為基準(zhǔn)評(píng)分標(biāo)準(zhǔn),并通過(guò)對(duì)比不同評(píng)分算法對(duì)學(xué)生答案的評(píng)分結(jié)果與手工評(píng)分結(jié)果的差異來(lái)分析不同評(píng)分算法的優(yōu)劣。

本文通過(guò)選取均方誤差(mean square error,MSE)、平均絕對(duì)誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)、對(duì)稱平均絕對(duì)百分比誤差(symmetric mean absolute percentage error,SMAPE)四個(gè)評(píng)價(jià)指標(biāo),進(jìn)一步客觀評(píng)價(jià)本文方法對(duì)于主觀題自動(dòng)評(píng)分的效果。

3.2 結(jié)果分析

本文方法模型、TF-IDF評(píng)分模型、基于語(yǔ)義樹(shù)的評(píng)分模型和人工對(duì)每道題目的評(píng)分結(jié)果如圖3所示。

圖3 自動(dòng)評(píng)分結(jié)果對(duì)比

從以上結(jié)果可以看出,本文方法得到的評(píng)分結(jié)果比TF-IDF算法和基于語(yǔ)義依存樹(shù)的算法得到的評(píng)分結(jié)果更加貼近人工評(píng)分結(jié)果,同時(shí)波動(dòng)較小。這主要是由于本文方法在相似度計(jì)算過(guò)程中考慮了詞序、詞形和搭配詞對(duì)三種特征相似度,并應(yīng)用融合語(yǔ)義詞典的算法提高了通用詞語(yǔ)的相似度的計(jì)算結(jié)果。同時(shí)主觀題相似度計(jì)算過(guò)程中會(huì)涉及到電氣領(lǐng)域的專業(yè)術(shù)語(yǔ),通過(guò)引入電氣領(lǐng)域本體,解決了分詞結(jié)果不全面導(dǎo)致計(jì)算結(jié)果存在誤差的問(wèn)題。對(duì)于含有專業(yè)術(shù)語(yǔ)較多的答案文本,例如題目1、題目3和題目10,本文算法模型構(gòu)建的領(lǐng)域本體和搭配詞對(duì)相似度算法,能夠準(zhǔn)確識(shí)別專業(yè)術(shù)語(yǔ),并且較為準(zhǔn)確地計(jì)算專業(yè)術(shù)語(yǔ)的相似度。但是,對(duì)于題目7和題目9,由于這兩道題涉及的電氣領(lǐng)域?qū)I(yè)術(shù)語(yǔ)較少,本文算法引入的電氣領(lǐng)域本體并沒(méi)有較大的影響,與語(yǔ)義依存算法的評(píng)分結(jié)果差異較小。

為了進(jìn)一步明確不同算法之間的差異,通過(guò)MSE、MAE、RMSE以及SMAPE四個(gè)評(píng)價(jià)指標(biāo)對(duì)評(píng)分結(jié)果的質(zhì)量進(jìn)行評(píng)估,其結(jié)果如表2所示。

表2 評(píng)分方法的評(píng)價(jià)指標(biāo)結(jié)果

在電氣領(lǐng)域的主觀題自動(dòng)評(píng)分中,由表2可以看出,本文算法模型能夠在MSE、MAE、RMSE和SMAPE都取得最小值。由于三種自動(dòng)評(píng)分方法考慮的特征不一致,導(dǎo)致評(píng)分結(jié)果有所偏差。TF-IDF評(píng)分方法主要考慮的是文本中單詞詞頻,沒(méi)有考慮句子成分間的語(yǔ)義結(jié)構(gòu),因此在句子的語(yǔ)義相似度計(jì)算方面具有一定的不足?;谡Z(yǔ)義樹(shù)的評(píng)分方法是從句法的結(jié)構(gòu)信息出發(fā),對(duì)于句子的理解較為充分,但是只保留了兩層的語(yǔ)義樹(shù),從而丟失了深層的語(yǔ)義結(jié)構(gòu)信息,導(dǎo)致自動(dòng)評(píng)分結(jié)果不佳。本文方法綜合考慮詞語(yǔ)的語(yǔ)義結(jié)構(gòu),句子深層的句法結(jié)構(gòu),引入領(lǐng)域本體提高了專業(yè)術(shù)語(yǔ)相似度計(jì)算結(jié)果的準(zhǔn)確率。試驗(yàn)結(jié)果表明,本文算法的評(píng)分結(jié)果與人工的評(píng)分結(jié)果的擬合度更高,同時(shí)相對(duì)于基于語(yǔ)義樹(shù)的評(píng)分方法和TF-IDF評(píng)分方法,整體的評(píng)分效果具有較為明顯的優(yōu)勢(shì)。

4 結(jié)語(yǔ)

本文提出了一種多特征融合的電氣領(lǐng)域主觀題自動(dòng)評(píng)分方法,該方法引入了電氣領(lǐng)域本體,提高了對(duì)電氣領(lǐng)域?qū)I(yè)術(shù)語(yǔ)的語(yǔ)義理解,有效地解決了對(duì)專業(yè)術(shù)語(yǔ)分詞不準(zhǔn)確的問(wèn)題。同時(shí)在文本相似度計(jì)算中綜合考慮了詞形、詞序以及搭配詞對(duì)相似度三個(gè)特征,解決了語(yǔ)義關(guān)系考慮不全面等問(wèn)題,進(jìn)一步提高了主觀題自動(dòng)評(píng)分的準(zhǔn)確度。

由于學(xué)生答案文本具有多樣性,如果可以構(gòu)建更大的參考答案集合,能夠增強(qiáng)學(xué)生答案的覆蓋范圍。目前深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于中文信息處理領(lǐng)域,后續(xù)可以對(duì)基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行研究,并且引入神經(jīng)網(wǎng)絡(luò)模型進(jìn)行主觀題自動(dòng)評(píng)分方法中,從而提高句子相似度的計(jì)算精度以及評(píng)分方法的自適應(yīng)能力。

猜你喜歡
專業(yè)術(shù)語(yǔ)主觀題本體
巧用參考答案提高高中生政治主觀題解題能力
極坐標(biāo)方程主觀題考點(diǎn)分析
繼齊韻往昔,以今聲開(kāi)來(lái)——思考自五音戲主奏樂(lè)器的演變、本體及延伸
眼睛是“本體”
看懂體檢報(bào)告,提前發(fā)現(xiàn)疾病
美國(guó)航空中英文官網(wǎng)隱私政策翻譯對(duì)比分析
丟棄“正確的廢話”
專題
Care about the virtue moral education
例析詩(shī)歌鑒賞主觀題解答五忌
汝阳县| 平潭县| 太和县| 洞头县| 手游| 昂仁县| 泰宁县| 高台县| 金寨县| 遵义市| 台南县| 五常市| 芦溪县| 乳山市| 兴山县| 湘潭县| 禄丰县| 扎囊县| 兴宁市| 烟台市| 绥化市| 宝应县| 探索| 岗巴县| 桑日县| 花垣县| 盘锦市| 长泰县| 班戈县| 永新县| 潼关县| 长宁区| 海丰县| 绥德县| 通化县| 德保县| 特克斯县| 桦南县| 金山区| 安福县| 崇义县|