国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大規(guī)模英語口語考試自動評卷可行性研究

2014-12-02 03:54:30
中國輕工教育 2014年6期
關(guān)鍵詞:評卷英語口語專家

范 鵬

(天津教育招生考試院,天津 300387)

多年來,英語一直是中國學(xué)生的主要課程。但由于語言習(xí)慣、傳統(tǒng)教學(xué)方式等原因,中國人的英語大多是“啞巴英語”——“聽、讀、寫”與“說”發(fā)展的極不均衡。但語言歸根結(jié)底是交流的工具,學(xué)習(xí)英語的目的是獲得以英語為工具的國際交際能力,只會讀不會說,語言交際也無從談起。針對這個問題,無論是教育主管部門還是教學(xué)單位都十分重視。針對以提高學(xué)生實(shí)際運(yùn)用英語的能力,改變啞巴英語學(xué)習(xí)的現(xiàn)狀,英語口語考試被廣泛推廣。天津考試院作為考試主管部門,多年來大力推廣英語口語考試,每年組織多次全市范圍不同層次的英語口語考試,考生規(guī)模多在萬人以上。本文著重對此類大規(guī)模英語口語考試進(jìn)行研究。

一、人機(jī)對話考試系統(tǒng)

傳統(tǒng)的英語口語考試多為面試,顧名思義是考官與考生進(jìn)行面對面的交流,根據(jù)考生作答情況現(xiàn)場予以評分。這種形式對于考官的要求比較高,要在面試的時(shí)間內(nèi)給出考生合理、客觀的成績。隨著考官精力的下降,考生成績也會產(chǎn)生一定的波動,并且由于受到考官數(shù)量的限制,這種形式也不適合大規(guī)模的英語口語考試。

隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,出現(xiàn)了“人機(jī)對話”的英語口語考試系統(tǒng),通過建立大型題庫和評價(jià)標(biāo)準(zhǔn)系統(tǒng),實(shí)現(xiàn)計(jì)算機(jī)人機(jī)對話,出題、考試、判卷、結(jié)果反饋全部由計(jì)算機(jī)完成。與以往英語口語考試的“人人對話”形式不同,“人機(jī)對話”考試模式由電腦充當(dāng)考官角色,所有問題和指令都由電腦發(fā)出,考生則根據(jù)從耳機(jī)中聽到的或在電腦屏幕上看到的指令和要求進(jìn)行作答。系統(tǒng)自動將考生答案保存成語音文件,后期再由考試主管部門統(tǒng)一組織教師進(jìn)行評卷??荚嚨娜^程中排除了人為因素和外界干擾因素對考生的影響,“人機(jī)對話”所有試題從題庫中選題。因此,不同場次的考生題目都不同,有效防止隨機(jī)“漏題”,即便是同一場次,相鄰的考生所作答的題目也不同?!叭藱C(jī)對話”實(shí)現(xiàn)了考官和考生的分離,更適合大規(guī)模英語口語考試。

二、人機(jī)對話考試系統(tǒng)的弊端

雖然人機(jī)對話的考試系統(tǒng)解決了組織大規(guī)??荚嚨碾y題,大大提高了考試的效率,但在一些方面尤其是評卷部分仍存在著許多弊端。主要表現(xiàn)在以下幾點(diǎn)。

1.人力投入大

英語口語考試的測試要求多為朗讀、復(fù)述、表達(dá)類題目,這類題目主觀性很強(qiáng),考生的答案也沒有唯一性,因此需要大量教師進(jìn)行評閱。一般來說,一次大規(guī)模英語口語考試的評卷,需要上百名教師評閱3至4天才能完成。

2.質(zhì)量難控制

不同于筆試評卷,所有考生的作答都是語段信息,評卷教師都是“聽閱”,每名評卷教師每天要聽大量的考生語音信息,還要努力排除由于口音、系統(tǒng)噪音等對作答造成的干擾,對于每個教師的體能都是不小的挑戰(zhàn),且每個教師對于題目的主管判斷存在差別,評卷質(zhì)量很難良好的控制。

3.系統(tǒng)誤差多

由于話筒、電腦聲卡等硬件問題會對考生作答造成一定的干擾,評卷教師輕則部分作答語段聽不清楚,重則所有作答語段都聽不到聲音,對于這種情況,評卷教師難以判斷考生是沒有作答還是系統(tǒng)故障。針對這些問題,作為考試主管部門,我們一直在探索一種適合的替代辦法。

三、人機(jī)對話系統(tǒng)自動評卷技術(shù)

近年來,隨著語音識別技術(shù)的發(fā)展,許多針對人機(jī)對話系統(tǒng)開發(fā)的自動評卷產(chǎn)品面市。這類產(chǎn)品使用語音識別技術(shù),采用專業(yè)模型對考生語音信息進(jìn)行分析,進(jìn)而對考生答案進(jìn)行評卷。這在一定程度上解決了口語考試評卷一直困擾的幾個問題,也為進(jìn)一步推進(jìn)考試信息化提供了契機(jī)。這類產(chǎn)品有以下幾個特點(diǎn)。

1.省時(shí)省力

不再需要評卷教師,只需要一定的計(jì)算機(jī)設(shè)備,軟件系統(tǒng)就可以使用語音識別技術(shù)對考生作答自動進(jìn)行評卷,自動甄別有誤作答和未作答,有效解決了傳統(tǒng)閱卷中由人工無法界定的問題。

2.安全穩(wěn)定

采用先進(jìn)的語音識別和語音分析技術(shù),以機(jī)器學(xué)習(xí)理論、數(shù)據(jù)挖掘理論和現(xiàn)代語言測量技術(shù)為基礎(chǔ),科學(xué)、準(zhǔn)確、高效地實(shí)現(xiàn)了英語口語的計(jì)算機(jī)自動評分,有效避免了人工評卷的主觀差錯和事故率。

3.客觀公平

克服了人工評卷中身體、精神等不利因素,極大提高閱卷和評估的客觀性和公正性。系統(tǒng)實(shí)現(xiàn)了短文朗讀、情景問答、看圖說話等題型的自動評分,對于每一個分?jǐn)?shù)有一個置信度值,當(dāng)給出評分后,如果超過置信度則自動反饋進(jìn)行人工校對。同時(shí)系統(tǒng)還具備完善的質(zhì)量監(jiān)控功能,確保自動評分的質(zhì)量。

4.可拓展性

為考試評估和提供改進(jìn)建議提供了數(shù)據(jù)參考,為教學(xué)提供了可信、可視化和可操作化的幫助。根據(jù)評卷數(shù)據(jù)可以自動生成參考個體之間、個體與總體之間的對比分析報(bào)告,能對學(xué)生英語口語水平進(jìn)行客觀評價(jià),有助于學(xué)生在今后英語學(xué)習(xí)中彌補(bǔ)不足,改進(jìn)學(xué)習(xí)方法;同時(shí)也有利于教師了解英語教學(xué)情況,有助于教學(xué)更具有針對性,并通過改進(jìn)教學(xué)方法來提高教學(xué)水平。

四、大規(guī)模英語口語考試自動評卷可行性分析

天津考試院目前使用的是由訊飛啟明公司開發(fā)的英語口語考試智能評分系統(tǒng),主要由自動評分服務(wù)器、管理終端、抽查終端、數(shù)據(jù)存儲和答案成績匯總服務(wù)器組成,系統(tǒng)根據(jù)口語發(fā)音準(zhǔn)確度、語音語調(diào)、流利程度和語言測量特征等各項(xiàng)考核標(biāo)準(zhǔn),對考生的口語水平進(jìn)行計(jì)算評分。天津考試院抽取了參加春季高考英語口語考試的1292名考生作答信息作為測試樣本,使用自動評卷系統(tǒng)評卷,并與人工評卷進(jìn)行對比測試。

運(yùn)營數(shù)據(jù)中心,全面采集供應(yīng)鏈各環(huán)節(jié)數(shù)據(jù),設(shè)置多種埋點(diǎn)方式,已建立完整的供應(yīng)鏈數(shù)字倉庫??蓪?shí)時(shí)查看訂單生產(chǎn)各環(huán)節(jié)數(shù)據(jù)、庫存數(shù)據(jù)、配送攬收數(shù)據(jù)、配送路由數(shù)據(jù)等針對大盤的實(shí)時(shí)數(shù)據(jù)。同時(shí)還可從細(xì)分的倉庫維度、品牌商維度、店鋪維度分別查看各環(huán)節(jié)的精細(xì)數(shù)據(jù)。讓數(shù)據(jù)產(chǎn)生運(yùn)營的價(jià)值,確保每一個品牌的雙11訂單履行變得穩(wěn)定可控。

1.測試說明

天津考試院組織9位英語口語教學(xué)方面的專家,對全部1292份數(shù)據(jù)進(jìn)行評分,作為比對參照。專家評分屬于精細(xì)評分,比較具有代表性,且總體水平一定高于大規(guī)模評卷中眾多評卷教師批量評分的總體水平。同時(shí),使用自動評卷系統(tǒng)進(jìn)行對1292份數(shù)據(jù)進(jìn)行評分,結(jié)果與標(biāo)準(zhǔn)參照進(jìn)行比對分析,測試自動評卷的可行性。

2.分析方法

對專家評分和自動評分之間的一致程度(相關(guān)度)及偏差,通過偏差進(jìn)一步計(jì)算一致率:

(1)相關(guān)度:即相關(guān)系數(shù),是衡量自動評分與專家評分對同一組數(shù)據(jù)評分排序合理程度的一種統(tǒng)計(jì)指標(biāo),反映了評分的公平性,也是對自動評分水平最主要的衡量指標(biāo)。設(shè)有N個評卷數(shù)據(jù),專家評分為x1,x2,…,xn,自動評分為y1,y2,…,yn,則自動評分和專家評分的相關(guān)度的計(jì)算公式為:

相關(guān)度的取值范圍介于0~1之間,越接近1表示自動評分的排序關(guān)系和專家評分越接近。

(2)一致率:即自動評分和專家評分的分差在20分以內(nèi)的比率。

3.分析結(jié)果

(1)相關(guān)性與一致率。

根據(jù)自動評分與專家評分的結(jié)果進(jìn)行比對,如表1所示。

表1 自動評分與專家評分相關(guān)度和一致率

如表2所示,自動評分與專家評分分差超過20分的數(shù)據(jù)有134份。為了進(jìn)一步確認(rèn)這部分較明顯分差是由自動評分還是專家評分所導(dǎo)致,考試院又安排了另外一部分有經(jīng)驗(yàn)的評卷人員進(jìn)行復(fù)評,每份數(shù)據(jù)由兩人評分,并取復(fù)審的平均分作為基準(zhǔn),用以驗(yàn)證這134份數(shù)據(jù)的真實(shí)情況。

表2 自動評分與專家評分差值

表3 復(fù)評結(jié)果

如表3所示,可以看出,多數(shù)復(fù)評結(jié)果更趨向于自動評分。根據(jù)復(fù)評的結(jié)果,重新計(jì)算了分差、相關(guān)性和一致率,如表4、表5所示。

表4 復(fù)評后自動評分和專家評分分差

表5 復(fù)評后自動評分與專家評分相關(guān)度和一致率

(2)評分趨勢

如圖1所示,自動評分與專家評分各分?jǐn)?shù)段的整體分布相當(dāng),均符合正態(tài)分布,完全可以反映出考生的水平差異。

如圖2所示,自動評分與專家評分大多數(shù)一致性很高。

圖1 自動評分與專家評分分?jǐn)?shù)分布

圖2 自動評分與專家評分散點(diǎn)圖

4.分析結(jié)論

本次測試自動評分與專家評分相關(guān)度達(dá)到0.732,一致率達(dá)到89.62%;僅對分差顯著數(shù)據(jù)進(jìn)行多人復(fù)評后,相關(guān)度即提升至0.823,一致率提升至98.14%。且通過復(fù)評可以發(fā)現(xiàn),自動評分的顯著差距要小于專家評分,可以認(rèn)為自動評分在本次口語評卷中效果表現(xiàn)良好,可以滿足大規(guī)模評卷的需要。

英語口語考試評卷主觀性強(qiáng),組織難度大,作為考試主管部門,最關(guān)心的是評卷的質(zhì)量。通過分析表明,計(jì)算機(jī)自動評卷的性能已經(jīng)與專家評卷較為接近,在實(shí)際操作中,肯定明顯超越眾多評卷教師批量評卷的評分信度,應(yīng)該說已經(jīng)達(dá)到了實(shí)用水平,完全可以替代評卷教師的角色。而從組織管理的角度來說,不論是人員投入、所需時(shí)間和設(shè)備,計(jì)算機(jī)自動評卷都有明顯優(yōu)勢。綜上所述,計(jì)算機(jī)自動評卷由于其可信度和實(shí)用性,在大規(guī)模英語口語考試中有較強(qiáng)的可行性。

自動化評卷不僅是一次評卷形式的革新,也是計(jì)算機(jī)信息技術(shù)與英語教學(xué)的整合。它依托于“人機(jī)對話”的口語考試系統(tǒng),不但促進(jìn)了英語教學(xué)資源庫的建設(shè),而且對英語教學(xué)提供最直觀的反饋,引領(lǐng)英語教學(xué)回歸語言學(xué)習(xí)的終極目標(biāo)——交流與溝通,進(jìn)一步發(fā)揮考試的導(dǎo)向和激勵作用,幫助學(xué)生克服英語學(xué)習(xí)中的障礙,樹立口語交流的自信,為他們進(jìn)一步學(xué)習(xí)運(yùn)用英語打下良好的基礎(chǔ)。

參考資料:

[1]李萌濤,楊曉果.大規(guī)模大學(xué)英語口語測試?yán)首x型機(jī)器閱卷研究與實(shí)踐[J].外語界,2008(4):88-95.

[2]屈志杰.XML自動閱卷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程,2003,9(16):189-191.

[3]丁衛(wèi)平,鄧偉.基于Web智能閱卷考試系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].電氣電子教學(xué)學(xué)報(bào),2007(3):102-104.

[4]楊惠中.大學(xué)英語口語考試設(shè)計(jì)原則[J].外語界,1999(3):48-57.

猜你喜歡
評卷英語口語專家
北京高考語文卷已現(xiàn)滿分作文
致謝審稿專家
2019年對口升學(xué)考試網(wǎng)上評卷考生答題注意事項(xiàng)
初中英語口語教學(xué)的反思與創(chuàng)新
高中英語口語教學(xué)研究
“畫?!痹u卷
教育(2016年49期)2017-03-20 02:23:28
大規(guī)??荚嚲W(wǎng)上評卷中趨中評分的成因探析
請叫我專家
專家面對面
如何加強(qiáng)及應(yīng)用英語口語教學(xué)
泰州市| 宜兰县| 定安县| 芦山县| 榆中县| 平舆县| 鄂尔多斯市| 泗阳县| 耿马| 广州市| 图木舒克市| 阜宁县| 淅川县| 陆川县| 丰宁| 尚义县| 昌邑市| 双流县| 宜兰市| 东乡| 炉霍县| 桑植县| 金阳县| 永德县| 若尔盖县| 盐亭县| 鄂托克旗| 工布江达县| 泸西县| 海宁市| 嘉黎县| 蚌埠市| 大理市| 元氏县| 始兴县| 洛隆县| 嘉义县| 锡林郭勒盟| 新蔡县| 霍山县| 抚顺市|