胡茶娟 邸平
【摘要】計算機輔助口語測試技術(shù)為大規(guī)??谡Z測試的實現(xiàn)提供了可能。文章基于暢言互動英語口語測試平臺開展了大學(xué)英語口語測試實踐,探討大規(guī)模在線口語測試的可行性,并就具體實施中存在的問題提出解決思路。研究表明,暢言互動英語口語測試系統(tǒng)具有良好的可操作性,其技術(shù)設(shè)計可以達到預(yù)設(shè)目的,但是在測試效度、測試信度以及技術(shù)整合上還需要進一步完善。
【關(guān)鍵詞】口語測試:計算機輔助;大學(xué)英語:反思
【中圖分類號】G420 【文獻標(biāo)識碼】A 【論文編號】1009—8097(2013)06—0076—05
引言
隨著大學(xué)英語教學(xué)改革的深入和大力推進,口語教學(xué)及測試己普遍受到國內(nèi)各高校的重視。但是,在以教師為主導(dǎo)的傳統(tǒng)口語測試環(huán)境下,由于學(xué)生人數(shù)眾多、考試時間和教師精力有限,使得大規(guī)模的英語口語測試難以實現(xiàn)。以計算機技術(shù)為主的現(xiàn)代信息技術(shù)為促進大學(xué)英語教學(xué)改革提供了強大的技術(shù)支持,也為大規(guī)模英語口語測試提供了實現(xiàn)手段。一大學(xué)英語口語測試現(xiàn)狀
口語考試是大學(xué)英語教學(xué)評估的重要手段。自2006年全面實施大學(xué)英語教學(xué)改革以來,全國各高校不同程度地實行了對大學(xué)英語教學(xué)理念、教學(xué)模式等方面的改革,但是,口語教學(xué)及其測試卻未能實現(xiàn)與時俱進的突破。廖亦斌通過短信調(diào)查發(fā)現(xiàn),受試對象中大部分高校(不少為211院校)口語測試不到位,在期末考試中并無口語考試的部分。而筆者同參加外教社暑期教學(xué)研討班的其他高校教師交流得知,許多實施口語考試的高校出現(xiàn)了進退兩難的尷尬局面。一方面,為了督促學(xué)生的口語學(xué)習(xí),提高口語能力,口語考試勢在必行;另一方面,由于采用的是以教師為主導(dǎo)的傳統(tǒng)口語測試,為了保證考試的真實性和公正性,通常會以小組討論形式讓學(xué)生就某個話題進行交流,并安排至少兩名教師評分,但是這種傳統(tǒng)口語測試用到大規(guī)模的大學(xué)英語口語考試中,不僅需要耗費掉大量的時間和精力,而且對學(xué)生口語能力提高的促進作用也相當(dāng)有限。
出現(xiàn)以上現(xiàn)象的原因主要有:(1)擴招后的師生比列嚴(yán)峻,無論是采取1:1、1:2還是1:3的師生比例考試組合,都需要耗費巨大的時間和精力,口語考試實施困難。(2)沒有規(guī)范化的培訓(xùn),教師口語測試評判能力和水平參差不齊,無法保證口語考試的信度和效度,并且為了保證公正每個考試小組配備兩名以上教師的要求也會讓大規(guī)模的口語測試難以實現(xiàn)。(3)缺乏相關(guān)部門的介入和指導(dǎo),口語考試沒有正式納入學(xué)生評估體系或所占比例甚小,也未納入教師的工作量,費時費力,教學(xué)雙方收效不明顯??梢姡瑐鹘y(tǒng)口語測試已經(jīng)不能滿足目前大學(xué)英語教學(xué)的需求,大規(guī)模英語口語測試迫切需要的是一種省時省力、高效的測試方式。隨著計算機和網(wǎng)絡(luò)技術(shù)的發(fā)展,計算機輔助口語測試技術(shù)已經(jīng)成熟,“將多媒體軟件應(yīng)用于口語教學(xué)是對傳統(tǒng)口語教學(xué)的突破,也是當(dāng)前大力加強口語教學(xué)的社會現(xiàn)實需要”。
二 暢言互動口語測試平臺簡介
暢言互動英語學(xué)習(xí)平臺是由科大訊飛信息科技公司研發(fā)的可部署在校內(nèi)網(wǎng)、校外網(wǎng)和計算機教室的自主學(xué)習(xí)系統(tǒng)。該系統(tǒng)融合了智能語音技術(shù),可以幫助實現(xiàn)智能化、自動化的英語口語測試、英語聽力測試、英語口語對話學(xué)習(xí)、英語朗讀訓(xùn)練和英語單詞速記,并且有利于教師快捷方便地掌握學(xué)生的英語水平和學(xué)習(xí)進度??谡Z測試功能提供一個開放性的考試環(huán)境,教師可以設(shè)定試題,通過系統(tǒng)的實時評測功能,進行自動化考試、判分和生成測試報告。其關(guān)鍵語音技術(shù)包括:(1)語音合成技術(shù)(TextTo Speech,TTS),該技術(shù)能夠自動將任意文字實時轉(zhuǎn)換為連續(xù)的自然語音,提供高效便捷的語音信息服務(wù);(2)語音識別技術(shù)(Auto SpeechRecognize,ASR),讓計算機辨別人類的語音,并將語音中包含的文字信息提取出來,實現(xiàn)有效人機交互。(3)語音評測技術(shù),即通過計算機自動對發(fā)音進行評分、檢錯并給出矯正指導(dǎo)。以上關(guān)鍵語音技術(shù)服務(wù)通過Web Service的方式實現(xiàn)。
三 大規(guī)模在線口語測試設(shè)計和實踐
1 實踐對象
研究對象為我校2012級普通班學(xué)生。目前我校大學(xué)英語教學(xué)實行分級教學(xué),分為長望實驗班(三級起點班)、實驗班(二級起點班)和普通班(一級起點班)。其中,普通班學(xué)生共2569人,占年級總?cè)藬?shù)的76%,其學(xué)期總評成績由平時成績(10%)、口語成績(10%)、期中成績(20%)和期末成績(60%)四部分組成,其中口語成績指學(xué)期末的在線口語測試成績。
2 實施方案
口語考試地點為我校大學(xué)多維語言綜合訓(xùn)練中心的兩個大學(xué)英語自主學(xué)習(xí)教室,共200個學(xué)生機位。
(1)時間安排
期末口語考試集中安排在兩天進行,考試時間為8:00-12:00和13:00-17:00,學(xué)生根據(jù)各自事先安排好的時間段進入自主學(xué)習(xí)中心考試,每一輪考試流程(包括組織過程等)控制在30分鐘以內(nèi)。進行口語考試的時間為10分鐘,非設(shè)備等客觀原因?qū)W生不允許重考。任課教師不用到場,考試地點有一名實驗技術(shù)人員和兩名學(xué)生助理負責(zé)維護考場秩序和進行考試指令說明。
(2)題型設(shè)計
本次口語考試內(nèi)容由任課老師結(jié)合所學(xué)課文主題設(shè)計,共九套不同主題的口語試題(題型設(shè)計見表1),學(xué)生隨機選取進行口語考試。
3 學(xué)生終端
學(xué)生登錄暢言互動英語學(xué)習(xí)平臺,輸入學(xué)號和密碼,確認個人信息后進入口語考試界面。該界面為學(xué)生提供了九套口語測試題,學(xué)生隨機選擇一套后,口語考試正式開始。
第一部分為短文朗讀。朗讀片段的內(nèi)容和體裁選自全新版大學(xué)英語綜合教程的課文。系統(tǒng)在宣讀題目指令以后,提供示范朗讀(圖2),為學(xué)生提供朗讀技巧參考和準(zhǔn)備時間。學(xué)生可以選擇跳過直接進入朗讀考試,錄音時間為2分鐘。
第二部分為主題說話,情景主題參考新視野視聽說教程的單元主題設(shè)計,提供思路提綱(圖3),學(xué)生要求就提綱進行語言組織和口語表達。該部分準(zhǔn)備時間為3分鐘,錄音時間為2分鐘。
學(xué)生在其電腦終端完成整個口語考試所需時間僅為10分鐘??偟膩碚f,該平臺提供的學(xué)生端口語測試功能良好。據(jù)學(xué)生口語考試結(jié)束后的訪談記錄,學(xué)生普遍認為:(1)該平臺提供的界面友好,操作簡單,省時高效。(2)大部分學(xué)生對自己的口語成績表示滿意,認為在線口語測試客觀公正。
4 教師終端
口語考試結(jié)束后,任課教師可以在任何一臺聯(lián)網(wǎng)的計算機終端上登錄學(xué)習(xí)平臺管理系統(tǒng)(圖4),查看學(xué)生的測試成績和測評報告,導(dǎo)出學(xué)生測評成績和考試錄音。如果對學(xué)生成績不確定,可以查看詳細口語測試報告(圖5)。該報告將提供學(xué)生的口語考試各部分的錄音和原文參考,教師可以播放學(xué)生錄音進行重新評估,確保無誤。
根據(jù)任課教師的考試總結(jié)和會談記錄,暢言互動在線口語測試平臺具有以下優(yōu)勢:(1)考試組織管理得以簡化,節(jié)省了人力物力??谡Z考試時任課教師不需要到場,整個考試過程由系統(tǒng)自動生成口語成績和評估報告,教師需要完成的是整體管理學(xué)生成績和把握學(xué)生口語水平。(2)系統(tǒng)自動生成的評估報告,能夠比較真實地反映學(xué)生的口語現(xiàn)狀,為任課教師的口語教學(xué)提供參考,緩解口語教學(xué)中師生1:1交流機會少的局面,增進教師對學(xué)生的了解。(3)系統(tǒng)的錄音保存功能和導(dǎo)出功能,創(chuàng)建了一個豐富的口語語料庫,教師不僅可以通過錄音重播追蹤學(xué)生的口語學(xué)習(xí)進展,而且也為教師進行口語教學(xué)研究提供了數(shù)據(jù)資源。(4)為學(xué)生提供個人原始錄音和示范音頻,還原口語考試現(xiàn)場,有助于學(xué)生自我分析和發(fā)現(xiàn)口語表達中存在的問題。
四 存在的問題與反思
1 對在線口語測試平臺的反思
(1)測試效度
效度是測試的可解釋性和可推廣性。大學(xué)英語口語測試是針對基礎(chǔ)階段大學(xué)英語學(xué)生進行的口語能力評估?!洞髮W(xué)英語課程教學(xué)要求》對基礎(chǔ)階段口語能力提出了要求,即“能就教材內(nèi)容和一般的聽力材料進行問答,復(fù)述和討論;能用英語進行一般的日常會話;能就一般的社會生活話題進行簡單的交談、討論和發(fā)言,表達思想清楚,語言、語調(diào)基本正確”。暢言互動口語測試平臺擁有的語音識別技術(shù)(ASR)實現(xiàn)了數(shù)字化模擬口語考試機制,減輕了口語測試對考官的需求和考試效度的壓力,能夠通過諸如朗讀、看圖說話、復(fù)述等結(jié)構(gòu)主義口試題型對學(xué)生錄音進行機評自動生成成績。這樣的人機對話有比較固定的參考答案,具備命題容易、評分相對客觀可靠的優(yōu)點,但是該平臺支持的人機對話考試模式只局限在某些測試題型上,無法實現(xiàn)如談話、討論、辯論等交際法口語測試題型的機考,因而很難做到真實的溝通,體現(xiàn)出交際的真實性和交互性,不能完全準(zhǔn)確的反映學(xué)生的真實交際能力。蔡基剛認為“只有試卷內(nèi)容能測試到各種相關(guān)的交際功能,而且這些功能具有足夠的代表性,才具有較高的效度”。理想的口語測試考查形式應(yīng)該是對話、討論、辯論等具有交際真實性和互動性的題型。而此類題型所要求的真實性和互動性卻是目前較難攻關(guān)的技術(shù)難題,今后的研究和開發(fā)應(yīng)該專注這一方面,讓在線口語測試更加真實化,進一步提高在線口語測試的效度。
(2)測試信度
信度主要指測試的穩(wěn)定性和可重復(fù)性。大規(guī)模口語考試實現(xiàn)準(zhǔn)確、公正地測量學(xué)生的實際口語能力需要考慮評分模式的可行性和可靠性。我國大學(xué)英語口語測試的對象為水平相對較低的在校學(xué)生,因此在制訂具體的評分標(biāo)準(zhǔn)上要依據(jù)學(xué)生的實際情況來決定。綜合式和分項式是目前大規(guī)??荚嚦S玫脑u分模式。為了確??谡Z考試的信度,提高口語測試對學(xué)生口語學(xué)習(xí)的反撥作用,評分標(biāo)準(zhǔn)和原則應(yīng)該保持一致性,為學(xué)生和教師提供多角度、多層面的測評分析,為今后的學(xué)習(xí)和教學(xué)提供參考。蔡基剛指出,可以利用計算機把口語評分內(nèi)容分解,將打分專業(yè)化、流水化,實現(xiàn)計算機口試的準(zhǔn)確性和高效率性。在線口語測試系統(tǒng)的評分一致性需要通過專業(yè)、細化的評分系統(tǒng)來實現(xiàn)。這樣的評分系統(tǒng)能夠提供:1)能力分項評分(AbilityAnalytical Scoring),從語音、詞匯、流利性等各方面對學(xué)生的口語表達能力進行評分,然后根據(jù)各個方面的得分算出總分;2)題型分項評分(ItemAnalytical Scoring),就考生對各題的內(nèi)容表達及語言表現(xiàn)程度給分;3)總體綜合評分(Holistic Scoring),把學(xué)生的口語能力分為五個等級,按每一級規(guī)定的標(biāo)準(zhǔn)給分。暢言互動英語學(xué)習(xí)系統(tǒng)提供的口語測試平臺并未細化評分標(biāo)準(zhǔn),系統(tǒng)自動生成口語成績評估報告構(gòu)成比較簡單,只是將單項得分列舉出來,對口語表現(xiàn)的得分點或是扣分點沒有明確說明,特別是對學(xué)生口語表現(xiàn)的能力分項未作出單項評分。這樣形成的測評報告只能為學(xué)生和教師提供一個總體判斷,無法幫助學(xué)生深入了解自己口語學(xué)習(xí)的優(yōu)勢和存在的問題,跟進自己的學(xué)習(xí)。
(3)測試技術(shù)
暢言互動英語學(xué)習(xí)平臺的服務(wù)端使用VS2008開發(fā)工具C#語言進行開發(fā),以.NET Framework 2.0作為實行環(huán)境,產(chǎn)品為B/S架構(gòu),并使用AJAX技術(shù)來進一步提升系統(tǒng)頁面的表現(xiàn)力。服務(wù)端的配置要求為:Intel Penfium 3.2 GHz(2 Core)的CPU、2G內(nèi)存、200G以上的硬盤剩余空間和100M網(wǎng)卡,其對應(yīng)的服務(wù)端并發(fā)性能支持1千人同時在線和50路關(guān)鍵業(yè)務(wù),而口語測試每題評測時間不大于評測引擎客戶端所需時間的120%??蛻舳瞬捎肈elphj開發(fā)外殼程序與部分允許離線使用的客戶端功能,其他的部分采用嵌入瀏覽器控件打開服務(wù)端頁面的方式實現(xiàn),使得客服端具備較好的響應(yīng)效果。系統(tǒng)采用的關(guān)鍵語音技術(shù)服務(wù)通過Web Service的方式實現(xiàn),便于靈活部署。
但是作為口語測試系統(tǒng)的重要功能之一,該系統(tǒng)的數(shù)據(jù)庫管理和維護功能稍顯薄弱,在提供學(xué)生考試錄音及傳送給客戶端的表現(xiàn)上比較吃力。為了保證傳輸可靠性和可行性,便于考試過程中大量文件的傳輸,今后在線口語測試系統(tǒng)的研發(fā)除了需要高性能網(wǎng)卡提高服務(wù)器的網(wǎng)絡(luò)并發(fā)能力,更有效的方式在于對系統(tǒng)服務(wù)器進行有效劃分,建立應(yīng)用服務(wù)器和數(shù)據(jù)庫服務(wù)器,采用如Microsoft SQL Server 2008等大型關(guān)系型數(shù)據(jù)庫作為后臺管理數(shù)據(jù)庫,延伸數(shù)據(jù)管理的有效性,建立“以數(shù)據(jù)的綜合處理、流程匯總、試題數(shù)據(jù)庫管理和信息檢索技術(shù)為核心”的大型網(wǎng)絡(luò)數(shù)據(jù)整合應(yīng)用平臺。
2 對在線口語測試方案和實施的反思
(1)優(yōu)化測試方案
本次口語測試僅有短文朗讀和主題說話兩種題型,容易操作和實施,在機考口語測試中易于實現(xiàn),但考查形式稍顯單薄。人類語言具有強大的交際性,交流互動是學(xué)習(xí)一門語言最大的目的。短文朗讀側(cè)重語音基礎(chǔ)和意群停頓,主題說話注重描述事物或敘述事件的能力,兩種考查形式都缺乏交際功能,只能局限在描述、敘述等語言功能上,無法測試較高級的語言能力,存在引出的話語功能和話語范圍比直接口試狹窄的問題。
另外,本次口語考試測試時長為10分鐘,除去考試指令、準(zhǔn)備的時間,真正用于口語表達的時間僅四分鐘,這其中只有兩分鐘的時間用于主題說話。后期學(xué)生訪談結(jié)果也證明了這一點,有學(xué)生反映“考試剛開始,我還沒找到感覺就已經(jīng)結(jié)束了”。測試時間長度的制定需要考慮學(xué)生人數(shù)、設(shè)備數(shù)量、教學(xué)計劃、實驗人員工作時間等諸多客觀因素。合理有效的考試長度不僅能讓大規(guī)??谡Z測試高效有序的完成,而且能夠為學(xué)生提供足以展現(xiàn)其口語能力的時間長度??梢姡窈箝_展口語測試時間需要作出調(diào)整,調(diào)整依據(jù)可以參考大學(xué)英語四六級口語測試等大型考試的時間設(shè)置標(biāo)準(zhǔn)。
(2)完善評價體系
目前,我校學(xué)生的口語成績占期末總評成績的10%,而教師對學(xué)生的口語成績評定主要取決于期末在線口語測試成績,這使得學(xué)生平時在線口語訓(xùn)練的參與性不高,大部分學(xué)生反映平時很少在自主學(xué)習(xí)中心進行在線口語練習(xí),部分學(xué)生甚至從未去過自主學(xué)習(xí)中心。只有建立多層次、多維度的評價體系和口語學(xué)習(xí)激勵機制,加大口試在學(xué)期成績中的權(quán)重,把在線口語考試納入形成性考察之中,從平時、期中和期末口語考評三個方面對學(xué)生做出要求,注重平時成績的積累,促進學(xué)生參與在線口語訓(xùn)練的積極性,樹立學(xué)生口語學(xué)習(xí)的主體意識,從而減少偶然因素的影響,使評價更加客觀。
(3)促進教師多維角色轉(zhuǎn)變
教師的指導(dǎo)、監(jiān)督和管理角色在口語測試中具有重要作用。作為在線口語測試的管理者,教師應(yīng)該及時查看學(xué)生的口語練習(xí)記錄,對學(xué)生的在線練習(xí)數(shù)據(jù)給予反饋和幫助,引導(dǎo)學(xué)生參與更多的口語練習(xí)任務(wù),實現(xiàn)在線口語練習(xí)的良性循環(huán),保證教學(xué)相長的雙向互動性。教師管理的不到位在本次實踐中凸顯出來,大部分教師反映還未從傳統(tǒng)口語測試的角色中轉(zhuǎn)變過來,在線口語訓(xùn)練僅僅停留在對學(xué)生的口頭要求上,并且多數(shù)教師對在線測試平臺沒有深入了解,更談不上對學(xué)生的監(jiān)控和指導(dǎo)。因此,為了讓教師熟悉在線口語測試系統(tǒng),對教師的系統(tǒng)培訓(xùn)顯得尤為迫切,除此之外,同樣需要建立相應(yīng)的機制規(guī)范教師行為,避免出現(xiàn)由于在線口語測試系統(tǒng)的自評功能使得教師完全依賴于機評的被動現(xiàn)象。
五 結(jié)束語
口語測試是語言能力測試中不可缺少的一部分?,F(xiàn)代教育技術(shù)的發(fā)展為大學(xué)英語口語測試尋求新的突破提供了契機,計算機輔助大規(guī)模英語口語測試還處于嘗試階段,如何使大規(guī)模的口語測試易于操作并具備顯著的效度和信度,還需要大量的實踐和探索。