馮寶鑫,馬炳軍
(1.廣東外語外貿(mào)大學(xué) 英語語言文化學(xué)院,廣東 廣州 510420;2.阜陽師范大學(xué) 外國語學(xué)院,安徽 阜陽 236000)
研究表明,近十年(2009-2018)國內(nèi)有關(guān)“診斷性測試”的研究主要聚焦在大學(xué)英語教學(xué)和職業(yè)英語教學(xué)上,有關(guān)中學(xué)的相關(guān)測試研究寥寥無幾。調(diào)查顯示,診斷性測試在中學(xué)英語教學(xué)中的使用多于研究,遠未達到普及的地步,網(wǎng)絡(luò)環(huán)境下實施診斷性測試更是寥若星辰。診斷性測試未普及的原因主要包括:診斷性測試不太適合大規(guī)模的測試,但小規(guī)模的測試效果比較明顯[1];測試的數(shù)據(jù)收集、整理與分析過程,對任課教師的個人能力與精力都具有很大的挑戰(zhàn)性。最近的一份《中國互聯(lián)網(wǎng)發(fā)展狀況統(tǒng)計報告》顯示,內(nèi)地手機網(wǎng)民規(guī)模達到7.53億,普及率達到55.5%,超過全球平均水平[2]。調(diào)查表明,在校大學(xué)生的手機持有率幾乎是100%,據(jù)此,智能手機的普及為“互聯(lián)網(wǎng)+診斷測試”提供了可行性技術(shù)平臺。因此,“互聯(lián)網(wǎng)+智能手機”技術(shù)對該平臺可以用于優(yōu)化診斷性測試進行調(diào)查、驗證和分析。
診斷性語言測試是診斷學(xué)生優(yōu)勢和需求的重要工具[3],其目的是幫助學(xué)生更好地了解自己的語言優(yōu)勢和不足,從而幫助語言學(xué)習(xí)[4]。
多年來,研究者對有關(guān)診斷性測試的概念、特點以及意義頗有爭議。有的學(xué)者認為,診斷性測試的主要特點是查缺補漏,強調(diào)其功能性和針對性[5];有的學(xué)者把診斷性測試的定義模糊化,同時弱化了診斷性測試的功能性和針對性[6];有的學(xué)者則將其定義為“甄別測試”[7],主要用于測試學(xué)生的強項與弱項[8]。多數(shù)學(xué)者認為,診斷性測試可以測出學(xué)生的問題與成因[9],同時也可以將診斷結(jié)果用于研判和了解學(xué)生的理解水平[1]。如 Alderson和 Huhta所說,目前真正的診斷性語言測試相對較少[10]。
總之,診斷性測試具有“小規(guī)模、高頻率、重反饋、講效率”的特點。移動互聯(lián)網(wǎng)終端的升級換代非???,其硬件的提升和系統(tǒng)的升級都會對測試方法、測試手段產(chǎn)生巨大的影響。目前,尚未發(fā)現(xiàn)有互聯(lián)網(wǎng)+智能手機與診斷性測試結(jié)合的可行性研究。且最新研究未提及成果轉(zhuǎn)化的問題,即如何將分析出的數(shù)據(jù),直觀地轉(zhuǎn)化成輔助教師教學(xué)的成果。
(1)高校英語專業(yè)的師生對診斷性語言測試的使用情況如何?
(2)高校英語專業(yè)師生對通過“互聯(lián)網(wǎng)+智能手機”優(yōu)化診斷性測試的接受度如何?
參加本次測試的受試者來自安徽省阜陽師范大學(xué),受試人共44人,其中教師組14人(副教授2人,講師12人),學(xué)生組30人,受試者從高年級學(xué)生中通過隨機抽樣產(chǎn)生。教師組平均年齡38.4歲,男女比例為1:6。學(xué)生組平均年齡為20.7歲,男女比例1:4。
本研究通過問卷星實施調(diào)查,采用李克特量表制作問卷。問卷設(shè)計的選項分別從“非常同意到非常不同意”,計分從 A-E(1、2、3、4、5 分),每個問題的選擇頻數(shù)和百分比,見表1。
表1 問卷1-7題教師組(T)和學(xué)生組(S)各選項的選擇頻數(shù)(N)和百分比(%)
問卷共十項,包括7個封閉式問題 (單項選擇)和3個開放式問題(簡答題)。問卷1-5題考查對診斷性語言測試的理解和使用,旨在了解高校師生是否參加過該測試,效果如何以及是否愿意頻繁使用。問卷6-10題則關(guān)注優(yōu)化方案,包括對智能手機使用的可接受度和對于手機軟件在設(shè)計和使用上的期待。在開放式問題中,受試者被允許用中文或英文在簡答題中表達自己的觀點。答案被輸入計算機進行詞頻分析,詞頻較高的關(guān)鍵詞將會被重點分析。調(diào)查共獲得有效問卷44份。通過加密功能,只有收到密碼的受試者才能通過智能手機打開并填寫問卷。這既保證了數(shù)據(jù)的真實性,又提高了數(shù)據(jù)收集的效率。
數(shù)據(jù)分析主要是教師組和學(xué)生組數(shù)據(jù)的對比分析??偡质侵该拷M受試者的相應(yīng)分數(shù)相加得到的分數(shù)?!胺浅M狻钡?分,“非常不同意”得5分,那么分數(shù)越低,表示認同程度越高。平均分由總分除以樣本量得到,反映了某一組的受試者對某一觀點的態(tài)度。數(shù)據(jù)的處理結(jié)果,見表2。
表2 教師組(N=14)和學(xué)生組(N=30)對問卷各題的總分(S)和平均分(P)
對比兩組的平均分發(fā)現(xiàn),兩組在有效性、使用頻次和使用手機作為測試工具的問題上差異較大,對難度和手機APP的接受程度上的差異較小,態(tài)度趨于一致。通過兩組對比分析發(fā)現(xiàn)教師組認為診斷性語言測試是有效的(1.9分),但學(xué)生組對此持消極態(tài)度,平均分接近4分。
通過表2中兩組參與者的平均分可以發(fā)現(xiàn),學(xué)生組對診斷性語言測試的理解較差,學(xué)生對該測試的接受度較低。而教師組數(shù)據(jù)顯示,了解并接受該測試的教師群體對高頻次地使用該測試表示擔(dān)憂,因為傳統(tǒng)的診斷性測試耗時費力。調(diào)查顯示,在教學(xué)中使用智能手機作為教學(xué)工具的問題上,教師的態(tài)度非常積極,而學(xué)生卻持中立態(tài)度。
問卷中1-7題為師生兩類受試樣本評估工具的一致程度的百分比(見表2),數(shù)據(jù)精確到小數(shù)點后一位數(shù),四舍五入。學(xué)生組數(shù)據(jù)針對開放式問題的詞頻分析表明,對于高頻次使用診斷性語言測試的弊端,回答中詞頻最高的單詞是:time(17次),這說明師生非常關(guān)心頻繁的測試會占用大量的時間。關(guān)于“課堂上使用智能手機的弊端”,詞頻較高的是:“game”(22 次)和“control”(20 次)。由此可見,手機的娛樂功能控制成為師生關(guān)注的重點。軟件設(shè)計期望方面,可總結(jié)為:具有娛樂軟件屏蔽功能,操作頁面簡單,沒有廣告,保護隱私,這些建議充分反映了師生的關(guān)注點,頗具參考意義。我們要控制每次測試不超過5分鐘,做到針對某個具體的知識點進行有效測試。如何讓學(xué)生在課堂上有序地使用智能手機,有效屏蔽社交和游戲功能是優(yōu)化方案成功的關(guān)鍵,這些建議對于未來的軟件開發(fā)是有價值的。
通過問卷調(diào)查分析,本研究從現(xiàn)狀、設(shè)備、動機、頻次四個方面得出如下結(jié)論。
從現(xiàn)狀看,學(xué)生對診斷性語言測試的了解程度不高,接受度更低。數(shù)據(jù)顯示,認知狀態(tài)與可接受性呈正相關(guān),即對測試的理解越多,越容易接受使用測試方法,形成良性循環(huán)。因此,教師應(yīng)加強對該測試的介紹,讓學(xué)生了解診斷性語言測試的概念。
從設(shè)備上看,智能手機在師生中的普及率非常高,已經(jīng)具備了作為測試工具的基本條件。但在功能上,其社交功能和娛樂功能已成為師生共同關(guān)注的問題。在測試過程中開發(fā)針對社交軟件和娛樂軟件的屏蔽功能,簡化測試軟件本身的操作是非常重要的。
動機方面,教師有較強的使用動機,但影響學(xué)生動機的消極因素依然存在。訪談表明,受先驗知識影響,學(xué)生本身討厭考試,尤其是頻繁的考試。因此,對診斷性語言測試的不了解和偏見極大地影響了該測試的推廣。同時,多數(shù)同學(xué)擔(dān)心測試數(shù)據(jù)泄露、測試時間過長等,數(shù)據(jù)保護和時長控制問題應(yīng)當(dāng)引起足夠的注意。
在使用頻次方面,由于診斷性測試的靈活性和時效性,提高頻度是優(yōu)化評估的關(guān)鍵。因此,如何解決師生對效率的關(guān)注,提高一線教師使用診斷性語言測試的頻率是優(yōu)化的重中之重。與此同時,大多數(shù)教師愿意嘗試用智能手機優(yōu)化該測試。對于人們普遍擔(dān)心的手機會分散學(xué)生的注意力問題,設(shè)計人員在開發(fā)軟件時需要給出相應(yīng)的對策,增加社交軟件的攔截功能。
總之,調(diào)查反映出診斷性語言測試在英語教學(xué)的師生中使用情況并不樂觀,普遍的情況是師生對該測試模式“不會用、不敢用、不能用”,而傳統(tǒng)的測試模式難以解決師生雙方的顧慮。診斷性語言測試要想普及,必須進行優(yōu)化。
測試工具的升級是診斷性語言測試優(yōu)化的基礎(chǔ)。首先,智能手機體積較小,便于學(xué)生上課時攜帶并使用。其次,智能手機具有傳感器豐富以及數(shù)據(jù)傳輸方式多樣的優(yōu)點,教師可以使用多種形式呈現(xiàn)診斷性測試的內(nèi)容如設(shè)計語音題、看圖題等,并通過網(wǎng)絡(luò)發(fā)布、接受、處理測試數(shù)據(jù)。再次,其具有開發(fā)環(huán)境成熟高效,數(shù)據(jù)處理能力較強的優(yōu)點,可以同時處理大量的數(shù)據(jù)。此外,智能手機可以處理和呈現(xiàn)圖片并播放視頻,為數(shù)據(jù)分析的可視化提供了基礎(chǔ)。因此,智能手機具備成為優(yōu)化診斷性測試的教學(xué)用具,測試的形式也可以基于智能手機的特點進行相應(yīng)的開發(fā)。智能手機和互聯(lián)網(wǎng)技術(shù)的新特點新功能,將成為優(yōu)化的基礎(chǔ)條件。
優(yōu)化的內(nèi)容即改善“教育數(shù)據(jù)”的輸入、處理、輸出、反饋過程。本研究所引述的“教育數(shù)據(jù)”的概念為其狹義定義,即為“學(xué)習(xí)者的行為數(shù)據(jù)”,具體到診斷性測試中,應(yīng)為“被測試者在測試中使用互聯(lián)網(wǎng)終端的行為數(shù)據(jù)”。
教育評價正在從“經(jīng)驗主義”走向“數(shù)據(jù)主義”,從“宏觀群體”評價走向“微觀個體”評價,從“單一評價”走向“綜合評價”[11]。優(yōu)化后的分類,將更加具體到個體,進行精確分析?,F(xiàn)舉例說明傳統(tǒng)的數(shù)據(jù)收集和優(yōu)化后的數(shù)據(jù)收集的對比:如對“定語從句”進行多次測試,在初始數(shù)據(jù)方面,傳統(tǒng)模式只能收集學(xué)生的姓名、學(xué)號,而優(yōu)化模式可以確認某生對“定義從句”的以往答題情況,進而生成個性化試題。在時間數(shù)據(jù)和內(nèi)容數(shù)據(jù)收集方面,優(yōu)化模式可以收集每道題的答題時間,以此判斷熟練度并對所涉知識點進行歸類分析。優(yōu)化模式還將追蹤個體的單項平均分、錯誤率等具體數(shù)據(jù),在這些方面?zhèn)鹘y(tǒng)模式無法做到??傊瑑?yōu)化模式將使得測試走向個性化,并且將會更加具體地描繪以個體為單位的知識掌握情況。
目前普遍認可的處理方法是由Fayyad設(shè)計的“多階段處理模型”。優(yōu)化后的數(shù)據(jù)處理,面對的是互聯(lián)網(wǎng)終端收集來的大量而全面的數(shù)據(jù),因此需要優(yōu)化的是“數(shù)據(jù)的篩選”和“相關(guān)數(shù)據(jù)的匹配”,排除對測試目的沒有幫助的數(shù)據(jù)[12]。
高校師范生基本上沒有受過數(shù)據(jù)分析方面的培訓(xùn),缺乏對復(fù)雜的數(shù)據(jù)進行量化分析和解讀的能力[13]??紤]到由于個體差異會導(dǎo)致解讀結(jié)果的極大不同,我們需要幫助教師把數(shù)據(jù)可視化。以初高中階段常見的單項選擇題為例,每題有四個選項,有且只有一個正確選項,答對一題的概率是25%,那么選項的干擾程度E:E=N1/N2(N1:某選項的錯誤人數(shù)N2:該題的正確人數(shù))。當(dāng)E≥1時,相似度很高;當(dāng)E≥0.8時,相似度較高;當(dāng) E≥0.5時,有一定干擾;當(dāng)E≥0.2時,干擾度很小。據(jù)此,系統(tǒng)將可以識別干擾度高的選項,并直接告知教師哪些選項間干擾度較高,需要重點講解。這樣就解決了教師在講評試卷過程中,僅僅依靠經(jīng)驗或粗略的統(tǒng)計,對不同的題目給予不同的重視程度的現(xiàn)象。
測試工具方面,將傳統(tǒng)診斷性測試中使用的紙質(zhì)版試卷替換成學(xué)生自行攜帶的智能手機,教師通過專門為診斷性測試開發(fā)的應(yīng)用軟件(推薦使用Android Studio)進行試題編輯,并在每一課時結(jié)束時利用網(wǎng)絡(luò)發(fā)布。測試形式以選擇題為主,可出現(xiàn)適當(dāng)?shù)奶羁疹}。簡答題的答案難以用互聯(lián)網(wǎng)終端進行分析。同時,教師應(yīng)加強思想引導(dǎo),在鼓勵“手機進課堂”的同時,強調(diào)課堂紀律。教室可設(shè)置網(wǎng)絡(luò)屏蔽設(shè)備,在有需要的時候開放網(wǎng)絡(luò),在其余時間屏蔽網(wǎng)絡(luò)信號,將負面因素降到最小。
測試設(shè)計上,做到內(nèi)容扁平化,只設(shè)立一級菜單;測試以選擇題為主,方便概率的分析;測試可以增加圖片、音頻及視頻,充分發(fā)揮智能手機的優(yōu)勢;測試時間不宜超過5分鐘,保證手機的續(xù)航能力和學(xué)生的注意力;在測試軟件運行時自動屏蔽聊天和娛樂功能,一旦學(xué)生主動退出答題界面,則系統(tǒng)需要有相應(yīng)的對策以阻止學(xué)生將注意力轉(zhuǎn)移到娛樂軟件上,以此將手機測試的弊端降到最小。
在優(yōu)化的過程中,我們需要建立多個數(shù)據(jù)庫,包括學(xué)生數(shù)據(jù)庫——學(xué)生英語能力信息卡;測試項目數(shù)據(jù)庫——為每個知識點準備幾個問題。教師只需選擇考試知識點的名稱即可自動顯示相應(yīng)的問題;測試結(jié)果數(shù)據(jù)庫——統(tǒng)計每個知識點的錯誤率,為期末如何更好地進行成績測試提供建議。在數(shù)據(jù)分析和優(yōu)化方面,應(yīng)該更加具有實用性,為教師的教學(xué)改進提供直觀的建議而非僅僅提供數(shù)據(jù)。教師不應(yīng)成為數(shù)據(jù)的解讀者,而應(yīng)該成為數(shù)據(jù)分析成果的使用者。
在優(yōu)化測試數(shù)據(jù)的量化分析方面,一是加入鑒別指數(shù)法和難度系數(shù)法相結(jié)合的分析方法,對測試總體進行量化分析,同時加強選項間相似度的量化分析,設(shè)置干擾度E,當(dāng)E≥1時,相似度很高;當(dāng)E≥0.8時,相似度較高;當(dāng)E≥0.5時,有一定干擾;當(dāng)E≥0.2時,干擾度很小。數(shù)據(jù)可以直觀化,即測試系統(tǒng)不用給教師發(fā)送枯燥的數(shù)據(jù)而是直接給教師的教學(xué)活動提供指導(dǎo)意見。
研究發(fā)現(xiàn),診斷性語言測試在英語專業(yè)沒有引起足夠的重視。數(shù)據(jù)表明,高年級學(xué)生普遍不了解該測試,而教師在教學(xué)中幾乎不運用該測試方法。盡管該測試被認為是有效的,但操作上存在諸多困難,難以被高頻次應(yīng)用。因此,利用新平臺新技術(shù)對診斷性測試進行優(yōu)化,才能真正促進該測試的普及。研究顯示,師生普遍接受把智能手機、互聯(lián)網(wǎng)技術(shù)融入該測試的設(shè)想,但關(guān)鍵要解決好娛樂社交功能對教學(xué)活動的負面影響。
診斷性語言測試在英語教學(xué)中長期處在“明知有用,但不能用”的境地。只有真正解決教師的困難顧慮,提高使用的效率效果,才能促進診斷性語言測試的普及?;ヂ?lián)網(wǎng)技術(shù)和手機的普及為問題的解決帶來契機。在此基礎(chǔ)上,我們要進一步深入挖掘診斷性測試與互聯(lián)網(wǎng)技術(shù)的可能性,設(shè)計相關(guān)的手機軟件,在理論與實踐的結(jié)合過程中不斷磨合完善,讓診斷性語言測試真正融入教學(xué),輔助教學(xué),促進測試領(lǐng)域的改革。