李振文 中國(guó)教育科學(xué)研究院基礎(chǔ)教育研究所
在當(dāng)今教育領(lǐng)域,各種測(cè)試題以紙筆測(cè)試居多。隨著信息技術(shù)的進(jìn)一步應(yīng)用,基于電子設(shè)備終端而進(jìn)行的測(cè)試正在迅速發(fā)展,比如計(jì)算機(jī)等級(jí)考試、雅思和托??荚?、建造師考試等。基于電子設(shè)備終端而進(jìn)行的測(cè)試,為測(cè)試者和閱卷者帶來(lái)便利。
當(dāng)前所出現(xiàn)的基于電子設(shè)備終端而進(jìn)行的測(cè)試,多數(shù)是基于靜態(tài)文本而呈現(xiàn)的信息,即實(shí)現(xiàn)了將紙筆測(cè)試轉(zhuǎn)移到電子終端,但并沒(méi)有發(fā)揮電子終端的智能特征。而國(guó)際上在PISA(Programme for International Student Assessment,國(guó)際學(xué)生評(píng)價(jià)項(xiàng)目)和NEAP(National Assessment of Educational Progress,美國(guó)國(guó)家教育進(jìn)展評(píng)價(jià))測(cè)試中,其題目已經(jīng)出現(xiàn)了顯著變化,即交互式試題。這種試題不再是紙筆測(cè)試,而是直接搬到電子屏幕上,利用電子設(shè)備的智能化特征,實(shí)現(xiàn)學(xué)生和終端之間的互動(dòng)。這樣的測(cè)試能更深入地了解學(xué)生的能力值,能模擬現(xiàn)實(shí)世界中難以接觸的模型,能帶來(lái)學(xué)生和測(cè)試工具之間的互動(dòng),以實(shí)現(xiàn)紙筆測(cè)試所不能實(shí)現(xiàn)的功能。
由此可見(jiàn),交互式試題是以計(jì)算機(jī)、手機(jī)、平板電腦等智能設(shè)備為工具,通過(guò)測(cè)試者與智能設(shè)備之間的信息互動(dòng),達(dá)到對(duì)測(cè)試者知識(shí)和能力考查的目標(biāo)。
在PISA 測(cè)試中,交互式試題一般由一個(gè)情景和多個(gè)問(wèn)題組成,從而構(gòu)成一個(gè)測(cè)試單元。交互式試題提供了一個(gè)模擬的互動(dòng)科學(xué)探究環(huán)境,用以評(píng)估學(xué)生在現(xiàn)實(shí)世界中的真實(shí)科學(xué)能力,幫助測(cè)查學(xué)生對(duì)應(yīng)的多個(gè)水平。在大多數(shù)情況下,每個(gè)交互式試題對(duì)應(yīng)評(píng)估多個(gè)知識(shí)和能力類(lèi)別,個(gè)別試題可能只對(duì)應(yīng)評(píng)估一種形式的知識(shí)或能力。
PISA 運(yùn)用這種試題結(jié)構(gòu)來(lái)達(dá)到盡可能真實(shí)的情景,從而有效反映現(xiàn)實(shí)生活的復(fù)雜性,高效利用測(cè)試時(shí)間。每個(gè)試題可以提出若干問(wèn)題,避免針對(duì)不同情況單獨(dú)提出問(wèn)題,避免因減少了測(cè)試字?jǐn)?shù)而相應(yīng)減少學(xué)生閱讀每個(gè)問(wèn)題材料的時(shí)間。整個(gè)情景內(nèi)的試題內(nèi)容不能有關(guān)聯(lián),不能影響測(cè)試的結(jié)果,要確保能使用足夠多的情景,還得保證情景的選擇不能影響測(cè)試的結(jié)果。
在NEAP 測(cè)試中,交互式試題記錄了學(xué)生對(duì)多項(xiàng)選擇類(lèi)問(wèn)題的答案以及對(duì)描述類(lèi)問(wèn)題的反應(yīng),并能在學(xué)生完成任務(wù)期間捕獲學(xué)生的行為,這些行為提供了與探究技能相關(guān)的深層次信息。例如,在“神秘植物”任務(wù)期間,學(xué)生在進(jìn)行實(shí)驗(yàn)時(shí)所使用的植物托盤(pán)的數(shù)量可以由測(cè)試系統(tǒng)捕獲。交互式試題的評(píng)分環(huán)節(jié)由計(jì)算機(jī)依據(jù)一定的算法自動(dòng)完成。
當(dāng)下出現(xiàn)的交互式試題主要集中在PISA 和NEAP中,本文主要針對(duì)這兩種測(cè)評(píng)中的交互式試題分類(lèi)進(jìn)行說(shuō)明。
在PISA 測(cè)試中,交互式試題出現(xiàn)在“問(wèn)題解決類(lèi)”(problem solving)試題中。PISA 根據(jù)問(wèn)題情景的性質(zhì),將問(wèn)題解決類(lèi)題目分為靜態(tài)和互動(dòng)兩種。靜態(tài)意味著所有的信息會(huì)在同一時(shí)間全部公開(kāi),包括文本、圖形、表格、圖表和相關(guān)問(wèn)題等?;?dòng)意味著不是所有的信息會(huì)在同一時(shí)間全部公開(kāi),它包括互動(dòng)的刺激材料和相關(guān)問(wèn)題,所以有些信息必須通過(guò)探索過(guò)程才能被發(fā)現(xiàn)。交互式試題對(duì)應(yīng)互動(dòng)類(lèi)別,通過(guò)模擬科學(xué)探究過(guò)程評(píng)價(jià)學(xué)生的科學(xué)素養(yǎng)。試題由特定刺激材料構(gòu)成,其可以是簡(jiǎn)短的書(shū)面段落或者帶有表格、圖像的文字,還可以包括非靜態(tài)刺激材料,如動(dòng)畫(huà)和交互式模擬。試題中包含一組多種類(lèi)型并獨(dú)立評(píng)分的問(wèn)題。
在NEAP 測(cè)試中,交互式試題出現(xiàn)在交互式計(jì)算機(jī)任務(wù)(interactive computer tasks,ICT)中。交互式試題通過(guò)模擬自然或?qū)嶒?yàn)室環(huán)境,要求學(xué)生在基于計(jì)算機(jī)的環(huán)境中解決科學(xué)問(wèn)題。這些任務(wù)為學(xué)生提供了一個(gè)多樣化參與科學(xué)問(wèn)題的機(jī)會(huì),但沒(méi)有與真實(shí)任務(wù)相關(guān)的物質(zhì)條件等方面的限制。
以PISA 官網(wǎng)所呈現(xiàn)的交互式試題“圣德”為例,該題是以地理學(xué)科為主的題目,考查的核心目標(biāo)是協(xié)作解決問(wèn)題技能。試題開(kāi)始有少量簡(jiǎn)介,之后包含三部分內(nèi)容。每個(gè)問(wèn)題的選項(xiàng)限于篇幅,在本研究中未能全部包含,僅展示兩個(gè)問(wèn)題的全部選項(xiàng),并將其作為下文評(píng)分標(biāo)準(zhǔn)的示例。
試題簡(jiǎn)介部分如下:
你的老師將全班學(xué)生分成三人小組進(jìn)行比賽,回答12 條有關(guān)一個(gè)名叫圣德的國(guó)家的問(wèn)題,最先答對(duì)的組別將會(huì)獲勝。開(kāi)啟圣德地圖上的聯(lián)結(jié),可以找到有關(guān)的答案。有四條是“地理”的問(wèn)題,如圣德最大的雨林是什么?有四條是“人民”的問(wèn)題,如圣德人的平均年齡是多少?有四條是“經(jīng)濟(jì)”的問(wèn)題,如圣德的就業(yè)率是多少?
試題的第一部分主要是小組討論完成任務(wù)的策略和分工,內(nèi)容如下:
你和你的組員麗斯和碩祺,可以使用以下功能:
聊天:用來(lái)互相溝通
標(biāo)示主題的按鈕:用來(lái)顯示比賽的問(wèn)題,并在圣德地圖上尋找答案。
計(jì)分卡:用來(lái)追查小組的進(jìn)度。計(jì)分卡會(huì)顯示小組答對(duì)的題數(shù)。
老師要求小組在比賽開(kāi)始前,不要尋找問(wèn)題和答案。相反,她建議花一點(diǎn)時(shí)間與組員討論如何以最好的方法來(lái)完成比賽。你的組員麗斯和碩祺已經(jīng)開(kāi)始聊天。
點(diǎn)擊以下按鈕來(lái)加入聊天。
當(dāng)點(diǎn)擊聊天按鈕后,界面顯示如圖1所示:
圖1 加入聊天后的交互式試題界面
加入聊天后,窗口內(nèi)是小組成員的聊天內(nèi)容,下面有若干選項(xiàng)供學(xué)生選擇。點(diǎn)擊某個(gè)選項(xiàng),然后點(diǎn)擊“傳送”按鈕即可參與聊天。
誰(shuí)在聊天
你 麗斯 碩祺
麗斯:嗨,我不太肯定用什么方法來(lái)進(jìn)行比賽最好。
碩祺:我們先做了再說(shuō)。
你:
(問(wèn)題1)
我懷疑其他組已經(jīng)開(kāi)始了。
我希望題目會(huì)容易一些。
或許我們應(yīng)該先討論一下答題的策略。
麗斯,當(dāng)我們開(kāi)始以后,你會(huì)知道要做什么了。
你:或許我們應(yīng)該先討論一下答題的策略。(選擇的選項(xiàng))
在此部分,如果選擇不同的選項(xiàng),聊天的內(nèi)容還會(huì)繼續(xù),且小組成員的聊天內(nèi)容不會(huì)發(fā)生變化。
麗斯:我很想我們?cè)陂_(kāi)始之前有一個(gè)計(jì)劃。
碩祺:我們應(yīng)該要盡快回答問(wèn)題。
你:沒(méi)錯(cuò),但是用什么方法來(lái)作答才好呢?(選擇的選項(xiàng))
麗斯:各位,我們需要想想小組如何才能好好合作啊。
碩祺:我們每個(gè)人用最快的速度來(lái)作答就是了。有什么難度呢?
你:假如我們分工,各自負(fù)責(zé)不同的題目,我們回答的問(wèn)題可以更多。(選擇的選項(xiàng))
麗斯:你知道嗎,如果我們一起找同一類(lèi)的答案,只會(huì)做得很慢。
碩祺:噢,是的……我終于明白了。
你:我們可以每個(gè)人選擇一個(gè)主題。(選擇的選項(xiàng))
試題的第2 部分主要是每個(gè)小組成員選擇一個(gè)作答主題,內(nèi)容如下:
你的小組同意每位組員負(fù)責(zé)回答一個(gè)主題內(nèi)的問(wèn)題。麗斯和碩祺已經(jīng)開(kāi)始了一個(gè)新的聊天。
點(diǎn)擊以下按鈕來(lái)加入聊天。
麗斯:我想選擇“人民”。
碩祺:喂!我也想選那個(gè)。
你:你們可以各自解釋為什么你想要這個(gè)主題嗎?(選擇的選項(xiàng))
碩祺:我只是想“人民”的問(wèn)題應(yīng)該是最簡(jiǎn)單的。
麗斯:我對(duì)不同國(guó)家的人民和生活方式十分感興趣。我經(jīng)常閱讀與這個(gè)主題有關(guān)的書(shū)籍。
你:聽(tīng)起來(lái)“人民”這個(gè)主題應(yīng)該屬于麗斯。碩祺,你認(rèn)為這樣好嗎?(選擇的選項(xiàng))
碩祺:我想“經(jīng)濟(jì)”應(yīng)該可以吧。我喜歡錢(qián)。
你:那我選“地理”吧。(選擇的選項(xiàng))
試題的第三部分主要是小組成員要完成自己選擇的主題,內(nèi)容如下:
你的小組已經(jīng)達(dá)成以下共識(shí):
“地理”是你負(fù)責(zé)的主題。
“人民”是麗斯負(fù)責(zé)的主題。
“經(jīng)濟(jì)”是碩祺負(fù)責(zé)的主題。
比賽開(kāi)始了!請(qǐng)點(diǎn)擊一個(gè)主題按鈕來(lái)開(kāi)始。
當(dāng)點(diǎn)擊“地理”按鈕后,試題界面如圖2所示:
圖2 點(diǎn)擊“地理”之后的試題界面圖
當(dāng)選擇某個(gè)主題之后,點(diǎn)擊地形圖上面的標(biāo)識(shí),可以提取到題目給出的信息。如上圖點(diǎn)擊了左上角的標(biāo)識(shí)后,題目給出的信息是圖中圈住的部分“圣德最高的山是莫祖山”。然后點(diǎn)擊第二個(gè)問(wèn)題的答題按鈕,按鈕中就會(huì)填入莫祖山的答案。其他試題的作答過(guò)程類(lèi)似。此時(shí),小組聊天窗口還在繼續(xù)。
麗斯:我們答對(duì)了一題。我們繼續(xù)吧!
(問(wèn)題2)
時(shí)光飛逝,我們不要浪費(fèi)時(shí)間聊天了。
是誰(shuí)答了地理題?。坎诲e(cuò)??!
既然有人回答了“地理”題,我轉(zhuǎn)答其他主題吧!
你:應(yīng)該由我來(lái)回答“地理”題。我們做自己原本選擇的主題吧?。ㄟx擇的選項(xiàng))
在一定的作答時(shí)間后,試題給出下一個(gè)頁(yè)面。
麗斯:我的計(jì)分卡是對(duì)的嗎?我們做得怎么樣?
你:我們看來(lái)表現(xiàn)不錯(cuò),除了“經(jīng)濟(jì)”外。(選擇的選項(xiàng))
此后作答界面跳轉(zhuǎn)到最終界面,顯示答題成功,如圖3所示:
圖3 交互式試題的答題成功界面
PISA 測(cè)試中,“圣德”交互式試題圍繞12 種協(xié)作問(wèn)題解決技能展開(kāi),這些技能是四種問(wèn)題解決的過(guò)程和三種協(xié)作能力的交叉。PISA 給出的協(xié)作問(wèn)題解決技能框架見(jiàn)表1:
表1 PISA的協(xié)作問(wèn)題解決技能框架
PISA 還提供了一個(gè)整體協(xié)作問(wèn)題解決能力量表,涵蓋了交互式協(xié)作問(wèn)題解決中的所有項(xiàng)目。協(xié)作問(wèn)題解決能力量表的設(shè)計(jì)目標(biāo)是,經(jīng)濟(jì)合作與發(fā)展組織國(guó)家的平均分為500 分,約三分之二的學(xué)生得分在400 分~600分之間。該量表分為五個(gè)熟練程度等級(jí)。其中1至4 級(jí)是對(duì)成功完成問(wèn)題的技能的描述,最低的級(jí)別是“低于1級(jí)”,對(duì)應(yīng)學(xué)生得分為低于340分,表示學(xué)生缺乏這些技能。1 級(jí)是協(xié)作問(wèn)題解決能力的最低級(jí)別,表示初級(jí)水平,對(duì)應(yīng)學(xué)生得分為340 分~440 分;2 級(jí)對(duì)應(yīng)440 分~540 分;3 級(jí)對(duì)應(yīng)540 分~640 分;4 級(jí)對(duì)應(yīng)協(xié)作問(wèn)題解決能力的最高水平,對(duì)應(yīng)學(xué)生得分為高于640分。成績(jī)?cè)?級(jí)范圍內(nèi)的學(xué)生有望成功完成大部分1級(jí)項(xiàng)目,但不太可能成功完成更高級(jí)別的項(xiàng)目。相比之下,成績(jī)?cè)? 級(jí)范圍內(nèi)的學(xué)生很可能可以成功完成協(xié)作問(wèn)題解決測(cè)試中的所有項(xiàng)目。
本研究以兩個(gè)具體問(wèn)題的評(píng)分標(biāo)準(zhǔn)為例進(jìn)行說(shuō)明。
首先,以上文“圣德”試題中的問(wèn)題1 為例,其評(píng)分標(biāo)準(zhǔn)見(jiàn)表2。問(wèn)題1關(guān)注學(xué)生討論過(guò)程中如何建立共同的理解。此問(wèn)題的正確回答是“或許我們應(yīng)該先討論一下答題的策略”,這有助于團(tuán)隊(duì)關(guān)注如何以最佳方式完成任務(wù)。學(xué)生必須主動(dòng)提出解決問(wèn)題所需的邏輯選項(xiàng),即應(yīng)該先確定答題策略,才能幫助團(tuán)隊(duì)取勝。該問(wèn)題對(duì)應(yīng)協(xié)作問(wèn)題解決能力量表的2 級(jí),對(duì)應(yīng)學(xué)生得分為502分。
表2 問(wèn)題1的評(píng)分標(biāo)準(zhǔn)
其次,以上文“圣德”試題中的問(wèn)題2 為例,其評(píng)分標(biāo)準(zhǔn)見(jiàn)表3。該問(wèn)題聚焦于對(duì)小組操作的監(jiān)控與反饋。在學(xué)生嘗試回答地理類(lèi)別中的問(wèn)題之前,第一個(gè)地理問(wèn)題的答案會(huì)顯示在記分卡上,并帶有復(fù)選標(biāo)記。麗斯評(píng)論說(shuō)有一個(gè)問(wèn)題已經(jīng)得到了回答。此時(shí)應(yīng)該注意到,這個(gè)題目并不是由選擇地理主題的“自己”完成,而是由別人完成。所以,這位同學(xué)的行為違反了最初制定的規(guī)則。對(duì)于該題目,學(xué)生容易選擇“是誰(shuí)答了地理題???不錯(cuò)??!”選項(xiàng),因?yàn)樵撨x項(xiàng)是對(duì)組員的鼓勵(lì)。但PISA更為關(guān)注小組合作時(shí)的規(guī)則,如果大家都不按照自己選擇的主題進(jìn)行作答,而是喜歡哪個(gè)答哪個(gè),將影響到小組的分工合作,并影響到最終整個(gè)題目的答題效率。
表3 問(wèn)題2的評(píng)分標(biāo)準(zhǔn)
該問(wèn)題對(duì)應(yīng)4 級(jí)難度水平,是測(cè)評(píng)中最難的水平。它要求學(xué)生不僅要跟蹤聊天,還要跟蹤答題狀態(tài)的變化。也就是說(shuō),學(xué)生必須注意到,現(xiàn)在發(fā)生的事件違反了每個(gè)成員只能選擇一個(gè)主題進(jìn)行作答的協(xié)議。該問(wèn)題的正確答案是合理阻止小組成員的違規(guī)行為,從而平衡個(gè)體的問(wèn)題解決需求和在游戲中所分配的角色之間的關(guān)系。
交互式試題在測(cè)評(píng)學(xué)生能力時(shí),能夠更加關(guān)注學(xué)生的過(guò)程性技能,記錄的信息更加詳細(xì),評(píng)分準(zhǔn)則也將更加科學(xué)合理。在計(jì)算機(jī)應(yīng)用更加普及、智能化水平越來(lái)越發(fā)達(dá)的今天,交互式試題的應(yīng)用將引發(fā)測(cè)評(píng)領(lǐng)域的變革。
未來(lái),交互式試題最為突出的特征,將是能夠隨著學(xué)生作答的變化而變化,深度適應(yīng)當(dāng)前學(xué)生的能力和水平,對(duì)應(yīng)呈現(xiàn)與其吻合的測(cè)評(píng)工具,實(shí)現(xiàn)智能測(cè)評(píng)。首先,交互式試題與大數(shù)據(jù)若能取得更為緊密的結(jié)合,則能夠有效利用大數(shù)據(jù)背后的海量信息,及時(shí)準(zhǔn)確地對(duì)當(dāng)前學(xué)生的能力做出反饋。通過(guò)適時(shí)改變測(cè)試題組,更為準(zhǔn)確地測(cè)評(píng)到學(xué)生的能力。其次,交互式試題如果能夠大范圍應(yīng)用,將改變當(dāng)前應(yīng)試教育的局面。應(yīng)試教育長(zhǎng)期存在的重要原因之一,就是測(cè)試內(nèi)容主要和知識(shí)相關(guān),而交互式試題的變化性在能力測(cè)試方面具有得天獨(dú)厚的優(yōu)勢(shì)。理想情況下,交互式試題可以不受考試時(shí)間的限制,對(duì)學(xué)生的能力進(jìn)行科學(xué)評(píng)判。當(dāng)考試的核心轉(zhuǎn)移到能力上時(shí),應(yīng)試教學(xué)將很難有所作為,必將得到有效限制。再次,交互式試題有助于人才選拔。當(dāng)前,多元智能理論被普遍接受,但卻難以廣泛應(yīng)用,究其原因就是單次、少量的測(cè)試工具終究難以直接測(cè)試出學(xué)生在某方面是否擅長(zhǎng)、是否有天分。但交互式試題能夠依據(jù)學(xué)生的不同反應(yīng),持續(xù)不斷地輸出各個(gè)維度的試題,從而確定學(xué)生是否在某個(gè)方面有特長(zhǎng)。這對(duì)于依據(jù)單次、少量的考試確定學(xué)生未來(lái)發(fā)展方向?qū)⒕哂兄匾饬x。