初中英語(yǔ)學(xué)業(yè)水平考試(以下簡(jiǎn)稱“中考英語(yǔ)”)是初中階段最重要的一項(xiàng)終結(jié)性測(cè)試。它依據(jù)《義務(wù)教育英語(yǔ)課程標(biāo)準(zhǔn)(2022年版)》(以下簡(jiǎn)稱《義教新課標(biāo)》)命制,是對(duì)學(xué)生完成九年義務(wù)教育后英語(yǔ)學(xué)業(yè)水平的檢驗(yàn),也是高一級(jí)學(xué)校錄取人才的重要依據(jù)。因此,其試題質(zhì)量對(duì)該項(xiàng)測(cè)試的分?jǐn)?shù)解釋和分?jǐn)?shù)使用都具有極其重要的影響。測(cè)試是一項(xiàng)綜合性系統(tǒng)工程,一項(xiàng)完整的測(cè)試系統(tǒng)至少包含測(cè)試目的明確、測(cè)試級(jí)別定位、測(cè)試構(gòu)念界定、測(cè)試規(guī)范和任務(wù)撰寫(xiě)、試測(cè)與試題評(píng)估、正式施測(cè)、分?jǐn)?shù)推斷、教學(xué)決策等環(huán)節(jié)(Fulcher,2010)。這個(gè)過(guò)程會(huì)產(chǎn)生一系列文件,如試題、多維細(xì)目表、成績(jī)分析報(bào)告等。但一般情況下,非測(cè)試核心人員往往只能獲得試題。本文基于通常情況下僅能獲得試題的現(xiàn)實(shí),以實(shí)踐為出發(fā)點(diǎn),淺談在僅能獲得試題(不包括評(píng)分細(xì)則)的情況下,如何對(duì)中考英語(yǔ)命題質(zhì)量開(kāi)展評(píng)估。以下從宏觀層面和微觀層面兩個(gè)角度來(lái)展開(kāi)討論。
從宏觀層面上來(lái)評(píng)估試題時(shí),評(píng)估者應(yīng)首先考慮測(cè)試中素材的價(jià)值取向;其次,評(píng)估者要考慮測(cè)試目的,進(jìn)而從內(nèi)容效度的角度來(lái)評(píng)估試題的質(zhì)量。
測(cè)試是一種社會(huì)行為,發(fā)生在特定的社會(huì)情境中,發(fā)揮特定的社會(huì)功能,如促進(jìn)社會(huì)公平、實(shí)現(xiàn)教育機(jī)會(huì)均等。測(cè)試也從來(lái)不是價(jià)值中立的,它本質(zhì)上是一種政治行為(Fulcher,2009)?!督逃筷P(guān)于加強(qiáng)初中學(xué)業(yè)水平考試命題工作的意見(jiàn)》(以下簡(jiǎn)稱《意見(jiàn)》)第一條為“堅(jiān)持正確導(dǎo)向”,其中將落實(shí)立德樹(shù)人根本任務(wù)放在首要位置。《意見(jiàn)》提出,考試命題工作要堅(jiān)持正確政治方向,牢固樹(shù)立“四個(gè)意識(shí)”,堅(jiān)定“四個(gè)自信”,堅(jiān)決做到“兩個(gè)維護(hù)”。注重加強(qiáng)對(duì)學(xué)生理想信念、愛(ài)國(guó)主義、品德修養(yǎng)、知識(shí)見(jiàn)識(shí)、奮斗精神、綜合素質(zhì)等方面的考查,積極培育和踐行社會(huì)主義核心價(jià)值觀,弘揚(yáng)中華優(yōu)秀傳統(tǒng)文化、革O7u58m+7U/2NH05kSXamk8TizJ1EElYDMZoqaEWHNo0=命文化和社會(huì)主義先進(jìn)文化,引導(dǎo)學(xué)生樹(shù)立正確的國(guó)家觀、民族觀、歷史觀、文化觀和宗教觀,促進(jìn)學(xué)生德智體美勞全面發(fā)展(教育部,2019)。這些內(nèi)容與《義教新課標(biāo)》的育人理念是完全吻合的。
在測(cè)試素材的價(jià)值取向方面,評(píng)估者要通過(guò)閱讀試題中的素材,來(lái)判定試題內(nèi)容的價(jià)值取向是否與《意見(jiàn)》和《義教新課標(biāo)》的內(nèi)容吻合。具體操作性表格可參考表1。評(píng)估者可以對(duì)試題中的素材進(jìn)行編號(hào),先判斷其是否堅(jiān)持正確的政治方向,再通過(guò)通讀素材,歸納其所傳遞的核心意義,并將之歸屬于不同類別,如體現(xiàn)社會(huì)主義核心價(jià)值觀、弘揚(yáng)中華優(yōu)秀傳統(tǒng)文化等。
從語(yǔ)言測(cè)試學(xué)角度來(lái)說(shuō),不論是設(shè)計(jì)一項(xiàng)測(cè)試,還是評(píng)估一項(xiàng)測(cè)試,首先要考慮的是測(cè)試目的。Ingram(1968:70)曾說(shuō)過(guò):“所有的測(cè)試都有其目的。如果沒(méi)有清晰地陳述測(cè)試目的,那么這項(xiàng)測(cè)試不會(huì)是一項(xiàng)好的測(cè)試?!盋arroll(1961:314)也指出:“語(yǔ)言測(cè)試的目的是提供信息,以幫助人們就可能的行動(dòng)方案作出明智的決定?!钡@些決定是多種多樣的,并且需要人們針對(duì)測(cè)試的每種預(yù)期用途作出非常具體的決定。從操作層面上看,F(xiàn)ulcher(2010)認(rèn)為,測(cè)試者如果沒(méi)有清晰地陳述測(cè)試目的,在選擇測(cè)試的內(nèi)容和形式時(shí)就無(wú)法提供令人信服的理?yè)?jù)。具體來(lái)說(shuō),測(cè)試者對(duì)測(cè)試目的的陳述應(yīng)該包含目標(biāo)測(cè)試群體的信息和他們的水平范圍、目標(biāo)語(yǔ)言使用域、知識(shí)技能能力的范圍等(Fulcher & Davidson,2007)。對(duì)測(cè)試目的的陳述為測(cè)試構(gòu)念(即測(cè)試的能力是什么)和內(nèi)容的選擇提供理?yè)?jù),在預(yù)期分?jǐn)?shù)解釋和分?jǐn)?shù)使用之間搭起橋梁。
就中考英語(yǔ)來(lái)說(shuō),根據(jù)《義教新課標(biāo)》的規(guī)定,它承擔(dān)了雙重的考試目的:一方面檢測(cè)義務(wù)教育階段結(jié)束時(shí)學(xué)生的學(xué)業(yè)成就,另一方面為高一級(jí)學(xué)校招生錄取提供依據(jù)。此外,它也為評(píng)價(jià)區(qū)域和學(xué)校教學(xué)質(zhì)量提供參考,還包含改進(jìn)教育質(zhì)量和教學(xué)方式的價(jià)值取向。從測(cè)試學(xué)角度來(lái)說(shuō),中考英語(yǔ)是一項(xiàng)終結(jié)性測(cè)試,兼具學(xué)習(xí)認(rèn)證(certification)和選拔(selection)的功能;也是一項(xiàng)高風(fēng)險(xiǎn)考試,因?yàn)槠浞謹(jǐn)?shù)使用會(huì)關(guān)系到考生能否畢業(yè)、是否有機(jī)會(huì)進(jìn)入下一個(gè)階段的學(xué)習(xí)。同時(shí),該考試還承擔(dān)教育問(wèn)責(zé)(accountability)的功能。
因此,從考試目的的角度來(lái)評(píng)估中考英語(yǔ)試題質(zhì)量時(shí),評(píng)估者可以考慮試題在依標(biāo)命題方面的執(zhí)行情況和試題難度控制情況。王薔、葛曉培(2024)對(duì)依標(biāo)命題做了詳細(xì)的解讀。筆者認(rèn)為,從試題出發(fā),評(píng)估者可以借助表2來(lái)對(duì)試題質(zhì)量進(jìn)行相應(yīng)的評(píng)估。在課程理念落實(shí)情況中,評(píng)估者要關(guān)注試題是否體現(xiàn)對(duì)核心素養(yǎng)的考查;是否體現(xiàn)以主題為引領(lǐng),以不同類型的語(yǔ)篇為依托的考查;是否為學(xué)生提供真實(shí)情境和真實(shí)問(wèn)題,指向主題意義的探究;是否與《義教新課標(biāo)》提倡的教學(xué)方法相匹配。課程目標(biāo)覆蓋情況則需要評(píng)估者評(píng)判試題在多大程度上涵蓋語(yǔ)言能力、思維品質(zhì)三級(jí)學(xué)段目標(biāo)的內(nèi)容,并兼顧對(duì)文化意識(shí)和學(xué)習(xí)能力的考查。在課程內(nèi)容涵蓋情況方面,需要評(píng)估者評(píng)判試題在主題、語(yǔ)篇類型、語(yǔ)言知識(shí)、文化知識(shí)、語(yǔ)言技能方面在多大程度上綜合反映了《義教新課標(biāo)》三級(jí)的內(nèi)容和能力要求。學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的體現(xiàn)情況則需要評(píng)估者考量試題背后考查的構(gòu)念與三級(jí)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)之間是否有對(duì)應(yīng)的關(guān)系。在評(píng)級(jí)方面可采用四級(jí)李克特量表。0代表完全不符合,1代表基本不符合,2代表基本符合,3代表完全符合??偡?以上就可以認(rèn)定為比較積極的評(píng)價(jià)結(jié)果。
從試題的難度把控上看,既要有反映初中學(xué)段結(jié)束后,學(xué)生應(yīng)該達(dá)到的最低要求的題目,體現(xiàn)試題的基礎(chǔ)性,實(shí)現(xiàn)學(xué)習(xí)認(rèn)證的功能;也要有反映《義教新課標(biāo)》所規(guī)定的初中學(xué)段較高目標(biāo)達(dá)成情況的試題,實(shí)現(xiàn)選拔的功能。這里有一個(gè)特別值得注意的地方:針對(duì)主觀性試題,特別是開(kāi)放性強(qiáng)的主觀性試題,在評(píng)分標(biāo)準(zhǔn)制定中,分步計(jì)分中較低層級(jí)的得分情況也可以納入基礎(chǔ)性考查目標(biāo)。試題的總體難度預(yù)估為0.65—0.75是比較理想的。
在閱讀一套試題時(shí),讀者得到的最直接的印象就是測(cè)試內(nèi)容。而對(duì)測(cè)試內(nèi)容的判斷是測(cè)試效度驗(yàn)證的一個(gè)重要組成部分。內(nèi)容效度考察的是一項(xiàng)測(cè)試在多大程度上測(cè)量了欲測(cè)的技能或行為(Mousavi,2012)。內(nèi)容效度主要從內(nèi)容相關(guān)性和內(nèi)容覆蓋面兩個(gè)維度考察(Bachman,1990)。對(duì)內(nèi)容相關(guān)性的考察需要細(xì)化目標(biāo)行為領(lǐng)域及其任務(wù),特別是需要細(xì)化測(cè)試方法;對(duì)內(nèi)容覆蓋面的考察指的則是考察測(cè)試中的任務(wù)在多大程度上能夠充分地代表目標(biāo)行為領(lǐng)域(Mousavi,2012)??疾煸嚲淼膬?nèi)容效度,可以通過(guò)審閱多維細(xì)目表來(lái)比對(duì)《義教新課標(biāo)》與考試內(nèi)容之間的匹配性。通常情況下,多維細(xì)目表未公布,因此評(píng)估者也可以通過(guò)逐題審閱試題,參考林敦來(lái)等(2024a)關(guān)于多維細(xì)目表編制的建議,反推考試內(nèi)容,從而建構(gòu)起試題與《義教新課標(biāo)》之間的內(nèi)容匹配情況。如表3所示,評(píng)估者可根據(jù)題目情況建構(gòu)試卷結(jié)構(gòu)、分值分布、考查內(nèi)容、題型分布、輸入材料特征等。在完成表3的基礎(chǔ)上,評(píng)估者可判斷試題對(duì)《義教新課標(biāo)》要求內(nèi)容取樣的代表性和覆蓋程度??紤]到涉及評(píng)估者的主觀判斷,因此建議采用雙人或多人背對(duì)背互評(píng)。當(dāng)評(píng)估者遇到不同意見(jiàn)時(shí),應(yīng)詳細(xì)研討以達(dá)成一致意見(jiàn)。
在從宏觀層面對(duì)試題進(jìn)行判斷之后,評(píng)估者可對(duì)試題做進(jìn)一步的深入分析。筆者認(rèn)為,在微觀層面,我們首先可以借鑒Weir(2005)提出的效度驗(yàn)證的社會(huì)認(rèn)知框架來(lái)評(píng)估試題的質(zhì)量。首先,情境效度證據(jù)是命題評(píng)估者可以參考的重要方面;其次,認(rèn)知效度證據(jù)也同樣起到重要作用。
關(guān)于情境(context),Weir(1993)的論述頗具啟發(fā)意義。他認(rèn)為,情境作為交際語(yǔ)言能力的決定性因素是至關(guān)重要的。情境必須是考生和專家考官一致認(rèn)同的可用于評(píng)估特定語(yǔ)言能力的合適條件。在測(cè)試這些能力時(shí),測(cè)試者應(yīng)盡可能獲得正常執(zhí)行任務(wù)的條件。Weir(1993)還指出,測(cè)試者應(yīng)該有意識(shí)地努力在測(cè)試中建立盡可能多的現(xiàn)實(shí)生活場(chǎng)景,且這些生活場(chǎng)景應(yīng)該被測(cè)試者及其同行視為是可行的和具有典型性的。如果測(cè)試任務(wù)反映了現(xiàn)實(shí)生活中的重要情境和操作任務(wù),那么測(cè)試者在進(jìn)行分?jǐn)?shù)解釋時(shí),就更容易推斷考生可以運(yùn)用英語(yǔ)完成什么任務(wù)。除非采取措施識(shí)別和納入反映現(xiàn)實(shí)生活中重要情境和操作任務(wù)的特征,否則測(cè)試者很難推斷在未來(lái)目標(biāo)條件下考生的語(yǔ)言能力是怎樣的。
情境效度可以從任務(wù)設(shè)定(考試指令、語(yǔ)言使用目的、應(yīng)答模式、評(píng)分標(biāo)準(zhǔn)、權(quán)重、題目順序、測(cè)試時(shí)間安排)和任務(wù)要求(語(yǔ)篇模式、交流渠道、語(yǔ)篇長(zhǎng)度、信息本質(zhì)、話題知識(shí)、輸入輸出特征、寫(xiě)作對(duì)象)兩大方面去評(píng)估(參閱Weir,2005)。這里對(duì)部分內(nèi)容進(jìn)行解釋。語(yǔ)言使用目的的適切性對(duì)考生調(diào)用元認(rèn)知策略進(jìn)行作答是很重要的。例如,廣告的目的是勸說(shuō)大眾購(gòu)買產(chǎn)品,測(cè)試者如果采用廣告作為閱讀素材,在命題時(shí)應(yīng)該圍繞勸說(shuō)購(gòu)買這個(gè)目的去設(shè)置題目。語(yǔ)篇模式會(huì)影響測(cè)試構(gòu)念。例如,測(cè)試者欲測(cè)試考生的互動(dòng)能力,則需要采用考官與考生現(xiàn)場(chǎng)互動(dòng)的語(yǔ)篇模式,考官需要針對(duì)考生的口語(yǔ)產(chǎn)出改變措辭和應(yīng)答內(nèi)容,以適應(yīng)即時(shí)性的交流。這時(shí),考官按腳本提問(wèn)的語(yǔ)篇模式就不合適了。在書(shū)面交流渠道方面,測(cè)試者往往會(huì)運(yùn)用圖表等方式傳遞信息。但是這些多模態(tài)的內(nèi)容如果運(yùn)用不當(dāng),可能會(huì)造成考生的理解困難。信息本質(zhì)則指信息的具體程度和抽象程度。表4詳細(xì)列出情境效度證據(jù)評(píng)估的觀測(cè)點(diǎn)。通過(guò)評(píng)估者的判斷,可以定位有問(wèn)題的題目,作為試題質(zhì)量的駁證呈現(xiàn)。
Weir(2005)框架中的認(rèn)知效度對(duì)試題評(píng)估同樣具有重要的啟發(fā)意義。Khalifa和Weir(2009)建構(gòu)了閱讀的認(rèn)知框架,其中主要的認(rèn)知過(guò)程包含詞匯識(shí)別、詞匯通達(dá)、句法解析、建構(gòu)小句和句子層面的命題意義、推斷、融合新信息建構(gòu)心理模型、創(chuàng)建語(yǔ)篇層面的意義表征和創(chuàng)建跨語(yǔ)篇層面的意義表征。Field(2025)建構(gòu)的聽(tīng)力認(rèn)知框架包含三個(gè)階段,即話語(yǔ)解析(含輸入材料解碼、詞匯檢索、句法解析)、意義單元(意義建構(gòu))和語(yǔ)篇含義(語(yǔ)篇意義建構(gòu))。在寫(xiě)作方面,Shaw和Weir(2007)對(duì)寫(xiě)作的認(rèn)知做了闡釋,包含宏觀規(guī)劃、組織、微觀規(guī)劃、轉(zhuǎn)換、監(jiān)控和修訂。通過(guò)評(píng)估題目對(duì)考生認(rèn)知層次的考查,評(píng)估者可以更加清晰地了解題目是否達(dá)到測(cè)試者預(yù)期的認(rèn)知層級(jí)。表5呈現(xiàn)了題目考查的認(rèn)知層面的評(píng)估表。需要指出的是,在判斷對(duì)應(yīng)題目時(shí),評(píng)估者應(yīng)該采納該題目考查的最高認(rèn)知層次。也就是說(shuō),在閱讀中考查了語(yǔ)言層面的意義表征,就自然包含了對(duì)詞匯識(shí)別、詞匯通達(dá)等比它更加初階的成分的考查。通過(guò)對(duì)應(yīng)題目數(shù)量以及賦分的比例,評(píng)估者可以較為清晰地統(tǒng)計(jì)出試題所測(cè)試的認(rèn)知層級(jí)的分布情況,并依此判斷試題對(duì)考生認(rèn)知層次的考查是否符合《義教新課標(biāo)》對(duì)該學(xué)段學(xué)生思維品質(zhì)方面的要求。
林敦來(lái)等(2024b)基于選擇題的設(shè)計(jì)原則,對(duì)中考英語(yǔ)命題中選擇題命制質(zhì)量的常見(jiàn)問(wèn)題進(jìn)行了分析。評(píng)估者可以依據(jù)該框架對(duì)試題中的選擇應(yīng)答型試題(含匹配題、判斷正誤題、選擇題等)的質(zhì)量進(jìn)行評(píng)估。具體評(píng)估指標(biāo)詳見(jiàn)表6。
Haladyna和Rodriguez(2013)對(duì)建構(gòu)應(yīng)答題型的命題原則做了闡釋,詳見(jiàn)表7。該表從內(nèi)容、格式和風(fēng)格、指示語(yǔ)撰寫(xiě)、情境等方面對(duì)建構(gòu)應(yīng)答題目的命題原則進(jìn)行了規(guī)定。在內(nèi)容方面,強(qiáng)調(diào)了測(cè)試的構(gòu)念要清晰、測(cè)試的認(rèn)知要符合初中學(xué)段學(xué)生的認(rèn)知要求,以及試題中對(duì)相同構(gòu)念的處理應(yīng)具有可比性。
表8詳細(xì)列出建構(gòu)應(yīng)答題目命題技術(shù)與規(guī)范的觀測(cè)點(diǎn),由于建構(gòu)應(yīng)答題目一般考查學(xué)生綜合運(yùn)用語(yǔ)言來(lái)解決問(wèn)題的能力,能夠更直接地體現(xiàn)對(duì)核心素養(yǎng)的考查,其質(zhì)量評(píng)估也體現(xiàn)多層多維的特征。因此筆者認(rèn)為,對(duì)題目質(zhì)量的評(píng)估應(yīng)采用評(píng)級(jí)的方式呈現(xiàn)。在內(nèi)容維度中,除了對(duì)構(gòu)念和認(rèn)知能力的評(píng)判,還包含了對(duì)相同構(gòu)念的處理是否具有可比性的問(wèn)題。Bachman和Palmer(2010)介紹了三種不同的構(gòu)念界定方式,即純語(yǔ)言構(gòu)念、語(yǔ)言構(gòu)念加話題構(gòu)念,以及語(yǔ)言融合話題構(gòu)念。在中考英語(yǔ)命題實(shí)踐方面,如果測(cè)試者在書(shū)面表達(dá)中選擇的構(gòu)念是寫(xiě)作能力且不包含話題知識(shí),那么在閱讀表達(dá)開(kāi)放性試題中如果考查寫(xiě)作能力,就不應(yīng)該把話題知識(shí)納入構(gòu)念。建構(gòu)應(yīng)答題目命題技術(shù)與規(guī)范的評(píng)估也需要采用雙人或者多人背對(duì)背評(píng)估的方式,有不同意見(jiàn)需要進(jìn)行商討達(dá)成一致,最終得分在22以上的試題可認(rèn)為是質(zhì)量較高的題目。
本文以中考英語(yǔ)試題為出發(fā)點(diǎn),討論如何開(kāi)展中考英語(yǔ)命題質(zhì)量評(píng)估的問(wèn)題。本文提出的方法主要靠評(píng)估者作為專業(yè)人士進(jìn)行專業(yè)判斷,需要評(píng)估者擁有相應(yīng)的評(píng)價(jià)素養(yǎng),對(duì)課程標(biāo)準(zhǔn)、語(yǔ)言能力標(biāo)準(zhǔn)、測(cè)試方法的優(yōu)缺點(diǎn)和命題規(guī)范,以及語(yǔ)言測(cè)試學(xué)的基本概念有深入的認(rèn)識(shí)。命題評(píng)估工作一般建議以3—5人的專家團(tuán)隊(duì)來(lái)開(kāi)展,最好包含有語(yǔ)言測(cè)試研究背景的人士、課程專家、一線教師和教研員等。本文提出的評(píng)估方法也適用于測(cè)試者在題目開(kāi)發(fā)階段對(duì)試題質(zhì)量進(jìn)行評(píng)估,以期改進(jìn)試題質(zhì)量。
* 本文系國(guó)家社科基金項(xiàng)目“核心素養(yǎng)下的國(guó)家義務(wù)教育質(zhì)量監(jiān)測(cè)英語(yǔ)指標(biāo)體系和范型題研究”(項(xiàng)目編號(hào):22BYY091)的成果。
Bachman, L. F. 1990. Fundamental considerations in language testing [M]. Oxford: Oxford University Press.
Bachman, L. F. & Palmer, A. S. 2010. Language assessment in practice: Developing language assessments and justifying their use in the real world [M]. Oxford: Oxford University Press.
Carroll, J. B. 1961. Fundamental considerations in testing for English language proficiency of foreign students [A]. Reprinted in H. B. Allen & R. N. Campbell (eds.). 1965. Teaching English as a second language: A book of readings [C]. New York, NY: McGraw Hill: 313—330.
Field, J. 2025. Cognitive insights into first and second language listening [A]. In E. Wagner, A. O. Batty & E. Galaczi (eds.). The Routledge handbook of second language acquisition and listening [C]. London: Routledge: 13—28.
Fulcher, G. 2009. Test use and political philosophy [J]. Annual Review of Applied Linguistics, 29: 3—20.
Fulcher, G. 2010. Practical language testing [M]. London: Hodder Education.
Fulcher, G. & Davidson, F. 2007. Language testing and assessment: An advanced resource book [M]. New York, NY: Routledge.
Haladyna, T. M. & Rodriguez, M. C. 2013. Developing and validating test items [M]. New York, NY: Routledge.
Ingram, E. 1968. Attainment and diagnostic testing [A]. In A. Davies (ed.). Language testing symposium: A psycholinguistic approach [C]. Oxford: Oxford University Press: 70—97.
Khalifa, H. & Weir, C. J. 2009. Examining reading [M]. Cambridge: Cambridge University Press.
Mousavi, S. A. 2012. An encyclopedic dictionary of language testing (5th ed.) [M]. Tehran: Rahnama Press.
Shaw, S. D. & Weir, C. J. 2007. Examining writing: Research and practice in assessing second language writing [M]. Cambridge: Cambridge University Press.
Weir, C. J. 1993. Understanding and developing language tests [M]. New York, NY: Prentice Hall.
Weir, C. J. 2005. Language testing and validation: An evidence-based approach [M]. Basingstoke: Palgrave Macmillan.
教育部. 2019. 教育部關(guān)于加強(qiáng)初中學(xué)業(yè)水平考試命題工作的意見(jiàn)[EB/OL]. (2019-11-22) [2024-09-08]. http://www.moe.gov.cn/srcsite/A06/s3321/201911/t20191128_409951.html.
教育部. 2022. 義務(wù)教育英語(yǔ)課程標(biāo)準(zhǔn)(2022年版) [S]. 北京: 北京師范大學(xué)出版社.
林敦來(lái), 陳芳, 林玉琴. 2024a. 初中英語(yǔ)學(xué)業(yè)水平考試多維細(xì)目表的設(shè)計(jì)與編制[J]. 英語(yǔ)學(xué)習(xí), (5): 17—22.
林敦來(lái), 羅正清, 李威峰. 2024b. 選擇題的設(shè)計(jì)原則、常見(jiàn)問(wèn)題與建議——以初中英語(yǔ)學(xué)業(yè)水平考試為例[J]. 英語(yǔ)學(xué)習(xí), (6): 19—25.
王薔, 葛曉培. 2024. 依標(biāo)命題,發(fā)揮考試評(píng)價(jià)對(duì)英語(yǔ)教與學(xué)的積極導(dǎo)向作用[J]. 英語(yǔ)學(xué)習(xí), (5): 4—10.
林敦來(lái) 北京師范大學(xué)外國(guó)語(yǔ)言文學(xué)學(xué)院副院長(zhǎng)、教授、博士生導(dǎo)師。主要研究方向?yàn)檎Z(yǔ)言測(cè)試與評(píng)價(jià)。