国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

例析Rasch模型在化學(xué)試卷質(zhì)量分析中的應(yīng)用

2017-01-05 21:55:51王桂桃嚴(yán)文法田秀云
化學(xué)教學(xué) 2016年11期

王桂桃+嚴(yán)文法+田秀云

摘要:化學(xué)測(cè)試是化學(xué)課程實(shí)施的重要組成部分,對(duì)測(cè)試試卷質(zhì)量進(jìn)行客觀、科學(xué)的分析具有重要意義。客觀、等距性的Rasch模型在試卷質(zhì)量分析應(yīng)用中顯示出傳統(tǒng)測(cè)量模型不具備的優(yōu)勢(shì)。以某市一次中考化學(xué)模擬試題分析為例,從Rasch檢驗(yàn)指標(biāo)及特征量、試卷整體質(zhì)量、單維性檢驗(yàn)、擬合度、測(cè)量誤差檢驗(yàn)和被試水平與項(xiàng)目難度匹配性檢驗(yàn)五個(gè)方面闡述了Rasch模型在化學(xué)試卷質(zhì)量分析中的應(yīng)用,并討論了應(yīng)用過程中應(yīng)注意的問題。期望為一線教師進(jìn)行試卷分析提供新的技術(shù)參考。

關(guān)鍵詞:Rasch模型;化學(xué)測(cè)試;試卷質(zhì)量分析

文章編號(hào):1005–6629(2016)11–0014–06 中圖分類號(hào):G633.8 文獻(xiàn)標(biāo)識(shí)碼:B

化學(xué)測(cè)試是化學(xué)課程實(shí)施的重要組成部分,為教師改進(jìn)教學(xué)方法、調(diào)整教學(xué)內(nèi)容提供基本依據(jù),是學(xué)生自我檢驗(yàn)、查漏補(bǔ)缺的有效途徑,在化學(xué)教學(xué)過程中扮演著教學(xué)質(zhì)量監(jiān)控和教學(xué)效果診斷等角色。因此,如何對(duì)化學(xué)測(cè)試試卷的質(zhì)量進(jìn)行科學(xué)、客觀的分析具有重要意義。

當(dāng)前,試卷質(zhì)量分析主要以經(jīng)典測(cè)試?yán)碚摚–lassical Test Theory)和項(xiàng)目反應(yīng)理論(Item Response Theory)為理論指導(dǎo)。經(jīng)典測(cè)試?yán)碚搹纳鲜兰o(jì)初問世以來,經(jīng)過百年來的發(fā)展、完善,已形成了包括信度、效度、難度、區(qū)分度、標(biāo)準(zhǔn)差、平均分等在內(nèi)的一系列項(xiàng)目分析指標(biāo)。項(xiàng)目反應(yīng)理論作為經(jīng)典測(cè)試?yán)碚摰睦^承、發(fā)展,也將信度、難度等作為分析指標(biāo)。Rasch模型作為一種以項(xiàng)目反應(yīng)理論為指導(dǎo)的非線性概率模型,在應(yīng)用該模型進(jìn)行試題分析時(shí),首先要對(duì)試題與模型的擬合性以及試題單維性進(jìn)行檢驗(yàn),且Rasch分析的質(zhì)量指標(biāo)給出的特征量也不同于經(jīng)典測(cè)量理論中的指標(biāo)特征量。

Rasch模型具有客觀、等距的測(cè)量?jī)?yōu)點(diǎn),因此自提出以來已經(jīng)被廣泛應(yīng)用于心理學(xué)、健康學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)科學(xué)等不同領(lǐng)域,但在中小學(xué)試卷質(zhì)量分析中的應(yīng)用研究還較少。本文以某市一次化學(xué)中考模擬試卷質(zhì)量分析為例,探討了Rasch模型在化學(xué)試卷質(zhì)量分析中的應(yīng)用,以期為一線教師進(jìn)行試卷質(zhì)量分析提供新的技術(shù)參考。

1 Rasch模型簡(jiǎn)介

Rasch模型是丹麥數(shù)學(xué)家、心理學(xué)家、教育家George Rasch于1960年提出的一種測(cè)量模型。該模型成功克服了傳統(tǒng)測(cè)量中項(xiàng)目難度與被試水平估計(jì)之間相互干擾的問題,使測(cè)量不再存在工具依賴和樣本依賴,從而使測(cè)量的結(jié)果達(dá)到客觀等距。模型的數(shù)學(xué)表達(dá)式如下:

其中Pni為被試n答對(duì)項(xiàng)目i的概率,Bn為被試水平,Di為項(xiàng)目難度。當(dāng)Bn=Di時(shí),被試n答對(duì)項(xiàng)目i的概率值為0.5,當(dāng)被試水平遠(yuǎn)遠(yuǎn)大于項(xiàng)目難度時(shí)(Bn>>Di),被試答對(duì)概率值趨近于1,相反,概率值趨近于0。Bn與Di單位相同,可加減,換言之,Di為客觀等距尺[1]。模型將被試能力水平與項(xiàng)目難度放在同一等距尺上,這決定了其Wright圖(懷特圖)可以直觀、簡(jiǎn)潔地進(jìn)行被試與被試、被試與項(xiàng)目、項(xiàng)目與項(xiàng)目之間的比較分析。

隨著驗(yàn)證Rasch模型應(yīng)用軟件的不斷開發(fā)完善,國(guó)內(nèi)外學(xué)者對(duì)該模型在教育領(lǐng)域的應(yīng)用研究也不斷深入。著名物理教學(xué)研究者M(jìn)aja Planinic利用Rasch模型進(jìn)行了力學(xué)概念測(cè)試的評(píng)價(jià)[2]。我國(guó)利用Rasch模型對(duì)全國(guó)大學(xué)生英語四六級(jí)考試(CET4/6)進(jìn)行分?jǐn)?shù)等值化已有二十多年,且效果較為理想[3]。王蕾在利用Rasch模型對(duì)PISA(Program for International Student Assessment,國(guó)際學(xué)生評(píng)估項(xiàng)目)試題進(jìn)行分析的基礎(chǔ)上,討論了Rasch這種客觀等距測(cè)量量尺對(duì)完善我國(guó)教育評(píng)價(jià)及心理測(cè)量的參考價(jià)值[4]。也有學(xué)者利用該模型的DIF(Differential Item Functioning)檢驗(yàn)功能進(jìn)行了一些相關(guān)關(guān)系研究,比如分析教師對(duì)學(xué)生自主學(xué)習(xí)支持程度與學(xué)生化學(xué)學(xué)習(xí)的相關(guān)關(guān)系[5],學(xué)生化學(xué)學(xué)科能力與性別差異的關(guān)系[6]。除此之外,Rasch模型還被用于認(rèn)知表現(xiàn)水平評(píng)價(jià)研究、題庫(kù)建設(shè)、試卷設(shè)計(jì)、學(xué)習(xí)進(jìn)階研究等方面,但多數(shù)研究仍停留在理論分析層面,較少將該技術(shù)用于中小學(xué)試卷的質(zhì)量分析中。

2 研究方法

筆者于2016年6月對(duì)某校參加市中考模擬的全體初三年級(jí)學(xué)生進(jìn)行了整群取樣,樣本人數(shù)為199,運(yùn)用Winsteps3.72.3軟件對(duì)其化學(xué)成績(jī)進(jìn)行了數(shù)據(jù)處理與分析,在此基礎(chǔ)上討論了Rasch模型在化學(xué)試卷質(zhì)量分析中的應(yīng)用以及在應(yīng)用過程中需要注意的問題。

本次化學(xué)測(cè)試試卷分為選擇題與非選擇題兩個(gè)部分,選擇題共10個(gè)題目,非選擇題共17個(gè)題目。其中非選擇題又分為物質(zhì)推斷題、實(shí)驗(yàn)題和化學(xué)計(jì)算題,物質(zhì)推斷題和實(shí)驗(yàn)題均以填空形式呈現(xiàn),共計(jì)14個(gè)題目,化學(xué)計(jì)算題為3個(gè)題目。為滿足Rasch模型分析要求,將整套試題所有27個(gè)題目均采取二級(jí)記分,答對(duì)記1,答錯(cuò)記0。利用Excel進(jìn)行數(shù)據(jù)初步處理之后,將數(shù)據(jù)轉(zhuǎn)化為Winsteps3.72.3導(dǎo)入格式導(dǎo)入并分析。

3 運(yùn)用Rasch模型進(jìn)行試題質(zhì)量分析

3.1 Rasch檢驗(yàn)指標(biāo)及特征量

Rasch模型使用根據(jù)殘差計(jì)算的兩個(gè)卡方擬合檢驗(yàn)指標(biāo)MNSQ和ZSTD進(jìn)行擬合度檢驗(yàn),其中ZSTD是MNSQ的標(biāo)準(zhǔn)化形式。理想擬合情況下的MNSQ值為1,MNSQ值在0.5~1.5之間表示數(shù)據(jù)與模型預(yù)期擬合程度可接受[7],理想擬合情況下ZSTD值為0,當(dāng)ZSTD值介于-2~2時(shí),可認(rèn)為擬合較好[8]。單維性檢驗(yàn)指標(biāo)的特征量是項(xiàng)目分?jǐn)?shù)與可能影響因素的相關(guān)關(guān)系值,當(dāng)該值介于-0.4與+0.4之間時(shí),認(rèn)為對(duì)應(yīng)項(xiàng)目符合單維性要求,Rasch模型可對(duì)該項(xiàng)目進(jìn)行準(zhǔn)確分析。本研究涉及到的質(zhì)量檢驗(yàn)指標(biāo)包括信度、分離度、難度、被試及試題分布。信度是對(duì)試卷測(cè)試結(jié)果一致性、可靠性、穩(wěn)定性的描述,特征量Reliability大于0.70表示具有較高可信度[9]。分離度是對(duì)試題區(qū)分度的描述,分離度越高,表示試題對(duì)不同水平被試的區(qū)分度越高,特征量Separation大于2表示試題具有較高區(qū)分度[10]。Rasch模型將試題難度與被試能力水平高低放在同一量尺上,用Logit值表示難度大小與能力水平高低,在懷特圖中Logit值自上而下減小,表示題目難度降低、被試能力水平降低[11]。不同能力水平被試及不同難度試題是否呈正態(tài)分布或近正態(tài)分布可以從懷特圖中直接觀察出,無需對(duì)特定參數(shù)進(jìn)行數(shù)值分析,這也是Rasch模型的直觀優(yōu)勢(shì)。

3.2 整體質(zhì)量檢驗(yàn)

利用Winsteps3.72.3軟件對(duì)199名學(xué)生的數(shù)據(jù)進(jìn)行整體質(zhì)量檢驗(yàn),結(jié)果如圖1所示。檢驗(yàn)結(jié)果顯示試題及被試的MNSQ和ZSTD值均十分接近理想值,與模型擬合較好。學(xué)生整體信度(Kid Reliability=0.81,>0.70)、試題整體信度(Tap Reliability=0.97,>0.70)均較高。項(xiàng)目分離度(Tap Separation=5.89,>2)顯示試題能夠?qū)Σ煌芰λ奖辉嚰右詤^(qū)分。

3.3 單維性檢驗(yàn)

Rasch模型是一種參數(shù)項(xiàng)目反應(yīng)理論(Parameter Item Response Theory,P-IRT)模型[12]。項(xiàng)目反應(yīng)理論建立在單維性假設(shè)的基礎(chǔ)上,即被試在特定項(xiàng)目上的表現(xiàn)可歸因?yàn)閱我蛔兞浚ㄖR(shí)、能力、人格特質(zhì)等),其他因素對(duì)被試表現(xiàn)的影響可忽略[13]。因此,單維性檢驗(yàn)是運(yùn)用Rasch模型進(jìn)行測(cè)量分析的必要步驟[14]。當(dāng)試題的Rasch檢驗(yàn)結(jié)果符合單維性要求時(shí),Rasch模型對(duì)該試題的信度、難度、區(qū)分度等分析才更為精確。對(duì)于這些單維性檢驗(yàn)結(jié)果不佳的題目,不適合使用Rasch模型進(jìn)行質(zhì)量分析,可結(jié)合經(jīng)典測(cè)量理論進(jìn)行質(zhì)量分析。

在Rasch檢驗(yàn)中,標(biāo)準(zhǔn)殘差圖可判斷是否有其他因素影響被試反應(yīng),用于進(jìn)行單維性檢驗(yàn)。殘差圖橫坐標(biāo)表示項(xiàng)目難度,縱坐標(biāo)為項(xiàng)目分?jǐn)?shù)與可能影響因素的相關(guān)關(guān)系值。標(biāo)準(zhǔn)殘差圖如圖2所示。

從圖2中可以直觀地看出,本次測(cè)量試題的絕大多數(shù)項(xiàng)目在-0.4與+0.4之間,符合單維性要求,只有題目A、B、C、a顯示出受其他因素干擾,測(cè)量的不是單一心理結(jié)構(gòu)。這種涉及多維能力測(cè)量的題目(如涉及到數(shù)學(xué)計(jì)算能力的化學(xué)定量計(jì)算試題)不符合Rasch模型基本假設(shè),就會(huì)與模型不擬合[15]。查表得出題目A、B、C、a分別對(duì)應(yīng)試題3、23、19、5,需對(duì)這四個(gè)題目進(jìn)行進(jìn)一步分析以確定其不擬合的原因。

3.4 題目擬合度、測(cè)量誤差檢驗(yàn)

氣泡圖(Bubble Chart)可以更直觀地顯示題目與模型的擬合程度和題目的測(cè)量誤差。如圖3所示,橫坐標(biāo)為用于擬合度檢驗(yàn)的未加權(quán)均方擬合統(tǒng)計(jì)量(Outfit Mean Square,簡(jiǎn)稱Outfit MNSQ)[16],該值介于0.5到1.5之間表示結(jié)果與模型預(yù)期擬合,小于0.5表示過度擬合(Overfit),大于1.5則表示結(jié)果與模型不擬合(Underfit)[17]。從圖3可以看出該試卷中題目擬合度總體上可以接受,即大部分試題的被試反應(yīng)與模型預(yù)測(cè)一致性較好,模型可對(duì)這部分試題質(zhì)量做出準(zhǔn)確估計(jì)。但題目1的Outfit MNSQ小于0.5,即被試反應(yīng)過度一致。題目3、5、6、19、23的Outfit MNSQ均大于1.5,這五個(gè)試題與模型預(yù)期結(jié)果不擬合,即被試實(shí)際作答跟模型預(yù)測(cè)結(jié)果不一致,說明高、低能力的被試都答對(duì)或答錯(cuò)題目。其中題目1、3、4、6的氣泡半徑較大,表明題目測(cè)量誤差較大,測(cè)量結(jié)果不準(zhǔn)確[18]。造成不擬合或誤差大的原因很多,比如被試在考試過程中的猜測(cè)、作弊、創(chuàng)造性作答等[19]。對(duì)于擬合不佳或難度誤差較大的題目須進(jìn)一步分析,以便了解不擬合或難度誤差大的可能原因。

3.5 題目難度與學(xué)生能力的匹配檢驗(yàn)

Rasch模型的客觀等距性反映在懷特圖中,即表現(xiàn)為懷特圖將學(xué)生能力與項(xiàng)目難度放在同一水平尺度上,不僅可以對(duì)不同項(xiàng)目難度進(jìn)行對(duì)比分析,而且可直觀、簡(jiǎn)潔地進(jìn)行項(xiàng)目難度與學(xué)生能力的匹配檢驗(yàn)。本研究中試題分析的懷特圖如圖4所示。

圖中最左端數(shù)字是用于對(duì)比被試能力水平和題目難度的Logit量尺值,自下而上Logit值增大,表示被試能力水平升高、題目難度增加。“#”代表兩個(gè)被試者,“·”代表一個(gè)被試者,右端數(shù)字為不同題目編號(hào)。理想的試卷題目分布應(yīng)該是不同難度題目均存在能力水平與之對(duì)應(yīng)的被試,且在被試分布相對(duì)密集處所設(shè)置的題目數(shù)量相應(yīng)較多[20]。圖4顯示大多被試能力水平在0以上,表明該試題相對(duì)被試整體水平偏易。Logit值3以上沒有與被試能力相對(duì)應(yīng)的題目,而題目1、3、6太過簡(jiǎn)單,沒有能力水平與之對(duì)應(yīng)的被試。需要適當(dāng)減少難度較低的題目,增加難度較高的題目,以增加不同難度題目的覆蓋面。由圖4還可看出,被試分布呈負(fù)偏態(tài)分布,這也說明試題整體難度較低,能力水平較高的被試較多。

綜上所述,試卷整體信度較高,具有良好的區(qū)分度,與Rasch模型擬合較好,但試題難度較被試能力水平而言偏易,缺少難度較大的題目。存在個(gè)別不擬合、過度擬合、不符合單維性要求等題目,有待進(jìn)行具體分析。

4 利用Rasch模型進(jìn)行試卷質(zhì)量分析應(yīng)注意的問題

利用Rasch模型進(jìn)行試卷質(zhì)量檢驗(yàn)可以更直觀地對(duì)試題質(zhì)量和學(xué)生能力水平加以分析,便于教師更好把握試題對(duì)應(yīng)內(nèi)容的教學(xué)質(zhì)量以及學(xué)生能力發(fā)展?fàn)顩r。但應(yīng)用過程中存在以下值得注意的問題。

4.1 根據(jù)實(shí)際分析需要選擇Rasch模型的相應(yīng)分析功能

Rasch模型的分析功能較多,應(yīng)根據(jù)實(shí)際需要選擇相應(yīng)功能進(jìn)行分析。比如,許多學(xué)校的平時(shí)測(cè)驗(yàn)采取教師或教科組自命題,這就可以選擇上述3.2的試卷整體質(zhì)量檢驗(yàn)功能進(jìn)行信度、區(qū)分度等檢驗(yàn),還可以根據(jù)3.3所述的單維性檢驗(yàn)功能檢驗(yàn)是否存在影響項(xiàng)目作答的其他因素,也可以選擇氣泡圖來分析被試在哪些項(xiàng)目上反應(yīng)過度一致或反應(yīng)與期望反差太大。又比如,在對(duì)單元小結(jié)考試的試卷分析中,教師可以選擇懷特圖來分析不同能力水平學(xué)生的分布情況,以確定本單元的教學(xué)質(zhì)量。

上述功能只是Rasch分析中可用于試卷質(zhì)量分析功能的一部分,教師可根據(jù)實(shí)際分析需要選擇對(duì)應(yīng)功能,也可結(jié)合多項(xiàng)功能進(jìn)行分析。教師還可根據(jù)實(shí)際分析需要選擇其他的功能,如使用Rasch分析的DIF(Differential Item Functioning)檢驗(yàn)功能進(jìn)行不同性別學(xué)生某一化學(xué)能力的對(duì)比分析。

4.2 根據(jù)項(xiàng)目實(shí)際分析情況進(jìn)行項(xiàng)目處理

Rasch模型對(duì)試題質(zhì)量以及被試能力的預(yù)測(cè)是基于被試反應(yīng)進(jìn)行的,因此,Rasch分析可對(duì)試題是否適用于相似群體的特定能力測(cè)試做出判斷。不同被試對(duì)相同試題可能做出不同反應(yīng),所以,不可以利用Rasch分析結(jié)果直接用于絕對(duì)性地判斷試題質(zhì)量高低。例如,如果將初中化學(xué)升學(xué)考試題用于化學(xué)知識(shí)競(jìng)賽,再利用Rasch模型進(jìn)行數(shù)據(jù)分析,分析結(jié)果可能會(huì)很不理想。

當(dāng)試題滿足單維性檢驗(yàn)且與模型擬合較好時(shí),說明被試反應(yīng)與模型預(yù)測(cè)較為一致,Rasch檢驗(yàn)就可以很好地對(duì)被試能力及試題質(zhì)量做出估計(jì)[21]。試卷質(zhì)量分析過程中可根據(jù)試題的各項(xiàng)分析結(jié)果進(jìn)行試題質(zhì)量界定。但Rasch檢驗(yàn)不可避免會(huì)有過度擬合、不擬合、誤差太大或不符合單維性要求項(xiàng)目存在。對(duì)于這些項(xiàng)目教師不可以盲目地加以否定,需要在進(jìn)一步分析的基礎(chǔ)上,根據(jù)實(shí)際情況對(duì)項(xiàng)目進(jìn)行修改或決定是否保留。

如上述題目1檢驗(yàn)結(jié)果顯示過度擬合,即學(xué)生反應(yīng)過于一致。查閱試卷信息發(fā)現(xiàn),該題目考察學(xué)生對(duì)造成霧霾原因的了解,學(xué)生都知道正確選項(xiàng)“水力發(fā)電”是不會(huì)造成霧霾的,故幾乎所有考生均能回答對(duì)該題目,考慮到一套試題中有必要存在難度低的題目,而且該題目與STSE的思想密切相關(guān),所以該題目可以保留。再如,在對(duì)不符合單維性要求的題目5進(jìn)行分析的過程中發(fā)現(xiàn),題目5結(jié)合圖形考察了“濃鹽酸具有揮發(fā)性”、“常溫下稀釋NaOH溶液,其pH減小,但不會(huì)小于7”、“同一溫度下相同物質(zhì)的飽和溶液濃度是一定的”、“Cu(OH)2沉淀可與鹽酸反應(yīng)”等多個(gè)知識(shí)點(diǎn),每個(gè)知識(shí)點(diǎn)的掌握情況及被試的讀圖能力均會(huì)影響被試對(duì)該題目的作答,所以,該題目雖然與模型不擬合,但是作為一個(gè)綜合性較高的中考模擬題可以保留??傊?,教師要學(xué)會(huì)利用Rasch檢驗(yàn)結(jié)果結(jié)合實(shí)際情況合理地對(duì)項(xiàng)目進(jìn)行處理。

4.3 根據(jù)實(shí)際情況選擇分析軟件及其他可用技術(shù)進(jìn)行Rasch分析

可用于Rasch分析的計(jì)算機(jī)使用軟件種類較多,如Winsteps、Conquest以及Bond & Foxstep等,且功能日趨完善,操作不斷簡(jiǎn)化。教師可選擇性地學(xué)習(xí)某一種進(jìn)行應(yīng)用。與Rasch分析軟件相兼容的常用數(shù)據(jù)處理軟件有Excel和SPSS,教師可結(jié)合分析要求和自身對(duì)軟件掌握的實(shí)際情況選擇合適的兼容軟件。教師還可結(jié)合實(shí)際情況選擇其他有利于將該試卷分析技術(shù)普及到實(shí)際教學(xué)測(cè)驗(yàn)工作中的技術(shù),比如計(jì)算機(jī)輔助考試技術(shù)、計(jì)算機(jī)輔助閱卷技術(shù)等。

參考文獻(xiàn):

[1][2][7][17] Maja Planinic, Lana Ivanjek, Ana Susac. Rasch Model Based Analysis of the Force Concept Inventor [J]. The American Physical Society, 2010, 3(10): 1~11.

[3]朱正才,楊惠中,楊浩然. Rasch模型在CET考試分?jǐn)?shù)等值中的應(yīng)用[J].現(xiàn)代外語,2003,1(26):69~75.

[4]王蕾.Rasch客觀等距測(cè)量在PISA中國(guó)試測(cè)研究中的實(shí)踐[J].心理學(xué)探新,2007,(4):69~73.

[5]徐惠,陳功,馬宏佳.教師對(duì)學(xué)生自主學(xué)習(xí)支持程度與學(xué)生化學(xué)學(xué)習(xí)相關(guān)性的實(shí)證研究[J].課程·教材·教法,2016,(36):100~106.

[6]張敏,馬宏佳.高一學(xué)生化學(xué)學(xué)科能力差異研究[J].教學(xué)研究,2016,(1):2~6.

[8] Gavin W. Fulmer,Ling L. Liang ,Xiufeng Liu .Applying a Force and Motion Learning Progression over an Extended Time Span using the Force Concept Inventory[J].International Journal of Science Education, 2014,(36): 2917~2936.

[9] Liu, X.Using and Developing Measurement Instrument in Science Education: A Rasch Modeling Approch Charlotte [M]. North Charlotte: Information Age Publishing, 2010: 206~208.

[10] Wei, S. Liu , X., Jia, Y.. Using Rasch Measurement to Validate the Instrument of Student Understanding of Models in Science (SUMS) [J]. International Journal of Science and Mathematics Education, 2014,(12): 1067~1082.

[11] Shawn M. Glynn. International Assessment: A Rasch Model and Teachers Evaluation of TIMSS Science Achievement Items [J]. Journal of Research in Science Teaching, 2012, 49(10): 1321~1344.

[12]何壯,袁淑莉,趙守盈.教育考試中短測(cè)驗(yàn)的分析方法——基于兩種項(xiàng)目反應(yīng)理論方法的比較研究[J].中國(guó)考試,2012,10(18):18~24.

[13] Jan-Eric Gustafsson. Testing and obtaining fit of data to the Rasch model [J]. British Journal of Mathematical and Statistical Psychology, 1980(33): 206~233.

[14] John. M. Linacre. A Users Guide to WINSTEPS[CP\OL]. www.winsteps.com,2011. 2016-06-20.

[15]張莉娜,王磊.對(duì)初中化學(xué)變化認(rèn)知水平的評(píng)價(jià)研究——基于Rasch模型[J].中學(xué)化學(xué)教學(xué)參考,2015,(11):1~6.

[16]楊玉琴.化學(xué)學(xué)科能力及其測(cè)評(píng)研究[D].上海:華東師范大學(xué)博士學(xué)位論文,2012.

[18]羅德紅,龔婧.Rasch模型在試卷質(zhì)量分析中的應(yīng)用——基于五六年級(jí)學(xué)生閱讀素養(yǎng)的測(cè)試卷的分析[J].教育測(cè)量與評(píng)價(jià),2015,(1):18~22.

[19]陳康.以PETS為例談Rasch擬合統(tǒng)計(jì)量的使用[J].中國(guó)考試,2013,(12):14~18.

[20]王蕾. Rasch測(cè)量原理及在高考命題評(píng)價(jià)中的實(shí)證研究[J].中國(guó)考試,2008,(1):32~39.

[21] Liu, X.. Elementary to High School Students Growth over an Academic Year in Understanding the Concept of Matter [J]. Journal of Chemical Education, 2007, 84(11): 1853~1856.

皋兰县| 鱼台县| 怀集县| 昔阳县| 武乡县| 额济纳旗| 平度市| 宣恩县| 休宁县| 富蕴县| 廉江市| 巴中市| 凤城市| 南宫市| 九龙坡区| 西乡县| 宾阳县| 沽源县| 永川市| 南岸区| 涿鹿县| 睢宁县| 无棣县| 八宿县| 阿勒泰市| 云和县| 进贤县| 晋中市| 延川县| 凤庆县| 博白县| 苏尼特右旗| 遂宁市| 福安市| 皮山县| 靖边县| 南开区| 崇仁县| 文化| 黑河市| 福州市|