国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

Rasch模型在教學(xué)質(zhì)量監(jiān)測(cè)工具評(píng)價(jià)上的應(yīng)用

2018-04-29 00:00:00吳小峰

摘"要:以高中遺傳學(xué)核心概念為研究載體,選擇階段性檢測(cè)中的相關(guān)題目,運(yùn)用Rasch模型分析軟件對(duì)得分情況進(jìn)行數(shù)據(jù)分析。研究結(jié)果表明,監(jiān)測(cè)工具在學(xué)生和題目的信度、分離度、單維性檢測(cè)、學(xué)生—題目對(duì)應(yīng)、題目擬合程度、題目氣泡圖等多維指標(biāo)上基本符合Rasch模型的預(yù)期假設(shè)條件,具有較高的信度和效度。

關(guān)鍵詞:Rasch模型"質(zhì)量監(jiān)測(cè)工具"評(píng)價(jià)"高中遺傳學(xué)

一、 Rasch模型

Rasch模型是由丹麥數(shù)學(xué)家、統(tǒng)計(jì)學(xué)家喬治·拉希(Georg Rasch)基于項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)提出的一個(gè)潛在特質(zhì)模型。該模型通過個(gè)體在題目上的表現(xiàn)(通常表示為原始分?jǐn)?shù))來測(cè)量不可直接觀察的潛在變量,即特定個(gè)體對(duì)特定題目答對(duì)的概率是個(gè)體能力與題目難度之差的函數(shù),其表達(dá)式為

Rasch模型通過對(duì)數(shù)轉(zhuǎn)換,將個(gè)體能力和題目難度在同一量尺上進(jìn)行標(biāo)定,并且將非線性數(shù)據(jù)轉(zhuǎn)換成具有等距意義的logit量尺(logit scale)數(shù)據(jù),從而使客觀的測(cè)量成為可能。根據(jù)Rasch模型,我們可以認(rèn)為個(gè)體正確回答題目的概率取決于個(gè)體能力和題目難度之間的比較:個(gè)體能力小于題目難度時(shí),答對(duì)概率小于50%;個(gè)體能力與題目難度相同時(shí),答對(duì)概率為50%;個(gè)體能力大于題目難度時(shí),答對(duì)概率大于50%。

二、研究過程

遺傳學(xué)核心概念是高中生物的重點(diǎn)和難點(diǎn)內(nèi)容。

在近幾年江蘇省的高考和學(xué)業(yè)水平測(cè)試中,關(guān)于遺傳學(xué)核心概念的題目,無論是比重還是難度都較高。

從學(xué)習(xí)現(xiàn)狀看,學(xué)生對(duì)概念內(nèi)涵和外延的理解相對(duì)薄弱,對(duì)概念的滲透與運(yùn)用缺乏認(rèn)知;從教學(xué)角度看,教師如未根據(jù)概念的特征,采用相應(yīng)的方式,促進(jìn)學(xué)生對(duì)概念的深度理解,則易造成學(xué)生對(duì)概念理解的混亂。

(一)研究目的

本研究旨在通過Rasch模型,對(duì)2018年江陰市高二生物教學(xué)質(zhì)量監(jiān)測(cè)工具(階段性檢測(cè)試卷)中關(guān)于高中遺傳學(xué)核心概念的部分題目,做一次系統(tǒng)全面的分析,從現(xiàn)代測(cè)量學(xué)的角度為高中生物學(xué)科測(cè)試題目評(píng)價(jià)提出新的方法,從而驗(yàn)證測(cè)試題目在難度、區(qū)分度、信度等方面是否符合高中學(xué)生的實(shí)際情況,為題目編制者修改編制方案、提高編制質(zhì)量提供客觀科學(xué)的依據(jù)。

(二)研究對(duì)象

本研究的樣本為江陰市12個(gè)普通高中(9個(gè)四星級(jí)高中,3個(gè)三星級(jí)高中)高二年級(jí)的學(xué)生,總計(jì)3737人。這些學(xué)生即將參加江蘇省學(xué)業(yè)水平測(cè)試,學(xué)習(xí)態(tài)度和學(xué)習(xí)程度處于高位,是具有典型性的樣本,能為本研究提供真實(shí)可靠的信息。

(三)研究方法

本研究選取關(guān)于高中遺傳學(xué)核心概念的9道選擇題,運(yùn)用WINSTEPS軟件(Rasch模型分析軟件)對(duì)題目得分情況進(jìn)行分析。

三、數(shù)據(jù)分析

首先,建立測(cè)試數(shù)據(jù)(Trial data)的控制文件。其中,數(shù)據(jù)欄一共有14列,前5列是個(gè)人代號(hào)(Person)沒有實(shí)際意義,不進(jìn)行統(tǒng)計(jì)分析;后9列是項(xiàng)目序號(hào)(Item No.),分別表示9道題的作答情況,正確記為1,錯(cuò)誤記為0。本次研究中,數(shù)據(jù)欄共有3737行,分別表示3737位學(xué)生的作答情況。

(一)總體統(tǒng)計(jì)分析

由WINSTEPS軟件所得到的本次測(cè)試中學(xué)生能力和題目難度的總體統(tǒng)計(jì)情況。

從整體測(cè)量值(MEASURE)來看,本次測(cè)試中學(xué)生能力和題目難度的均值分別為0.35和0,說明學(xué)生完成題目相對(duì)容易,這也符合學(xué)業(yè)水平測(cè)試的總體要求。從整體模型誤差(MODEL ERROR)來看,學(xué)生能力誤差高于題目難度誤差,說明學(xué)生之間的差異較大,部分學(xué)生作答時(shí)有困難;題目之間的差異較小。從整體擬合度來看,加權(quán)殘差均方(INFIT MNSQ)和未加權(quán)殘差均方(OUTFIT MNSQ)的指標(biāo)值均為1,在這兩個(gè)指標(biāo)的理想值范圍[0.7,1.3]內(nèi);標(biāo)準(zhǔn)加權(quán)殘差均方(INFIT ZSTD)和標(biāo)準(zhǔn)未加權(quán)殘差均方(OUTFIT ZSTD)的指標(biāo)值均接近0,在這兩個(gè)指標(biāo)的理想值范圍[-2,2]內(nèi),說明本次測(cè)試數(shù)據(jù)與Rasch理想模型較一致,擬合程度較好。從整體區(qū)分度(SEPARATION)來看,學(xué)生能力和題目難度的區(qū)分度分別為1.78(<2)和10.3(>2),說明題目能很好地區(qū)分不同能力的學(xué)生,而學(xué)生不能很好區(qū)分不同難度的題目。從整體信度(RELIABILITY)來看,學(xué)生能力和題目難度的信度分別是0.87和0.99,結(jié)合學(xué)生能力的區(qū)分度,說明可能學(xué)生能力的分布范圍還不夠廣。

(二)單維性檢測(cè)分析

本次測(cè)試的前提是,假設(shè)只有高中遺傳學(xué)核心概念對(duì)學(xué)生的作答情況有影響,沒有其他因素(變量)的影響。Rasch模型通過提供標(biāo)準(zhǔn)殘差對(duì)比圖,來鑒別是否有其他可能的因素影響檢測(cè)結(jié)果。本次測(cè)試的標(biāo)準(zhǔn)殘差對(duì)比圖。其中,下方橫坐標(biāo)是題目難度測(cè)量值(item MEASURE),左側(cè)縱坐標(biāo)是當(dāng)主要因素被控制后題目得分與其他可能的因素之間的相關(guān)系數(shù)(CONTRAST LOADING),上方橫坐標(biāo)是某一測(cè)量值上對(duì)應(yīng)的題目數(shù)量,右側(cè)縱坐標(biāo)是某一相關(guān)系數(shù)上對(duì)應(yīng)的題目數(shù)量,坐標(biāo)系中的1~9為題號(hào)。

通常認(rèn)為,測(cè)試題目落在相關(guān)系數(shù)區(qū)間[-0.4,0.4]內(nèi),表明它測(cè)量的是主要因素的結(jié)構(gòu)。從圖4中可以看出,9道題目大部分落在相關(guān)系數(shù)區(qū)間[-0.4,0.4]內(nèi)(第2題和第9題位于該區(qū)間邊界),大體上測(cè)量的是主要因素的結(jié)構(gòu),具有單維性;只有第4題超出范圍,說明它測(cè)量的可能是其他因素的結(jié)構(gòu),應(yīng)進(jìn)一步分析和修改。

(三)學(xué)生—題目對(duì)應(yīng)分析

顯示了學(xué)生能力和題目難度之間的對(duì)應(yīng)關(guān)系。其中,左邊部分顯示的是學(xué)生能力的分布(每個(gè)“#”表示52名學(xué)生,每個(gè)“.”表示1~51名學(xué)生),中間豎線是logit量尺(M、S、T分別表示平均水平、1個(gè)logit、2個(gè)logit),右邊部分顯示的是題目難度的分布。

從上往下,學(xué)生能力逐漸降低,題目難度逐漸減小。

由圖可知,學(xué)生能力分布范圍約為6個(gè)logit,分布類型為負(fù)偏態(tài)分布,題目難度分布范圍約為3個(gè)logit,分布類型為正態(tài)分布。學(xué)生能力水平范圍大于題目難度分布范圍,比較兩者的M值(平均值),可得出學(xué)生能力大于題目難度,即題目對(duì)學(xué)生來說難度較小;題目沒有覆蓋到在±1.0 logit附近能力的學(xué)生;第8題難度最大,第2題難度最小,題目難度范圍在±2 logit以內(nèi),難度分布均勻。

(四)題目擬合程度分析

上述多是從整體角度分析測(cè)試題目質(zhì)量的,針對(duì)每道題目的質(zhì)量還需從題目擬合的程度進(jìn)行分析。Rasch模型通過檢驗(yàn)實(shí)際數(shù)據(jù)與模型的擬合情況,來判斷該監(jiān)測(cè)工具是否實(shí)現(xiàn)了功效。9道測(cè)試題目的擬合指標(biāo)統(tǒng)計(jì)情況,包括題目難度測(cè)量值、模型標(biāo)準(zhǔn)誤(MODEL S.E.,估計(jì)數(shù)據(jù)與模型擬合時(shí)的穩(wěn)定程度,標(biāo)準(zhǔn)誤越小,估計(jì)的結(jié)果越穩(wěn)定)、加權(quán)殘差均方、標(biāo)準(zhǔn)加權(quán)殘差均方、未加權(quán)殘差均方、標(biāo)準(zhǔn)未加權(quán)殘差均方等指標(biāo)。另外,PT測(cè)量(PT-MEASURE)中的相關(guān)系數(shù)(CORR.)和理論值(EXP.),精確匹配(EXACT MATCH)中的觀察值(OBS%)和理論值(EXP%)之間的吻合程度越高,數(shù)據(jù)和模型的擬合程度越高。

根據(jù)擬合的數(shù)據(jù)來看,難度最大的題目為第8題,正確率約為47%;難度最小的題目為第2題,正確率約為69%。9道題目的標(biāo)準(zhǔn)誤都在0.10以下,說明9道題目在估計(jì)學(xué)生能力時(shí)都比較穩(wěn)定。加權(quán)殘差均方的取值范圍為0.94~1.08,未加權(quán)殘差均方的取值范圍為0.91~1.15,均在正常的取值范圍0.7~1.3內(nèi)。相關(guān)系數(shù)和理論值,觀察值和理論值都很接近。這些都說明了題目難度與學(xué)生能力水平接近,題目與模型擬合得很好,能得到精確的估計(jì)。

(五)題目氣泡圖分析

在題目氣泡圖中,每一個(gè)氣泡表示一個(gè)題目;縱軸表示題目難度,越靠近頂端,表示題目越難;橫軸表示題目與模型的擬合情況,用標(biāo)準(zhǔn)加權(quán)殘差均方表示,越靠近中間,表示擬合越好,測(cè)量的準(zhǔn)確性越高;每個(gè)氣泡的大小表示標(biāo)準(zhǔn)誤,氣泡越大,標(biāo)準(zhǔn)誤越大,測(cè)量的精確性越低。

有部分題目重合在一起,說明題目之間難度接近;除第5題外,其余題目均落在可接受的范圍內(nèi),說明題目的擬合度較高;第5題的擬合指標(biāo)超過了取值范圍,表示該題目的擬合度不夠,需要進(jìn)一步的修正。結(jié)合圖6來看,大部分題目的標(biāo)準(zhǔn)誤都較小,說明所選題目的精確性較高。

四、研究結(jié)論

檢測(cè)題目在多種數(shù)據(jù)指標(biāo)上符合Rasch模型的預(yù)期假設(shè)條件,說明監(jiān)測(cè)工具的效度指標(biāo)都比較理想;實(shí)證數(shù)據(jù)基本滿足Rasch模型規(guī)定的結(jié)構(gòu)和標(biāo)準(zhǔn),驗(yàn)證了監(jiān)測(cè)工具的可靠性和可行性。

需要特別說明的是,本研究是一種探索性研究,難免會(huì)存在一些不足之處。如監(jiān)測(cè)工具中關(guān)于高中遺傳學(xué)核心概念的題目數(shù)量較少,這可能會(huì)影響這部分知識(shí)的代表性,或者不能客觀地反映學(xué)生對(duì)于這部分知識(shí)掌握的能力水平。期待在后續(xù)的深入研究中加以改進(jìn)和完善。

參考文獻(xiàn):

[1] 趙平,紀(jì)曉麗.基于經(jīng)典測(cè)試?yán)碚摵晚?xiàng)目反應(yīng)理論的VST測(cè)試工具效度研究[J].外語測(cè)試與教學(xué),2016(2).

[2] 張金勇,何妃霞.教育測(cè)驗(yàn)中學(xué)生能力水平與測(cè)驗(yàn)項(xiàng)目難度的Rasch模型分析——個(gè)體能力與題目難度之間的對(duì)應(yīng)關(guān)系[J].當(dāng)代教育科學(xué),2012(12).

[3] 黃蓉,張曉正,趙守盈.Rasch分析和因素分析對(duì)學(xué)績測(cè)驗(yàn)的質(zhì)量分析比較[J].貴州師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2015(2).

平陆县| 利川市| 伊春市| 全椒县| 阿尔山市| 邢台市| 北川| 通江县| 蓝田县| 海南省| 达拉特旗| 孟州市| 鲜城| 泉州市| 南川市| 连南| 新巴尔虎右旗| 乃东县| 台南市| 扎囊县| 连州市| 烟台市| 安福县| 惠安县| 土默特左旗| 日照市| 潜江市| 周宁县| 西吉县| 岳池县| 昔阳县| 嘉禾县| 静安区| 台东市| 利津县| 景洪市| 横峰县| 临武县| 凭祥市| 桐梓县| 乌拉特中旗|