国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)于“考試”,我們了解多少?

2015-05-11 15:31:12廖先祥莫海浪
廣西教育·D版 2015年4期
關(guān)鍵詞:內(nèi)容效度負(fù)數(shù)效度

廖先祥+莫海浪

在第二個(gè)問題中,我們已經(jīng)知道了什么是真分?jǐn)?shù)理論,平時(shí)我們的考試就是以它為理論依據(jù)實(shí)施的。真分?jǐn)?shù)理論有時(shí)也叫經(jīng)典測(cè)量理論(Classical Test Theory,CTT),它有三個(gè)理論假設(shè):第一,真分?jǐn)?shù)具有不變性;第二,誤差是完全隨機(jī)的;第三,卷面分?jǐn)?shù)是真分?jǐn)?shù)與誤差分?jǐn)?shù)的和。其實(shí),經(jīng)典測(cè)量理論的內(nèi)容并不只是前面我們所講的這些,在這個(gè)框架下,它的內(nèi)容可豐富呢。

問題3:你知道我們考試的信度是怎么回事嗎?

在很多人的眼里,考試并不是問題,“不就是做題嘛”。但問題是,我們要利用考試考出來(lái)的成績(jī)對(duì)考生進(jìn)行評(píng)價(jià),進(jìn)而對(duì)學(xué)校、班級(jí)或其他團(tuán)體等進(jìn)行評(píng)價(jià)。如果是這樣,我們就不得不提出這樣一個(gè)問題了:“這次考試到底有多大可信性?”或者如此表述:“這次考試所得到的成績(jī)能代表考生的真實(shí)水平嗎?其可靠性達(dá)到了怎樣的程度?”如果這次考試的可靠性不夠高,那么用這樣的考試成績(jī)作為評(píng)價(jià)用的數(shù)據(jù)就有點(diǎn)兒“不靠譜”,我們不能讓考生被“不靠譜”的數(shù)據(jù)“冤枉”。

還記得我們?cè)谏衔闹刑岬降摹靶W(xué)一年級(jí)學(xué)生兩位數(shù)以內(nèi)的加減法運(yùn)算能力”測(cè)驗(yàn)嗎?我們?yōu)榱说玫綄W(xué)生的真實(shí)能力水平,前后進(jìn)行了60次同樣內(nèi)容的測(cè)驗(yàn)(題目不同)。這在經(jīng)典測(cè)量理論(CTT)里叫做“平衡測(cè)驗(yàn)”,其目的是使我們所獲得的考試成績(jī)更可信、成績(jī)更真實(shí),進(jìn)而保證我們的評(píng)價(jià)更可靠。然而,這只是理論上的做法,在現(xiàn)實(shí)中我們不可能做那么多次測(cè)驗(yàn)才進(jìn)行評(píng)價(jià),這樣的代價(jià)實(shí)在太大了!哪怕就是平時(shí)的測(cè)驗(yàn),做兩次都很難,更不用說(shuō)做那么多次同樣內(nèi)容的測(cè)驗(yàn)了。至于中高考,從來(lái)都是一次過。那么,我們有沒有別的什么方法可以解決這個(gè)可信性、可靠性的問題呢?答案是肯定的。那些專門研究教育測(cè)量學(xué)的專家們已經(jīng)為我們提供了各種各樣的解決辦法,比如采用相關(guān)法進(jìn)行重測(cè)信度(Test-retest Re-liability)、復(fù)本信度(Equivalent-forms Re-liability)、分半信度(Split-half Reliability)的估計(jì)等。另外,克倫巴赫(Cronbach)α系數(shù)、荷伊特信度(Hoyt,1941)以及庫(kù)德和理查遜(G.F.Kuder & M.W.Richardson,1937)提出的兩個(gè)公式K-R20公式和K-R21公式等都是進(jìn)行信度估計(jì)的重要方法。

什么是重測(cè)信度呢?所謂重測(cè)信度,又叫再測(cè)信度,就是把同一(群)考生、同一個(gè)測(cè)驗(yàn)在不同的時(shí)間里測(cè)量?jī)纱危缓笥?jì)算這兩次測(cè)驗(yàn)成績(jī)的相關(guān)系數(shù),這個(gè)系數(shù)就叫做重測(cè)信度。

什么是復(fù)本信度呢?復(fù)本信度就是以兩個(gè)等值但題目不同的測(cè)驗(yàn)(復(fù)本,就是平時(shí)我們所說(shuō)的備用卷;若相同的人用正卷和備用卷測(cè)驗(yàn)的結(jié)果一樣,那么這兩份試卷就是等值的)來(lái)考查同一個(gè)群體(考生),然后求得這批考生在這兩次測(cè)驗(yàn)中所得分?jǐn)?shù)的相關(guān)系數(shù),這個(gè)相關(guān)系數(shù)就叫復(fù)本信度。

什么是分半信度呢?分半信度是指在測(cè)驗(yàn)后將測(cè)驗(yàn)試題分成相等的兩組(兩半),通常采用奇偶分組方法,即將測(cè)驗(yàn)題目按照題號(hào)的奇數(shù)和偶數(shù)分成兩半,然后計(jì)算這兩組題目得分之間的相關(guān)系數(shù),這個(gè)系數(shù)就叫分半信度。

無(wú)論是重測(cè)信度、復(fù)本信度還是分半信度,這些名詞聽起來(lái)都是一些很專業(yè)的東西。不過,在科學(xué)很發(fā)達(dá)的今天,我們一般都能毫不費(fèi)力地利用各種計(jì)算機(jī)軟件將它們快速測(cè)算出來(lái)。

例如,我們利用IRT統(tǒng)計(jì)分析軟件ConQuest version 2.0對(duì)2013年柳州市中考試卷的信度進(jìn)行計(jì)算分析,得到各科的克倫巴赫(Cronbach)α系數(shù):語(yǔ)文=0.90,數(shù)學(xué)=0.93,英語(yǔ)=0.93,物理=0.93,化學(xué)=0.93,思品=0.87,歷史=0.92。

其實(shí),求克倫巴赫(Cronbach)α系數(shù)還可以用SPSS軟件來(lái)測(cè)算。為了計(jì)算2014年柳州市中考數(shù)學(xué)試卷的克倫巴赫(Cronbach)α系數(shù),我們使用了這個(gè)SPSS軟件,過程如下:

第一步:把每個(gè)學(xué)生每道題的得分輸入或?qū)氲絊PSS軟件中,如圖1。

第二步:在SPSS菜單中選取“分析”→“度量”→“可靠性分析”,如圖2。

第三步:在選取“可靠性分析”確定后出現(xiàn)如圖3的選項(xiàng)窗口,這時(shí)把左邊的各題變量都選放到右邊的項(xiàng)目欄中,模型選項(xiàng)取“α”,如圖3。

第四步:點(diǎn)擊“統(tǒng)計(jì)量”按鈕,出現(xiàn)如圖4的窗口,鉤選相應(yīng)選項(xiàng)后點(diǎn)擊“繼續(xù)”。在回到上一窗口后點(diǎn)擊“確定”即可。

第五步:在軟件的查看器中就可以查看到“可靠性統(tǒng)計(jì)量”克倫巴赫(Cronbach)α系數(shù)了。如圖5中的“可靠性統(tǒng)計(jì)量”,我們發(fā)現(xiàn)2014年柳州市中考數(shù)學(xué)的α系數(shù),即信度為0.92。

現(xiàn)在,信度系數(shù)求出來(lái)了,可是,這個(gè)系數(shù)到底要多大才能說(shuō)明這份試卷的測(cè)驗(yàn)結(jié)果具有足夠的可靠性呢?我們可以參考下面這個(gè)表格來(lái)下結(jié)論:

信度高低與克倫巴赫

(Cronbach)α系數(shù)關(guān)系對(duì)照表

由此看來(lái),2014年柳州市中考數(shù)學(xué)試卷的測(cè)試信度較高,這份試卷是十分可信的,用它來(lái)作測(cè)試,結(jié)果是十分可靠的,能夠測(cè)出我們要考查的學(xué)生的真實(shí)雙基水平。

解決了考試的信度問題,下面便是考試的“效度”問題了。

問題4:我們?nèi)绾沃揽荚嚨慕Y(jié)果是否有效、效度如何?

信度只是幫助我們解決了考試結(jié)果的可信程度的問題,卻不能幫助我們解決考試結(jié)果是否有效、效度如何的問題。那什么是效度呢?考試的效度指的是考試結(jié)果的有效性程度,也就是已經(jīng)測(cè)量得到的東西與我們想要測(cè)量的東西是否相符、符合的程度有多大。比如,我們本想通過對(duì)一篇短文的分析來(lái)了解學(xué)生對(duì)某種文體的理解和掌握水平,但是在命題時(shí)我們卻問了大量有關(guān)作者生平、寫作思想、人生態(tài)度、對(duì)短文所描述情境的感悟以及對(duì)字、詞、句的分析等,很顯然,這樣的考試,其分?jǐn)?shù)不能有效地反映出學(xué)生對(duì)某種文體的理解和掌握水平。又比如,我們?yōu)榱丝疾槠吣昙?jí)學(xué)生對(duì)正、負(fù)數(shù)的理解能力,于是,命制了下面這份測(cè)試題。

一、選擇題(每小題8分,共32分)

1.有一組數(shù)據(jù):-1,0,+,-1.732,-3.14,106,-。下列說(shuō)法中,正確的選項(xiàng)是( )。

A.正數(shù)有1個(gè) B.負(fù)數(shù)有2個(gè)

C.正數(shù)有3個(gè) D.負(fù)數(shù)有4個(gè)

2.如果水位升高5m時(shí)水位變化記作+5m,那么水位下降3m時(shí)水位變化記作( )。

A.+3m B.+2m

C.-2m D.-3m

3.下列說(shuō)法正確的是( )。

A.負(fù)數(shù)是小于0的數(shù)

B.不是正數(shù)的數(shù)一定是負(fù)數(shù)

C.正數(shù)是不小于0的數(shù)

D.不是負(fù)數(shù)的數(shù)一定是正數(shù)

4.向東行進(jìn)-30米表示的意義是

( )。

A.向東行進(jìn)30米

B.向東行進(jìn)-30米

C.向西行進(jìn)30米

D.向西行進(jìn)-30米

二、填空題(每空8分,共48分)

5.甲、乙兩人同時(shí)從A地出發(fā),如果向南走48m,記作+48m,那么:

(1)A地的距離在數(shù)學(xué)上可標(biāo)記為

。

(2)乙向北走32m,記為 。

(3)甲走了+28m,表示甲向 方向走了28m。

(4)此時(shí)此刻,甲乙兩人的距離為

。

6.某種藥品的說(shuō)明書上標(biāo)明保存溫度是(20±2)℃,由此可知:

(1)這種藥物保存溫度不能高于

℃。

(2)這種藥物保存溫度范圍只有

℃。

三、解答題(共20分)

7.2014年我國(guó)全年平均降水量比上年減少24mm,2013年比上年增長(zhǎng)8mm,2012年比上一年減少20mm。用正數(shù)和負(fù)數(shù)表示這三年我國(guó)全年平均降水量比上年的增長(zhǎng)量。

那么,這份試題能否測(cè)出七年級(jí)學(xué)生對(duì)正、負(fù)數(shù)的理解能力呢?如果能的話,它的有效程度怎樣?要回答這樣一個(gè)問題,測(cè)量學(xué)的專家們給出了三種方式的回答,提出了三種類別的效度:一是內(nèi)容效度(Content Validity),指的是測(cè)驗(yàn)的試題對(duì)想要測(cè)驗(yàn)的內(nèi)容的代表性程度;二是結(jié)構(gòu)效度(Construct Validity),指的是測(cè)驗(yàn)結(jié)果與測(cè)驗(yàn)的理論假設(shè)之間的一致性程度;三是效標(biāo)關(guān)聯(lián)效度(Criterion-related Validity),又稱實(shí)證效度,指的是測(cè)驗(yàn)的結(jié)果與某種外在效標(biāo)之間的一致性程度,一般用測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)之間的相關(guān)系數(shù)表示。

在日常的教學(xué)中,我們的考試以檢測(cè)知識(shí)為主,比較容易獲得較高的內(nèi)容效度,因此,我們對(duì)這一類測(cè)驗(yàn)也往往更加關(guān)注它們的內(nèi)容效度。內(nèi)容效度,在實(shí)際操作中有時(shí)也叫“知識(shí)覆蓋面”。我們?cè)诿}時(shí)為了提高測(cè)驗(yàn)的內(nèi)容效度,往往先羅列出考試范圍內(nèi)的所有內(nèi)容,然后再盡可能多地對(duì)所羅列的內(nèi)容設(shè)定相關(guān)的試題,具體操作步驟如下:第一,確定考試總體內(nèi)容,并列出有關(guān)知識(shí)與技能的分類板塊;第二,進(jìn)一步細(xì)化考試內(nèi)容,并根據(jù)其重要性確定各內(nèi)容的加權(quán)比例,作出盡可能詳細(xì)的描述;第三,確定每道題所測(cè)的知識(shí)與技能,將題目的分類歸屬與上述所列考試內(nèi)容進(jìn)行比較;第四,結(jié)合考試內(nèi)容,計(jì)算試題所包含的考試內(nèi)容比例、內(nèi)容板塊所占比例、分值所占內(nèi)容量值比例,綜合評(píng)估內(nèi)容效度。以下是柳州市對(duì)2014年中考數(shù)學(xué)內(nèi)容效度的評(píng)估:

《中考說(shuō)明》所列知識(shí)點(diǎn)136個(gè),考核了123個(gè),占90.4%;出自課本的有103分,占到總分的85.8%;在各個(gè)板塊內(nèi)容賦分比例中,數(shù)與代數(shù)部分占56分,空間與圖形部分占52分,統(tǒng)計(jì)與概率部分占12分,其賦分比例是14∶13∶3;如果按照學(xué)年內(nèi)容比,則七年級(jí)24分,八年級(jí)48分,九年級(jí)48分,學(xué)年內(nèi)容的比例是1∶2∶2。

通常,我們?cè)诿}前會(huì)預(yù)先公布該年度的筆試考試的內(nèi)容范圍,然后根據(jù)這一考試范圍研制命題雙向細(xì)目表,同時(shí)根據(jù)考試內(nèi)容范圍進(jìn)行題目的命制,在命制完題目后,再對(duì)照雙向細(xì)目表描述試題所包含的內(nèi)容,最后計(jì)算試題所含內(nèi)容占雙向細(xì)目表中的考試范圍內(nèi)容比例。另外,我們還會(huì)根據(jù)實(shí)際授課的課時(shí)比例,統(tǒng)計(jì)試題分值的分布比例,以觀察考試值分量是否合理。還有另一個(gè)也是非常重要的評(píng)價(jià)內(nèi)容,那就是試題與學(xué)科課程板塊分布是否合理。

對(duì)于中小學(xué)教師來(lái)說(shuō),我們能把握好內(nèi)容效度也基本能滿足平時(shí)對(duì)學(xué)生考試的要求了。

(責(zé)編 白聰敏)

猜你喜歡
內(nèi)容效度負(fù)數(shù)效度
COSMIN方法介紹:評(píng)價(jià)患者報(bào)告結(jié)局測(cè)量工具內(nèi)容效度的評(píng)分系統(tǒng)
慈善募捐規(guī)制中的國(guó)家與社會(huì):兼論《慈善法》的效度和限度
英語(yǔ)專八閱讀理解部分內(nèi)容效度的歷時(shí)對(duì)比研究(2009—2017年)
絕對(duì)值的作用
學(xué)好乘方四注意
歷經(jīng)艱辛的“負(fù)數(shù)”
非負(fù)數(shù)|a|、a2幫你輕松解題
被看重感指數(shù)在中國(guó)大學(xué)生中的構(gòu)念效度
大學(xué)英語(yǔ)新四級(jí)閱讀理解內(nèi)容效度研究
外語(yǔ)形成性評(píng)估的效度驗(yàn)證框架
舟曲县| 津市市| 辽中县| 广安市| 福州市| 积石山| 景德镇市| 永年县| 阜南县| 中牟县| 房产| 蒲江县| 杂多县| 高清| 宁武县| 黄山市| 鄂州市| 义马市| 黄石市| 拉孜县| 潮安县| 平南县| 福清市| 黎城县| 三江| 兴业县| 黎川县| 双江| 商城县| 门源| 淮阳县| 得荣县| 伊吾县| 龙江县| 枝江市| 仁寿县| 晴隆县| 千阳县| 东兴市| 梁平县| 安义县|