任東青,趙 濤,謝學(xué)軍,李予蓉,楊 燁,劉 洋
(第四軍醫(yī)大學(xué)軍事預(yù)防醫(yī)學(xué)院,陜西 西安 710032)
防原醫(yī)學(xué)考試是預(yù)防醫(yī)學(xué)教學(xué)過程的重要環(huán)節(jié),通過防原醫(yī)學(xué)考試可以檢驗(yàn)學(xué)生對(duì)該課程的掌握程度,還可以檢驗(yàn)試卷的命題是否恰當(dāng)。從考試成績(jī)本身或僅對(duì)成績(jī)進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)是不能全面獲得學(xué)生對(duì)知識(shí)和應(yīng)用的掌握程度的,因?yàn)檫@些信息都是隱藏在試卷成績(jī)后面的。因此,防原醫(yī)學(xué)試卷分析就顯得尤為重要,只有對(duì)所得數(shù)據(jù)進(jìn)行深挖掘以獲取更多有價(jià)值的信息,才能用來指導(dǎo)后續(xù)的防原醫(yī)學(xué)教學(xué)活動(dòng)。通過防原醫(yī)學(xué)試卷分析可以科學(xué)地評(píng)價(jià)其教學(xué)質(zhì)量和學(xué)生掌握知識(shí)的情況[1]。目前用于試卷分析的軟件有Excel、SPSS、SAS等專業(yè)統(tǒng)計(jì)分析軟件[2]。Microsoft Excel是office辦公軟件中一款功能強(qiáng)大的電子表格軟件,該軟件集數(shù)據(jù)管理、統(tǒng)計(jì)、制表繪圖等功能于一體,完全可以滿足常規(guī)試卷分析的需要[3]。本研究對(duì)一套由防原醫(yī)學(xué)試題庫組卷的試卷進(jìn)行各項(xiàng)定量分析,旨在為進(jìn)一步改進(jìn)防原醫(yī)學(xué)的教學(xué)質(zhì)量和完善試題庫提供依據(jù)。
以本校五年制醫(yī)療本科學(xué)生的334份防原醫(yī)學(xué)試卷為研究對(duì)象。該試卷為出題教師根據(jù)課程考核方案與考核標(biāo)準(zhǔn)設(shè)計(jì),采用防原醫(yī)學(xué)試題庫組題定卷??荚囶}型為:?jiǎn)芜x題20個(gè),每題2分,共40分;判斷題10個(gè),每題1分,共10分;名詞解釋為5個(gè),每個(gè)4分,共20分;問答題3個(gè),每題10分,共30分,試卷總分100分。將試卷題型、分值等信息和學(xué)生信息輸入Excel工作簿,學(xué)生信息包括學(xué)號(hào)、姓名和各項(xiàng)目得分。
運(yùn)用Excel軟件進(jìn)行成績(jī)統(tǒng)計(jì)分析及試卷質(zhì)量分析。
1.2.1 成績(jī)統(tǒng)計(jì)指標(biāo) 成績(jī)統(tǒng)計(jì)指標(biāo)包括平均分、標(biāo)準(zhǔn)差、最高分、最低分、頻數(shù)表、統(tǒng)計(jì)圖的計(jì)算及繪制。用Excel 2007軟件中函數(shù)計(jì)算和繪圖項(xiàng)目來完成。
1.2.2 難度分析 難度是試卷或試題的難易程度。試卷難度其實(shí)質(zhì)是總的平均分除以滿分值;試題難度是指某個(gè)試題的難易程度,用難度系數(shù)(P)表示,P值計(jì)算公式為:P=X/Xmax,其中P為題目難度,X表示該題目的平均得分,Xmax表示該題目的滿分。P值在0~1之間,P≥0.9為容易題,P>0.75為較易題,P≥0.55為中等難度題,P>0.4為較難題,P≤0.4為難題。
1.2.3 區(qū)分度分析 區(qū)分度是指考試試卷或試題對(duì)學(xué)生水平的區(qū)分程度。區(qū)分度好的考試能有效地將不同水平的學(xué)生區(qū)分開來,高水平的學(xué)生得高分,低水平的學(xué)生得低分。區(qū)分度的計(jì)算是將全體考生的成績(jī)按降序的方式排列,前27%的學(xué)生為高分組,后27%的學(xué)生為低分組,區(qū)分系數(shù)的計(jì)算公式為:D=(H-L)/F,式中的H和L分別是高分組和低分組在第X題上得分的平均值,F(xiàn)為第X題的滿分。D≥0.4表示區(qū)分度優(yōu)良;D≥0.3表示區(qū)分度合格;D≥0.2表示區(qū)分度較差,建議修改;D<0.2表示區(qū)分度差,建議淘汰。
1.2.4 信度分析 試卷信度是檢驗(yàn)考試結(jié)果的可靠性及穩(wěn)定性的指標(biāo)。通常運(yùn)用克隆巴赫系數(shù)α來表示,克隆巴赫系數(shù)α的計(jì)算公式:α=(1-∑Si2/St2)T/(T-1),其中T為總題目數(shù),Si2為每個(gè)試題的方差,St2為考生總成績(jī)的方差。一般來說,當(dāng)克隆巴赫系數(shù)α≥0.9為十分可信,0.7≤α<0.9為很可信很好(少見);O.5≤α<0.7為可信度好(最常見);0.4≤α<0.5為可信;0.3≤α<0.4為勉強(qiáng)可信;α<0.3為不可信。
1.2.5 綜合判定 A級(jí)為難度適中或容易、區(qū)分度良好的好試題;B級(jí)為試題偏難、但區(qū)分度良好,依然適用;C級(jí)為試題容易且區(qū)分較差,建議少用;D級(jí)為試題既難又無區(qū)分能力,建議不用。
防原醫(yī)學(xué)試卷成績(jī)滿分100分,學(xué)生平均成績(jī)74.26分,標(biāo)準(zhǔn)差6.14,最高分92分,最低分60分,全距32分,以70~79分最多,占 58.4%;60~69分、80~89分和 90~100分占16.2%、23.4%和2.1%;不及格率為0,頻數(shù)分布的峰值在70~79分之間,總成績(jī)頻數(shù)分布見圖1,分布曲線呈正態(tài)分布,表示該套防原醫(yī)學(xué)試卷難度適中或偏易,適合于多數(shù)學(xué)生。
圖1 總成績(jī)頻數(shù)分布
總成績(jī)經(jīng)過數(shù)據(jù)計(jì)算,獲得試卷的難度、區(qū)分度與信度(見表1)。本套防原醫(yī)學(xué)試卷從總體上來看,試卷難度中等,區(qū)分度優(yōu)良,0.5≤α<0.7,屬很可信,綜合判定A級(jí)。
從防原醫(yī)學(xué)試卷每個(gè)題型以及每一道題的試卷分析得知,單選題大多數(shù)題目較易,但區(qū)分優(yōu)良,4個(gè)題目偏難,另有兩個(gè)題過于簡(jiǎn)單,建議修改,綜合判定總體上屬A級(jí);判斷題除3個(gè)題難度較易,兩個(gè)題難度較難外,其余各題難度都中等,區(qū)分優(yōu)良,綜合判定A級(jí);名詞解釋有3個(gè)題難度較易,兩個(gè)題難度中等,區(qū)分度總體合格,綜合判定均屬B級(jí);問答題有兩道題難度中等,1道題難度較易,區(qū)分度總體上優(yōu)良,綜合判定均屬A級(jí)。
考試是為了檢驗(yàn)學(xué)生對(duì)教學(xué)目標(biāo)所規(guī)定的知識(shí)的掌握情況,不僅要考核學(xué)生對(duì)基礎(chǔ)知識(shí)的掌握,還要考核學(xué)生應(yīng)用知識(shí)進(jìn)行推理判斷、解決問題的能力[1]。一份優(yōu)秀的試卷考核設(shè)計(jì)應(yīng)當(dāng)能夠有效地體現(xiàn)出考試目標(biāo),一份試卷不可能覆蓋所有教學(xué)內(nèi)容。為此,合理分配教學(xué)內(nèi)容中各知識(shí)點(diǎn)在一份試卷中的題量與分值,試題應(yīng)難度中等,區(qū)分度達(dá)到優(yōu)良,能有效地將不同水平的學(xué)生區(qū)分開來。以往在防原醫(yī)學(xué)教學(xué)中評(píng)價(jià)試卷的難易程度主要依靠閱卷教師的主觀感覺和學(xué)生分?jǐn)?shù),缺乏客觀的量化指標(biāo),也缺乏對(duì)各試題項(xiàng)目的具體分析的科學(xué)性和有效性。本研究利用Excel軟件和經(jīng)典測(cè)量理論進(jìn)行防原醫(yī)學(xué)試卷分析,檢測(cè)指標(biāo)包括分?jǐn)?shù)常規(guī)統(tǒng)計(jì)指標(biāo)、難度和區(qū)分度系數(shù)、克隆巴赫系數(shù)α和綜合判定等項(xiàng)目。結(jié)果顯示,此次防原醫(yī)學(xué)考試成績(jī)?yōu)檎龖B(tài)分布,學(xué)生平均成績(jī)74.26分,最高分92分,最低分60分,標(biāo)準(zhǔn)差6.14,全距32分,峰值分布在70~79分之間。說明防原醫(yī)學(xué)試卷的考試結(jié)果較客觀準(zhǔn)確地反映了學(xué)生的知識(shí)和水平,達(dá)到了防原醫(yī)學(xué)教學(xué)的預(yù)期目標(biāo)和效果,同時(shí)也反映出命題者從總體水平上對(duì)試題難度等因素掌握較好。測(cè)驗(yàn)試題既要能夠覆蓋全部的教學(xué)章節(jié),又要反映各部分內(nèi)容和各認(rèn)知層次的相對(duì)比重[4]。此次命題者為長(zhǎng)期從事防原醫(yī)學(xué)教學(xué)一線的教師,對(duì)各章節(jié)教學(xué)重點(diǎn)和知識(shí)點(diǎn)非常熟悉,并且精心設(shè)計(jì)了防原醫(yī)學(xué)考核計(jì)劃,進(jìn)行防原醫(yī)學(xué)試題庫組卷,對(duì)試題庫中的題目稍加干預(yù)并刪除了各題型中重疊相似試題,由此組出高效度的防原醫(yī)學(xué)試卷。
在防原醫(yī)學(xué)試卷總體難度、區(qū)分度和信度分析方面,難度分析是指剖析試題的難易程度,它是衡量試題質(zhì)量的一個(gè)重要指標(biāo)參數(shù),它和區(qū)分度共同影響并決定試卷的鑒別性[4]。一般認(rèn)為,試題的難度指數(shù)在0.7~0.8之間比較合適,整份試卷的平均難度最好在0.5左右,高于0.9和低于0.4的試題不能太多。區(qū)分度高的試題可將不同水平的考生區(qū)分開,區(qū)分度低的試題對(duì)考生水平不能很好地區(qū)分,水平高和水平低的考生得分差不多,區(qū)分度在0.4以上就為較好試卷。常用克隆巴赫系數(shù)α來表示試題信度,該指標(biāo)檢驗(yàn)了考試結(jié)果是否真實(shí)客觀地反映了學(xué)生的實(shí)際水平,當(dāng)0.5≤α<0.7時(shí)為可信度好。本試卷的總體難度系數(shù)是0.74,難度合適;區(qū)分度為0.41,歸屬于區(qū)分度優(yōu)良;克隆巴赫系數(shù)α為0.62,表明該試卷較真實(shí)地反映了學(xué)生實(shí)際水平,考試成績(jī)是可信的;綜合判定本試卷為難度適中、區(qū)分度良好的A級(jí)試卷。
防原醫(yī)學(xué)試卷各型試題的具體分析方面,在難度上單選題及名詞解釋題整體難度較易,問答題和判斷題難度中等。本套試卷的測(cè)驗(yàn)試題基本能夠覆蓋全部的教學(xué)章節(jié)知識(shí)點(diǎn),各認(rèn)知層次的比重合理,重點(diǎn)突出,例如第四章“急性放射病”的內(nèi)容在各題型中所占比例和比重均高。這一章節(jié)是教學(xué)的重點(diǎn)也是難點(diǎn),教師投入的力量和學(xué)生花費(fèi)的精力均很大,學(xué)生對(duì)此部分的知識(shí)點(diǎn)掌握和運(yùn)用非常好,體現(xiàn)在此方面的失分率較低。試題具體分析的結(jié)果提示我們應(yīng)思考如何在有限的教學(xué)時(shí)間內(nèi)有效地把握好教學(xué)重點(diǎn)的傳授以及如何促進(jìn)學(xué)生對(duì)知識(shí)的領(lǐng)悟,同時(shí),也應(yīng)注意到學(xué)生掌握知識(shí)能力的提高就是教學(xué)質(zhì)量的提高?;蛟S同樣是這份A級(jí)試卷卻無法有效地區(qū)分水平各異的學(xué)生,在這種情況下,命題者要審時(shí)度勢(shì)并認(rèn)真地修改考核方案,剔除試題庫中那些區(qū)分度低和難度差的考題,更新和完善試題庫,組建出更優(yōu)秀的試卷。
通過防原醫(yī)學(xué)試卷分析還有助于調(diào)整教學(xué)進(jìn)度和安排,促進(jìn)教學(xué)相長(zhǎng)[5]。我們從防原醫(yī)學(xué)試卷分析的結(jié)果中發(fā)現(xiàn),學(xué)生對(duì)某些知識(shí)點(diǎn)的理解和掌握速度是不同的。例如名詞解釋的第一題非電離輻射是作為較易的題目出現(xiàn)的,但學(xué)生的答案正確率極低,只會(huì)解釋電離輻射而不能解釋非電離輻射,說明學(xué)生在這方面的知識(shí)掌握不足。問答題的第二題是結(jié)合現(xiàn)實(shí)生活的綜合型考題,如在日本的福島核事故中如何進(jìn)行醫(yī)學(xué)救援?我們認(rèn)為此題有一定的難度,但出乎意料的是學(xué)生的答案正確率很高。原因是學(xué)生已學(xué)完臨床課程也具備急救患者的能力,加上防原醫(yī)學(xué)專業(yè)知識(shí)的學(xué)習(xí),再加上學(xué)生對(duì)日本福島核事故的極大關(guān)注和興趣。對(duì)此我們已將這些試卷分析的結(jié)果進(jìn)行仔細(xì)梳理和認(rèn)真討論,在今后教學(xué)中增添實(shí)例,適當(dāng)調(diào)整授課內(nèi)容和進(jìn)度??傊?,應(yīng)用Excel軟件進(jìn)行試卷分析簡(jiǎn)便易行,所獲信息量大,且科學(xué)規(guī)范。對(duì)防原醫(yī)學(xué)的試題質(zhì)量和考試成績(jī)的綜合評(píng)價(jià),使我們獲得了成績(jī)數(shù)據(jù)背后的大量信息。實(shí)踐證明,考后及時(shí)分析試卷有助于適時(shí)調(diào)整教學(xué)方案、改善教學(xué)效果和提高教學(xué)質(zhì)量。
表1 試卷的難度、區(qū)分度、信度估計(jì)和綜合判定
[1]崔慧林,王澎,張巖波,等.組織學(xué)與胚胎學(xué)考試有效性分析[J].西北醫(yī)學(xué)教育,2011,13(8):699-712.
[2]崔永紅,李學(xué)民.運(yùn)用SPSS對(duì)專業(yè)基礎(chǔ)課與專業(yè)課成績(jī)分析[J].中國(guó)科教創(chuàng)新導(dǎo)刊,2011,5(6):32-33.
[3]王岱岳,王金平,田華,等.EXCEL-VBA編制試卷分析軟件之探索與實(shí)踐[J].中國(guó)醫(yī)藥導(dǎo)報(bào),2007,(16):118-119.
[4]馮修猛,李凱軍,閻實(shí),等.試卷分析及其對(duì)教學(xué)工作指導(dǎo)作用的研究[J].西北醫(yī)學(xué)教育,2009,17(4):69-70.
[5]韓春紅,季曉輝.臨床醫(yī)學(xué)專業(yè)學(xué)生部分課程考核試卷效度的分析[J].中華醫(yī)學(xué)教育雜志,2011,31(5):784-789.■