馬明建
摘要:文章運用多元統(tǒng)計分析中的因子分析,根據(jù)試卷的量化指標(biāo)難度、區(qū)分度、信度以及學(xué)生對教師的評價等數(shù)據(jù)指標(biāo)建立多元統(tǒng)計模型,利用SAS統(tǒng)計分析軟件進(jìn)行建模分析。通過因子分析運行結(jié)果,進(jìn)一步分析影響教學(xué)效果、教學(xué)評價、教學(xué)質(zhì)量的因素,為提高教學(xué)質(zhì)量提供參考。
關(guān)鍵詞:多元統(tǒng)計分析;因子分析;難度;區(qū)分度;信度;態(tài)度
試卷質(zhì)量的統(tǒng)計分析是檢驗學(xué)生學(xué)習(xí)成果、提高教學(xué)效果、改進(jìn)教學(xué)方式的重要途徑。過去很多研究大多就試卷質(zhì)量量化指標(biāo)進(jìn)行計算和分析,僅得到了一些關(guān)于試卷質(zhì)量的數(shù)據(jù)。而本文以教育統(tǒng)計和測量為理論基礎(chǔ),計算出試卷質(zhì)量的量化指標(biāo),運用多元統(tǒng)計分析知識,建立因子模型,根據(jù)因子分析的結(jié)果,簡要分析教師的教學(xué)效果和學(xué)生的學(xué)習(xí)狀況,對教學(xué)質(zhì)量得出綜合評價。
一、試卷量化的指標(biāo)
試卷分析數(shù)量化是教育測量科學(xué)化的重要內(nèi)容,衡量試卷質(zhì)量的主要檢驗指標(biāo)有難度、區(qū)分度、信度、效度四項指標(biāo),這些指標(biāo)的概念和計算方法如下(本文所要分析的試卷中不含有選擇、是非題)。
大量統(tǒng)計資料表明,考試成績的分布一般服從正態(tài)分布或近似正態(tài)分布。于是我們可以作如下假設(shè):評分以100分制,每題滿分為aj(j=1,2,…,n),其中xj、S表示第j題的均值、方差。
(一)可靠性分析
可靠性是指考試結(jié)果的可信程度,用于考察試卷的總體質(zhì)量。從教育測量學(xué)的角度來看,學(xué)生的考試成績應(yīng)來自正態(tài)分布或近似正態(tài)分布,否則該次考試的成績就是不合理的。
(二)難度分析
試卷難度可根據(jù)Pi=計算出每一題的難度,然后再根據(jù)P=ajPj來計算出試卷總體難度。一般大規(guī)模標(biāo)準(zhǔn)化考試難度控制0.4~0.7之間,但學(xué)科結(jié)業(yè)考試一般控制在0.5~0.85之間為宜。
(三)區(qū)分度分析
試題區(qū)分度是考量試題是否能將學(xué)識不同的學(xué)生區(qū)分開的指標(biāo)。第j道題的區(qū)分度為δj=,Hj,Lj分別表示高低分組第j題的平均分,高低分組各占樣本總量的25%~30%為宜,試卷的總區(qū)分度δ=ajδj,一般試題的區(qū)分度應(yīng)在0.3以上。
(四)信度分析
信度是評估分?jǐn)?shù)與考生真實水平一致性的指標(biāo)。通常大規(guī)模標(biāo)準(zhǔn)化考試要求信度在0.9以上,自編試卷的信度應(yīng)大于0.4,計算公式:rx=(1-)=(1-)。
二、具體試卷指標(biāo)計算
現(xiàn)有某學(xué)校某專業(yè)學(xué)生(58人)的五門課程,其中,前兩門課程為同一位老師教授,后三門課程的授課教師均為互不相同的教師。另外,根據(jù)問卷調(diào)查,得到了學(xué)生對五門專業(yè)課授課教師的教學(xué)評價的平均值,滿分為100分。在對學(xué)生的調(diào)查中發(fā)現(xiàn),學(xué)生對教師的評價較低,則相應(yīng)的學(xué)生的學(xué)習(xí)積極性不高,學(xué)習(xí)態(tài)度差;而對評價高的課程,學(xué)生的學(xué)習(xí)積極性高,學(xué)習(xí)態(tài)度良好。因此,將教學(xué)評價可以看作學(xué)生的學(xué)習(xí)態(tài)度(見表1)。
(一)可靠性檢驗
由于樣本容量n≤200,將采用SAS軟件中的Shapiro-Wilks的W統(tǒng)計量來檢驗正態(tài)性。經(jīng)檢驗,此次考察的五門課程均符合正態(tài)分布,數(shù)據(jù)可靠,可以進(jìn)行數(shù)據(jù)統(tǒng)計分析。
(二)試卷量化分析的各項指標(biāo)的計算
按照上述所提供的試卷各項指標(biāo)計算公式可得到結(jié)果如表1所示。
三、正交因子模型及因子分析
建立因子分析數(shù)學(xué)模型的目的不僅要找出公共因子以及對變量進(jìn)行分組,更重要的是要知道每個公共因子的意義,以便對實際問題做出科學(xué)的分析。
下面以表1作為數(shù)據(jù)源,編寫程序,輸出結(jié)果如表2、表3。
由表2可看出,前兩個因子的累計貢獻(xiàn)率超過90%,故公因子的個數(shù)為2。由表3可以看到第一公因子中主要載荷為x2(區(qū)分度)、x4(態(tài)度)、x1(難度),這都是影響學(xué)生考試成績的指標(biāo),且可看到學(xué)生的對老師態(tài)度起了很大的作用,可以稱之分?jǐn)?shù)因子;第二個公因子中,起主要作用的是x3(信度),可稱之為穩(wěn)定性因子。
四、結(jié)果分析
通過上述的試卷質(zhì)量指標(biāo)的計算,以及因子分析的結(jié)果,可以得到以下分析結(jié)果。
第一,雖然學(xué)生對前兩門課程的同一位任課教師的評價很低,但是該授課教師試卷質(zhì)量符合要求,反映了教師的教學(xué)大綱完成情況正常,說明了課程考試從一定意義上有效的檢驗了學(xué)生的學(xué)習(xí)效果及教師課堂教學(xué)效果;其次,學(xué)生對教師的評價的主觀性較強,這些評價數(shù)據(jù)也反映學(xué)生對待授課教師、該門課程的學(xué)習(xí)態(tài)度情況。接下來,通過因子分析來進(jìn)一步判斷學(xué)生的態(tài)度對考試結(jié)果的影響。
第二,SAS軟件統(tǒng)計分析課程試卷與時間序列統(tǒng)計分析課程試卷相比較,前者的試卷量化指標(biāo)顯然要比后者質(zhì)量高,以此來看,前者的教學(xué)效果及教學(xué)質(zhì)量要比后者強,同一位老師教授的同一批學(xué)生的不同課程,存在較為明顯的差異。從SAS軟件中利用成對組檢驗,也可以得出這樣的結(jié)論,即兩次考試存在顯著性差異。另外需要說明的是,前者是第六學(xué)期考試科目,后者是第七學(xué)期的必修課,而全國碩士研究生入學(xué)考試就是在第七學(xué)期??梢钥吹?,在出題者和答題者不變的情況下,前后兩次考試存在顯著性差異,除了試卷質(zhì)量本身的差異性,另一個非常重要的原因應(yīng)該是學(xué)生的學(xué)習(xí)態(tài)度。
第三,學(xué)生的學(xué)習(xí)態(tài)度是否影響考試結(jié)果,在因子分析中這個問題得到了解答。按照因子分析的理論,影響考試成績的因素可以綜合為少數(shù)的幾個,并且可以根據(jù)因子載荷矩陣來判斷,哪個因素的影響較大。經(jīng)因子分析后,影響成績的指標(biāo)綜合為兩個:分?jǐn)?shù)因子和穩(wěn)定性因子。其中可以看到學(xué)生態(tài)度的載荷為0.94309,表明態(tài)度是影響成績非常重要的因素。
通過上面的分析,大多數(shù)學(xué)生都忙于準(zhǔn)備考研,沒有認(rèn)真的準(zhǔn)備考試,因此,在第七學(xué)期的《時間序列分析》考試與上學(xué)期的考試存在顯著性差異,其中一部分原因是由學(xué)生的學(xué)習(xí)態(tài)度造成的。