丁海霞(灌云中等專(zhuān)業(yè)學(xué)?!〗K連云港 222200)
?
基于經(jīng)典測(cè)量理論的試卷評(píng)價(jià)系統(tǒng)的設(shè)計(jì)
丁海霞
(灌云中等專(zhuān)業(yè)學(xué)校江蘇連云港222200)
摘要:針對(duì)傳統(tǒng)的試卷評(píng)價(jià)方式欠缺真實(shí)性和準(zhǔn)確性的問(wèn)題,在充分分析經(jīng)典測(cè)量理論的基礎(chǔ)上,將定量分析和定性分析有機(jī)結(jié)合起來(lái),開(kāi)發(fā)了一款專(zhuān)業(yè)的試卷評(píng)價(jià)系統(tǒng)。以灌云中等專(zhuān)業(yè)學(xué)校1 407班學(xué)生計(jì)算機(jī)應(yīng)用基礎(chǔ)期末成績(jī)?yōu)槔?,進(jìn)行了試卷分析和試題分析,反映了本班學(xué)生的整體水平,并通過(guò)分析學(xué)生的客觀能力,對(duì)本次試卷的改進(jìn)進(jìn)行建議。
關(guān)鍵詞:經(jīng)典測(cè)量理論;試卷評(píng)價(jià)系統(tǒng);定量分析;定性分析
隨著我國(guó)經(jīng)濟(jì)迅猛發(fā)展,教育事業(yè)受到了前所未有的重視,教育測(cè)評(píng)作為教育過(guò)程的一個(gè)重要環(huán)節(jié),能夠調(diào)控教育過(guò)程,促進(jìn)教育發(fā)展,日漸引起了國(guó)家和政府的高度重視,已經(jīng)被教育部上升到了一個(gè)重要的政策層面。2010年7月發(fā)布的《國(guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》和2012年6月頒布的《國(guó)家教育事業(yè)發(fā)展第十二個(gè)五年規(guī)劃》都強(qiáng)調(diào)要重視教育評(píng)價(jià),以提高教育質(zhì)量。
試卷評(píng)價(jià)是反映和評(píng)估教學(xué)質(zhì)量的重要手段,傳統(tǒng)的人工評(píng)價(jià)方式操作繁瑣,效率低下,很難準(zhǔn)確地衡量學(xué)生的實(shí)際水平[1]。以經(jīng)典測(cè)量理論為基礎(chǔ)進(jìn)行試卷評(píng)價(jià),不僅理論依據(jù)充分,而且評(píng)價(jià)指標(biāo)明確,數(shù)學(xué)模型簡(jiǎn)單易懂,只要誤差在允許的范圍內(nèi),就能得到比較客觀、準(zhǔn)確的結(jié)果。
經(jīng)典測(cè)量理論是以真分?jǐn)?shù)理論為核心理論假設(shè)的測(cè)量理論及其方法體系,真分?jǐn)?shù)模型通過(guò)一系列的基本定義和推導(dǎo)對(duì)此進(jìn)行了簡(jiǎn)單而有效的描述。①觀測(cè)分?jǐn)?shù)是真分?jǐn)?shù)與誤差分?jǐn)?shù)之和;②真分?jǐn)?shù)與觀測(cè)分?jǐn)?shù)的各自平均數(shù)相等;③誤差分?jǐn)?shù)的期望值是0;④真分?jǐn)?shù)與誤差分?jǐn)?shù)的相關(guān)性為0;⑤不同的測(cè)驗(yàn)誤差的相關(guān)性為0;⑥測(cè)驗(yàn)觀測(cè)分?jǐn)?shù)的方差為真分?jǐn)?shù)方差和誤差分?jǐn)?shù)方差之和[2]。本次開(kāi)發(fā)的試卷評(píng)價(jià)系統(tǒng)是以經(jīng)典測(cè)量理論為指導(dǎo),在定量分析的基礎(chǔ)上,進(jìn)行了定性分析,以能夠正確反映學(xué)生的實(shí)際水平。
本項(xiàng)目在開(kāi)發(fā)過(guò)程中前端使用C#作為開(kāi)發(fā)語(yǔ)言,VS2008作為開(kāi)發(fā)平臺(tái),后端使用SQL Server 2005數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù)。
系統(tǒng)中,管理員擁有最大權(quán)限,教師在申請(qǐng)賬號(hào)后,可以登陸進(jìn)入主窗口,通過(guò)選用相應(yīng)的菜單及子菜單,添加試卷、試題信息和學(xué)生的相關(guān)信息,并可以當(dāng)場(chǎng)分析,同時(shí)也可以對(duì)數(shù)據(jù)庫(kù)中已有的試卷進(jìn)行分析。具體流程圖如圖1所示:
圖1 試卷分析系統(tǒng)流程圖
2.1功能模塊設(shè)計(jì)
試卷評(píng)價(jià)系統(tǒng)包括各子系統(tǒng),分別是:
①系統(tǒng)管理:系統(tǒng)中各級(jí)用戶(hù)管理和權(quán)限分配,包括管理員和教師。
②信息管理:試卷基本信息的錄入,包括班級(jí)號(hào)、課程名、試題總分、每道試題的分值、考試人數(shù)、任課教師、出卷教師。
③成績(jī)錄入:把學(xué)生的個(gè)人成績(jī)添加進(jìn)數(shù)據(jù)庫(kù)。
④試卷分析:對(duì)試卷從平均分、全距、方差、及格率、優(yōu)秀率、難度、區(qū)分度、信度、效度等幾個(gè)方面進(jìn)行分析。
⑤知識(shí)點(diǎn)分布與分值:通過(guò)對(duì)考察的試題知識(shí)點(diǎn)情況分析試卷,同時(shí)也分析了考生在每個(gè)知識(shí)點(diǎn)上的平均得分及每位考生在每個(gè)知識(shí)點(diǎn)的得分情況。
其中試卷分析模塊是本系統(tǒng)的核心模塊,也是進(jìn)行試卷評(píng)價(jià)的重要依據(jù),整個(gè)系統(tǒng)是以經(jīng)典測(cè)量理論為基礎(chǔ),具體結(jié)構(gòu)圖如圖2所示:
圖2 試卷分析模塊
2.2數(shù)據(jù)庫(kù)設(shè)計(jì)
試卷評(píng)價(jià)系統(tǒng)需要存儲(chǔ)大量的信息,本系統(tǒng)采用性能較好,使用較廣泛的SQL Server 2005設(shè)計(jì)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)名稱(chēng)為PaperAnalysis。
2.2.1主要數(shù)據(jù)表的設(shè)計(jì)
在試卷評(píng)價(jià)系統(tǒng)中,數(shù)據(jù)庫(kù)表清單如表1所示:
表1 數(shù)據(jù)庫(kù)表清單
①用戶(hù)表:存儲(chǔ)系統(tǒng)用戶(hù)的權(quán)限和密碼等信息。
②試卷信息表:存放試卷的基本信息,主要包括人數(shù)、任課老師、出卷老師等。
③學(xué)生信息表:存放考生的學(xué)號(hào)、姓名以及其所屬的班級(jí)等信息。
④成績(jī)錄入表:試卷總分值及每題分值。
⑤個(gè)人成績(jī)表:每個(gè)學(xué)生的成績(jī)及每題得分。
2.2.2數(shù)據(jù)庫(kù)連接
本系統(tǒng)選用Microsoft SQL Server 2005作為關(guān)系數(shù)據(jù)庫(kù),選用ADO.NET作為數(shù)據(jù)庫(kù)訪問(wèn)技術(shù)。具體數(shù)據(jù)庫(kù)連接語(yǔ)句如下:
2.3系統(tǒng)主要功能實(shí)現(xiàn)
根據(jù)分配的權(quán)限,用戶(hù)輸入正確的用戶(hù)名和密碼進(jìn)入系統(tǒng)[3]。在試卷分析下拉菜單中點(diǎn)擊試卷整體分析,系統(tǒng)則會(huì)對(duì)當(dāng)前選擇的1407班的學(xué)生成績(jī)數(shù)據(jù)進(jìn)行分析,點(diǎn)擊試題分析,則會(huì)對(duì)當(dāng)前選擇的題目進(jìn)行數(shù)據(jù)分析,具體結(jié)果如圖3和圖4所示:
圖3 試卷分析
圖4 試題分析
教師點(diǎn)擊知識(shí)點(diǎn)分布與分值菜單后,則會(huì)以直觀、清晰的界面把一張?jiān)嚲碇懈髦R(shí)點(diǎn)的分值及本班學(xué)生在每個(gè)知識(shí)點(diǎn)上的平均得分及每個(gè)考生在各知識(shí)點(diǎn)上的得分展示出來(lái),具體如圖5所示:
圖5 知識(shí)點(diǎn)分布與分值
2.4主要公式算法實(shí)現(xiàn)
4)區(qū)分度:指試卷對(duì)不同水平考生加以區(qū)分的能力。計(jì)算公式:
2)方差:指每位考生的成績(jī)與平均成績(jī)的差的平方和。計(jì)算公式為:,其中ZH、ZL分別代表高分組(卷面成績(jī)前27%)和低分組(后27%)考生成績(jī)總和,H、L分別代表考生的最高分和最低分,N代表高(低)分組人數(shù)[5]。代碼如下:
5)信度:指試卷的穩(wěn)定性和可靠性程度。即將同一組測(cè)試者反復(fù)測(cè)試同一份試卷,所得結(jié)果一致,那么這份測(cè)驗(yàn)題就具有很高的信度。計(jì)算公式為:,其中k代表試卷的題目數(shù),代表第t道題分?jǐn)?shù)的方差代表考生總分的方差。代碼如下:
6)效度:指測(cè)量試卷的有效性程度,即測(cè)量工具能夠準(zhǔn)確測(cè)出所要測(cè)量事物的程度。計(jì)算公式為:,其中Xi、Yi分別表示i考生在X考卷與Y考卷中的成績(jī),和分別是這兩次考試的平均成績(jī),Sx和Sy分別是這兩次考試成績(jī)的標(biāo)準(zhǔn)差,n是考試人數(shù)。主要代碼如下:
選用灌云中等專(zhuān)業(yè)學(xué)校1407班學(xué)生的計(jì)算機(jī)應(yīng)用基礎(chǔ)期末成績(jī)作為本次實(shí)驗(yàn)的數(shù)據(jù)。在對(duì)各模塊運(yùn)行結(jié)束后,點(diǎn)擊主界面上的“數(shù)據(jù)輸出”菜單,實(shí)現(xiàn)對(duì)本試卷的整體分析,具體如表2所示:
表2 評(píng)價(jià)結(jié)果
從試卷分析結(jié)果可以得出:
1)該試卷的具體題目難度值偏小,這在一定程度上勢(shì)必會(huì)影響整體試卷應(yīng)發(fā)揮的作用。
2)試卷整體難度適中,平均分大致反映了本班學(xué)生的實(shí)際學(xué)習(xí)水平,優(yōu)秀率、及格率符合標(biāo)準(zhǔn)的情況,方差能夠?qū)W(xué)生的離散程度表現(xiàn)出來(lái),這幾個(gè)指標(biāo)也反映了本班學(xué)生的學(xué)習(xí)成績(jī)符合正態(tài)分布,符合標(biāo)準(zhǔn)試卷的大致指標(biāo)標(biāo)準(zhǔn)。但是該試卷的全距有點(diǎn)大,說(shuō)明學(xué)生的水平差距大,同時(shí)也反映了試卷的題目設(shè)置上可能不能滿(mǎn)足所有學(xué)生的需求,或者有部分題目偏離大綱要求,需要改進(jìn)。
3)試卷的區(qū)分度、信度、效度都比較好,與測(cè)驗(yàn)的目的、性質(zhì)相一致,說(shuō)明該試卷整體上是一份符合教學(xué)大綱,題型結(jié)構(gòu)合理、覆蓋面廣的好試卷,能夠很好地區(qū)分出班級(jí)優(yōu)秀生和差生,也能夠保證其測(cè)試的準(zhǔn)確度和穩(wěn)定性。
4)試卷的知識(shí)點(diǎn)分布符合大綱考查要求,覆蓋面也較廣,符合中等院校計(jì)算機(jī)基礎(chǔ)課程的公共課考察要求。從學(xué)生在每個(gè)知識(shí)點(diǎn)的分布情況也可以看出,該試卷是一份不錯(cuò)的試卷,在改進(jìn)的基礎(chǔ)上值得保留,可以納入題庫(kù)。
本文對(duì)系統(tǒng)的開(kāi)發(fā)模型作了詳細(xì)介紹,嚴(yán)格按照瀑布開(kāi)發(fā)模型的方法,初步開(kāi)發(fā)了一個(gè)基于經(jīng)典測(cè)量理論的試卷評(píng)價(jià)系統(tǒng),該系統(tǒng)綜合應(yīng)用了教育測(cè)量理論相關(guān)知識(shí),使試卷評(píng)價(jià)模型的建立更加科學(xué),評(píng)價(jià)結(jié)果更加準(zhǔn)確。同時(shí)利用本校1407班學(xué)生的計(jì)算機(jī)應(yīng)用基礎(chǔ)期末成績(jī)作為本次實(shí)驗(yàn)的數(shù)據(jù),經(jīng)過(guò)測(cè)試,客觀、高效地對(duì)本試卷進(jìn)行了綜合評(píng)價(jià)。
參考文獻(xiàn):
[1]鄭金婷.高校試卷分析系統(tǒng)的研究與開(kāi)發(fā)[D].上海:華東師范大學(xué),2007:1.
[2]于向英.教育測(cè)量與統(tǒng)計(jì)[M].鄭州:鄭州大學(xué)出版社,2004:26-27.
[3]孫瑩.云南文化學(xué)院試卷質(zhì)量網(wǎng)上綜合評(píng)價(jià)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2008:43-44.
[4]董萬(wàn)歸.試卷分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].大理學(xué)院學(xué)報(bào),2009(8):12.
[5]李勇,宋曉霞.通用試卷分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].中國(guó)教育信息化,2008(4):55-56.
Design of Examination Paper Assessment System Based on Classical Test Theory
DING Haixia
(Guanyun Polytechnic School,Lianyungang 222200,China)
Abstract:The traditional way of examination paper evaluation is lack of authenticity and accuracy.Based on the classical measurement theory,this paper combines quantitative analysis with qualitative analysis to develop a professional paper evaluation system.It analyzes the paper and test question by viewing final examination result of computer basic knowledge of class 1407 in Guanyun Polytechnic School,which could reflect students'overall level,analyze students'ability and give suggestions for improving the paper.
Key words:Classical Test Theory;examination paper assessment system;quantitative analysis;qualitative analysis
作者簡(jiǎn)介:丁海霞(1987-),女,助教,碩士,主要研究方向:計(jì)算機(jī)輔助教學(xué)
收稿日期:2015-11-09
中圖分類(lèi)號(hào):TP 311.52
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1672-2434(2016)01-0032-04
常州信息職業(yè)技術(shù)學(xué)院學(xué)報(bào)2016年1期