摘要:考試評價與分析是教學過程中的重要環(huán)節(jié)。在各學校紛紛采用數(shù)字化學習、數(shù)字化考試的背景下,基于數(shù)據(jù)倉庫技術(shù)對考試評價各指標進行了研究。首先研究了考試評價指標,提出了建立試題庫時的知識點權(quán)重算法和試卷信度檢測算法,然后基于數(shù)據(jù)倉庫技術(shù)對考試評價的各指標建立了多維數(shù)據(jù)模型,以便于對考試信息進行挖掘與評價分析。
關(guān)鍵詞:數(shù)字化學習;數(shù)據(jù)倉庫;考試評價;試卷信度
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2013)12-2756-02
當前社會對人才需求的數(shù)量及程度越來越高,高等院校在課程質(zhì)量建設(shè)方面的重視度也在不斷提高,在課程的考試評價方面也隨之逐漸的科學化和智能化。各高校紛紛引入了數(shù)字化學習平臺,通過建立試題庫系統(tǒng),由系統(tǒng)自動進行試卷生成和試卷分析,是教學部門提高考生評價效果的重要手段,也是教學過程中的重要環(huán)節(jié)。在目前各高校招生規(guī)模不斷擴大的情況下,學生考試所產(chǎn)生的的數(shù)據(jù)量也是呈幾何級增長。面對海量的考試數(shù)據(jù),采用合適的數(shù)據(jù)處理技術(shù)就顯得尤為重要。
數(shù)據(jù)倉庫技術(shù)[1]是涉及人工智能、機器學習和數(shù)據(jù)庫等多學科的一個相當活躍的研究領(lǐng)域。隨著技術(shù)發(fā)展,如何更好地將數(shù)據(jù)倉庫技術(shù)應(yīng)用于教育領(lǐng)域,已成為目前教育領(lǐng)域應(yīng)用研究的重點問題[2]。
1 考試評價指標
本文從教學及考試的目的出發(fā),建立的評價指標包括:試卷質(zhì)量分析、試題分析、知識點分析、考生分析[3]。
考試分析是教育測量學的重要內(nèi)容,傳統(tǒng)的考試評價指標,從試題的角度講,有難度、區(qū)分度、覆蓋度等,從試卷的角度講,還有信度、效度等[4]。
在數(shù)字化學習平臺中,學生的考試是通過試題庫隨機抽取試題來進行的,而試題庫的建設(shè)需要組織優(yōu)秀的教師進行,但在編寫試題時每個教師對某個章節(jié)內(nèi)知識點的權(quán)重把握又存在差別,為了使得每次抽取的試題所報含的知識點更加合理,該文對如何確定某個章節(jié)內(nèi)知識點的權(quán)重建立了如下算法:
假如某章節(jié)共有[n]個指標(在此我們將知識點用指標表示),認為最重要的就記為1,認為第二重要的就記為2,……,最不重要的指標記為[n]。每一個指標排在第幾位的順序號數(shù)叫做該指標的秩。把參加編寫試題的所有教師(設(shè)共有[m]位教師)對某個指標給予的秩加起來,所得結(jié)果叫做該指標的秩和,用字母[R]表示。第[j]個指標的秩和用[Rj]來表示。如果用[aj]表示第[j]個指標的權(quán)重,則權(quán)重的計算公式是
[aj=2[m(1+n)-Rj]mn(1+n)] (1)
其中[n]為指標(知識點)個數(shù),[m]為教師人數(shù)。[j=1,2,3,…,n]
為了保障學生考試成績的合理性,該文擬對所產(chǎn)生試卷的信度進行檢測,建立如下試卷信度檢測算法:
假設(shè)收集了[n]位學生的成績,用[x]表示奇數(shù)號題目得分,具體得分是[x1,x2,x3,…,xn];用[y]表示偶數(shù)號題目得分,具體得分是[y1,y2,y3,…,yn]。用[rxy]表示[x]和[y]的相關(guān)系數(shù),用[r]表示信度,當兩部分的總體方差[σ2x]和[σ2y]相同時,則信度計算公式為
[r=2rxy1+rxy] (2)
當兩部分的總體方差[σ2x]和[σ2y]不同時,信度計算公式為
[r=2(1-s2x+s2ys2T)] (3)
式中[s2x]和[s2y]為兩部分的樣本方差,[s2T]為[x]和[y]之和[x+y]的樣本方差([T=x+y])。
[s2x=1n-1[x2-1n(x)2]] (4)
[s2y=1n-1[y2-1n(y)2]] (5)
[s2T=1n-1[T2-1n(T)2]] (6)
2 考試評價數(shù)據(jù)倉庫的構(gòu)建
數(shù)據(jù)倉庫設(shè)計的核心是構(gòu)建多維數(shù)據(jù)模型。多維數(shù)據(jù)模型將數(shù)據(jù)看做數(shù)據(jù)方形式,數(shù)據(jù)方允許以多維對數(shù)據(jù)建模和觀察。它由維和事實定義。一般地,維是透視或關(guān)于一個組織想要記錄的實體。每一個維都有一個表與之相關(guān)聯(lián),該表稱為維表。維表可以由用戶或?qū)<以O(shè)定,或者根據(jù)數(shù)據(jù)分布自動產(chǎn)生和調(diào)整。通常,多維數(shù)據(jù)模型圍繞中心主題組織。該主題用事實表示。事實是數(shù)值度量的,我們可根據(jù)數(shù)據(jù)分析維之間的關(guān)系。事實表包括事實的名稱或度量,以及每個相關(guān)維表的關(guān)鍵詞[5-6]。
目前,多維數(shù)據(jù)模型主要有星型模式和雪花模式兩類[7]。
本文采用星形模式來構(gòu)建多維數(shù)據(jù)模型,以考生分析主題為例,其數(shù)據(jù)模型如圖1所示。
圖1 考生分析主題對應(yīng)的星型模型
3 結(jié)束語
本文是在各學校紛紛建立數(shù)字化學習平臺的大背景下進行研究的。數(shù)字化環(huán)境為考試評價分析提供了大量的數(shù)據(jù)支持,該文提出了建立試題庫時的知識點權(quán)重分配算法和試卷信度檢測算法,以保障所生成試題的合理性和有效性;從教學及考試的目的出發(fā),提出了考試評價的指標,基于數(shù)據(jù)倉庫技術(shù)建立了多維數(shù)據(jù)模型,決策者可以使用多維分析的方法從多個角度、多個層次對數(shù)據(jù)進行挖掘和分析,以獲取有效的考試評價信息。
參考文獻:
[1] Inmon W H. Building the data warehouse[M].2nd ed.JohnWiley,1996:50-93.
[2] 陳京民.數(shù)據(jù)倉庫原理、設(shè)計與應(yīng)用[M].北京:中國水利水電出版社,2004:150-200.
[3] 蔡敏.網(wǎng)絡(luò)教學的交互性及其評價指標研究[J].電化教育研究,2007.11:40-44..
[4] 魏華忠,周仁來,馬健生.教育統(tǒng)計與測量[M].遼寧師范大學出版社,2003.
[5] 康博創(chuàng)作室.SQL Server 2000數(shù)據(jù)倉庫設(shè)計和使用指南[M].北京:清華大學出版社,2001:100-150.
[6] 陳啟買,賀超波,劉 海.基于OLAP的高校教學協(xié)同決策[J].計算機應(yīng)用,2009(1)
[7] 林杰斌,劉明德,陳湘.數(shù)據(jù)挖掘與OLAP理論與實物[M].北京:清華大學出版社,2003:83-200.