摘要:就試題庫建設過程中的命題原則、試題設計方法、試題質(zhì)量控制、試題評價等關鍵問題進行了詳細的分析和研究,提出了一系列具有可行和可操作性的措施,并以《計算機操作系統(tǒng)》試題庫為例進行實踐,對試題庫建設質(zhì)量控制和評價具有一定借鑒意義。
關鍵詞:試題庫;質(zhì)量控制;評價技術
面對21世紀社會對人材的高素質(zhì)要求,大學課程教育也面臨著新的挑戰(zhàn)和機遇。突飛猛進的計算機技術也為改善各門課程教學手段、方法及考試方法提供了有利的工具。全國高校都在利用現(xiàn)代化教學手段對教學各方面進行大膽的改革和探索。作為大學課程教育的重要環(huán)節(jié)——考試方法已經(jīng)成為教學改革的重點,也成為提高教學效率的重要突破口??茖W建立試題庫,自動抽題組卷,實現(xiàn)考教分離成為解決這個問題根本途徑和有效手段。它可以促進教師根據(jù)人才培養(yǎng)目標的要求,嚴格按照教學大綱授課,改善教學質(zhì)量;可以科學檢查學生對本課程的基本知識、基本理論和基本技能掌握程度,很大程度激發(fā)學生的學習興趣;可以為同一門課程教學質(zhì)量評價提供有利條件,能更好的激發(fā)教師的教學熱忱,增強愛崗敬業(yè)的熱情。
一、試題設計的原則和方法
1.試題設計原則
(1)目的性原則:《計算機操作系統(tǒng)》將全部試題作為一個整體,應該符合考試的目的要求,即通過解答或完成這些題目,應該能夠測出預定需要測定的知識和能力水平。試題內(nèi)容、形式、難度等均應服從于考試的目的;(2)科學性原則:《計算機操作系統(tǒng)》的試題表述要科學準確??陀^性試題的答案應該確切唯一,研究型、討論型題目研討方向應該清晰,即學生可以使用不同的方法,但要解決的應該是同一個問題;非探討性問題所給條件要做到既不多余也不欠缺;(3)考試與教學要求相一致原則:《計算機操作系統(tǒng)》的結業(yè)考試,作為目標性檢測考試,其考核內(nèi)容及試題難度應該與教學大綱要求為準,教學的重點和難點也是考試的重點。不能怕學生“押題”而回避教學重點??碱}設計的形式和難度要求可以在教學大綱范圍之內(nèi)根據(jù)學生的學習情況稍微變動;(4)知識與能力并重原則:《計算機操作系統(tǒng)》作為計算機類專業(yè)的專業(yè)基礎課程,是學生將來從事計算機行業(yè)必備的基礎知識。不僅要考核學生對知識的掌握程度,更應該考核學生對所學知識的理解程度和應用能力。在試題設計時不能忽略能力的測試,否則無法有效實現(xiàn)教學目標。
2.試題設計方法
《計算機操作系統(tǒng)》試題庫中包含單項選擇題、多項選擇題、填空題、判斷題、簡答題、算法分析題等六種題型。在試題設計之前先根據(jù)教學目標和教學大綱以及考試目的,設計不同難度要求的試題,供以后抽題組卷時選用。(1)選擇題的編寫應注意:每一選擇題的選擇項數(shù)應保持一致,單選題以4 項,多選題可設4 項;選擇支的位置安排要具有邏輯性,正確支的位置要具有隨機性和相對均衡性;正確支與干擾支要具有相似性,干擾支與題干的聯(lián)系要與正確支與題干的聯(lián)系同樣密切,不能生搬硬湊,人為臆造。(2)填空題的編寫應注意:填充的內(nèi)容應該是關鍵字詞,并要求與上下文有密切聯(lián)系;一道填空題中不宜有過多、過長的空白,而且空白處所能填充的內(nèi)容應該是惟一的;如果填充的內(nèi)容是計算的結果,當為概念、法則等常規(guī)運算時,則計算不宜復雜。若是根據(jù)某些性質(zhì)進行計算,則所用性質(zhì)應該是重要的或簡單的,不宜過分要求解題技巧,不能將綜合題變成填空題。(3)判斷題的編寫應注意:每個題面最好只包含一個重要概念,盡量避免兩個或多個概念同時出現(xiàn);試題措辭必須含義清晰,語句簡練,避免用較長的復合語句命題;盡量不用否定式語句,尤其不要用雙重否定語句故意制造難點;不要用“可能”、“有時”、“通?!钡取疤丶酉薅ㄔ~”。(4)算法題的編寫人們比較熟悉,這里只強調(diào)以下三點:為考核學生對概念、法則的理解而編寫的計算題,主要是考查學生對方法而不是對技巧的掌握,因此計算量不要過大,數(shù)字不要復雜;要注意一題多解,如果一個題目有多種解法,且?guī)追N解法的難度差異較大,則可注明要求學生使用的解題方法,以避免學生回避所要考核的知識點;盡量少出為計算而計算的題目,要把計算和實際應用結合起來。
二、試題質(zhì)量評價指標
1.試題難度
試題的記分方法分兩種,客觀性題目在評分時,只有得分和不得分兩種情況,稱為二分法,而主觀性題目學生可能得到不超過題目分值的任何分數(shù),稱為非二分法。兩種記分方法對應的難度計算方法也不相同,他們的計算方法這里不詳細列出[4]。從計算公式可以知道, 難度值P 的最小值為0,表示該題不難;難度值P 的最大值為1 ,表示該題很難,無人做對。難度過大或過小, 都不能區(qū)分學生的學習水平。一般情況下,難度在0.3 以下為容易題,0.3~0.6 的為中等題,0.6 以上的為難題。由于難度與區(qū)分度有關, 難度越接近0.5,區(qū)分度越高。例如,在期末考試中,為了期望平均成績?yōu)?0~75 分,適當調(diào)整易、中、難題的比例,設計分值比為5:4:1,且三種試題的平均難度分別為0.19、0.35、0.16,這樣可期望平均難度為0.295。試題的難度與考試的性質(zhì)有關,一般說來,作為教學檢查性題目,其難度不宜過大,以0.2~0.4 為宜,而作為選拔性考試的題目,其難度在0.4~0.6 比較適合。
2.區(qū)分度
區(qū)分度是反映試題對學生實際學習水平區(qū)分能力的指標。區(qū)分度好的試題,學習好的學生得分高,學習差的學生得分低;而區(qū)分度低的試題,從得分上不能判斷出學生學習的實際情況。一般以試題得分與試卷得分的相關系數(shù)作為區(qū)分度。相關程度越高,區(qū)分度越好。正式考試試題的區(qū)分度應該在0.3 以上,好的試題應該達到0.4 以上。對于試題區(qū)分度因為區(qū)分度與標準差成正比, 所以要使區(qū)分度達到0.3 以上的良好水平,成績標準差應大于12 分,但這會使不及格的人數(shù)增多。一般期末考試成績標準差應控制在10 分,平均區(qū)分度以0.25 為宜。
3.信度
在教學評價中,考試結果的可靠性稱為信度,就是同一個測驗對同一組被試先后實施兩次, 其測驗結果的一致性的程度, 所以信度是反映考試結果穩(wěn)定性的一個指標。目標參考性測驗信度的估計, 目標參考性試驗由許多所要考查的目標組成, 而每個目標又由許多測題組成。在估計這種測驗的信度時,可將每個目標的測題視為一個測題組,用信度的測試方法,如再測法、復分法、分半法等來估計每個測題組的信度, 然后用各測題組的復本信度系數(shù)來表示整個測驗的信度。在估計測題的信度時采用內(nèi)在一致性信度。信度的最大值規(guī)定為1.0 ,一般標準化考試要求信度達到0.90??荚嚨睦硐虢Y果是學生的考試分數(shù)與其真實水平(“理想分數(shù)”) 完全相同,這時考試的信度最大。
4.效度
效度是指一次考試在多大程度上測量了需要測量的東西。計算效度一般采用“效標分數(shù)”法,即把學生有關考試成績和有經(jīng)驗而且了解學生的教師對學生的評定等作為效度的標準(效標) ,把考試分數(shù)和效標分數(shù)之間的相關系數(shù)作為考試的效度值。如果測試的結果與學生平時學習情況基本一致,這樣的考試有較高的效度。測試過程中,效度的最大值為1,表示測試結果符合測試目的,最小值為0, 一般測試的效度應在0.4~0.7 之間為宜。
三、試卷質(zhì)量統(tǒng)計分析與評價
試卷質(zhì)量統(tǒng)計分析與評價是考試管理中一項重要工作,也是我們評價考試質(zhì)量的最重要、最有效的方法。它能夠為改進考試設計工作,使之更符合考生實際提供重要信息;也能夠為改進命題工作提供大量信息,提高試題和試卷的編制質(zhì)量;也是完善題庫,提高題庫試題質(zhì)量的重要途徑。試卷質(zhì)量統(tǒng)計分析與評價主要包括:考試成績分布的統(tǒng)計估計、考試的信度分析、考試的效度分析、試題的難度分、試題的區(qū)分度分析