張滿滿
摘要:隨著計算機技術(shù)的不斷發(fā)展和進步,計算機自適應測試系統(tǒng)開始在諸多領域彰顯出重要的應用價值,測試是教育評價中被廣泛采用的一種重要方法,傳統(tǒng)的測試多是借助于紙筆完成,本文基于此,首先分析了計算機自適應測試的基本要素,然后重點探討了計算機自適應測試中的若干關(guān)鍵技術(shù),望對相關(guān)人員帶來一定的參考價值。
關(guān)鍵詞:計算機自適應測試 基本要素 關(guān)鍵技術(shù)
中圖分類號:TP391.6文獻標識碼:A文章編號:1007-9416(2015)11-0000-00
隨著近十幾年來計算機技術(shù)和網(wǎng)絡技術(shù)的成熟,測試也出現(xiàn)了新的實現(xiàn)方式,即利用計算機作為測試工具,以網(wǎng)絡作為測試平臺的計算機自適應測試(CAT)。大量的理論和實踐均證明,這種測試方法能夠有效解決傳統(tǒng)測試中存在的諸多問題,包括過于簡單或是過于困難的問題耽誤被測試人員的測試時間,測試人員和測試題目的隨機性使得測試結(jié)果分析的可靠性下降等等?;诖耍耙蛉耸y”的計算機自適應測試具有重要的研究價值。
1 計算機自適應測試的基本要素分析
不考慮測試系統(tǒng)的差異性,整個計算機自適應測試的工作流程可概括如下。首先是隨機從數(shù)據(jù)庫中對測試項目進行選擇并展示給測試對象,測試對象作出反應后,計算機再根據(jù)其反應情況得出能力水平的預估值,然后根據(jù)所得到的預估值繼續(xù)從數(shù)據(jù)庫中選擇與測試對象能力相匹配的測試項目。當計算機判斷測試所得結(jié)果滿足測試程序的終止標準后,測試完成。根據(jù)其工作流程,可得出計算機自適應測試的基本要素包括以下幾點。
1.1 數(shù)據(jù)庫/題庫
數(shù)據(jù)庫又稱作項目池或是題庫,其是整個計算機自適應測試中的核心組成成分,題庫的覆蓋范圍越廣,能力測試水平越強,測試所需要的時間復雜度和空間復雜度也就越低,整個系統(tǒng)也就越有利于實現(xiàn)。
1.2 項目反應模型
項目反應模型用于描述測試對象對測試項目所作出的反映。當使用相同的項目反應模型時,工具和數(shù)據(jù)庫對于測試效果的影響應當小于某一特定值。
1.3 項目選擇模型
項目選擇模型主要用于在計算機得到來自項目反映模型的反饋后,根據(jù)測試對象當前階段被測試出的水平來選擇合適的測試項目。合適的項目選擇模型能夠有效保障測試的精度和準確性,但過于復雜的項目選擇模型可以會需要花費更多的測試時間。如何在兩者之間取得平衡,則于整個測試算法的選擇和優(yōu)化息息相關(guān)。
1.4 測試終止規(guī)則
測試終止規(guī)則類似于匯編語言中跳出某一循環(huán)的判斷條件,在計算機自適應測試中,測試終止的規(guī)則往往基于不同的測試目的所建立,例如大眾化普遍性測試、娛樂性測試多采用較為簡單的終止規(guī)則,但擇優(yōu)式考試、精英化考試則多采用較為精確的測試終止規(guī)則,以期望所得出的測試結(jié)果更為精確。
2 計算機自適應測試若干關(guān)鍵技術(shù)研究
2.1 題庫構(gòu)建技術(shù)
顧名思義,題庫構(gòu)建技術(shù)即是針對計算機自適應測試中數(shù)據(jù)庫/題庫的所建立的,其包括題庫的設計組織和項目參數(shù)的確定兩大方面。在題庫的設計和組織上,現(xiàn)階段廣泛采用的技術(shù)是基于課程結(jié)構(gòu)的架構(gòu)技術(shù),其優(yōu)勢在于操作簡單,成本低廉,可行性強。但其缺陷同樣較為明顯,例如架構(gòu)過程中,技術(shù)人員往往缺乏對不熟悉領域內(nèi)知識結(jié)構(gòu)較為陌生,可能會出現(xiàn)項目結(jié)構(gòu)難以與知識結(jié)構(gòu)一一對應的情況產(chǎn)生。基于此,現(xiàn)階段題庫設計正在向著“以本體技術(shù)構(gòu)建領域本體,再輔以項目與知識點的合理分配”的趨勢不斷發(fā)展,通過兩者結(jié)合提升題庫設計的覆蓋面。而在項目參數(shù)的確定方面,題庫構(gòu)建技術(shù)對其有著極高的精確性要求,考慮到理論與實踐存在的差異,題庫構(gòu)建的初期被賦值的初始設置參數(shù)往往難以與實際運行情況相匹配,這就需要相關(guān)人員隨著整個測試工作的進行不斷對相關(guān)參數(shù)進行二次修改及維護,以解決專家法誤差大和IRT理論模型可行性差的重要難題。
2.2 項目選擇技術(shù)
項目選擇技術(shù)的關(guān)鍵在于項目信息量的確定以保障測試的精確性和有效性、項目曝光率的控制以保障測試系統(tǒng)的保密性、項目選擇速度、內(nèi)容覆蓋面等等。對于項目信息量的計算與確定,實際開發(fā)過程中往往需要對整個題庫進行掃描和讀取,然后取項目的總信息量,因此提升項目信息量的計算速度是極其重要的。而在所開發(fā)的計算機自適應技術(shù)正式投入商用或民用領域后,考慮到系統(tǒng)的偽隨機性,故項目曝光不均可能會對題庫的有效利用以及測試的保密性產(chǎn)生一定的影響,故需要利用項目曝光控制技術(shù)來對系統(tǒng)的安全性進行控制,即通過降低高區(qū)分度項目的使用率,提升低區(qū)分度項目的使用率來延長整個系統(tǒng)的使用壽命。除此以外,常使用的技術(shù)還包括內(nèi)容平衡處理技術(shù),題干曝光控制技術(shù)等等,這些技術(shù)對計算機自適應測試技術(shù)在不同領域的應用有著重要的意義。
2.3 能力評估技術(shù)
在測試對象對計算機所展示的題目做出選擇后,計算機需要將所獲得的反饋送入能力評估技術(shù)的核心處理器中,同時結(jié)合項目選擇技術(shù)做出對測試對象能力的合適評估,若測試此時未滿足測試終止條件,所得結(jié)果還將會作為新的能力水平值來選擇下一道測試項目。因此,能力評估技術(shù)的實現(xiàn)關(guān)鍵在于測試對象初始能力的設置以及測試過程中對測試對象能力的動態(tài)估計?,F(xiàn)階段,測試對象初始能力的設置主要是基于定性預測技術(shù)所實現(xiàn)的,即測試管理人員基于測試對象的綜合素質(zhì),依照自身的經(jīng)驗判斷能力和邏輯推理能力將初始條件輸入進測試系統(tǒng)中。而測試過程中對測試對象能力的動態(tài)估計則是基于大數(shù)據(jù)分析下的動態(tài)預測技術(shù)所實現(xiàn)的。
2.4 測試終止技術(shù)
測試終止技術(shù)自身是較為簡單的,以匯編語言為例,常使用的測試終止函數(shù)包括atexit()、switch-break、free等等。但測試終止技術(shù)的難點在于對退出測試的條件進行判斷和篩選,其往往需要在考慮到被試的估計精度以及題庫中項目的使用情況的基礎上,盡可能降低測試時間,以提升使用效率。因此,測試終止技術(shù)往往需要對多種因素進行綜合考慮,才可以確保測試的有效性。
3 結(jié)語
在現(xiàn)階段人才選拔和相關(guān)的能力測試領域當中,計算機自適應測試是一種集可行性、經(jīng)濟性、可靠性于一身的測試技術(shù),其不僅能夠“因人施測”,針對不同測試對象的特點選擇更具有代表性的測試項目,而且還能在測試過程中不斷對測試者的能力進行動態(tài)評估,從而取得更精確的測量結(jié)果。因此,相關(guān)人員應當立足于此,對計算機自適應測試中的若干關(guān)鍵技術(shù)進行研究和完善,以期望其能夠達到更優(yōu)秀的測試結(jié)果。
參考文獻
[1] 龔文斌.計算機自適應測試技術(shù)研究[D].貴州大學,2013.
[2] 尹華.基于計算機自適應測試的胃痞患者報告結(jié)局量表研制[J].價值工程,2013(18):38-39.
[3] 孟科紫.計算機自適應測驗的測試流程與測試技術(shù)[R].創(chuàng)新與應用,2014(3).
數(shù)字技術(shù)與應用2015年11期