国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高校試卷分析研究的內(nèi)容分析

2011-12-31 00:00:00趙永華李海櫻
考試周刊 2011年87期


  摘 要: 作者利用內(nèi)容分析法,對公開發(fā)表的期刊上與高校試卷分析相關(guān)的論文,從論文作者所在院校類別、學(xué)科背景、研究層次與內(nèi)容、所發(fā)表期刊級別四個維度進行分析。結(jié)果表明:對高校試卷分析的關(guān)注主要來自醫(yī)學(xué)院校、師范院校和綜合性大學(xué),主要內(nèi)容研究包括經(jīng)典測驗理論的研究及其在各學(xué)科的考試分析應(yīng)用,以及考試分析系統(tǒng)軟件的開發(fā)。
  關(guān)鍵詞: 高校試卷分析 內(nèi)容分析 研究層次與內(nèi)容
  
  一、引言
  近年來,高校教育教學(xué)質(zhì)量受到了社會各界的廣泛關(guān)注。學(xué)校層面,為了確保達到教學(xué)目標,教師應(yīng)能借助試卷分析來確定學(xué)生學(xué)習(xí)和發(fā)展的狀態(tài),診斷教學(xué)中存在的問題,為正確的教學(xué)決策提供參考。
  隨著學(xué)生學(xué)業(yè)評價的目標從“對學(xué)習(xí)”向“為了學(xué)習(xí)”[1]的轉(zhuǎn)移,試卷分析受到越來越多的關(guān)注。黃穎等人2005年對試卷分析的應(yīng)用實踐狀況做了研究[2],主要涉及我國教育測量學(xué)研究的沿革、試卷分析的內(nèi)容、醫(yī)學(xué)院校試卷分析的實踐、試卷分析系統(tǒng)開發(fā)的狀況。本文借助內(nèi)容分析法,對國內(nèi)公開發(fā)表的期刊上高校試卷分析的相關(guān)論文進行分析,從論文作者所在院校類別、學(xué)科背景、研究層次與內(nèi)容、所發(fā)表期刊級別四個維度,描述高校試卷分析的研究現(xiàn)狀,為進一步的研究提供參考。
  二、研究過程
  1.樣本來源
  為了了解高校試卷分析的研究特點、研究熱點和實踐領(lǐng)域,本研究以中國知網(wǎng)收錄的與高校試卷分析相關(guān)的論文為研究對象。從2005年1月到2011年8月,以關(guān)鍵字集{“試卷”,“考試”,“成績”}和{“分析”,“評價”,“信度”,“效度”,“難度”,“區(qū)分度”}的組合,共檢索到論文581篇,從中隨機選取100篇作2.類目系統(tǒng)的建立
  根據(jù)所確定的論文樣本,結(jié)合前人的相關(guān)研究,確定了初步的類目系統(tǒng)。隨機挑選部分樣本進行小規(guī)模測試和修改之后,向相關(guān)領(lǐng)域?qū)<艺髟円庖姡薷?、測試之后形成了本內(nèi)容分析研究的類目系統(tǒng),如表2所示。
  3.內(nèi)容評判及數(shù)據(jù)統(tǒng)計
  我們仔細閱讀每一篇論文,根據(jù)類目系統(tǒng)從四個維度對每一篇論文進行歸類。對于涉及多個方面的論文,按其主要研究方面進行歸類。
  歸類結(jié)果數(shù)據(jù)借助Excel及SPSS進行數(shù)據(jù)統(tǒng)計及圖表生成,得出分析結(jié)論。
  三、內(nèi)容分析
  1.基本信息
  100篇論文樣本中,以理論建設(shè)與綜述和應(yīng)用實例層次的研究居多,各占37%;設(shè)計開發(fā)研究類占26%。
  2.研究層次與內(nèi)容分析
vM67hcP9LdC7bn0kA0HQABBdFdR0NIMhAshY9fxBYiA= ?。?)理論建設(shè)與綜述層次
  37篇理論建設(shè)與綜述類論文中,主要涉及:(a)考試方式、制度和管理改進,(b)高校試卷分析的方法綜述,(c)試卷分析指標的改進,(d)利用其他學(xué)科的方法改進評價方法等方面。其中,a類占37.8%,主張應(yīng)用多元評價、針對學(xué)生個性的評價,對網(wǎng)絡(luò)協(xié)作考試的構(gòu)想,試卷分析的反饋信息利用現(xiàn)狀分析,音樂、體育等課程考核體系的構(gòu)建,以及國外考試制度、明代科舉“策”試題的啟示,等等;b類占29.7%,主要涉及經(jīng)典與現(xiàn)代教育測量理論的對比,教育評價的概念,國外及我國的實踐,試卷分析內(nèi)容、指標及評估公式,等等;c類占16.2%,討論了信度指標及口語考試中信、效度[3]的問題,以及標準參照考試的評價標準,等等;d類占16.2%,研究了用貝葉斯網(wǎng)絡(luò)[4]、關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘[5]、模糊綜合評價法分析試卷[6]、六西格瑪方法[7]、評價試卷質(zhì)量的調(diào)優(yōu)函數(shù)[8]等方法改進試卷評價,也有研究涉及試卷分析系統(tǒng)的加密問題。
 ?。?)設(shè)計開發(fā)層次
  26篇設(shè)計開發(fā)類論文中提及的高校試卷分析系統(tǒng)近一半為單機版,反映出試卷分析的相關(guān)信息的共享程度較低,從而影響了信息的進一步利用。其中,系統(tǒng)結(jié)構(gòu)方面,42.3%的研究所開發(fā)的試卷分析軟件為單機版的,34.6%為網(wǎng)絡(luò)版的,其余未指明系統(tǒng)結(jié)構(gòu);系統(tǒng)功能方面,69.2%研究開發(fā)了專用的試卷分析軟件,其余將試卷分析作為題庫管理系統(tǒng)的一個子系統(tǒng)來實現(xiàn)。所實現(xiàn)的功能主要是對反映試卷質(zhì)量的指標的統(tǒng)計計算,對教學(xué)目標與學(xué)生學(xué)習(xí)狀態(tài)之間差距的診斷關(guān)注較少,因而難以有效地支持教師教學(xué)過程中的決策。
 ?。?)應(yīng)用實例層次
  37篇應(yīng)用實例類論文中,多數(shù)研究利用SPSS、Excel等通用數(shù)據(jù)分析工具,從成績分布、試卷質(zhì)量、試題質(zhì)量等層面,對不同科目單一課程進行分析。分析工具方面,27.0%使用SPSS或SAS作為分析工具,21.6%使用專門的試卷分析軟件,13.5%以Excel作為分析工具,其余未指明分析工具,從中可以看出專用試卷分析軟件所占份額不大,影響了試卷分析在高校的普遍開展;分析的樣本量方面,59.5%分析單一課程大樣本數(shù)據(jù),35.1%對單一課程小樣本數(shù)據(jù)進行分析,其余對醫(yī)學(xué)實踐課程中多科目統(tǒng)一分析。由此可見,試卷分析的結(jié)果主要來自單一課程。然而高校的現(xiàn)實是課程之間相對獨立,造成單門課程的試卷分析結(jié)果被重用的可能性很小,因而也影響了試卷分析在高校的普遍開展。
  大部分應(yīng)用實例類研究均涉及試卷質(zhì)量四度的分析,并提出了相應(yīng)的可接受范圍。其中:
  67.6%的研究分析了試題難度指標,大部分利用通過率(或正答率)統(tǒng)計試題難度P,部分研究涉及選擇題消除猜測影響的問題。這類研究將試題難度可接受標準分為5級或3級,考慮了整卷平均難度及選拔性考試與校內(nèi)學(xué)業(yè)考試難度評價標準的不同,并主張試卷要有合理的難度比例。
  64.9%的研究分析了試題區(qū)分度,主要采用極端分組法計算鑒別指數(shù)D,部分研究計算試題得分與試卷總分的皮爾遜(Pearson)相關(guān)系數(shù)。這類研究將試題區(qū)分度可接受標準分為4級、3級或2級不等,大部分選用美國測量學(xué)家伊貝爾(Ebel,L.)提出的鑒別指數(shù)標準[9]。部分研究分題型來統(tǒng)計難度和區(qū)分度,并結(jié)合難度與區(qū)分度來評價試題質(zhì)量。
  51.3%的研究討論了信度指標的統(tǒng)計,主要采用克龍巴赫(Cronbach)α系數(shù)或KR21公式統(tǒng)計同質(zhì)性信度。這類研究將信度指標可接受標準分成5級、3級、2級不等,討論了客觀試題、主觀試題及教師自編試題的信度可接受標準。
  27.0%的研究分析了試卷效度,認為內(nèi)容效度一般通過學(xué)科專家對照測驗雙向細目表與試卷,通過邏輯分析法得到。這類研究一般通過計算考試分數(shù)與能體現(xiàn)考試分數(shù)目的的效標分數(shù)之間的相關(guān)系數(shù)得到效標關(guān)聯(lián)效度,將效標關(guān)聯(lián)效度的可接受標準分為3級或2級,或者進行顯著性檢驗。
  43.2%的研究分析了試卷的題型及分值分布。
  大部分應(yīng)用實例類研究都分析了總體成績分布,給出了分數(shù)段頻數(shù)分布,少量研究對總體成績分布進行峰度、偏度或正態(tài)性檢驗。
  大部分實例類研究用定量數(shù)據(jù)描述分析結(jié)果,輔以定性說明;近三分之一的研究以圖表描述分析結(jié)果,如分數(shù)段頻數(shù)分布圖或分布表,結(jié)合難度、區(qū)分度的試題質(zhì)量評價圖等。
  部分實例類研究從教學(xué)改進、促進學(xué)習(xí)、試題及題庫改進、教學(xué)與管理等方面給出了較為主觀的、表層的建議[10]。
  3.影響高校試卷分析研究的因素
  通常,不同類型的高校對試卷分析有不同的規(guī)定和要求,這可能會影響到研究者對研究內(nèi)容的選取。對作者單位和研究層次與內(nèi)容進行x2檢驗的結(jié)果為:x2=28.084,df=8,Sig.=0.000,差異非常顯著,即不同類型院校的研究者所做的研究分布非常不一樣。理論建設(shè)與綜述層次的研究者主要來自師范院校,也有一部分來自綜合性大學(xué),這表明師范院校對于考試過程有較多的規(guī)定和要求,并有較好的教育測量研究基礎(chǔ);設(shè)計開發(fā)層次的研究者主要來自工科院校和綜合性大學(xué);而應(yīng)用實例層次的研究者則主要來自醫(yī)學(xué)院校,表明醫(yī)學(xué)類院校普遍重視對試卷的分析。另外黃穎等人2005年的研究表明醫(yī)學(xué)院校因?qū)I(yè)的特殊性對試卷分析開展較普遍,并形成了一定的規(guī)模[2]。
  
  研究者所具有的學(xué)科背景也會影響研究內(nèi)容和角度的選擇。對作者學(xué)科背景和研究層次與內(nèi)容進行x2檢驗的結(jié)果為:x2=55.497,df=10,Sig.=0.000,差異非常顯著,即具有不同學(xué)科背景的研究者所做的研究分布非常不一樣。理論建設(shè)與綜述層次的研究者主要具有教育學(xué)背景,也有一部分具有工學(xué)背景和文學(xué)背景;設(shè)計開發(fā)層次的研究者主要具有工科背景,也有一部分具有教育學(xué)背景。所選樣本中,具有文學(xué)背景的研究者沒有發(fā)表設(shè)計開發(fā)層次的論文;應(yīng)用實例層次的研究者則主要具有醫(yī)學(xué)背景,文學(xué)背景的研究者也占一定比例。
  對期刊級別和研究層次與內(nèi)容進行x2檢驗的結(jié)果為:x2=11.908,df=4,Sig.=0.018,差異顯著,即不同影響面的刊物上所發(fā)表論文的研究內(nèi)容分布不一樣。一般刊物上發(fā)表的論文以應(yīng)用實例層次居多,理論建設(shè)與綜述層次也占比較大的份額;核心期刊上發(fā)表的主要是理論建設(shè)與綜述層次的論文;而碩士論文則主要從理論建設(shè)與綜述層次和設(shè)計開發(fā)層次選題。
  從四個分析維度看,對目前高校試卷分析的研究表現(xiàn)出一定的特征。100篇論文樣本中,對來自醫(yī)學(xué)院校,具有醫(yī)學(xué)背景的研究者在一般期刊上發(fā)表應(yīng)用實例類高校試卷分析論文的支持度為18%;對來自師范院校,具有教育學(xué)背景的研究者在一般期刊上發(fā)表理論建設(shè)與綜述類高校試卷分析論文的支持度為9%。以上兩種關(guān)聯(lián)關(guān)系如圖1中實線箭頭所示;對其余關(guān)聯(lián)關(guān)系的支持度均為3%,如圖1中虛線箭頭所示。
  四、研究中存在的問題與建議
  理論建設(shè)方面,目前高校試卷分析研究中對校內(nèi)考試的特點重視不夠。這一方面是受高考等高利害的傳統(tǒng)鑒別性考試的影響,另一方面是因為目前高校的課程考試主要是終結(jié)性考試,以及分析工具的可用性不夠、題庫系統(tǒng)沒有普遍建立等因素也影響和限制了對高校試卷分析的研究。另外,由于分數(shù)等值問題的限制,大部分分析局限于單一課程,對學(xué)校在中觀層次的決策中利用試卷分析信息造成困難。要改變這一現(xiàn)狀,需要轉(zhuǎn)變課程評價觀念,從關(guān)注考試的價值判斷轉(zhuǎn)向促進教師教和學(xué)生學(xué),更多地關(guān)注考試的診斷與促進功能;需要將評價嵌入到教學(xué)過程,大量加強以診斷性、形成性考試為主的課堂測驗,從單一考試轉(zhuǎn)向健全的評價體系;需要研究如何通過試卷分析從測驗中獲得更多的關(guān)于教學(xué)目標和學(xué)生學(xué)習(xí)現(xiàn)狀之間差距的信息,以便有效地支持教師教學(xué)決策。
  設(shè)計開發(fā)方面,高校試卷分析專用軟件的可用性不夠;分析得到的結(jié)果相對孤立,信息可重用性不高。要改變這一現(xiàn)狀,需要在相關(guān)理論的指導(dǎo)下,增強分析工具的可用性、信息的可重用性,建立完善的、具備試卷分析功能的題庫管理系統(tǒng),為教師提供足夠的支持發(fā)展性評價的資源和工具,以確保在教學(xué)和評價環(huán)節(jié)的循環(huán)中信息是互補的、充足的、流暢的。
  應(yīng)用分析方面,目前的應(yīng)用主要是針對單一課程試卷的分析,信息利用率不高,并且沒有廣泛開展試卷分析,因而未能為教學(xué)過程提供足夠的反饋控制信息。要改變這一現(xiàn)狀,一方面離不開相關(guān)試卷分析觀念的轉(zhuǎn)變、相關(guān)管理制度的確立及教師自身試卷分析素質(zhì)的提高,另一方面也離不開相關(guān)理論及易于使用的專用試卷分析軟件的支持。
  五、結(jié)論
  1.高校試卷分析的研究特征
  對高校試卷分析的關(guān)注主要來自醫(yī)學(xué)院校、師范院校和綜合性大學(xué),研究人員一般具有教育學(xué)或計算機科學(xué)與技術(shù)學(xué)科背景,以及相應(yīng)考試課程對應(yīng)的學(xué)科背景。該領(lǐng)域的研究論文主要發(fā)表在一般刊物上。
  2.高校試卷分析的研究內(nèi)容
  從研究內(nèi)容上看,主要是經(jīng)典測驗理論的研究及其在各學(xué)科的考試分析應(yīng)用,以及考試分析系統(tǒng)軟件的開發(fā)。
  理論建設(shè)與綜述層次的研究主要關(guān)注考試方式、制度和管理改進,高校試卷分析的方法綜述,試卷分析指標的改進,利用其他學(xué)科的方法改進評價方法等問題。
  設(shè)計開發(fā)層次的研究采用程序設(shè)計語言作為工具,或?qū)νㄓ脭?shù)據(jù)分析軟件進行二次開發(fā),實現(xiàn)單機版或網(wǎng)絡(luò)版的專用試卷分析系統(tǒng)軟件或題庫管理系統(tǒng)。
  應(yīng)用實例層次的研究應(yīng)用通用數(shù)據(jù)分析軟件或?qū)iT的試卷分析軟件,主要分析單一課程的試卷,大部分研究均涉及試卷質(zhì)量四度的分析,并提出了相應(yīng)可接受范圍,均分析了總體成績分布。大部分研究用定量方式描述分析結(jié)果,輔以定性分析,并以圖表描述分析結(jié)果。部分應(yīng)用實例類研究提及分析結(jié)果的利用,提出較主觀的、表層的改進建議。
  
  參考文獻:
 ?。?]崔允漷.基于標準的學(xué)生學(xué)業(yè)成就評價[M].上海:華東師范大學(xué)出版社,2008:1-3.
 ?。?]黃穎,林端宜.試卷分析研究現(xiàn)狀綜述[J].西北醫(yī)學(xué)教育,2005,(1):39-40.
 ?。?]龐繼賢,陳嬋.外語口語考試的效度和信度研究述評[J].外語與外語教學(xué),2005,(7):19-23.
  [4]王娜.基于貝葉斯網(wǎng)絡(luò)的試卷分析[MA].天津大學(xué),2007:24-31.
  [5]李雄飛.試卷分析系統(tǒng)的研究與設(shè)計[MA].吉林大學(xué),2006:19-21.
  [6]王慶民.考試分析系統(tǒng)設(shè)計與實現(xiàn)[MA].山東科技大學(xué),2005:42-44.
 ?。?]包美芳.考試質(zhì)量分析中應(yīng)用六西格瑪方法初探[J].教育探索,2008,(7):90-91.
 ?。?]王美華,楊德貴.試卷評價系統(tǒng)算法設(shè)計與分析[J].昆明理工大學(xué)學(xué)報(理工版),2006,(2):37-40.
  [9]張敏強.教育測量學(xué)[M].北京:人民教育出版社,2005:90-91.
 ?。?0]張芊,汪利,丁國永.高校課程試卷分析的管理創(chuàng)新[J].中國大學(xué)教學(xué),2005,(9):39-42.

嫩江县| 依安县| 宁河县| 敖汉旗| 大庆市| 青铜峡市| 昌黎县| 廊坊市| 周宁县| 阿克陶县| 阳春市| 清徐县| 大方县| 广灵县| 玉环县| 方城县| 霍邱县| 涿鹿县| 外汇| 积石山| 临潭县| 白沙| 天全县| 雷波县| 鹰潭市| 呼图壁县| 中方县| 永年县| 阜南县| 甘德县| 梁山县| 河津市| 平舆县| 枣阳市| 攀枝花市| 霍城县| 青冈县| 当涂县| 忻州市| 南投市| 黄大仙区|