国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

發(fā)展視角下學(xué)生成長(zhǎng)評(píng)價(jià)模型的實(shí)踐與展望
——以初中科學(xué)測(cè)試為例

2020-03-07 02:45:12
關(guān)鍵詞:回歸方程殘差顯著性

祝 錢

一、問題提出

長(zhǎng)期以來,我國(guó)基礎(chǔ)教育主要以考試分?jǐn)?shù)作為評(píng)價(jià)學(xué)生的依據(jù),這種評(píng)價(jià)手段確實(shí)在人才選拔、學(xué)生培養(yǎng)方面起到了相當(dāng)?shù)某尚?,但在?shí)踐過程中也暴露出一些問題。因?yàn)閭鹘y(tǒng)的考試分?jǐn)?shù)往往是絕對(duì)的、靜態(tài)的,其主要發(fā)揮了判優(yōu)劣、重選拔的技術(shù)屬性,但無法從動(dòng)態(tài)的、發(fā)展的視角對(duì)學(xué)生學(xué)業(yè)成績(jī)做出預(yù)測(cè),無法通過學(xué)業(yè)成長(zhǎng)性評(píng)價(jià)有效激勵(lì)學(xué)生的成長(zhǎng)。

2015年,美國(guó)政府頒布了《每一個(gè)學(xué)生成功法案》(Every Student Succeeds Act,ESSA),提出了“既關(guān)注‘達(dá)標(biāo)’,又重視‘發(fā)展’”的理念。[1]基于ESSA,美國(guó)各州開展了“基于學(xué)生幾次的測(cè)試成績(jī),通過一定的數(shù)學(xué)計(jì)算方法以做出對(duì)學(xué)生、學(xué)校、教師有關(guān)的解釋”的成長(zhǎng)評(píng)價(jià),成長(zhǎng)模型成為各州對(duì)學(xué)生、學(xué)校和學(xué)區(qū)進(jìn)行教育評(píng)估(assessment)和問責(zé)(accountability)的主要方法。[2]

基于美國(guó)的有益經(jīng)驗(yàn),國(guó)內(nèi)很多研究者開始關(guān)注學(xué)生成長(zhǎng)評(píng)價(jià),并開展了一些積極的探索,但學(xué)生成長(zhǎng)評(píng)價(jià)模型尚未在國(guó)內(nèi)進(jìn)行大面積的實(shí)踐,而且研究者們對(duì)于“實(shí)踐中應(yīng)以多少次考試分?jǐn)?shù)作為自變量來建構(gòu)模型才能達(dá)到較好的預(yù)測(cè)效果”這一問題還沒有確切的答案。因此,我國(guó)基礎(chǔ)教育階段的學(xué)生成長(zhǎng)評(píng)價(jià)還有很長(zhǎng)一段路要走。本研究以現(xiàn)有考試分?jǐn)?shù)為基礎(chǔ),將考試分?jǐn)?shù)與學(xué)生成長(zhǎng)模型進(jìn)行有機(jī)整合,并通過對(duì)回歸模型的分析優(yōu)化,利用標(biāo)準(zhǔn)估算誤差、殘差標(biāo)準(zhǔn)差、相對(duì)誤差等指標(biāo),科學(xué)分析了考試次數(shù)與模型預(yù)測(cè)準(zhǔn)確度之間的關(guān)系。本研究也是基層中小學(xué)校基于傳統(tǒng)分?jǐn)?shù),建構(gòu)學(xué)生成長(zhǎng)模型對(duì)學(xué)生進(jìn)行動(dòng)態(tài)的、發(fā)展的評(píng)價(jià)的一次有益探索。

二、學(xué)生成長(zhǎng)評(píng)價(jià)模型的建構(gòu)

1.成長(zhǎng)模型的選定

目前,國(guó)外基于學(xué)生成長(zhǎng)視角的評(píng)價(jià)模型中比較流行和成熟的主要是美國(guó)的三大類七種模型,即基于縱向量表的模型、預(yù)測(cè)模型和增值模型。其中,第一類縱向量表模型主要包括增分模型(前后標(biāo)準(zhǔn)分的增量)、漸進(jìn)達(dá)標(biāo)模型(基于最初的標(biāo)準(zhǔn)分增量,來確定今后每年的進(jìn)步值)和分類模型(基于分?jǐn)?shù)的等級(jí)變化)。其實(shí),目前國(guó)內(nèi)用來評(píng)價(jià)學(xué)生進(jìn)步與成長(zhǎng)的評(píng)價(jià)方法與這三種縱向量表模型類似,但這三種模型都是基于縱向量表之上的,而縱向量表的開發(fā)是一個(gè)浩大的工程,我國(guó)尚不具備采用這類模型的現(xiàn)實(shí)條件。第二類預(yù)測(cè)模型就是為了彌補(bǔ)縱向量表模型的缺陷而研發(fā)出來的,主要包括殘差模型(基于兩年測(cè)試標(biāo)準(zhǔn)分的線性回歸方程構(gòu)建)、成長(zhǎng)百分等級(jí)(基于SGP 技術(shù)的學(xué)生成長(zhǎng)等級(jí)預(yù)測(cè))、投射模型(基于多組數(shù)據(jù)及相關(guān)因素的回歸方程構(gòu)建)。第三類增值模型又稱為多變量模型。增值模型的構(gòu)建不僅包含分?jǐn)?shù)因素,還要將多種影響學(xué)生學(xué)習(xí)、成長(zhǎng)的因素納入其中,模型結(jié)構(gòu)非常復(fù)雜。所以,即使在美國(guó),這種模型的運(yùn)用也比較少,很多評(píng)價(jià)專家也曾呼吁謹(jǐn)慎使用該模型。[3]另外,增值模型涉及多因素分析,不利于大面積的推廣實(shí)施,因此,本研究暫時(shí)舍去增值模型。如此,第二類預(yù)測(cè)模型成為本次研究的首選,其中的殘差模型應(yīng)用簡(jiǎn)單,軟硬件技術(shù)也可以跟進(jìn),最終選定其作為本研究中學(xué)生成長(zhǎng)的評(píng)價(jià)模型。

2.殘差模型的界定

殘差模型在美國(guó)的實(shí)踐是以學(xué)生前后兩年測(cè)試成績(jī)?yōu)閰⒖迹趦赡瓿煽?jī)之間建立線性回歸方程,并通過函數(shù)方程來預(yù)測(cè)學(xué)生的成績(jī),然后用真實(shí)值減去預(yù)測(cè)值便得到學(xué)生的殘差值。若殘差>0,說明學(xué)生“成長(zhǎng)性”為正;若殘差<0,說明學(xué)生“成長(zhǎng)性”為負(fù)。同時(shí),還可將殘差標(biāo)準(zhǔn)化處理后,對(duì)學(xué)生成長(zhǎng)性進(jìn)行等級(jí)排列。[4]

3.優(yōu)化殘差模型的目的

從數(shù)理統(tǒng)計(jì)上來看,用于線性回歸方程預(yù)測(cè)的成績(jī)數(shù)量多少?zèng)Q定了函數(shù)預(yù)測(cè)的準(zhǔn)確性,若成績(jī)數(shù)量過少,回歸方程預(yù)測(cè)會(huì)出現(xiàn)較大誤差。因此,本研究以理論難度系數(shù)為0.75 的學(xué)校標(biāo)準(zhǔn)化考試成績(jī)?yōu)樽宰兞繕?gòu)建8 組回歸方程,并對(duì)自變量數(shù)量與模型預(yù)測(cè)能力之間的關(guān)系進(jìn)行分析,以探尋在有限考試次數(shù)的背景下構(gòu)建適合學(xué)校實(shí)踐的殘差模型。

4.優(yōu)化殘差模型的實(shí)踐

(1)學(xué)生樣本選取

本研究以浙江省杭州市C 學(xué)校九年級(jí)學(xué)生的9 次科學(xué)測(cè)試成績(jī)?yōu)閰⒄拯c(diǎn)來進(jìn)行研究。樣本選擇主要基于以下兩方面的思考:①大樣本更有利于得到普遍規(guī)律;②九年級(jí)學(xué)生測(cè)試成績(jī)參考點(diǎn)比較多,便于構(gòu)建多組線性回歸曲線。

(2)統(tǒng)計(jì)分析工具選取

本研究采用IBM SPSS Statistics 24 和Excel 軟件進(jìn)行統(tǒng)計(jì)分析。

(3)整體優(yōu)化思路

圖1 成長(zhǎng)模型選擇、建構(gòu)的框架圖

本研究選擇623 名九年級(jí)學(xué)生為樣本,首先將他們的9 次科學(xué)測(cè)試成績(jī)(七、八年級(jí)期中、期末共8 次測(cè)試,再加上九年級(jí)上學(xué)期期中測(cè)試)進(jìn)行等值化處理,然后選取學(xué)生成長(zhǎng)模型中的殘差模型,再以取樣學(xué)生的不同考試次數(shù)為自變量建立線性回歸方程,通過分析不同考試次數(shù)與模型預(yù)測(cè)準(zhǔn)確度之間的關(guān)系,來對(duì)殘差模型做進(jìn)一步的優(yōu)化。(見圖1)

(4)具體優(yōu)化過程

①原始成績(jī)值的等值化處理

等值化處理必須符合以下標(biāo)準(zhǔn):新測(cè)驗(yàn)與標(biāo)桿測(cè)試在內(nèi)容和結(jié)構(gòu)上相同;兩次測(cè)試必須信度相同或相近;兩次測(cè)試之間的分值必須存在對(duì)稱性;考生選考任何一次測(cè)驗(yàn)所得量表分?jǐn)?shù)必須是等價(jià)公平的;等值關(guān)系在同一個(gè)總體上是不變的;兩次被測(cè)樣本所具有的能力分布相近;等值設(shè)計(jì)中的錨測(cè)驗(yàn)必須與標(biāo)桿試卷完全一致。[5]

對(duì)照上述標(biāo)準(zhǔn),由于是對(duì)同一批623 名學(xué)生進(jìn)行9 次科學(xué)測(cè)試,且9 次測(cè)試的試卷命制要求進(jìn)行了嚴(yán)格的規(guī)定,因此不管是從被試能力,還是從試卷的結(jié)構(gòu)內(nèi)容、信度及難度來看,其前后都基本保持了一致。與此同時(shí),這9 次測(cè)試的組卷、監(jiān)考、閱卷、分?jǐn)?shù)統(tǒng)計(jì)流程也非常規(guī)范,因而可以認(rèn)為考生測(cè)驗(yàn)分?jǐn)?shù)的獲取是相對(duì)公平公正的。由此,本研究以第一次科學(xué)測(cè)試為標(biāo)桿測(cè)試,采用線性等值的方法來進(jìn)行多次測(cè)試分?jǐn)?shù)的等值換算。公式如下:

表1 轉(zhuǎn)置后的部分線性等值分表

上式中,X 為新測(cè)驗(yàn)的原始分,Mx 與 SDx 分別為新測(cè)驗(yàn)的均分與標(biāo)準(zhǔn)差;Y 為考生在標(biāo)桿測(cè)驗(yàn)中的得分,My 與SDy 分別為標(biāo)桿測(cè)驗(yàn)的均分與標(biāo)準(zhǔn)差。

將上述等值分錄入Excel,后導(dǎo)入SPSS 進(jìn)行處理,表1 為轉(zhuǎn)置后的部分線性等值分?jǐn)?shù)。

②線性回歸方程的建構(gòu)

由于選用了9 次科學(xué)測(cè)試成績(jī),本研究以“七上期中”“七上期末”“七下期中”“七下期末”“八上期中”“八上期末”“八下期中”“八下期末”“九上期中”這9 次測(cè)試成績(jī)?yōu)榛A(chǔ),以第1 次“七上期中”為自變量,第2 次“七上期末”為因變量建立線性回歸方程并預(yù)測(cè)“七上期末”成績(jī),該模型記為模型Ⅰ;以“七上期中”和“七上期末”為自變量,“七下期中”為因變量建立線性回歸方程并預(yù)測(cè)“七下期中”成績(jī),該模型記為模型Ⅱ,以此類推。按照這種思路分別建立起后面幾組線性回歸方程,總共建構(gòu)了8 組線性回歸方程并用于預(yù)測(cè),分別標(biāo)記為:模型Ⅰ、模型Ⅱ、模型Ⅲ、模型Ⅳ、模型Ⅴ、模型Ⅵ、模型Ⅶ、模型Ⅷ。

③8 組線性回歸模型的檢驗(yàn)

為了全方位分析比較8 組模型的解釋預(yù)測(cè)效果,我們需要從擬合優(yōu)度檢驗(yàn)、顯著性F 檢驗(yàn)、D-W 檢驗(yàn)、共線性檢驗(yàn)、顯著性t 檢驗(yàn)等方面來進(jìn)行統(tǒng)計(jì)分析。

擬合優(yōu)度檢驗(yàn):該指標(biāo)主要檢驗(yàn)自變量對(duì)因變量的解釋程度,主要通過校正決定系數(shù)(調(diào)整后R2)來進(jìn)行檢驗(yàn)。

顯著性F 檢驗(yàn):主要檢驗(yàn)全體自變量是否與全體因變量存在顯著性線性關(guān)系。

D-W 檢驗(yàn):主要用于檢驗(yàn)?zāi)P褪欠翊嬖谧韵嚓P(guān)。

表 2 中,F(xiàn) 檢驗(yàn)的 Sig.<0.001,說明 8 組模型自變量均與因變量存在顯著性線性關(guān)系;D-W 均在2 左右,說明模型不存在自相關(guān);擬合優(yōu)度即R2值,模型Ⅰ和模型Ⅱ的解釋率總體均低于0.7,模型Ⅲ和模型Ⅳ的解釋率均接近0.8,而模型Ⅴ、Ⅵ、Ⅶ、Ⅷ的解釋率都在0.8 以上,說明對(duì)于這一屆九年級(jí)學(xué)生樣本而言,以5 次及以上測(cè)試成績(jī)?yōu)樽宰兞拷?gòu)的模型是較好的,以3 次或4 次測(cè)試成績(jī)?yōu)樽宰兞拷?gòu)的模型可以接受,但以一次或兩次測(cè)試成績(jī)?yōu)樽宰兞拷?gòu)的模型則相對(duì)不適宜。[6]

表2 檢驗(yàn)統(tǒng)計(jì)結(jié)果

表2 檢驗(yàn)統(tǒng)計(jì)結(jié)果

注:“含1 組自變量”即表示“以一次測(cè)試(含有623 名學(xué)生的成績(jī))”為自變量建構(gòu)線性回歸方程。以此類推。

模型 模型摘要 ANOVA 檢驗(yàn)調(diào)整后R2 標(biāo)準(zhǔn)估算的誤差 D-W F Sig.模型Ⅰ(含1 組自變量) 0.559 9.880 1.811 788.656 0.000模型Ⅱ(含2 組自變量) 0.678 8.446 1.772 654.374 0.000模型Ⅲ(含3 組自變量) 0.789 6.839 1.804 774.318 0.000模型Ⅳ(含4 組自變量) 0.789 6.831 2.009 582.709 0.000模型Ⅴ(含5 組自變量) 0.837 6.012 2.062 638.042 0.000模型Ⅵ(含6 組自變量) 0.830 6.130 1.984 507.611 0.000模型Ⅶ(含7 組自變量) 0.846 5.841 1.913 488.223 0.000模型Ⅷ(含8 組自變量) 0.825 6.230 2.008 366.381 0.000

共線性檢驗(yàn):多元線性回歸的前提是自變量間不能存在共線性關(guān)系。因此,本研究通過VIF指標(biāo)來檢驗(yàn)自變量間的共線性是否存在。

表3 中,上述8 組模型中的VIF 值均小于10,因此自變量間不存在共線性。[6]

顯著性t 檢驗(yàn):主要用于檢驗(yàn)常數(shù)項(xiàng)、自變量、因變量之間的線性關(guān)系是否顯著。

表4 中,隨著自變量組增加,模型中某些自變量與因變量之間的關(guān)系呈現(xiàn)出非顯著性。如模型Ⅷ中“七上期中、七上期末、七下期中、七下期末”自變量的Sig.>0.05,它們與因變量之間的線性關(guān)系不顯著。但在模型Ⅲ至模型Ⅷ中我們又發(fā)現(xiàn),離所要預(yù)測(cè)值最近的連續(xù)3(或4 或5)組自變量均表現(xiàn)出了與因變量之間的顯著性。如模型Ⅲ中自變量(七上期中、七上期末、七下期中)呈現(xiàn)出與因變量(七下期末)之間的顯著性??紤]到模型Ⅰ與模型Ⅱ可能由于自變量過少導(dǎo)致解釋率較低,因此建議在利用殘差模型預(yù)測(cè)學(xué)生成績(jī)的時(shí)候,最好能以離預(yù)測(cè)值最近的5 次測(cè)試成績(jī)作為自變量來進(jìn)行模型建構(gòu),若沒有足夠組的測(cè)試成績(jī),最近的3 次或4 次測(cè)試成績(jī)作為自變量也是可以接受的。

表3 模型共線性檢驗(yàn)統(tǒng)計(jì)結(jié)果

將模型進(jìn)行調(diào)整后,本研究對(duì)所構(gòu)建模型的預(yù)測(cè)準(zhǔn)確度進(jìn)行了分析。

④模型優(yōu)化

本研究通過線性回歸中的“步進(jìn)”方法,對(duì)Sig.>0.05 的自變量進(jìn)行了刪除處理,因此各模型的自變量成績(jī)組數(shù)也隨之進(jìn)行了如下調(diào)整:

模型Ⅰ、模型Ⅱ、模型Ⅲ、模型Ⅳ自變量不做調(diào)整;

模型Ⅴ刪除自變量七上期中、七上期末,保留自變量七下期中、七下期末、八上期中,記為模型Ⅴ’;

以此類推,建構(gòu)新的模型Ⅵ’和模型Ⅷ’(包含4 組自變量)、模型Ⅶ’(包含5 組自變量)。調(diào)整后的各模型所得結(jié)果統(tǒng)計(jì)情況如表5 所示。

為了說明自變量組的增多對(duì)回歸方程預(yù)測(cè)能力的影響,我們可以參考標(biāo)準(zhǔn)估算的誤差。表5的數(shù)據(jù)顯示,隨著考試次數(shù)的增加,標(biāo)準(zhǔn)估算誤差在減小。同時(shí)結(jié)合參考?xì)埐顦?biāo)準(zhǔn)差,標(biāo)準(zhǔn)差是一組數(shù)據(jù)較平均值分散程度的一種度量。一個(gè)較大的標(biāo)準(zhǔn)差,代表大部分?jǐn)?shù)值和其平均值之間差異較大;一個(gè)較小的標(biāo)準(zhǔn)差,代表這些數(shù)值較接近平均值。[7]通過標(biāo)準(zhǔn)差指標(biāo),我們進(jìn)一步確認(rèn),隨著考試次數(shù)的增加,預(yù)測(cè)值相較于真實(shí)值的波動(dòng)幅度總體趨勢(shì)在減小。

⑤對(duì)優(yōu)化后的8 組模型的殘差分?jǐn)?shù)段分析

為了能更好地解讀優(yōu)化后的8 組模型殘差分?jǐn)?shù)段,我們將殘差值按“≤10 分”“≤20 分”“≤30 分”“≤40 分”“≤50 分”以及“>50 分”段內(nèi)人數(shù)分布進(jìn)行了統(tǒng)計(jì),結(jié)果如表6 所示。

為了更加直觀地表示表6 中各分?jǐn)?shù)段人數(shù)的分布,我們又將其轉(zhuǎn)化為如圖2 所示的柱狀圖。我們發(fā)現(xiàn),若自變量組過少,其殘差值波動(dòng)幅度會(huì)很大,如模型Ⅰ,其殘差波動(dòng)幅度過大,不宜采用。從3 組自變量開始,殘差值5 分及10 分以內(nèi)的人數(shù)逐漸提高,殘差值超過20 分的人數(shù)大幅減少;4~5 組自變量時(shí),殘差絕對(duì)值 5 分、10 分及15 分以內(nèi)的人數(shù)基本為:390 人左右/623 人、560 人左右/623 人、610 人左右/623 人。

⑥8 組模型間對(duì)“不同相對(duì)誤差段內(nèi)”人數(shù)預(yù)測(cè)效果的顯著性差異分析

為了能更加精準(zhǔn)地測(cè)度不同模型的預(yù)測(cè)情況,本研究引進(jìn)了相對(duì)誤差來測(cè)度不同誤差范圍內(nèi)的人數(shù),進(jìn)而比較8 組模型對(duì)“不同相對(duì)誤差段內(nèi)”人數(shù)的預(yù)測(cè)是否有顯著性差異。相對(duì)誤差主要以5%以內(nèi)、10%以內(nèi)、15%以內(nèi)、20%以內(nèi)(含)這4 組進(jìn)行比較,結(jié)果如表7 所示。

相對(duì)誤差=ABS(實(shí)際值-預(yù)測(cè)值)/實(shí)際值。[8]其中,“ABS(實(shí)際值-預(yù)測(cè)值)”表示對(duì)“(實(shí)際值-預(yù)測(cè)值)”取絕對(duì)值。

表5 各模型殘差統(tǒng)計(jì)

通過對(duì)8 組模型計(jì)算出每一個(gè)預(yù)測(cè)值的相對(duì)誤差,并通過“SPSS→分析→描述統(tǒng)計(jì)→交叉表中的卡方檢驗(yàn)”,我們針對(duì)不同模型是否對(duì)不同相對(duì)誤差段內(nèi)人數(shù)的預(yù)測(cè)存在顯著性差異進(jìn)行了檢驗(yàn)。以“相對(duì)誤差5%以內(nèi)”對(duì)“模型Ⅰ”與“模型Ⅱ”進(jìn)行交叉表(卡方檢驗(yàn))分析為例,具體檢驗(yàn)結(jié)果如表8 和表9 所示。

由于上述為2×2 表,因此通過參照費(fèi)希爾精確檢驗(yàn)的原則[9],其精確顯著性(雙側(cè))值為0.003,遠(yuǎn)小于0.05,說明樣本案例不支持原假設(shè),因此認(rèn)為模型Ⅰ和模型Ⅱ?qū)τ陬A(yù)測(cè)“相對(duì)誤差5%以內(nèi)”的人數(shù)存在顯著性差異,模型Ⅱ要顯著優(yōu)于模型Ⅰ。按照同樣的方法,本研究通過卡方檢驗(yàn),逐一對(duì)8 組模型進(jìn)行兩兩比對(duì),以獲得模型間對(duì)于“相對(duì)誤差5%、10%、15%、20%以內(nèi)”的人數(shù)預(yù)測(cè)是否存在顯著性差異的證據(jù),最后根據(jù)8 組模型間對(duì)各誤差段內(nèi)人數(shù)的預(yù)測(cè)有無顯著性差異,將模型進(jìn)行歸類,對(duì)預(yù)測(cè)結(jié)果無顯著性差異的模型歸在同一方格內(nèi),對(duì)預(yù)測(cè)結(jié)果有顯著性差異的模型歸在不同的方格內(nèi)。

表10 中,以“相對(duì)誤差5%以內(nèi)”組為例:2 號(hào)方格內(nèi)有“模型Ⅱ”和“模型Ⅲ”,說明這兩個(gè)模型對(duì)“相對(duì)誤差5%以內(nèi)”的人數(shù)預(yù)測(cè)無顯著性差異,而1 號(hào)方格中的“模型Ⅰ”與2 號(hào)方格中的“模型Ⅱ(或模型Ⅲ)”對(duì)于“相對(duì)誤差5%以內(nèi)”的人數(shù)預(yù)測(cè)存在顯著性差異,即2 號(hào)方格內(nèi)的“模型Ⅱ、模型Ⅲ”的預(yù)測(cè)效果要顯著優(yōu)于1 號(hào)方格內(nèi)的模型Ⅰ。因此,通過表10我們可以非常直觀地看到,對(duì)于C 校九年級(jí)學(xué)生而言,若要建構(gòu)基于殘差的成長(zhǎng)模型,用1 組或2組自變量建構(gòu)的回歸方程預(yù)測(cè)準(zhǔn)確度偏弱,比較理想的自變量組數(shù)為5 組,3 組或4 組自變量也是可以接受的。

圖2 不同殘差分?jǐn)?shù)段人數(shù)分布圖

表6 不同“殘差”分?jǐn)?shù)段人數(shù)分布統(tǒng)計(jì)

表7 相對(duì)誤差段內(nèi)人數(shù)統(tǒng)計(jì)

(5)基于殘差的成長(zhǎng)模型的應(yīng)用

該模型最大的優(yōu)勢(shì)是通過預(yù)測(cè)學(xué)生的學(xué)業(yè)成績(jī),然后將實(shí)測(cè)成績(jī)與預(yù)測(cè)成績(jī)進(jìn)行比較,進(jìn)而反映學(xué)生的學(xué)業(yè)“成長(zhǎng)”情況。如以“八上期中、八上期末、八下期中、八下期末”為自變量,建構(gòu)線性回歸方程為:y=6.326+0.146x1+0.271x2+0.204x3+0.330x4,將學(xué)生前4 次成績(jī)得分133.42分、134.62 分、141.90 分和 141.89 代入方程,便得出其預(yù)測(cè)值為138.06 分,而該生實(shí)際測(cè)試值為139.47 分。若以傳統(tǒng)的評(píng)價(jià)視角,該學(xué)生較前一次141.89 分來說成績(jī)有所退步,但是以“成長(zhǎng)”的視角來看,該學(xué)生的殘差為1.41 分,殘差大于0,因此總體來說該學(xué)生還是有所進(jìn)步的。

表8 相對(duì)誤差5%以內(nèi)的模型Ⅰ與模型Ⅱ交叉表模型

表9 卡方檢驗(yàn)表

表10 模型對(duì)“各相對(duì)誤差段內(nèi)人數(shù)”的預(yù)測(cè)效果有無顯著性差異分組表

(6)極值的處理

構(gòu)建學(xué)生成長(zhǎng)評(píng)價(jià)模型僅僅是從數(shù)理的角度來預(yù)測(cè)學(xué)生成績(jī),所以有可能導(dǎo)致有時(shí)候預(yù)測(cè)出來的成績(jī)遠(yuǎn)遠(yuǎn)高于或低于學(xué)生的實(shí)際水平。因此,在實(shí)際運(yùn)用中,我們還要充分考慮學(xué)生能力的邊界。通過統(tǒng)計(jì)623 組數(shù)據(jù)我們發(fā)現(xiàn),99.5%樣本的預(yù)測(cè)值位于樣本前幾次數(shù)據(jù)中最大值(MAX)與最小值(MIN)的上浮或下浮5%區(qū)間內(nèi)。因此,學(xué)生學(xué)業(yè)水平最大或最小邊界可用以下兩個(gè)經(jīng)驗(yàn)公式表示:

根據(jù)這兩個(gè)公式,我們可以分別以149.0 分和126.7 分為上述模型中學(xué)生的最大(?。┻吔缰?。當(dāng)預(yù)測(cè)值高(低)于邊界值時(shí),我們就以邊界值代替預(yù)測(cè)值,以此來解決極值的問題。

三、總結(jié)與展望

學(xué)生成長(zhǎng)評(píng)價(jià)模型可以向教師、學(xué)生、家長(zhǎng)提供關(guān)于學(xué)生學(xué)習(xí)表現(xiàn)更為豐富的信息,在改進(jìn)學(xué)習(xí)和教學(xué)方面,也可以提供更多參考依據(jù)。

其一,根據(jù)成長(zhǎng)評(píng)估結(jié)果,我們不僅可以告訴一些學(xué)習(xí)成績(jī)尚不理想的學(xué)生,“雖然你這次學(xué)習(xí)成績(jī)不理想,但與以前相比,你已經(jīng)取得了一定的成長(zhǎng)和進(jìn)步”,而且可以告訴一些學(xué)習(xí)表現(xiàn)較好的學(xué)生,“雖然你這次成績(jī)不錯(cuò),但與以前相比,你并沒有取得明顯的成長(zhǎng)和進(jìn)步”。

其二,如果623 名學(xué)生被劃為若干個(gè)班級(jí),其任課教師不止一位,那么,通過學(xué)生成長(zhǎng)評(píng)估結(jié)果,我們可以獲得對(duì)各任課教師教學(xué)效果的評(píng)估,也可以知道不同班級(jí)學(xué)生的成長(zhǎng)情況。我們可以了解到,雖然某個(gè)班級(jí)的某次測(cè)試平均成績(jī)不理想,但與以往相比,取得了明顯的進(jìn)步;雖然某個(gè)班級(jí)的某次測(cè)試平均成績(jī)不錯(cuò),但與以往相比進(jìn)步并不明顯。我們可以了解到,雖然某位教師任教的班級(jí)某次測(cè)試平均成績(jī)不理想,但與以往相比取得了明顯的進(jìn)步;雖然某位教師任教的班級(jí)某次測(cè)試平均成績(jī)不錯(cuò),但與以往相比進(jìn)步并不明顯。這種發(fā)展性評(píng)估的重點(diǎn)不是教師任教班級(jí)的學(xué)生基礎(chǔ),而是教師在幫助學(xué)生成長(zhǎng)方面所取得的成績(jī)。

學(xué)生成長(zhǎng)評(píng)價(jià)模型是未來教育測(cè)量的重要發(fā)展方向,在今后的實(shí)踐和探索過程中,教育教學(xué)研究者、學(xué)校管理人員和一線教師要著重關(guān)注以下幾個(gè)方面。

1.妥善處理成長(zhǎng)模型與傳統(tǒng)評(píng)價(jià)之間的關(guān)系

雖然傳統(tǒng)評(píng)價(jià)即紙筆測(cè)試在具體操作中存在一些問題,但總體而言在當(dāng)下的中國(guó)其對(duì)于整個(gè)社會(huì)的意義是不言而喻的。因此,從地位關(guān)系上來看,傳統(tǒng)評(píng)價(jià)仍處于主要地位,而成長(zhǎng)模型可以作為其重要的補(bǔ)充。從作用關(guān)系上來看,傳統(tǒng)評(píng)價(jià)主要還是發(fā)揮其重選拔的技術(shù)功能,以此維持社會(huì)的公平正義及人才選拔的高效有序,成長(zhǎng)模型則可以發(fā)揮其重激勵(lì)的倫理功能,以此關(guān)懷學(xué)生的內(nèi)心、激發(fā)學(xué)生的潛能。從評(píng)價(jià)整體性上來看,傳統(tǒng)評(píng)價(jià)和成長(zhǎng)模型相輔相成,不可分割。一方面,在教育教學(xué)評(píng)價(jià)實(shí)踐中抓好傳統(tǒng)評(píng)價(jià),這是守住公平正義、保障教學(xué)質(zhì)量的底線和根本。另一方面,適時(shí)引入成長(zhǎng)評(píng)價(jià)模型這一“情感節(jié)拍器”,可以更好地促進(jìn)傳統(tǒng)評(píng)價(jià)的實(shí)施和發(fā)展,更有效地發(fā)揮傳統(tǒng)評(píng)價(jià)的作用。

2.有效發(fā)揮成長(zhǎng)模型對(duì)學(xué)生情感的正向激勵(lì)作用

由于成長(zhǎng)評(píng)價(jià)模型可以通過實(shí)際水平與預(yù)測(cè)水平的差值即“殘差”來更好地反映學(xué)生的學(xué)業(yè)成長(zhǎng)情況,它較之以往根據(jù)前后兩次學(xué)業(yè)成績(jī)的名次進(jìn)退來評(píng)價(jià)學(xué)生成長(zhǎng)的傳統(tǒng)方式,更加科學(xué)、精細(xì)和人本,因此,筆者所在學(xué)校將該模型與現(xiàn)有的學(xué)生激勵(lì)體系進(jìn)行有機(jī)結(jié)合,成功探索出了基于“成長(zhǎng)值”的學(xué)校三級(jí)激勵(lì)評(píng)價(jià)體系,即常態(tài)檢測(cè)下的班級(jí)個(gè)性化成長(zhǎng)激勵(lì);期中質(zhì)量檢測(cè)下的年級(jí)“三荷好少年”表彰;期末質(zhì)量檢測(cè)下的學(xué)?!懊利悓W(xué)生表彰大會(huì)”獎(jiǎng)評(píng)。通過該模型的有效應(yīng)用,一方面,可以呈現(xiàn)出類似于上文分析中的“退步中看進(jìn)步”的評(píng)價(jià)視角,另一方面,三級(jí)激勵(lì)評(píng)價(jià)體系的有效建構(gòu)也可以讓更多的學(xué)生得到肯定和鼓勵(lì),以實(shí)現(xiàn)激勵(lì)的常態(tài)化和全員化,更好地體現(xiàn)評(píng)價(jià)的最終目標(biāo)——讓每一名學(xué)生都體會(huì)到成功!

3.積極探索成長(zhǎng)模型由單一共性向多元個(gè)性轉(zhuǎn)變

目前,我們?cè)趯W(xué)生發(fā)展性成長(zhǎng)評(píng)價(jià)方面的實(shí)踐探索主要還是基于一元線性回歸方程建構(gòu)學(xué)生學(xué)業(yè)成長(zhǎng)模型,但是在實(shí)際建構(gòu)中我們發(fā)現(xiàn),基于一元線性回歸的模型存在一些問題,如,某些學(xué)生歷次成績(jī)波動(dòng)較大,由此建構(gòu)的一元線性曲線無法很好地與該學(xué)生的成績(jī)軌跡進(jìn)行耦合,最終導(dǎo)致預(yù)測(cè)值對(duì)實(shí)際值的解釋量不足。因此,后續(xù)的實(shí)踐中我們還需要探索出在大量學(xué)生樣本下,如何快速、高效地實(shí)現(xiàn)個(gè)性化的成長(zhǎng)模型的構(gòu)建,如一部分學(xué)生學(xué)業(yè)軌跡適用于一元曲線模型,而另外一部分學(xué)生則可能更適用于二次曲線、復(fù)合曲線、對(duì)數(shù)曲線等模型。因此,“一生一?!钡膫€(gè)性化成長(zhǎng)模型的建構(gòu),不僅是該評(píng)價(jià)模式今后深入推進(jìn)、長(zhǎng)遠(yuǎn)發(fā)展的戰(zhàn)略需要,同時(shí)也是評(píng)價(jià)走向精準(zhǔn)化、個(gè)性化、友好化的必然選擇。

猜你喜歡
回歸方程殘差顯著性
基于雙向GRU與殘差擬合的車輛跟馳建模
采用直線回歸方程預(yù)測(cè)桑癭蚊防治適期
線性回歸方程的求解與應(yīng)用
線性回歸方程要點(diǎn)導(dǎo)學(xué)
基于殘差學(xué)習(xí)的自適應(yīng)無人機(jī)目標(biāo)跟蹤算法
基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
走進(jìn)回歸分析,讓回歸方程不再是你高考的絆腳石
基于顯著性權(quán)重融合的圖像拼接算法
電子制作(2019年24期)2019-02-23 13:22:26
基于視覺顯著性的視頻差錯(cuò)掩蓋算法
一種基于顯著性邊緣的運(yùn)動(dòng)模糊圖像復(fù)原方法
年辖:市辖区| 加查县| 阳春市| 石棉县| 雷州市| 乡宁县| 百色市| 黄浦区| 黄龙县| 虎林市| 绵竹市| 礼泉县| 台湾省| 辽阳县| 苏尼特左旗| 璧山县| 祁东县| 申扎县| 丹江口市| 石首市| 巨野县| 寿宁县| 呼伦贝尔市| 莆田市| 馆陶县| 丹凤县| 南充市| 河间市| 治县。| 故城县| 河源市| 平顺县| 浮梁县| 盐池县| 淮北市| 遂平县| 清河县| 金山区| 丰镇市| 通州区| 新民市|