顧振華
(上海商學(xué)院商務(wù)經(jīng)濟(jì)學(xué)院,上海201400)
在缺少家長和教師監(jiān)督的環(huán)境下,如何讓大學(xué)生將更多時(shí)間用于學(xué)習(xí)一直是教育界普遍關(guān)心的問題。生動(dòng)有趣的課堂、循循善誘的教授、別開生面的師生互動(dòng)無疑有利于學(xué)生的學(xué)習(xí)投入(Bransford et al.,1999)[1],而考核機(jī)制則是經(jīng)濟(jì)學(xué)視角下影響學(xué)生時(shí)間和精力分配的最重要因素(Scouller,1998;劉金石,2013)[2,3]。在現(xiàn)實(shí)環(huán)境下,學(xué)習(xí)成績的高低直接決定學(xué)生的就業(yè)、升學(xué)、出國、獎(jiǎng)學(xué)金等,而平時(shí)成績、期中考試和期末考試是國內(nèi)高校多數(shù)課程考核的三大組成部分,它們按一定權(quán)重值相加形成學(xué)生的課程成績。①這種考核方式之所以被多數(shù)高校和教師所采用,一是它擁有清晰的成績計(jì)算方法,易量化比較和分析;二是師生都有明確的以教材內(nèi)容為主的考核導(dǎo)向,并在一定程度上兼顧平時(shí)課堂表現(xiàn)。不過,不少教育界人士對該考核機(jī)制是否能夠全面評價(jià)學(xué)習(xí)效果持懷疑態(tài)度(鄧建平,2014;Watts and Becker,2008),他們認(rèn)為以考試為主的考核側(cè)重于學(xué)生的理解能力,無法很好地衡量學(xué)生運(yùn)用知識解決實(shí)際問題的能力。那么,是否有一種考核機(jī)制既能引導(dǎo)學(xué)生自主平衡書面成績和實(shí)踐應(yīng)用,又不增加教師額外的工作量?是否能尋找到一種評價(jià)方法可直觀地觀察考核機(jī)制轉(zhuǎn)變對學(xué)生的影響?
本文以經(jīng)濟(jì)學(xué)課程為例,設(shè)計(jì)了一個(gè)兼顧書面考試和案例分析的混合型考核機(jī)制,通過控制異方差的最小二乘法(OLS)和傾向得分匹配法(PSM)對該機(jī)制的效果進(jìn)行實(shí)證分析。從結(jié)果來看,混合型考核機(jī)制可激發(fā)學(xué)生學(xué)習(xí)積極性,當(dāng)學(xué)生對成績提出挑戰(zhàn)后,主觀案例分析或論文撰寫會促使其投入更多時(shí)間進(jìn)行學(xué)習(xí),最終提高月考成績和總成績。該考核機(jī)制對于學(xué)習(xí)基礎(chǔ)較好的學(xué)生而言,積極作用更顯著。
本文設(shè)計(jì)的創(chuàng)新考核機(jī)制在形式上既有客觀書面考試,又有主觀案例分析,采用回歸模型定量分析考核機(jī)制對學(xué)生成績所產(chǎn)生的影響,在技術(shù)上對模型的內(nèi)生性問題采用傾向得分匹配法進(jìn)行控制。
以學(xué)生為本、以綜合能力培養(yǎng)為核心是目前國內(nèi)外高校教育教學(xué)改革的重點(diǎn),有關(guān)高校課程考核機(jī)制的研究亦是如此,不少文獻(xiàn)從定性的角度闡釋如何確定考核目標(biāo)、如何豐富考核內(nèi)容以及如何全面反映學(xué)生學(xué)習(xí)效果。Gibbs和Simpson(2004)、McGoldrick 和 Schuhmann(2013)認(rèn)為相比以客觀題為主的考試,案例分析和課程論文撰寫更有助于培養(yǎng)學(xué)生的邏輯思維和信息處理分析能力。林靜(2010)、樊瑜等(2014)以及班娟(2015)提出“考、教、學(xué)”三位一體的考試評價(jià)體系,倡導(dǎo)以考促教、以考導(dǎo)學(xué)、以考評教的理念,設(shè)計(jì)出包括語言表達(dá)、創(chuàng)新思維、知識運(yùn)用和知識掌握等多角度評價(jià)的考核機(jī)制。張國生(2015)以《Visual Basic程序設(shè)計(jì)》課程為例,提出建立多維立體化教學(xué)資源庫并結(jié)合多媒體網(wǎng)絡(luò)教學(xué)。馮江茹等(2015)認(rèn)為網(wǎng)絡(luò)課堂是未來大學(xué)教育的主要形式之一,課程考核機(jī)制將與網(wǎng)絡(luò)緊密結(jié)合,在其所授的《宏觀經(jīng)濟(jì)學(xué)》課程中,網(wǎng)絡(luò)試題庫的卷面分、網(wǎng)絡(luò)課堂討論表現(xiàn)以及隨機(jī)案例分析是最終成績的組成部分。
上述研究基本達(dá)成共識,即用多維考核機(jī)制代替以書面考試為主的課程評價(jià)方法。然而,無論是增加主觀評價(jià)法,還是強(qiáng)調(diào)多媒體網(wǎng)絡(luò)的作用,多數(shù)學(xué)者僅完成考試機(jī)制的設(shè)計(jì)部分,并沒有對其效果進(jìn)行完整的客觀評價(jià)。正如McGoldrick和Schuhmann(2016)所言,創(chuàng)新的考核機(jī)制由于包含更多內(nèi)容,將會給師生帶來額外的時(shí)間成本,其效果未必如設(shè)想的那樣美好。鑒于此,本文通過實(shí)證模型對所設(shè)計(jì)的混合型考核機(jī)制進(jìn)行量化評價(jià),以此客觀地觀察其對學(xué)生學(xué)習(xí)效果的作用。該方法不僅可應(yīng)用于經(jīng)濟(jì)學(xué)課程,還可推廣到更多課程領(lǐng)域。
上海商學(xué)院是以商立校的應(yīng)用型本科院校,經(jīng)濟(jì)學(xué)課程是大一和大二必修的公共基礎(chǔ)課,總時(shí)長為18周。②和大多數(shù)基礎(chǔ)課程一樣,平時(shí)成績、期中考試和期末考試是考核的三個(gè)部分,三個(gè)成績按一定權(quán)重相加得到學(xué)生最終成績。本文使用混合型考核機(jī)制替代原有機(jī)制:(1)以月考代替期中和期末考試,前三次月考隨堂進(jìn)行,末次在第17周單獨(dú)進(jìn)行,權(quán)重分別為 20%、30%、20%和 30%;(2)在前三次中的每次月考結(jié)束后,如果學(xué)生發(fā)揮欠佳,可提出挑戰(zhàn),教師將會在下次月考前統(tǒng)一給學(xué)生布置挑戰(zhàn)內(nèi)容,讓學(xué)生在一定時(shí)間內(nèi)完成并提交,取挑戰(zhàn)成績和上次月考成績中較高的進(jìn)行記錄;(3)月考以選擇、判斷、計(jì)算等客觀題為主,而挑戰(zhàn)以案例分析或小論文寫作等主觀題為主,學(xué)生需要運(yùn)用所學(xué)知識解決實(shí)際問題。之所以設(shè)計(jì)這種混合型考核機(jī)制,一是書面知識和實(shí)踐應(yīng)用的結(jié)合可系統(tǒng)考查學(xué)生學(xué)習(xí)效果;二是在兩次月考間安排一次挑戰(zhàn)既可調(diào)動(dòng)學(xué)生學(xué)習(xí)積極性,使其多一次獲得高分的機(jī)會,還可使其溫故知新,為下次月考做更充分的準(zhǔn)備(Kulik et al.,1990)。相比已有研究提出的網(wǎng)絡(luò)考評、“考、教、學(xué)”結(jié)合等機(jī)制,本文設(shè)計(jì)的考核機(jī)制內(nèi)容更簡單明了,成績更易量化,效果更易評估,且四次月考加上一次可能的挑戰(zhàn)均在原有課時(shí)中完成,并未給教師增加更多的工作量。
本文樣本類型為橫截面數(shù)據(jù),包括2015—2016學(xué)年第一學(xué)期至2016—2017學(xué)年第一學(xué)期大一、大二以及重修共13個(gè)班級的學(xué)生,共525個(gè)樣本值。所使用的數(shù)據(jù)主要分為兩部分,一是學(xué)生的個(gè)人特征數(shù)據(jù),包括性別、民族、生源地、文理科、高考成績及學(xué)習(xí)績點(diǎn)等;二是經(jīng)濟(jì)學(xué)課程成績數(shù)據(jù),包括月考和最終成績等。個(gè)人特征數(shù)據(jù)來自于班主任和輔導(dǎo)員提供的學(xué)生詳細(xì)信息,以往經(jīng)濟(jì)學(xué)課程考試數(shù)據(jù)來自教務(wù)處。
評估混合型考核機(jī)制對于學(xué)習(xí)效果的影響不僅要觀察學(xué)生選擇挑戰(zhàn)后的月考成績,還要觀察該考核機(jī)制是否調(diào)動(dòng)了學(xué)生學(xué)習(xí)積極性,從而提升學(xué)習(xí)效果?;诖耍疚慕⑹剑?)—(3)的實(shí)證模型:
其中,exam表示學(xué)生四次月考的成績;challenge代表學(xué)生在第幾次月考后是否選擇進(jìn)行挑戰(zhàn),選擇則為1,不選擇為0;cum_sc表示課程最終加權(quán)總成績,schallenge代表學(xué)生在學(xué)習(xí)期間是否申請過挑戰(zhàn),是為1,否為0;X是解釋變量向量,主要包括學(xué)生特征數(shù)據(jù);gender是學(xué)生性別的虛擬變量,男生為1,女生為0;people是學(xué)生民族的虛擬變量,漢族為1,少數(shù)民族為0;ecw代表學(xué)生的生源地,2為東部,1為中部,0為西部;gpa反映學(xué)生已獲得的績點(diǎn);class是文理科虛擬變量,1為理科,0為文科;grade代表學(xué)生的年級,0為大一,1為大二,2為重修班;ncee是高考成績虛擬變量,1表示該學(xué)生的成績超過來自同一生源地學(xué)生的成績中位數(shù),0表示未超過。③
由于橫截面數(shù)據(jù)包括生源地、性別、民族等學(xué)生個(gè)人特征不盡相同,因此要考慮異方差問題,本文采取Huber-White穩(wěn)健性標(biāo)準(zhǔn)誤進(jìn)行調(diào)整。同時(shí),為了克服樣本中離群值的影響,本文對所有連續(xù)變量在前后1%的水平上進(jìn)行winsorize縮尾處理。由于解釋變量為是否申請?zhí)魬?zhàn),而被解釋變量為下期月考成績,因此樣本選擇產(chǎn)生的內(nèi)生性問題并不明顯??紤]到式(3)中加權(quán)總成績與是否申請?zhí)魬?zhàn)可能存在相互影響,本文使用PSM方法作為穩(wěn)健性檢驗(yàn)以緩解內(nèi)生性問題。
表1報(bào)告了525個(gè)樣本值的描述性統(tǒng)計(jì)結(jié)果,從各變量的平均值和標(biāo)準(zhǔn)差中可見,經(jīng)過winsorize縮尾處理后,整個(gè)樣本基本不再受離群值的干擾。從對四次月考成績的描述來看,平均值基本保持在60分左右,第二次和第四次月考的標(biāo)準(zhǔn)差較大,說明學(xué)生成績波動(dòng)較大,這可能是由于兩次考試權(quán)重較高,又恰是期中和期末考試時(shí)間,學(xué)生復(fù)習(xí)課程較多,心理較緊張。從三次挑戰(zhàn)申請的描述情況來看,第一次月考結(jié)束后申請?zhí)魬?zhàn)的學(xué)生最少,而第二次月考結(jié)束后申請?zhí)魬?zhàn)的學(xué)生最多,原因可能是第一次月考較簡單,多為緒論、簡單供求理論及價(jià)格理論,學(xué)生成績較高,且多數(shù)學(xué)生對新考試機(jī)制并不熟悉,因此申請?zhí)魬?zhàn)的人數(shù)并不多;第二次月考相當(dāng)于過去的期中考試,內(nèi)容是微觀經(jīng)濟(jì)學(xué)的核心內(nèi)容,包括消費(fèi)者行為和生產(chǎn)者行為,難度相比第一次月考提升很多,不少學(xué)生的成績并不理想,加上第二次月考的權(quán)重較大,想通過挑戰(zhàn)取得更好成績的學(xué)生數(shù)量自然有所增加。
經(jīng)濟(jì)學(xué)課程要用到不少數(shù)學(xué)知識,且涉及很多晦澀的專業(yè)詞匯,在文科基礎(chǔ)課中較有難度,這也反映在cum_score的結(jié)果中:最終平均成績剛超過合格線,近四成學(xué)生不合格。從schallenge結(jié)果中可見,學(xué)生并不排斥混合型考核機(jī)制,92%的學(xué)生申請過挑戰(zhàn),考試次數(shù)有所增加,但提高成績的渠道也增加了。從各個(gè)學(xué)生特征變量可知,50%以上來自東部地區(qū),25%為少數(shù)民族,平均績點(diǎn)在3.0左右。
表1 回歸變量的描述性統(tǒng)計(jì)
(續(xù)表 1)
表2報(bào)告了月考成績變量和挑戰(zhàn)申請變量的Pearson相關(guān)性分析結(jié)果,是否接受挑戰(zhàn)申請對于下次月考成績基本存在正相關(guān)關(guān)系,雖然第三次挑戰(zhàn)與第四次月考相關(guān)關(guān)系的顯著性不高,但申請?zhí)魬?zhàn)在10%的顯著性水平上對總成績存在正相關(guān)關(guān)系,這初步證明混合型考核機(jī)制對學(xué)生學(xué)習(xí)效果有積極影響。由于表2僅考慮變量兩兩相關(guān)關(guān)系,更準(zhǔn)確的結(jié)果仍需實(shí)證模型和回歸分析得到。
表2 相關(guān)性分析
表 3列出了式 (1)—(3) 的回歸結(jié)果,從challenge1—3的系數(shù)來看,申請?zhí)魬?zhàn)與否對下次月考成績存在正影響。參加第一次挑戰(zhàn)的學(xué)生在第二次月考中提高逾3分,參加第二次挑戰(zhàn)的學(xué)生在第三次月考中提高逾2分,兩次結(jié)果均至少在10%的顯著性水平上顯著。參加第三次挑戰(zhàn)的學(xué)生在最后一次月考中提高約1.5分,但該結(jié)果僅在15%的顯著性水平上顯著。這說明混合型考核機(jī)制可調(diào)動(dòng)學(xué)生學(xué)習(xí)積極性,使學(xué)生較主動(dòng)地學(xué)習(xí)。從schallenge的系數(shù)可見,參加過挑戰(zhàn)的學(xué)生總成績提高約2分,且該結(jié)果在10%的顯著性水平上顯著,這更說明本文設(shè)計(jì)的考核機(jī)制對經(jīng)濟(jì)學(xué)課程整體效果有幫助。
除考核機(jī)制外,學(xué)生的部分個(gè)人特征也對成績有顯著影響。其中,學(xué)生已取得的成績績點(diǎn)和高考分?jǐn)?shù)對月考和總成績有顯著影響,績點(diǎn)成績越高或高考成績越好,月考成績和總成績則越高,這說明學(xué)生基礎(chǔ)扎實(shí)與否是影響成績的重要因素。從生源地來看,來自中部地區(qū)的學(xué)生比東西部的學(xué)生表現(xiàn)更好。
表3 回歸結(jié)果
(續(xù)表3)
本文使用PSM方法作為穩(wěn)健性檢驗(yàn)的一種,表4報(bào)告了傾向得分匹配的結(jié)果。首先,無論是月考成績還是總成績,除挑戰(zhàn)變量challenge外的其他控制變量在實(shí)驗(yàn)組和對照組均不存在10%顯著性水平以上的差異,這更凸顯混合型考核機(jī)制對學(xué)習(xí)效果的影響。根據(jù)是否申請?zhí)魬?zhàn)劃分的實(shí)驗(yàn)組和對照組,經(jīng)過PSM后的月考成績基本都在10%的顯著性水平上存在差異,申請?zhí)魬?zhàn)的實(shí)驗(yàn)組平均月考成績約為73分、60分和58分,未申請?zhí)魬?zhàn)的對照組為70分、55分和56分,這進(jìn)一步證明申請?zhí)魬?zhàn)有助于學(xué)生在下次月考中的表現(xiàn)。經(jīng)過PSM后實(shí)驗(yàn)組和對照組的最終成績顯示,實(shí)驗(yàn)組平均成績接近63分,對照組約為61分,這也說明混合型考核機(jī)制有助于學(xué)生學(xué)習(xí)效果的提升。
從表2可知,高考成績往往反映學(xué)生的基礎(chǔ),是影響學(xué)習(xí)效果的重要因素。基礎(chǔ)較好的學(xué)生想要獲得高分,對不同考核機(jī)制的反應(yīng)程度更明顯。鑒于此,表5報(bào)告了混合型考核機(jī)制對擁有較高高考成績學(xué)生的作用,學(xué)生申請?zhí)魬?zhàn)后月考成績有較顯著的提高,總成績比未申請?zhí)魬?zhàn)的學(xué)生高2分左右,這與表3的結(jié)果一致,且表5的整體顯著性略優(yōu)于表3。另外,本文依據(jù)不同性別、班級以及生源地對樣本進(jìn)行分組回歸,結(jié)果基本支持混合型考核機(jī)制的積極效果,因此結(jié)果是較穩(wěn)健的。
表4 穩(wěn)健性檢驗(yàn)A-傾向得分匹配
表5 穩(wěn)健性檢驗(yàn)B-分組回歸
注:***、**和*分別代表1%、5%和10%的顯著性水平(雙尾),類別變量ecw和grade被分解為兩個(gè)虛擬變量參與回歸
為了在眾多教育理念中尋找到能真正激發(fā)學(xué)生積極性并提高學(xué)習(xí)效果的考核機(jī)制,并對其進(jìn)行客觀評估,本文以經(jīng)濟(jì)學(xué)課程為例,設(shè)計(jì)了一個(gè)兼顧客觀題和主觀分析的混合型考核機(jī)制,并通過控制異方差OLS和PSM法對該機(jī)制的效果進(jìn)行實(shí)證分析。從結(jié)果來看,混合型考核機(jī)制可激發(fā)學(xué)生學(xué)習(xí)積極性,當(dāng)學(xué)生對成績提出挑戰(zhàn)后,主觀案例分析或論文撰寫會促使其投入更多時(shí)間學(xué)習(xí),從而提高月考成績和總成績。與此同時(shí),該考核機(jī)制對基礎(chǔ)較好的學(xué)生積極作用更顯著。
當(dāng)前,教育界和學(xué)術(shù)界大多提倡通過豐富教學(xué)手段、增加課堂互動(dòng)、更新教材內(nèi)容等方法吸引學(xué)生注意力,激發(fā)學(xué)生積極性并提升學(xué)習(xí)效果。然而,這些方法在一定程度上給師生增加了額外負(fù)擔(dān),師生必須在原有課時(shí)外投入更多時(shí)間和精力,從經(jīng)濟(jì)學(xué)角度而言,這種時(shí)間成本的增加會稀釋其積極效果。本文從考核機(jī)制入手,強(qiáng)調(diào)通過改變考核機(jī)制也能吸引學(xué)生注意力,幫助其提高成績,本文設(shè)計(jì)出一個(gè)混合型考核機(jī)制,并利用實(shí)證模型進(jìn)行了較客觀和準(zhǔn)確的評估。在大數(shù)據(jù)發(fā)展迅猛的今天,定量分析有助于研究者發(fā)現(xiàn)、分析和解決問題,因此本文的評估方法不僅可應(yīng)用于考核機(jī)制對學(xué)習(xí)效果的評估,還可推廣到更多的教育研究領(lǐng)域中。
注 釋:
①上海商學(xué)院的權(quán)重為平時(shí)成績10%、期中成績30%、期末成績60%。
②本文提到的經(jīng)濟(jì)學(xué)課程包括《經(jīng)濟(jì)學(xué)概論》《經(jīng)濟(jì)學(xué)基礎(chǔ)》和《經(jīng)濟(jì)學(xué)》。雖然上海商學(xué)院的這三門課程名稱略有差異,但教材相同、授課內(nèi)容接近,因此將之視為相同課程一起作為研究對象。18周課時(shí)中,第18周一般被安排為試卷批改和答疑。
③在實(shí)際回歸過程中,將類別變量ecw和grade展開成虛擬變量形式參與回歸。
[1]Bransford,John D.,Brown A.L.,Cocking,R.How People Learn:Brain,Mind,Experience,and School[M].Washington DC:National Academies Press,1999.
[2] Scouller K.M.The Influence of Assessment Method on Students’Learning Approaches:Multiple Choice Question Examination versus Assignment Essay[J].Higher Education,1998,35(4):453-472.
[3]劉金石.公共基礎(chǔ)課程大班教學(xué)中的學(xué)生考評機(jī)制創(chuàng)新探析——以微觀經(jīng)濟(jì)學(xué)課程為例[J].中國大學(xué)教學(xué),2016(6):81-83.
統(tǒng)計(jì)學(xué)報(bào)2018年1期