●駱 美
淺析大學(xué)教師教學(xué)評(píng)價(jià)方法之技術(shù)效能*
●駱美
摘要:制度不合理僅是引致現(xiàn)階段我國(guó)高校科研“GDP”至上之異化現(xiàn)象的表象。這背后的一個(gè)重要原因在于實(shí)務(wù)界對(duì)大學(xué)教學(xué)評(píng)價(jià)技術(shù)資源缺乏一定程度的了解和掌握。通過(guò)提供一個(gè)簡(jiǎn)單明了的“技術(shù)指標(biāo)”框架,可以幫助相關(guān)利益者提高對(duì)教學(xué)評(píng)價(jià)方法的認(rèn)知、選擇和運(yùn)用能力,為保障大學(xué)教師教學(xué)評(píng)價(jià)的公平公正性,落實(shí)教學(xué)在教師管理制度中的應(yīng)有地位提供一條可行路徑。
關(guān)鍵詞:大學(xué)教師評(píng)價(jià);大學(xué)教學(xué)評(píng)價(jià);評(píng)價(jià)方法;技術(shù)標(biāo)準(zhǔn)
在我國(guó),盡管大學(xué)教學(xué)與科研的失衡問(wèn)題很早就引起了高等教育工作者的重視,但該領(lǐng)域?qū)虒W(xué)評(píng)價(jià)方法和技術(shù)的研究卻一直比較薄弱,實(shí)務(wù)界對(duì)教學(xué)評(píng)價(jià)方法的運(yùn)用也不盡如人意。辨識(shí)、分析以及解決我國(guó)大學(xué)教師評(píng)價(jià)存在的主要問(wèn)題,對(duì)教學(xué)評(píng)價(jià)方法的技術(shù)效能進(jìn)行系統(tǒng)化梳理,對(duì)提高評(píng)價(jià)使用者的認(rèn)知、選擇和運(yùn)用能力,落實(shí)教學(xué)在教師管理中的應(yīng)有地位具有十分重要的意義。本文所做技術(shù)分析適用于與教師崗位分類管理、職稱晉升、人才計(jì)劃、獎(jiǎng)勵(lì)與懲罰等高風(fēng)險(xiǎn)人事決策掛鉤的教師教學(xué)總結(jié)性評(píng)價(jià)。
我國(guó)高等教育教師評(píng)價(jià)的“應(yīng)然”和“實(shí)然”之間存在很大的差距,突出表現(xiàn)在制度框架中科研與教學(xué)的嚴(yán)重失衡。有學(xué)者認(rèn)為制度失衡僅僅是表象,真正的原因在于高校“教學(xué)學(xué)術(shù)”理念的缺失[1]。這些學(xué)者以美國(guó)著名學(xué)者博耶1990年對(duì)“教學(xué)學(xué)術(shù)”的界定為理論支撐,認(rèn)為中國(guó)高校如果能沿著博耶的邏輯,轉(zhuǎn)變觀念、更新理念,那么評(píng)價(jià)制度中教學(xué)將獲得與科研同等的重要地位,進(jìn)而教育活動(dòng)中教師職業(yè)道德與職業(yè)素養(yǎng)下滑等問(wèn)題均能迎刃而解。
然而,在我國(guó)導(dǎo)致中國(guó)大學(xué)科研與教學(xué)失衡的因素并非僅在觀念層面。中國(guó)歷來(lái)是一個(gè)教育大國(guó),中國(guó)人對(duì)教育的重視為世界稱道,無(wú)論教學(xué)是否歸屬學(xué)術(shù)范疇,中國(guó)教育者對(duì)教書(shū)育人這一基本使命的重要性是達(dá)成普遍共識(shí)的。制度不合理的主要原因在于貫徹支撐這一觀念的教師評(píng)價(jià)技術(shù)沒(méi)有跟上現(xiàn)代化教育管理實(shí)踐的要求。
現(xiàn)行中國(guó)高等教育教師評(píng)價(jià)制度的邏輯起點(diǎn)源于西方的現(xiàn)代教育評(píng)價(jià),其體系的框架搭建和方法技術(shù)的應(yīng)用雖也結(jié)合我國(guó)過(guò)往經(jīng)驗(yàn),但主要還是以學(xué)習(xí)和模仿發(fā)達(dá)國(guó)家模式為演進(jìn)路線。這種安排在鑒定教師科學(xué)研究活動(dòng)質(zhì)量方面是行得通的,盡管各高校的科研評(píng)價(jià)體系仍存在許多為人詬病的地方,但通過(guò)學(xué)習(xí)西方經(jīng)驗(yàn)依據(jù)學(xué)科特色構(gòu)建多個(gè)本土論文影響因子系統(tǒng),科研評(píng)價(jià)在技術(shù)上已基本達(dá)到“公平公正”這一基礎(chǔ)要求,能夠基本滿足大學(xué)對(duì)科研的評(píng)價(jià)需求。相比之下,教學(xué)評(píng)價(jià)在引進(jìn)西方成熟做法的過(guò)程中卻遇到了本土化難題。由于西方教學(xué)評(píng)價(jià)主要采用主觀、質(zhì)性的評(píng)價(jià)方法與技術(shù),在我國(guó)以“差序格局”為主導(dǎo)的社會(huì)結(jié)構(gòu)和文化土壤環(huán)境下,其評(píng)價(jià)的公平公正性遭到了廣泛爭(zhēng)議和質(zhì)疑。
換言之,中國(guó)高等教育教學(xué)與科研失衡的原因雖表面看來(lái)源自制度的價(jià)值取向,而實(shí)質(zhì)在于評(píng)價(jià)實(shí)踐長(zhǎng)期面臨著技術(shù)瓶頸。有部分學(xué)者也注意到了評(píng)價(jià)方法與技術(shù)應(yīng)用水平低下對(duì)我國(guó)高等教育評(píng)價(jià)實(shí)踐的影響[2]。遺憾的是,這方面的研究一直都比較薄弱。研究者要么僅從整個(gè)教育評(píng)價(jià)架構(gòu)層面對(duì)評(píng)價(jià)方法的技術(shù)價(jià)值、技術(shù)效用等問(wèn)題進(jìn)行陳述,未深入到機(jī)理層面對(duì)各方法進(jìn)行逐一鑒別;要么羅列各方法的概念、理論依據(jù)、基本程序、指標(biāo)體系等,在方法的技術(shù)問(wèn)題上卻淺嘗輒止,缺乏深度開(kāi)掘,難以對(duì)實(shí)踐提供具有系統(tǒng)性的理論指導(dǎo)。鑒于此,本文將致力于填補(bǔ)當(dāng)前研究空白,針對(duì)實(shí)踐中面臨的技術(shù)難點(diǎn),提供一套對(duì)評(píng)價(jià)方法效能進(jìn)行元分析的指標(biāo)體系,并根據(jù)此體系對(duì)各教學(xué)評(píng)價(jià)方法進(jìn)行具體到操作層面的系統(tǒng)化梳理,為高校落實(shí)和提高教學(xué)評(píng)價(jià)的公平公正性探索一條切實(shí)可行的路徑。
評(píng)估標(biāo)準(zhǔn),根據(jù)美國(guó)教育評(píng)估標(biāo)準(zhǔn)聯(lián)合委員會(huì)的定義,是指從事評(píng)估專業(yè)實(shí)踐的人們相互之間達(dá)成的共識(shí)原則,旨在通過(guò)標(biāo)準(zhǔn)的設(shè)立與達(dá)成,提高評(píng)估質(zhì)量,增強(qiáng)其公平公正性[3]。評(píng)估技術(shù)作為評(píng)估標(biāo)準(zhǔn)的主要構(gòu)成,其共識(shí)原則的指向首先集中于可供選擇的各種評(píng)價(jià)方法的技術(shù)效用;然后關(guān)注評(píng)價(jià)方法所涉及的評(píng)估程序和工具操作條件的實(shí)際可行度。
需要指出的是,本文所建議的技術(shù)指標(biāo)較為寬泛,不能代替諸如定性和定量研究設(shè)計(jì)與分析、測(cè)量與數(shù)據(jù)收集、數(shù)據(jù)分析等研究方法領(lǐng)域的具體指標(biāo)與標(biāo)準(zhǔn)。提供這一技術(shù)指標(biāo)的目的是為高校教師教學(xué)評(píng)價(jià)的利益相關(guān)者提供一個(gè)簡(jiǎn)單明了的認(rèn)知框架,為短期內(nèi)解決當(dāng)前大學(xué)教師教學(xué)評(píng)價(jià)難題,提高評(píng)價(jià)質(zhì)量尋找突破口。本文提出的評(píng)價(jià)技術(shù)指標(biāo)具體如下:
(一)準(zhǔn)確性
教育評(píng)價(jià)以事實(shí)判斷為基礎(chǔ),教育事實(shí)判斷的科學(xué)性直接影響價(jià)值判斷的科學(xué)性??茖W(xué)準(zhǔn)確的事實(shí)判斷必須具有兩個(gè)基本屬性:有效、可靠。這是各學(xué)科科學(xué)解釋自然或社會(huì)現(xiàn)象所須遵循的兩大基本準(zhǔn)則。
1.有效性
在測(cè)量學(xué)中,有效性通常通過(guò)效度這個(gè)概念來(lái)體現(xiàn),指一個(gè)測(cè)量工具(或操作性定義)是否測(cè)量了它本應(yīng)測(cè)量的內(nèi)容。保羅考茲比教授(Paul Cozby)在其所著的方法論教材中講述了一個(gè)關(guān)于零效度的例子:假設(shè)你想測(cè)測(cè)自己的智力,測(cè)試者卻讓你站到一個(gè)類似鞋碼器的測(cè)試儀器上,顯然鞋碼信息對(duì)智力程度的表達(dá)是完全無(wú)效的。[4]以此類推,教育評(píng)價(jià)的有效性主要取決于評(píng)價(jià)結(jié)果與評(píng)價(jià)客體的事實(shí)本質(zhì)是否相符以及相符的程度如何。
2.可靠性
可靠性在測(cè)量學(xué)中是通過(guò)信度這個(gè)概念來(lái)體現(xiàn)的,是任何總能夠產(chǎn)生相同結(jié)果的系統(tǒng)所具備的一種屬性[5]。再借用保羅·考茲比教授的舉例,鞋碼器雖然在測(cè)量智力方面是無(wú)效的,卻顯示出許多類型的信度,例如這個(gè)儀器無(wú)論測(cè)量多少次,對(duì)同一客體都會(huì)呈現(xiàn)出一致的讀數(shù)(測(cè)量學(xué)稱之為“重測(cè)信度”),并且無(wú)論誰(shuí)操作它,它都會(huì)給出一樣的讀數(shù)(稱之為“評(píng)分者信度”)。信度的形式較多,但是與教師總結(jié)性評(píng)價(jià)最相關(guān)的是重測(cè)信度以及評(píng)分者信度。信度在教育評(píng)價(jià)領(lǐng)域通常是指評(píng)價(jià)結(jié)果的一致性,即如果對(duì)同一教育事物進(jìn)行多次測(cè)評(píng),是否能夠得到相同或相似的結(jié)果。
(二)可行性
設(shè)立可行性指標(biāo)是為了確保教學(xué)評(píng)價(jià)的方案是實(shí)際可行的。要注意的方面具體包括(但不僅限于):在數(shù)據(jù)和資料收集方案決定之前,確保各種信息收集計(jì)劃的可操作性;主要選擇那些與評(píng)價(jià)人員相關(guān)技術(shù)水平一致的程序步驟;必要的時(shí)候,對(duì)評(píng)價(jià)人員進(jìn)行短期培訓(xùn);對(duì)于可能出現(xiàn)的問(wèn)題,提前做好后備方案,等等。嚴(yán)格來(lái)講,可行性指標(biāo)并不完全屬于技術(shù)范疇,其內(nèi)涵通常還涵蓋政治與成本效益方面的考慮。
教師評(píng)價(jià)作為一種對(duì)人的價(jià)值判斷活動(dòng),一開(kāi)始就與社會(huì)科學(xué)研究方法的應(yīng)用密切聯(lián)系。筆者根據(jù)在社會(huì)科學(xué)研究、教育測(cè)量以及教育評(píng)價(jià)等領(lǐng)域積累的知識(shí)與經(jīng)驗(yàn),梳理出高等教育教師評(píng)價(jià)過(guò)程的幾個(gè)關(guān)鍵節(jié)點(diǎn),以期幫助在評(píng)價(jià)實(shí)踐中提高對(duì)教學(xué)事實(shí)的準(zhǔn)確判斷:
第一,清楚地了解評(píng)價(jià)主體的反映能力。從高等教育評(píng)價(jià)方法的技術(shù)起源來(lái)看,任何一種方法都是為了解決與特定對(duì)象有關(guān)的問(wèn)題而開(kāi)發(fā)出來(lái)的,在教師評(píng)價(jià)實(shí)踐中,如果不結(jié)合評(píng)價(jià)目的,批判考慮評(píng)價(jià)主體在達(dá)成評(píng)價(jià)任務(wù)方面的有效程度,則評(píng)價(jià)很難達(dá)到預(yù)期的目的。以目前我國(guó)高等教育界運(yùn)用最普遍的學(xué)生評(píng)教為例,其在西方發(fā)達(dá)國(guó)家的發(fā)源與全面質(zhì)量管理以及人本主義思潮對(duì)教育界的沖擊緊密相關(guān)。學(xué)生評(píng)價(jià)教學(xué)在彰顯主體關(guān)系平等、價(jià)值意義同構(gòu)等現(xiàn)代教育理念方面具有其他方法不能望其項(xiàng)背的功能。然而當(dāng)評(píng)價(jià)目的轉(zhuǎn)向衡量教師勞動(dòng)質(zhì)量時(shí),學(xué)生評(píng)教本身的局限就凸顯出來(lái)。教師的知識(shí)傳播行為具有非常強(qiáng)的復(fù)雜性和學(xué)術(shù)性,盡管學(xué)生是教學(xué)過(guò)程的重要參與方,但是學(xué)生在教師掌握知識(shí)的深度廣度、課程設(shè)計(jì)能力以及所用教學(xué)材料的科學(xué)合理性方面卻始終處于信息弱勢(shì),因而很難準(zhǔn)確做出符合價(jià)值主體需求的判斷。
第二,清楚地了解評(píng)價(jià)工具的信息收集能力。關(guān)于評(píng)價(jià)工具的測(cè)量能力,測(cè)量學(xué)中有專門的實(shí)證檢驗(yàn)方法,但對(duì)于大多數(shù)教育管理者而言,這些檢驗(yàn)方法也許并不實(shí)用。本文所談及的評(píng)價(jià)工具測(cè)量能力更為直觀。教師評(píng)價(jià)所涉及的資料收集方法大多源自社會(huì)科學(xué)研究方法,雖然這些方法經(jīng)過(guò)多年的發(fā)展已經(jīng)比較成熟,但是在人類復(fù)雜的情感、態(tài)度、認(rèn)知、行為等屬性特征面前,其準(zhǔn)確捕捉與評(píng)價(jià)目的一致的信息能力本身就各有長(zhǎng)短。比如教學(xué)評(píng)價(jià)中常見(jiàn)的問(wèn)卷受其書(shū)面形式的限制,對(duì)行為特征的測(cè)量能力就遠(yuǎn)不及對(duì)態(tài)度、情感等主觀感受特征的測(cè)量。而相較之下,直接觀察對(duì)行為信息的采集則更為敏銳。此外,由于問(wèn)卷主要以量化的形式表達(dá)意見(jiàn),有時(shí)會(huì)使一些評(píng)價(jià)項(xiàng)目帶上不太符合邏輯的精確性,反而導(dǎo)致其甄別精準(zhǔn)度降低。某些大學(xué)的學(xué)生評(píng)教數(shù)據(jù),大部分老師的得分在98以上(百分制),人際差距精確到十分位。學(xué)校卻常將這些結(jié)果進(jìn)行排名,并以此作為鑒別教師教學(xué)水平高低的依據(jù)。那么得99.9分的老師真的優(yōu)于99.8的老師嗎?這樣的排名顯然是無(wú)效的,并有失公允。
第三,清楚地了解評(píng)價(jià)程序的抗干擾能力。在現(xiàn)階段大學(xué)教師教學(xué)評(píng)價(jià)條件下,教學(xué)事實(shí)的許多方面是難以客觀量化的,主觀量化和主觀質(zhì)性評(píng)價(jià)便成為了主導(dǎo)。這些方法的共同特征是通過(guò)各類“人”對(duì)教學(xué)事實(shí)的“真”進(jìn)行主觀反映,因而評(píng)價(jià)實(shí)施的過(guò)程中,不可避免地會(huì)受到人對(duì)教育事物的認(rèn)識(shí)差異以及人際主觀情感或利益的沖突影響,某些情況下甚至出現(xiàn)評(píng)價(jià)主體不嚴(yán)格尊重事實(shí),不按照科學(xué)標(biāo)準(zhǔn)進(jìn)行評(píng)議的“形式主義”和“好好先生”現(xiàn)象。評(píng)價(jià)工作者因此須對(duì)各個(gè)步驟在抵抗人為因素影響的優(yōu)勢(shì)與局限方面有清晰的了解,認(rèn)真思考如何利用某些程序的合理正義性降低甚至排除“人情關(guān)系”等對(duì)評(píng)價(jià)準(zhǔn)確性可能造成的負(fù)面干擾。
此外,本文將內(nèi)涵多維的“可行性”指標(biāo)置于大學(xué)教師評(píng)價(jià)之“技術(shù)指標(biāo)”框架下,意在提醒高校頂層設(shè)計(jì)與決策人員在注重教學(xué)評(píng)價(jià)準(zhǔn)確性與公平公正性的前提下,充分考慮方案的實(shí)用性、政治性以及經(jīng)濟(jì)性,避免落入“唯技術(shù)論”之陷阱,設(shè)計(jì)出理論上可行但實(shí)際不可用的評(píng)價(jià)方案。不過(guò),到目前為止大多數(shù)高校的教學(xué)評(píng)價(jià)實(shí)踐與“唯技術(shù)論”的方向正相反,往往在“利用現(xiàn)有管理?xiàng)l件”思想下,為可行性而犧牲準(zhǔn)確性要求。那么,可行性與準(zhǔn)確性之間究竟孰輕孰重?筆者認(rèn)為鑒于總結(jié)性評(píng)價(jià)對(duì)個(gè)體教師的高風(fēng)險(xiǎn)性,在評(píng)價(jià)成本與潛在政治影響或者經(jīng)濟(jì)成本尚未成為不可逾越的障礙的情況下,準(zhǔn)確性應(yīng)該總是優(yōu)先于可行性。畢竟,只有首先實(shí)現(xiàn)對(duì)教學(xué)事實(shí)的準(zhǔn)確把握,公平公正的教師評(píng)價(jià)才能有堅(jiān)實(shí)的物質(zhì)基礎(chǔ)。
基于以上技術(shù)指標(biāo)及其在應(yīng)用時(shí)應(yīng)注意的要點(diǎn),沿著“要素解構(gòu)——綜合歸納”的思路,本文借用“標(biāo)準(zhǔn)參照評(píng)估”法的比較視角對(duì)各方法的技術(shù)效能進(jìn)行了從局部到整體的等級(jí)區(qū)分。參照的基準(zhǔn)為美國(guó)高校廣泛使用的學(xué)生評(píng)教。作為基準(zhǔn),此版本學(xué)生評(píng)教方法在有效性、可靠性以及可行性三個(gè)技術(shù)維度的評(píng)價(jià)等級(jí)設(shè)定均為“+”,其他評(píng)價(jià)方法高于此基準(zhǔn)則相應(yīng)增加“+”符號(hào),反之則標(biāo)記“—”符號(hào),“+”或“—”的個(gè)數(shù)由與基準(zhǔn)之間的差異程度決定。分析結(jié)果見(jiàn)表1。
在表1中,整體技術(shù)效能是三個(gè)要素所涉及的準(zhǔn)確性效能之綜合,輔以方法可行性進(jìn)行總體評(píng)判。在評(píng)判各要素對(duì)評(píng)價(jià)方法有效性的影響時(shí)基于兩方面認(rèn)識(shí):(1)評(píng)價(jià)主體對(duì)客體教學(xué)水平、教學(xué)質(zhì)量的反映能力。校內(nèi)外同行、懂教學(xué)的管理者被認(rèn)為比學(xué)生有更高的反映能力(有效性等級(jí)“++”),而管理者與用人單位由于不直接參與教學(xué)過(guò)程被認(rèn)為普遍比學(xué)生的反映能力低(有效性等級(jí)“—”);(2)所采用評(píng)價(jià)工具對(duì)教學(xué)事實(shí)信息的收集能力。評(píng)價(jià)者直接觀察課堂教學(xué)行為(或教學(xué)錄像)被認(rèn)為比基準(zhǔn)工具(評(píng)教問(wèn)卷)有更強(qiáng)的信息收集能力(有效性等級(jí)“++”);輔以配套教學(xué)檔案材料則有效性提升一個(gè)等級(jí)(+++);如果教學(xué)錄像是隨機(jī)獲取的,又有配套教學(xué)檔案材料,則此評(píng)價(jià)工具的有效性等級(jí)為最高(++++)。在評(píng)判各要素對(duì)評(píng)價(jià)方法可靠性的影響時(shí)處于以下兩方面考慮:(1)評(píng)價(jià)主體的數(shù)量(旨在關(guān)注“重測(cè)信度”)。主體數(shù)量少于基準(zhǔn)的,可靠性等級(jí)均為“—”;(2)評(píng)價(jià)程序的抗干擾能力(旨在關(guān)注評(píng)分者信度)。非匿名式同事評(píng)價(jià)和管理者評(píng)價(jià)(校領(lǐng)導(dǎo)評(píng)價(jià)除外)因無(wú)法較圓滿的降低評(píng)議者與被評(píng)議教師之“人情關(guān)系”或“惡意競(jìng)爭(zhēng)”的干擾,其評(píng)分者信度等級(jí)低于基準(zhǔn)(“—”);省內(nèi)同行評(píng)價(jià)因存在專家與被評(píng)議教師認(rèn)識(shí)的可能性而被視為和基準(zhǔn)有同等的評(píng)分者信度;相比之下,省外同行匿名式評(píng)價(jià)、畢業(yè)生評(píng)價(jià)以及用人單位評(píng)價(jià)因在很大程度上克服了人情干擾而被認(rèn)為具有比基準(zhǔn)更高的評(píng)分者信度(“++”)。在評(píng)判可行性方面,管理者評(píng)價(jià)、省內(nèi)同行公開(kāi)課評(píng)價(jià)、畢業(yè)生評(píng)價(jià)和用人單位評(píng)價(jià)因面臨比率嚴(yán)重失調(diào)的人力困境,均被賦予比基準(zhǔn)低的等級(jí)(“—”);其他評(píng)價(jià)方法則與基準(zhǔn)的操作可行性等級(jí)相同。根據(jù)表1的分析結(jié)果,在構(gòu)建科學(xué)合理的大學(xué)教師教學(xué)評(píng)價(jià)體系時(shí)應(yīng)注意:
(一)運(yùn)用多種方法,避免教學(xué)評(píng)價(jià)實(shí)踐的簡(jiǎn)單化傾向
教育評(píng)價(jià)是對(duì)教育事物或人物的組織價(jià)值(或社會(huì)價(jià)值)的系統(tǒng)判斷,屬于典型的主觀判斷。但是公平公正的教師評(píng)價(jià)最根本的依據(jù)仍然在客觀物質(zhì)世界,需要通過(guò)合目的、合規(guī)律地收集和分析信息,對(duì)教師教育活動(dòng)的事實(shí)本質(zhì)進(jìn)行科學(xué)的認(rèn)識(shí)和反映。為實(shí)現(xiàn)這個(gè)目標(biāo),評(píng)價(jià)方案應(yīng)同時(shí)具備高有效性、高可靠性與高可行性。然而,表1顯示,盡管目前大學(xué)教學(xué)評(píng)價(jià)方法的儲(chǔ)備是豐富的,但是沒(méi)有一種或一類方法在技術(shù)效能方面能同時(shí)達(dá)到此要求。因此,面對(duì)復(fù)雜的高等教育評(píng)價(jià)任務(wù),有必要注意“方法多樣、主體多元、內(nèi)容多維”,根據(jù)評(píng)價(jià)目的與基礎(chǔ)條件,揚(yáng)長(zhǎng)避短,互為補(bǔ)充。
當(dāng)前在我國(guó)高等教育教師教學(xué)評(píng)價(jià)實(shí)踐中普遍存在的問(wèn)題是,豐富的評(píng)價(jià)方法資源在實(shí)際中很少得到開(kāi)發(fā)利用,甚至很少受到關(guān)注,這種將復(fù)雜的教育教學(xué)現(xiàn)象簡(jiǎn)單化、單一化技術(shù)處理的做法,不能不說(shuō)是我國(guó)大學(xué)教師評(píng)價(jià)發(fā)展的一大遺憾。充分發(fā)掘、合理利用現(xiàn)有高等教育教學(xué)評(píng)價(jià)方法之技術(shù)資源,是迅速高效提高我國(guó)教育評(píng)價(jià)水平的可行路徑,也是高等教育評(píng)價(jià)發(fā)展的客觀要求。[6]
表1 大學(xué)教師教學(xué)評(píng)價(jià)方法之技術(shù)效能
(二)注意微觀細(xì)節(jié),避免教學(xué)評(píng)價(jià)方法的誤用濫用
表1同樣顯示,即使是同一類評(píng)價(jià)方法,細(xì)節(jié)的不同設(shè)計(jì)也會(huì)導(dǎo)致整個(gè)方法的技術(shù)效能出現(xiàn)較大差異。以學(xué)生評(píng)教為例,其主要信息收集方法為問(wèn)卷調(diào)查。社會(huì)科學(xué)研究方法論強(qiáng)調(diào)使用“匿名制”與“自愿參與”兩個(gè)措施以保障調(diào)查結(jié)果準(zhǔn)確性[7]。相較于美國(guó)高校,我國(guó)部分高校的學(xué)生評(píng)教活動(dòng)卻并未意識(shí)到這兩項(xiàng)措施的重要性,為單純追求學(xué)生參與率,以選課權(quán)為交換籌碼,強(qiáng)迫每個(gè)學(xué)生對(duì)授課教師的教學(xué)進(jìn)行評(píng)價(jià)。表面看來(lái),似乎參與評(píng)議的人數(shù)增加了,評(píng)議結(jié)果就更可靠,殊不知在非自發(fā)性動(dòng)力驅(qū)使下的評(píng)價(jià),使本來(lái)無(wú)興趣參與的問(wèn)卷回答者極易罔顧評(píng)價(jià)目的與事實(shí),胡亂填寫(xiě),并最終導(dǎo)致“純凈”數(shù)據(jù)被某些“污染”數(shù)據(jù)侵蝕,使得評(píng)教結(jié)果的整體可靠性降低。對(duì)比之下,“學(xué)生評(píng)價(jià)教學(xué)錄像”式評(píng)教卻由于既保證了足夠的評(píng)議者數(shù)量,又通過(guò)讓本校非授課班級(jí)學(xué)生或外校學(xué)生參與的方式基本克服了學(xué)生評(píng)教中自身背景、教師背景以及課程背景等因素[8]對(duì)結(jié)果的消極影響,因此方法的整體有效性與可靠性得到了有力保障。
從我國(guó)高等教育評(píng)價(jià)的發(fā)展歷程觀察,我國(guó)的相關(guān)理論研究、制度建設(shè)和實(shí)踐活動(dòng)一直堅(jiān)持走中西結(jié)合的道路。前面對(duì)不同版本“學(xué)生評(píng)教”及其技術(shù)效能差異的解釋表明,在“拿來(lái)”西方經(jīng)驗(yàn)的時(shí)候,應(yīng)充分了解每種評(píng)價(jià)方法的國(guó)別土壤,歷史起源,教育文化,資源條件以及技術(shù)要求等等,以保障評(píng)價(jià)方法在我國(guó)的微觀選擇在評(píng)價(jià)目的、評(píng)價(jià)對(duì)象特點(diǎn)和操作條件的配套使用上科學(xué)合理,避免評(píng)價(jià)方法在實(shí)踐中的誤用、濫用等嚴(yán)重后果。
(三)明晰技術(shù)效能,推動(dòng)教學(xué)評(píng)價(jià)方法的不斷創(chuàng)新
從高等教育評(píng)價(jià)發(fā)展的宏觀需求看,充分了解現(xiàn)有評(píng)價(jià)方法的技術(shù)要求與效能還有助于教育評(píng)價(jià)方法的技術(shù)創(chuàng)新,因?yàn)樵诜椒ㄅc技術(shù)的形成過(guò)程中,根據(jù)現(xiàn)實(shí)需求,對(duì)原有方法的相關(guān)量度或程序作出一些調(diào)整和變化,本身就有可能衍生出一些新的方法與技術(shù)。1985年,美國(guó)學(xué)者霍瑞斯.曼(Horace Mann)在波士頓文法學(xué)校以小論文筆試取代傳統(tǒng)口試的改革雖是從口頭到書(shū)面的調(diào)整,卻開(kāi)啟了以學(xué)生書(shū)面考試成績(jī)?cè)u(píng)估學(xué)校教學(xué)效能的傳統(tǒng)[9]。表1列舉的教師教學(xué)評(píng)價(jià)方法中,包含很多通過(guò)細(xì)節(jié)微調(diào)實(shí)現(xiàn)方法創(chuàng)新的例子。比如,同事評(píng)估從最初的內(nèi)部進(jìn)行到引入校內(nèi)外專家,并由此衍生出“同行評(píng)價(jià)”;評(píng)價(jià)工具從最初的課堂實(shí)地觀察到引入教學(xué)錄像,使得跨地域同行評(píng)審成為可能。而本文首次提出的“隨機(jī)課堂教學(xué)錄像”概念,旨在實(shí)現(xiàn)對(duì)教師教學(xué)信息采集視野從最優(yōu)狀態(tài)瞬間捕捉擴(kuò)展到持續(xù)性一般狀態(tài)反映,使得進(jìn)一步提高對(duì)教師教學(xué)事實(shí)的準(zhǔn)確把握成為可能。當(dāng)然,雖然僅多了“隨機(jī)”二字,這背后蘊(yùn)含的社會(huì)科學(xué)研究技術(shù)要求更嚴(yán),所需評(píng)價(jià)成本也更高。
總之,在現(xiàn)代教育質(zhì)量保障思想方法體系中,教師是大學(xué)最寶貴的資源。教師對(duì)教育教學(xué)的重視度和貢獻(xiàn)度,與相關(guān)教師管理制度為其提供什么樣的動(dòng)力、條件和機(jī)會(huì)緊密相關(guān)。評(píng)價(jià)作為師資隊(duì)伍管理體系的核心機(jī)制,只有當(dāng)其真正實(shí)現(xiàn)對(duì)教學(xué)事實(shí)的公平公正評(píng)測(cè)時(shí),才能大面積激發(fā)教師教學(xué)行為朝組織目標(biāo)方向正態(tài)前進(jìn)。針對(duì)當(dāng)前我國(guó)大學(xué)在教學(xué)評(píng)價(jià)方面的短板,本文為高校管理者和其他相關(guān)利益者提供了一個(gè)簡(jiǎn)單明了的技術(shù)指標(biāo)框架,幫助其對(duì)各評(píng)價(jià)方法進(jìn)行系統(tǒng)梳理,了解原理,明白操作,對(duì)比優(yōu)缺點(diǎn),為彌補(bǔ)現(xiàn)階段相關(guān)研究的不足,落實(shí)教學(xué)在教師管理實(shí)踐的應(yīng)有權(quán)重提供了技術(shù)可行性。當(dāng)然,在一個(gè)以財(cái)政支持為主要經(jīng)費(fèi)來(lái)源的高等教育體系,僅在大學(xué)內(nèi)部攻克教學(xué)評(píng)價(jià)技術(shù)瓶頸是不夠的。雖然使用者提高了對(duì)評(píng)價(jià)資源的理性認(rèn)知以及選擇能力,但是部分高校的專任教師管理方案搭建仍將受制于來(lái)自體系內(nèi)外宏觀環(huán)境的壓力。當(dāng)前,我國(guó)高等教育體系內(nèi)部資源分配機(jī)制以及社會(huì)第三方教育質(zhì)量監(jiān)控機(jī)制在評(píng)價(jià)大學(xué)教師教育教學(xué)集體成果方面同樣面臨準(zhǔn)確性和可行性困境。而這些都是需要通過(guò)高等教育質(zhì)量評(píng)價(jià)方法的技術(shù)研究與開(kāi)發(fā)才能解決的,也是高等教育評(píng)價(jià)需要迫切發(fā)展的一個(gè)重要方向。
參考文獻(xiàn):
[1]康翠萍.一種認(rèn)識(shí)理路:高校教師教學(xué)發(fā)展的現(xiàn)實(shí)反思與理性建構(gòu)[C].武漢:中南民族大學(xué)教師教學(xué)發(fā)展中心,2014.16-27.
[2][6]沈玉順.高等教育評(píng)價(jià)方法技術(shù)的誤用、濫用及其矯正[J].復(fù)旦教育論壇,2010,(5).
[3][美]詹姆斯·桑德斯.劉玲譯.教育項(xiàng)目評(píng)估標(biāo)準(zhǔn)——如何評(píng)價(jià)對(duì)教育項(xiàng)目的評(píng)估[M].北京:北京大學(xué)出版社,2012.2.
[4]Cozby,P.C.Methods in Behavioral Research(9th ed.).New York:McGraw-Hill,2006:45.
[5][加]基思.斯坦諾維奇.對(duì)“偽心理學(xué)”說(shuō)不[M].竇東徽,劉肖岑譯.北京:人民郵電出版社,2012.
[7]Madhabi Chatterji.Designing and Using Tools for Educational Assessment[M].Boston:Pearson Education,Inc.,2003.
[8]梅萍.近十年我國(guó)高校學(xué)生評(píng)教有效性問(wèn)題研究述評(píng)[J].現(xiàn)代大學(xué)教育,2013,(4).
[9]吳巖.構(gòu)建中國(guó)特色高等教育質(zhì)量保障體系[M].北京:教育科學(xué)出版社,2014.9.
(責(zé)任編輯:孫寬寧)
駱美/中南財(cái)經(jīng)政法大學(xué)教師發(fā)展中心主任,助理研究員,教育領(lǐng)導(dǎo)與政策學(xué)博士
*本文系中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目“基于復(fù)合創(chuàng)新型人才培養(yǎng)視角下的教育評(píng)價(jià)范式創(chuàng)新”(項(xiàng)目編號(hào):31541310706)的研究成果之一。