劉少雪(上海交通大學(xué) 高等教育研究院,上海 200240)
?
高等教育評價中的“數(shù)字陷阱”
劉少雪
(上海交通大學(xué) 高等教育研究院,上海 200240)
摘 要:高等教育是育人的事業(yè),其核心任務(wù)很難用具體數(shù)字來表達(dá)。數(shù)字化的描述和評價方法客觀上為人們提供了更直接的考察高等教育及其價值體現(xiàn)的視角,但工具理性自身帶有漠視人的情感和精神價值的弊端,也會將高等教育核心使命零碎化、淺表化,對人們?nèi)嬲J(rèn)識和評價高等教育帶來一定的負(fù)面影響。本文通過三個具體案例,分析了數(shù)字化形式表述高等教育所可能帶來的問題,進(jìn)而認(rèn)為,數(shù)字化指標(biāo)可以用來解釋高等教育質(zhì)量,但其使用需要設(shè)置若干前提條件,包括數(shù)字指標(biāo)的解釋力、指標(biāo)間的邏輯關(guān)系、數(shù)據(jù)來源的真實性等;缺乏合理性和真實性的數(shù)據(jù),對高等教育質(zhì)量評價則是失真的、無效的,甚至是有害的。
關(guān)鍵詞:數(shù)字;指標(biāo);高等教育質(zhì)量
高等教育是育人的事業(yè),關(guān)系到人類的長遠(yuǎn)進(jìn)步、現(xiàn)實發(fā)展和文明承續(xù),因此,無論何時何地,培養(yǎng)人、探索未知和傳承人類文明都是高等教育的根本任務(wù)。與可衡量的其他物質(zhì)存在不同,高等教育的核心任務(wù)因為與“人”、“文明”和“未知”有關(guān),因此很難用衡量其他物質(zhì)存在通常用的具體數(shù)字表達(dá),案例陳述往往成為人們描述和評價高等教育的主要方式。但隨著現(xiàn)代工具理性在社會各方面的運用和滲透,效率和數(shù)字亦越來越成為人們衡量和描述高等教育的重要方式。數(shù)字化的描述和評價方法客觀上能夠為人們提供更直接的考量高等教育及其價值體現(xiàn)的視角,但不可避免地,由工具理性自身帶有的漠視人的情感和精神價值的弊端,也體現(xiàn)在其可能導(dǎo)致將高等教育核心使命的描述零碎化、淺表化、庸俗化,對人們準(zhǔn)確認(rèn)識和評價高等教育帶來負(fù)面影響。本文試圖從一些具體的案例出發(fā),闡釋僅僅運用數(shù)字方式分析高等教育質(zhì)量所可能存在的不足。
當(dāng)前,國內(nèi)用數(shù)字方式來分析和表達(dá)高等教育發(fā)展的成果很多,本研究選取目前較為普遍的就業(yè)與專業(yè)設(shè)置、學(xué)生評教與教學(xué)質(zhì)量、量化指標(biāo)考核與科研發(fā)展等三個方面的一些典型案例進(jìn)行關(guān)注和分析。
(一)就業(yè)與專業(yè)設(shè)置
進(jìn)入新世紀(jì)后,我國高等教育快速從精英化階段步入大眾化階段。2014年的高等教育毛入學(xué)率已經(jīng)達(dá)到37.5%,普通高校在校生規(guī)模達(dá)到2500萬人以上[1],這也意味著每年會有數(shù)以百萬計的高等學(xué)校畢業(yè)生進(jìn)入勞動力市場。因此,每到畢業(yè)季,關(guān)于大學(xué)生就業(yè)的話題就會牽動社會各方面的注意力。為此,若干機(jī)構(gòu)以不同形式發(fā)布了與大學(xué)生就業(yè)相關(guān)的數(shù)據(jù)和排名,也都會有不同的高?;?qū)I(yè)成為輿論“討伐”的中槍者。那么,這些數(shù)據(jù)排名是否科學(xué)合理呢?現(xiàn)以麥可思公司發(fā)布的《中國大學(xué)生就業(yè)報告》(2013年和2014年)為例分析說明。
《中國大學(xué)生就業(yè)報告》顯示,2013、2014年我國高校本科畢業(yè)生半年內(nèi)的平均就業(yè)率分別為91.8%和92.6%;從專業(yè)角度看,兩個年份中排名最高和最低的十個本科專業(yè)分別可見表1和表2。
表1 2013年高校畢業(yè)生就業(yè)率最高和最低的10個本科專業(yè)[3]
表2 2014年就業(yè)率最高和最低的10個本科專業(yè)
從表中可以看出:
第一,2013、2014年我國高等學(xué)校本科畢業(yè)生半年內(nèi)的平均就業(yè)率為92%左右。這個數(shù)字是否屬于國家、社會和高??梢越邮艿乃??從我國高等教育發(fā)展歷史可知,自新中國成立后到20世紀(jì)90年代中期,我國高等學(xué)校畢業(yè)生一直實行計劃分配制度,高校畢業(yè)生畢業(yè)后都能夠獲得安排工作崗位(個別不服從分配的除外)。實行畢業(yè)生自主進(jìn)入勞動力市場、雙向選擇就業(yè)制度后,沒有人能夠保證所有的高等學(xué)校畢業(yè)生都能夠在短期內(nèi)找到滿意的工作崗位—這是市場運行的基本規(guī)律。但由于新中國成立后上大學(xué)—畢業(yè)—工作之間的密切聯(lián)系,畢業(yè)生家長和畢業(yè)生本人對畢業(yè)后的就業(yè)狀態(tài)抱有較高期望;另一方面我國人口基數(shù)和高等學(xué)校學(xué)生規(guī)模大,即使畢業(yè)生中出現(xiàn)小部分不能立即就業(yè)的群體時,其絕對數(shù)量也相當(dāng)可觀,因此易于激發(fā)社會多方面的反應(yīng);第三則是由于近年來的經(jīng)濟(jì)轉(zhuǎn)型發(fā)展,勞動力市場的人才需求與高校畢業(yè)生的專業(yè)技能難以一一對應(yīng),使得社會對高校的人才培養(yǎng)工作頗有微詞??梢哉f,在諸多因素的影響下,高校畢業(yè)生就業(yè)成為近年來的敏感話題。值得注意的是,即使在高等教育發(fā)達(dá)國家,高等學(xué)校畢業(yè)生的就業(yè)率也達(dá)不到100%,這其中既有勞動力市場的因素,也有畢業(yè)生自身的原因。例如,美國國家科學(xué)基金會2006年的畢業(yè)生調(diào)查顯示,學(xué)士和碩士畢業(yè)生參加工作的比例為85%;勞工部委托人口調(diào)查局在2007年的調(diào)查中發(fā)現(xiàn),在24歲及以下青年中,具有學(xué)士以上學(xué)位的就業(yè)率最高,男性為88.1%,女性為90%,具有副學(xué)士學(xué)位和接受一定高等教育的青年的就業(yè)率居次,男性為85.4%,女性為75.1%。[2]英國高等教育統(tǒng)計局發(fā)布的《大學(xué)畢業(yè)生追蹤調(diào)查》顯示,2011年英國高等教育畢業(yè)生全職工作的比例也只有73.4%。[3]如果僅從就業(yè)率的數(shù)據(jù)上看,我國高校畢業(yè)生的就業(yè)率水平明顯高出美、英兩國。那么,這是否意味著我國高校畢業(yè)生的就業(yè)率已經(jīng)很高?我們是否可以對此表示滿意?或者我們對此還有其他要求和期望?
第二,表1和表2顯示的2013和2014年高校本科畢業(yè)生半年內(nèi)的就業(yè)率最高和最低的差距分別是13和12.3個百分點。在平均就業(yè)率達(dá)到92%左右的水平上,最高和最低之間10%的差距,其實質(zhì)性內(nèi)涵應(yīng)如何解釋?特別是在2013和2014年就業(yè)率最高和最低的專業(yè)排名榜單中,就業(yè)率最高和最低的專業(yè)重合率都不高(50%),兩年都列入最高前10位的專業(yè)有建筑學(xué)、安全工程、護(hù)理學(xué)、工程管理和礦物加工工程等5個專業(yè);都列入最低名單的專業(yè)有法學(xué)、生物技術(shù)、音樂表演和應(yīng)用物理學(xué)等4個專業(yè)。另外,教育部于2014年也公布了2012、2013年就業(yè)率較低的15個本科專業(yè)[4],這15個專業(yè)與前面的兩年的最低專業(yè)名單重合率也不高,在三個名單中都出現(xiàn)的專業(yè)只有1個(音樂表演),出現(xiàn)兩次的專業(yè)有3個(生物科學(xué)、動畫和表演)。依此來分析,我國高等學(xué)校設(shè)置的專業(yè)中,是否真正存在就業(yè)率低的專業(yè)?教育部對高等學(xué)校專業(yè)設(shè)置有要求,即需要“有穩(wěn)定的社會人才需求”[5],在巨大的畢業(yè)生就業(yè)壓力下,要對畢業(yè)生就業(yè)率低的專業(yè)設(shè)置預(yù)警制度。如果用明確數(shù)字表達(dá)出來的就業(yè)率排名結(jié)果不一致,甚至差別明顯,這樣的統(tǒng)計或排名結(jié)果是否可信?高校是否可據(jù)此調(diào)整和設(shè)置專業(yè)?這里同樣有2011年英國高等教育統(tǒng)計局發(fā)布的《高校畢業(yè)生就業(yè)去向調(diào)查》作對比,該報告顯示,80.5%的英國高校學(xué)生畢業(yè)生從事的是與其專業(yè)相關(guān)的工作,66.3%的畢業(yè)生認(rèn)為大學(xué)教育體現(xiàn)了其自身的價值。[6]我國高校不同專業(yè)畢業(yè)生的就業(yè)率數(shù)字可否用來判斷學(xué)生的就業(yè)去向,或者是否能夠體現(xiàn)高等學(xué)校的教育價值?顯然目前的數(shù)字很難達(dá)到這樣的目的。
(二)A大學(xué)的本科課程教學(xué)學(xué)生評教情況
教學(xué)活動是“良心活”,教師的能力、技巧和投入對教學(xué)活動的成效影響很大。教師是影響教學(xué)活動成效的重要因素,但不是唯一因素,學(xué)生的投入和準(zhǔn)備、教學(xué)內(nèi)容與難度、培養(yǎng)體系的設(shè)計、教學(xué)制度安排等都會影響教學(xué)活動效果,因此,考察教學(xué)活動效果本身就是一件很復(fù)雜的事情。
近年來高等教育領(lǐng)域中的量化指標(biāo)評估趨勢,也影響到了教學(xué)領(lǐng)域,不少高校嘗試對教師教學(xué)活動進(jìn)行數(shù)字化評估,學(xué)生評教是其中的典型做法。學(xué)生評教起源于20世紀(jì)的美國。“我國高校學(xué)生參與教師教學(xué)評價,始于20世紀(jì)80年代中期。這段時間部分高校開始引入學(xué)生參與評價教學(xué)的評價方式,后逐漸為在多數(shù)高校得到認(rèn)可和應(yīng)用?!保?]13本案例選取的A高校于本世紀(jì)初開始將學(xué)生評教作為監(jiān)督和考核教師教學(xué)活動成效的一種方式。學(xué)生評教自被引入后,不斷遭受教師的質(zhì)疑,校方也曾多次改進(jìn)評教體系和內(nèi)容,但在教師晉升或獎勵時,學(xué)生的評教結(jié)果還是會發(fā)揮一定作用。A大學(xué)2014—2015學(xué)年第一學(xué)期開設(shè)的3 034門次本科生課程的學(xué)生評教結(jié)果呈現(xiàn)如下。①A大學(xué)本科課程教學(xué)學(xué)生評教情況的所有數(shù)據(jù)和問卷內(nèi)容均來源于A大學(xué)教務(wù)處組織的2014—2015學(xué)年度的本科課程教學(xué)學(xué)生評教結(jié)果(供內(nèi)部使用)。除了選課人數(shù)少于10人,或參評學(xué)生少于50%的課程外,2 823門次課程得到有效評價。在滿分為100分的評價規(guī)則下,最高評教課程得分為98.2分,最低為38.4分;所有課程得分的平均數(shù)為85.2分,標(biāo)準(zhǔn)差為6.3;有2084門次課程得分超過平均分(占73.8%);得分最集中的區(qū)間在85~95分之間,超過2/3的課程集中在這個區(qū)間(具體情況見表3)。
表3 A大學(xué)本科生課程的學(xué)生評教結(jié)果分布表
從表3的數(shù)據(jù)中,會有這樣的疑問產(chǎn)生:
第一,全校的本科生課程評教分?jǐn)?shù)平均分超過85分,是否意味著A大學(xué)的本科生課程教學(xué)已經(jīng)達(dá)到令人滿意的程度?實際上,關(guān)于A大學(xué)本科課程教學(xué)的滿意度曾經(jīng)有一個參考數(shù)據(jù)(研究經(jīng)過信度和效度檢驗合格,但因為非學(xué)術(shù)原因不能公開發(fā)表),即通過對該校某個本科2+2項目(在A校和其國外合作大學(xué)分別學(xué)習(xí)過2年)的學(xué)生調(diào)查結(jié)果表明,學(xué)生對A大學(xué)專業(yè)培養(yǎng)的滿意度明顯不如對國外合作大學(xué)的滿意度高。調(diào)查學(xué)生對A大學(xué)的課程體系、教學(xué)內(nèi)容、教材與參考書、教學(xué)方法、師資配備、教學(xué)效果、教學(xué)組織與管理等均有40%左右的“不滿意”或“很不滿意”;相反,對國外合作大學(xué)的上述方面僅在“教學(xué)方法”和“師資配備”兩個方面分別有1.5%的“不滿意”,沒有“很不滿意”的選項。兩種來源不同的數(shù)據(jù)有如此明顯的差距,作為學(xué)校的管理者和教師,更應(yīng)該相信哪個數(shù)據(jù)?
第二,評教課程的最高分與最低分之間的差距達(dá)60分,是哪些因素導(dǎo)致了如此大的差距?是授課教師,還是授課內(nèi)容,抑或是授課方式導(dǎo)致學(xué)生對某門課程的評價如此低?經(jīng)過仔細(xì)查看,發(fā)現(xiàn)最高得分(98.2分)的3門次課程和最低得分(38.4分)的1門課程都是外語類課程,除其中1門最高得分課程是英語課程外,其余3門都是法語課程。在全部有效評價的課程中,法語類課程共有37門,其中“法語寫作”課程開設(shè)3門次,且評教得分均處于同類課程中的最低得分(分別為71、65.2和38.4分),其余法語類課程的得分均在85分以上。這里的疑問是,在法語類課程中,不同課程得分差別巨大,是否與課程內(nèi)容及難度相關(guān)?但同為“法語寫作”課程,不同班級的評教分?jǐn)?shù)差別很大,那么根源在任課教師還是選課學(xué)生?另外,從目前的數(shù)據(jù)中可以看出,在3門次的“法語寫作”課程中,最高得分的課程在全部課程排名中已經(jīng)處在最后2%的水平上,更不用說最低得分的課程就是全部評教課程的最低分。那么從管理部門的角度,如何看待這門課程?從任課教師的角度,又如何評價這門課程?從課程設(shè)置本身,這門課程是否有存在的價值和必要?如何在師生間溝通處理好設(shè)與不設(shè)之間的平衡?……由此可以引出的問題很多,但僅從上面的數(shù)據(jù)中是看不出來的。
圖1 A大學(xué)本科課程評教分?jǐn)?shù)聚集圖
第三,評教分?jǐn)?shù)呈現(xiàn)嚴(yán)重偏正態(tài)分布(見圖1),這個結(jié)果是否意味著這次評教本身不夠嚴(yán)謹(jǐn)有效?按照教育統(tǒng)計學(xué)規(guī)律,正常的評教成績分布直方圖,如基本呈正態(tài)分布狀,會比較有效地反映學(xué)生對學(xué)校開設(shè)課程的評價情況,即評教效果是好的,基本上可以信任;現(xiàn)在的評教結(jié)果呈嚴(yán)重偏態(tài),峰值處與得分最集中的課程數(shù)不能重合,說明評教的效果不理想。通過考察學(xué)生評教的問卷內(nèi)容,其中“理論教學(xué)”類課程的評教內(nèi)容主要關(guān)注三方面內(nèi)容:課程內(nèi)容、課程及任課教師等。由此提出的問題是,以這樣三個問題來評價教師的教學(xué)工作,依據(jù)是什么?這三個指標(biāo)之間的關(guān)聯(lián)性如何?它們是否可以反映教師的工作投入和狀態(tài)?問卷內(nèi)容是否進(jìn)行過可靠性檢驗?與學(xué)校的本科課程教學(xué)目的、人才培養(yǎng)目標(biāo)是否匹配?評教指標(biāo)體系是否能夠規(guī)避評教過程中的干擾性因素?如果所有這些問題都不能在評教之前就得到解答,評教結(jié)果自身及其應(yīng)用都是值得商榷的。
綜合上面的分析,由于A大學(xué)沒有提供學(xué)生評教的信效度檢驗,影響了評教結(jié)果的真實可靠性,難以反映A大學(xué)本科生對學(xué)校開設(shè)課程的態(tài)度和真實評價。因此,從嚴(yán)格意義上說,這樣的評價是沒有意義的。但對于管理者和教師來說,這些有先天缺陷的分?jǐn)?shù)又是有意義的——因為它們可能會被運用到學(xué)校對學(xué)院和教師的考核評價中,甚至可能在教師的聘任與職務(wù)晉升等關(guān)鍵性事項中發(fā)揮作用。這樣的數(shù)字確實會在高等教育管理中產(chǎn)生“陷阱”作用。
(三)C大學(xué)在不同年代對教師的考核要求及科研成果比較
近年來,對教師進(jìn)行以量化指標(biāo)為核心的考核,成為國內(nèi)高校的普遍做法。具體的量化指標(biāo)在不同高校之間會有差異,但宗旨都是把高校教師的工作分成若干不同的方面并指標(biāo)化。表4反映了C大學(xué)自20世紀(jì)80年代以來對教師考核變化要求。
表4 C大學(xué)在三個不同年份對教師的考核要求①若無特別說明,表4、5、6中涉及C大學(xué)的材料數(shù)據(jù),均整理自其公開出版物和部分內(nèi)部資料。
可以看出,自20世紀(jì)80年代中期以來,C大學(xué)對教師的年度任務(wù)考核內(nèi)容已發(fā)生顯著變化。20世紀(jì)80年代,學(xué)校對教師的教學(xué)工作量要求很明確,7門次的標(biāo)準(zhǔn)班級授課任務(wù)是教師工作量的主干;科研工作有時間要求,但工作內(nèi)容比較靈活,除了常規(guī)的調(diào)查研究、撰寫論文外,“科技文件材料整理歸檔、成果鑒定、成果推廣、技術(shù)后勤、課題組長組織工作等”也可以納入到教師的科研工作量計算。由此可以看出,這一時期學(xué)校對教師的科研工作要求比較寬松,基本尊重教師的自主選擇。相比80年代,90年代的教學(xué)工作量要求依然繁重,平均增加0.5門次的授課任務(wù);同時,科研工作要求也比80年代聚焦,最明顯的是有了發(fā)表論文或其他成果形式的明確要求,但成果體現(xiàn)依然允許有多種選擇。到21世紀(jì),教師的教學(xué)任務(wù)量明顯降低,但科研工作的要求更加集中明確,包括論文方面有了數(shù)量和發(fā)表刊物等級的要求,項目或獎勵有來源等級,著作也有出版社等方面的明確要求或限制。由之可以清楚看出,C大學(xué)對教師的考核要求越來越明確、集中,并向越來越數(shù)字化的方向轉(zhuǎn)變。
學(xué)校的考核要求,一定會轉(zhuǎn)化到教師的實際工作中。在不同時期的要求中,教學(xué)工作量都是“硬任務(wù)”,且教學(xué)工作量的安排,并不完全取決于教師自身,因此,一般在學(xué)期/年初,教師的教學(xué)工作會被首先落實??蒲泄ぷ鞯谋憩F(xiàn)、類型、成果等工作,與教師個體的能動水平有明顯關(guān)系。在考核要求相對模糊階段,教師的科研工作可能會表現(xiàn)為多種方式,“成果效率”可能不高;但在精準(zhǔn)要求階段,完成考核任務(wù)成為教師第一要務(wù),效率可能會有明顯提高。表5是對C大學(xué)在這三個時期教師科研產(chǎn)出的簡單對比。
表5 C大學(xué)在三個年份的科研產(chǎn)出比較表
從表5中看出,C大學(xué)在這三個階段以論文和項目為指標(biāo)的科研產(chǎn)出有明顯進(jìn)步。其中,20世紀(jì)90年代與80年代相比,80年代師均發(fā)表論文不到1篇,承擔(dān)的科研項目數(shù)也很少(0.5項);到90年代初,師均論文數(shù)略有降低(0.02篇),但承擔(dān)項目數(shù)有明顯進(jìn)步(1.56倍),再考慮到這一時期教師的教學(xué)工作量增加,可以說這一時期的教師科研產(chǎn)出還是有明顯進(jìn)步的。但更大的進(jìn)步體現(xiàn)在2014年的數(shù)據(jù)上,其中,論文和項目數(shù)比前面兩個年份都是呈倍數(shù)增長,如對1985年論文和項目數(shù)都超過2.5倍以上,對1993年則是論文數(shù)超過近3倍、項目數(shù)超過1.2倍。這充分證明了數(shù)字化的考核要求對教師的科研產(chǎn)出有相當(dāng)明顯的正面影響。
從表5的數(shù)據(jù)中,還可以發(fā)現(xiàn)反映科研質(zhì)量的另外一個指標(biāo)——獲獎成果——在三個不同年份的變化。在三個年份中,1985年的師均科研成果獲獎數(shù)最高,其后的兩個年份沒有明顯變化。進(jìn)一步查閱相關(guān)材料,發(fā)現(xiàn)1985—1990年間是C大學(xué)迄今為止獲得科研成果獎勵項目數(shù)量最多、等級最高的輝煌時期。相對來說,2014年C大學(xué)教師發(fā)表了更多學(xué)術(shù)論文,承擔(dān)了更多項目,但教師的獲獎量不僅沒有提高,反而有所下降。由此產(chǎn)生的疑問是:論文發(fā)表和承擔(dān)項目的數(shù)量和級別是否能夠反映一所大學(xué)的科研能力和水平?如果能,那么為什么以反映質(zhì)量為核心的師均成果獎勵數(shù)沒有隨著教師科研產(chǎn)出數(shù)量的增加而提高?如果不能,為什么當(dāng)前我國的大學(xué)普遍采用以論文和項目數(shù)來表示大學(xué)的科研能力?發(fā)表和承擔(dān)項目的數(shù)量及級別在用于評價大學(xué)和教師的科研能力時應(yīng)該發(fā)揮什么作用?比較C大學(xué)三個時期的考核要求,1984年對教師的科研考核指標(biāo)最軟、最難以考量和把握,教師發(fā)表的論文和承擔(dān)的項目數(shù)也最少,但科研成果的師均獲獎率最高,甚至后面還有一段時間成果獲獎的輝煌期。這對C大學(xué)來說意味著什么?2014年時學(xué)校對教師的科研工作任務(wù)要求最明確,教師和管理者都很容易把握這些指標(biāo),其后的教師科研表現(xiàn)也基本實現(xiàn)了校方的預(yù)期,但成果的質(zhì)量并沒有同步得到社會和同行的認(rèn)可。那么這是不是大學(xué)期望的結(jié)果?另外,大學(xué)教師除了可以羅列出教學(xué)時數(shù)和發(fā)表論文、承擔(dān)項目外,大學(xué)內(nèi)的很多其他諸如教學(xué)改革、調(diào)查研究、與外界溝通交流,特別是需要直指人心、打動學(xué)生的思想教育工作等,都需要教師較多的精力、時間和精神投入。如果大學(xué)把教師的工作都以數(shù)字指標(biāo)來標(biāo)示的話,那么這些難以用數(shù)字精確衡量的精神和文化層面的工作是否還需要教師承擔(dān)?如果大學(xué)和教師不能繼續(xù)承擔(dān)此類工作,大學(xué)與研究機(jī)構(gòu)之間是否還有區(qū)別?大學(xué)及大學(xué)校園存在的價值意義,培養(yǎng)學(xué)生、學(xué)術(shù)研究及推動科學(xué)進(jìn)步在當(dāng)下的意義史無前例的重大,但若因此而忽略了其在傳承和發(fā)揚人類文明、承擔(dān)改良社會風(fēng)氣之先的重任,大學(xué)的意義會黯淡許多。但傳承人類文明、改良社會風(fēng)氣的責(zé)任,過程比結(jié)果重要,且很難用結(jié)果替代過程,因此非常有必要讓大學(xué)和教師能夠感受到適度的寬松和信任,既能由此體現(xiàn)出大學(xué)對教師和學(xué)生、大學(xué)教師職業(yè)的信任和尊重,也是大學(xué)能夠獲得更多教育成果及存在價值的基本前提。
高等教育作為教育的一部分,樹立百年育人、長期教育的觀念和情懷至關(guān)重要。數(shù)字性指標(biāo)能夠在某個或某些方面幫助人們直觀地考察高等教育質(zhì)量的部分表現(xiàn),但如果過分依賴數(shù)字性指標(biāo)評價高等教育質(zhì)量,則還有很多重要問題需要討論清楚。
第一,評價中所選取的數(shù)字指標(biāo),是否有科學(xué)合理的依據(jù)?簡單地說,不同的指標(biāo)只能反映高等教育質(zhì)量的某一或某幾個方面,因此,不同的高等教育質(zhì)量評價,只能根據(jù)目的需要選取不同的指標(biāo)及指標(biāo)體系。因此,服務(wù)于不同目的的指標(biāo)選取,即使合理,也只能保證其合理性在評價某一或某幾個方面時的有限范圍。從這個意義來說,任何時候選取科學(xué)合理的指標(biāo)都是合理使用數(shù)字性指標(biāo)的第一步。但如何選擇科學(xué)合理的指標(biāo)?選擇時是否有合理的規(guī)則和流程?如何評價考察選取的指標(biāo)是否合理科學(xué)?這些則是指標(biāo)使用前需要解決的關(guān)鍵問題。以上面提到的就業(yè)率為例。這個就業(yè)率所表述的是學(xué)生在畢業(yè)后半年內(nèi)是否簽訂了工作協(xié)議,因此其核心內(nèi)涵為是否有工作協(xié)議,但工作協(xié)議不反映畢業(yè)生正在或?qū)⒁獜氖鹿ぷ鞯男再|(zhì)、類型,以及畢業(yè)生對該工作的滿意度等,也反映不出畢業(yè)前學(xué)生所學(xué)專業(yè)對其從事的工作是否有價值、價值有多大。用沒有反映學(xué)生專業(yè)價值的工作協(xié)議來評價不同學(xué)科專業(yè)的就業(yè)率,沒有邏輯意義,因此也難有衡量價值。用文章數(shù)和項目數(shù)來考核教師的合理性同樣值得懷疑。在近年來大學(xué)普遍采用量化考核指標(biāo)后,我國大學(xué)的學(xué)術(shù)發(fā)表能力和國際影響力不斷提高,但論文泡沫、論文槍手、學(xué)術(shù)造假等與考核指標(biāo)密切相關(guān)的質(zhì)疑聲不斷;大學(xué)教師作為職業(yè)化“寫手”(論文和項目申請書)的素質(zhì)和能力也有明顯提高,但大學(xué)中另一核心群體——學(xué)生——被教師關(guān)注的越來越少,質(zhì)疑高等教育質(zhì)量的外部聲音越來越多,這也是就業(yè)率、學(xué)生評教等數(shù)字性指標(biāo)能夠有市場需求的原因所在。借用克拉克?科爾所說的“高等教育越來越少只是為成人就業(yè)做準(zhǔn)備,而越來越多成為一個人整個一生的一部分”[7]264來評價畢業(yè)生就業(yè)率與高校專業(yè)設(shè)置的問題,高等學(xué)校不應(yīng)該也不需要把就業(yè)率與專業(yè)設(shè)置聯(lián)系在一起。
第二,數(shù)字本身是否真實可靠?無論是就業(yè)率統(tǒng)計,還是學(xué)生評教,都需要大范圍收集有效數(shù)據(jù)。但目前的數(shù)據(jù)發(fā)布者都沒有對數(shù)據(jù)來源的可靠性進(jìn)行說明。在我國高等教育領(lǐng)域真實數(shù)據(jù)獲取有很多現(xiàn)實障礙的情況下,采用不同方式獲取大規(guī)模數(shù)據(jù)是不可避免的,但越是在這種情況下,越需要對所獲得的數(shù)據(jù)進(jìn)行可靠性分析。特別當(dāng)這些數(shù)據(jù)指標(biāo)有可能被應(yīng)用到評價個人或群體時(如就業(yè)率可能會影響到高校的專業(yè)設(shè)置、學(xué)生和家長專業(yè)選擇,學(xué)生評教結(jié)果可能會影響到教師考核及晉升等),真實可靠是影響數(shù)據(jù)意義的核心因素。高等教育質(zhì)量是一個內(nèi)涵極其豐富的概念,對其能夠產(chǎn)生影響的因素也很多,人們對好的高等教育質(zhì)量有若干共識,不理想的高等教育質(zhì)量可能是受多種不同因素共同影響的結(jié)果,僅靠某些因素分析就對高等教育質(zhì)量進(jìn)行評價和判斷的做法是危險的。富有大學(xué)管理經(jīng)驗的克拉克?科爾還說過:“即使意圖再好,成績難以界定,也不易估價。這是為什么在美國高等教育機(jī)構(gòu)教師的晉升中至少有半數(shù)(也許多至四分之三)的教師以資歷取代成績的一個理由。鑒于極少合適的績效,又缺乏明顯的高績效的證據(jù),至少全體教師的一半(多半在研究型大學(xué)和優(yōu)秀的文理學(xué)院以外)只根據(jù)資歷晉升?!保?]173大學(xué)教師是一群以傳承文化、探索未知為基本使命的知識精英,他們之間的共性要遠(yuǎn)遠(yuǎn)少于他們之間的個性差別,而且正是因為他們之間是不同的,他們才有可能共處一個校園。承認(rèn)了他們之間的差別,就難以對不同的人、不同的工作進(jìn)行精確評價和比較,以模糊代替精確是科爾管理大學(xué)的明智選擇。
第三,精確的數(shù)字化模式是否適合高等教育質(zhì)量管理?精確管理最先出現(xiàn)在企業(yè)管理中,它對提高企業(yè)的生產(chǎn)效率、降低成本等方面富有成效。但與企業(yè)相比,高等學(xué)校承擔(dān)了育人、探索未知、服務(wù)社會、傳承文明等多項使命,因此決定了高等學(xué)校的發(fā)展是多目標(biāo)性的,其質(zhì)量維度也是多向的;更由于高等教育是以人(包括教師和學(xué)生)、文明、科學(xué)等為核心要素,就決定了高等教育難以套用精確管理的模式去進(jìn)行質(zhì)量管理,簡單地說,高等教育質(zhì)量管理需要更加復(fù)雜的系統(tǒng)管理模式。但“隨著系統(tǒng)復(fù)雜性的增加,我們做出關(guān)于系統(tǒng)行為的精確而有意義的陳述的能力將降低,越過一定閾值,精確性和有意義(或適用)幾乎成為相互排斥的特性”[8]30,以簡單的數(shù)字化指標(biāo)來判斷和指揮高等教育的做法從管理學(xué)的意義上說是不適宜的。
由于高等教育目標(biāo)和使命的多元化,決定了高等教育質(zhì)量的測量和評價是個復(fù)雜工程,用數(shù)字化指標(biāo)解釋高等教育質(zhì)量,需要若干的前提條件,包括指標(biāo)對高等教育質(zhì)量的解釋力、指標(biāo)間的邏輯關(guān)系、數(shù)據(jù)來源的真實性等。缺乏合理性和真實性的數(shù)據(jù),對高等教育質(zhì)量評價則是失真的、無效的,甚至是有害的。因此,防止高等教育質(zhì)量評價中的“數(shù)字陷阱”,對于高等教育研究者來說是非常急迫而且相當(dāng)艱巨的任務(wù)。
參考文獻(xiàn)
[1]中華人民共和國教育部.2014年全國教育事業(yè)發(fā)展統(tǒng)計公報[EB/OL].(2015-07-30)[2015-10-10].http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/s5987/201507/t20150730_196698.html.
[2]王曉陽,方軍.美國聯(lián)邦政府對高校畢業(yè)生就業(yè)市場的培育與引導(dǎo)[J].世界教育信息,2009,(1).
[3]Chris Havergal.Graduate unemployment back to pre-recession levels[EB/OL].(2015-08-27)[2015-10-10].https://www.timeshighereducation.com/news/graduate-unemployment-back-pre-recession-levels.
[4]晉浩天.教育部公布近兩年就業(yè)率較低的本科專業(yè)名單[EB/OL].(2014-10-16)[2015-10-10].http://www.jyb.cn/high/gdjyxw/201410/t20141016_601306.html.
[5]教育部.普通高等學(xué)校本科專業(yè)設(shè)置管理規(guī)定[EB/OL].(2012-09-14)[2015-10-10].http://www.moe.gov.cn/s78/A08/gjs_left/moe_1034/s3881/201305/t20130523_152287.html.
[6]王麗榮.中美高校學(xué)生評教指標(biāo)體系的比較研究[D].濟(jì)南:山東大學(xué),2008.
[7]克拉克?科爾.高等教育不能回避歷史——21世紀(jì)的問題[M].王承緒,譯.杭州:浙江教育出版社,2001.
[8]馬驥良.札德的科學(xué)思想和方法[M].西安:陜西師范大學(xué)出版社,1992.
[責(zé)任編輯:羅雯瑤]
Misleading Quantitative Evaluation in Higher Education
LIU Shao-xue
(Graduate School of Higher Education,Shanghai Jiaotong University,Shanghai 200240,China)
Abstract:The core missions of higher education as an undertaking of talent development cannot be simply evaluated in quantitative terms,though quantitative evaluation and description may sometimes offer straightforward insight into higher education and into its expression of values.However,due to the failure of instrumental reason tofully consider human emotional and spiritual values,the quantitative approach to higher education may lead to segmented and superficial misunderstandings of the core missions of higher education,and therefore inaccurate evaluation of higher education.Through an analysis of three cases,the paper discusses the possible problems caused by the quantitative description of higher education.It argues that though quantitative indicators may help interpret education quality,the use of these indicators needs a number of preconditions,including the insightful interpretation of the indicators,the relationship among different indicators,the authenticity of the data sources,etc.The illegitimate and invalid data may lead to misleading assessment of higher education.
Key words:data;indicator;quality of higher education
中圖分類號:G640
文獻(xiàn)標(biāo)識碼:A
文章編號:2095-7068(2016)01-0028-08
收稿日期:2015-12-22
作者簡介:劉少雪(1967—),女,山東萊陽人,博士,上海交通大學(xué)高等教育研究院教授,主要從事高等教育研究。