張 冉∣杭州師范大學(xué)經(jīng)亨頤教育學(xué)院
教育“管、辦、評分離”與高質(zhì)量教育體系建設(shè)的政策驅(qū)動,促使區(qū)域教育評價需求不斷提升,相關(guān)理論與實踐不斷發(fā)展,地方政府與學(xué)校期盼更加科學(xué)和有溫度的教育評價與監(jiān)測。目前,以縣域教育為對象的教育評價在理論上遵循第四代評價的基本原則,但在實踐中以量化數(shù)據(jù)收集和分析為主要方式,質(zhì)性方法在整體評價理論和實踐中面臨著應(yīng)用困境,無法發(fā)揮其應(yīng)有作用。教育評價的理論與實踐在過去一個多世紀的時間中緊密交織,既承接管理學(xué)、心理學(xué)的理論傳統(tǒng),也在后期接受了社會學(xué)、文化人類學(xué)等學(xué)科理論發(fā)展的影響,逐漸形成了以量化數(shù)據(jù)收集測算為主,輔以質(zhì)性資料收集和分析的混合評價方式。整體而言,目前針對縣域教育評價的研究,更多地體現(xiàn)在縣域教育評價指標(biāo)體系構(gòu)建、定量數(shù)據(jù)分析的策略探究等方面,對質(zhì)性方法的研究和實踐都較少?;谶@一現(xiàn)狀,針對質(zhì)性方法在教育評價中的應(yīng)用進行研究有其必要性與緊迫性??h域教育評價是國內(nèi)區(qū)域教育評價的主流形態(tài),因此研究可從縣域教育評價入手展開。
區(qū)域教育評價是教育評價理論和實踐的一個重要組成部分。受我國基礎(chǔ)教育“以縣為主”管理體制的實施以及教育深化改革的影響,縣域教育的發(fā)展與評價也日漸受到行政組織、地方社會與學(xué)界的重視。前者是評價需求的發(fā)出者、評價結(jié)果的使用者,而后兩者往往是評價的執(zhí)行者與研究者。時至今日,針對縣域范圍內(nèi)的整體性教育評價實踐仍然難以擺脫實證主義的窠臼,缺乏質(zhì)性研究與評價方法的介入。從評價需求上看,我國目前的縣域整體性教育評價需求與20世紀美國聯(lián)邦政府的教育評價需求有一定的相似性,本質(zhì)上都是社會職能部門對中央和地方政府追求教育“投入—產(chǎn)出”的有效性和教育過程科學(xué)性的回應(yīng)。受教育發(fā)展“管、辦、評分離”政策的驅(qū)動,地方政府逐漸將教育評價的功能從行政職能中剝離,并通過政府招標(biāo)、采購和委托等方式,由具有相應(yīng)資質(zhì)的事業(yè)單位組織或社會第三方組織承接并執(zhí)行。結(jié)合當(dāng)下縣域基礎(chǔ)教育評價的實踐路徑看,其在方法上受科學(xué)主義方法論影響,以量化評價為主,通過專家進校調(diào)研、訪談等途徑兼顧部分質(zhì)性材料收集,在理論上受治理理論和新公共管理理論的影響較深,強調(diào)對評價委托方負責(zé)以及對教育效能的追求。
以縣域為橫向比較單位的教育評價,一般由中央和省一級教育行政部門主導(dǎo),委托相應(yīng)的職能部門、事業(yè)單位、智庫組織或社會第三方機構(gòu)執(zhí)行。國內(nèi)縣域內(nèi)針對學(xué)校的整體性評價實踐較多,其中較為成熟的評價實踐,如上海市的“中小學(xué)發(fā)展性督導(dǎo)評估”、北京市的“規(guī)范性指標(biāo)和發(fā)展性指標(biāo)”、山東省的學(xué)?!盎A(chǔ)性評估+發(fā)展性評估”和江蘇省教育評估院的“星級高中評估”等,已經(jīng)獲得了一定的社會認同度,促進了當(dāng)?shù)貐^(qū)域的學(xué)校發(fā)展。同時,針對縣域基礎(chǔ)教育整體發(fā)展水平展開的評價以發(fā)達省份的實踐居多,如開展較早的廣東省的“縣域教育現(xiàn)代化評估”,江蘇省教育評估院的“江蘇省縣(市、區(qū))教育現(xiàn)代化建設(shè)水平評估”,以及浙江省教育現(xiàn)代化研究與評價中心近年來展開的“浙江省縣(市、區(qū))教育現(xiàn)代化發(fā)展水平監(jiān)測”等。上述縣域教育評價的規(guī)模較大,程序較為規(guī)范,取得了較好的社會影響力,也為學(xué)界開展縣域教育評價研究提供了相應(yīng)的實踐范本與觀察對象。部分研究者就縣域教育某一方面的問題進行了短時間的介入與實踐,如在縣域范圍內(nèi)進行的義務(wù)教育經(jīng)費監(jiān)管方式及其成效評價研究,縣域義務(wù)教育發(fā)展均衡性測評研究,以及縣域教師發(fā)展支持體系建設(shè)研究等。需要明確的是,大部分基于學(xué)術(shù)研究目的的調(diào)研與數(shù)據(jù)收集,雖然在研究結(jié)果上有評價功能,在調(diào)研區(qū)域上也涉及縣域,但因其研究本身并不以評價為目的,研究對象的選擇范圍較窄,實踐操作上不具備可持續(xù)性,使得整個研究過程與實踐層面上的縣域整體性教育評價仍有一定距離,只能視為教育研究者對評價實踐的短時間介入,而非專業(yè)、可持續(xù)的縣域教育評價活動。
有研究者認為,盡管近年來我國多地陸續(xù)成立了專業(yè)化的評估機構(gòu),但從地位上看這些評估機構(gòu)依附于政府生存,從功能上看其是行政管理的工具。經(jīng)過“管、辦、評分離”等公共政策的推動,近十年來國內(nèi)教育評價組織的專業(yè)度和獨立程度都得到了大幅提升,但在縣域教育的整體性評價中仍存在諸多問題。
1.以量化數(shù)據(jù)測算為基礎(chǔ),強調(diào)判斷與排序
從教育評價實踐的可操作性角度出發(fā),量化數(shù)據(jù)測算成為當(dāng)下國內(nèi)縣域基礎(chǔ)教育整體評價的主流方式有其必然性。在硬件指標(biāo)上,評價通過學(xué)校占地規(guī)模、功能室的配置、圖書館設(shè)置和計算機的數(shù)量等,對學(xué)?;A(chǔ)設(shè)施和辦學(xué)條件進行評斷;在軟件指標(biāo)上,評價通過對教師群體骨干教師數(shù)、脫產(chǎn)培訓(xùn)時長、境外培訓(xùn)次數(shù)、發(fā)表論文數(shù)量,學(xué)生群體標(biāo)準(zhǔn)化測試成績、體育素質(zhì)、近視率和肥胖率等數(shù)據(jù)進行分析排序。通過相應(yīng)的權(quán)重分配,這些硬性指標(biāo)測算在很大程度上促進了地方行政部門對學(xué)?;A(chǔ)建設(shè)投入的提升,推動標(biāo)準(zhǔn)化學(xué)校的建設(shè)發(fā)展。在縣域教育發(fā)展不均衡、地方教育資源投入尚不能滿足基本需求的情況下,這種評價有助于提升地方政府對教育投入的重視程度,改善教育基礎(chǔ)設(shè)施和師資條件。但需要注意的是,這種評價常常導(dǎo)致評價結(jié)果以判斷和排序的方式呈現(xiàn),易對評價對象造成負面影響。
2.以質(zhì)性評價為輔助,忽視評價雙方的互動對話
由于教育評價實踐環(huán)境的復(fù)雜性,評價過程中會需要借助問卷調(diào)查、能力水平評價、專家咨詢和訪談等方式,產(chǎn)生大量復(fù)合型異構(gòu)量化數(shù)據(jù)。僅數(shù)據(jù)類型,就包括基本數(shù)字、比率、絕對值和相對值等多種;資料形式,又表現(xiàn)為數(shù)字資料、訪談資料、觀察資料、實物資料和音視頻資料等。進一步而言,評價專家和被評價對象的互動,價值取向、評價經(jīng)驗和評價智慧也是難以直觀呈現(xiàn)的重要“數(shù)據(jù)”。從這一點看,縣域教育評估中的質(zhì)性評價仍然處于從屬和輔助位置,功能體現(xiàn)為對量化數(shù)據(jù)分析的注解和深入闡釋,無法發(fā)揮其應(yīng)有的功能。特別是當(dāng)數(shù)據(jù)分析結(jié)果與社會公眾認知產(chǎn)生矛盾時,質(zhì)性評價無法提供相應(yīng)的解釋支撐。
3.以評價者為主體,被評價者全面缺位
現(xiàn)有的縣域教育整體評價中,將學(xué)校整體評價和課程評價、教師評價、學(xué)生評價相分離,分成不同模塊或指標(biāo)進行權(quán)重量化,將去情境化、追求普遍化的科學(xué)主義研究,運用到對日趨復(fù)雜的基礎(chǔ)教育學(xué)校評價探索中,已經(jīng)造成被評價者在整個評價過程中的缺位,乃至失蹤。從現(xiàn)行縣域教育評價指標(biāo)體系的構(gòu)成看,都呈現(xiàn)出過于關(guān)注資源的投入,而忽視教育產(chǎn)出和師生體驗的特征,被評價者的意見和建議難以通過數(shù)據(jù)分析呈現(xiàn),使得評價結(jié)果只能代表評價者意圖,對區(qū)域教育循證研究和學(xué)校改進的實際作用有限。
在上述縣域教育評價的特征之外,質(zhì)性研究通過收集非數(shù)量化資料信息,并運用描述分析方法得出評價結(jié)論,使得方法對評價者本身的要求較高,需要評價者適應(yīng)分析主體多元、標(biāo)準(zhǔn)多元的情境。在評價主體能力、經(jīng)驗和學(xué)術(shù)背景難以勝任的情況下,它幾乎必然與“主觀”“人為”“缺乏操作性”等特征聯(lián)系在一起,因而在縣域教育評價實踐中的操作層面也存在著諸多困境。
1.重視經(jīng)驗判斷,缺乏應(yīng)用技能
就評價群體內(nèi)部而言,我國教育評價者所接受的定量和質(zhì)性評價的技能訓(xùn)練都是較少的。近二十年來,以德國、英國等為代表,國際各國已經(jīng)逐漸形成開發(fā)并使用分析軟件輔助質(zhì)性資料分析的研究慣例。相關(guān)分析軟件和工具已有近五十種,而國內(nèi)教育評價者對主流分析軟件的熟悉程度與使用頻度依然較低。在實踐操作中,只有部分高校研究者能熟練操作Nvivo、ATLAS.ti和MAXQDA等主流質(zhì)性分析工具,多數(shù)教育評價參與者對輔助軟件的掌握程度不足,其主要憑借自身經(jīng)驗對訪談、觀察而得的質(zhì)性資料進行判斷,缺乏相應(yīng)技能。
2.重視局部質(zhì)性評價,忽視整體質(zhì)性評價
為了“平衡”量化數(shù)據(jù)分析結(jié)果的缺陷和不完整性,多數(shù)縣域教育評價設(shè)計了專家進校觀察、訪談和查看臺賬資料等“質(zhì)性”或“定性”環(huán)節(jié),但往往為了追求“客觀”而采取“瞎子摸象”式的評價程序,即每位評價專家只負責(zé)對幾項指標(biāo)進行材料收集分析與評價,將學(xué)校和區(qū)域教育工作割裂成分散的片段,失去了整體視野。這種符合工具理性,但又“欠科學(xué)”的評價程序與評價自身生命力內(nèi)在要求的科學(xué)性、合理性之間產(chǎn)生了失衡。
3.重視評價標(biāo)準(zhǔn)統(tǒng)一性,忽視評價情境特殊性
學(xué)理上,多維目標(biāo)下的教育評價一直是評價研究與實踐操作的難點,而縣域整體性教育評價的目標(biāo)恰恰是復(fù)雜而豐富的。無論是國家層面展開的縣域義務(wù)教育優(yōu)質(zhì)均衡縣評價,還是各省、市展開的教育現(xiàn)代化監(jiān)測與評估,其目標(biāo)中的“優(yōu)質(zhì)均衡”和“現(xiàn)代化”均有著多層次的內(nèi)涵?,F(xiàn)有的質(zhì)性方法為了在評價中體現(xiàn)自身的“科學(xué)性”和“去價值性”,習(xí)慣于向統(tǒng)一標(biāo)準(zhǔn)靠攏,忽視了具體教育情境下的“人”“事”“物”的特殊性,使得質(zhì)性方法的特色被淡化。以相同的價值之尺衡量不同自然條件和社會環(huán)境下的縣域教育發(fā)展水平,必然出現(xiàn)“千校一面”的價值導(dǎo)向。
如果縣域基礎(chǔ)教育整體性評價的目的,僅僅是用來為政府決策及資源分配投資等提供基礎(chǔ)資料和依據(jù),希望通過評價過去的教育活動過程,達到判斷等級、定合格或區(qū)分優(yōu)劣的目的,那么現(xiàn)行的各類量化評價方法可以基本滿足要求。但站在教育生態(tài)發(fā)展的層面上,教育評價的目的遠不止簡單排序和判斷,重點是幫助被評價者獲得提升。出于這一目的,評價者就必須關(guān)注評價對象在具體社會環(huán)境、學(xué)校情境中發(fā)揮作用,產(chǎn)生理念,得到反饋,逐步通過建構(gòu)和體驗形成知識,并通過描述性、解釋性的語言對其行為及其原因和意義作出判斷。教育生態(tài)學(xué)視野下的評價,應(yīng)該將基礎(chǔ)教育評價作為一個有機的整體,將“管、辦、評”作為一個有機的整體,將教育發(fā)展和社會發(fā)展看作一個有機的整體。要實現(xiàn)上述目標(biāo),可以從下述路徑進行探索。
著力突出質(zhì)性評價的理論特性。當(dāng)下,部分發(fā)達國家的公共教育質(zhì)量測評已經(jīng)與數(shù)據(jù)分析產(chǎn)生了多層次結(jié)合,并形成跨國聯(lián)合研究的趨勢,成為一門新的社會科學(xué)。目前,國內(nèi)教育領(lǐng)域的大數(shù)據(jù)研究主要為理論探討,對于教育大數(shù)據(jù)的界定、來源、挖掘技術(shù)等相關(guān)研究尚在起步階段,實證研究甚少。隨著大數(shù)據(jù)技術(shù)的成熟和云計算硬件設(shè)備的完善,教育評價基礎(chǔ)數(shù)據(jù)的收集、填報和分析將不再是困擾教育評價實踐者的難題,甚至可由日趨完善的運算軟件和人工智能協(xié)同完成,而評價者的工作重心將逐步轉(zhuǎn)向評價價值導(dǎo)向的確定、評價標(biāo)準(zhǔn)的制訂和評價成果的使用。在這一假想基礎(chǔ)上,量化數(shù)據(jù)測算的重要性將開始降低,而評價者和被評價對象作為“人”的主動性,以及質(zhì)性評價背后的建構(gòu)主義理論特性將進一步被凸顯。換而言之,未來的縣域教育評價,不僅需要考慮地域教育發(fā)展結(jié)構(gòu)和水平等教育自身的問題,還涉及不同地區(qū)間的文化差異、經(jīng)濟發(fā)展水平、人口結(jié)構(gòu)等差異問題,而針對這些問題的討論,正是質(zhì)性研究與評價方法之所長,也是質(zhì)性評價在縣域教育評價中的突破口。
持續(xù)豐富質(zhì)性評價資料的收集形式。現(xiàn)有的質(zhì)性評價資料收集方式是較為被動的,受時間、場地限制,評價者難以對所評對象有深入的了解與認識,更無法針對情境進行描述與分析,使得質(zhì)性評價有名無實,不斷失語。要改善這一情況,評價者應(yīng)通過文本分析、比較研究、問題查找、實地考察、焦點團體、深度訪談與傾聽、扎根理論等多種質(zhì)性方法,進行材料收集,打破以往以查閱臺賬資料為主的被動方法,增加學(xué)校觀測點,收集與整理更為全面的質(zhì)性數(shù)據(jù)。此外,通過區(qū)域教育質(zhì)量評價,建立與地方公眾的教育信息溝通機制,是各國區(qū)域教育評價結(jié)果運用的重要目的之一。質(zhì)性評價結(jié)果的展現(xiàn)形式更為多樣,過程更加強調(diào)參與性,評價者可以通過官方與地方公眾的教育信息溝通機制收集資料,深入了解區(qū)域教育輿情中的難點與熱點,更加有的放矢地提出政策建議和意見。
要不斷增強質(zhì)性評價方法的可操作性。如上所述,現(xiàn)代區(qū)域教育評價的困境,在于如何將分散在教育各領(lǐng)域、各部門的業(yè)務(wù)數(shù)據(jù),匯聚形成對學(xué)校現(xiàn)代化目標(biāo)評估的有用信息,改變宏觀和中觀層面教育評價中出現(xiàn)的“有零散信息資源、缺綜合分析手段”的局面。針對這一問題,質(zhì)性評價方法的主張者和實踐者需要進一步熟悉質(zhì)性分析輔助軟件和量化分析方法的使用,并通過不同途徑向教育主管部門、第三方評價組織和高校智庫進行宣傳、引導(dǎo)和培訓(xùn),不斷增強質(zhì)性評價方法的可操作性。高校與教育科研組織可以利用自身優(yōu)勢,有計劃、有方向地針對地方教育督導(dǎo)和評價部門人員進行專業(yè)培訓(xùn)。面對量化數(shù)據(jù)標(biāo)準(zhǔn)的單一性,質(zhì)性評價的優(yōu)勢在于評價本身是一套體系而非線性數(shù)字,有更高的靈活度。因此,在技術(shù)上,質(zhì)性評價要結(jié)合模糊評價、驗證性因子分析、相關(guān)分析等方法,建構(gòu)縣域教育評價的多源異構(gòu)數(shù)據(jù)的定量分析模型和定性數(shù)據(jù)綜合分析體系,推動質(zhì)性評價可操作性的提升與實用性的增強,避免與定量分析方法產(chǎn)生隔離。
要著力構(gòu)建有利于被評估者主動參與的質(zhì)性評價機制。學(xué)校、教師和學(xué)生,作為評估客體,也應(yīng)該厘清其各組成部分的價值關(guān)系,明確哪一部分在客體中居于核心地位,并在此基礎(chǔ)上協(xié)商各部分的關(guān)系,進行有效整合。在這一過程中,學(xué)校應(yīng)該建立定期的“內(nèi)部評估”制度,選擇適合本校實際的評價方案,監(jiān)測學(xué)校表現(xiàn),評價工作效能,形成評價報告。相對于評價專家而言,學(xué)校管理者和教師群體是學(xué)校日常教學(xué)的親歷者與組織者,對學(xué)校和地方教育所存在的問題有著自己的理解與闡釋,他們的主動參與將使得評價結(jié)果有更好的使用價值,也能夠促進縣域教育評價在指標(biāo)體系上的不斷創(chuàng)新。
綜上所述,區(qū)域教育評價,其主要功能不是選拔和甄別,而是側(cè)重指導(dǎo)和改進,為學(xué)校和教研部門提供教育教學(xué)診斷信息,從學(xué)生發(fā)展結(jié)果的角度分析學(xué)校教育和學(xué)科教學(xué)的優(yōu)勢和不足,為促進教育教學(xué)改進提供科學(xué)支撐。由于教育評價的復(fù)雜性,單純依靠某一領(lǐng)域?qū)<一蚰骋宦毮懿块T難以分析其狀態(tài),預(yù)測其走向,評價者需要綜合分析多領(lǐng)域、多層次數(shù)據(jù)信息,依托多系統(tǒng)多模型進行評價,實現(xiàn)定性與定量相結(jié)合。在當(dāng)下注重數(shù)據(jù)收集與分析的情況下,研究者與實踐者更要重視實地觀察與質(zhì)性資料的收集。
普利高津在耗散結(jié)構(gòu)理論中提出過系統(tǒng)平衡的經(jīng)典命題,他指出:非平衡態(tài)是有序之源。平衡和線性平衡只能使系統(tǒng)成為一種永久穩(wěn)定的死結(jié)構(gòu),但系統(tǒng)的開放性,使得系統(tǒng)與外界進行物質(zhì)與能量的交換,使得系統(tǒng)具有非平衡性的漲落特性。換而言之,基礎(chǔ)教育的縣域整體性評價要允許非平衡結(jié)構(gòu)的存在,肯定其積極影響,并通過質(zhì)性方法尋找其產(chǎn)生的原因。量化評價方法對不平衡的數(shù)據(jù)、不顯著的相關(guān)性、缺乏效率的教育“投入—產(chǎn)出”比,往往持有敵意。但是,受社會經(jīng)濟環(huán)境的制約和歷史文化因素的影響,縣域間與縣域內(nèi)基礎(chǔ)教育發(fā)展不均衡是一個既成的歷史事實,也是將在未來相當(dāng)長時間內(nèi)存在的現(xiàn)象。研究者與實踐者需要協(xié)同作業(yè),通過量化與質(zhì)性的研究方式,拓展、修正甚至推翻原有的“理論—實踐”相分離的現(xiàn)狀,實現(xiàn)縣域教育評價中理論與實踐的互生?!酲?/p>