李雯雯
摘 要:廣受全國各界關(guān)注的學(xué)科評估作為公共項目實施績效的一種周期性評價,大量高校采取了“棄卒保車”的迎評策略,即安排本校相對弱勢學(xué)科放棄參評,將其學(xué)科建設(shè)中的人力、物力資源打包到其他學(xué)科中參評或者直接通過撤銷該學(xué)科的方式來力圖獲得以A類學(xué)科為代表的“亮眼”績效。這種“棄卒保車”策略是否真的能提升所在高校的評估結(jié)果?本文通過對第四次學(xué)科評估中“985高?!钡臄?shù)據(jù)進行檢驗,發(fā)現(xiàn)學(xué)科棄評策略對“亮眼”績效不僅沒有提升,反而有顯著的負效果,最終“賠了夫人又折兵”;而學(xué)科撤銷策略則微弱地提高了“亮眼”績效。針對這種情況,我們以即將到來的第五次學(xué)科評估為典型代表,對公共項目績效評價提出建議。
關(guān)鍵詞:公共項目;績效評價;學(xué)科評估
一、引言
在一個社會主義大國的轉(zhuǎn)型過程中,政府的宏觀調(diào)控是中國奇跡的關(guān)鍵“源動力”,這種源動力生產(chǎn)作用的機制就在于政府財政支持的公共項目,比如“西部大開發(fā)”、“振興東北”等經(jīng)濟振興項目;“精準扶貧”、“退耕還林工程”等社會發(fā)展項目;“211工程”、“985工程”、“雙一流建設(shè)”等教育振興項目。各類公共項目之所以能夠達到或者超出預(yù)期的效果,很大程度上緣于科學(xué)的績效評價和監(jiān)控問責,能夠及時地了解公共項目實施情況,保證公共財政資金受托責任的履行。通過評價干預(yù),保證公共項目實現(xiàn)人民所委托的目標。
績效評價和監(jiān)控問責作為科學(xué)的糾偏工具,在最大程度上實現(xiàn)了項目全過程中的“后置約束”,但盡管如此,仍有大量的“改善人類生活的項目”失敗了,其失敗原因各有不同,但其中一個重要的誘因就是在績效評價和監(jiān)控問責中存在著博弈問題。一般而言,一個項目如果在績效評價中有一些“亮眼”點,上級部門往往就不再追究未做好的方面,甚至還公開鼓勵那些做的好的地方。而另一部分公共項目正是在這些刻意營造的“亮眼”績效的影響下,意圖將“暈輪效應(yīng)”發(fā)揮到最大,但結(jié)果卻往往并不盡如人意。有些公共項目在評估過程中將“卒”拋棄也未能保住“車”,不但沒能遮丑,反而“竹籃打水一場空”。在這場博弈中,無論“棄卒”能否“保車”,這種做法都便利了公共項目的承擔者,但大大違背了公共財政經(jīng)費設(shè)置的目標,損害了國家利益。若每一個公共項目都刻意以“一白遮百丑”的方式應(yīng)付績效評價,最終所有項目的積累便會產(chǎn)生系統(tǒng)性問題,引致國家治理的體系性失敗。為此我們就需要去偵測現(xiàn)實中的“迎評策略”,不被“亮眼”績效蒙蔽了雙眼,找出看似華麗的結(jié)果后面的不足,為我國公共項目的整體性提升找到解決辦法。
學(xué)科評估結(jié)果實際上就是公共項目實施績效的一種周期性評價。以2017年結(jié)束的教育部第四次學(xué)科評估為例,其屬于教育部學(xué)位與研究生教育發(fā)展中心對2011-2015年間各校年度教育經(jīng)費使用情況的績效評估。學(xué)科評估工作在顯著促進我國高等教育事業(yè)發(fā)展的同時,其背后也隱藏著危機和隱患,即作為公共財政在學(xué)科建設(shè)上的檢驗評價,第四輪學(xué)科評估中存在著所謂的“迎評策略”。學(xué)科評估前各校大規(guī)模撤銷已有的學(xué)科,意圖通過撤銷某些相對“弱勢”的學(xué)科換來評估結(jié)果的優(yōu)異。比如浙江大學(xué)共撤銷了34個學(xué)科,北京理工大學(xué)撤銷了20個學(xué)科,華中科技大學(xué)撤銷了16個學(xué)科。除了主動撤銷學(xué)科,各個學(xué)校還廣泛采用了“拆東墻補西墻”的方式,故意系統(tǒng)性的不讓某些學(xué)科參與評估,卻將這些學(xué)科對應(yīng)的資源(人員、經(jīng)費、設(shè)備、實驗與辦公場所等等)分攤、組合到其他學(xué)科上去以人為制造“亮眼”績效??紤]到各校的學(xué)科發(fā)展經(jīng)費主要來源于公共財政經(jīng)費,同時考慮到第四次學(xué)科評估是對“985工程”和“211工程”實施情況的一種評估,故而本文以第四次學(xué)科評估為研究對象,探索高校的“棄卒保車”策略是否達到了預(yù)期效果,進而探討公共項目績效評價中這種策略的形成原因,并對即將到來的第五次學(xué)科評估工作提出合理建議。
二、文獻述評
通過搜索CNKI和SSCI的相關(guān)文獻,發(fā)現(xiàn)國內(nèi)外對于公共項目評估的研究主要聚焦在公共項目績效評價的規(guī)范性、有效性以及局限性等方面。一部分學(xué)者意圖運用科學(xué)方法對某項具體的公共項目進行測評,Zong(2019)用泰爾指數(shù)法測評了我國“985計劃”對“985大學(xué)”的出版產(chǎn)出的積極影響[1];馬輝(2007)提出了“過程—內(nèi)容分解法(Process-Content Breakdown)+Delphi法”的指標體系兩階段構(gòu)建方法[2];胡芳提出基于熵權(quán)法及多準則妥協(xié)解排序法(KIKOR)來綜合決策者的偏好,從而進行有效的風(fēng)險評估[3]。
圍繞公共項目績效評估的有效性,Liu(2018)研究發(fā)現(xiàn),國內(nèi)外研究均發(fā)現(xiàn)公共基礎(chǔ)設(shè)施項目中基于公私合作的PPP(Public—Private Partnership)模式可以有效地提高公共項目建設(shè)和評估效率,Liu(2018)進一步的研究表明,正確選擇評級指標對建設(shè)高效政府、提高公共項目績效有積極意義[4]。
在對公共項目績效評價管理漏洞的探究中,尚虎平(2012)認為我國公共財政資助的公共項目存在“邊際效率遞減”和“低效、無效與揮霍”的問題[5];Zong(2019)認為“985高?!表椖康膶嵤┦沟酶咝i_始出現(xiàn)同質(zhì)化趨勢。Zhang(2019)探討了公共服務(wù)項目中的參與式工具——基于網(wǎng)絡(luò)的規(guī)劃支持系統(tǒng)(PSS),反思了我國目前計算機知識水平低、互聯(lián)網(wǎng)接入有限以及公眾參與國家事務(wù)的傳統(tǒng)欠缺[6]。
這些研究試圖從評估方法的規(guī)范、評估效率的提高、評估漏洞的洞察等方面厘清我國公共項目績效評價的圖景,洞悉其中的諸多問題,是難能可貴的“苦口良藥”,但是很少有研究將目光聚焦在公共項目績效評估的迎評策略上,事實上,公共項目評估的結(jié)果勢必與公共財政資金的流向、國家扶持政策的傾斜緊密相關(guān),因此被評估對象所采用的迎評策略恰恰是影響公共項目評價準確性、公正性和客觀性的關(guān)鍵因素,因此這是一個不能被忽視的領(lǐng)域。鑒于這種情況,本文力圖從學(xué)科評估這種典型的公共項目績效評價入手,探討在評價過程中的迎評策略來彌補目前學(xué)界的這種不足,以實證的眼光打破利益的桎梏,科學(xué)地把握公共項目績效評價的內(nèi)在規(guī)律。
三、研究設(shè)計
本文的研究目標是厘清我國“棄卒保車”式公共項目績效評價在實施過程中的實際效果、因果機制和突破路徑等問題,并以此為方向?qū)磳㈤_展的第五次學(xué)科評估提出合理建議。鑒于我國公共項目種類繁多,我們以最近的一次學(xué)科評估為代表對其進行研究。
(一)樣本框來源
公共項目作為實現(xiàn)公共利益、推進國家建設(shè)的基礎(chǔ)性活動,在社會經(jīng)濟發(fā)展中發(fā)揮著至關(guān)重要的作用。國家的公共事務(wù)常依托公共項目展開,因此對公共項目的評估過程也是測量國家公共事務(wù)實施效度的過程?!?85工程”“211工程”等高等教育領(lǐng)域的公共項目是我國在助力現(xiàn)代化發(fā)展道路上的有力探索,對我國教育事業(yè)的發(fā)展所起到的作用是相當深遠的。尤其是被冠以“985”的高校,代表了我國最先邁向世界一流大學(xué)的第一梯隊。第四次學(xué)科評估具有覆蓋面積廣、參評比例高、評估結(jié)果按“ABC分檔”呈現(xiàn)的特點,本文中所重點分析的“亮眼”績效都與A類學(xué)科相關(guān),在這部分高校中,本身具備較強綜合實力和學(xué)科實力的“985高?!闭紦?jù)了“亮眼”績效的絕大多數(shù),鑒于此,本文截取“985高?!弊鳛榉治龅臋M截面。需要說明的是,得到A類評估結(jié)果的學(xué)科不只局限于“985高?!?,部分“211高?!焙推渌咝R舱紦?jù)了少部分比例,這可能導(dǎo)致我們的研究存在一定的系統(tǒng)性偏誤(Bias),但從我國目前對公共項目績效評價的現(xiàn)狀出發(fā),相比于缺乏數(shù)據(jù)資料支撐的研究,有數(shù)據(jù)資料支撐的實證研究也符合“漸進真理”的做法。另外,本研究的這些不足,也在一定程度上是未來進一步研究的新的邏輯起點。
(二)數(shù)據(jù)搜集
本研究的目標是以學(xué)科評估為例,厘清我國在公共項目績效評價程序中存在的“棄卒保車”問題。為了搜集到更加全面、準確的資料,本研究采取了以下方式來獲得第四次學(xué)科評估的撤銷數(shù)和棄評數(shù)的學(xué)科數(shù)據(jù)。
(1)學(xué)科撤銷數(shù)數(shù)據(jù)查詢方法
通過在線查閱官方公示材料,獲得可信可靠的撤銷學(xué)科的數(shù)據(jù)。比如2016年10月19日國務(wù)院學(xué)位委員會正式公布的《關(guān)于下達2016年動態(tài)調(diào)整撤銷和增列的學(xué)位授權(quán)點名單的通知》,查詢到共有25個省份的175所高校大幅撤銷576個學(xué)位點,包括大量博士學(xué)位授權(quán)點。此外,共有25個省份的178所高校增列了366個學(xué)位點。從中摘取出“985高校”在撤銷學(xué)科方面的數(shù)據(jù),得到35所“985高校”中有22所在此次調(diào)整中進行了撤銷學(xué)位點的調(diào)整,撤銷總計數(shù)目達到193個,即12.5%的高校占據(jù)了此次撤銷學(xué)科總數(shù)的33.5%。
(2)學(xué)科棄評數(shù)數(shù)據(jù)搜集方法
查詢棄評學(xué)科數(shù)據(jù)的方法與查詢撤銷學(xué)科數(shù)據(jù)的方法不太一樣。我們將棄評數(shù)定義為:棄評數(shù)=一級學(xué)科數(shù)-參評學(xué)科數(shù),問題就此轉(zhuǎn)化為查詢各高校的一級學(xué)科數(shù)與參評學(xué)科數(shù)。首先通過在線比對查詢,登陸中國學(xué)位與研究生教育信息網(wǎng),以高校為單位查詢到第四次學(xué)科評估的結(jié)果,與各個高校官網(wǎng)在學(xué)科簡介、招生簡章等中所列出的學(xué)科做出比對,得到各個高校在學(xué)科評估中一級學(xué)科數(shù)和參評學(xué)科數(shù)。第二,在“百度”搜索引擎中檢索網(wǎng)絡(luò)數(shù)據(jù),與第一步所查詢到的數(shù)據(jù)進行反復(fù)比對。相比而言,百度搜索的數(shù)據(jù)來源更多,可以很好地彌補單一途徑比對的局限性。
(3)A類學(xué)科數(shù)數(shù)據(jù)查詢方法
與上述方法雷同,我們通過中國學(xué)位與研究生教育信息網(wǎng)公布的結(jié)果,可以準確地查詢到在第四次學(xué)科評估中各個“985高?!鲍@得A類學(xué)科的準確信息。以北京大學(xué)為例,我們根據(jù)官網(wǎng)公布的結(jié)果,在理、工、農(nóng)、醫(yī)等7大類95個一級學(xué)科中查到北京大學(xué)共有A類學(xué)科35個。其他“985高?!蔽覀円膊扇×诉@種簡單但非常準確的方式獲取A類學(xué)科數(shù)數(shù)據(jù)。
(三)技術(shù)路線
隨著國家對教育的日益重視,教育經(jīng)費投入也逐漸加大。2016年財政性教育經(jīng)費投入首超3萬億元,比上年增長7.36%,體現(xiàn)了國家實施科教興國戰(zhàn)略的堅定信念,為教育事業(yè)發(fā)展鑄就穩(wěn)固的物質(zhì)基礎(chǔ)。不斷增長的公共資金投入固然是高等教育事業(yè)發(fā)展的前提條件,但這些承擔全面委托責任的資金需要通過公共項目的實施來達到提高教育質(zhì)量的目的,需要及時的績效評估來衡量效果并且根據(jù)評估結(jié)果來確定下一階段的發(fā)展目標和分配下一階段的教育經(jīng)費。盡管第四次學(xué)科評估相比于前三次,已經(jīng)采用了分級分檔而不是分數(shù)排名的方式,旨在避免因分數(shù)和排名而引起的無序競爭,這種以提升學(xué)科水平為初衷的戰(zhàn)略指向是非常值得稱道的。有了正確的風(fēng)向標,就應(yīng)該將考察評估的重點放在評估過程中。眾所周知,盡管沒有具體的分數(shù)和令人敏感的排名,但與A相關(guān)的學(xué)科檔次依然是各學(xué)科建設(shè)無可爭議的領(lǐng)頭羊,學(xué)科建設(shè)中A檔次劃分越多,隨之而來的,各高校能夠得到的財政資金的扶持力度也就越大,同時高校的名氣就越大,有更多的發(fā)言權(quán)和社會影響力。一系列的利好優(yōu)勢使得各高校在評估的過程中采取不同的應(yīng)對策略以期得到更多的“亮眼”績效。除了全面迎評,還有高校采用策略性迎評的方式,除了根據(jù)國務(wù)院學(xué)位委員會《關(guān)于下達2016年動態(tài)調(diào)整撤銷和增列的學(xué)位授權(quán)點名單的通知》來撤銷和增列相關(guān)學(xué)科以外(從數(shù)據(jù)看,撤銷的多,增列的少),還有采用棄評和打包參評的方式,讓重點學(xué)科“集萬千寵愛于一身”,盡可能匯集多的人、財、物等優(yōu)勢,以期在學(xué)科評估中得到好的成績。一般來說,全面迎評的方式比較客觀、真實地反映了當下高校各個學(xué)科建設(shè)的水平,通過學(xué)科評估的結(jié)果制定下一階段的發(fā)展戰(zhàn)略,這樣我國學(xué)科建設(shè)可以進入“資金受托—學(xué)科建設(shè)—科學(xué)評估—提高績效”的良性循環(huán)。但如果采用策略性評估,從考察國家高等教育經(jīng)費的使用效果角度,則達不到相應(yīng)的效果,屬于系統(tǒng)性失誤。如圖1所示。
綜上,本研究的技術(shù)路線依次為:大學(xué)類型選擇→考評結(jié)果數(shù)據(jù)收集→數(shù)據(jù)整理→整合統(tǒng)計分析→統(tǒng)計結(jié)果呈現(xiàn)→棄卒保車因果機制探析→公共項目績效評價政策建議。
四、“棄卒保車”式績效評價統(tǒng)計結(jié)果
(一)統(tǒng)計檢驗方法確定
本研究意圖厘清高校在學(xué)科評估中對本校學(xué)科的撤銷和棄評等做法是否對學(xué)科的A類學(xué)科數(shù)目有顯著的影響,并進一步探究這種影響是正向的還是負向的。按統(tǒng)計學(xué)上的傳統(tǒng)做法,多元回歸是確定影響因素的常用方式。但當研究的統(tǒng)計樣本數(shù)量沒有豐富到能夠確定總體樣本的分布情況時,往往會產(chǎn)生“偽回歸”的問題。因此我們選擇更為直觀的測量相關(guān)系數(shù)的方法來匯報統(tǒng)計結(jié)果,用以反映變量之間相關(guān)關(guān)系的密切程度。統(tǒng)計學(xué)三大相關(guān)系數(shù)有皮爾森相關(guān)系數(shù)(Pearsoncorrelationcoefficient)、斯皮爾曼相關(guān)系數(shù)(Spearman Rank Correlation)和肯德爾相關(guān)系數(shù)(Kendllstau-b Rank Correlation),由于我們抽取的數(shù)據(jù)存在出現(xiàn)異常值的可能性(部分高校在撤銷學(xué)科上的數(shù)據(jù)可能為0),同時未必符合總體正態(tài)分布的情況,總體上數(shù)據(jù)形態(tài)符合斯皮爾曼相關(guān)系數(shù)的要求。
(二)統(tǒng)計結(jié)果及研究結(jié)論
本研究的目標是通過斯皮爾曼相關(guān)系數(shù)法,利用高校學(xué)科棄評數(shù)、撤銷數(shù)等指標分別計算出其對A類亮眼績效的影響,在此基礎(chǔ)上探索以學(xué)科評估為典型代表的我國公共項目績效評價的現(xiàn)狀和問題,對即將到來的第五次學(xué)科評估提出合理建議。
(1)統(tǒng)計數(shù)據(jù)整合
通過前文提到的數(shù)據(jù)搜集的方法,我們梳理了全國“985高?!睂W(xué)科撤銷數(shù)、棄評數(shù)和A類學(xué)科數(shù),如表1所示。
(2)按照上文所述的技術(shù)路線,我們最終確定了學(xué)科撤銷數(shù)與A類學(xué)科數(shù)、學(xué)科棄評數(shù)與A類學(xué)科數(shù)之間的對應(yīng)數(shù)據(jù)。雖然從絕對意義上說,39個數(shù)據(jù)屬于小-N研究模式,但從統(tǒng)計學(xué)規(guī)律而言,超過30個要素的樣本就開始呈現(xiàn)正態(tài)分布屬性,逐漸會表現(xiàn)出一定的規(guī)律性,因此,我們的統(tǒng)計結(jié)論也具有一定的規(guī)律性。我們將統(tǒng)計檢驗結(jié)果總結(jié)為表2與表3。
表2 A類學(xué)科數(shù)與學(xué)科棄評數(shù)的斯皮爾曼相關(guān)系數(shù)
表3 A類學(xué)科數(shù)與學(xué)科撤銷數(shù)的斯皮爾曼相關(guān)系數(shù)
從表2可以看出,A類學(xué)科與學(xué)科棄評數(shù)的相關(guān)系數(shù)顯著為負(p=0.01),且其值竟然達到了-4.28,這顯示了其“副作用”還非常大。也就是說,雖然這些高校企圖通過將某些“見不得人”的學(xué)科隱藏,秘不示人,采用放棄評估的做法,以保證本校A類學(xué)科的數(shù)量,但是從統(tǒng)計檢驗結(jié)果看,并沒有實現(xiàn)高校“棄卒保車”的愿望,兩者之間呈現(xiàn)出顯著的負相關(guān),可以說是“賠了夫人又折兵”。
從表3可以看出,A類學(xué)科數(shù)與學(xué)科撤銷數(shù)之間存在正相關(guān)關(guān)系,就是說高校在學(xué)科評估中對學(xué)科的撤銷促進了A類學(xué)科數(shù)的提升,但是這種提升和促進是微弱的,在統(tǒng)計學(xué)意義上并不顯著。
(三)原因分析
第一,在學(xué)科評估中,高校的棄評策略是指將某些相對弱勢學(xué)科的資源拆分,集合到其他學(xué)科中,意圖臨時打造出強勢學(xué)科參與評定,例如,因為電子信息工程專業(yè)中集合了很多物理學(xué)的學(xué)科知識,如果高校通過權(quán)衡發(fā)現(xiàn)該專業(yè)的實力不足以取得A的成績而將該專業(yè)的師資力量、實驗設(shè)備、論文發(fā)表情況等拆分到本校相對強勢的物理學(xué)科中,那么該高校就以犧牲電子專業(yè)為代價,意圖提高物理學(xué)專業(yè)在評估中的實力來取得“亮眼”績效。諸如此類的迎評策略從表層邏輯上看是合理的,可以使得參評的碩士或博士一級學(xué)科“人多力量大”,增加奪A的概率,但事實上,在第四輪學(xué)科評估的關(guān)鍵環(huán)節(jié)——權(quán)重確定上,學(xué)位中心邀請專家近9000名(每個參評學(xué)科至少一位專家),根據(jù)權(quán)重設(shè)置原則給出建議權(quán)重,繼而通過求平均得到各個學(xué)科的最終權(quán)重。也就是說,評估的最終結(jié)果是求平均值而不是做加法。但從高校角度看,被拆分的學(xué)科往往是高校目前學(xué)科評估中實力相對較弱或者還在成長中的學(xué)科,其人力、物力被拆分后劃撥到別的學(xué)科中,弱勢學(xué)科中的弱勢資源反而拉低了平均值,造成了1+1<1的局面。
第二,除了棄評,很多高校也將撤銷學(xué)科作為另外一種迎評策略。根據(jù)2016年10月國務(wù)院學(xué)位委員會發(fā)布的《關(guān)于下達2016年動態(tài)調(diào)整撤銷和增列的學(xué)位授權(quán)點名單的通知》,全國高校開展了大范圍的學(xué)科調(diào)整。單就撤銷學(xué)科而言,無論是數(shù)量還是學(xué)科層級,范圍之廣、力度之大都引發(fā)了外界關(guān)注。而高校之所以有動力進行學(xué)科調(diào)整,原因之一在于學(xué)科評估中有碩士一級或博士一級、二級的都要參評,砍掉這些薄弱和老舊學(xué)科,能使數(shù)據(jù)“好看”,使績效“亮眼”,屬于迎評策略中的“有心”之舉;之二是被撤銷的這些學(xué)位點大多是與學(xué)校學(xué)科發(fā)展整體規(guī)劃不符,或者是因為人才培養(yǎng)績效偏低,比如第一志愿報考學(xué)生少、調(diào)劑生源不足、導(dǎo)師責任心不強、導(dǎo)師科研經(jīng)費少、學(xué)生研究成績(專利成果、發(fā)表論文等)弱、就業(yè)質(zhì)量差等等,撤銷這類學(xué)科有利于本校的未來發(fā)展規(guī)劃,這類撤銷對學(xué)科評估造成的影響屬于“無意”之舉。無論是有心還是無意,撤銷學(xué)科之舉都有各高校對本校學(xué)科群通盤規(guī)劃的意圖。自從學(xué)科點取消“終身制”后,高校在對自身學(xué)科評估的全盤布局上態(tài)度更加慎重,規(guī)劃更加合理,因此對學(xué)科評估的結(jié)果起到了一部分的推動作用。
五、啟示與突破之路
就我們的研究結(jié)果來看,在第四次學(xué)科評估中,“985高校”普遍采用“棄卒保車”迎評策略意圖打造更為亮眼的績效,但實證研究證明,棄評學(xué)科這種不適當?shù)挠u策略對學(xué)科評估結(jié)果造成了顯著的負效果;撤銷學(xué)科雖然優(yōu)化了學(xué)科整體結(jié)構(gòu),但對獲取亮眼績效也是收效甚微。作為典型的公共項目評估案例,高校學(xué)科評估中常見的迎評策略對公共項目績效評價形成了幾點啟示。
啟示一:以“數(shù)字指標”替換“真實績效”,警惕評估中發(fā)生目標轉(zhuǎn)換
作為典型的國家公共項目,第四次學(xué)科評估中評估指標的確立成為評估工作的重中之重,學(xué)位中心采用專家法和德爾斐法相結(jié)合的方法,遵循嚴格的程序確定指標權(quán)重。各高校通過學(xué)位中心提供的指標匯報本校在學(xué)科建設(shè)上取得的成就,因此各高校參評的過程也是數(shù)據(jù)不斷生成、上報的過程。為了贏得更為亮眼的績效,放棄和撤銷某些學(xué)科就成為了很多高校屢試不爽的方法,原本“服務(wù)大局、服務(wù)高校、服務(wù)社會”的目標就轉(zhuǎn)換為數(shù)據(jù)的比拼,甚至轉(zhuǎn)換為虛假數(shù)據(jù)的比拼。激勵理論認為,績效評估中代理人(下級)迫于政績壓力和組織資源稀缺的束縛,在執(zhí)行過程中容易將有限的資源聚焦于能夠“彰顯政績”的面子工程而忽略了績效考核的初衷。美國學(xué)者西奧多·H·波伊斯特認為,目標轉(zhuǎn)換現(xiàn)象常常發(fā)生在公共項目的績效評估工作中。一種情況是,不平衡的一套指標可能會不適當?shù)仃P(guān)注一些績效標準而導(dǎo)致對其他指標的損害。當管理者和雇員努力在某些并非最優(yōu)的指標上表現(xiàn)卻忽視了其他更為重要的目標時(因為考評指標不反映這些目標),就會出現(xiàn)目標轉(zhuǎn)換現(xiàn)象從而導(dǎo)致整體績效受到影響。在另一種情況下,績效標準或激勵沒有被很好地具體化,使得某些被評估對象在指標上“看起來好看”,而并沒有真正達到目標。[7]正是因為在目標轉(zhuǎn)換發(fā)生之后,往往會“如愿”出現(xiàn)“亮眼”的績效評估結(jié)果,公共財政資源繼而發(fā)生傾斜和錯位的配置,因此在公共項目評估過程中對于目標轉(zhuǎn)換情形要多加防范,建設(shè)性地使用考評系統(tǒng),引導(dǎo)被評估對象減少不必要的迎評策略,甚至是故意為之的欺騙行為。
啟示二:是良性競爭還是信息失真?降低博弈中信息失真概率
在第四次學(xué)科評估過程中,A類學(xué)科成為“985高校”追求的目標,獲得這些優(yōu)質(zhì)學(xué)科的評估結(jié)果猶如摘取了學(xué)科評估中的“榮譽之果”,獲得國家更多政策上的重視和財政上的支持也是水到渠成,因此在“自愿申請、免費參評”的原則下,處于全國第一梯隊的“985高?!奔娂姴扇×藯壴u或撤銷學(xué)科等策略性行為來與評估者進行博弈,以期獲得更為滿意的績效結(jié)果。但在這種博弈情形下,數(shù)據(jù)的失真會產(chǎn)生績效損失現(xiàn)象。在實際操作層面,績效損失是不可避免的,但如果人為的、大規(guī)模的數(shù)據(jù)失真則會放大績效損失,引起測評的系統(tǒng)性問題和項目的整體性、系統(tǒng)性失敗。我們將這一理論擴展到公共項目績效評價層面,就需要在評估中盡量還原信息所表達的真實含義,避免大規(guī)模和有意為之的信息失真,降低評估者與被評估者的不良博弈行為概率。在績效評價工作中,“亮眼”的績效是被評估對象獲得激勵、公共項目負責人員(官員)獲得肯定(晉升)的有力籌碼,如果策略性應(yīng)對可以改善公共項目的績效,那么這種“策略”很快就會成為被評估者爭相效仿的模式,甚至如果人為的弄虛作假可以顯著提高“亮眼”績效的概率而評估系統(tǒng)中恰好缺失了績效評估后置的監(jiān)督和制裁措施,那么弄虛作假就會成為千方百計獲得“亮眼”績效的不良策略,成為一種以信息失真為特點的偽參評模式。即使個別主體實事求是也改變不了現(xiàn)狀的時候,組織成員就會隨波逐流,心安理得地弄虛作假。[8]因此提高信息和數(shù)據(jù)的真實程度是改善這種博弈現(xiàn)象的關(guān)鍵。
啟示三:看“顯績”更看“潛績”,重視公共項目內(nèi)涵式提升
2005年1月,時任浙江省委書記的習(xí)近平同志在《浙江日報》頭版“之江新語”欄目以“哲欣”為筆名發(fā)表了《“潛績”與“顯績”》一文,辯證地論述了政府工作中潛績與顯績的關(guān)系:“‘潛與‘顯是對立統(tǒng)一的一對矛盾?!疂撌恰@的基礎(chǔ),‘顯是‘潛的結(jié)果?!睂W(xué)科評估結(jié)果中以A類學(xué)科為代表的“亮眼”績效顯然屬于“985高?!逼玫娘@績,但“實現(xiàn)高等教育內(nèi)涵式發(fā)展”則要求高校不能僅僅追逐排行榜的名次和“亮眼”的一級學(xué)科數(shù)目,更要結(jié)合地方特色和高校優(yōu)勢,開發(fā)潛績指標,為地方經(jīng)濟社會發(fā)展服務(wù),實現(xiàn)高校內(nèi)涵式發(fā)展。因此,我們將其推廣到廣義上的公共評估項目,既要評估其顯績,讓優(yōu)秀的顯績繼續(xù)發(fā)揚光大,同時也要厘清公共項目潛績的核心維度,構(gòu)建一套針對公共項目潛績的評估指標體系,用以衡量公共項目發(fā)展的可持續(xù)性。
這些啟示可以說是我國在公共項目績效評價中的通病,如何沖破桎梏根除痼疾,我們認為可以從以下路徑來嘗試突破。
路徑1:樹立真實的評估觀。如鄭方輝教授所言,公共項目績效評價本質(zhì)上是一種價值判斷,是關(guān)于公共項目評估的價值觀,它直接影響了政府行政行為的價值導(dǎo)向,直接決定了政府行政行為的利益指向。不搞清楚政府公共項目的評估取向,就很難把握在評估過程中存在的問題,進一步來說就難以避免在公共項目評估過程中的“拆東墻補西墻”、“一白遮百丑”、“棄卒保車”等弊端的泛濫。改革開放以來,我國政府績效評估經(jīng)歷了從唯GDP—偏重GDP—突破唯GDP的科學(xué)發(fā)展之路,這種政府的績效觀轉(zhuǎn)型事實上是非常成功的,就此而言,我們需要做的就是保持當前的趨勢,走科學(xué)的績效評估道路,同時在公共項目績效評價的頂層設(shè)計上樹立真實的評估觀。所謂真實的評估觀,就是在績效評估前端樹立誠信的參評原則,從源頭上杜絕有策略的迎評現(xiàn)象。第四次學(xué)科評估中部分高校以棄評的方式將“非優(yōu)勢學(xué)科”放棄或者拆分、融合到優(yōu)勢學(xué)科中,或許可以形成更為強大的參評力,但這樣一來,一方面曲解了教育部對于學(xué)科評估的初衷,另一方面對使用真實數(shù)據(jù)全面參評的高校造成不公平競爭的態(tài)勢,擾亂了國內(nèi)學(xué)科建設(shè)公平競爭的環(huán)境。針對這一態(tài)勢,建議國內(nèi)第五次學(xué)科評估設(shè)立高校學(xué)科的最低參評率,確保全面參評和公平競爭。同時改自愿參評為全面參評,擁有一級學(xué)科博士點的學(xué)科必須參評。我國進行的第四次學(xué)科評估與以往歷次學(xué)科評估一樣,堅持“自愿申請、免費參評”原則,各單位具有博士或碩士學(xué)位授予權(quán)的一級學(xué)科(含一級學(xué)科和二級學(xué)科授權(quán)),均可申請參評。這一原則本意在強調(diào)高校的參評自主權(quán),但若部分高校將自愿參評的原則誤解成了策略參評和優(yōu)勢學(xué)科參評,則曲解了國家將學(xué)科評估打造成為“中國特色、世界影響”的特色品牌的期待。只有在學(xué)科評估的前端樹立真實的參評原則,對社會而言,才能展現(xiàn)出真實和具有參考價值的學(xué)科評估結(jié)果,對高校而言,才能將注意力真正投入到學(xué)科建設(shè)中。
路徑2:讓數(shù)據(jù)僅僅成為解釋結(jié)果的來源之一,關(guān)注數(shù)據(jù)背后的“故事”,從根源上解決被評估對象目標轉(zhuǎn)換的問題。公共項目績效評價趨于完善的過程一定意義上就是對數(shù)據(jù)處理的有效性逐漸增強的過程??冃гu價中的目標轉(zhuǎn)換之所以會發(fā)生,就是因為數(shù)據(jù)作為績效信息的來源之外還承擔了額外的“任務(wù)”。在我國第五次學(xué)科評估工作中,要正確對待高校學(xué)科建設(shè)的數(shù)據(jù)和指標,更要注重高校自身建設(shè)及學(xué)科內(nèi)涵式發(fā)展,盡可能淡化以排名為導(dǎo)向的學(xué)科建設(shè)。毋庸置疑,“985”、“211”等這些集全國之力推動的教育項目為實現(xiàn)“兩個一百年”奮斗目標和中華民族偉大復(fù)興的中國夢提供了有力支撐,但同時,高校的發(fā)展和學(xué)科實力的提升并非一朝一夕之功,更非幾次學(xué)科評估就可以輕易下定論,因此在解釋學(xué)科評估結(jié)果時,突破數(shù)據(jù)和指標的桎梏,結(jié)合高校實際情況和背景環(huán)境,創(chuàng)設(shè)更為人性化的排序方式。目前評估中,部分高校為了贏得“亮眼”的績效,將優(yōu)勢學(xué)科打包參評,非優(yōu)勢學(xué)科放棄參評,無形中形成了“優(yōu)勢學(xué)科建設(shè)是加法式增長而非內(nèi)涵式增長”的錯誤邏輯,這種發(fā)展邏輯的危害在于對國內(nèi)的一流高校的學(xué)科建設(shè)形成了不良導(dǎo)向和錯誤風(fēng)氣。事實上,對公共項目績效評價來說,其涉及的項目廣泛、種類繁多,用于評估的指標和數(shù)據(jù)應(yīng)該僅僅是單純描述性的,結(jié)果也只是項目績效一個表層的圖景描述,在解釋項目評價結(jié)果時,應(yīng)該本著“一把鑰匙開一把鎖”的原則,結(jié)合公共項目更為實際和全面的背景環(huán)境,將現(xiàn)階段數(shù)據(jù)所背負的不必要的意義從績效評價中剝離出去,這樣被評估者目標轉(zhuǎn)換就失去了動力。
路徑3:預(yù)見和避免可能出現(xiàn)的評估雙方博弈的問題。在西方績效評估研究中,博弈被界定為“能從激勵契約中獲取最大收益同時沒有實際改進績效的行動”,或“刻意包裝,甚至赤裸裸地捏造數(shù)據(jù),旨在提高個人或組織的地位”。[9]波伊斯特認為矯正博弈現(xiàn)象需要定義可以平衡任何被引發(fā)的潛在副作用的附加指標,使得管理者更好地留意這種警告。公共項目績效評價中的每一個環(huán)節(jié)都可能存在評估者與被評估者之間的博弈,提高績效評價的公信力就是要建設(shè)性地應(yīng)用考評系統(tǒng),正確監(jiān)控考評系統(tǒng)中指標的運用,讓每一個環(huán)節(jié)中的雙方博弈不以弄虛作假的方式展開。教育部實施的第四次學(xué)科評估本意是對高校學(xué)科發(fā)展和建設(shè)情況進行評價進而能夠?qū)θ肆ξ锪M行更優(yōu)質(zhì)的資源分配,但眾所周知,在學(xué)科評估中獲得優(yōu)異的成績不但是國家對高校學(xué)科建設(shè)的認可和肯定,同時更是教育部在分配優(yōu)質(zhì)教育資源時的“寵兒”,這無形中就捆綁了很多利益因素。從政府的角度,優(yōu)質(zhì)教育資源被“捆綁”的過程也是政府有關(guān)部門被高?!胺@”的過程,被“俘獲”之后的政府在進行“利益的權(quán)威性分配”時明顯向“俘獲者”傾斜。因此在未來第五次學(xué)科評估中需要進一步保證參評數(shù)據(jù)的完整性和有效性,在真實、科學(xué)的數(shù)據(jù)基礎(chǔ)上盡可能地減少雙方博弈產(chǎn)生的績效損失,以使優(yōu)質(zhì)的教育資源公平地傾斜,增強我國在科教興國戰(zhàn)略上的硬實力。我們將這一思路擴展到我國公共項目評估領(lǐng)域,就是要預(yù)見和避免參評對象在公共項目績效評價中出現(xiàn)的非正當博弈現(xiàn)象,以科學(xué)的評估觀為指導(dǎo),促進評估每一個環(huán)節(jié)都以公平公正公開的方式展開。
路徑4:探索構(gòu)建公共項目的潛績評估指標體系。公共項目承擔著我國公共財政資金的受托責任,在評估上不僅要體現(xiàn)出財政資金投入的直接效果即顯績,更要以公共財政資金投入的目的性為導(dǎo)向,評估出那些真正讓群眾(師生)有獲得感的潛績。盡管我國一直在強調(diào)高校內(nèi)涵式發(fā)展,但排名、數(shù)據(jù)和等級等這類硬性的指標依然是高校追逐的目標,在硬性指標的壓力下,科研實力強勁的綜合性大學(xué)更能在競爭中拔得頭籌,“小而精”的學(xué)院或者特色鮮明的行業(yè)型院校則相形見絀,這不利于我國教育領(lǐng)域整體潛績的提升。因此注重高校的內(nèi)涵式發(fā)展,提升我國教育整體潛績,就要開發(fā)出更多測量潛績的科學(xué)指標,在下一次學(xué)科評估中嘗試使用。建立測量潛績的評估指標體系不僅僅應(yīng)用在高校學(xué)科評估上,在我國其他各類公共項目評估中同樣有用武之地。面對我國紛繁復(fù)雜的各類公共項目評估工作,我們建議以厘清評估價值導(dǎo)向—構(gòu)建指標池—篩選指標—實證評估為思路,進行公共項目潛績評估指標的開發(fā),在初步取得效果后嘗試將潛績評估指標體系以規(guī)范化、法制化的形式固定下來,在各類公共項目評估的實踐中形成組織“慣例”和重視潛績的行政文化,促進我國公共項目評估的正向發(fā)展。
六、研究不足與展望
改革開放以來,我國政府不斷追求更科學(xué)的評估方式、更高效的評估機制,但由于我國公共項目績效評價起步晚,同時在制度慣性的影響下,還存在一些問題。本文嘗試性、探索性地以第四次學(xué)科評估中“985高?!钡臄?shù)據(jù)為源頭,實證性地分析了高校“棄卒保車”的迎評方式,我們認為目前代表我國教育水平最高級別的“985高?!贝嬖诓贿m當?shù)挠u策略,一方面擾亂了學(xué)科評估的真實性,另一方面“棄卒”也沒能“保車”。本文在邏輯思路和實證方法上具備科學(xué)性,但同時也存在以下問題:第一,截止到2018年3月30日的教育部數(shù)據(jù),我國共有普通高等學(xué)校2595所(含獨立院校266所),我們所涉及的“985高校”雖然具備典型性,但是在實證研究角度上,數(shù)據(jù)的完備性不足。第二,第四次學(xué)科評估是我國教育部學(xué)位與研究生教育發(fā)展中心以第三方方式展開的非行政性、服務(wù)型的公共評估項目,是否能夠完全代表我國公共項目績效評價的發(fā)展趨勢存在進一步討論的空間??偟膩碚f,本研究力圖通過一定的數(shù)據(jù)資料來彌補和觸及國內(nèi)對學(xué)科評估、對公共項目績效評價存在問題的不足,盡量以客觀的數(shù)據(jù)資料作為工具來厘清我國公共項目績效評價的問題,但這種探索性的研究依然留下了大量的空隙需要進一步的研究來彌補,需要更廣泛的數(shù)據(jù)、更富于解釋力的研究來解決前述的問題。
參考文獻:
[1]Zong XH,Zhang W.Establishing world-class universities in China:deploying a quasi-experimental design to evaluate the net effects of Project 985[J].Studies In Higher Education,2019(44):417-431.
[2]馬輝,杜亞靈,王雪青.公共項目管理績效過程評價指標體系的構(gòu)建[J].軟科學(xué),2008(7):49-53.
[3]胡芳,劉志華,李樹丞.基于熵權(quán)法和VIKOR法的公共工程項目風(fēng)險評價研究[J].湖南大學(xué)學(xué)報(自然科學(xué)版),2012(4):83-86.
[4]Liu B ,Shen JQ ,Meng ZJ ,Sun FH.A Survey on the Establishment and Application of Social Capital Partner Selection System for the New Profit PPP Project[J].Ksce Journal Of Civil Engineering,2018(22):3726-3737.
[5]尚虎平,葉杰,趙盼盼.我國科學(xué)研究中的公共財政效率:低效與浪費——來自國家自然科學(xué)基金、社會科學(xué)基金項目產(chǎn)出的證據(jù)[J],科學(xué)學(xué)研究,2012(10):1476-1486.
[6]Zhang L,Geertman S,Hooimeijer P,Lin YL.The usefulness of a Web-based Participatory Planning Support System in Wuhan,China[J].Computers Environment and Urban Systems,2019(3),208-217.
[7]西奧多·H·波伊斯特.公共部門績效評估[M].北京:中國人民大學(xué)出版社,2016:208.
[8]徐艷晴,周志忍.地方政府績效評估中博弈行為的致因研究——分析框架及其初步檢視[J].上海行政學(xué)院學(xué)報,2015(4):15.
[9]徐艷晴,周志忍.公民滿意度數(shù)據(jù)失真現(xiàn)象考察:信任赤字、博弈策略、理論意涵[J].公共行政評論,2014(6):60.
(責任編輯 劉第紅)