● 谷向東
中國是考試的發(fā)源地,一直沿襲著考試的傳統(tǒng)做法。直到90年代后期,西方的人才測評技術(shù)才逐漸由外企引入中國,理論研究與方法建設(shè)非常欠缺,相對于不斷引進(jìn)的大量西方測評技術(shù),理論與方法的本土化研究幾乎是空白。 目前國內(nèi)的選聘工作都或多或少吸收了西方的思想和做法,但我們的主流選聘實踐的核心理念和技術(shù)仍然是考試,中國考官的評分仍有濃重的考試色彩。
那么,發(fā)源于中國的考試與發(fā)源于西方的測評有什么區(qū)別呢?簡單的說,考試的理論基礎(chǔ)是"擇優(yōu)汰劣"和"干什么,考什么";考試主要依據(jù)崗位職責(zé)要求和雙向細(xì)目表進(jìn)行命題,采用的核心技術(shù)是申論、客觀題、案例分析和面試等,評價者多是單位領(lǐng)導(dǎo)和某個專業(yè)領(lǐng)域中的資深專家,測試的結(jié)果主要是按照分?jǐn)?shù)進(jìn)行排序,其作用主要體現(xiàn)在人才招聘與選拔上。而人才測評的理論基礎(chǔ)是人職匹配,測評主要依據(jù)勝任力模型設(shè)計測評方案和命制題目,采用的核心技術(shù)是以情景模擬為主的評價中心技術(shù),評價者多是人才測評的專業(yè)人士,測試結(jié)果的呈現(xiàn)方式主要是素質(zhì)測評報告,其作用主要體現(xiàn)在選拔、培訓(xùn)、發(fā)展、指導(dǎo)。為此,本文試圖從中西方的對比研究中進(jìn)行分析,為本土化研究提供借鑒,為中西考試測評技術(shù)的進(jìn)一步有效融合探索有效途徑。
西方的人才測評一般界定為一個收集和評估有關(guān)候選人信息的過程,以便做出針對某職位的人事決策。長期以來,人們主要采用收集學(xué)業(yè)成績和工作資歷作為評價內(nèi)容,直到二戰(zhàn)后才開始采用智力測驗和個性測驗的結(jié)果進(jìn)行人事決策。實踐證明,這些信息至少難以預(yù)測復(fù)雜工作和高層次職位任職者的工作績效或生活中的成功。
近年來,西方新增加的評價內(nèi)容主要有情緒智力(EI)、實踐智力和勝任力等。美國耶魯大學(xué)的心理學(xué)家Sternberg研究發(fā)現(xiàn)實踐智力是管理績效非常好的預(yù)測指標(biāo),后又提出實踐智力構(gòu)成勝任力的核心,從而將實踐智力與勝任力概念融合到一起。情緒智商的概念是由美國心理學(xué)家Salovey和Mayer提出的,用于描述對成功至關(guān)重要的情緒特征,后來又推出情緒勝任特征的概念,也實現(xiàn)了與勝任力概念的融合。西方人才測評領(lǐng)域得到普遍接受和廣泛應(yīng)用的主流評價內(nèi)容為麥克利蘭德勝任力,圍繞勝任力的一整套技術(shù)方法為人才測評提供了很好的評價基礎(chǔ)。
對于勝任力,目前西方所采用的主流測評技術(shù)是基于多質(zhì)多法的評價中心技術(shù),測評的原理是人職匹配。為了建立科學(xué)的評價內(nèi)容,首先要通過工作分析建立相應(yīng)的勝任力模型,并且界定行為的操作定義,使之可被準(zhǔn)確觀察、記錄和評價。如將“組織能力”定義為“在小組討論中既能主動發(fā)言,又能顧全他人,組織大家發(fā)言,及時向他人提出疑問,及時糾正跑題,發(fā)言能綜合他人意見,適時概括、總結(jié)別人的發(fā)言?!比缓螅瑢⒏鞣N評價方法得出的評分進(jìn)行整合,得到一個“組織能力”的最終分?jǐn)?shù)。最后將該分?jǐn)?shù)和其他勝任力得分與崗位勝任力模型比照,得出總體的人職匹配水平,以此作為人事決策的主要依據(jù)。
而對于那些抽象的勝任力如責(zé)任心、敬業(yè)精神等,則必須進(jìn)一步分解和操作化,才可以采用測評技術(shù)進(jìn)行測試。西方認(rèn)為情景模擬測試難以測試出品德、個性等深層次勝任力的內(nèi)容,需要通過心理測驗、工作考核、背景調(diào)查等手段進(jìn)行了解。更重要的是,被測者在實際工作環(huán)境中的品德行為必須依靠法律、工作制度和激勵方法加以規(guī)范和保證,并在實際工作中對其長期考察,僅靠短時間的評價中心是很難解決這一問題的。
在測評中,西方考官對于被測者觀察評價的主要方法是行為報告法。這種方法強調(diào)先觀察、記錄被測者的行為信息,而不是直接對被測者的行為表現(xiàn)進(jìn)行打分。具體分為以下幾個步驟:
(1)觀察行為(Observing):考官在測試過程中全面而有重點地看與聽被測者的行為細(xì)節(jié),包括語言、語氣、動作等。
(2)記錄行為(Recording):考官在觀察的同時,采用速記法盡量全面地進(jìn)行記錄。
(3)將行為按照測評指標(biāo)歸類(Classifying):在觀察和記錄行為后,考官將被測者的大量行為細(xì)節(jié)歸類和劃分到對應(yīng)的測評指標(biāo)上。例如“在充分肯定別人之后,對大家說出了自己的相反意見”可以劃分到“影響力”這一測評指標(biāo)中等。
(4)初步對測評指標(biāo)打分(Evaluating):考官在將行為歸類完成后,對每名被測者的行為表現(xiàn)情況嚴(yán)格比照每個測評指標(biāo)的描述情況,按照“吻合率”或者“一致水平”給出一個初步的分?jǐn)?shù)。比如,符合率為80%,按照十分制評分就可以給8分。
(5)整合分?jǐn)?shù):考官圍繞每個勝任力指標(biāo)的評分進(jìn)行討論,每一名考官都針對同一名被測者的同一個指標(biāo)給出自己觀察到的行為和評分,各考官之間的觀察行為報告可以相互補充、印證,不同考官的不同評分可以通過討論達(dá)成一致。在上述工作的基礎(chǔ)上形成整合性的評分結(jié)果和完整的測評報告。
在面試、小組討論等測試中,考官工作的原則和具體的任務(wù)是觀察和記錄候選人所有重要的行為和語言,在觀察中要保持高度集中和注意;對所有的候選人都保持公正公平,排除主觀印象;注重行為事實,而非主觀感受;在測試中,不進(jìn)行任何主觀的推理,直到測試結(jié)束后才做出判斷;所給出的具體評價分?jǐn)?shù)要有足夠事實作為支撐,加以佐證;要充分克服各種誤區(qū),比如第一印象、近因性、暈輪效應(yīng)和刻板印象等。
考官思維加工的關(guān)鍵原則是客觀性原則,在觀察階段僅僅關(guān)注事實,即那些看得到的和聽得到的內(nèi)容,不可以摻雜主觀推測和判斷的成份。用一個不太恰當(dāng)?shù)谋扔?,考官在觀察記錄階段需要表現(xiàn)得像一臺攝像機,而在評分階段則可以進(jìn)行一些歸納概括判斷,但仍然必須保持充分的客觀性。
中國有著悠久獨特的中華文化,人才的評價與選拔標(biāo)準(zhǔn)自然有自己獨特之處。歷史上許多大師級的專家學(xué)者對于選人的標(biāo)準(zhǔn)和方法都進(jìn)行了深入的論述。概括起來,他們非常重視對抽象的個性、品德等內(nèi)容的考查。比如,《易經(jīng)》中提到領(lǐng)導(dǎo)應(yīng)具有定力、情懷和效率等品質(zhì);《尚書》提出了“九德”概念;儒家提出選人的標(biāo)準(zhǔn)為節(jié)用愛人、以身作則、樂觀積極、剛直不阿、謙虛踏實、理性求實、文質(zhì)彬彬。墨家則提出厚德載物,認(rèn)為在形成領(lǐng)導(dǎo)者品質(zhì)的各要素中,道德品質(zhì)占據(jù)很重要的位置,并提出“德”的十一項指標(biāo)。上述種種流派的理念代代相傳,沿襲至今,構(gòu)成中國觀察和評價人的內(nèi)在標(biāo)準(zhǔn)。
2005年,筆者開展了一項“處級正職內(nèi)隱的領(lǐng)導(dǎo)素質(zhì)結(jié)構(gòu)初探”的研究,對60位特大城區(qū)的黨政處級正職領(lǐng)導(dǎo)進(jìn)行訪談?wù){(diào)查,經(jīng)過質(zhì)性研究概括出20個素質(zhì)條目,其中的核心部分包括品行正直、奉獻(xiàn)精神、事業(yè)心、政治素質(zhì)、服務(wù)意識等品德的內(nèi)容,另外還包括許多個性內(nèi)容,這些素質(zhì)的被提及率都比較高。這證明了對領(lǐng)導(dǎo)者評價的內(nèi)在標(biāo)準(zhǔn)十分強調(diào)品德和個性成份,說明考官在實際觀察和評價的思維加工中會下意識地將這些素質(zhì)內(nèi)容納入到評分標(biāo)準(zhǔn)中。
中國人的個性框架結(jié)構(gòu)也有較強的獨特性。近年,臺灣學(xué)者楊國樞和北大的王登峰教授所開展的中西方人格結(jié)構(gòu)的比較研究表明,與西方的大五人格不同的是中國人存在大七人格結(jié)構(gòu)。雖然在“外向性”和“情緒穩(wěn)定性”上中西方有著較高一致性,但從內(nèi)容上看,西方人的這兩個維度主要反映外在行為的特點和傾向性,而中國人則較多涉及個人品質(zhì)。另外,中國人獨有的人格維度包括 “精明干練——愚蠢懦弱”,指的是能力;“善良仁慈——狡詐卑鄙”,指的是道德品質(zhì);以及“淡泊知足——功利虛榮”,指的是一個人所追求的目標(biāo)。這三個維度,都是中國人評價自己及他人人格的重要維度。
今天,人們在選人用人實踐中已經(jīng)或多或少引進(jìn)西方的測評標(biāo)準(zhǔn)的理念與技術(shù),對綜合分析、組織協(xié)調(diào)等行為化的素質(zhì)進(jìn)行測試,但仍然非常重視品德和個性因素的考察。以面試為例,在正式的面試實踐中,考官通常仍然十分重視責(zé)任心、謙遜、有魄力和進(jìn)取心等個性和品德的內(nèi)容內(nèi)容的觀察與評價。具體表現(xiàn)為:考官們尤其是領(lǐng)導(dǎo)考官在評分討論和決策討論中頻繁使用上述有關(guān)個性和品德的用語,同時使用許多相關(guān)的推測性語言,并強調(diào)這些因素的重要性,賦予其很高的權(quán)重等。筆者認(rèn)為,這樣做抓住了選人評價的關(guān)鍵要素,問題是如何才能實現(xiàn)對這些要素的準(zhǔn)確測評。
概括說來,中國考官觀察評分方法有三個突出特點,一是傾向于非結(jié)構(gòu)化面試的方法,“中國選才調(diào)查”2010年出爐的調(diào)查數(shù)據(jù)表明,英國在招聘選拔中采用結(jié)構(gòu)化面試的比例為69%,中國僅為38%;而中國在選任中普遍采用面試的方法,說明存在大量非結(jié)構(gòu)化面試實踐。二是具有濃厚的考試色彩,表現(xiàn)為多數(shù)面試等測試的目標(biāo)僅僅為了給候選人排出名次。三是評價中強調(diào)個性、品德等內(nèi)容勝任力標(biāo)準(zhǔn),而這些標(biāo)準(zhǔn)往往有較強的概括性、抽象性,缺乏操作化和量化標(biāo)準(zhǔn),更多需要依靠觀察者的經(jīng)驗、悟性和直覺進(jìn)行評價。
中國考官的評價程序是首先提出問題,引發(fā)被測者的言語與行為反應(yīng);其次,觀察被測者的言行,憑借記憶進(jìn)行“記錄”;最后,概括性地進(jìn)行思考加工,調(diào)用經(jīng)驗儲備,比照評分標(biāo)準(zhǔn),給出分?jǐn)?shù)。這種方法的優(yōu)點在于充分發(fā)揮考官的能力,為最大程度地深挖被測者信息提供了可能,不受評價標(biāo)準(zhǔn)的限制。但是整個過程由于操作性不強,考官沒有進(jìn)行詳細(xì)記錄,往往憑借記憶比照概括性的評價標(biāo)準(zhǔn)進(jìn)行量化,因而比較模糊。評分是“仁者見仁,智者見智”的過程,考官的主觀性難以控制,也就造成了對同樣的被測者,不同考官的評分出現(xiàn)較大差異而且難以調(diào)和的情況。這種評分方法對于有些考官故意操縱分?jǐn)?shù)、打出極端分?jǐn)?shù)、給出不穩(wěn)定不恰當(dāng)?shù)姆謹(jǐn)?shù)等等問題都沒有很好的處理辦法。實際操作中往往采用七位以上的考官同時觀察評分,對于考官之間的評分差異問題要通過計算平均值的方法加以解決。
經(jīng)過大量實踐和反思,中國形成了觀察評價人才的獨特視角、思維模式和評價方法,并以非常概括性的語言加以描述,代代相傳,但是實際掌握應(yīng)用需要具有很好的悟性、長年的閱人用人的經(jīng)驗,并且善于反思、歸納、總結(jié),這對于一般考官尤其是年輕考官是有相當(dāng)挑戰(zhàn)性的。
考官必須借助主觀能動性進(jìn)行推測,正如《淮南子》所主張的考察人才要注重行為的細(xì)小方面,然后推知總體品行??脊偃魶]有很好的悟性和經(jīng)驗,做到這一點是很困難的,所以這種做法很難復(fù)制推廣。
筆者認(rèn)為兩種模式各有特點和利弊,根據(jù)各自特點可將中國的主流評分方法定義為概括經(jīng)驗法,將西方的主流評分方法定義為機械評分法。
西方評分方法是更強調(diào)客觀性,最大限度排除了主觀成份的影響,而且易于掌握和大面積推廣復(fù)制,對于評分人員的領(lǐng)導(dǎo)經(jīng)驗和觀察人員的天賦等要求不高。但是西方的評分法比較機械,內(nèi)在的邏輯是加減乘除,采用的是“具體行為點”歸納出“內(nèi)在勝任力”,是 1+1+1=3的思維,而由于割裂的行為細(xì)節(jié)相加未必準(zhǔn)確推導(dǎo)勝任素質(zhì)水平,因而可以說它在一定程度上忽略行為整體的復(fù)雜性,造成了“只見樹木,不見森林”、“不識廬山真面目,只緣身在此山中”。而且這種方法比較繁瑣,費時費力。
而中方則將事物聯(lián)系起來,形成一個整體,借助有經(jīng)驗觀察者的慧眼,站在一個更高的層面俯視地進(jìn)行觀察評價。這種方法淡化細(xì)節(jié)內(nèi)容,重視整體的概括評價和直覺的判斷,解決了“在對人的評價中細(xì)節(jié)成份的簡單相加推測出綜合因素未必合理”,即“1+1+1未必等于3”的問題。這種方法對于考官要求很高,在公開選拔和競爭上崗測試中,挑選考官往往只能選擇那些相應(yīng)行業(yè)或者專業(yè)領(lǐng)域的成功人士和高管,合格的考官難覓且所需成本很高,難以進(jìn)行大面積推廣,而且更重要的是它為主觀性打開了大門。
總之,兩種方法各有利弊,難以替代,應(yīng)該相互融合。
目前,中國在考評工作中,考官往往由臨時抽調(diào)的非測評專業(yè)人員構(gòu)成,可以稱為“臨時考官”,多是以本地組織、人事、紀(jì)檢監(jiān)察等部門和用人單位的領(lǐng)導(dǎo)為主;評分基本依賴于參照擬定的標(biāo)準(zhǔn)答案,或者根據(jù)直覺進(jìn)行評價,沒有足夠的專業(yè)測評技能評判出被測者的各種素質(zhì)能力水平。有鑒于此,我們在實際操作中,要側(cè)重注意充分吸納西方重客觀、重量化的思想與操作化強的評估技術(shù),借此提高這些"臨時考官"的專業(yè)技能水平,盡量減少評分中的人為主觀成分,提高我們評分的科學(xué)性與嚴(yán)謹(jǐn)性,同時充分保留中方評價方法的精髓,從而形成科學(xué)高效的綜合方案。
筆者認(rèn)為有兩種具體的操作方案:
方案一是,對于“臨時考官”開展至少1-2天的西方評分方法的訓(xùn)練,使他們同時掌握兩種評分方法的技巧,在分要素的評估時采用西式方法,在綜合評估時,采用中式方法。即采用西方的方法得出每個要素項分后,可以將所有要素分相加得到一個總分,這個總分與采用中方方法得到的總分往往會有一定的差異,這正是前述的評價標(biāo)準(zhǔn)和視角不同所致,最后的總分可以采用數(shù)理統(tǒng)計的方法加以合成,將兩個分?jǐn)?shù)按照一定比例或者權(quán)重進(jìn)行加權(quán),比如按照7:3的比例合成。
這種方法的操作難點在于讓考官們掌握西方的評分方法,為了幫助他們快速習(xí)得西方的評估方法,可在評分表的設(shè)計上下功夫。具體可以對每個評價要素采用行為列表法,給評價人員提供行為觀察上的幫助,在行為列表上對每一維度進(jìn)行操作化界定,至少列出10種左右的典型行為,尤其是一些關(guān)鍵性的行為,同時最好將列表上的行為按照實際發(fā)生的類別進(jìn)行分類,這樣就可以幫助他們在缺乏系統(tǒng)訓(xùn)練的前提下快速掌握西方的評分方法。
方案二是,考官組由兩部分人構(gòu)成,一部分為專業(yè)的人才測評師,另一部分為所謂“臨時考官”。對于前者,要確保人才測評師熟練準(zhǔn)確掌握西方專業(yè)化的評分方法,以提高評價的客觀性。對于“臨時考官”,盡量選擇那些在選人和用人方面有豐富經(jīng)驗的領(lǐng)導(dǎo)和人事專家,他們對人的觀察、評估與分析上是“行家里手”,可以熟練高超地運用中國式的評分方法。每位被測者的最后得分可以將兩類考官的評分按照一定權(quán)重進(jìn)行合成,形成最后的得分。
為此,今后應(yīng)進(jìn)一步加大專業(yè)人才測評師的培養(yǎng)力度,以滿足社會迅速增長的對專業(yè)測評師的需求,不斷增加專業(yè)人才測評師在考官組中的構(gòu)成比例,至少達(dá)到半數(shù)以上的水平。另外,在測評方案的設(shè)計上也要按照評價中心的設(shè)計原則進(jìn)行,比如,要進(jìn)行科學(xué)詳細(xì)的工作分析以建立崗位的素質(zhì)模型作為評價的基礎(chǔ)和標(biāo)準(zhǔn),對所有評價人員進(jìn)行科學(xué)選擇和專業(yè)化的深入培訓(xùn),采用多個評價者,對于同一個素質(zhì)采用多種測評手段進(jìn)行測評。只有在評價的方式方法上不斷完善,才可以最終實現(xiàn)科學(xué)的測評,切實提高考試測評水平。
1.北京雙高人才發(fā)展中心:《領(lǐng)導(dǎo)人才選拔研究與實踐》,北京出版集團公司北京出版社,2009年版。
2.陳德述:《儒家管理思想論》,中國國際廣播出版社,2008年版。
3.王登峰、崔紅:《中國人人格量表(QZPS)的編制過程和初步結(jié)果》,載《心理學(xué)報》,2003年第35期。
4.Zeidner,M.,Matthews,G.,Roberts,R.D.Emotional intelligence in theworkplace:acriticalreview.Applied Psychology:An International Review,2004,53:371-399.
5.Terpak,Michael A..:Assessment center strategy and tactics.PennWell,2008.