国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

負面績效反饋下員工績效改進動機的人機比較*

2025-02-15 00:00:00王國軒龍立榮李紹龍孫芳望家晴黃世英子
心理學報 2025年2期
關鍵詞:人工智能

摘 "要""負面績效反饋對員工學習和績效提升具有重要意義, 然而其往往難以被員工所接受。隨著人工智能技術(artificial intelligence, AI)逐漸應用于組織情境中, 探索AI提供負面績效反饋對員工行為及態(tài)度的影響成為重要議題。采用4個遞進式實驗探索了AI與人類管理者提供負面績效反饋對個體績效改進動機的差異化影響及機制。實驗1~3采取經典的虛假反饋的策略, 發(fā)現(xiàn)相較于人類管理者, AI提供負面績效反饋引發(fā)個體更高水平的績效改進動機(實驗1)。并且, 在客觀任務中, AI (較人類管理者)提供負面績效反饋引發(fā)個體更高水平的績效改進動機; 而在主觀任務中, 結果則相反(實驗2)。此外, 個體對于負面績效反饋的內部歸因解釋了上述關系發(fā)生的內在機制(實驗3)。實驗4則采用相對真實的負面績效反饋情境, 重復了先前3個實驗的研究發(fā)現(xiàn)。該研究對于組織為何以及何時應用AI提供負面績效反饋提供了一定的啟示。

關鍵詞""負面績效反饋, 人工智能, 績效改進動機, 內部歸因, 任務類型

分類號""B849: C93

1 "前言

負面績效反饋是組織對未達到業(yè)績期望的員工所給予的否定和批評(Cianci et al., 2010)。通常來說, 管理者提供負面績效反饋的目的在于引導和激勵員工的績效表現(xiàn)(Lam et al., 2011; Podsakoff amp; Farh, 1989)。然而遺憾的是, 負面績效反饋多引發(fā)員工焦慮、悲傷等負面情緒, 從而降低員工績效(Audia amp; Locke, 2003; Kitz et al., 2023)。此外, 由于涉及人際溝通, 負面績效反饋還會降低管理者與員工的關系質量(Ni amp; Zheng, 2024)。特別是在中國文化下, 考慮到人們的溝通方式較為含蓄, 管理者的負面績效反饋使員工愧疚和尷尬, 繼而損害工作積極性(耿紫珍"等, 2020)。蓋勒普(Gallup)1在2019年的調查也顯示, 在對管理者負面績效反饋產生消極情緒(失望、沮喪)后, 僅有10.4%的員工會繼續(xù)投入工作或改善績效水平。綜合看來, 傳統(tǒng)由人類管理者提供負面績效反饋的方式面臨著較大的挑戰(zhàn)(Kluger amp; Denisi, 1996; Xing et al., 2023)。

隨著數(shù)智化技術的發(fā)展, 采用AI提供負面績效反饋為組織帶來新的機遇(Lee, 2018; Luo et al., 2021)。例如, 一款名為Enaible的算法通過遠程監(jiān)控員工的工作行為, 診斷員工表現(xiàn)不佳的原因, 并提供績效改進建議。此外, Butterfly等AI評估軟件可以細致搜集員工的行為數(shù)據, 幫助員工及時改善表現(xiàn)(Tong et al., 2021)。那么, AI相較人類管理者提供負面績效反饋有哪些潛在優(yōu)勢?研究發(fā)現(xiàn)AI有著強大的數(shù)據整合及分析能力, 且具備較少的主觀意圖(Garvey et al., 2023; Lee, 2018)。因此, 相較于人類管理者, AI提供負面績效反饋會更加“對事不對人” (Yalcin et al., 2022), 繼而削弱傳統(tǒng)人際互動中員工對負面績效反饋的歸因偏差(attribution bias) (例如, 將負面績效反饋歸因于管理者的偏見) (Xing et al., 2023), 使得員工更多關注自身的不足, 并增強績效改進動機。

盡管已有文獻初步表明, AI和人類管理者在提供績效反饋時可能呈現(xiàn)出不同的特征(Garvey et al., 2023; Yalcin et al., 2022), 員工在與AI或人類互動時也會產生差異化的反應(Tong et al., 2021), 但少有研究在人機提供負面績效反饋情境下探討員工的歸因過程及后續(xù)反應, 因此本研究的目標包括:首先, 基于人機比較的研究, 本研究擬探索人機負面績效反饋(即由人類管理者或AI提供負面績效反饋)的差異化影響效應。第二, 當前算法態(tài)度的研究表明, 人類對AI的欣賞或厭惡取決于任務類型(Castelo et al., 2019)。比如在客觀任務中, 相比于人類反饋, 個體更愿意接受準確性更強的AI反饋。因此研究擬探索任務類型(主觀或客觀任務)在人機負面績效反饋中的邊界效應。最后, 員工會對負面績效反饋進行內部或外部歸因, 從而決定是否改善績效(Ilgen et al., 1979; Tolli amp; Schmidt, 2008)?;诖?, 研究擬基于歸因理論的視角, 探究人機提供負面績效反饋產生差異化結果的機制。

1.1""人機負面績效反饋對個體績效改進動機的影響"

傳統(tǒng)人際場景中, 負面績效反饋對員工消極的影響被廣泛探討, 例如, 減少學習動機(Xing et al., 2023)、自我效能感(Dimotakis et al., 2017), 降低員工目標設置以及績效改進(Podsakoff amp; Farh, 1989), 或阻礙創(chuàng)造力(Kim amp; Kim, 2020)。上述負面影響大致通過三條路徑解釋:人際破壞性、負面情緒和自我防御路徑。首先, 員工可能將負面績效反饋知覺為管理者的敵意, 致使學習和改善意愿下降(Cianci et al., 2010; Ni amp; Zheng, 2024)。第二, 在受挫、羞愧等負面情緒狀態(tài)的影響下, 員工受到打擊并較少關注績效提升(Belschak amp; Den Hartog, 2009; Kim amp; Kim, 2020)。最后, 受自我防御的驅使, 負面績效反饋減少員工內部歸因, 導致績效水平降低(Xing et al., 2023)。

人類與AI提供反饋的特征存在較大差異。由于依賴主觀的經驗與直覺, 人類管理者的反饋容易包含個人看法或偏見(蔣路遠"等, 2022; Qin et al., 2023), 繼而引發(fā)員工的消極情緒和防御反應(Ni amp; Zheng, 2024)。相反, AI作為反饋提供者不容易出現(xiàn)認知疲勞和情緒失控, 并且由于具備強大的數(shù)據分析與預測能力, 使AI反饋更加客觀與全面, 也較少被個體知覺為惡意或偏見(許麗穎"等, 2022; Qin et al., 2023)。值得說明的是, 人類與AI提供反饋的特征差異在負面情境中更為顯著。比如, 面對AI提供的負面信息, AI的客觀性減少了個體對其蓄意意圖的感知, 并增加信息接受度(Garvey et al., 2023)。相反, 囿于主觀偏差, 人類的負面決策容易包含個人看法或主觀判斷, 從而降低接受度(Tong et al., 2021)。另外, 在負面事件中, 相對于人類, 個體更容易接受AI的決策。比如, 面對商品價格不公平時, 相較于人類, 消費者認為AI的決策基于大量客觀數(shù)據生成, 進而產生更高水平的信任, 而人類銷售員的決策可能存在主觀局限性, 從而引發(fā)消費者較高的蓄意評估(宋曉兵, 何夏楠, 2020)。此外, 當個體受到監(jiān)控時, 相較于人類監(jiān)控, 算法監(jiān)控被認為具有較低的主觀判斷與意志, 而更容易被接受(Raveendhran amp; Fast, 2021)?;谏鲜龇治鎏岢觯?/p>

假設1:"相較于人類管理者, AI提供負面績效反饋引發(fā)員工更高水平的績效改進動機。

1.2""任務類型作為邊界條件

在組織中, 與績效關聯(lián)的任務通常有主觀與客觀之分(Van Dijk amp; Kluger, 2011)。前者是基于個人觀點或直覺的開放式或可解釋任務(處理人際關系以及溝通等)。而后者是可量化的事實型任務(業(yè)績分析、銷量預測等) (Castelo et al., 2019)。任務類型是影響個體偏好人類或AI決策的關鍵因素。比如, 相較于人類, 用戶認為算法基于客觀銷量數(shù)據提供的購買建議更為公平與中肯, 因此更愿意接受來自AI的建議(Helberger et al., 2020)。此外, 主觀任務依賴人際互動能力, 需要通過直覺、經驗和隱性知識等處理(Castelo et al., 2019), 而人類相較于AI在社會屬性與主觀屬性方面更具優(yōu)勢。因此相比于AI, 個體更信任人類管理者對主觀任務提供的負面績效反饋(Newman et al., 2020), 進而產生較高水平的績效改進動機。相反, 客觀任務具有可量化的特點(Castelo et al., 2019), 能夠充分發(fā)揮AI負面績效反饋在強大算力加持下的客觀屬性優(yōu)勢(Longoni et al., 2019; Tong et al., 2021), 使得員工更能接受反饋并增強績效改進動機。據此提出:

假設2: 人機負面績效反饋與任務類型交互影響員工的績效改進動機水平。具體而言, 在客觀任務中, 相較于人類管理者, AI提供負面績效反饋會引發(fā)員工更高水平的績效改進動機; 在主觀任務中, 相較于AI, 人類管理者提供負面績效反饋會引發(fā)員工更高水平的績效改進動機。

1.3""內部和外部歸因的中介作用

歸因理論(attribution theory; Heider, 1958)的因果控制點(locus of causality)視角將個體的歸因風格區(qū)分為內部與外部歸因。內部歸因強調, 個體傾向尋找自身原因, 并相信當前的結果與個人因素(比如, 個人能力或性格特征等)相關; 相反, 外部歸因則表示個體之所以出現(xiàn)某種行為或結果, 與所處的環(huán)境或運氣等外部因素關聯(lián)。

面對負面績效反饋, 個體會識別反饋提供者的意圖, 從而選擇內部或外部歸因(Audia amp; Locke, 2003)。具體來說, 當感知負面績效反饋出于管理者的惡意時(例如, 打壓, 傷害等), 個體傾向于外部歸因。相反, 當負面績效反饋傳遞出管理者幫助員工改善績效的意圖時, 個體則更多地內部歸因(Ni amp; Zheng, 2024; Xing et al., 2023)。由于AI的決策依賴客觀數(shù)據, 使AI具備更少的主觀意圖(Garvey et al., 2023)。因此, 相比于人類, AI在負面情境中輸出的決策具有更低的蓄意性與傷害性, 也更容易被接受。比如, 相比于人類歧視, 個體認為算法歧視具有更低的自由意志, 因此對其道德懲罰欲更少(許麗穎"等, 2022)。再如, 面對高于預期的價格, 個體認為AI (較人類)的出價具備較低的主觀意圖并更愿意接受(Garvey et al., 2023)。總結來看, 相比于人類管理者, AI基于客觀數(shù)據與或已有事實的特性使負面績效反饋更加客觀, 且具有更少的主觀意圖(Tong et al., 2021), 從而提升員工的內部歸因(Yalcin et al., 2022)。

此外, 研究發(fā)現(xiàn), 經歷挫折等負性事件會增強個體的成就動機(achievement motivation)。特別是對負面績效反饋內部歸因后, 員工會完善自身的行為表現(xiàn), 以期達到更高的績效表現(xiàn)來維護自尊水平(Weiner, 1985)。相反, 當員工將績效反饋結果歸因于自身無法控制的外部因素時, 可能會產生無力感并導致績效改進動機下降(Harvey et al., 2014)。據此, 本研究認為, 當員工將負面反饋歸因于自身因素(即內部歸因)而非外部情境因素(即外部歸因)時, 能夠提高員工的績效改進動機水平。因此提出:

假設3:"內部與外部歸因分別中介了人機負面績效反饋對績效改進動機水平的影響。具體而言, 相較于人類管理者, 員工對AI負面績效反饋的內部歸因水平更高、外部歸因水平更低, 進而會產生更高水平的績效改進動機。

最后, 由于客觀任務可量化的特點, 相比于人類管理者, 客觀任務下AI的數(shù)據整合與分析能力更強, 更容易獲得個體的信任, 進而引發(fā)員工的內部歸因(和減少外部歸因), 并提高績效改進動機水平。相反, 在主觀任務中, 相比于AI, 人類管理者擁有的人際溝通經驗和互動能力能夠更好地評估員工表現(xiàn)。因此, 在主觀任務中, 相比于AI, 人類管理者提供的負面績效反饋會引發(fā)更高水平的內部歸因(以及更低的外部歸因), 從而增強個體的績效改進動機(Castelo et al., 2019)。綜上提出:

假設4: 內部與外部歸因分別中介了人機負面績效反饋和任務類型對績效改進動機的交互作用。具體而言, 在客觀任務中, 相較于人類管理者, 員工對AI負面績效反饋的內部歸因水平更高、外部歸因水平更低, 進而產生更高水平的績效改進動機; 在主觀任務中, 相較于AI, 個體對人類管理者負面績效反饋的內部歸因水平更高、外部歸因水平更低, 進而產生更高水平的績效改進動機。

1.4""研究概覽

本研究關注的主要問題是, AI或人類管理者提供的負面績效反饋是否會影響員工差異化的績效改進動機, 并探討任務類型是否在上述過程中發(fā)揮邊界效應, 以及內部與外部歸因的中介作用。本研究擬通過4個遞進的實驗對假設進行檢驗。具體來說, 為達到對負面績效反饋內容更好的控制, 實驗1~3采用虛假反饋的策略為個體提供負面績效反饋(即被試收到內容完全相同的反饋)。其中, 實驗1在Credemo平臺上進行, 目的在于檢驗研究的假設1, 即相較于人類管理者, 由AI提供的負面績效反饋是否會導致員工產生更高水平的績效改進動機。實驗2在實驗1檢驗主效應的基礎上, 采用在問卷網定向招募不同行業(yè)與崗位員工的取樣策略(即通過調查平臺發(fā)布實驗信息與要求, 招募愿意參與本研究的員工被試), 目的在于檢驗研究的假設2, 并進一步探索任務類型的調節(jié)效應。此外, 實驗3通過發(fā)送工作郵件這一更真實的績效反饋形式為員工提供反饋信息, 并進一步檢驗內部與外部歸因的中介效應(假設3與4)。最后, 為進一步提高反饋的質量并增強其相對真實性, 實驗4向個體提供相對而言更加真實的負面績效反饋(基于個體任務表現(xiàn)的真實評估, 且更加具體和準確的反饋)。為提升研究結果的適用性, 本研究采用不同類型的AI代理提供負面績效反饋。具體來說, 實驗1為嵌入型AI (算法), 而實驗2~4為機器人式AI。

2 "實驗1:AI提供負面績效反饋引發(fā)較高的績效改進動機

實驗1的目的是探究人機提供負面績效反饋對員工績效改進動機的差異化影響。

2.1""方法

2.1.1""被試

采用G*Power 3.1 (Faul et al., 2007)計算本實驗所需樣本量。對于本實驗適用的單因素方差分析, 取中等效應量f = 0.25, 顯著性水平α"= 0.05, 組別數(shù)為2。事前檢驗顯示, 為達到80%的統(tǒng)計檢驗力至少需要128名被試。通過Credamo平臺發(fā)布實驗, 實時剔除12份注意力檢查未通過、規(guī)律性作答或回答時間過短的樣本, 并滾動采集, 最終得到了128份有效數(shù)據。其中, 女性71名(55.5%), 被試平均年齡為33.95歲(SD"= 8.24)。參與實驗的被試被隨機分配到人類管理者或AI負面績效反饋組, 其中人類管理者組63人, AI組65人。所有被試均自愿參加實驗并知情同意。通過注意力檢查并完成實驗的被試可獲得一定報酬。

2.1.2""實驗設計與程序

實驗1采用單因素兩水平的被試間設計:人機(人類管理者"vs. AI)負面績效反饋。被試被隨機分配到兩個實驗組別中的一組。首先, 考慮到自我效能感水平可能影響個體收到負面績效反饋后的態(tài)度(Kluger amp; Denisi, 1996), 為控制這一無關變量, 要求被試先填寫10題項的一般自我效能感問卷(Scholz et al., 2002), 采用7點量表計分, 從“1 = 非常不同意”到“7 = 非常同意” (實驗1該測量的內部一致性系數(shù)為0.91)。被試會閱讀一段情境材料, 情境材料改編自Tong等(2021)的研究。描述了某公司呼叫中心電話銷售員的日常工作情境, 并告知被試目前是該公司的一名電話銷售, 公司為了評估呼叫中心電話銷售員的工作表現(xiàn), 設立了質量控制部門, 對銷售員的服務電話進行錄音分析, 并于每周固定時間通過公司內部績效反饋系統(tǒng)提供績效反饋。

以往研究表明, 個體可能會因為AI規(guī)則或原理的不透明性從而降低對AI的信任(Glikson amp; Woolley, 2020)。因此在AI組, 適當?shù)貫楸辉囂峁〢I的屬性信息, 被試會被告知(人機反饋的變化通過字體加粗顯示): “質量控制部門的人工智能系統(tǒng)小ai (基于算法系統(tǒng), 由測評專家設計評價標準, 人工智能學者和計算機專家開發(fā)的用于提供績效反饋的程序,"通過對電話錄音和銷售量的數(shù)據分析為電話銷售員提供專業(yè)的績效反饋”。在人類管理者組, 相應地告知被試: “質量控制部門的銷售經理小艾經歷過系統(tǒng)的績效管理培訓, 具有專業(yè)知識和從業(yè)經驗), 通過對電話錄音和銷售量的數(shù)據分析, 為電話銷售員提供專業(yè)的績效反饋” (圖片材料見網絡版附錄)。隨后, 為檢驗人機負面績效反饋的啟動, 要求被試填寫操縱檢驗題目(“剛才是誰為您提供績效反饋?”)。

接下來, 不同組別的被試會收到來自“銷售經理小艾”或“人工智能系統(tǒng)小ai”的負面績效反饋:“你的工作表現(xiàn)低于部門平均水平, 你現(xiàn)在是部門績效表現(xiàn)較低的員工之一, 希望你能持續(xù)改進” (Belschak amp; Den Hartog, 2009)。閱讀完反饋信息后, 要求被試報告績效改進動機。采用并改編來自Wexley等(1973)的兩題項量表(實驗1~4均采用該測量的題項): “收到績效反饋后, 你多大程度上想在未來工作中達到更高的績效目標?”和“收到績效反饋后, 你多大程度上想在未來工作中提升績效” (采用7點量表評分, 從“1 = 一點沒有”到“7 = 非常”)。實驗1該測量的內部一致性系數(shù)為0.84。

考慮到AI組中被試可能對AI的熟悉度有所不同, 進而影響AI反饋后的績效改進動機。為排除上述影響, 參考Leo和Huh (2020)的研究, 要求被試報告對于AI的熟悉程度, 采用兩題項測量(“請問在你的日常工作或生活中是否經常與人工智能打交道?”和“請問你對人工智能的工作原理和運行機制是否熟悉和了解?”; 從“1 = 一點不了解”到“7"= 非常了解”)。另外, 在材料閱讀或問卷填寫過程中會隨機出現(xiàn)兩道注意力檢測題目(此題請選擇“非常不同意”用于篩選未認真作答的被試)。最后, 被試報告了性別和年齡兩項人口統(tǒng)計學信息。

2.2 "結果

2.2.1""操縱檢驗

為檢驗人機提供負面績效反饋的啟動效果, 要求被試閱讀實驗材料后回憶負面績效反饋的提供者“請回憶剛才是誰為你提供的績效反饋”。經檢查, 最終保留的128名被試全部回答正確。說明實驗1對人機負面績效反饋的操縱是成功的。

2.2.2 "假設檢驗

獨立樣本t檢驗結果發(fā)現(xiàn), 相比于人類管理者組(M"= 4.94, SD"= 1.38), AI負面績效反饋組(M"= 5.49, SD"= 1.18)中被試的績效改進動機更強, t(126)"= 2.38, p"= 0.019, Cohen’s"d = 0.43。為驗證這一結果的穩(wěn)健性, 首先將被試自我效能感作為控制變量, 進行單因素方差分析。結果表明, AI組的績效改進動機水平仍然高于人類管理者組, F(1, 127)"= 5.97, p = 0.016, η2"= 0.046。

其次, 為進一步排除被試性別(男性"= 1; 女性"= 2)和年齡可能對結果的影響, 分別對其進行相關分析和獨立樣本t檢驗。結果表明, 被試年齡與績效改進動機并不相關(r"= 0.07, p"= 0.447), 男性(M"= 5.18, SD"= 1.34)和女性(M"= 5.25, SD"= 1.29)的績效改進動機也無顯著差異, t(126) = 0.34, p"= 0.738。最后, 為排除被試對AI的熟悉程度對結果可能的影響, 相關分析結果表明, AI組被試的AI熟悉程度與績效改進動機的相關不顯著(r"= 0.002, p"= 0.990)。

2.3""討論

實驗1在電話銷售的績效反饋場景中初步驗證了研究假設1, 即相對于人類管理者提供的負面績效反饋, AI提供的負面績效反饋會促使個體產生更高水平的績效改進動機。為驗證實驗1結果的穩(wěn)健性, 并進一步檢驗假設2, 實驗2定向招募企業(yè)的在職員工, 并改變績效反饋的場景(新員工入職培訓場景), 擬驗證任務類型與人機負面績效反饋影響員工績效改進動機的交互作用。此外, 在操縱人機反饋時, 實驗1以嵌入式的算法作為AI組的實驗材料??紤]到機器人式AI (robotic AI)未來可能與員工共事并進入組織(Yam et al., 2023), 以及其通常在人機交互過程中引發(fā)更高水平的信任與體驗感(Glikson amp; Woolley, 2020), 實驗2~4采用機器人式AI作為AI組的實驗材料, 并為個體提供負面績效反饋。

3 "實驗2:任務類型作為邊界條件

實驗2定向招募企業(yè)的在職人員, 擬進一步探討人機負面績效反饋和任務類型是否交互影響員工績效改進動機。此外, 為進一步提升實驗材料的嚴謹性, 實驗2對實驗材料進行了預測試。

3.1 "方法

3.1.1""實驗材料預測試

在正式進行實驗2之前, 為了檢驗本研究自編的任務類型(主觀vs. 客觀)與人機(人類管理者vs. AI)反饋刺激圖片的可靠性。在Credamo平臺招募60名被試(男性29名, 女性31名, 被試平均年齡為29.07歲(SD"= 7.97), 對實驗材料展開預測試。被試被隨機分配到主觀或客觀任務情境中, 完成三道任務題目(每題作答不少于100字)。其中, 主觀任務中的三道題目分別包含沖突化解, 突發(fā)事件應對以及人際溝通等組織中常面臨的問題; 而客觀任務的三道題目分別包含人員排序, 方案計算以及銷量預測三方面內容(詳見網絡版附錄)。此外, 被試需要對主觀任務和客觀任務的任務客觀性(您在多大程度上認為上述任務是客觀任務; 1 = 一點也不, 5 = 很大程度上)、任務難度進行評估(請您評估上述任務的難易程度; 1 = 一點不難, 5 = 非常困難)。獨立樣本t檢驗結果顯示, 客觀任務(M = 4.10, SD"= 0.80)的任務客觀性顯著高于主觀任務(M = 1.53, SD"= 0.82), t(58) = 12.25, p lt;"0.001, Cohen’s"d ="0.80; 此外, t檢驗結果表明, 兩類任務的難度不存在顯著差異, t(58) = 0.26, p ="0.25。同時, 為檢驗兩種任務類型是否貼近真實的工作場景, 采用5題項量表(Fields et al., 2023), 并要求被試進行表面效度(face validity)評分, 代表題項如:“您在多大程度上認為, 本次測試的實際內容是與日常工作明顯相關的”, 從“1 = 完全沒有”到“5 = 完全是”。結果顯示, 兩種任務的表面效度均較高, 主觀任務的表面效度均值為4.33, 而客觀任務為3.92。因此可知, 實驗任務的設置較為合理且比較符合現(xiàn)實的工作場景。

此外, 參考"Garvey等(2023)的實驗材料, 檢驗AI和人類管理者形象的圖片在面孔吸引力和詭異性方面的差異(圖片材料見網絡版附錄)。獨立樣本t檢驗結果顯示, 兩張圖片在面孔吸引力上不存在顯著差異, t(59) = 0.24, p = 0.59。人工智能圖片僅存在輕微的詭異度(M =1.47, SD = 0.57)。因此可知, 實驗2對刺激圖片的選擇較為合理。

3.1.2""被試

采用G*Power 3.1軟件(Faul et al., 2007)計算實驗所需的樣本量。對于本實驗適用的雙因素方差分析, 取中等效應量f = 0.25, 顯著性水平α"= 0.05, 組數(shù)為4。事前檢驗表明, 要達到85%的統(tǒng)計檢驗力至少需要146名被試。實驗2委托問卷網發(fā)布實驗信息, 定向招募在職員工被試參與本實驗, 并在平臺導入實驗相關材料, 開展線上行為實驗。考慮到可能會出現(xiàn)未完成或回答無效的數(shù)據, 實驗二招募了168名在職企業(yè)人員。剔除8份沒有通過注意力檢查、存在規(guī)律性回答或作答時間異常的數(shù)據后, 最終得到了160份有效數(shù)據。其中, 女性61名(38.1%), 被試平均年齡為33.29歲(SD"= 4.98)。被試主要來自制造、軟件、金融、教育及快消品行業(yè), 主要從事管理(55人, 占34.4%)、生產運營(37人, 占23.1%)、技術研發(fā)(10人, 占6.3%)、市場營銷(25人, 占15.6%)、產品設計(33人, 占20.6%)等崗位的工作。所有被試均自愿參加實驗并知情同意。通過注意力檢查并完成實驗的被試可獲得相應報酬。

3.1.3""實驗設計與程序

實驗2采用雙因素被試間設計: 2"(人機負面績效反饋:人類管理者vs. AI) ′"2"(任務類型:主觀vs.客觀)。參與實驗的被試被隨機分配到4個實驗組別中的其中一組。

正式實驗前, 同實驗1, 要求被試填寫一般自我效能感問卷(Scholz et al., 2002), 并作為研究的控制變量(實驗2該測量的內部一致性系數(shù)為0.89)。被試隨后會閱讀一段情境材料, 告知被試是某日用品股份有限公司的一名新入職員工。在一次部門月度工作總結結束后, 部門為包括被試在內的5名新員工安排了職業(yè)能力的測試, 以更好地制定個性化的培訓計劃, 并為后續(xù)的崗位安排提供基礎。接下來, 告知被試以下是測試的其中一道代表性例題。在主觀任務組, 被試需要完成一道職場中化解人際沖突的題目; 在客觀任務組, 被試需要完成一道預測未來產品銷量的題目(見網絡版附錄), 為確保被試認真作答并融入情景, 要求被試每題作答不少于100字。

完成測試題目后, 告知被試2分鐘后會收到對于測試的反饋。在人類管理者組, 告知被試(加粗字展示了操縱人機反饋的差異): “公司邀請了人力資源部門測評專員王亮對你的表現(xiàn)進行評估反饋。測評專員王亮經過系統(tǒng)的職業(yè)能力測評培訓, 具有專業(yè)知識且經驗豐富的測評專家會閱讀你的回答, 評估你的作答質量, 并進行統(tǒng)計排名, 對你本次測試完成情況進行評估反饋”, 并展示王亮形象的圖片(見網絡版附錄)。在AI組, 被試相應被告知: “公司通過人力資源測評中心開發(fā)設計的人工智能評估助手小ai, 對你的表現(xiàn)進行評估反饋。人工智能評估助手小ai, 會基于算法系統(tǒng)該算法系統(tǒng)是基于測評專家設計的評價標準, 由人工智能學者和計算機專家開發(fā)的程序對你的答案自動進行識別, 評估你的作答質量, 并進行統(tǒng)計排名, 對你本次測試完成情況進行評估反饋” (相應展示小ai, 見網絡版附錄)。隨后, 要求被試填寫操縱檢驗題目(例如“請問為您提供測試反饋的是”, 1 = 測評專員王亮, 7 = AI評估助手小ai以及“請對您剛才完成的測試題目的客觀性進行評分”, 1 = 非常主觀, 7 = 非??陀^)。

約2分鐘后, 被試會收到來自“測評專員王亮或人工智能測評助手小ai”的負面績效反饋: “在本次測試中, 你的表現(xiàn)低于80%的同事, 位于后20%, 表現(xiàn)有待提升” (Kim amp; Kim, 2020)。最后, 要求被試填寫績效改進動機(實驗2該測量的內部一致性系數(shù)為0.84), 并報告性別、年齡、行業(yè)與崗位這4項人口統(tǒng)計學信息。AI組被試需要填寫對AI的熟悉程度。問卷填答過程中會隨機出現(xiàn)兩道注意力檢測題目(此題請選擇“非常不同意”)用于篩選未認真作答的被試。

3.2""結果

3.2.1 "操縱檢驗

首先, 為檢驗人機提供負面績效反饋的啟動效果。要求被試閱讀實驗材料后回憶負面績效反饋的提供者“請回憶剛才是誰為您提供的績效反饋” (1 = 測評專員王亮, 7 = AI評估助手小ai)。結果顯示, AI負面績效反饋組(M"= 6.24, SD"= 1.05)的評分顯著高于人類管理者組(M"= 1.95, SD"= 1.11), t"(158) = 25.11, p"lt; 0.001, Cohen’s"d = 0.86。說明實驗2對人機負面績效反饋的操縱成功。

其次, 為檢驗任務類型操縱有效性, 要求被試回答, “你認為剛才所做測試例題的客觀性” (1 = 非常主觀, 7 = 非??陀^)。結果表明, 客觀任務組(M"= 5.96, SD"= 0.79)的任務客觀性評分顯著高于主觀任務組(M"= 2.33, SD"= 0.87), t(158) = 27.77, p"lt; 0.001, Cohen’s"d = 0.83。說明任務類型的操縱成功。

3.2.2""假設檢驗

其次, 獨立樣本t檢驗結果發(fā)現(xiàn), 相較于人類管理者組(M"= 5.36, SD"= 1.13), AI提供負面績效反饋組(M"= 5.67, SD"= 0.79)被試的績效改進動機更強, t"(158) = 2.00, p"= 0.048, Cohen’s"d = 0.46。將被試自我效能感作為控制變量, 進行單因素方差分析。結果表明, AI組的績效改進動機水平仍然高于人類管理者組, F(1, 157) = 4.64, p = 0.033, η2"= 0.029。為排除被試對AI的熟悉程度對結果可能的影響, 相關分析結果表明, AI組被試的AI熟悉程度與績效改進動機的相關不顯著(r"= 0.10, p"= 0.40)。綜上, 研究假設1再次得到驗證。

最后, 檢驗任務類型是否能夠作為邊界條件。雙因素方差分析結果表明, 人機負面績效反饋和任務類型對個體的績效改進動機有顯著的交互影響, F(1, 156) = 39.65, p"lt; 0.001, η2"= 0.203。簡單效應分析發(fā)現(xiàn)(如圖1), 在客觀任務組, AI負面績效反饋組的績效改進動機水平(M"= 5.71, SD"= 0.66)顯著高于人類管理者組(M"= 4.60, SD"= 1.01), F (1, 156)"= 37.75, p lt; 0.001, η2"= 0.195。在主觀任務組, 人類管理者組的負面反饋績效改進動機水平(M"= 6.13, SD"= 0.59)顯著高于AI組(M"= 5.63, SD"= 0.90), F(1, 156) = 7.63, p = 0.006, η2"= 0.047。為檢驗上述結果的穩(wěn)健性, 將被試自我效能感作為協(xié)變量進行控制, 結果發(fā)現(xiàn), 人機負面績效反饋與任務類型的交互作用依然顯著, F(1, 155) = 40.58, p"lt; 0.001, η2"= 0.207。假設2得到驗證。

3.3""討論

實驗2基于新入職員工績效反饋的場景, 重復實驗1研究發(fā)現(xiàn)的基礎上, 還進一步發(fā)現(xiàn)了人機負面績效反饋與任務類型對個體績效改進動機的交互作用, 從而驗證了研究假設2。實驗2較實驗1主要有兩點改善。首先, 參考以往績效反饋的研究(Cianci et al., 2010), 在被試執(zhí)行實驗任務后間隔一定時間后提供績效反饋, 以增強績效反饋的真實性。其次, 實驗1采用的是評價型反饋(例如, “你現(xiàn)在是部門績效表現(xiàn)較低的員工之一”), 而實驗2采用了客觀型反饋(例如, “在本次測試中, 你的表現(xiàn)低于80%的同事, 位于后20%”), 這使負面績效反饋的內容更加客觀, 也有利于降低被試的負面情緒反應(Kim amp; Kim, 2020)。

但是, 實驗2仍存在一些不足。比如, 雖然實驗2通過任務執(zhí)行?延遲反饋的設計在一定程度上提升了反饋的真實性, 但任務與績效反饋的間隔時間以及績效反饋的呈現(xiàn)方式仍然有待改進。鑒于此, 實驗3在被試完成任務間隔20分鐘后, 通過郵件這種更真實的形式發(fā)送績效反饋, 并進一步檢驗內部與外部歸因在人機負面績效反饋影響員工績效改進動機發(fā)揮的中介作用。

4 "實驗3:內部與外部歸因的中介作用

實驗3目的是采用郵件績效反饋這種更真實的形式, 進一步檢驗實驗1和實驗2實驗結果的穩(wěn)健性, 以及探討內部和外部歸因發(fā)揮的中介作用。

4.1""方法

4.1.1""被試

采用G*Power 3.1軟件(Faul et al., 2007)計算本實驗所需樣本量。對于本實驗適用的雙因素方差分析, 取中等效應量f = 0.25, 顯著性水平α"= 0.05, 組別數(shù)為4。事前分析顯示, 要達到85%的統(tǒng)計檢驗力至少需要146名被試。類似于實驗2, 實驗3委托問卷網發(fā)布實驗信息, 定向招募在職員工被試參與本實驗??紤]到可能會出現(xiàn)少量未完成或填答無效的數(shù)據, 實驗3共招募了160名在職員工參加實驗。所有被試均自愿參加實驗并知情同意, 通過注意力檢測并完成實驗任務的被試可獲得相應報酬。

剔除沒有通過注意力測試, 未完成作答或作答無效的被試10名, 實驗3最終有效樣本為150。其中, 女性86名(57.3%), 被試平均年齡為29.70歲(SD"= 4.97), 平均工齡為6.17年(SD"= 4.23)。參與實驗的被試來自互聯(lián)網、建筑業(yè)、制造業(yè)、信息通信業(yè)、商品銷售業(yè)、教育、醫(yī)療、金融和服務這9個行業(yè)。從工作崗位上來看, 參與實驗的員工包含管理類52人, 占比34.87%; 運營類29人, 占比19.40%; 技術類19人, 占比12.50%; 營銷類26人, 占比17.43%; 創(chuàng)意設計類24, 占比15.79% 。

4.1.2""實驗設計與程序

實驗3采用雙因素組間設計: 2 (人機負面績效反饋:人類管理者vs. AI) × 2 (任務類型:主觀vs. 客觀)。被試被隨機分配到4個實驗組別中的一組。

告知被試即將參與一場職業(yè)能力競賽。事先收集參與者的工作郵箱以便后期發(fā)送對應的績效反饋。競賽分為兩個階段(競賽與績效反饋)。在競賽階段, 被試需要根據要求完成競賽中的題目。首先, 要求被試填寫自我效能感問卷以作為研究的控制變量(實驗3該測量的內部一致性系數(shù)為0.91)。接下來, 采用實驗2的材料預測試題目, 被試依據組別完成三道主觀或客觀型競賽題目(具體題目見網絡版附錄), 為確保被試認真作答并融入情景, 要求被試每題作答不少于100字。完成競賽任務后, 被試被告知某高校的職業(yè)測評中心將負責對參與者的競賽表現(xiàn)進行評估和反饋。在人類管理者組, 被試被告知(人機反饋的操縱差異通過加粗的字體呈現(xiàn)): “為了評估您在本次職業(yè)能力競賽中的表現(xiàn), 我們邀請了某高校測評中心的負責人王亮, 對您的表現(xiàn)進行評估反饋。測評中心負責人王亮經過系統(tǒng)的職業(yè)能力測評培訓, 具有專業(yè)知識且經驗豐富的測評專家), 會閱讀您的回答, 評估您的作答質量, 并進行統(tǒng)計排名對您本次職業(yè)能力競賽結果進行評估反饋”。并配有王亮形象的圖片(見網絡版附錄)。在AI組, 被試會被告知:“為了評估您在本次職業(yè)能力競賽中的表現(xiàn), 我們將使用某大學測評中心最新引進的人工智能測評助手小ai, 對您的表現(xiàn)進行評估反饋。人工智能測評助手小ai, 基于算法系統(tǒng)該算法系統(tǒng)是基于測評專家設計的評價標準由人工智能學者和計算機專家開發(fā)的程序對您的答案自動進行識別和分析, 評估您的作答質量并進行統(tǒng)計排名, 對您本次職業(yè)能力競賽結果進行評估反饋” (相應展示小ai, 見網絡版附錄)。期間, 要求被試回答操縱檢驗題目(“請問為您提供競賽反饋的是”, 1"= 測評中心負責人王亮, 7 = 測評中心AI助手小ai; 以及“請對您剛才完成的競賽題目的客觀性進行評分”, 1 = 非常主觀, 7 = 非??陀^)。隨后, 被試被告知“由于需要等待和評估其他參與者的表現(xiàn)并進行最終排名, 績效反饋需要約20分鐘, 最終的競賽結果和測評問卷鏈接會通過您的電子郵箱發(fā)送給您”。為減弱被試在等待反饋過程中可能出現(xiàn)的注意力缺失問題對實驗結果的干擾, 要求所有被試觀看一段時長約20分鐘的某高校測評中心的介紹視頻。

在績效反饋階段, 實驗人員通過提前更換好域名的電子郵箱(比如, 某高校測評中心負責人王亮或AI測評助手小ai), 向先前收集好的被試工作郵箱發(fā)送職業(yè)競賽的反饋結果。為加強對人機負面績效反饋的操縱, 人類管理者組的被試會收到: “您好!在本次職業(yè)能力競賽中, 您的表現(xiàn)低于82%的參與者, 位于后18%” (Kim amp; Kim, 2020)。而AI組除了為被試提供與人類管理者組相同內容的負面績效反饋外, 還會在郵件的文末備注: “此郵件由人工智能助手自動發(fā)送, 請勿回復”。隨后, 提示被試填答附于郵件中的第二階段問卷, 包括回憶并簡述績效反饋內容(確保被試基于反饋信息填答后續(xù)題目); 對于AI的熟悉程度; 績效改進動機(實驗3該測量的內部一致性系數(shù)為0.84); 內部與外部歸因的測量選取Russell (1982)開發(fā)的6題項量表來測量。3題項用于測量內部歸因, 代表題項如: “您在多大程度上認為, 反饋者提供的測評反饋結果是基于你個人的努力而產生”, 該測量內部一致性系數(shù)為0.78; 外部歸因代表題項如“您在多大程度上認為, 反饋者提供的測評反饋結果是基于環(huán)境因素而產生(比如題目很難)”, 該測量內部一致性系數(shù)為0.74。采用7點評分法, 從“1為一點也沒有”, 到“7為很大程度上”。

接下來, 已有研究發(fā)現(xiàn), 個體對人類或AI績效反饋的準確性(Tong et al., 2021)和公平感知(Newman et al., 2020)可能存在差異。比如, 由于AI本質上是一套數(shù)據驅動的程序模型, 其客觀和無偏性更高, AI (較人類管理者)提供負面績效反饋可能引發(fā)個體較高的準確性或公平感知(蔣路遠"等, 2022), 從而差異化影響績效改進動機。為排除上述兩條替代解釋機制, 要求被試填寫反饋準確性(Brett amp; Atwater, 2001)和公平感量表(Chory amp; Westerman, 2009)。反饋準確性的測量包含2個題項(“您在多大程度上認為您收到的反饋是對您表現(xiàn)的準確評估”; “您在多大程度上相信您收到的反饋是正確的”。采用7點量表評分, 從“1 = 一點沒有”到“7 = 非?!?, 該測量的內部一致性系數(shù)為0.89)。公平感知包含6個題項(代表題項如“我認為反饋者給我提供的反饋是:1 = 不公正的; 7 = 公正的”, “我認為反饋者給我提供的反饋是:1 = 有偏見的; 7 = 中立的”, 該測量的內部一致性系數(shù)為0.97)。最后, 被試報告性別、年齡、工齡、行業(yè)以及崗位這5項人口學變量。問卷填答過程中會隨機出現(xiàn)兩道注意力檢測題目(此題請選擇“非常不同意”)用于篩選未認真作答的被試。

4.2 "結果

4.2.1 "操縱檢驗

首先, 為檢驗人機提供負面績效反饋的啟動效果。要求被試閱讀實驗材料后回憶負面績效反饋的提供者“請回憶剛才是誰為您提供的績效反饋” (1 = 測評中心負責人王亮, 7 = 測評中心AI助手小ai)。結果顯示, AI負面績效反饋組(M"= 5.26, SD"= 1.47)的評分顯著高于人類管理者組(M"= 2.49, SD"= 0.86), t(148) = 13.10, p lt; 0.001, Cohen’s"d = 0.71。說明實驗3對人機負面績效反饋的操縱成功。

為檢驗任務類型的啟動效果, 要求被試評價實驗任務的客觀性。結果表明, 客觀任務組(M"= 5.54, SD"= 0.98)的任務客觀性評分顯著高于主觀任務組(M"= 3.41, SD"= 1.95), t(148) = 8.23, p"lt; 0.001, Cohen’s"d = 0.63。表明任務類型的操縱成功。

4.2.2""假設檢驗

為檢驗研究假設1。獨立樣本t檢驗結果表明, 相較于人類管理者(M = 4.66, SD = 1.10), AI的負面績效反饋(M = 5.06, SD = 1.21)能夠引發(fā)更高水平的績效改進動機, t(148) = 2.10, p = 0.037, Cohen’s"d"= 0.44。將自我效能感作為協(xié)變量控制, 依然發(fā)現(xiàn)相較于人類管理者, AI提供負面績效反饋會導致更高水平的績效改進動機, F(1, 147) = 4.05, p"= 0.046, η2"= 0.027。假設1得到驗證。其次, 為排除AI熟悉程度對結果的影響, 相關分析發(fā)現(xiàn), AI組被試對AI的熟悉度與其績效改進動機并不相關(r = 0.06, p"= 0.61)。為檢驗研究假設2, 雙因素方差分析結果發(fā)現(xiàn)(如圖2), 人機負面績效反饋和任務類型對個體的績效改進動機具有顯著的交互作用, F(1, 146)"= 20.00, p"lt; 0.001, η2"= 0.120。且簡單效應分析發(fā)現(xiàn), 在客觀任務組, AI負面反饋組的績效改進動機水平(M"= 5.60, SD"= 0.88)顯著高于人類管理者組(M"= 4.35, SD"= 0.92), F(1, 146) = 24.47, p lt;"0.001, η2"= 0.144。在主觀任務組, 人類管理者負面反饋組的績效改進動機水平(M"= 4.92, SD"= 1.17) (邊緣)顯著高于AI組(M"= 4.57, SD"= 1.26), F(1, 146) = 3.00, p = 0.085 lt; 0.10, η2"= 0.02。為檢驗上述結果的穩(wěn)健性, 將被試自我效能感作為協(xié)變量進行控制, 結果發(fā)現(xiàn), 人機負面績效反饋與任務類型的交互作用依然顯著, F(1, 145)"= 22.79, p"lt; 0.001, η2"= 0.136。因此, 研究的假設2再次得到了驗證。

為檢驗內部與外部歸因的中介效應, 選擇PROCESS插件的模型4, Bootsrap為2000。結果表明, 內部歸因在人機負面績效反饋到績效改進動機的間接效應顯著, 且中介效應的指標值為0.17,95%的CI為[0.015, 0.350], 區(qū)間不包含0。此外, 外部歸因在人機負面績效反饋到績效改進動機的中介效應指標值為0.08, 95%的CI為[?0.04, 0.21], 區(qū)間包含0, 說明外部歸因在人機負面績效反饋到績效改進動機的間接效應不顯著。研究假設3得到了部分驗證。

此外, 本研究還檢驗了內部與外部歸因在人機負面績效反饋與任務類型對績效改進動機交互效應中的間接效應。選擇PROCESS插件的模型8, 設定樣本量為2000。結果表明, 在主觀任務中, 內部歸因在人機負面績效反饋到績效改進動機的間接效應顯著, 95%的CI為[?0.40, ?0.03]; 在客觀任務中, 內部歸因在人機負面績效反饋到績效改進動機的間接效應同樣顯著, 95%的CI為[0.20, 0.84]。且在兩種不同類型的任務下, 有調節(jié)的間接效應的差值顯著, 指標值為0.67, 95%的CI為[0.277, 1.178]。說明有調節(jié)的中介效應顯著; 而外部歸因有調節(jié)的間接效應指標值為0.12, 95%的CI為[?0.065, 0.375]。區(qū)間包含0, 因此研究假設4也得到了部分驗證。

為檢驗反饋準確性和公平感是否能作為替代性解釋的機制。首先, 獨立樣本t檢驗發(fā)現(xiàn), 人類管理者(M = 3.78, SD"= 1.63)或AI提供負面績效反饋(M"= 3.80, SD = 1.60)在準確性水平上并無差異, t(148)"= 0.07, p ="0.94。但是, AI提供負面績效反饋(M = 5.31, SD = 1.35)比人類管理者(M = 4.84, SD = 1.50)更公平, t(148) = 2.00, p ="0.047, Cohen’s"d = 0.32。此外, 人機負面績效反饋與任務類型對反饋準確性(和公平感)的交互作用均不顯著, F(1, 146) = 0.12, p"= 0.73; F(1, 146) = 0.58, p"= 0.45。最后, 反饋準確性(95%的CI為[?0.082, 0.065])和公平感(95%的CI為[?0.06, 0.24])在人機負面績效反饋與績效改進動機之間的間接效應也均不顯著。綜上, 實驗3排除了反饋準確性與公平感這兩條替代的解釋機制。

4.3""討論

實驗3以更加貼近組織真實反饋的方式, 檢驗了實驗1和實驗2結果的穩(wěn)健性, 并進一步發(fā)現(xiàn)了內部歸因發(fā)揮的中介作用。這為不同任務情境下, AI和人類管理者提供負面績效反饋對員工績效改進動機的差異化影響提供了一個良好的解釋機制。不僅如此, 實驗3還排除了反饋準確性與公平感的替代解釋機制。

實驗3未能發(fā)現(xiàn)外部歸因的中介作用, 可能的原因在于, 個體出于自尊維護與自我防御的目的, 無論人類管理者抑或AI提供負面績效反饋, 可能都傾向于表現(xiàn)一定水平的外部歸因(Hareli amp; Hess, 2008)。比如實驗3中, 人類管理者組(M = 3.60, SD"= 1.27)與AI負面績效反饋組(M = 3.92, SD = 1.33)的被試均有一定程度的外部歸因, 但差異并不顯著, t(148) = 1.52, p ="0.13。與實驗3結果一致的是, Yalcin等(2022)也發(fā)現(xiàn)在不利性決策情境中(例如遭到公司拒絕), 消費者對來自人類或AI客服反饋的外部歸因差異不顯著。

此外, 實驗1~3采用了績效反饋研究中常用的虛假反饋范式(Cianci et al., 2010; Kim amp; Kim, 2020), 其優(yōu)點在于控制被試間反饋內容的一致性。但由于沒有評估被試的真實任務表現(xiàn), 導致個體可能對負面績效反饋的準確性、真實性感知較低。為解決上述問題并進一步提升績效反饋的質量, 實驗4擬在相對真實的反饋場景下為個體提供更為具體和個性化的績效反饋, 從而再次驗證本研究的整體模型。

5 "實驗4:真實反饋下對假設模型的再驗證

實驗4擬基于個體真實的任務表現(xiàn)為其提供具體的、個性化的績效反饋。具體來說, 除提供結果性的反饋外(展示排名, 成績等結果), 實驗4加入了過程性的反饋, 比如解釋任務目的, 提供針對任務表現(xiàn)的鼓勵, 或問題診斷等具體信息(Goodman amp; Wood, 2004), 從而加強負面績效反饋的真實性和質量。

5.1""方法

5.1.1 "被試

采用G*Power 3.1軟件(Faul et al., 2007)計算本實驗所需樣本量。對于本實驗適用的雙因素方差分析, 取中等效應量f = 0.25, 顯著性水平α"= 0.05, 組別數(shù)為4。事前分析顯示, 要達到85%的統(tǒng)計檢驗力至少需要146名被試。類似于實驗2和3, 實驗4委托問卷網發(fā)布實驗信息, 定向招募在職員工被試??紤]到可能會出現(xiàn)少量未完成或填答無效的數(shù)據, 實驗4共招募了166名在職員工參加實驗。所有被試均自愿參加實驗并知情同意。通過注意力檢測并完成實驗任務的被試可獲得相應報酬。

剔除沒有通過注意力測試, 未完成作答或作答無效的被試6名。實驗4最終有效樣本為160。其中, 女性65名(40.60%), 被試平均年齡為29.54歲(SD"= 6.07)。91.3%的被試有過本科及以上的教育經歷。參與實驗的被試主要來自制造業(yè)、軟件業(yè)、商務服務業(yè)、金融業(yè)、科學研究與教育業(yè)等5個行業(yè)。從工作崗位來看, 參與實驗的員工包含技術研發(fā)類50人, 占比31.30%; 管理類34人, 占比21.30%; 生產與運營類31人, 占比19.40%; 市場營銷類31人, 占比19.40%; 產品設計類14人, 占比8.80% 。

5.1.2""實驗設計與程序

實驗4采用雙因素組間設計: 2"(人機負面績效反饋:人類管理者vs. AI)"×"2"(任務類型:主觀vs. 客觀)。被試被隨機分配到4個實驗組別中的一組。

在正式實驗開始前進行兩項實驗的準備工作。首先, 對5名主試人員進行培訓, 使他們清晰并熟練地掌握各題目的作答要點或評價標準。其次, 事先編輯好負面績效反饋的模版, 在正式作答時依據被試的表現(xiàn)進行個性化的更改, 從而控制反饋的內容并減少提供反饋所需的時間。在正式實驗階段, 第一, 告知被試是某涂料公司的一名主管, 即將參與一場針對企業(yè)中層管理人員的管理能力測評, 為后續(xù)的培訓與學習提供參考依據。隨后, 將測評分為兩個階段(任務以及績效反饋)。在測評任務階段, 被試需要完成以下實驗步驟:第一, 要求被試填寫自我效能感問卷以作為研究的控制變量(實驗4該測量的內部一致性系數(shù)為0.96)。第二, 與實驗2~3類似, 不同任務組別的被試需要相應完成2道主觀或客觀任務(見網絡版附錄), 要求每題的作答不得少于100字。第三, 完成測評任務后, 被試被告知公司將會對其測評表現(xiàn)進行專業(yè)評估和反饋。在人類管理者組(人機反饋操縱的差異通過加粗字體展示): “為了評估您在本次管理能力中的表現(xiàn), 我們邀請公司管理能力測評專員王亮, 對您的表現(xiàn)進行評估反饋。測評專員王亮經過系統(tǒng)的職業(yè)能力測評培訓, 具有專業(yè)知識且經驗豐富的測評專家), 會閱讀您的回答, 評估您的作答質量并進行統(tǒng)計排名, 對您本次管理能力測評的結果進行評估反饋”, 并搭配一張王亮形象的圖片(見網絡版附錄)。在AI組, 則對應描述為: “為了評估您在本次職業(yè)能力競賽中的表現(xiàn), 我們將使用公司人事部最新引進的人工智能(AI)測評助手小ai, 對您的表現(xiàn)進行評估反饋。人工智能測評助手小ai, 基于算法系統(tǒng)該算法系統(tǒng)是基于測評專家設計的評價標準, 由人工智能學者和計算機專家開發(fā)的程序并對您的答案自動進行識別和分析, 評估您的作答質量, 并進行統(tǒng)計排名, 對您本次管理能力測評的結果進行評估反饋” (相應展示小ai形象, 見網絡版附錄)。隨后, 被試被告知“由于需要等待和評估其他參與者的表現(xiàn)并進行最終排名, 績效反饋需要約1分鐘”。最后, 要求被試完成任務類型的操縱檢驗題目“請問您在多大程度上認為本次您完成的測評題目屬于客觀任務”, 從1 = 非常主觀至7 = 非??陀^。

在績效反饋階段, 參考Goodman和Wood (2004)的做法, 通過為被試解釋任務目的, 提供具體的鼓勵或改善意見來提升績效反饋的質量。首先, 要求被試登陸SalesSmartly (一個專業(yè)的企業(yè)?人員實時聊天交互網站), 由實驗人員扮演的人類管理者或者AI為參與者提供幾乎實時的績效反饋。被試通過輸入其對應的編號, 即可收到測評的績效反饋。其次, 在反饋的內容方面, 第一, 實驗人員會依據個體作答的詳細性、邏輯性以及清晰性, 給予參與者一句測評的總評, 例如: “親愛的××參與者, 感謝您完成本次管理能力測評的試題。整體上, 您的回答較為模糊(或清晰)”。接著, 向參與者解釋測評的目的以及題目考察的具體能力。主觀任務組的描述為:“本次測試的第一封公文旨在考察您在建設團隊中的矛盾化解能力。而第二封意在測試您應對團隊中突發(fā)事件的問題解決能力”??陀^任務組的描述對應為: “本次測試的第一封公文旨在考察您在原料采購中的運算分析能力。而第二封意在測試您預測銷售量的邏輯推理能力”。隨后, 依據事先整理好的作答要點對被試作答的兩道題目進行評分, 并給予具體的意見。例如: “相較于同期的參與者, 您表現(xiàn)出了較弱的矛盾化解能力【54.15/100】(分析并列舉具體的作答缺陷)。但您表現(xiàn)出的突發(fā)事件解決能力較好, 得分為【69.75/100】(分析并列舉具體的作答優(yōu)點)”。此外, 為提供明確的負面績效反饋并更好地對內容進行控制, 所有參與者統(tǒng)一收到:"“總的來說, 您在本次測試中的總分為【61.95/"100】, 低于82%的參與者且位于后18%, 表現(xiàn)有待提升”。為展現(xiàn)人機反饋操縱的差異, 在人類管理者組, 測評專員王亮會感謝被試的參與和配合。在AI組, 小ai會感謝被試的使用。最后, 為防止產生額外變量, 所有負面績效反饋均參考相同的格式, 且內容控制在200字左右。

閱讀反饋后, 被試會填寫第二階段問卷, 為確保被試認真閱讀反饋并基于反饋內容填答后續(xù)題目, 要求被試回憶并簡述收到的反饋內容。接著, 被試填寫問卷題目, 包括反饋提供者(1 = 測評專員王亮; 7 = 測評助手小ai)與反饋內容(1 = 很負面; 5 = 很正面)的操縱檢驗, 以及對于AI的熟悉程度; 績效改進動機(實驗4該測量的內部一致性系數(shù)為0.89); 內部歸因(內部一致性系數(shù)為0.79)與外部歸因(內部一致性系數(shù)為0.83;"測量題項同實驗3)。最后, 與實驗3類似, 考慮到反饋公平感(內部一致性系數(shù)為0.95)與準確性(內部一致性系數(shù)為0.87)可能作為本研究的替代中介變量, 要求被試分別對上述兩個變量進行填答。問卷填答過程中會隨機出現(xiàn)兩道注意力檢測題目(此題請選擇“非常不同意”)用于篩選未認真作答的被試。

5.2 "結果

5.2.1""操縱檢驗

首先, 為檢驗負面績效反饋的啟動效果。要求被試回憶接收的反饋內容: “請問您收到的反饋對您在測評中的表現(xiàn)的評價是"(1 = 很負面, 5 = 很正面)”。結果顯示, 個體對反饋內容感知的均值為2.01(SD = 0.97)。說明實驗4對負面績效反饋的操縱是成功的。

其次, 為檢驗人機提供負面績效反饋的啟動效果。要求被試閱讀實驗材料后回憶負面績效反饋的提供者: “請回憶剛才是誰為您提供的績效反饋"(1"= 測評中心負責人王亮, 7 = 測評中心AI助手小ai)”。結果顯示, AI負面績效反饋組(M"= 5.71, SD"= 1.72)的評分顯著高于人類管理者組(M"= 1.60, SD"= 1.33), t"(158) = 16.92, p lt; 0.001, Cohen’s"d = 0.80。說明實驗4對人機負面績效反饋的操縱是成功的。

最后, 為檢驗任務類型的啟動效果, 要求被試評價實驗任務的客觀性。結果表明, 客觀任務組(M"= 5.49, SD"= 1.23)的任務客觀性評分顯著高于主觀任務組(M"= 3.41, SD"= 1.51), t"(158) = 9.53, p"lt; 0.001, Cohen’s"d = 0.60。表明任務類型的操縱成功。

5.2.2""假設檢驗

為檢驗研究假設1。獨立樣本t檢驗結果表明, 相較于人類管理者(M = 5.76, SD = 0.97), AI的負面績效反饋(M = 6.07, SD = 0.78)能夠引發(fā)更高水平的績效改進動機, t(158) = 2.24, p = 0.027, Cohen’s"d"= 0.35。將自我效能感作為協(xié)變量控制, 依然發(fā)現(xiàn)相較于人類管理者, AI提供負面績效反饋會導致更高水平的績效改進動機, F(1, 157) = 4.98, p"= 0.027, η2"= 0.031。假設1得到驗證。其次, 為排除AI熟悉程度對結果的可能影響, 相關分析發(fā)現(xiàn), AI組被試對AI的熟悉度與其績效改進動機并不相關(r = 0.058, p = 0.61)。為檢驗研究假設2, 雙因素方差分析結果發(fā)現(xiàn)(如圖3), 人機負面績效反饋和任務類型對個體的績效改進動機具有顯著的交互作用F(1, 156) = 44.76, p"lt; 0.001, η2"= 0.223。且簡單效應分析發(fā)現(xiàn), 在客觀任務組, AI負面反饋組的績效改進動機水平(M"= 6.19, SD"= 0.72)顯著高于人類管理者組(M"= 5.09, SD"= 0.81), F(1, 156) = 43.66, p lt;"0.001η2"= 0.219。在主觀任務組, 人類管理者負面反饋組的績效改進動機水平(M"= 6.43, SD"= 0.61)顯著高于AI組(M"= 5.95, SD"= 0.82), F(1, 156) = 8.14, p = 0.005, η2 = 0.05。為檢驗上述結果的穩(wěn)健性, 將被試自我效能感作為協(xié)變量進行控制, 結果發(fā)現(xiàn), 人機負面績效反饋與任務類型的交互作用依然顯著, F(1, 155)"= 44.66, p"lt; 0.001, η2"= 0.224。因此, 研究的假設2再次得到了驗證。

為檢驗內部與外部歸因的中介效應, 選擇PROCESS插件的模型4, Bootsrap為2000。結果表明, 內部歸因在人機負面績效反饋到績效改進動機的間接效應顯著, 且中介效應的指標值為0.17, 95%的CI為[0.017, 0.359], 區(qū)間不包含0。此外, 外部歸因在人機負面績效反饋到績效改進動機的中介效應指標值為?0.10, 95%的CI為[?0.086, 0.011], 區(qū)間包含0, 說明外部歸因在人機負面績效反饋到績效改進動機的間接效應不顯著。研究假設3得到了部分驗證。

此外, 本研究還檢驗了內部與外部歸因在人機負面績效反饋與任務類型對績效改進動機交互效應中的間接效應。選擇PROCESS插件的模型8, 設定樣本量為2000。結果表明, 在主觀任務中, 內部歸因在人機負面績效反饋到績效改進動機的間接效應顯著, 95%的CI為[?0.373, ?0.035]; 在客觀任務中, 內部歸因在人機負面績效反饋到績效改進動機的間接效應同樣顯著, 95%的CI為[0.241, 0.669]。且不同任務類型下, 有調節(jié)的間接效應的差值顯著, 指標值為0.63, 95%的CI為[0.349, 0.989]。說明存在有調節(jié)的中介效應; 而外部歸因有調節(jié)的間接效應指標值為0.013, 95%的CI為[?0.017, 0.110]。區(qū)間包含0, 因此研究假設4也得到了部分驗證。

為檢驗反饋準確性和公平感是否能作為替代性解釋的機制。首先, 獨立樣本t檢驗發(fā)現(xiàn), 人類管理者(M = 5.33, SD"= 0.91)或AI提供負面績效反饋(M"= 5.48, SD = 0.99)在準確性水平上并無差異, t(158)"= 0.99, p ="0.32。但是, AI提供負面績效反饋(M = 6.14, SD = 1.21)比人類管理者(M = 5.74, SD = 1.28)更公平, t(158) = 2.01, p ="0.046, Cohen’s"d = 0.33。此外, 人機負面績效反饋與任務類型對反饋準確性[和公平感]的交互作用均不顯著, F(1, 156) = 0.45, p"= 0.51[ F(1, 156) = 0.20, p"= 0.65]。最后, 反饋準確性(指標值為0.02; 95%的CI為[?0.012, 0.105])和公平感(指標值為0.03; 95%的CI為[?0.075, 0.051])在人機負面績效反饋與績效改進動機之間的間接效應也均不顯著。綜上, 同實驗3, 實驗4也排除了反饋準確性與公平感可能的替代解釋機制。

5.3""討論

實驗4在實驗3的基礎上, 采用相對真實的反饋策略進一步加強了負面績效反饋的質量。在為個體提供個性化反饋的基礎上, 使得反饋內容更加具體和可信。例如, 相較于實驗3個體知覺到的反饋準確性(M"= 3.79, SD"= 1.61), 實驗4的反饋準確性得到明顯的提升(M"= 5.41, SD"= 0.95)。此外, 實驗4還進一步驗證了先前3個實驗的結果, 并排除了反饋準確性與公平感可能的替代解釋機制。

6 "總討論

基于歸因理論, 本研究采用4個遞進式實驗發(fā)現(xiàn)了人機負面績效反饋對績效改進動機的差異化影響及機制。具體而言, 本研究發(fā)現(xiàn), 相較于人類管理者, 由AI提供負面績效反饋會導致員工更高水平的績效改進動機。第二, 人機負面績效反饋和任務類型交互影響個體的績效改進動機。具體來說, 在主觀任務中, 相較于AI, 個體對人類管理者負面績效反饋的績效改進動機更強; 而在客觀任務中, 上述結果則發(fā)生反轉。此外, 本研究基于歸因理論, 進一步發(fā)現(xiàn)了內部歸因在人機負面績效反饋和任務類型對績效改進動機的交互作用中起到中介作用。另外, 本研究采用了不同類型的AI主體(實驗1為嵌入式AI, 實驗2~4為機器人式AI)、不同的績效反饋場景(實驗1~4分別為電話銷售人員、新入職員工培訓、員工職業(yè)能力競賽、中層管理者管理能力測評)、差別化的績效反饋策略(實驗1~3采用虛假反饋, 實驗4采用相對真實的反饋), 以及不同的績效反饋途徑(實驗1~2在線上實驗平臺展示反饋, 實驗3通過真實的郵件發(fā)送反饋, 實驗4則通過實時的對話交互網站發(fā)送反饋)。總體來看, 本研究4個實驗的結果保持了較強的一致性和穩(wěn)健性。

6.1""理論貢獻

首先, 本研究拓展了既有負面績效反饋研究的視角。具體而言, 傳統(tǒng)基于人際互動的負面反饋研究大多關注來自人類管理者的反饋(Kitz et al., 2023), 而本研究則發(fā)現(xiàn)AI替代人類管理者提供負面績效反饋潛在的積極效應。既有研究從多種角度探索提升負面績效反饋實施效果的途徑, 例如, 反饋特征層面(績效反饋的頻率、即時性或質量等) (Kuvaas et al., 2017; Ni amp; Zheng, 2024), 員工個體層面(對負面績效反饋的積極歸因, 員工核心自我評價等) (馬璐"等, 2021; Xing et al., 2023)。而本研究結合數(shù)智化時代背景, 基于人機提供負面績效反饋的新興視角, 發(fā)現(xiàn)AI (相較人類管理者)提供的負面績效反饋提升員工后續(xù)的績效改進動機, 為負面績效反饋的人機差異化影響效果提供了研究證據。

其次, 本研究豐富了既有人機反饋的研究。當前數(shù)智化技術在績效反饋中的應用引發(fā)了一些爭論(董毓格"等, 2022)。一方面, 基于算法欣賞的視角, 研究者發(fā)現(xiàn)AI能夠提升績效反饋的準確性和可靠性, 從而提升員工的績效水平(Tong et al., 2021), 但另一方面, 也有研究從算法厭惡角度出發(fā), 發(fā)現(xiàn)AI缺乏真誠性與獨特性, 并且會威脅人類的工作機會, 因此當組織披露績效反饋(尤其是帶有鼓勵、贊揚性質的正面反饋)來源于AI時(Yalcin et al., 2022), 會降低個體的積極表現(xiàn)(Luo et"al., 2019; Tong et al., 2021)。本研究聚焦于負面績效反饋, 并發(fā)現(xiàn)AI (較人類管理者)作為反饋提供者提升個體的績效改進動機。此外, 既有研究也關注人機反饋產生差異化效果的邊界條件, 比如, Tong等(2021)發(fā)現(xiàn), 對于任期較長的員工而言, 由于他們與組織建立了更強的情感紐帶, 對于組織采用AI提供績效反饋的變革也更為支持, 因此員工的任期會緩解AI提供績效反饋的負面效果。此外, Luo等(2019)發(fā)現(xiàn), 顧客對于AI的熟悉程度會降低個體對于AI的刻板印象(例如, 缺乏知識和同理心), 從而緩解由AI提供反饋造成的產品銷量下降。本研究關注員工工作的任務類型這一外部因素, 并發(fā)現(xiàn)人機負面績效反饋與任務類型對員工績效改進動機的交互作用, 從而拓展了人機反饋邊界條件的研究。

此外, 本研究豐富了敏捷型(agile)績效管理的研究。具體來說, 傳統(tǒng)以年、季度為時間單位的績效管理模式存在周期過長的缺陷, 不利于員工即時獲取信息并提升績效。為此, 有學者提出敏捷型績效管理的變革趨勢(Pulakos et al., 2019; Schleicher et al., 2018), 旨在提升績效管理的時效性, 并為員工提供準確, 高質量的績效評估與反饋。數(shù)智化是提升敏捷績效管理最為重要的因素, 表現(xiàn)在AI能夠不知疲倦地整合并分析數(shù)據, 以客觀、無偏的方式評估員工的績效表現(xiàn), 并提供更加準確的績效反饋(Qin et al., 2023; Tong et al., 2021)。除人機績效反饋的研究外, 也有研究關注了AI績效指導(AI coach)。比如, Luo等(2021)發(fā)現(xiàn)"AI教練相對于人類教練的指導效果在不同的銷售人員中呈倒U形分布。這是因為績效排名靠后的銷售會面臨AI反饋信息過載的問題, 而績效排名靠前的銷售對AI的厭惡程度較高。本研究與上述文獻一致, 均探索了數(shù)智化技術對績效管理中特定環(huán)節(jié)的影響和機制。

最后, 本研究深化了歸因理論在組織場景中的研究。歸因理論被廣泛應用于解釋人際互動中個體如何理解自身或他人行為的原因(Tolli amp; Schmidt, 2008)。根據經典歸因理論的觀點(Heider, 1958), 人們通常出于自我防御的目的對不利性結果進行外部歸因, 或對有利性結果進行內部歸因從而獲得自我提升。不過上述結論也受到一些因素的調節(jié), 比如, Xing等(2023)發(fā)現(xiàn)員工核心自我評價水平越高, 越會將負面績效反饋視作提升與改善績效的機會, 從而提高內部歸因與學習績效。而本研究深入探究人機反饋的差異化影響, 發(fā)現(xiàn)AI (較人類管理者)提供負面績效反饋可能會提升個體的內部歸因。并結合人機不同的反饋特征(比如, 相較于人類, AI具備更少的主觀或傷害意圖) (蔣路遠"等, 2022)進行了解釋。本研究結果表明, 在削弱負面刺激的消極影響時(如采用AI替代人類管理者進行負面績效反饋), 個體可能會加強內部歸因。這為歸因理論解釋不利性結果中個體的歸因傾向或行為表現(xiàn)提供了新的認識。

6.2""管理啟示

本研究也具有一定的管理啟示。首先, 傳統(tǒng)由人類管理者主導的負面績效反饋可能破壞領導?下屬關系, 引起員工負面情緒并降低績效水平(Ni amp; Zheng, 2024)。而本研究的結果表明, AI (較人類管理者)增強了個體的內部歸因與績效改進動機。本研究啟示組織可以應用數(shù)智化技術賦能績效管理流程, 發(fā)揮AI客觀、無偏的績效反饋優(yōu)勢。這一方面能夠減輕人類管理者提供負面績效反饋的壓力, 另一方面, 來自AI的負面績效反饋更容易被員工接納, 從而提升反饋實施的效果。

第二, 盡管數(shù)智化技術具有高效、客觀、標準化等優(yōu)勢, 但它減少了績效反饋過程中的人際互動或同理心(董毓格"等, 2022; Yalcin et al., 2022), 因此需要區(qū)分人機反饋不同的應用場景。根據本研究的結果, 組織應關注人機負面績效反饋中的任務特征, 比如, AI以其客觀和無偏的特征為客觀任務(比如業(yè)績分析、銷量預測等)中的負面績效反饋提供優(yōu)勢。但相比于人類管理者, 由于AI缺乏社會與互動屬性, 因而在主觀工作任務(比如人際溝通、沖突管理等)中進行負面績效反饋的效果較差。據此, 組織應事先辨別任務的類型, 從而充分發(fā)揮人類管理者與AI各自的反饋優(yōu)勢。

第三, 本研究為人機負面績效反饋后, 組織幫助員工進行積極的心理建設提供了管理啟示。由于員工對人機負面績效反饋的內部歸因會影響員工的績效改進動機, 對負面績效反饋的內部歸因越高, 績效改進的動機也越高。因此, 組織需要關注人機負面績效反饋后員工的歸因方式, 并加強績效溝通, 幫助員工及時地發(fā)現(xiàn)自身不足或改善績效反饋流程, 從而提升員工績效。

6.3""研究局限與展望

本研究也存在一些局限。首先, 未來AI可能以人類的外在形象(例如, 虛擬員工)進入工作場所, 與人類員工共事并提供績效反饋(Yam et al., 2023)。未來研究可以在更為真實的人機反饋場景(例如, 虛擬同事提供反饋), 操控被試的績效反饋來源感知(來自人類vs. AI vs.人機混合), 從而加深人機的比較。其次, 以往研究指出, 反饋的特征是影響績效反饋效果的重要因素。本研究主要關注以績效表現(xiàn)排名為呈現(xiàn)方式的客觀型反饋(objective feedback)。由于人類管理者與AI在溝通及情感屬性方面的差異, 未來研究可以更多地探索人機在評價型反饋(evaluative feedback; 比如開放性, 質性或針對具體問題的反饋)方面的影響差異(Johnson, 2013)。

另外, 未來研究可以更多關注人機績效反饋中的文化因素。比如, 在中國傳統(tǒng)中庸和謙和文化的影響下, 管理者為避免沖突往往采用“三明治”式的反饋形式, 即在負面的反饋中夾雜鼓勵與贊揚性質的正面反饋。由于AI通常因缺乏“人情味”而遭到個體的厭惡(Dietvorst et al., 2015; Luo et al., 2019), 未來研究可以探索AI采用“三明治”式的績效反饋策略對員工績效表現(xiàn)的影響。此外, 相比于西方, 東方社會在和諧文化的影響下, 人際間的溝通方式更為含蓄(耿紫珍"等, 2020), 這可能導致東方社會中的個體更加消極地應對負面績效反饋, 繼而影響人機負面績效反饋的差異化效果。未來研究可以采用西方樣本, 探究文化背景差異下人機負面績效反饋的效果。

再者, 本研究聚焦于歸因理論中的因果控制點視角(內部和外部歸因)。事實上, 歸因理論的內涵非常豐富。比如, 按照歸因的穩(wěn)定性水平, 個體的歸因可被劃分為能力歸因(ability attribution; 即把事件的結果歸因于自身的能力)與努力歸因(effort attribution; 即歸因于自身的努力或投入程度)。按照歸因的可控性, 個體可能會將事件結果歸結為可控因素(能力、努力等), 抑或不可控因素(運氣、任務難度等) (Russell, 1982; Weiner, 1985)??紤]到AI能夠基于大數(shù)據對個體進行畫像性分析, 并深入解析人類在性格、愛好與能力等方面的特征(Fan et al., 2023), 未來研究可以基于更多歸因理論的視角, 或進行視角結合(例如, AI提供的負面績效反饋能否提升員工對于能力的內部歸因, 并影響績效改進動機), 從而進一步豐富歸因理論對人機績效反饋產生差異化效果的解釋。

最后, 本研究關注人機負面績效反饋影響員工績效改進動機這一近端的結果。未來研究可以探索人機提供負面績效反饋對員工實際行為表現(xiàn)(例如績效水平, 學習行為等)的影響, 從而拓展人機負面績效反饋的影響后效研究。

參""考""文""獻

Audia, P. G., amp; Locke, E. A. (2003). Benefiting from negative feedback. Human Resource Management Review, 13(4), 631?646.

Belschak, F. D., amp; Den Hartog, D. N. (2009). Consequences of positive and negative feedback: The impact on emotions and extra-role behaviors. Applied Psychology, 58(2), 274? 303.

Brett, J. F., amp; Atwater, L. E. (2001). 360° feedback: Accuracy, reactions, and perceptions of usefulness. Journal of Applied Psychology, 86(5), 930?942.

Castelo, N., Bos, M. W., amp; Lehmann, D. R. (2019). Task-dependent Algorithm aversion. Journal of Marketing Research, 56(5), 809?825.

Chory, R. M., amp; Westerman, C. Y. (2009). Feedback and fairness: The relationship between negative performance feedback and organizational justice. Western Journal of Communication, 73(2), 157?181.

Cianci, A. M., Klein, H. J., amp; Seijts, G. H. (2010). The effect of negative feedback on tension and subsequent performance: The main and interactive effects of goal content and conscientiousness. Journal of Applied Psychology, 95(4), 618?630.

Dietvorst, B. J., Simmons, J. P., amp; Massey, C. (2015). Algorithm aversion: People erroneously avoid algorithms after seeing them err. Journal of Experimental Psychology: General, 144(1), 114?126.

Dimotakis, N., Mitchell, D., amp; Maurer, T. (2017). Positive and negative assessment center feedback in relation to development self-efficacy, feedback seeking, and promotion. Journal of Applied Psychology, 102(11), 1514?1527

Dong, Y., Long, L., amp; Cheng, Z. (2022). Performance management in the era of digital intelligence: Present and future. Tsinghua Management Review, 5, 93?100.

[董毓格, 龍立榮, 程芷汀. (2022). 數(shù)智時代的績效管理:現(xiàn)實和未來. 清華管理評論, 5, 93?100.]

Fan, J., Sun, T., Liu, J., Zhao, T., Zhang, B., Chen, Z., Glorioso, M., amp; Hack, E. (2023). How well can an AI chatbot infer personality? Examining psychometric properties of machine-inferred personality scores."Journal of Applied Psychology, 108(8), 1277?1299.

Faul, F., Erdfelder, E., Lang, A. G., amp; Buchner, A. (2007). G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods, 39(2), 175?191.

Fields, B., Carbery, M., Schulz, R., Rodakowski, J., Terhorst, L., amp; Still, C. (2023). Evaluation of Face Validity and Acceptability of the Care Partner Hospital Assessment Tool. Innovation in Aging, 7(2), 557?568.

Garvey, A. M., Kim, T. W., amp; Duhachek, A. (2023). Bad news? Send an AI. Good news? Send a human. Journal of Marketing, 87(1), 10?25.

Geng, Z. Z., Zhao, J. J., amp; Ding. L. (2020). The “wisdom” of golden mean thinking: Research on the mechanism between supervisor developmental feedback and employee creativity. Nankai Management Review, 23(1), 75?86.

[耿紫珍, 趙佳佳, 丁琳. (2020). 中庸的智慧:上級發(fā)展性反饋影響員工創(chuàng)造力的機理研究. 南開管理評論, 23(1)75?86.]

Glikson, E., amp; Woolley, A. W. (2020). Human Trust in Artificial Intelligence: Review of Empirical Research. Academy of Management Annals, 14(2), 627?660.

Goodman, J. S., amp; Wood, R. E. (2004). Feedback specificity, learning opportunities, and learning. Journal of Applied Psychology, 89(5), 809?821.

Hareli, S., amp; Hess, U. (2008). The role of causal attribution in hurt feelings and related social emotions elicited in reaction to others' feedback about failure. Cognition and Emotion, 22(5), 862?880.

Harvey, P., Madison, K., Martinko, M., Crook, T. R., amp; Crook, T. A. (2014). Attribution theory in the organizational sciences: The road traveled and the path ahead. Academy of Management Perspectives, 28(2), 128?146.

Heider, F. (1958). The psychology of interpersonal relations. New York: John Wiley amp; Sons Publishing House.

Helberger, N., Araujo, T., amp; de Vreese, C. H. (2020). Who is the fairest of them all? Public attitudes and expectations regarding automated decision-making. Computer Law amp; Security Review, 39, 105456.

Ilgen, D. R., Fisher, C. D., amp; Taylor, M. S. (1979). Consequences of individual feedback on behavior in organizations. Journal of Applied Psychology, 64(4), 349?374.

Jiang, L., Cao, L., Qin, X., Tan, L., Chen, C., amp; Peng, X. (2022). Fairness perceptions of artificial intelligence decision- making. Advances in Psychological Science, 30(5), 1078? 1092.

[蔣路遠, 曹李梅, 秦昕, 譚玲, 陳晨, 彭小斐. (2022). 人工智能決策的公平感知. 心理科學進展, 30(5), 1078?1092.]

Johnson, D. A. (2013). A component analysis of the impact of evaluative and objective feedback on performance. Journal of Organizational Behavior Management, 33(2), 89?103.

Kim, Y. J., amp; Kim, J. (2020). Does negative feedback benefit (or harm) recipient creativity? The role of the direction of feedback flow. Academy of Management Journal, 63(2), 584?612.

Kitz, C. C., Barclay, L. J., amp; Breitsohl, H. (2023). The delivery of bad news: An integrative review and path forward. Human Management Review, 33(3), 1?23.

Kluger, A. N., amp; Denisi, A. (1996). The effects of feedback interventions on performance: A historical review, a meta-analysis, and a preliminary feedback intervention theory. Psychological Bulletin, 119(2), 254?284.

Kuvaas, B., Buch, R., amp; Dysvik, A. (2017). Constructive supervisor feedback is not sufficient: Immediacy and frequency is essential. Human Resource Management, 56(3), 519?531.

Lam, C. F., DeRue, D. S., Karam, E. P., amp; Hollenbeck, J. R. (2011). The impact of feedback frequency on learning and task performance: Challenging the \"More is better\" assumption. Organizational Behavior and Human Decision Processes, 116(2), 217?228.

Lee, M. K. (2018). Understanding perception of algorithmic decisions: Fairness, trust, and emotion in response to algorithmic management. Big Data and Society, 5(1), 1?16.

Leo, X., amp; Huh, Y. E. (2020). Who gets the blame for service failures? Attribution of responsibility toward robot versus human service providers and service firms. Computers in Human Behavior, 113, 106520.

Longoni, C., Bonezzi, A., amp; Morewedge, C. K. (2019). Resistance to medical artificial intelligence. Journal of Consumer Research, 46(4), 629?650.

Luo, X., Qin, M. S., Fang, Z., amp; Qu, Z. (2021). Artificial intelligence coaches for sales agents: Caveats and solutions. Journal of Marketing, 85(2), 14?32.

Luo, X., Tong, S., Fang, Z., amp; Qu, Z. (2019). Frontiers: Machines vs. Humans: The Impact of Artificial Intelligence Chatbot Disclosure on Customer Purchases. Marketing Science, 38(6), 937?947.

Lyytinen, K., Nickerson, J. V., amp; King, J. L. (2021). Metahuman systems = humans + machines that learn. Journal of Information Technology, 36(4), 427?445.

Ma, L., Xie, P., Wei, Y., amp; Qiao, X. (2021). Is negative feedback from leaders really harm for employee innovative behavior? The role of positive attribution and job crafting. Science and Technology Progress and Policy, 38(12), 144?150.

[馬璐, 謝鵬, 韋依依, 喬小濤. (2021). 領導者負面反饋真的不利于員工創(chuàng)新嗎——積極歸因與工作重塑的作用. 科技進步與對策, 38(12), 144?150.]

Newman, D. T., Fast, N. J., amp; Harmon, D. J. (2020). When eliminating bias isn't fair: Algorithmic reductionism and procedural justice in human resource decisions. Organizational Behavior and Human Decision Processes, 160, 149?167.

Ni, D., amp; Zheng, X. M. (2024). Does negative performance feedback always lead to negative responses? The role of trust in the leader. Journal of Occupational and Organizational Psychology, 97(2), 623?646.

Podsakoff, P. M., amp; Farh, J. L. (1989). Effects of feedback sign and credibility on goal setting and task performance. Organizational Behavior and Human Decision Processes, 44(1), 45?67.

Pulakos, E. D., Mueller-Hanson, R. A., amp; Arad, S. (2019). The evolution of performance management: Searching for value. Annual Review of Organizational Psychology and Organizational Behavior, 6, 249?271.

Qin, S., Jia, N., Luo, X., Liao, C., amp; Huang, Z. (2023). Perceived fairness of human managers compared with artificial intelligence in employee performance evaluation. Journal of Management Information Systems, 40(4), 1039? 1070.

Raveendhran, R., amp; Fast, N. J. (2021). Humans judge, algorithms nudge: The psychology of behavior tracking acceptance. Organizational Behavior and Human Decision Processes, 164, 11?26.

Russell, D. (1982). The causal dimension scale: A measure of how individuals perceive causes. Journal of Personality and Social Psychology, 42(6), 1137?1145.

Schleicher, D. J., Baumann, H. M., Sullivan, D. W., Levy, P. E., Hargrove, D. C., amp; Barros-Rivera, B. A. (2018). Putting the system into performance management systems: A review and agenda for performance management research."Journal of Management, 44(6), 2209?2245.

Scholz, U., Gutiérrez-Do?a, B., Sud, S., amp; Schwarzer, R. (2002). Is general self-efficacy a universal construct? Psychometric findings from 25 countries. European Journal of Psychological Assessment, 18(3), 242?251.

Song, X., amp; He, X. (2020). The effect of artificial intelligence pricing on consumers’ perceived price fairness. Journal of Management Science, 33(5), 3?16.

[宋曉兵, 何夏楠. (2020). 人工智能定價對消費者價格公平感知的影響. 管理科學, 33(5), 3?16.]

Tolli, A. P., amp; Schmidt, A. M. (2008). The role of feedback, casual attributions, and self-efficacy in goal revision. Journal of Applied Psychology, 93(3), 692?701.

Tong, S., Jia, N., Luo, X., amp; Fang, Z. (2021). The Janus face of artificial intelligence feedback: Deployment versus disclosure effects on employee performance. Strategic Management Journal, 42(9), 1600?1631.

Van Dijk, D., amp; Kluger, A. N. (2011). Task type as a moderator of positive/negative feedback effects on motivation and performance: A regulatory focus perspective. Journal of Organizational Behavior, 32(8), 1084?1105.

Weiner, B. (1985). An attributional theory of achievement motivation and emotion. Psychological Review, 92(4), 548?573.

Wexley, K. N., Singh, U. A., amp; Yukl, G. A. (1973). Subordinate personality as a moderator of the effects of participation in 3 types of appraisal interviews. Journal of Applied Psychology, 58(1), 54?59.

Xing, L., Sun, J. M., Jepsen, D., amp; Zhang, Y. J. (2023). Supervisor negative feedback and employee motivation to learn: An attribution perspective. Human Relations, 76(2), 1?31.

Xu, L., Yu, F., amp; Peng, K. (2022). Algorithmic discrimination causes less desire for moral punishment than human discrimination. Acta Psychologica Sinica, 54(9), 1076? 1092.

[許麗穎, 喻豐, 彭凱平. (2022). 算法歧視比人類歧視引起更少道德懲罰欲. 心理學報, 54(9), 1076?1092.]

Yalcin, G., Lim, S., Puntoni, S., amp; van Osselaer, S. M. J. (2022)."Thumbs up or down: Consumer reactions to decisions by algorithms versus humans."Journal of Marketing Research, 59(4), 696?717.

Yam, K., Tang, P., Jackson, J., Su, R., amp; Gray, K. (2023). The rise of robots increases job insecurity and maladaptive workplace behaviors: Multimethod evidence. Journal of Appied Psychology, 108(5), 850?870.

A comparative study on human or AI delivering negative performance feedback influencing employees’ motivation to improve performance

WANG Guoxuan1, LONG Lirong1, LI Shaolong2, SUN Fang3, WANG Jiaqing1, HUANG Shiyingzi1

1"School of Management, Huazhong University of Science and Technology, Wuhan 430074,"China)(2"Economics and Management School, Wuhan University, Wuhan 430072, China)(3"Business School, Hubei University of Economics, Wuhan 430205, China

Abstract

Given that negative performance feedback can evoke negative reactions from employees, delivering such feedback effectively has become a challenge for organizations. Driven by rapid innovations in science and technology, artificial intelligence (AI) is gradually being applied in organizational management. For instance, AI can monitor employees’ work behaviors in real time, diagnose and analyze the reasons for their poor performance, and provide them with suggestions for performance improvement. Based on attribution theory, this study examined the benefits that employees may gain when receiving negative performance feedback from AI than from human managers. This study also explored the moderating effect of task type (subjective vs. objective) as a boundary factor for the influence of feedback source on employees’ motivation to improve their performance. Previous research has shown that individuals often experience internal or external attribution after receiving negative performance feedback. Therefore, this study also proposed internal and external attributions as underlying mediating mechanisms.

To test the hypotheses, four experiments were conducted (N"= 598) involving various kinds of performance feedback contexts in the workplace, including performance feedback for employees in call centers, training of new employees, employees in vocational ability competitions, and middle managers’ capacity of management. Two strategies were adopted to provide performance feedback for the participants. Specifically, experiments 1–3 used fake feedback to control the feedback content among the participants, while experiment 4 delivered relatively real negative feedback based on the participants’ actual performance to further test the results of experiments 1–3.

Experiment 1 involved 128 full-time employees and used a single-factor, two-level between-subjects design, and results showed that compared with those coming from human managers, negative performance feedback coming from AI led to a higher employee motivation to improve performance."Experiment 2 involved 160 employees and used a two-factor between-subjects design, and results highlighted the interactive effect of negative feedback source (human manager vs. AI) and task types on employees’ motivation to improve their performance. Specifically, in subjective tasks, negative performance feedback from human managers (relative to AI) resulted in a higher motivation to improve performance. However, the opposite case was observed in objective tasks."Experiment 3 involved 150 employees who received negative performance feedback through email, and results highlighted the mediating role of internal attributions in the relationship between negative feedback source and motivation to improve performance."Experiment 4 involved 160 employees and utilized relatively real negative performance feedback, and results were the same as those obtained in experiment 3.

This study offers four theoretical contributions. First, with the emergence of AI as a feedback source for organizations, results show that compared with feedback from human managers, negative performance feedback from AI led to a higher motivation among employees to improve their performance, thereby enriching traditional research on negative performance feedback. Second, task type can moderate the relationship between negative performance feedback source and employees’ motivation to improve performance, and this finding contributes to the expansion of the boundary effects of feedback source (AI or human managers). Third, this study generates insights into agile performance management in the digital intelligence era by demonstrating the advantages of AI in replacing human managers in delivering negative performance feedback. Fourth, this study underscores internal attribution as a potential mechanism, thus expanding the application of attribution theory in explaining individual motivation and behavior within the context of AI versus human managers in delivering negative performance feedback.

Keywords "negative performance feedback, artificial intelligence, motivation to improve performance, internal and external attribution, task type

附錄: 主要實驗材料

1. 附錄1 (自編主觀和客觀任務)

注:實驗2采用主觀任務1與客觀任務3; 實驗3采用以下所有任務; 實驗4采用主觀任務1、2, 以及客觀任務2、3。

[主觀任務]

假設今天是××年×月×日, 您是×公司的××?,F(xiàn)在您收到了三封公文郵件需要您處理。

[主觀任務1]

您收到了××部門同事××給您發(fā)送的郵件公文, 公文中提到了××在帶領團隊完成項目過程中遇到的困難, 請您處理以下公文。

[公文]

公文類型:郵件

發(fā)至:××

發(fā)自:××

日期:××年×月×日

主題:關于項目團隊建設問題

××:

最近, 公司派我?guī)ьI團隊負責一個新項目。我們項目團隊結合以往經驗順利完成了前期工作, 也得到了甲方的確認和認可。但由于時間緊任務重, 又申請從公司調來了2名新成員進入項目團隊。項目開始實施后, 項目團隊原成員和新加入的成員之間經常發(fā)生爭執(zhí), 對出現(xiàn)的錯誤相互推諉。項目團隊原成員認為新加入的成員效率低下, 延誤了項目進度; 新加入成員則認為項目團隊原成員不好相處, 沒法有效溝通。我開始認為這是正常的團隊磨合過程, 沒有過多的干預。但是項目實施2個月之后, 我發(fā)現(xiàn)這樣下去肯定會出問題。對此, 您有何建議?請指示。

××部門××

××年×月×日

問題:請您結合自己的工作經驗, ××部門同事××提供有效的建議建議要具體可行, 邏輯清晰, 不少于100

[主觀任務2]

您收到了××部同事××給您發(fā)送的郵件公文, 公文中提到了××在帶領團隊完成項目過程中遇到的困難, 請您處理以下公文。

[公文]

公文類型:郵件

發(fā)至:××

發(fā)自:××

日期:××年×月×日

主題:關于突發(fā)情況的處理

××:

目前, 我主要負責的一個項目正進行到后期階段, 但最近因為疫情的突然反復, 原本負責一項線下工作的項目同事小李被隔離在外。由于成本的控制, 我們項目團隊今年已不能再招收新人, 而該線下工作之前一直只有小李主要負責, 其他人并不了解且自身工作相對飽和。受條件限制, 該工作也不能線上進行。對此, 您有何建議?請指示。

××部門××

××年×月×日

問題:請您結合自己的工作經驗××部門同事××提供有效的建議建議要具體可行, 邏輯清晰, 不少于100。

[主觀任務3]

您是××的職場導師, 他給您發(fā)送了郵件公文, 公文中提到了其在近日工作中遇到的困難, 請您處理以下公文。

[公文]

公文類型:郵件

發(fā)至:××

發(fā)自:××

日期:××年×月×日

主題:關于工作溝通的求助

師傅:

今天, 總經理安排我和××一起完成一項重要的工作任務。當我詢問領導何時需要交付工作時, 領導回答盡快完成。原本, 我打算今天加班完成該工作任務, 但××認為領導并沒有說何時交付工作, 可以下周再慢慢完成。我勸說了很久, 他還是覺得沒必要加班。請問我應該如何勸說他和我一起加班完成這項工作任務?您能否給我一些建議?請指示。

徒弟××

××年×月×日

問題:請您結合自己的工作經驗給您的職場徒弟××提供有效的建議。要具體可行, 邏輯清晰, 不少于100

[客觀任務]

假設今天是××年×月×日, 您是××公司××部門××?,F(xiàn)在您收到了三封公文郵件需要您處理。

[客觀任務1]

您收到了××部門同事××給您發(fā)送的郵件公文, 公文中提到了關于工作安排中的問題, 請您處理以下公文。

[公文]

公文類型:郵件

發(fā)至:××

發(fā)自:××

日期:××年×月×日

主題:關于工作安排問題

××:

明天, 我們邀請了甲、乙、丙、丁4名應聘者同時來公司項目部參加三個階段的面試, 公司要求每名應聘者都必須先由招聘專員進行初試, 然后到項目主管處進行復試, 最后到項目部經理處參加面試, 并且不允許插隊(即:在任何一個階段4名應聘者的順序是一樣的), 由于4名應聘者的專業(yè)背景和工作經歷不同, 所以每人在三個階段的面試時間也不同, 如下表所示:(單位:分鐘)

現(xiàn)在, 由于我們公司距離應聘者下榻的酒店較遠, 因此要安排專車送4名應聘者一起同時離開公司。明天早晨8: 00開始面試, 請問您怎樣安排他們的面試順序, 可以讓他們一起最早離開公司?最早時間是幾點?請您具體安排。

××部門××

××年×月×日

問題:請您運用邏輯推理和運算能力, 回復××關于面試順序安排的問題對甲、乙、丙、丁的面試順序進行排序, 并推算出他們能夠離開公司的最早時間。請寫出具體的邏輯分析和推理, 不少于100

[客觀任務2]

您收到了××部門同事××給您發(fā)送的郵件公文, 公文中提到了項目生產設備的投資購買問題, 請您處理以下公文。

[公文]

公文類型:郵件

發(fā)至:××

發(fā)自:××

日期:××年×月×日

主題:關于生產設備的投資購買

××:

我們項目團隊最近預計投資購買一個項目生產設備, 并按6個決策指標對不同類型的設備進行綜合評價。這6個指標是, 最大運行速度(C1)、最大產量(C2)、最大負荷(C3)、費用(C4)、可靠性(C5)、靈敏性(C6)?,F(xiàn)有4種型號的設備可供選擇, 具體指標值如表。各屬性所占比重分別為20%、10%、10%、10%、20%、30%, 請您指示我們應該如何進行購買?請您就購買設備問題進行決策, 選擇最優(yōu)的購買方案。

問題:請您運用邏輯推理和運算能力, 回復××關于設備投資購買的問題, A, B, C, D四種設備按照優(yōu)劣進行排序。請寫出具體的邏輯分析和推理, 不少于100

[客觀任務3]

您是××的職場導師, 他給您發(fā)送了郵件公文, 公文中提到了其最近在項目前期調研中遇到的困難, 請您處理以下公文。

[公文]

公文類型:郵件

發(fā)至:××

發(fā)自:××

日期:××年×月×日

主題:關于項目調研的求助

師傅:

最近, 我正在為我負責的項目做前期調研, 需要了解該項目涉及到的一商品銷售情況以決定是否將該商品納入我們的項目方案。下表是該商品最近10個月的商品銷售量統(tǒng)計記錄。按公司銷量為標準進行劃分:(1)銷售量lt;60千件:屬于滯銷; (2)60千件≤銷售量≤100千件:屬于一般; (3)銷售量>100千件:屬于暢銷。根據公司要求, 如果該商品下個月(第11個月)暢銷則可以納入我們的項目方案。請您指示是否要將該商品納入我們的項目方案。

問題:請您運用邏輯推理和運算能力, 回復××關于項目調研的求助問題, 分析第11個月商品銷量狀態(tài)滯銷、一般、暢銷), 并預測第11個月的商品銷售量。請寫出具體的邏輯分析和推理, 不少于100

2. 附錄2(展示人類管理者或AI形象的圖片)

猜你喜歡
人工智能
我校新增“人工智能”本科專業(yè)
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業(yè)
IT經理世界(2018年20期)2018-10-24 02:38:24
基于人工智能的電力系統(tǒng)自動化控制
人工智能,來了
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
义乌市| 砚山县| 巴林左旗| 弥渡县| 临高县| 娄烦县| 东乡县| 汤原县| 上栗县| 武义县| 天全县| 沈丘县| 策勒县| 汉川市| 古蔺县| 张北县| 唐山市| 固阳县| 昌邑市| 云南省| 贡嘎县| 博白县| 平远县| 卢氏县| 睢宁县| 金溪县| 普安县| 石城县| 观塘区| 米易县| 台安县| 永登县| 嘉兴市| 柞水县| 木兰县| 新丰县| 密山市| 瓮安县| 年辖:市辖区| 普洱| 五家渠市|