摘" 要" 在社會互動中, 人們常表現(xiàn)出有條件的合作行為, 即只有在預(yù)期他人也合作時人們才愿意合作。當(dāng)前該過程的認(rèn)知機(jī)制尚不明確。本文采用多回合版本的囚徒困境范式, 兩項(xiàng)實(shí)驗(yàn)均表明個體的合作行為隨合作者合作行為的提高而提高。認(rèn)知計算模型顯示個體同時采用了一階信念(只根據(jù)他人過去的行為)與二階信念(既根據(jù)他人過去的行為, 也考慮自己的行為對他人產(chǎn)生的影響)去更新他們對合作者的合作概率的期望。結(jié)果顯示個體的有條件合作行為的提升由積極期望(即合作成功使得個體對合作者建立了積極的期望)與社會獎賞(由合作本身帶來的額外獎勵)共同驅(qū)動。這些結(jié)果揭示了有條件的合作行為的計算認(rèn)知學(xué)習(xí)機(jī)制, 闡明了積極期望和社會獎賞對合作的促進(jìn)作用, 能為社會中各領(lǐng)域合作的成功推動提供了重要的科學(xué)證據(jù)與參考價值。
關(guān)鍵詞" 條件合作, 社會獎賞, 積極期望, 認(rèn)知計算建模, 信念更新
分類號" B842
1" 前言
合作(Cooperation)是促進(jìn)人類社會發(fā)展的基石(Fehr amp; Fischbacher, 2003)。合作并非憑空發(fā)生, 而是依賴于合作中的互惠和收益(Fischbacher et al., 2001)。當(dāng)個體在合作中付出卻沒有回報時, 其行為無法得到強(qiáng)化, 因而合作關(guān)系無法持久(Baker amp; Rachlin, 2001)。合作本質(zhì)上需要參與各方犧牲自我利益, 以達(dá)到群體最優(yōu)。因此, 人們在面臨合作時也期待對方有所付出以實(shí)現(xiàn)互惠共利(De Cremer amp; Van Lange, 2001)。大量的研究表明個體通常在他人合作或預(yù)期他人會合作的情況下才會愿意合作, 這稱為有條件的合作(Conditional cooperation, 簡稱
條件合作) (Fehr amp; Schurtenberger, 2018)。但至今為止, 條件合作的認(rèn)知計算機(jī)制尚不清楚。根據(jù)既往研究, 有兩個重要的因素驅(qū)動著個體進(jìn)行條件合作, 分別是合作期望(即個體對他人合作的期望)與社會獎賞(Social reward, 即合作成功帶來的喜悅與主觀積極體驗(yàn)) (Pal amp; Hilbe, 2022)。
有效的合作決策需要準(zhǔn)確地預(yù)知合作者的合作意愿, 那么人們?nèi)绾文軌蛑浪说暮献饕庠改??最重要的信息來源于先前的互動(van Baar et al., 2019)。在多次互動的情景中, 個體會對合作者的后續(xù)行為建立起一個動態(tài)的預(yù)期, 隨著多次互動的反饋繼而更新這種預(yù)期。簡而言之, 如果個體對合作者抱有積極的期待, 即認(rèn)為合作者有較大可能選擇合作, 這種情況下如果個體也選擇合作就能夠?yàn)殡p方帶來更大的收益, 因此個體的合作概率也會提高(G?chter, 2007)。在公共博弈品游戲 中, 研究多次發(fā)現(xiàn)個體在游戲重復(fù)多個回合后, 會逐漸通過合作者的合作水平來調(diào)整自己的合作水平(Fischbacher et al., 2001)。這一過程得到了許多研究確認(rèn), 但直到最近幾年才有研究者應(yīng)用認(rèn)知計算建模試圖揭示合作的動態(tài)學(xué)習(xí)過程。Fareri等人(2012, 2015)采用了強(qiáng)化學(xué)習(xí)的基礎(chǔ)模型來研究個體在信任游戲 中的動態(tài)學(xué)習(xí)過程。該模型假定個體根據(jù)每次互動的結(jié)果與預(yù)期的差異(即預(yù)期誤差, Prediction error), 通過學(xué)習(xí)率(Learning rate)來更新下一回合的預(yù)期(即預(yù)期更新, Expectation updating)。這里學(xué)習(xí)率的大小影響了個體將預(yù)期誤差用于更新下一回合的預(yù)期的速度。該模型的特點(diǎn)是人們只是在被動地根據(jù)對手過去的行為建立未來合作可能性的預(yù)期。盡管該研究發(fā)現(xiàn)了帶有學(xué)習(xí)假設(shè)的模型要比沒有學(xué)習(xí)假設(shè)的模型更好地解釋被試的行為, 也為動態(tài)預(yù)期更新的過程提供了認(rèn)知機(jī)制上的證據(jù)(Fareri et al., 2012; Fareri et al., 2015)。但不足之處在于該研究中僅采用了一種學(xué)習(xí)模型, 并未與其他模型比較。
心理學(xué)認(rèn)為心智化(Mentalizing)是支持人們社會互動的重要心理功能(Astington amp; Jenkins, 1995)。上述提到的單從他人的行為表現(xiàn)來推導(dǎo)其心理和意圖的心理過程被稱為“一階信念”, 是人們較為基礎(chǔ)的心智化功能(Rusch et al., 2020)。相比于一階信念, “二階信念”是更加高級和復(fù)雜的心智化功能。二階信念指的是雙方在互動過程中, 個體不僅會從合作者的行為表現(xiàn)來推測其合作意愿, 也會考慮到自己過去的行為如何影響對方從而影響對手接下來的行為(Wu et al., 2020)。研究發(fā)現(xiàn)個體在實(shí)時博弈的監(jiān)工游戲 中同時采用一階和二階信念去更新他們對競爭對手行為的預(yù)期(Hampton et al., 2008)。該研究中所應(yīng)用的影響模型(Influence Model)假設(shè)個體不僅可以根據(jù)對手以往的表現(xiàn)來推斷其想法(一階信念), 還包括個體同時考慮自己的行動如何影響對手的信念從而影響對手接下來的行為(二階信念)。隨后有腦成像研究發(fā)現(xiàn), 在監(jiān)工游戲互動中, 個體的一階信念和二階信念可能由不同的神經(jīng)機(jī)制所調(diào)控(Hill et al., 2017)。盡管二階信念在社會互動中如此重要, 然而在多次合作情景中的作用尚不明確。合作相關(guān)的實(shí)驗(yàn)范式與上述研究中監(jiān)工游戲范式的不同點(diǎn)在于, 合作范式中存在合作雙方最優(yōu)解, 即每個人放棄自己的最優(yōu)選擇可以成就雙方總和最優(yōu)解。那么個體在多次合作情景中是否也采用了二階信念去推測合作者的行為呢?目前尚未有研究考察。這可能是用于研究合作行為的經(jīng)典范式囚徒困境有穩(wěn)定的納什均衡點(diǎn) (Kreps et al., 1982)。當(dāng)雙方?jīng)Q策達(dá)到納什均衡點(diǎn)時將不再有信息更新, 此時個體無需通過預(yù)期誤差去更新對合作者的期望, 因此也不適用于探索其行為決策的動態(tài)發(fā)展過程。因而, 本研究的目的之一是構(gòu)建一個能夠觀察到個體在動態(tài)學(xué)習(xí)中不斷調(diào)整合作行為的實(shí)驗(yàn)環(huán)境, 以便我們采用計算建模探索人們在合作過程中的動態(tài)預(yù)期更新, 并深入揭示合作的計算認(rèn)知機(jī)制。為了更加深入探究合作過程中個體對他人預(yù)期的動態(tài)學(xué)習(xí)過程, 本研究將比較不同的模型, 以探索個體是否在多次合作中同時采用一階和二階信念去更新他們對合作者的合作意愿的期望。
社會互動會帶來愉悅的體驗(yàn), 這種體驗(yàn)被稱為社會獎賞, 在促進(jìn)個體參與社會行為方面起到重要的作用(Tamir amp; Hughes, 2018)。促成條件合作的另一個可能因素是社會獎賞(Stallen et al., 2013), 即合作成功本身能夠帶來獎賞價值, 從而強(qiáng)化人們的合作行為(唐輝 等, 2022)。腦成像研究表明, 在獲得相同金錢獎勵的條件下, 雙方合作會引發(fā)腹側(cè)與背側(cè)紋狀體更強(qiáng)烈的激活。腹側(cè)與背側(cè)紋狀體是獎賞加工的重要大腦區(qū)域, 這表明人們在合作中獲得收益會產(chǎn)生更強(qiáng)的獎賞反應(yīng)(Rilling et al., 2002)。事件相關(guān)電位研究也報告了類似的發(fā)現(xiàn)(白麗英 等, 2014)。Rilling等人(2002)認(rèn)為這種由合作成功所帶來的社會獎賞對于維持合作非常重要。但是如果在互動中個體能夠精確預(yù)測合作者的行為, 這已經(jīng)有足夠的信息能夠幫助個體做出決策(Nowak amp; Sigmund, 1993)。那么還需要額外的社會獎賞來促進(jìn)條件合作嗎?對于這個問題我們尚未知道答案。目前尚未有研究采用認(rèn)知計算建模系統(tǒng)地檢驗(yàn)這兩者在多次合作中的作用。因此, 本研究的另一個目的是通過系統(tǒng)地構(gòu)建和比較不同的認(rèn)知模型, 探索人們在多次合作過程中條件合作行為產(chǎn)生的認(rèn)知計算機(jī)制, 檢驗(yàn)合作期望和社會獎賞這兩者對條件合作行為的作用。
本研究所采用的范式改編自經(jīng)典的囚徒困境范式 。與原經(jīng)典范式最大的不同之處是多次互動的設(shè)置。被試在任務(wù)中與另一個合作者進(jìn)行多次博弈, 每次面臨選擇或背叛兩個選項(xiàng)。為了使被試在游戲中必須不斷學(xué)習(xí)和調(diào)整決策, 我們操縱了合作者的行為, 其選擇行為由實(shí)驗(yàn)程序提前設(shè)定。同時, 為增強(qiáng)實(shí)驗(yàn)情境的真實(shí)性, 在低概率合作部分引入了變動的概率周期。本研究包含兩個實(shí)驗(yàn): 實(shí)驗(yàn)1構(gòu)建了不同假設(shè)的模型以探索條件合作的認(rèn)知計算機(jī)制; 實(shí)驗(yàn)2則在實(shí)驗(yàn)1的基礎(chǔ)上, 進(jìn)一步分離了合作者合作行為的變動性和概率, 以便我們考察這兩者對個體合作行為的影響及其內(nèi)在的認(rèn)知計算機(jī)制。為了考察這種效應(yīng)是否特異于社會合作情況, 我們在兩個實(shí)驗(yàn)中還設(shè)置了非社會條件。在非社會條件中, 被試被告知與他們的合作者不是真人而是電腦程序。非社會條件與合作條件除了指導(dǎo)語外其他設(shè)置完全一致。本研究的第一個假設(shè)是, 被試的合作行為會隨合作者行為的變化而變化, 當(dāng)合作者表現(xiàn)出高概率合作時被試也會更傾向于選擇合作。本研究的第二個假設(shè)進(jìn)一步提出, 個體可能同時采用了一階和二階信念去更新他們對合作者行為的期望。為了回答這一問題, 我們將Hampton等人(2008)所提出的影響模型根據(jù)我們的實(shí)驗(yàn)任務(wù)進(jìn)行調(diào)整, 通過系統(tǒng)地構(gòu)建和比較模型和比較來回答這一問題。本研究的第三個假設(shè)在假設(shè)一的基礎(chǔ)上提出, 個體因合作者的高合作傾向所表現(xiàn)出更多的合作行為, 可能主要有兩個方面的因素所驅(qū)動。其一是積極期望, 即合作者的高概率合作使得被試對合作者建立了積極的期望。其二是社會獎賞, 即合作者的高合作概率使得被試從合作成功中感受到更多獎賞價值。也有可能兩者共同作用以促進(jìn)合作行為。
2" 實(shí)驗(yàn)1: 合作者合作意愿對條件合作的影響
2.1" 方法
2.1.1" 被試
實(shí)驗(yàn)1中共招募了135名年齡在18至30歲之間的健康成人被試(平均年齡: 21.69 ± 2.96歲, 79名女性), 均為北京師范大學(xué)在讀學(xué)生。所有被試的視力或矯正視力正常, 無精神疾病病史。所有被試在正式實(shí)驗(yàn)開始前簽署知情同意書。本研究獲得北京師范大學(xué)心理學(xué)部研究倫理委員會的批準(zhǔn)(批準(zhǔn)號: CNL_A_0001_009), 遵守《赫爾辛基宣言》的相關(guān)規(guī)定。對樣本量選取參考了采用類似的學(xué)習(xí)任務(wù)和研究方法的研究(Fang et al., 2024; Henco et al., 2020; Mukherjee et al., 2020), 同時兼顧樣本獲取的便利性, 實(shí)驗(yàn)前未使用任何軟件工具進(jìn)行計算樣本量。
2.1.2" 實(shí)驗(yàn)任務(wù)
本研究采用改編版的囚徒困境范式, 被試在游戲中與一名合作者進(jìn)行多次互動, 每輪決策面臨“合作”或“背叛”兩個選項(xiàng)。為消除社會贊許影響, 實(shí)驗(yàn)指導(dǎo)語避免了使用“合作”、“背叛”等詞匯, 改用幾何形狀(三角形、正方形)來表示選項(xiàng)對應(yīng)的獎勵(圖1a)。被試被告知合作者也在同時面臨選擇, 根據(jù)雙方?jīng)Q策, 會有四種結(jié)果, 對應(yīng)不同的獎勵(表1)。具體來說, 雙方均合作時則各得4代幣, 被
圖1" 實(shí)驗(yàn)范式與實(shí)驗(yàn)1行為數(shù)據(jù)分析結(jié)果。a. 單個試次展示。上圖和下圖分別展示社會和非社會條件下的單個試次展示。b. 實(shí)驗(yàn)1合作者的合作概率設(shè)置。c-d. 實(shí)驗(yàn)1行為數(shù)據(jù)分析結(jié)果。c. 橫坐標(biāo)為自變量, 縱坐標(biāo)為各個自變量解釋被試行為決策的效應(yīng)量(beta值)。d. 左圖展示情景×概率的交互作用; 右圖展示在社會條件(高概率減去低概率)和非社會條件(高概率減去低概率)中被試合作概率差值。右圖的跨過條形圖上的每根線條表示每位被試的數(shù)據(jù)。***表示p lt; 0.001; ns. 表示統(tǒng)計上未顯著, 即p值 gt; 0.05。彩圖見電子版, 下同。
試合作而合作者背叛, 被試得0代幣, 合作者得6代幣, 反之亦然; 雙方均背叛時則各得2代幣。被試在任務(wù)前需通過測驗(yàn)以確認(rèn)理解任務(wù)。被試的報酬部分取決于任務(wù)中獲得的金幣, 在任務(wù)結(jié)束后隨機(jī)選取10%的試次作為計算報酬依據(jù), 被試在任務(wù)前了解這一獎勵規(guī)則。
2.1.3" 實(shí)驗(yàn)流程
本研究在行為實(shí)驗(yàn)室內(nèi)進(jìn)行, 同一時間段會有多人抵達(dá)實(shí)驗(yàn)室參加實(shí)驗(yàn)。被試抵達(dá)實(shí)驗(yàn)室后, 先填寫篩選問卷并閱讀指導(dǎo)語。被試在正式實(shí)驗(yàn)前進(jìn)行了6輪練習(xí)試驗(yàn)以幫助被試熟悉任務(wù)。練習(xí)試次不涉及實(shí)際互動。實(shí)驗(yàn)設(shè)有社會與非社會條件, 每個條件下均包含高概率與低概率合作兩部分, 高低概率各60試次。高概率合作保持78%的合作概率, 低概率合作以20試次為周期, 第一個周期合作概率為20%, 而后兩個周期的合作率分別以80%與20%為交替(圖1b)。高低合作概率條件的順序平衡分配。社會條件下, 被試被告知與匿名被試在同一實(shí)驗(yàn)室內(nèi)進(jìn)行互動, 并用抽簽程序增強(qiáng)真實(shí)性感知; 在非社會條件下, 被試被告知與他互動是的電腦而非真人。實(shí)際上合作者的行為均為電腦程序預(yù)設(shè)。社會條件與非社會條件的設(shè)置參考了先前研究(Sanfey et al., 2003)。為消除順序效應(yīng)與社會期望偏差, 社會與非社會條件的順序平衡且實(shí)驗(yàn)任務(wù)被稱為“互動游戲”。實(shí)驗(yàn)結(jié)束后, 被試被隱晦地詢問是否相信在社會條件下與真人進(jìn)行互動。其中, 84%被試相信社會條件的真實(shí)性。將懷疑真實(shí)性的被試數(shù)據(jù)排除后再次分析發(fā)現(xiàn), 統(tǒng)計結(jié)果未受到影響, 故135名被試數(shù)據(jù)均納入分析。實(shí)驗(yàn)程序通過E-prime 2.0執(zhí)行。實(shí)驗(yàn)結(jié)束后, 被試填寫了社會價值取向的問卷(Murphy et al., 2011), 該問卷用于測量個體的親社會傾向性, 分?jǐn)?shù)越高(低)表示個體越利他(自私)。該指標(biāo)有助于驗(yàn)證認(rèn)知計算模型中有關(guān)親社會假設(shè)的成分的心理意義。
2.1.4" 行為數(shù)據(jù)分析
我們采用廣義線性混合模型(Generalized Linear Mixed Model, GLMM)分析影響被試選擇(二分類變量)的變量。自變量包括情景(scenario)、合作概率(cooperation probability)及二者交互作用, 情景分為社會(social)與非社會(nonsocial)條件, 合作概率區(qū)分為高(high probability)與低(low probability)。此外, 納入了被試及合作者在前三次試驗(yàn)的選擇(subject’s choice t-1, t-2, t-3; partner’s choice t-1, t-2, t-3)以探討先前選擇對當(dāng)前決策的影響??刂谱兞堪ㄐ詣e(gender)、年齡(age)及條件順序(order)。模型隨機(jī)效應(yīng)涵蓋被試截距與自變量斜率。對交互作用的事后分析基于廣義線性混合模型的結(jié)果。模型中的連續(xù)變量在擬合前進(jìn)行標(biāo)準(zhǔn)化(z-score轉(zhuǎn)換), 報告的β值為標(biāo)準(zhǔn)化系數(shù)。所有事后比較的p值均經(jīng)過Bonferroni多重比較校正。
2.1.5" 認(rèn)知計算模型的構(gòu)建
本研究結(jié)合本文研究問題和相關(guān)的經(jīng)典理論, 共構(gòu)建了6個基于不同理論假設(shè)的模型(詳見補(bǔ)充材料第一部分)。模型1作為基線模型, 假設(shè)被試的合作概率固定。模型2 (獎勵學(xué)習(xí)模型)認(rèn)為被試基于獎勵反饋調(diào)整選擇, 忽略收益矩陣、預(yù)期價值和對手行為。模型3 (理性決策模型)基于個人收益最大化原則, 假設(shè)被試傾向于選擇背叛以獲得更大收益, 除非存在決策誤差。模型4 (社會獎賞學(xué)習(xí)模型)在理性模型基礎(chǔ)上引入社會獎賞, 假設(shè)被試在合作預(yù)期下獲得額外的社會獎賞。模型5 (社會獎賞+一階學(xué)習(xí)模型)假設(shè)被試根據(jù)合作者的行為反饋預(yù)測下一回合合作概率。模型6 (社會獎賞+二階學(xué)習(xí)模型)在模型5的基礎(chǔ)上, 考慮被試在更新信念時納入合作者歷史行為及其對合作者行為的影響。模型比較結(jié)果顯示模型6優(yōu)于其他模型(見圖2a和網(wǎng)絡(luò)版附表1), 能夠很好地預(yù)測被試的合作行為(圖2c和網(wǎng)絡(luò)版附圖1)。在模型6, 合作與背叛的主觀價值計算如下:
(1)
(2)
其中, Uc (t) 表示在試驗(yàn)t中合作的主觀價值(utility), Ud (t)表示在試驗(yàn)t中背叛的主觀價值。根據(jù)表1, 合作和背叛的預(yù)期收益分別是4pt和4pt + 2。ω在這里代表社會獎賞。社會獎賞越高表示雙方合作的情況下能夠提升合作的主觀價值。在此模型上我們假設(shè)被試采用影響模型(Hampton et al., 2008)去更新他們對合作者未來的合作行為的期望, 影響模型包含了一階和二階信念更新。pt表示被試對合作者在第t個回合時的合作概率的預(yù)期:
(3)
Pt表示合作者第t個試次中的行為決定, 如果合作Pt = 1, 如果背叛Pt = 0。(Pt ? pt)合作者的實(shí)際決策與被試對合作者的預(yù)期之間的差異, 即一階信念的預(yù)期誤差。α∈[0, 1] 是用于更新一階信念的預(yù)期誤差的權(quán)重, 稱為一階學(xué)習(xí)率。Qt代表被試在第t個試次中的行動決定, 如果合作Qt = 1, 如果背叛Qt = 0。(Qt? – )表示二階信念預(yù)期誤差。 ∈[0, 1]是更新二階信念預(yù)期誤差的學(xué)習(xí)率。 表示被試在第t 個試次中從合作者的角度推測自己的合作概率。 由公式4推導(dǎo)所得(詳見網(wǎng)絡(luò)版附加計算建模部分)。p1對于所有被試都設(shè)置為0.5, 假定所有人在互動開始之前對合作者沒有期望偏差, 即合作的概率是50%。
(4)
我們的模型采用Softmax來計算被試的合作概率:
(5)
β表示逆溫系數(shù), 衡量參與者決策的一致性, 較低的β值意味著更高的選擇變異。合作概率( )代表參與者在試次t的合作傾向。我們利用MATLAB (R2021a版本)中的fmincon函數(shù)估計每位參與者的自由參數(shù), 采用極大似然估計方法(Maximum Likelihood Estimation, MLE)擬合行為數(shù)據(jù)。為避免估計陷入局部最小值, 初始參數(shù)隨機(jī)選取, 重復(fù)估計過程500次后選取最優(yōu)的估算值。模型假定參與者在不同條件下使用不同的參數(shù)值, 即高概率與低概率條件下的自由參數(shù)各不相同。對于每位被試的行為, 我們通過以下公式對L進(jìn)行最大化:
(6)
其中, T是試驗(yàn)的總數(shù), 即120。ct表示被試的選擇。當(dāng)被試選擇合作時, ct = qt, 當(dāng)被試選擇背叛時, ct = 1 ? qt。參考前人報告(Wilson amp; Collins, 2019), 所有自由參數(shù)的范圍均在模型擬合之前, 通過模擬和參數(shù)恢復(fù)分析所確定。其參數(shù)恢復(fù)的結(jié)果請見網(wǎng)絡(luò)版附圖2。模型中自由參數(shù)的統(tǒng)計值請見網(wǎng)絡(luò)版附表2。在本模型中, 預(yù)期(pt)和社會獎賞(ω)是我們重點(diǎn)關(guān)注的變量。模型顯示被試在實(shí)驗(yàn)過程中動態(tài)地更新他們對合作者的預(yù)期(網(wǎng)絡(luò)版附
圖2" 實(shí)驗(yàn)1模型比較與模型變量分析結(jié)果。a. 模型比較。橫坐標(biāo)為各個模型(詳見方法部分), 縱坐標(biāo)為Bayesian Information Criterion (BIC)值, 其計算公式為BIC = k·ln(n) ? 2 ln(L)。在社會條件(黃色條形)和非社會條件(藍(lán)色條形), 被試的行為均由模型6解釋得最好, protected exceedance probability (PEP, Rigoux et al., 2014) 顯示模型6相比于其他所有模型在群體上可能是最優(yōu)模型的概率大于98%。b. 模型恢復(fù)(model recovery)。模型6所產(chǎn)生的數(shù)據(jù)由模型6最好地解釋得概率為0.79。c. 被試數(shù)據(jù)與最優(yōu)模型預(yù)測的吻合度。橫坐標(biāo)為試次數(shù), 縱坐標(biāo)為被試的平均合作概率。藍(lán)色實(shí)線表示被試的真實(shí)選擇, 黑色實(shí)線表示最優(yōu)模型的預(yù)測均值, 陰影部分為模型預(yù)測的合作率的95%的置信區(qū)間。這里僅展示單個子條件(非社會條件下合作者的行為從變動到穩(wěn)定的情況下)的數(shù)據(jù), 所有條件的模型預(yù)測吻合度比對圖請見網(wǎng)絡(luò)版附圖1。d-e. 從最優(yōu)模型中得到的社會獎賞(ω, social reward)和預(yù)期(p, expectation)的參數(shù)值的分析統(tǒng)計結(jié)果。***表示p lt; 0.001。
圖3)。在本模型的框架下, 預(yù)期或社會獎賞的提高都會影響個體的心里計算機(jī)制而提高合作的主觀價值計算, 從而提高個體的合作行為(詳見網(wǎng)絡(luò)版附加第一部分的模型預(yù)測與驗(yàn)證和附圖4)。
在本研究中, 模型選擇依據(jù)貝葉斯信息量準(zhǔn)則(BIC) (Schwarz, 1978)進(jìn)行, 優(yōu)先考慮模型的簡潔性及對參數(shù)數(shù)量的嚴(yán)格懲罰, 以BIC值較低為擬合優(yōu)度的指標(biāo)。此外, 計算保護(hù)性超限概率(PEP) (Rigoux et al., 2014)以評估各模型在群體水平上成為最優(yōu)模型的可能性。BIC和PEP的結(jié)合使用, 旨在精確選擇最適合描述數(shù)據(jù)的模型, 確保模型選擇的科學(xué)性和嚴(yán)謹(jǐn)性, PEP的計算基于BIC。
2.1.6" 最優(yōu)模型的分析
基于研究假設(shè), 我們重點(diǎn)探討模型中社會獎賞(ω)和預(yù)期(p)的作用, 故采用線性混合模型(Linear Mixed Model, LMM)進(jìn)行了進(jìn)一步的統(tǒng)計分析。對于社會獎賞, 線性混合模型考慮的自變量包括情景、合作概率及其交互作用。對于預(yù)期, 分析采用了相同的自變量。此外, 為探究被試及其合作者先前選擇對當(dāng)前選擇的潛在影響, 我們分析了被試及合作者在前三個試次的選擇情況, 這包括被試的前三次選擇和合作者的前三次選擇。上述兩個線性混合模型中, 性別、年齡、條件順序同樣作為控制變量被納入分析。模型的隨機(jī)效應(yīng)部分包括每個被試的截距(intercept)和所有自變量的斜率。
2.2" 結(jié)果
2.2.1" 行為數(shù)據(jù)的分析結(jié)果
以被試選擇為因變量的GLMM表明(網(wǎng)絡(luò)版附表3, 圖1c): 情境的主效應(yīng)顯著, 被試在社會條件下比非社會條件下更傾向于選擇合作, β = 1.19, 95% CI = [1.00, 1.37], p lt; 0.001。合作概率的主效應(yīng)顯著, 被試在高概率條件下比低概率條件下更傾向于選擇合作, β = 0.24, 95% CI = [?0.36, ?0.12], p lt; 0.001。合作概率與情境的交互作用顯著, β = 0.52, 95% CI = [?0.64, ?0.40], p lt; 0.001。事后分析表明在社會條件(t(134) = ?16.93, 95% CI = [?0.28, 0.22], p校正 lt; 0.001)和非社會條件(t(134) = ?6.94, 95% CI = [?0.15, ?0.09], p校正 lt; 0.001)下, 被試在低概率條件的合作行為要顯著低于高概率條件(圖1d)。基于此, 將高概率條件減去低概率條件后再進(jìn)行t檢驗(yàn)。結(jié)果表明(圖1d), 社會條件下被試在高概率條件與低概率條件之間合作傾向的差異顯著大于非社會條件(t(134) = 5.63, 95% CI = [0.09, 0.19], p校正 lt; 0.001)。此外, 被試的前一個試次(β = 1.38, 95% CI = [1.31, 1.44], p lt; 0.001)、前第二個試次(β = 0.63, 95% CI = [0.56, 0.69], p lt; 0.001)、前第三個試次(β = 0.22, 95% CI = [0.16, 0.29], p lt; 0.001)的選擇均顯著提升被試的合作行為。合作者的前一個試次的選擇顯著提升被試的合作行為(β = 0.50, 95% CI = [0.44, 0.57], p lt; 0.001)。性別(β = ?0.15, 95% CI = [?0.31, 0.02], p = 0.076)、年齡(β = ?0.03, 95% CI = [?0.07, 0.01], p = 0.128)、條件順序(β = ?0.002, 95% CI = [?0.16, 0.16], p = 0.983)、合作者的前第二個試次(β = 0.05, 95% CI = [?0.01, 0.12], p = 0.090)與前第三個試次(β = ?0.05, 95% CI = [?0.11, 0.01], p = 0.136)對被試的選擇影響不顯著。
2.2.2" 認(rèn)知模型的分析結(jié)果
以社會獎賞為因變量的LMM表明(網(wǎng)絡(luò)版附表4): 情境的主效應(yīng)顯著, 被試在社會條件下比非社會條件下感知到更多的社會獎賞, β = 1.70, 95% CI = [1.37, 2.03], p lt; 0.001。合作概率的主效應(yīng)不顯著, 被試在高概率與低概率條件下感知到的社會獎賞沒有差異, β = 0.28, 95% CI = [?0.05, 0.62], p = 0.100。合作概率與情境的交互作用顯著, β = ?1.67, 95% CI = [?2.10, ?1.24], p lt; 0.001。事后分析顯示, 在社會條件下, 被試在低概率條件下比高概率條件下感知到更低的社會獎賞, t(134) = ?7.30, 95% CI = [?1.75, ?1.00], p校正 lt; 0.001。而在非社會條件下, 被試在低概率與高概率條件下感知到的社會獎賞沒有顯著差異, t(134) = 1.77, 95% CI = [?0.03, 0.61], p = 0.08 (圖2d)。基于此, 將高概率條件減去低概率條件下的社會獎賞后再進(jìn)行t檢驗(yàn)。結(jié)果表明(圖2d), 社會條件下被試在高概率條件與低概率條件之間感知社會獎賞的差異顯著大于非社會條件, t(134) = 6.84, 95% CI = [1.18, 2.15], p校正 lt; 0.001。此外, 性別(β = ?0.28, 95% CI = [?0.61, 0.04], p = 0.088)、年齡(β = ?0.04, 95% CI = [?0.11, 0.02], p = 0.226)、條件順序(β = 0.06, 95% CI = [?0.22, 0.35], p = 0.668)對被試感知社會獎賞沒有影響。皮爾遜相關(guān)分析顯示在社會條件(r = 0.19, p = 0.034)和非社會條件(r = 0.28, p lt; 0.001)下, 親社會人格與與社會獎賞皆為顯著正相關(guān)(詳見網(wǎng)絡(luò)版附圖5a)。
以預(yù)期為因變量的LMM表明(網(wǎng)絡(luò)版附表5): 情境的主效應(yīng)顯著, 被試在社會條件下比非社會條件下具有更高的預(yù)期, β = 0.20, 95% CI = [0.16, 0.24], p lt; 0.001。合作概率的主效應(yīng)顯著, 被試在高概率條件下比低概率具有更高的預(yù)期, β = ?0.03, 95% CI = [?0.06, ?0.01], p = 0.015。合作概率與情境的交互作用顯著, β = ?0.17, 95% CI = [?0.18, ?0.16], p lt; 0.001。 事后分析表明(圖2e), 在社會條件(t(134) = ?12.38, 95% CI = [?0.23, ?0.17], p校正 lt; 0.001)與非社會條件(t(134) = ?9.30, 95% CI = [?0.18, ?0.12], p校正 lt; 0.001)中, 被試在高概率條件下比低概率條件下的期望更高?;诖?, 將高概率條件減去低概率條件下的期望后再進(jìn)行t檢驗(yàn)。結(jié)果表明(圖2e), 社會條件下被試在高概率條件與低概率條件之間社會期望的差異顯著大于非社會條件, t(134) = 2.53, 95% CI = [0.01, 0.12], p = 0.013。此外, 被試的前一個試次(β = 0.07, 95% CI = [0.07, 0.08], p lt; 0.001)、前第二個試次(β = 0.04, 95% CI = [0.04, 0.05], p lt; 0.001)、前第三個試次(β = 0.03, 95% CI = [0.02, 0.04], p lt; 0.001)的決策均顯著提升被試的預(yù)期。合作者的前一個試次(β = 0.22, 95% CI = [0.22, 0.23], p lt; 0.001)、前第二個試次(β = 0.06, 95% CI = [0.05, 0.06], p lt; 0.001)、前第三個試次(β = 0.04, 95% CI = [0.03, 0.04], p lt; 0.001)的決策均顯著提升被試的預(yù)期。性別(β = ?0.002, 95% CI = [?0.05, 0.04], p = 0.919)、年齡(β = ?0.001, 95% CI = [?0.01, 0.004], p = 0.619)、條件順序(β = ?0.002, 95% CI = [?0.02, 0.06], p = 0.365)對被試的預(yù)期的影響不顯著。
2.3" 小結(jié)
實(shí)驗(yàn)1結(jié)果驗(yàn)證了假設(shè)一: 合作者表現(xiàn)高合作概率時, 個體更頻繁選擇合作, 重復(fù)了前人的條件合作現(xiàn)象(Fischbacher et al., 2001)。在認(rèn)知建模方面, 初步結(jié)果復(fù)現(xiàn)了Fareri等(2012, 2015)的發(fā)現(xiàn), 表明包含社會獎賞的模型比無社會獎賞模型更好地解釋被試的行為。此外, 模型分析支持假設(shè)二, 即整合一階及二階信念的模型優(yōu)于僅包含一階信念的模型。對最優(yōu)模型6的參數(shù)分析揭示, 個體在高概率合作情境下合作行為的增多可歸因于更強(qiáng)的積極期望和社會獎賞感知。這種效應(yīng)不僅局限于社會條件, 非社會條件下也觀察到了相似的效應(yīng), 但情境相關(guān)的交互作用表明, 在社會條件下這一效應(yīng)顯著強(qiáng)于非社會條件。
我們在實(shí)驗(yàn)1的低概率條件中設(shè)置了合作者的合作概率變動周期以增加被試在實(shí)驗(yàn)互動的真實(shí)性。為排除合作者的合作概率變動可能帶來的混淆, 在實(shí)驗(yàn)2中, 我們將合作者的合作概率和合作變動性設(shè)置為兩個獨(dú)立的自變量。這有利于我們澄清在實(shí)驗(yàn)1所觀察到的合作者的高概率提升了被試的合作行為這一效應(yīng), 是否因?yàn)楹献髡叩暮献髯儎有缘挠绊憽?/p>
3" 實(shí)驗(yàn)2: 排除合作者行為變動性的影響
3.1" 方法
3.1.1" 被試
實(shí)驗(yàn)2的計劃樣本為至少82人, 該樣本量在實(shí)驗(yàn)前基于G*Power進(jìn)行計算的?;谖覀兯P(guān)注的三個自變量之間交互作用: 情景×合作概率×變動性(volatility), 設(shè)定了F檢驗(yàn), 重復(fù)測量?被試間與被試內(nèi)交互作用, 一類錯誤概率(α)為0.05、預(yù)期效應(yīng)大?。–ohen's f )為0.20、95%統(tǒng)計檢驗(yàn)力(1 ? β)以及重復(fù)測量之間的相關(guān)性為0.26 (基于實(shí)驗(yàn)1), 從而確定了最小樣本大小為82。招募被試時考慮到可能有會被試中途退出, 實(shí)際樣本為104人。所有被試均為北京師范大學(xué)在讀學(xué)生。其中高概率組有52人(平均年齡20.94 ± 2.47歲, 女性26人), 低概率組有52人(平均年齡20.22 ± 2.22歲, 女性34人)。所有被試的視力或矯正視力正常, 且無任何精神疾病病史。在正式實(shí)驗(yàn)開始前, 實(shí)驗(yàn)者獲得了所有被試的知情同意書。本研究獲得了當(dāng)?shù)匮芯總惱砦瘑T會的批準(zhǔn)(批準(zhǔn)號: CNL_A_0001_009), 并遵守《赫爾辛基宣言》的相關(guān)規(guī)定。
3.1.2" 實(shí)驗(yàn)任務(wù)與實(shí)驗(yàn)流程
在實(shí)驗(yàn)1的基礎(chǔ)上, 實(shí)驗(yàn)2的被試被隨機(jī)分配兩組(高概率組與低概率組)。每組都要面對兩種情境: 社會條件與非社會條件。社會條件和非社會條件的設(shè)置與實(shí)驗(yàn)1一致。每個情境中包含兩個條件, 合作者合作概率的穩(wěn)定和變動兩個組塊。每個組塊皆有90個試次。在高概率組中, 合作者的合作概率在穩(wěn)定組塊中恒定為78%, 而在變動組塊中的合作概率隨時間在40%與95%之間上下波動, 平均概率為78%。在低概率組中, 合作者的合作概率在穩(wěn)定組塊中恒定為23%, 在變動組塊中的合作概率隨時間而在5%與60%之間上下波動, 平均概率為23% (圖3a)。即在高概率和低概率兩組被試中, 穩(wěn)定組塊和變動組塊的平均概率是相同的。實(shí)驗(yàn)2的實(shí)驗(yàn)指導(dǎo)語和實(shí)驗(yàn)流程與實(shí)驗(yàn)1一致。實(shí)驗(yàn)程序采用E-prime 2.0實(shí)現(xiàn)。
3.1.3" 行為數(shù)據(jù)分析
實(shí)驗(yàn)2采用GLMM分析被試的選擇(二分類變量)受到哪些因素影響。模型的自變量包括情景、合作概率、變動性。同時, 我們考察情境與合作概率、合作概率與變動性、變動性與情境的兩因素交互作用以及情境、合作概率、變動性的三因素交互作用。情境的2個水平分別為社會條件和非社會條件, 合作概率的2個水平分別為高概率條件(high probability)和低概率條件(low probability), 變動性的兩個水平分別為穩(wěn)定條件(stable)與變動條件(volatile)。與實(shí)驗(yàn)1一致, 我們還考察了被試先前的三個試次的選擇, 合作者先前的三個試次的選擇可能對被試當(dāng)前選擇的影響, 以及將性別、年齡、條件順序作為控制變量納入分析。隨機(jī)效應(yīng)包括每個被試的截距和各個自變量相應(yīng)的斜率。與實(shí)驗(yàn)1一致, 模型中的連續(xù)變量在擬合之前進(jìn)行了標(biāo)準(zhǔn)化(z分?jǐn)?shù)轉(zhuǎn)換), 報告的β值為標(biāo)準(zhǔn)化系數(shù)。所有事后比較的p值都經(jīng)過了Bonferroni多重比較校正。
3.1.4" 認(rèn)知建模
模型構(gòu)建部分與實(shí)驗(yàn)1一致。實(shí)驗(yàn)2的結(jié)果同樣也顯示模型6相比于其他模型能夠更好地擬合被試的行為(模型比較結(jié)果請見圖3c和網(wǎng)絡(luò)版附表6, 模型預(yù)測結(jié)果請見網(wǎng)絡(luò)版附圖6), 被試在實(shí)驗(yàn)過程中動態(tài)地更新他們對合作者的預(yù)期(網(wǎng)絡(luò)版附圖7)?;趯?shí)驗(yàn)2的設(shè)計, 因變量為社會獎賞的線性混合模型的自變量包括情景、合作概率、變動性, 并探討了情景與合作概率、合作概率與變動性、變動性與情景的雙因素交互作用, 以及三者的三因素交互作用。因變量為預(yù)期的LMM的自變量包括情景、合作概率、變動性, 并探討了情景與合作概率、合
圖3" 實(shí)驗(yàn)2行為數(shù)據(jù)與模型變量分析結(jié)果。a. 實(shí)驗(yàn)2合作者的合作概率設(shè)置。b. 實(shí)驗(yàn)2被試的行為決策分析結(jié)果。c. 模型比較。d. 被試合作概率的統(tǒng)計分析結(jié)果。e amp; f 分別展示社會獎賞和預(yù)期的統(tǒng)計分析結(jié)果。***表示p lt; 0.001。
作概率與變動性、變動性與情景的雙因素交互作用, 以及三者的三因素交互作用。此外, 我們還考察了被試先前三個試次的選擇, 合作者先前三個試次的選擇可能對被試當(dāng)前選擇的影響。在上述兩個線性混合模型中, 我們均將性別、年齡、條件順序作為控制變量納入分析。隨機(jī)效應(yīng)包括每個被試的截距和各個自變量相應(yīng)的斜率。
3.2" 結(jié)果
3.2.1" 行為數(shù)據(jù)分析結(jié)果
以被試選擇為因變量的GLMM表明(網(wǎng)絡(luò)版附表7, 圖3b): 情境的主效應(yīng)顯著, 被試在社會條件下比非社會條件下更傾向于選擇合作, β = 1.20, 95% CI = [0.91, 1.50], p lt; 0.001。合作概率的主效應(yīng)顯著, 被試在高概率條件下比低概率條件下更傾向于選擇合作, β = 0.53, 95% CI = [0.12, 0.93], p = 0.011。變動性的主效應(yīng)不顯著, 被試在穩(wěn)定與變動條件下的選擇結(jié)果沒有差異, β = ?0.12, 95% CI = [?0.28, 0.05], p = 0.174。合作概率與情境的交互作用顯著, β = 0.89, 95% CI = [?0.1.30, ?0.47], p lt; 0.001。事后分析表明, 在社會條件下低概率組的合作行為要顯著低于高概率組, t(51) = ?12.80, 95% CI = [?0.48, ?0.35], p校正 lt; 0.001。而在非社會條件下, 低概率組和高概率組之間的差異不顯著, t(51) = ?0.09, 95% CI = [?0.09, 0.08], p = 0.925 (圖3d)。合作概率與變動性的交互作用不顯著, β = 0.16, 95% CI = [?0.08, 0.39], p = 0.192。
變動性與情境的交互作用顯著, β = 0.22, 95% CI = [0.04, 0.39], p = 0.017。事后分析顯示在社會條件(t(103) = ?1.34, 95% CI = [?0.04, 0.01], p未校正 = 0.182)與非社會條件(t(103) = 0.183, 95% CI = [?0.03, 0.03], p未校正 = 0.855)中, 被試在穩(wěn)定組塊和變動組塊的行為均沒有顯著差異。情境、變動性與合作概率的三因素交互作用不顯著, β = ?0.17, 95% CI = [?0.42, 0.08], p = 0.187。此外, 被試的前一個試次(β = 1.69, 95% CI = [1.61, 1.76], p lt; 0.001)、前第二個試次(β = 0.65, 95% CI = [0.58, 0.73], p lt; 0.001)、前第三個試次(β = 0.26, 95% CI = [0.19, 0.33], p lt; 0.001)的選擇均顯著提升被試的合作行為。合作者的前一個試次(β = 2.22, 95% CI = [2.15, 2.29], p lt; 0.001)與前第二個試次(β = 0.33, 95% CI = [0.26, 0.40], p lt; 0.001)的選擇也顯著提升被試的合作行為。被試年齡主效應(yīng)顯著, β = ?0.05, 95% CI = [?0.09, ?0.01], p = 0.010。性別(β = ?0.12, 95% CI = [?0.33, 0.09], p = 0.253)、條件順序(β = 0.07, 95% CI = [?0.14, 0.28], p = 0.498)、合作者前第三個試次(β = 0.01, 95% CI = [?0.07, 0.08], p = 0.819)對被試的行為影響不顯著。
3.2.2" 認(rèn)知建模分析結(jié)果
以社會獎賞為因變量的LMM表明(網(wǎng)絡(luò)版附表8): 情境的主效應(yīng)顯著, 被試在社會條件下比非社會條件下感知到更多的社會獎賞, β = 1.20, 95% CI = [0.81, 1.59], p lt; 0.001。合作概率的主效應(yīng)不顯著, 被試在高概率與低概率條件下感知到的社會獎賞沒有差異, β = 0.45, 95% CI = [?0.02, 0.91], p = 0.058。變動性的主效應(yīng)不顯著, 被試在穩(wěn)定與變動條件下感知到的社會獎賞沒有差異, β = ?0.03, 95% CI = [?0.39, 0.33], p = 0.884。合作概率與情境的交互作用顯著, β = ?1.08, 95% CI = [?1.62, ?0.53], p lt; 0.001。事后分析顯示在社會條件下, 低概率組的社會獎賞要顯著小于高概率組, t(51) = ?2.41, 95% CI = [?0.99, ?0.09], p校正 = 0.038; 而在非社會條件下, 低概率組和高概率組的社會獎賞沒有顯著差異(t(51) = 2.22, 95% CI = [0.05, 1.05], p校正 = 0.062)中, 被試在高概率合作中比低概率合作中均感知到更多的社會獎賞(圖3e)。合作概率與變動性的交互作用不顯著, β = 0.16, 95% CI = [?0.34, 0.67], p = 0.528。情境與變動性的交互作用不顯著, β = 0.11, 95% CI = [?0.34, 0.57], p = 0.621。情境、變動性與合作概率的三因素交互作用不顯著, β = ?0.05, 95% CI = [?0.70, 0.59], p = 0.873。個體的親社會人格與社會獎賞參數(shù)顯著正相關(guān), 社會條件: r = 0.24, p = 0.013, 非社會條件: r = 0.36, p lt; 0.001, 詳見網(wǎng)絡(luò)版附圖5b)。
以預(yù)期為因變量的線性混合模型結(jié)果表明(網(wǎng)絡(luò)版附表9): 情境的主效應(yīng)顯著, 被試在社會條件下比非社會條件下具有更高的預(yù)期, β = 0.16, 95% CI = [0.11, 0.20], p lt; 0.001。合作概率的主效應(yīng)不顯著, 被試在高概率與低概率條件下的預(yù)期沒有顯著差異, β = 0.02, 95% CI = [?0.04, 0.07], p = 0.550。變動性的主效應(yīng)不顯著, 被試在變動與穩(wěn)定條件下的預(yù)期沒有顯著差異, β = ?0.02, 95% CI = [?0.04, 0.01], p = 0.218。合作概率與情境的交互作用顯著, β = ?0.16, 95% CI = [?0.22, ?0.10], p lt; 0.001。事后分析顯示, 社會條件(t(51) = ?17.42, 95% CI = [?0.44, ?0.35], p lt; 0.001)下高概率組的預(yù)期要顯著大于低概率組, 而非社會條件(t(51) = 0.73, 95% CI = [?0.05, 0.10], p = 0.467)高低概率兩組人的預(yù)期沒有顯著差異(圖3f)。合作概率與變動性的交互作用不顯著, β = ?0.002, 95% CI = [?0.04, 0.04], p = 0.936。變動性與情境的交互作用不顯著, β = 0.01, 95% CI = [?0.002, 0.03], p = 0.102。變動性、合作概率與情境的三因素交互作用不顯著, β = ?0.02, 95% CI = [?0.04, 0.003], p = 0.104。此外, 被試的前一個試次(β = 0.06, 95% CI = [0.05, 0.07], p lt; 0.001)、前第二個試次(β = 0.03, 95% CI = [0.02, 0.04], p lt; 0.001)、前第三個試次(β = 0.03, 95% CI = [0.02, 0.03], p lt; 0.001)的選擇均顯著提高被試的預(yù)期。合作者的前一個試次(β = 0.34, 95% CI = [0.33, 0.34], p lt; 0.001)、前第二個試次(β = 0.09, 95% CI = [0.09, 0.10], p lt; 0.001)、前第三個試次(β = 0.04, 95% CI = [0.04, 0.05], p lt; 0.001)的選擇均顯著提高的預(yù)期。
3.3" 小結(jié)
實(shí)驗(yàn)2重復(fù)了實(shí)驗(yàn)1觀察到的效應(yīng), 并排除了合作者行為變動性的影響。結(jié)果顯示個體合作行為隨著合作者合作概率的增加而提高, 不受合作者合作變動性的影響。同時, 我們再次發(fā)現(xiàn)包含社會獎賞的模型優(yōu)于無社會獎賞的模型。此外, 實(shí)驗(yàn)2再次發(fā)現(xiàn)包含一階和二階信念的模型優(yōu)于其他模型。合作者的高合作概率行為提升了被試的積極預(yù)期和社會獎賞, 從而促進(jìn)了被試的合作行為。這些結(jié)果證實(shí)了合作者的合作概率(而非行為的變動性)是提升合作的關(guān)鍵因素, 并闡明了其內(nèi)在的認(rèn)知計算機(jī)制。
4" 討論
本研究通過兩個實(shí)驗(yàn)探究了多次合作情境中合作者的高合作概率促進(jìn)個體合作行為的認(rèn)知計算機(jī)制。模型比較發(fā)現(xiàn), 包含社會獎賞假設(shè)的模型(模型4)優(yōu)于僅考慮金錢收益假設(shè)的模型(模型3), 驗(yàn)證了合作的成功能夠給人們帶來額外的獎賞價值這一說法(Rilling et al., 2002)。此外, 包含學(xué)習(xí)假設(shè)的模型(模型5和模型6)優(yōu)于不包含學(xué)習(xí)假設(shè)的模型(模型4)。同時比較多個包含學(xué)習(xí)的模型發(fā)現(xiàn)含一階和二階信念的模型(模型6)優(yōu)于只包含一階信念的模型(模型5)。研究結(jié)果顯示個體的合作行為隨著合作者的提升而提升, 這由個體對合作者構(gòu)建的積極期望以及合作本身帶來的額外獎賞所共同驅(qū)動。
研究結(jié)果驗(yàn)證了假設(shè)一, 即個體的合作行為會受到合作者合作行為的影響。相對于合作者低合作概率的情況, 當(dāng)合作者展現(xiàn)高合作概率時, 被試的合作行為顯著增加。這一效應(yīng)在社會條件下并非特異, 即使在非社會情境下, 高合作者合作概率也能促進(jìn)被試的合作行為。然而, 情景與合作概率的交互作用顯示, 在社會條件下, 這一效應(yīng)更為顯著。實(shí)驗(yàn)2通過獨(dú)立操縱合作者的合作概率和變動性, 更清晰地揭示了合作者合作概率對條件合作的關(guān)鍵影響。并發(fā)現(xiàn)這一效應(yīng)只有在社會條件下成立。也就是說, 與真人互動時, 合作者提高合作概率時, 被試也相應(yīng)提高合作概率; 反之亦然。這一結(jié)果與以往研究的發(fā)現(xiàn)一致(Baker amp; Rachlin, 2001; De Cremer amp; Van Lange, 2001; Fischbacher et al., 2001; G?chter et al., 2022; Sorgi amp; van’t Wout, 2016), 共同表明個體的合作行為是有條件的, 只有在他人也表現(xiàn)出愿意合作時, 個體才愿意合作。
研究結(jié)果驗(yàn)證了假設(shè)二, 即個體在更新對合作者行為期望時同時考慮了一階和二階信念。該結(jié)果在社會和非社會條件下均得到確認(rèn), 并表明個體在選擇合作時將自身過去的選擇考慮在內(nèi)。我們推測這可能是因?yàn)閭€體認(rèn)為先前的合作選擇會給對方傳遞積極信號, 從而鼓勵對方也選擇合作。認(rèn)知計算模型的結(jié)果進(jìn)一步支持了這一解釋。比較不同模型后發(fā)現(xiàn), 包含一階和二階信念的模型最能準(zhǔn)確地描述被試的行為。在解釋最優(yōu)模型的結(jié)果之前, 我們的結(jié)果也重復(fù)了先前研究關(guān)于合作過程中個體采用強(qiáng)化學(xué)習(xí)迭代更新他們對合作者期望的發(fā)現(xiàn)(Fareri et al., 2012; Fareri et al., 2015), 即包含強(qiáng)化學(xué)習(xí)迭代函數(shù)的模型要比不包含學(xué)習(xí)假設(shè)的模型更好地擬合被試的行為。我們拓展的二階信念學(xué)習(xí)模型提供了更深入理解, 為解釋多次合作過程中的認(rèn)知過程提供了重要線索。這一研究的貢獻(xiàn)之一是構(gòu)建了更加完善的模型, 深入探索了多次合作中的認(rèn)知計算機(jī)制。
研究結(jié)果驗(yàn)證了假設(shè)三, 即合作者的高概率合作所引起的積極期望與社會獎賞共同促進(jìn)了條件合作。相比于合作者表現(xiàn)出低合作概率的情況下, 合作者的高合作概率會提高被試對合作者后續(xù)合作行為的預(yù)期, 我們將其稱為積極期望。出于對合作者的積極期待, 被試也會更加有可能選擇合作從而提高共同合作的可能性。此外, 在兩個實(shí)驗(yàn)中我們均發(fā)現(xiàn)包含社會獎賞假設(shè)的模型要比不包含社會獎賞假設(shè)的模型更好地擬合被試的行為。這表明了合作能夠給個體帶來除金錢收益外的積極體驗(yàn), 并且這種體驗(yàn)對保持和促進(jìn)繼續(xù)互惠非常重要。結(jié)果顯示相比于合作者表現(xiàn)出低合作概率時, 合作者的高合作概率會提升被試的社會獎賞。這種提高的社會獎賞也可以理解為互惠成功帶來的激勵作用, 進(jìn)而促進(jìn)個體隨后更有可能選擇合作。
此外, 與以往有關(guān)合作的研究結(jié)果一致(Rilling et al., 2002), 個體在社會情境下的合作概率顯著高于非社會情境, 表明了個體對與真人進(jìn)行互利互惠的偏好。人際互動提供了更多的社會認(rèn)同和情感聯(lián)系, 滿足了個體的社會心理需求。認(rèn)知計算模型的結(jié)果顯示, 個體對與真人互動的偏好受到積極期望和社會獎賞的共同驅(qū)動。這表明, 個體對合作者是真人的信念會增強(qiáng)對積極期望和社會獎賞的感知, 從而促進(jìn)合作。但是, 當(dāng)合作者表現(xiàn)出低合作概率時, 這種效應(yīng)會減弱, 表明人們會以對待機(jī)器的方式對待不愿意合作的人。盡管在人機(jī)合作中合作概率顯著低于人際合作, 但個體仍有一定概率選擇與機(jī)器合作。認(rèn)知計算模型提供了相應(yīng)解釋, 即在非社會情境下, 合作仍會獲得社會獎賞, 促使個體進(jìn)行合作。這進(jìn)一步強(qiáng)調(diào)了社會獎賞在個體合作中的重要性。然而, 并非所有社會互動情境下個體都會同時考慮一階和二階信念。某項(xiàng)關(guān)于多名被試社交互動的研究發(fā)現(xiàn), 此類模型未能更好地解釋被試的行為(Park et al., 2019)。這可能是因?yàn)楸辉囄丛诿枯喕雍笫盏胶献髡叩男畔⒎答仯?也未能評估自己的決策如何影響他人。此外, 互動次數(shù)也可能影響個體更新對方行為的策略。相比之下, 本研究通過真實(shí)互動和持續(xù)的反饋提供了更多的信息, 因此包含一階和二階信念的模型更能解釋被試的行為。
本研究深入探究了高合作概率合作者促進(jìn)團(tuán)結(jié)合作的認(rèn)知機(jī)制, 為了解個體在多次合作情境中的認(rèn)知和學(xué)習(xí)過程提供了新的視角。在實(shí)踐方面, 本研究強(qiáng)調(diào)了共贏促進(jìn)合作的重要性, 對于社會組織、團(tuán)隊(duì)合作和合作性決策的優(yōu)化具有重要意義。具體來說, 本研究為組織管理、團(tuán)隊(duì)協(xié)作和合作項(xiàng)目的設(shè)計提供了指導(dǎo), 有助于更好地理解和引導(dǎo)合作行為, 從而實(shí)現(xiàn)更高效的合作和協(xié)同工作。然而, 本研究的不足之處在于合作者的行為設(shè)置并未根據(jù)個體的選擇進(jìn)行調(diào)整。未來的研究可以采用更復(fù)雜的模型來實(shí)時生成合作者的行為, 例如考慮一階和二階信念的模型, 以增強(qiáng)被試和合作者的互動體驗(yàn), 并提高研究的生態(tài)效度。
致謝: 感謝黎櫻、高露、徐楊曉雪和蔣文元幫忙招募被試與采集實(shí)驗(yàn)數(shù)據(jù)。感謝Marius Moisa博士的討論和啟發(fā)。
參" 考" 文" 獻(xiàn)
Astington, J. W., amp; Jenkins, J. M. (1995). Theory of mind development and social understanding. Cognition and Emotion, 9(2-3), 151?165. https://doi.org/10.1080/02699939508409006
Bai, L., Yuan, B., Zhang, W., Zhang, Z., Lan, J., amp; Yiwen, W. (2014). Interpersonal cooperation and conflict influenced outcome evaluation in social decision-making. Acta Psychologica Sinica, 46(11), 1760. https://doi.org/10.3724/SP. J.1041.2014.01760
[白麗英, 袁博, 張蔚, 張振, 蘭姣, 王益文. (2014). 人際合作與沖突影響博弈決策的結(jié)果評價. 心理學(xué)報, 46(11), 1760?1771. https://doi.org/10.3724/SP.J.1041.2014.01760]
Baker, F., amp; Rachlin, H. (2001). Probability of reciprocation in repeated prisoner's dilemma games. Journal of Behavioral Decision Making, 14(1), 51?67. https://doi.org/10.1002/ 1099-0771(200101)14:1lt;51::AID-BDM365gt;3.0.CO;2-K
De Cremer, D., amp; Van Lange, P. A. (2001). Why prosocials exhibit greater cooperation than proselfs: The roles of social responsibility and reciprocity. European Journal of Personality, 15(S1), S5?S18. https://doi.org/10.1002/per. 418
Fang, Z., Zhao, M., Xu, T., Li, Y., Xie, H., Quan, P., Geng, H., amp; Zhang, R.-Y. (2024). Individuals with anxiety and depression use atypical decision strategies in an uncertain world. eLife, 13, RP93887. https://doi.org/10.7554/eLife. 93887.1
Fareri, D. S., Chang, L. J., amp; Delgado, M. R. (2012). Effects of direct social experience on trust decisions and neural reward circuitry. Frontiers in Neuroscience, 6, 148. https://doi.org/10.3389/fnins.2012.00148
Fareri, D. S., Chang, L. J., amp; Delgado, M. R. (2015). Computational substrates of social value in interpersonal collaboration. Journal of Neuroscience, 35(21), 8170?8180. https://doi.org/10.1523/jneurosci.4775-14.2015
Fehr, E., amp; Fischbacher, U. (2003). The nature of human altruism. Nature, 425(6960), 785?791. https://doi.org/ 10.1038/nature02043
Fehr, E., amp; Schurtenberger, I. (2018). Normative foundations of human cooperation. Nature Human Behaviour, 2(7), 458?468. https://doi.org/10.1038/s41562-018-0385-5
Fischbacher, U., G?chter, S., amp; Fehr, E. (2001). Are people conditionally cooperative? Evidence from a public goods experiment. Economics Letters, 71(3), 397?404. https://doi. org/10.2139/ssrn.203288
G?chter, S. (2007). Conditional cooperation: Behavioral regularities from the lab and the field and their policy implications. In B. S. Frey amp; A. Stutzer (Eds.), Economics and psychology: A promising new cross-disciplinary field (pp. 19–50). MIT Press.
G?chter, S., Lee, K., amp; Sefton, M. (2022). The variability of conditional cooperation in sequential prisoner's dilemmas. The Centre for Decision Research and Experimental Economics, School of Economics, University of Nottingham.
Hampton, A. N., Bossaerts, P., amp; O'Doherty, J. P. (2008). Neural correlates of mentalizing-related computations during strategic interactions in humans. Proceedings of the National Academy of Sciences, 105(18), 6741?6746. https://doi.org/10.1073/pnas.0711099105
Henco, L., Brandi, M.-L., Lahnakoski, J. M., Diaconescu, A. O., Mathys, C., amp; Schilbach, L. (2020). Bayesian modelling captures inter-individual differences in social belief computations in the putamen and insula. Cortex, 131, 221?236. https://doi.org/10.1016/j.cortex.2020.02.024
Hill, C. A., Suzuki, S., Polania, R., Moisa, M., O'Doherty, J. P., amp; Ruff, C. C. (2017). A causal account of the brain network computations underlying strategic social behavior. Nature Neuroscience, 20(8), 1142?1149. https://doi.org/10.1038/ nn.4602
Kreps, D. M., Milgrom, P., Roberts, J., amp; Wilson, R. (1982). Rational cooperation in the finitely repeated prisoners' dilemma. Journal of Economic Theory, 27(2), 245?252. https://doi.org/10.1016/0022-0531(82)90029-1
Mukherjee, D., Filipowicz, A. L., Vo, K., Satterthwaite, T. D., amp; Kable, J. W. (2020). Reward and punishment reversal- learning in major depressive disorder. Journal of Abnormal Psychology, 129(8), 810?823. https://doi.org/10.1037/ abn0000641
Murphy, R. O., Ackermann, K. A., amp; Handgraaf, M. (2011). Measuring social value orientation. Judgment and Decision Making, 6(8), 771?781. https://doi.org/10.1017/S193029750-000?4204
Nowak, M., amp; Sigmund, K. (1993). A strategy of win-stay, lose-shift that outperforms tit-for-tat in the Prisoner's Dilemma game. Nature, 364(6432), 56?58. https://doi.org/ 10.1038/364056a0
Pal, S., amp; Hilbe, C. (2022). Reputation effects drive the joint evolution of cooperation and social rewarding. Nature Communications, 13, 5928. https://doi.org/10.1038/s41467- 022-33551-y
Park, S. A., Sestito, M., Boorman, E. D., amp; Dreher, J.-C. (2019). Neural computations underlying strategic social decision-making in groups. Nature Communications, 10, 5287. https://doi.org/10.1038/s41467-019-12937-5
Rigoux, L., Stephan, K. E., Friston, K. J., amp; Daunizeau, J. (2014). Bayesian model selection for group studies— revisited. Neuroimage, 84, 971?985. https://doi.org/10.1016/ j.neuroimage.2013.08.065
Rilling, J. K., Gutman, D. A., Zeh, T. R., Pagnoni, G., Berns, G. S., amp; Kilts, C. D. (2002). A neural basis for social cooperation. Neuron, 35(2), 395?405. https://doi.org/10. 1016/S0896-6273(02)00755-9
Rusch, T., Steixner-Kumar, S., Doshi, P., Spezio, M., amp; Gl?scher, J. (2020). Theory of mind and decision science: Towards a typology of tasks and computational models. Neuropsychologia, 146, 107488. https://doi.org/10.1016/ j.neuropsychologia.2020.107488
Sanfey, A. G., Rilling, J. K., Aronson, J. A., Nystrom, L. E., amp; Cohen, J. D. (2003). The neural basis of economic decision- making in the ultimatum game. Science, 300(5626), 1755?1758. https://doi.org/10.1126/science.1082976
Schwarz, G. (1978). Estimating the dimension of a model. Annals of Statistics, 6(2), 461?464.
Sorgi, K. M., amp; van’t Wout, M. (2016). The influence of cooperation and defection on social decision making in depression: A study of the iterated Prisoner's Dilemma Game. Psychiatry Research, 246, 512?519. https://doi.org/ 10.1016/j.psychres.2016.10.025
Stallen, M., Smidts, A., amp; Sanfey, A. G. (2013). Peer influence: neural mechanisms underlying in-group conformity. Frontiers in Human Neuroscience, 7, 50. https://doi.org/ 10.3389/fnhum.2013.00050
Tamir, D. I., amp; Hughes, B. L. (2018). Social rewards: from basic social building blocks to complex social behavior. Perspectives on Psychological Science, 13(6), 700?717. https://doi.org/10.1177/1745691618776263
Tang, H., Li, X., Wei, Y., Li, X., Chen, L., amp; Zhang, Y. (2022). The impact of partner choice on cooperative behavior and its mechanisms. Advances in Psychological Science, 30(10), 2356. https://doi.org/10.3724/SP.J.1042.2022.02356
[唐輝, 李鑫宇, 魏一帆, 李曉彩, 陳柳燕, 張曜. (2022). 伙伴選擇對合作行為的影響作用與機(jī)制. 心理科學(xué)進(jìn)展, 30(10), 2356?2371. https://doi.org/10.3724/SP.J.1042.2022. 02356]
van Baar, J. M., Chang, L. J., amp; Sanfey, A. G. (2019). The computational and neural substrates of moral strategies in social decision-making. Nature Communications, 10, 1483. https://doi.org/10.1038/s41467-019-09161-6
Wilson, R., amp; Collins, A. (2019). Ten simple rules for the computational modeling of behavioral data. eLife, 8, e49547. https://doi.org/10.7554/eLife.49547
Wu, H., Liu, X., Hagan, C. C., amp; Mobbs, D. (2020). Mentalizing during social InterAction: A four component model. Cortex, 126, 242?252. https://doi.org/10.1016/ j.cortex.2019.12.031
A cognitive computational mechanism for mutual cooperation:
The roles of positive expectation and social reward
WU Xiaoyan1, FU Hongyu1, ZHANG Tengfei1, BAO Dongqi2, HU Jie3,
ZHU Ruida4, FENG Chunliang5, GU Ruolei6,7, LIU Chao1
(1 State Key Laboratory of Cognitive Neuroscience and Learning, Beijing Normal University, Beijing 100875, China)
(2 Zurich Center for Neuroeconomics, Department of Economics, University of Zurich, Zurich 8006, Switzerland)
(3 Shanghai Key Laboratory of Mental Health and Psychological Crisis Intervention, School of Psychology and Cognitive Science,
East China Normal University, Shanghai 200062, China)
(4 Department of Psychology, Sun Yat-sen University, Guangzhou 510006, China)
(5 School of Psychology, South China Normal University, Guangzhou 510631, China)
(6 CAS Key Laboratory of Behavioral Science, Institute of Psychology, Beijing 100101, China)
(7 Department of Psychology, University of Chinese Academy of Sciences, Beijing 100049, China)
Abstract
People usually exhibit conditional cooperative behavior during cooperation; that is, they cooperate only when they expect others will cooperate as well. The cognitive computations and the dynamic processes underlying such conditional cooperation in repeated interactions remain underexplored. To this end, this study investigates the cognitive mechanisms behind conditional cooperation, focusing on two hidden mental variables: positive expectation (participants’ expected cooperation willingness of the partner) and the perception of social reward (additional reward derived from reciprocity).
Using a repeated aversion of Prisoner's Dilemma Game (PDG), we conducted two experiments (n = 134 in Experiment 1 and n = 104 in Experiment 2) in this study. Nonsocial context (playing PDG with a computer program) was created to test if the effects are specific to social context (playing PDG with a supposed human partner). By manipulating partners' cooperation probabilities and response variability, we explored how positive expectation and social reward evolve during cooperation and to affect participants’ behavioral outputs. We systematically developed six models to model participants’ decision process during PDG. These models range from baseline model with random choice assumption (Model 1) to more complex formulations incorporating reward-based learning (Model 2), rational choice theory (Model 3), social reward (Model 4), and the integration of different learning rules (Models 5 to 6).
The results of two experiments consistently demonstrated that participants dynastically adjust their cooperation decisions in response to their partners' behaviors. After separating the effects that may be brought by the partner's cooperation probability from those of response vocality, we found that participants' cooperation increases with their partner’s increased cooperative behaviors, rather than with the partner's response volatility, an effect specific to social context. Model comparisons showed that participants' behaviors in both social and nonsocial contexts were best described by a model assuming social rewards and incorporating a learning algorithm that includes both first-order beliefs (based solely on others' past behavior) and second-order beliefs (considering both others' past behavior and the influence of their own behavior on others) to update their expectations of their partners' cooperation. The results indicated that increasing conditional cooperation is driven by both participants' positive expectation and social reward, effects that were specific to a social context.
This study elucidated the cognitive computational dynamics of conditional cooperation, highlighted the roles of positive expectation and social reward, and showed that people applied a complex model with both first-order and second-order beliefs to update their expectations of their partner’s willingness to cooperate. These contributions underscore the importance of understanding the mental processes that encourage mutual cooperation. Future studies might explore the neural correlates of these mechanisms or apply these insights to more complex scenarios, bridging the gap between laboratory research findings and real-world collaboration.
Keywords" conditional cooperation, social reward, positive expectation, cognitive computational modeling, belief update
補(bǔ)充材料
第一部分: 補(bǔ)充方法
模型比較
模型1: 基線模型。該模型假設(shè)被試在任務(wù)中作出的合作選擇是一個固定的概率。對于每個被試, 通過以下函數(shù)計算對數(shù)似然:
(1)
這里的p是一個自由參數(shù), 表示被試的合作率, 可以在不同受試者之間有所不同。
模型2: 獎勵學(xué)習(xí)模型。該模型假設(shè)人們通過收益獎勵來強(qiáng)化他們當(dāng)前的行為。被試分別比較選擇合作和背叛兩個選擇的預(yù)期值, 期望值會在每個試次通過獎勵反饋進(jìn)行更新:
(2)
(3)
其中Vct和Vdt分別表示在時刻t時合作和背叛的期望值。我們將初始期望值設(shè)置為收益矩陣(見正文表1)的均值, 即3。決策由以下方式建模:
(4)
其中q是選擇合作的概率。β是一個反溫度參數(shù), β的值越低, 選擇越分散和變化(β∈[0, 10])。對于每個被試, 通過最大化以下函數(shù)來計算對數(shù)似然:
(5)
其中θ表示自由參數(shù), t表示當(dāng)前試驗(yàn), n是總試驗(yàn)次數(shù)。
模型3: 理性經(jīng)濟(jì)模型。該模型假設(shè)被試的選擇獲得的經(jīng)濟(jì)收益。效用函數(shù)定義如下:
(6)
(7)
其中Uc表示合作的效用, Ud表示背叛的效用。p表示合作的期望概率, 固定為0.5。因此, Ud總是比Uc有更多的貨幣獎勵。
被試的選擇由Softmax函數(shù)建模:
(8)
在這里, q表示選擇合作的概率。通過計算方程(5)來最大化對數(shù)似然以估計參數(shù)。
模型4: 社會獎賞模型。社會獎勵模型假設(shè)被試對合作的重視程度不僅取決于合作所帶來的金錢獎勵, 還取決于來自互惠性的社會獎賞。我們預(yù)測人們可能會因?yàn)榕c合作者的積極互惠而獲得社會獎賞, 由參數(shù)ω表示:
(9)
(10)
其中ω代表社會獎賞。p是合作者的預(yù)期合作概率, 固定為試驗(yàn)中的0.5, 假設(shè)被試不會更新對合作者選擇的信念。
模型5: 帶有一階信念學(xué)習(xí)的社會獎賞模型。先前的研究發(fā)現(xiàn)人們在社會互動中基于預(yù)測誤差以強(qiáng)化學(xué)習(xí)的方式更新他們的信念(2, 3)。該模型假設(shè)人們通過基本的強(qiáng)化學(xué)習(xí)規(guī)則來更新他們對合作者行動的期望:
(11)
其中p表示合作者的合作概率的期望。Pt是合作者在t時刻的行動。Pt = 1表示合作, Pt = 0表示背叛。α代表一階信念更新的學(xué)習(xí)率(α∈[0, 1])。(Pt ? pt)是試驗(yàn)間的預(yù)測誤差, 即合作者的合作行為與被試對合作者的期望之間的差異。被試的選擇由方程(8)建模。使用方程(5)對每個受試者在120次試驗(yàn)中進(jìn)行MLE估計。
模型6: 帶有一階和二階信念學(xué)習(xí)的社會獎賞模型。該模型在模型5的基礎(chǔ)上, 假設(shè)被試對合作者的合作概率的預(yù)期更新過程不僅受到合作者自身行為反饋的影響, 同時也考慮自身的決策對對手的預(yù)期產(chǎn)生影響, 從而影響對手的合作概率。其更新公式如下:
(12)
Pt表示合作者第t個試次中的行為決定, 如果合作Pt = 1, 如果背叛Pt = 0。(Pt ? pt)表示合作者的實(shí)際決策與被試對合作者的預(yù)期之間的差異, 即一階信念的預(yù)期誤差。α∈[0, 1] 是用于更新一階信念的預(yù)期誤差的權(quán)重, 稱為一階學(xué)習(xí)率。Qt 代表被試在第t個試次中的行動決定, 如果合作Qt = 1, 如果背叛Qt = 0。(Qt ? )表示二階信念預(yù)期誤差。κ∈[0, 1]是更新二階信念預(yù)期誤差的學(xué)習(xí)率。 表示被試在第t個試次中從合作者的角度推測自己的合作概率。即被試試圖從合作者的視角去推測他們關(guān)于我的合作概率的推測。社會決策研究通常將其稱之為“二階信念”(Hill et al., 2017)。其形式由被試的合作概率方程(8)推導(dǎo)所得:
首先, 將Ud和Uc代入公式后得到:
(13)
根據(jù)這一公式, 我們得到pt關(guān)于qt 的關(guān)系式:
(14)
由此, 我們假定對手也應(yīng)用同樣的模型, 即相同的主觀價值函數(shù), 那么該公式也適用于對手用來推測被試自己的合作概率。由此我們得到:
(15)
我們分別對社會和非社會情景下的被試行為進(jìn)行了擬合。在相同情景下, 我們針對不同實(shí)驗(yàn)條件擬合了自由參數(shù), 假設(shè)被試在不同條件下采用不同參數(shù)進(jìn)行認(rèn)知計算和決策。實(shí)驗(yàn)1中, 我們分別在高合作概率和低合作概率條件下擬合了自由參數(shù)。實(shí)驗(yàn)2中, 同樣分別對社會和非社會情景下的行為進(jìn)行了擬合, 并在同一情景下的變動和穩(wěn)定條件下擬合了自由參數(shù)。逆溫系數(shù)在同一情景的所有條件下保持不變, 代表個體對價值差異的敏感性或決策隨機(jī)程度。我們認(rèn)為在相同情景的不同子條件下, 這些參數(shù)不應(yīng)發(fā)生劇烈變化。另外, 我們發(fā)現(xiàn), 在不同實(shí)驗(yàn)條件下使用相同參數(shù)值的模型與分別擬合自由參數(shù)的模型相比, 表現(xiàn)更佳。
模型恢復(fù)
模型恢復(fù)分析旨在評估最優(yōu)模型與其他候選模型在區(qū)分能力和預(yù)測準(zhǔn)確性方面的表現(xiàn)。分析包括以下步驟: 首先, 利用各模型參數(shù)生成模擬數(shù)據(jù)。然后, 所有模型在生成的模擬數(shù)據(jù)上進(jìn)行擬合, 競爭解釋數(shù)據(jù)能力。采用BIC評估每個模型的擬合優(yōu)度, 并驗(yàn)證其是否能準(zhǔn)確識別出“真實(shí)”模型。該過程重復(fù)100次, 將每次提供最佳解釋的模型標(biāo)記為1, 否則為0。通過計算標(biāo)記為1的次數(shù)占總次數(shù)的比例, 得出模型恢復(fù)的概率。分析結(jié)果顯示, 模型6在提供最佳解釋方面表現(xiàn)優(yōu)異, 其概率為0.79 (見圖2b)。
參數(shù)恢復(fù)
我們進(jìn)行了參數(shù)恢復(fù)分析, 以評估模型6的過度擬合情況和參數(shù)的可靠性(見附圖2)。該分析旨在評估認(rèn)知模型參數(shù)估計的準(zhǔn)確性和可靠性。我們首先基于被試的行為數(shù)據(jù)擬合模型, 將得到的參數(shù)視為真值。然后, 利用這些真值預(yù)測被試行為, 在模型和實(shí)驗(yàn)設(shè)計條件下生成虛擬數(shù)據(jù)。重新擬合虛擬數(shù)據(jù)后, 通過計算真值與恢復(fù)值的相關(guān)系數(shù)來評估參數(shù)恢復(fù)效果。高相關(guān)性表明所用模型和參數(shù)估計方法能可靠地反映被試的認(rèn)知過程, 確保模型預(yù)測的準(zhǔn)確性。結(jié)果顯示, 所有參數(shù)真值與恢復(fù)值的皮爾遜相關(guān)系數(shù)均超過0.7, 證明模型能有效區(qū)分參數(shù), 無冗余或過度擬合。
模型預(yù)測與驗(yàn)證
為檢驗(yàn)預(yù)期和社會獎賞對被試合作行為的影響, 我
們進(jìn)行了模擬分析。首先, 我們創(chuàng)建了一位虛擬被試, 其自由參數(shù)值來自實(shí)驗(yàn)1所有被試的均值。在預(yù)期模擬分析中, 我們將被試的預(yù)期(pt)分別設(shè)為0、0.2、0.4、0.6、0.8、1.0, 并觀察其對合作概率的影響。結(jié)果顯示, 隨著預(yù)期的增加, 被試的合作概率相應(yīng)提高(附圖4a)。在社會獎賞模擬分析中, 我們將被試的預(yù)期保持為全程0.5, 其他參數(shù)值與實(shí)驗(yàn)1所有被試的均值相同, 然后通過改變社會獎賞參數(shù)(ω)從0至10, 以2為步長觀察其對合作概率的影響。結(jié)果顯示, 隨著社會獎賞的增加, 合作概率也相應(yīng)提高(附圖4b)。
為評估模型6是否能準(zhǔn)確捕捉被試行為, 我們將模型預(yù)測數(shù)據(jù)與實(shí)際行為數(shù)據(jù)進(jìn)行了對比(見附圖1和附圖6), 并執(zhí)行了統(tǒng)計分析。具體操作中, 我們在實(shí)驗(yàn)1 (見附表3)與實(shí)驗(yàn)2 (見附表7)的廣義線性混合模型的基礎(chǔ)上, 加入了另一個自變量“prediction”。此變量為二分類變量, 預(yù)測行為標(biāo)記為1, 實(shí)際行為標(biāo)記為0。通過該模型中prediction變量的效應(yīng)分析, 我們可以評估預(yù)測行為與實(shí)際行為間的潛在偏差。實(shí)驗(yàn)1的結(jié)果顯示, “prediction”變量的主效應(yīng)(β = ?0.03, 95% CI = [?0.14, 0.07], p = 0.536)以及所有交互效應(yīng)均不顯著(cooperation probability×prediction: β = 0.06, 95% CI = [?0.07, 0.20], p = 0.378; scenario×prediction: β = ?0.05, 95% CI = [?0.18, 0.08], p = 0.487; cooperation probability×scenario× prediction: β = 0.01, 95% CI = [?0.17, 0.20], p = 0.875)。
實(shí)驗(yàn)2的結(jié)果顯示, “prediction”變量的主效應(yīng)(β = 0.06, 95% CI = [?0.06, 1.18], p = 0.322)以及所有交互效應(yīng)均不顯著(prediction ×probability: β = 0.05, 95% CI = [?0.12, 0.22], p = 0.546; volatility×prediction: β = ?0.07, 95% CI = [?0.22, 0.07], p = 0.321; probability×volatility× prediction: β =0.02, 95% CI=[?0.19, 0.22], p = 0.994; probability×scenario×prediction: β = 0.06, 95% CI = [?0.14, 0.27], p = 0.551; volatility×scenario×prediction: β = 0.03, 95% CI = [?0.17, 0.24], p = 0.748; probability× volatility×scenario×prediction: β = ?0.02, 95% CI = [?0.31, 0.26], p = 0.887), 這包括prediction×scenario交互項(xiàng)的效應(yīng)也不顯著(β = ?0.06, 95% CI = [?0.20, 0.08], p = 0.418)。這些結(jié)果顯示, 認(rèn)知計算模型所預(yù)測的合作行為與我們實(shí)際觀測到的合作行為在統(tǒng)計學(xué)上沒有差異, 表明我們的模型預(yù)測很好地預(yù)測了被試的決策。
第二部分: 附加圖片
附圖1" 實(shí)驗(yàn)1模型預(yù)測。左側(cè)圖片展示了社會條件下被試的合作概率(黃色實(shí)線)和最優(yōu)模型預(yù)測合作概率(黑色實(shí)線)。右側(cè)圖片展示非社會條件下被試的合作概率(藍(lán)色實(shí)線)和最優(yōu)模型的預(yù)測合作概率(黑色實(shí)線)。陰影部分展示模型預(yù)測的合作概率的95%的置信區(qū)間。橫坐標(biāo)為試次數(shù), 縱坐標(biāo)為p (cooperation)表示所有被試的平均合作概率。上圖和下圖分別表示不同的順序, 上圖為伙伴的合作概率從高概率到低概率而下圖為伙伴的合作概率從低概率到高概率。
附圖2" 參數(shù)恢復(fù)(parameter recovery)。a-g為實(shí)驗(yàn)1的參數(shù)恢復(fù), h-n為實(shí)驗(yàn)2的參數(shù)恢復(fù)。圖中每個點(diǎn)代表每個被試, 線條為線性擬合, 陰影部分為95%的置信區(qū)間。r值為皮爾遜相關(guān)系數(shù)。
附圖3" 實(shí)驗(yàn)1被試對合作者的合作概率的動態(tài)期望。左圖右圖分別展示在社會條件(黃色實(shí)線)和非社會條件(藍(lán)色實(shí)線)下, 被試對合作者的合作概率的動態(tài)期望變化。黑色虛線表示合作者的真實(shí)合作概率。上下圖片表示不同的順序, 分別是合作者的行為從高概率轉(zhuǎn)為低概率, 以及從低概率轉(zhuǎn)為高概率。
附圖4" 模擬分析。圖a展示預(yù)期從低(左)倒高(右)的變化對個體合作行為的提升。圖b展示社會獎賞從小(左)到大(右)對個體合作行為的提升。
附圖5" 實(shí)驗(yàn)1的社會獎賞與親社會人格相關(guān)性分析。橫軸代表個體在社會價值取向問卷上的得分, 得分較低表示個體更加自利, 不太考慮他人利益, 而得分較高則表明個體更加利他??v軸顯示了優(yōu)選模型中的社會獎賞參數(shù)值, 左圖(右圖)展示的是在社會(非社會)條件下個體的社會獎賞參數(shù)值。通過皮爾遜相關(guān)分析探究了二者之間的關(guān)系。圖中, 每個灰色點(diǎn)代表一名被試在這兩個維度上的數(shù)據(jù), 藍(lán)色線表示二者之間的線性關(guān)系擬合。
附圖6" 實(shí)驗(yàn)2被試對合作者的合作概率的動態(tài)期望。左側(cè)圖片展示了社會條件下被試的合作概率(黃色實(shí)線)和最優(yōu)模型預(yù)測合作概率(黑色實(shí)線)。右側(cè)圖片展示非社會條件下被試的合作概率(藍(lán)色實(shí)線)和最優(yōu)模型的預(yù)測合作概率(黑色實(shí)線)。陰影部分展示模型預(yù)測的合作概率的95%的置信區(qū)間。橫坐標(biāo)為試次數(shù), 縱坐標(biāo)為p (cooperation)表示所有被試的平均合作概率。上圖和下圖分別表示不同子條件, 第一行和第二行的圖片為伙伴的合作行為為低概率(low probability), 第三行和第四行的圖片為伙伴的合作行為為高概率(high probability)。第1行和第3行為先穩(wěn)定再變動(stable-volatile), 而第2行和第4行為伙伴的合作概率先變動再穩(wěn)定(volatile-stable)。
附圖7" 實(shí)驗(yàn)2被試對合作者的合作概率的期望的動態(tài)更新過程。左右圖分別展示在社會條件(黃色實(shí)線)和非社會條件(藍(lán)色實(shí)線)下被試對合作者的合作概率的動態(tài)期望變化。黑色虛線表示合作者的真實(shí)合作概率。社會條件和非社會條件縱向的四張圖片分別代表不同的實(shí)驗(yàn)子條件, 從上至下分別為低概率?先穩(wěn)定再變動、低概率?先穩(wěn)定再變動、高概率?先穩(wěn)定再變動、高概率?先變動再穩(wěn)定。
第三部分: 附加表格
附表1: 實(shí)驗(yàn)1的模型比較
Model Task Number of parameters Mean BIC PEP
Model 1 Social 1 151.19 0.00%
Model 2 Social 2 152.85 0.00%
Model 3 Social 1 156.37 0.00%
Model 4 Social 3 147.46 0.00%
Model 5 Social 5 137.59 0.00%
Model 6 Social 7 128.32 100.00%
Model 1 Non-social 1 115.94 0.00%
Model 2 Non-social 2 111.72 0.07%
Model 3 Non-social 1 117.38 0.00%
Model 4 Non-social 3 116.21 0.00%
Model 5 Non-social 5 108.00 0.00%
Model 6 Non-social 7 100.83 93.00%
附表2: 最優(yōu)模型的自由參數(shù)
scenario parameter Mean ± SD
Experiment 1 social αhigh 0.23 ± 0.27 (95% CI = 0.18, 0.27)
αlow 0.26 ± 0.24 (95% CI = 0.22, 0.30)
κhigh 0.33 ± 0.28 (95% CI = 0.28, 0.38)
κlow 0.37 ± 0.21 (95% CI = 0.34, 0.41)
ωhigh 4.57 ± 1.97 (95% CI = 4.24, 4.90)
ωlow 3.19 ± 1.38 (95% CI = 2.96, 3.42)
β 1.93 ± 2.05 (95% CI = 1.59, 2.28)
nonsocial αhigh 0.32 ± 0.25 (95% CI = 0.28, 0.36)
αlow 0.31 ± 0.22 (95% CI = 0.28, 0.35)
κhigh 0.34 ± 0.25 (95% CI = 0.30, 0.38)
κlow 0.30 ± 0.22 (95% CI = 0.27, 0.34)
ωhigh 2.83 ± 1.80 (95% CI = 2.53, 3.13)
ωlow 3.12 ± 1.57 (95% CI = 2.85, 3.38)
β 3.03 ± 2.69 (95% CI = 2.58, 3.49)
Experiment 2 High probability group social αstable 0.43 ± 0.27 (95% CI = 0.35, 0.50)
αvolatile 0.43 ± 0.25 (95% CI = 0.37, 0.50)
κstable 0.24 ± 0.21 (95% CI = 0.18, 0.30)
κvolatile 0.28 ± 0.23 (95% CI = 0.22, 0.34)
ωstable 4.32 ± 1.65 (95% CI = 3.87, 4.76)
ωvolatile 4.38 ± 1.48 (95% CI = 3.98, 4.78)
β 2.33 ± 2.05 (95% CI = 1.77, 2.89)
nonsocial αstable 0.35 ± 0.25 (95% CI = 0.29, 0.42)
αvolatile 0.35 ± 0.25 (95% CI = 0.28, 0.42)
κstable 0.29 ± 0.22 (95% CI = 0.23, 0.35)
κvolatile 0.28 ± 0.21 (95% CI = 0.23, 0.34)
ωstable 3.55 ± 1.33 (95% CI = 3.19, 3.91)
ωvolatile 3.72 ± 1.39 (95% CI = 3.34, 4.09)
β 2.32 ± 1.00 (95% CI = 2.04, 2.59)
Low probability group social αstable 0.37 ± 0.25 (95% CI = 0.30, 0.44)
αvolatile 0.40 ± 0.19 (95% CI = 0.34, 0.45)
κstable 0.30 ± 0.22 (95% CI = 0.24, 0.36)
κvolatile 0.27 ± 0.19 (95% CI = 0.22, 0.32)
ωstable 3.70 ± 0.94 (95% CI = 3.44, 3.95)
ωvolatile 3.92 ± 0.93 (95% CI = 3.67, 4.17)
β 1.93 ± 0.89 (95% CI = 1.69, 2.18)
nonsocial αstable 0.30 ± 0.22 (95% CI = 0.24, 0.36)
αvolatile 0.33 ± 0.23 (95% CI = 0.27, 0.39)
κstable 0.33 ± 0.24 (95% CI = 0.26, 0.39)
κvolatile 0.30 ± 0.19 (95% CI = 0.24, 0.35)
ωstable 3.05 ± 1.42 (95% CI = 2.66, 3.43)
ωvolatile 2.99 ± 1.46 (95% CI = 2.59, 3.39)
β 2.41 ± 1.89 (95% CI = 1.90, 2.92)
附表3: 實(shí)驗(yàn)1中以被試選擇為因變量的廣義線性混合模型效應(yīng)
Fixed effects Estimated beta value SE t value p value
(Intercept) ?1.43 0.43 ?3.32 p lt; 0.001
cooperation probability ?0.24 0.06 ?3.83 p lt; 0.001
order 0.002 0.08 0.02 p = 0.983
subject’s choice t-1 1.38 0.03 43.04 p lt; 0.001
subject’s choice t-2 0.63 0.03 18.60 p lt; 0.001
subject’s choice t-3 0.22 0.03 6.62 p lt; 0.001
partner’s choice t-1 0.50 0.03 15.64 p lt; 0.001
partner’s choice t-2 0.05 0.03 1.69 p = 0.090
partner’s choice t-3 ?0.05 0.03 ?1.49 p = 0.136
scenario 1.19 0.09 12.68 p lt; 0.001
gender ?0.15 0.08 ?1.78 p = 0.076
age ?0.03 0.02 ?1.52 p = 0.128
cooperation probability ×scemario ?0.52 0.06 ?8.20 p lt; 0.001
附表4: 實(shí)驗(yàn)1中以社會獎賞為因變量的線性混合模型效應(yīng)
Fixed effects Estimated beta value SE t value p value
(Intercept) 3.91 0.76 5.11 p lt; 0.001
cooperation probability 0.28 0.17 1.65 p = 0.100
order 0.06 0.14 0.43 p = 0.668
scenario 1.70 0.17 10.13 p lt; 0.001
gender ?0.28 0.17 ?1.71 p = 0.088
age ?0.04 0.04 ?1.21 p = 0.226
cooperation probability ×scemario ?1.67 0.22 ?7.68 p lt; 0.001
附表5: 實(shí)驗(yàn)1中以期望為因變量的線性混合模型效應(yīng)
Fixed effects Estimated beta value SE t value p value
(Intercept) 0.18 0.08 2.24 p = 0.025
cooperation probability ?0.03 0.01 ?2.43 p = 0.015
order 0.02 0.02 0.91 p = 0.365
subject's choice t-1 0.07 0.003 22.03 p lt; 0.001
subject’s choice t-2 0.04 0.004 12.16 p lt; 0.001
subject’s choice t-3 0.03 0.003 9.11 p lt; 0.001
partner’s choice t-1 0.22 0.003 77.03 p lt; 0.001
partner’s choice t-2 0.06 0.003 20.13 p lt; 0.001
partner’s choice t-3 0.04 0.003 12.54 p lt; 0.001
scenario 0.20 0.02 10.86 p lt; 0.001
gender ?0.002 0.02 ?0.10 p = 0.919
age ?0.001 0.003 ?0.50 p = 0.619
cooperation probability ×scemario ?0.17 0.01 ?30.63 p lt; 0.001
附表6: 實(shí)驗(yàn)2的模型比較
Model Task Number of parameters Mean BIC PEP
Model 1 Social 1 194.80 0.00%
Model 2 Social 2 196.59 0.00%
Model 3 Social 1 220.54 0.00%
Model 4 Social 3 151.31 0.00%
Model 5 Social 5 201.36 0.02%
Model 6 Social 7 140.21 98.00%
Model 1 Non-social 1 170.76 0.00%
Model 2 Non-social 2 164.91 0.00%
Model 3 Non-social 1 179.03 0.00%
Model 4 Non-social 3 173.86 0.00%
Model 5 Non-social 5 144.67 0.00%
Model 6 Non-social 7 133.30 100.00%
附表7: 實(shí)驗(yàn)2中以被試選擇為因變量的廣義線性混合模型效應(yīng)
Fixed effects Estimated beta value SE t value p value
(Intercept) ?2.58 0.48 ?5.37 p lt; 0.001
cooperation probability 0.53 0.21 2.53 p = 0.011
volatility ?0.12 0.08 ?1.36 p = 0.174
order 0.07 0.11 0.68 p = 0.498
subject’s choice t-1 1.69 0.04 44.06 p lt; 0.001
subject’s choice t-2 0.65 0.04 16.19 p lt; 0.001
subject’s choice t-3 0.26 0.04 6.98 p lt; 0.001
partner’s choice t-1 2.22 0.04 60.64 p lt; 0.001
partner’s choice t-2 0.33 0.04 8.90 p lt; 0.001
partner’s choice t-3 0.01 0.04 0.23 p = 0.819
scenario 1.20 0.15 8.07 p lt; 0.001
gender ?0.12 0.11 ?1.14 p = 0.253
age ?0.05 0.02 ?2.59 p = 0.010
cooperation probability×volatility 0.16 0.12 1.31 p = 0.192
cooperation probability×scenario 0.89 0.21 ?4.21 p lt; 0.001
volatility×scenario 0.22 0.09 2.39 p = 0.017
cooperation probability×volatility×scenario ?0.17 0.13 ?1.32 p = 0.187
附表8: 實(shí)驗(yàn)2中以社會獎賞為因變量的線性混合模型效應(yīng)
Fixed effects Estimated beta value SE t value p value
(Intercept) 4.62 0.75 6.14 p lt; 0.001
cooperation probability 0.45 0.24 1.90 p = 0.058
volatility ?0.03 0.18 ?0.15 p = 0.884
order ?0.19 0.15 ?1.30 p = 0.193
scenario 1.20 0.20 6.10 p lt; 0.001
gender ?0.38 0.16 ?2.39 p = 0.017
age ?0.06 0.03 ?1.82 p = 0.069
cooperation probability×volatility 0.16 0.26 0.63 p = 0.528
cooperation probability×scenario ?1.08 0.28 ?3.90 p lt; 0.001
volatility×scenario 0.11 0.23 0.50 p = 0.621
cooperation probability×volatility×scenario ?0.05 0.33 ?0.16 p = 0.873
附表9: 實(shí)驗(yàn)2中以期望為因變量的線性混合模型效應(yīng)
Fixed effects Estimated beta value SE t value p value
(Intercept) 0.11 0.06 1.92 p = 0.055
cooperation probability 0.02 0.03 0.60 p = 0.550
volatility ?0.02 0.01 ?1.23 p = 0.218
order ?0.004 0.01 ?0.43 p = 0.667
subject’s choice t-1 0.06 0.004 15.90 p lt; 0.001
subject’s choice t-2 0.03 0.004 7.62 p lt; 0.001
subject’s choice t-3 0.03 0.003 8.15 p lt; 0.001
partner’s choice t-1 0.34 0.003 112.40 p lt; 0.001
partner’s choice t-2 0.09 0.003 28.67 p lt; 0.001
partner’s choice t-3 0.04 0.003 13.85 p lt; 0.001
scenario 0.16 0.02 7.11 p lt; 0.001
gender 0.01 0.02 0.32 p = 0.747
age 0.001 0.002 0.30 p = 0.762
cooperation probability×volatility ?0.002 0.02 ?0.08 p = 0.936
cooperation probability×scenario ?0.16 0.03 ?5.25 p lt; 0.001
volatility×scenario 0.01 0.01 1.63 p = 0.102
cooperation probability×volatility×scenario ?0.02 0.01 ?1.62 p = 0.104
參" 考" 文" 獻(xiàn)
Hill, C. A., Suzuki, S., Polania, R., Moisa, M., O'Doherty, J. P., amp; Ruff, C. C. (2017). A causal account of the brain network computations underlying strategic social behavior. Nature Neuroscience, 20(8), 1142?1149. https://doi.org/10.1038/nn.4602