羅躍嘉,李晉熙,袁 璐
1.成都醫(yī)學院 養(yǎng)老與老年健康協同創(chuàng)新中心(成都 610500);2.深圳大學 深圳市情緒與社會認知科學重點實驗室(深圳 618060);3.成都醫(yī)學院 四川應用心理學研究中心(成都 610500);4.成都醫(yī)學院第一附屬醫(yī)院(成都 610500)
·健康養(yǎng)老校慶專題·
結果預期對結果評價影響的事件相關電位研究*
羅躍嘉1,2,3,李晉熙4,袁 璐1,3Δ
1.成都醫(yī)學院 養(yǎng)老與老年健康協同創(chuàng)新中心(成都 610500);2.深圳大學 深圳市情緒與社會認知科學重點實驗室(深圳 618060);3.成都醫(yī)學院 四川應用心理學研究中心(成都 610500);4.成都醫(yī)學院第一附屬醫(yī)院(成都 610500)
目的采用事件相關電位技術探索結果預期對結果評價影響的腦機制。方法采用金錢激勵延遲任務探測正常個體在情境線索和反饋結果誘發(fā)的N350,反饋負波(feedback-related negativity,FRN)和晚期正成分(late positive complex,LPC)。結果情境線索條件下,獎賞和懲罰線索誘發(fā)的N2波幅相同且均小于零值線索,LPC波幅相同且均大于零值線索;反饋結果條件下,負性反饋結果的FRN波幅均大于正性反饋結果,LPC波幅小于正性反饋結果。結論情境線索下正常個體對獎賞和懲罰線索的敏感程度相同,但反饋結果傾向于對未知結果做積極預期。
結果預期;結果評價;反饋負波;事件相關電位
結果評價(outcome evaluation)是指人們將當前事件的評價為“好”或者“壞”。其實,這個評價不僅決定于事件本身的正、負性及其程度,而且決定于被試對事件結果的預期。也就是說,當人們對未知結果做樂觀預期,事實結果與期望相符或者不符合時將會影響對事實結果的評價,從而誘發(fā)正性或者負性情緒。就目前的研究結果而言,尚不能說明:符合樂觀預期的事實結果一定導致積極情緒,不符合樂觀預期的事實結果一定導致負性情緒。因此,有必要探索結果預期對結果評價影響的腦機制來進一步說明這個問題。
根據“強化學習理論”對結果評價做出的闡述:在結果反饋形成之前,決策者對具體結果會產生自己的心理預期,隨后以這種結果預期為標準,來判斷實際結果的好壞[1]。這個理論指出“預期錯誤信號”,與事件相關電位波幅對應的成分是反饋負波(feedback-related negcltinty,FRN),表示結果預期與實際結果之間的差異。預期結果與實際結果之間差異越大,FRN波幅越大。這個FRN波幅出現在反饋刺激后200~300ms時間窗內。一些研究認為代表損失的負性結果誘發(fā)的FRN總是比正性結果更大。近年來,大量的研究[2-5]結果認為:出乎被試意料的負性結果能夠比意料之內的負性結果誘發(fā)出波幅更大的FRN。也就是說,被試的結果預期與實際結果的背離程度越顯著,FRN的波幅就應該越大[6-7]。因此,當已知反饋結果時,可以根據FRN波幅的大小,反向推測此前被試的預期結果是樂觀還是悲觀[8]。
比FRN時間上更靠后的晚期正成分(late positive complex,LPC)也是在本研究的考察范圍之內。LPC波幅由數個潛伏期、出現時間、持續(xù)時間及心理學意義不同的亞成分組成。這些亞成分多出現在刺激后200~600ms的時間范圍內,可以孤立出現或在時間及空間上相互重疊,主要包括有P3a、P3b、P300及慢波(slow wave, SW)。其中P3a標志著注意驅動過程,伴隨著重新調整不隨意的注意;P3b與選擇性注意與任務相關刺激有關;P300被認為是與結果所誘發(fā)的動機顯著性有關,與結果評價活動的聯系相對來說比較間接[9]。
以往有研究[10-11]采用金錢激勵延遲任務(Monetary Incentive Delay Task,MID)任務考察零值、獎賞和懲罰情境下的FRN波幅來推測正常個體的結果評價和預期。例如,一項研究采用MID任務調查了正常個體在零效價結果時的FRN,發(fā)現獎賞和懲罰情境下的結果誘發(fā)的FRN波幅相同且均小于零值情境[12]。另外一項研究[13]也同樣發(fā)現獎賞情境和懲罰情境下的負性反饋結果誘發(fā)的FRN波幅沒有差異。因此,本研究假設,獎賞和懲罰情境可以增強結果預期,特別是增強避免懲罰和贏得獎賞(正性結果)的預期,當現實結果為懲罰或者是去獎賞(負性反饋)時,FRN的波幅增強。與此相對應,對于線索條件誘發(fā)的LPC波幅,本研究認為獎賞和懲罰線索誘發(fā)的LPC比零值線索更大。
1.1測量工具
抑郁自評量表(SDS)含有20個項目,分為4級評分,標準得分為總分×1.25后取整,標準得分<50 無抑郁,50~59輕度抑郁,60~69中重度抑郁,≥70重度抑郁。焦慮自評量表(SAS)含有21個項目,分為4級評分:標準得分的分界值為50,50~59輕度焦慮,60~69中度焦慮,70以上重度焦慮。
1.2研究對象
本研究采用SDS和SAS對300名在校學生進行問卷測試,并與符合標準的被試預約問卷測試后一周時間內進行腦電實驗。
入組標準:SDS 標準得分<50,SAS標準得分<50。年齡18~25歲,智力正常,視力或矯正視力良好,右利手。排除標準:(1)任何醫(yī)學疾病,包括神經疾病(例如中風,癲癇),精神疾病(例如抑郁癥,精神分裂癥),學習障礙(例如閱讀障礙,運動障礙);(2)腦損傷或腦震蕩;(3)使用影響中樞系統的藥物;(4)藥物濫用史;(5)日常使用尼古丁;(6)懷孕。所有被試均得到一定的實驗報酬并簽署知情同意書。
按照SDS和SAS量表進行篩選之后,得到符合ERP實驗設計要求的被試共20人。最終去掉因壞電極點而致的信噪比過大的被試1人,對19人的結果進行了測量和統計,其中男生9人,女生10人,平均年齡為23.60歲。
1.3實驗設計
本研究采用情境類型的被試內設計,3種情境線索為被試內變量,有3個水平,分別為零值情境線索、獎賞情境線索和懲罰情境線索。
1.4實驗任務
MID任務由3個情境組成:零值情境、獎賞情境和懲罰情境。每個情境包含線索刺激、靶目標和結果呈現。被試首先看到一個線索刺激信息,之后當屏幕中央出現靶目標“白色方塊”時迅速按“空格”鍵擊中白色方塊,之后屏幕會給出做對或做錯信息的行為結果反饋。
這個任務將在3個獨立的情境區(qū)組進行,每個區(qū)組包含1種情境線索(零值、獎賞和懲罰之一)和1種與金錢無關的填充線索。零值、獎勵和懲罰情境線索分別代表3種不同的金錢分配規(guī)則,填充線索代表無論是否擊中白色方塊都不影響金錢得失。零值情境中只出現“六邊形”和“梯形”兩種線索:“六邊形”為零值線索,被試在之后擊中或者沒有擊中白色方塊都不得錢也不失錢;“梯形”為填充條件。獎賞情境中只出現“菱形”和“圓形”,“菱形”為獎賞情境線索,表示擊中白色方塊則得錢,每次兩元,未擊中不得錢;“圓形”為填充條件。懲罰情境只出現“五邊形”和“三角形”,“五邊形”為懲罰情境線索,表示未擊中白色方塊則會被扣錢,每次扣兩元,擊中則避免扣錢;“三角形”為填充線索。由此,每個情境線索各匹配一個與金錢無關的填充線索,使各情境分別獨立成為1個block,每個block只包含1種情境線索和對應的1種填充線索,其中情境線索180個,填充線索720個,一個block共計 900個試次。值得注意的是,情境線索與填充線索出現的比例為1∶4,且情境線索不連續(xù)出現,避免了被試對情境線索的預期和練習效應。為了增加被試的信任度,靶刺激(白色方塊)的呈現時間依據每個被試的平均反應時和按鍵正確率進行調整:第一個試次靶刺激呈現時間為被試在練習中的平均反應時,設置反應正確率為60%,正確率大于或小于這個值則下次試次呈現時間縮短或增加10%呈現時間。這種方法可使被試擊中和未擊中試次接近。線索出現順序為隨機。
1.5實驗程序
MID任務采用心理學專業(yè)E-Prime 2.0軟件編制(如圖1),刺激呈現于17寸純平顯示器上。確保被試清楚實驗任務及要求后端坐在屏幕前方100 cm位置,水平和垂直視角均在7°以內,屏幕背景為黑色。正式實驗開始前,主試指導被試完成45個練習試次,并記錄被試的平均按鍵反應時。練習試次不計入總金額。每個情境開始前,屏幕將提示被試在接下來進行的情境中出現的線索圖形及含義。刺激呈現流程如圖2所示,屏幕首先出現“next trail”持續(xù)800 ms提醒被試這個試次開始,隨后屏幕中央將會出現一個藍色幾何圖形,持續(xù)1 200 ms,之后出現1 200~2 500 ms的“+”,之后屏幕中央將出現一個白色方塊,呈現時間依據被試的平均反應時和正確率調整。若被試在500 ms的反應時間內按鍵視為有效反應,500 ms的空屏之后,電腦屏幕將給出此次行為結果反饋。若在靶刺激呈現時間范圍內按鍵,則為擊中靶目標,紅色豎線將落在左邊綠色方格;若超出靶刺激呈現時間,則為未擊中,紅色豎線落在右邊3黃色方格;顏色在被試內平衡。若超過500 ms的反應時間未按鍵或者在白色方塊出來之前按鍵(搶按)則視為無效試次,反饋結果的紅色豎線將位于最右側。500 ms的空屏之后刺激由E-Prime 2.0 軟件呈現。
圖1 刺激呈現序列圖
圖2 3種情境線索刺激誘發(fā)的N2波形圖(FZ點)
被試被告知擁有30元底金參與游戲,并在獎賞情境中盡量去掙錢,在懲罰情境中盡量避免扣錢,使累計總金額達最大。實驗開始前被試將進行45個練習試次,并記錄被試按鍵的平均反應時。實驗開始后首先進行零值情境、獎賞情境和懲罰情境順序在被試內平衡。參與者完成MID任務,記錄被試的腦電波。
1.6數據采集
使用E-Prime 2.0 軟件記錄被試的行為表現結果,使用Neuroscan ERP系統記錄EEG信號,采用國際腦電圖學會標定的10-20擴展電極位置系統的Ag/AgCl 64導電極帽。頭皮阻抗小于5 kΩ,參考電極為左側乳突,離線分析時轉參考電極為雙側乳突平均值。雙眼外眥安置水平眼電(HEOG),左眼框上下各1 cm處正中安置垂直眼電(VEOG)。濾波帶通為0.05~100 Hz,連續(xù)采樣,采樣頻率為500 Hz。
分析線索刺激和反饋結果刺激出現時誘發(fā)的ERPs,截取刺激出現前200 ms到刺激出現后2000 ms的分析時程(epoch),去除眨眼偽跡。疊加前剔除無效試次和波±50 μV之外的試次。對EEG進行分類疊加,分別檢測情境線索(零值情境線索、獎賞情境線索、懲罰情境線索)和結果反饋引發(fā)的900 ms時間窗內的ERP成分。采用平均波幅進入之后的數據分析。
1.7數據分析
對于線索刺激引發(fā)的腦電數據,首先計算中線上(Fz、FCz、Cz、CPz、Pz、POz、Oz)波幅最大電極點。采用最大電極點波幅進行單因素(情境線索:零值線索、獎賞線索、懲罰線索)ANOVA分析。對于結果反饋刺激引發(fā)的腦電數據,使用同樣的方法:首先計算中線上(Fz、FCz、Cz、CPz、Pz、POz、Oz)波幅最大的電極點,采用最大電極點波幅進行3(情境線索:零值線索、獎賞線索、懲罰線索)× 2(結果效價:正性、負性)ANOVA分析。交互效應采用簡單效應分析的方法。主效應事后檢驗采用LSD法,必要時采用Greenhouse-Geisser方法進行校正。采用SPSS 23.0軟件(SPSS, Inc., Chicago, IL)進行統計分析。檢驗水準α除特別說明外均設定為0.05。
2.1線索刺激誘發(fā)的N2波幅
2.2線索刺激誘發(fā)的LPC波幅
情境線索誘發(fā)的LPC波幅,時間窗為350~600 ms,中線上波幅最大電極點為PZ點,平均波幅為6.581 μV,其他電極點均與PZ點差異有統計學意義。采用PZ的平均波幅對情境類型(零值情境、獎賞情境、懲罰情境)進行ANOVA分析。
圖3 情境線索誘發(fā)的LPC波形圖(CPZ電極點)
2.3反饋刺激誘發(fā)的FRN波幅
圖4 3種情境下,正負性結果反饋誘發(fā)的FRN波形圖(FZ點)
2.4反饋刺激誘發(fā)的LPC波幅
圖5 不同情境下正、負性反饋結果LPC波形圖(CPZ點)
N2波幅被認為是與早期感覺加工過程、低水平注意分配和晚期刺激評價階段相關的腦電成分[15]。另外也有研究[16]表明N2成分與抑制執(zhí)行功能密切相關,反映個體調用抑制執(zhí)行功能的有效性。也就是說,個體越能夠有效地抑制情緒信息,N2波幅越大。彭家欣等[17]認為:個體能夠有效地抑制對中性刺激的情緒加工, 表現出更大的N2波幅, 而情緒刺激由于占用了個體比較多的注意資源, 因此削弱了對其情緒的加工的抑制, 所以表現出比較小的N2,進而表現為中性刺激誘發(fā)的N2顯著大于情緒刺激。同理,對于本研究中線索條件誘發(fā)的N2波幅,獎賞和懲罰線索(相當于情緒刺激)誘發(fā)的N2波幅相同且比零值線索(相當于中性刺激)更小。這個結果與前人的研究[14]結果相一致,說明個體投入到獎賞和懲罰線索刺激的注意資源更多,削弱了對其情緒的加工抑制,因而誘發(fā)的N2波幅比零值線索更小。除此之外,LPC波幅也被認為是與注意資源投入有關的腦電成分。本研究中獎賞和懲罰情境線索誘發(fā)的LPC波幅相同且均大于零值線索,這個結果同樣說明了被試對于獎賞和懲罰線索更為敏感且增強的程度一致。
對于結果評價階段誘發(fā)的FRN波幅,負性結果FRN波幅均大于正性結果。根據預期錯誤相關負波理論,預期結果與實際結果的差異越大,FRN波幅越大。負性結果誘發(fā)FRN波幅更大,表示負性結果與預期結果的背離程度越大,越不符合預期;相反,正性結果FRN波幅更小,表示正性結果與預期結果更接近,說明被試對未知的結果做正性預期,也就是預期積極的結果[18]。值得一提的是,在零值、獎賞和懲罰3種情境條件下負性結果的FRN波幅均大于正性結果,而負性結果包括了扣錢(懲罰)和不扣錢(獎賞和零值)兩種金錢結果,這說明FRN波幅并不受金錢激勵的影響,而是反應了被試對于未知結果的行為結果(“做對”或者“做錯”)的預期,而不是對未知結果的金錢結果(“得錢”或者“扣錢”)的結果預期[19]。除此之外,3種情境條件下,正性反饋結果的LPC波幅均大于負性結果。同樣也證明了被試在意的是“是否做對”的行為結果而不是金錢結果。因為3種情境下正性結果也包括了得錢(獎賞)和不得錢(懲罰和零值)兩種金錢結果,而這兩種金錢結果的LPC波幅相等。
綜上所述,本研究通過MID任務全面的考察了被試在3種情境設置下的線索刺激和反饋結果刺激誘發(fā)的腦電成分。本研究認為:情境設置下被試對于獎賞和懲罰情境的敏感程度相同,但在反饋結果下對于未知結果傾向于做積極的結果預期。以往一些研究認為:正常個體在獎賞和懲罰情境線索下的反應時相同且快于零值情境。然而,另外一些研究則得出獎賞線索的反應時快于懲罰線索。除此之外,未來的研究還可以對影響結果預期的其他因素進行探索,例如情緒特質(抑郁、焦慮)和人格維度(自尊、自戀等)。從社會性特質這一熱點問題的角度出發(fā),采用MID任務研究不同人格特質群體在零值、獎賞、懲罰3種不同效價情境下的結果評價階段的腦電和行為反應,探討上訴的不同人格和情緒特質群體在行為和腦電結果上的差異,可以說明被試對于獎懲的動機,繼而研究得失平衡相關問題。
[1]Holroyd C B, Krigolson O E. Reward prediction error signals associated with a modified time estimation task[J]. Psychophysiology, 2007, 44(6): 913-917.
[2]Holroyd C B, Hajcak G, Larsen J T. The good, the bad and the neutral: electrophysiological responses to feedback stimuli[J]. Brain Res, 2006, 1105(1): 93-101.
[3]Holroyd C B, Pakzad-Vaezi K L, Krigolson O E. The feedback correct-related positivity: sensitivity of the event-related brain potential to unexpected positive feedback[J]. Psychophysiology, 2008, 45(5): 688-697.
[4]Gu R, Lei Z, Broster L,etal. Beyond valence and magnitude: a flexible evaluative coding system in the brain[J]. Neuropsychologia, 2011, 49(14): 3891-3897.
[5]Gu R, Huang Y X, Luo Y J. Anxiety and feedback negativity[J]. Psychophysiology, 2010, 47(5): 961-967.
[6]Nieuwenhuis S, Holroyd C B, Mol N,etal. Reinforcement-related brain potentials from medial frontal cortex: origins and functional significance[J]. Neurosci Biobehav Rev, 2004, 28(4): 441-448.
[7]Brown S, Martinez M J, Parsons L M. The neural basis of human dance[J]. Cereb Cortex, 2006, 16(8): 1157-1167.
[8]Hajcak G, Holroyd C B, Moser J S,etal. Brain potentials associated with expected and unexpected good and bad outcomes[J]. Psychophysiology, 2005, 42(2): 161-170.
[9]Nieuwenhuis S, Aston-Jones G, Cohen J D. Decision making, the P3, and the locus coeruleus-norepinephrine system[J]. Psychol Bull, 2005, 131(4): 510-532.
[10] Knutson B, Fong G W, Adams C M,etal. Dissociation of reward anticipation and outcome with event-related fMRI[J]. Neuroreport, 2001, 12(17): 3683-3687.
[11] Knutson B, Westdorp A, Kaiser E,etal. FMRI visualization of brain activity during a monetary incentive delay task[J]. Neuroimage, 2000, 12(1): 20-27.
[12] Pfabigan D M, Seidel E M, Paul K,etal. Context-sensitivity of the feedback-related negativity for zero-value feedback outcomes[J]. Biol Psychol, 2015, 104: 184-192.
[13] Broyd S J, Richards H J, Helps S K,etal. An electrophysiological monetary incentive delay (e-MID) task: a way to decompose the different components of neural response to positive and negative monetary reinforcement[J]. J Neurosci Methods, 2012, 209(1): 40-49.
[14] Santesso D L, Bogdan R, Birk J L,etal. Neural responses to negative feedback are related to negative emotionality in healthy adults[J]. Soc Cogn Affect Neurosci, 2011, 7(7): 794-803..
[15] Hillyard S A, Luck S J, Mangun G R. The Cuing of Attention to Visual Field Locations: Analysis with ERP Recordings[M]// Heinze H J,Münte T F,Mangun G R.Cognitive Electrophysiology. Boston:Birkh?user,1994:1-15.
[16] Folstein J R, Van Petten C, Rose S A. Novelty and conflict in the categorization of complex stimuli[J]. Psychophysiology, 2008, 45(3):467-479.
[17] 彭家欣, 楊奇?zhèn)? 羅躍嘉. 不同特質焦慮水平的選擇性注意偏向[J]. 心理學報, 2013, 45(10): 1085-1093.
[18] Cohen M X, Elger C E, Ranganath C. Reward expectation modulates feedback-related negativity and EEG spectra[J]. Neuroimage, 2007, 35(2): 968-978.
[19] 余芬, 袁璐, 羅躍嘉. 行為和金錢的反饋效應比較[J]. 中國臨床心理學雜志, 2015, 23(6): 959-962.
TheEffectofOutcomePredictiononOutcomeEvaluation:AStudyofEvent-RelatedPotentials
LuoYuejia1,2,3,LiJinxi4,YuanLu1,3Δ.
1.CollaborativeInnovationCenterofSichuanforElderlyCareandHealth,ChengduMedicalCollege,Chengdu610500,China;2.ShenzhenKeyLaboratoryofAffectiveandSocialCognitiveScience,ShenzhenUniversity,Shenzhen618060,China;3.SichuanResearchCenterofAppliedPsychology,ChengduMedicalCollege,Chengdu610500,China;4.TheFirstAffiliatedHospitalofChengduMedicalCollege,Chengdu610500,China
ObjectiveTo explore the brain mechanism that the outcome prediction affects the outcome evaluation by using the technique of the event-related potentials (ERPs).MethodsMonetary Incentive Delay Task (MID task) was adopted to measure the N350induced by the situational cue and the feedback, the feedback-related negativity (FRN) and the late positive component (LPC) in healthy subjects.ResultsIn the condition of cues, the N2amplitudes induced by the cues of rewards and punishment respectively were the same and smaller than zero, and their LPC amplitudes were the same and greater than zero. In the condition of feedback, the FRN amplitude of the negative feedback was greater than that of the positive feedback, while the LPC amplitude of the negative feedback was smaller than that of the positive feedback.ConclusionHealthy individuals are equally sensitive to the cues of rewards and punishment in the condition of cues, but they tend to make positive prediction for unknown outcomes in the condition of feedback.
Outcome prediction; Outcome evaluation; Feedback-related negativity; Event-related potential
http://kns.cnki.net/kcms/detail/51.1705.R.20170901.0922.004.html
10.3969/j.issn.1674-2257.2017.04.006
國家自然科學基金重點項目(No:31530031);國家自然科學基金面上項目(No:81471376);國家973項目(No:2014CB744600)
:袁 璐,E-mail: yuan_lu@outlook.com
B845
A
△