朱 訓(xùn) 顧 昕
(華東師范大學(xué)教育心理學(xué)系,上海 200062)
在當(dāng)前心理學(xué)研究關(guān)注高維度大數(shù)據(jù)的背景之下,研究涉及的變量越來(lái)越多,變量的重要性評(píng)估變得越發(fā)重要。例如,個(gè)人、家庭、學(xué)校、社會(huì)層面的諸多因素都可能影響學(xué)生校園欺凌行為。簡(jiǎn)單來(lái)說(shuō),變量重要性表示其在預(yù)測(cè)和解釋因變量時(shí)的貢獻(xiàn)。相對(duì)重要性評(píng)估能夠幫助研究者探索、驗(yàn)證和細(xì)化理論。比如家庭因素和學(xué)校因素哪一個(gè)對(duì)于校園欺凌行為的影響更大,在家庭因素中親子互動(dòng)關(guān)系、父母管教方式、父母情緒處理等變量的重要性排序又是怎樣的。相對(duì)重要性評(píng)估對(duì)變量的有效利用格外重要。首先,探索變量的相對(duì)重要性能夠幫助決策者確定投入的重點(diǎn)。盡管師生關(guān)系、教師對(duì)待欺凌的態(tài)度、校園文化、班級(jí)大小等因素都會(huì)影響校園欺凌行為,但在資源和時(shí)間有限的情況下,管理人員可能不得不選擇更具成本和時(shí)間效率的項(xiàng)目,例如是開(kāi)發(fā)課程幫助學(xué)生認(rèn)識(shí)校園欺凌還是加強(qiáng)教師處理欺凌事件技巧的培訓(xùn)更為迫切。此外,評(píng)估變量的相對(duì)重要性能夠幫助決策者確定需要接受干預(yù)的個(gè)體。如果確定個(gè)體的自尊水平、身體表征是校園欺凌行為發(fā)生的重要因素,就可以預(yù)先識(shí)別出可能涉及欺凌事件的高危學(xué)生群體并進(jìn)行早期介入,避免或減少欺凌行為的發(fā)生。因此,變量相對(duì)重要性的方法與應(yīng)用研究具有重要的現(xiàn)實(shí)意義。
變量相對(duì)重要性的研究是從回歸模型開(kāi)始的,Darlington (1968)在Psychological Bulletin期刊的文章最早討論了相對(duì)重要性的評(píng)估指標(biāo),包括相關(guān)系數(shù)、偏相關(guān)系數(shù)、標(biāo)準(zhǔn)化回歸系數(shù)等,但都被證明存在明顯缺陷。后來(lái),心理學(xué)研究者提出了優(yōu)勢(shì)分析(Budescu,1993;Azen & Budescu,2003)、相對(duì)權(quán)重(Johnson,2000)等相對(duì)重要性評(píng)估指標(biāo),并給出了相對(duì)重要性的一般定義:同時(shí)考慮單獨(dú)效應(yīng)與偏效應(yīng)時(shí),每一個(gè)自變量對(duì)R2(回歸模型測(cè)定系數(shù),coefficient of determination)的貢獻(xiàn)比例(Johnson & LeBreton,2004)。這些指標(biāo)的含義和計(jì)算方法不同,適用情境也不盡相同。
許多應(yīng)用相對(duì)重要性方法的實(shí)證研究只匯報(bào)了各變量重要性指標(biāo)的估計(jì)值和由此得到的排序,而忽略假設(shè)檢驗(yàn)的結(jié)果。但是,假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的必要工作。在計(jì)算變量的相對(duì)重要性指標(biāo)后,研究者最好利用假設(shè)檢驗(yàn)推斷變量相對(duì)重要性及其差異的顯著性。例如,一個(gè)自變量的重要性是否顯著地大于另一個(gè)自變量,或是否有足夠的數(shù)據(jù)證據(jù)支持變量的重要性排序。研究者通常使用bootstrap 抽樣方法計(jì)算指標(biāo)估計(jì)值的標(biāo)準(zhǔn)誤并構(gòu)造置信區(qū)間(Azen & Budescu,2003;Tonidandel et al.,2009)。同時(shí),也有基于貝葉斯因子的相對(duì)重要性評(píng)估方法,其優(yōu)勢(shì)是能夠檢驗(yàn)三個(gè)及以上自變量的相對(duì)重要性次序,并給出數(shù)據(jù)支持重要性次序的證據(jù)(Gu,2021)。
近年來(lái),相對(duì)重要性研究被拓展到其他一些模型中,如多因變量回歸模型(Azen & Budescu,2006;LeBreton & Tonidandel,2008)、Logistic 回歸模型(Azen & Traxel,2009;Tonidandel & LeBreton,2009)、多水平模型(Luo & Azen,2013;Rights & Sterba,2019)、結(jié)構(gòu)方程模型(Gu,2022)等。同時(shí),研究者開(kāi)發(fā)了許多統(tǒng)計(jì)軟件用于計(jì)算變量相對(duì)重要性指標(biāo)并推斷其顯著性,如R 包dominanceanalysis可以用于執(zhí)行優(yōu)勢(shì)分析,R 包yhat 可以執(zhí)行優(yōu)勢(shì)分析和相對(duì)權(quán)重分析,R 包bain 用于相對(duì)重要性的貝葉斯因子評(píng)估。優(yōu)勢(shì)分析和相對(duì)權(quán)重方法因其解釋的直觀性以及較完備的模型與軟件支持,在心理學(xué)領(lǐng)域得到了廣泛應(yīng)用(Casillas et al.,2012;Richardson et al.,2021;Modersitzki et al.,2021)。
相對(duì)重要性的評(píng)估指標(biāo)種類繁多,統(tǒng)計(jì)推斷方法和模型的適用情形不同,但目前國(guó)內(nèi)缺乏相關(guān)的文獻(xiàn)綜述和評(píng)論。本文通過(guò)相對(duì)重要性評(píng)估方法的論述與比較,幫助心理學(xué)研究者選取恰當(dāng)?shù)淖兞恐匾栽u(píng)估指標(biāo)和推斷方法,并為相對(duì)重要性方法研究提供方向性建議。
本節(jié)在回歸模型下介紹幾種常用的相對(duì)重要性指標(biāo),回歸模型可表示為:
其中Y是長(zhǎng)度為N(被試人數(shù))的因變量,α是截距,X1,…,XJ是長(zhǎng)度為N的J個(gè)自變量,β1,…,βJ是對(duì)應(yīng)的回歸系數(shù),∈~N(0,σ2)是以σ2為方差的長(zhǎng)度為N的殘差向量。
為了便于解釋說(shuō)明,首先舉一個(gè)簡(jiǎn)單的例子。如圖1 所示,建立以考試成績(jī)?yōu)橐蜃兞?學(xué)科能力、復(fù)習(xí)時(shí)長(zhǎng)和焦慮程度為自變量的回歸模型:
圖1 回歸模型例
并假設(shè)變量的相關(guān)系數(shù)矩陣如表1 所示。考試成績(jī)和學(xué)科能力有強(qiáng)相關(guān),復(fù)習(xí)時(shí)長(zhǎng)會(huì)影響考試成績(jī),學(xué)生的焦慮程度與學(xué)科能力和復(fù)習(xí)時(shí)長(zhǎng)有關(guān)。我們將分析學(xué)科能力、復(fù)習(xí)時(shí)長(zhǎng)、焦慮程度在以上回歸模型中的相對(duì)重要性。
表1 變量的相關(guān)系數(shù)矩陣
因變量Y和各自變量Xj的相關(guān)系數(shù)rj是變量重要性的基礎(chǔ)指標(biāo),代表自變量和因變量的相關(guān)性,衡量了自變量對(duì)因變量的獨(dú)立影響與直接預(yù)測(cè)能力。但是,相關(guān)系數(shù)指標(biāo)忽略了模型中的其他自變量,沒(méi)有考慮自變量的相互影響。例如焦慮程度和考試成績(jī)的相關(guān)系數(shù)r3=0,但焦慮程度和學(xué)科能力及復(fù)習(xí)時(shí)長(zhǎng)有關(guān),也會(huì)影響考試成績(jī)。
標(biāo)準(zhǔn)化回歸系數(shù)是心理學(xué)研究比較自變量重要性最常見(jiàn)的傳統(tǒng)指標(biāo),它表示保持其他自變量不變,Xj對(duì)因變量Y的標(biāo)準(zhǔn)化偏效應(yīng),解釋為Xj增加1 個(gè)標(biāo)準(zhǔn)差時(shí),Y的預(yù)期變化。但是,標(biāo)準(zhǔn)化回歸系數(shù)存在缺點(diǎn),標(biāo)準(zhǔn)化回歸系數(shù)的估計(jì)依賴模型中的其他自變量,一個(gè)自變量回歸系數(shù)為零并不代表它一點(diǎn)也不重要,它的重要性可能被其他自變量隱藏。例如,根據(jù)表1 的相關(guān)系數(shù)矩陣,學(xué)科能力、復(fù)習(xí)時(shí)長(zhǎng)和焦慮程度對(duì)應(yīng)的標(biāo)準(zhǔn)化回歸系數(shù)分別為-0 .17,但這并不意味著復(fù)習(xí)時(shí)長(zhǎng)對(duì)考試成績(jī)不重要。
由于相關(guān)系數(shù)和標(biāo)準(zhǔn)化回歸系數(shù)都可以為負(fù),一般使用它們的平方作為變量重要性指標(biāo)。當(dāng)自變量不相關(guān)時(shí),相關(guān)系數(shù)等于標(biāo)準(zhǔn)化回歸系數(shù)。但當(dāng)自變量相關(guān)時(shí),兩者不一定相等。相關(guān)系數(shù)代表每個(gè)自變量的單獨(dú)貢獻(xiàn),而標(biāo)準(zhǔn)化回歸系數(shù)代表每個(gè)自變量在控制了其他自變量后的貢獻(xiàn),也即自變量對(duì)因變量的獨(dú)特貢獻(xiàn)。
心理學(xué)研究常涉及變量組,如社會(huì)經(jīng)濟(jì)地位(包括收入、職業(yè)、受教育水平等)和人格特質(zhì)(包括開(kāi)放性、宜人性、責(zé)任心等)。研究人員可能希望評(píng)估變量組在解釋和預(yù)測(cè)因變量時(shí)的聯(lián)合貢獻(xiàn),即變量組的重要性。相關(guān)系數(shù)、標(biāo)準(zhǔn)化回歸系數(shù)及其乘積指標(biāo)的另一個(gè)缺點(diǎn)是不能衡量變量組的重要性。一組變量的相關(guān)系數(shù)或標(biāo)準(zhǔn)化回歸系數(shù)的和或平均值不能解釋為變量組的聯(lián)合效應(yīng),比如,學(xué)科能力和焦慮程度的標(biāo)準(zhǔn)化回歸系數(shù)分別為0.83 和–0.17,但其聯(lián)合效應(yīng)并非為0.66。一組變量的乘積指標(biāo)之和可能為負(fù)或小于單個(gè)變量的乘積指標(biāo),因此難于解釋。此外,回歸模型中的分類自變量,如職業(yè)與受教育水平,都需要轉(zhuǎn)化為一組虛擬變量,分類變量的重要性無(wú)法用標(biāo)準(zhǔn)化回歸系數(shù)衡量與比較。
回歸模型R2增量 ΔR2是直觀的變量重要性評(píng)估指標(biāo),它反映了自變量進(jìn)入模型后因變量方差解釋的增量,也即該自變量的獨(dú)特貢獻(xiàn)。變量Xj最后進(jìn)入模型時(shí)的R2增量可表示為:
其中R2(Y)是模型總R2,R2(X-j)表示不包含自變量Xj的模型R2。R2增量方法能夠衡量變量組的重要性,比如自變量X1,X2,X3的聯(lián)合貢獻(xiàn)可由它們同時(shí)進(jìn)入模型時(shí)的R2增量 ΔR2(X1X2X3)=R2(Y) -R2(X-123)評(píng)估,其中R2(X-123)表示不包含自變量X1,X2,X3的模型R2。但與標(biāo)準(zhǔn)化回歸系數(shù)類似,R2增量為零不代表自變量毫無(wú)作用,該變量對(duì)方差解釋的貢獻(xiàn)可能被其他先進(jìn)入模型的變量隱藏。此外,所有自變量最后進(jìn)入模型的R2增量之和不等于R2(Y),不能表示R2的分解。如對(duì)于考試成績(jī)的回歸模型,由表1 相關(guān)系數(shù)矩陣可計(jì)算得到,R2(Y)=0.66,學(xué)科能力的R2增量 ΔR2(X1)=0.51,復(fù)習(xí)時(shí) 長(zhǎng) ΔR2(X2)=0.00,焦慮程度 ΔR2(X3)=0.03。
ΔR2(Xj)只考慮了Xj最后一個(gè)加入模型時(shí)的R2變化,而自變量可以有不同的進(jìn)入次序,不同進(jìn)入次序下R2增量的平均值被認(rèn)為是更合適的重要性指標(biāo)(Kruskal,1987)。例如,對(duì)于4 個(gè)自變量X1,X2,X3,X4,有4!=24種不同的進(jìn)入次序,圖2 呈現(xiàn)了部分自變量進(jìn)入次序。對(duì)于進(jìn)入次序(a),X3的R2增量為R2(X1X2X3) -R2(X1X2),對(duì)于進(jìn)入次序c,X3的R2增量為R2(X2X3) -R2(X2),其中R2(·) 表示包含相應(yīng)自變量的模型R2。對(duì)所有進(jìn)入次序下X3的R2增量求平均值即得到值得注意的是,所有自變量R2增量的平均值之和等于模型總體R2(Y),因此,?R2增量的平均值評(píng)估了各自變量對(duì)因變量方差解釋的貢獻(xiàn)比例。如對(duì)于考試成績(jī)回歸模型,(學(xué) 科能力)=0.57,(復(fù) 習(xí)時(shí)長(zhǎng))=0.08,(焦 慮程度) =0.01。該方法結(jié)合自變量的不同進(jìn)入次序,較為全面地衡量自變量的重要性,并且能夠分解模型R2。然而當(dāng)自變量個(gè)數(shù)較多時(shí),它需要付出較大的計(jì)算成本。對(duì)于J個(gè)自變量,該方法需要考慮J!個(gè)不同變量進(jìn)入次序下的自變量R2增量,當(dāng)J=10時(shí),共有上百萬(wàn)種情形。
圖2 自變量加入模型的不同次序
事實(shí)上,自變量產(chǎn)生的R2增量?jī)H與它加入的自變量集有關(guān),而與這個(gè)自變量加入前后的其他變量次序無(wú)關(guān)。例如圖2 中次序(a) 和(b) 下X3的R2增量相同,都為R2(X1X2X3) -R2(X1X2)。因此,只需考慮自變量可以進(jìn)入的變量子集,這種變量子集可以是空集或是包含一個(gè)或多個(gè)自變量的集合。如圖3 表示了X3可進(jìn)入的子集。隨后計(jì)算進(jìn)入不同子集后R2增量的加權(quán)平均值指標(biāo),這里使用加權(quán)平均值是因?yàn)樽兞窟M(jìn)入各子集的概率可能不同。
圖3 自變量可進(jìn)入的子集
Shapley 值分解就是基于這樣的思想。Shapley值是數(shù)學(xué)家Lloyd Shapley 在合作博弈論的背景下提出的(Nandlall & Millard,2019),用于衡量玩家的參與對(duì)合作游戲結(jié)果得分的影響。玩家j對(duì)參與情況(即參與時(shí)游戲中已有玩家)的獨(dú)特貢獻(xiàn)就是玩家j加入后得分的變化,Shapley 值是玩家加入所有參與情況的獨(dú)特貢獻(xiàn)的加權(quán)和,而所有玩家的Shapley 值之和就是全部玩家參與時(shí)的游戲得分。將線性回歸模型和Shapley 值方法結(jié)合,自變量即是參與游戲的玩家,游戲的得分為R2,玩家的獨(dú)特貢獻(xiàn)是自變量加入變量子集帶來(lái)的R2增量。變量Xj的Shapley 值用S(Xj)表示。例如,對(duì)于4 個(gè)自變量X1,X2,X3,X4,圖3 呈現(xiàn)了自變量X3可能加入的子集。X3進(jìn)入子集(A)的R2增量為R2(X1X3X4) -R2(X1X4),子集(A)大小為2,自變量總數(shù)為4,因此X3進(jìn)入子集(A)的概率為進(jìn)入子集(C)的R2增量為R2(X2X3) -R2(X2),子集(C)大小 為 1,因此X3進(jìn)入子集(C)的概率為進(jìn)入所有可能子集R2增量的加權(quán)平均值即為S(X3)。對(duì)于考試成績(jī)回歸模型,S(學(xué)科能力)=0.57,S(復(fù)習(xí)時(shí)長(zhǎng))=0.08,S(焦慮程度)=0.01。Shapley 值同樣能夠分解R2,另外子集思想的引入有助于提升計(jì)算效率。對(duì)于J個(gè)自變量,該方法需要考慮的子集數(shù)量為2J-1 個(gè),當(dāng)J=10 時(shí),共有一千多種情形。
另一種考慮變量進(jìn)入子集的方法是優(yōu)勢(shì)分析(dominance analysis,Azen & Budescu,2003),其使用變量成對(duì)比較,定義了三種優(yōu)勢(shì)模式:完全優(yōu)勢(shì)、條件優(yōu)勢(shì)和一般優(yōu)勢(shì)。完全優(yōu)勢(shì)比較兩個(gè)自變量對(duì)它們可加入的公共變量子集的R2增量。例如對(duì)4個(gè)自變量X1,X2,X3,X4,X1和X2可加入的公共變量集是空集{.}、{X3}、{X4}和{X3X4}。若在這些子集中加入X1比加入X2都能得到更多的R2增量,則1X完全優(yōu)于X2。
完全優(yōu)勢(shì)模式是嚴(yán)格的,當(dāng)模型中有多個(gè)自變量時(shí),常常不能識(shí)別出完全優(yōu)勢(shì),例如X1和X2分別加入空集的R2增量R2(X1) >R2(X2),而分 別 加 入{X3}的R2增量 (R2(X1X3) -R2(X3))<(R2(X2X3) -R2(X3))。為此Azen 和Budescu (2003)引入了另外兩種較為寬松的指標(biāo):條件優(yōu)勢(shì)和一般優(yōu)勢(shì)。條件優(yōu)勢(shì)比較兩個(gè)自變量加入相同大小的變量子集的R2增量平均值,對(duì)每一種子集大小,若1X的R2增量平均值都大于X2,則說(shuō)明1X有條件優(yōu)于X2。當(dāng)然條件優(yōu)勢(shì)也可能無(wú)法識(shí)別。一般優(yōu)勢(shì)比較兩個(gè)自變量條件優(yōu)勢(shì)指標(biāo)的平均值,考慮不同變量子集大小,若X1的R2增量的總體平均值大于X2,則說(shuō)明X1一般優(yōu)于X2。完全優(yōu)勢(shì)必然導(dǎo)致條件優(yōu)勢(shì),條件優(yōu)勢(shì)又必然導(dǎo)致一般優(yōu)勢(shì)。變量Xj的一般優(yōu)勢(shì)指標(biāo)用d(Xj)表示。
以考試成績(jī)回歸模型為例,表2 展示了優(yōu)勢(shì)分析結(jié)果,k為變量加入的子集大小。自變量加入空集的R2增量即為自變量與因變量相關(guān)系數(shù)的平方,例如X1加入空集的R2增量為0.64(見(jiàn)表2 中k=0平均行)。X1加入{X2}的R2增量R2(X1X2) -R2(X2)=0.48,X1加入{X3}的R2增量R2(X1X3) -R2(X3)=0.67,因 此X1加 入 大 小 為k=1的子集的R2增量平均值為0.57 (見(jiàn)k=1 平均行)。1X的一般優(yōu)勢(shì)指標(biāo)為各條件優(yōu)勢(shì)指標(biāo)的平均值(見(jiàn)總平均行)。由表2 可知,對(duì)于解釋和預(yù)測(cè)考試成績(jī),學(xué)科能力完全優(yōu)于復(fù)習(xí)時(shí)長(zhǎng)和焦慮程度。復(fù)習(xí)時(shí)長(zhǎng)和焦慮程度之間不存在完全優(yōu)勢(shì)和條件優(yōu)勢(shì),通過(guò)比較一般優(yōu)勢(shì)指標(biāo)可得復(fù)習(xí)時(shí)長(zhǎng)一般優(yōu)于焦慮程度。
表2 優(yōu)勢(shì)分析結(jié)果
一般優(yōu)勢(shì)指標(biāo)同樣具備分解R2的性質(zhì),所有自變量的一般優(yōu)勢(shì)指標(biāo)之和等于模型R2(Y) 。一般優(yōu)勢(shì)指標(biāo)評(píng)估了自變量對(duì)因變量方差解釋的貢獻(xiàn),完全優(yōu)勢(shì)和條件優(yōu)勢(shì)則提供了更多重要性模式的信息。此外,優(yōu)勢(shì)分析可以獲得有限制的變量相對(duì)重要性,在模型中固定包含一些自變量,檢驗(yàn)其他自變量的相對(duì)重要性。
盡管不同次序R2增量的平均值、Shapley 值、一般優(yōu)勢(shì)分析指標(biāo)的含義不同,但以上三種方法得到完全相等的變量重要性度量:
并且具有相同的性質(zhì):(1)衡量自變量對(duì)因變量方差解釋的平均貢獻(xiàn);(2)分解R2,即將對(duì)因變量的方差貢獻(xiàn)分配給每一個(gè)自變量;(3)能夠衡量變量組的重要性,一組變量的聯(lián)合重要性為組內(nèi)各變量的重要性之和,例如對(duì)于一般優(yōu)勢(shì)分析指標(biāo),X1和X2的聯(lián)合重要性指標(biāo)即為d(X1) +d(X2)。
另一種劃分因變量方差的方法是共性分析(commonality analysis),與前文方法不同的是,它不假定解釋的方差能夠獨(dú)立地分給每個(gè)自變量,而是存在著公共的方差解釋部分。共性分析將解釋的方差劃分為兩個(gè)部分,一個(gè)為獨(dú)特效應(yīng),表示僅能夠由某一自變量解釋的方差;一個(gè)為共同效應(yīng),表示多個(gè)自變量共同解釋的方差。如圖4 所示,橢圓圈代表各變量的方差,陰影部分為Y被X1和X2解釋的方差,也即X1和X2的聯(lián)合貢獻(xiàn),它分為X1的獨(dú)特貢獻(xiàn)U1,X2的獨(dú)特貢獻(xiàn)U2,以及X1,X2的共同貢獻(xiàn)C12。X1的單獨(dú)貢獻(xiàn)表示為U1+C12。自變量的獨(dú)特效應(yīng)U是自變量最后一個(gè)加入模型的R2增量,即前文提到的 ΔR2。圖4中三部分效應(yīng)分別為:
圖4 共性分析
獨(dú)特效應(yīng)和共同效應(yīng)統(tǒng)稱為共性系數(shù)(commonality coefficient,簡(jiǎn)稱CC)。當(dāng)有多個(gè)自變量時(shí),共性系數(shù)的計(jì)算公式可以通過(guò)多項(xiàng)式展開(kāi)的方法得到。表3 列出了考試成績(jī)回歸模型的共性分析結(jié)果,所有共性系數(shù)之和為R2(Y) 。僅能由學(xué)科能力解釋的方差占總方差76%,學(xué)科能力與復(fù)習(xí)時(shí)長(zhǎng)共同解釋的方差占總方差24%,這兩部分解釋了絕大多數(shù)的方差,可見(jiàn)學(xué)科能力對(duì)解釋或預(yù)測(cè)考試成績(jī)最重要。此外,復(fù)習(xí)時(shí)長(zhǎng)的獨(dú)特效應(yīng)為 0,但和學(xué)科能力有較大的共同效應(yīng);焦慮程度的獨(dú)特效應(yīng)不為0,且與學(xué)科能力的共同效應(yīng)為負(fù)數(shù)。由表3 可知,共性分析可能產(chǎn)生負(fù)的重要性估計(jì)值,Ozdemir (2015)對(duì)這一現(xiàn)象的解釋為存在抑制變量(suppressor variable)。
表3 共性分析結(jié)果
共性分析能夠解釋變量間的關(guān)系,檢測(cè)抑制變量,通過(guò)考量獨(dú)特效應(yīng)和共同效應(yīng)綜合評(píng)估自變量對(duì)因變量方差的貢獻(xiàn)(Ozdemir,2015)??赡艿膯?wèn)題是高階共性和負(fù)共性很難解釋。
相對(duì)權(quán)重分析從不同的視角出發(fā)評(píng)估變量相對(duì)重要性。自變量相互獨(dú)立時(shí),各自變量標(biāo)準(zhǔn)化回歸系數(shù)的平方和為R2,因此,相對(duì)權(quán)重方法的思想是尋找一組正交變量,使其與原始自變量具有最大相關(guān),作為對(duì)原始自變量的近似。如果原始自變量相關(guān)程度不高,則正交變量的標(biāo)準(zhǔn)化回歸系數(shù)的平方可近似作為原始自變量的相對(duì)重要性指標(biāo)。但是如果原始自變量高度相關(guān),則正交變量無(wú)法很好地近似原始自變量,其標(biāo)準(zhǔn)化回歸系數(shù)的平方不能作為相對(duì)重要性指標(biāo)。
對(duì)于考試成績(jī)回歸模型,w(學(xué)科能力)=0.57,w(復(fù)習(xí)時(shí)長(zhǎng))=0.08,w(焦慮程度)=0.01。
相對(duì)權(quán)重分析的步驟可總結(jié)為:(a)創(chuàng)建原始自變量的正交逼近;(b)獲得原始自變量和正交變量的系數(shù);(c)獲得正交變量和因變量的系數(shù);(d)結(jié)合兩組系數(shù)。相對(duì)權(quán)重方法能夠表示R2分解,能夠衡量變量組重要性,w1+w2可以解釋為X1和X2的聯(lián)合重要性,更重要的是相對(duì)權(quán)重具有較高的計(jì)算效率。對(duì)該方法可能的批評(píng)是,如果采用不同的正交近似過(guò)程,所得到的結(jié)果可能有所差異。另外,Thomas 等人(2014)指出該方法在將正交變量解釋的方差分配到原始自變量時(shí)使用的方法仍是基于相關(guān)系數(shù)的方法。
變量相對(duì)重要性各種指標(biāo)的性質(zhì)如表 4 所示。大部分的相對(duì)重要性指標(biāo)是非負(fù)的,與相關(guān)系數(shù)和標(biāo)準(zhǔn)化回歸系數(shù)有關(guān)的指標(biāo)不能比較變量組。與R2增量有關(guān)的指標(biāo)能夠解釋為對(duì)因變量方差解釋的貢獻(xiàn)且可以比較變量組。和wj等指標(biāo)都能對(duì)R2進(jìn)行分解。但是,乘積指標(biāo)和共性分析系數(shù)CC都存在難以被解釋的問(wèn)題。不同進(jìn)入次序的R2平均增量、Shapley 值和一般優(yōu)勢(shì)指標(biāo)具有相同的評(píng)估結(jié)果。其中,優(yōu)勢(shì)分析對(duì)變量重要性的含義有直觀的解釋,且定義了相對(duì)重要性的不同模式,因此更具優(yōu)勢(shì)。不同進(jìn)入次序的R2平均增量、Shapley 值、優(yōu)勢(shì)分析和共性分析都需要大量的計(jì)算。而相對(duì)權(quán)重分析提供了和一般優(yōu)勢(shì)分析幾乎相同的評(píng)估結(jié)果,前者可以看作后者的近似,相對(duì)權(quán)重分析的優(yōu)點(diǎn)是計(jì)算效率較高。
表4 相對(duì)重要性指標(biāo)對(duì)比
根據(jù)以上討論和實(shí)際研究問(wèn)題,給出相對(duì)重要性指標(biāo)的選擇參考:首先,如果研究者只關(guān)注自變量對(duì)因變量的單獨(dú)貢獻(xiàn),那么相關(guān)系數(shù)可以作為重要性評(píng)估指標(biāo);如果研究者只關(guān)注自變量對(duì)因變量的獨(dú)特貢獻(xiàn),那么標(biāo)準(zhǔn)化回歸系數(shù)可以作為重要性評(píng)估指標(biāo)。但是,以上指標(biāo)均不能比較變量組或分類變量的重要性。其次,如果研究者希望通過(guò)自變量對(duì)因變量的獨(dú)特貢獻(xiàn)和共同貢獻(xiàn)來(lái)解釋變量間的關(guān)系,可以使用共性分析。再次,如果研究者關(guān)注自變量對(duì)因變量方差解釋的貢獻(xiàn),那么優(yōu)勢(shì)分析與相對(duì)權(quán)重是合適的重要性評(píng)估指標(biāo),綜合考慮單獨(dú)貢獻(xiàn)和獨(dú)特貢獻(xiàn),衡量每一個(gè)自變量對(duì)R2的貢獻(xiàn)比例。根據(jù)表4 比較結(jié)果,本文重點(diǎn)推薦優(yōu)勢(shì)分析與相對(duì)權(quán)重指標(biāo)。R2平均增量和Shapley 值的評(píng)估結(jié)果與優(yōu)勢(shì)分析相同,但優(yōu)勢(shì)分析更關(guān)注心理學(xué)意義的重要性解釋。具體地,如果研究者更關(guān)注相對(duì)重要性的解釋與模式,推薦使用優(yōu)勢(shì)分析;如果研究者希望評(píng)估大量自變量的相對(duì)重要性,則應(yīng)選擇相對(duì)權(quán)重指標(biāo)。最后,值得注意的是,所有相對(duì)重要性指標(biāo)都可直接由變量相關(guān)系數(shù)矩陣計(jì)算得到,不需要原始數(shù)據(jù)樣本(Gu,2021)。
本節(jié)討論相對(duì)重要性的統(tǒng)計(jì)推斷方法。使用第2 節(jié)中的考試成績(jī)回歸模型為例,說(shuō)明不同相對(duì)重要性指標(biāo)的頻率統(tǒng)計(jì)與貝葉斯統(tǒng)計(jì)推斷過(guò)程。生成樣本容量為N=200,各變量均值為零,協(xié)方差矩陣為表1 所示的多元正態(tài)分布數(shù)據(jù)。為了便于解釋,這里只生成一個(gè)數(shù)據(jù)集,并限制樣本均值和協(xié)方差矩陣與總體中完全相等。
傳統(tǒng)相對(duì)重要性指標(biāo)相關(guān)系數(shù)及標(biāo)準(zhǔn)化回歸系數(shù)都服從t分布。以標(biāo)準(zhǔn)化回歸系數(shù)為例,通過(guò)檢驗(yàn)零假設(shè),即可得到標(biāo)準(zhǔn)化回歸系數(shù)的顯著性。對(duì)模擬樣本做回歸分析,學(xué)科能力對(duì)應(yīng)的=0.83,P<0.001,復(fù)習(xí)時(shí)長(zhǎng)對(duì)應(yīng)的=0,P=1,焦慮程度對(duì)應(yīng)的=-0 .17,P< 0.001,說(shuō)明以標(biāo)準(zhǔn)化回歸系數(shù)為重要性指標(biāo),學(xué)科能力和焦慮程度對(duì)考試成績(jī)都有顯著的重要性。如果想要知道兩個(gè)自變量的標(biāo)準(zhǔn)化回歸系數(shù)是否有顯著差異,則可使用Wald 檢驗(yàn)判斷系數(shù)的差異顯著性H0:-=0。但是,對(duì)于三個(gè)變量相對(duì)重要性的推斷,多重Wald 檢驗(yàn)即便可能,統(tǒng)計(jì)功效也會(huì)十分低下(Braeken et al.,2015)。
一般優(yōu)勢(shì)分析和相對(duì)權(quán)重等指標(biāo)的抽樣分布函數(shù)未知,可以使用bootstrap 抽樣方法構(gòu)造的抽樣分布來(lái)替代。這里以一般優(yōu)勢(shì)分析為例,對(duì)于大小為N的樣本,重抽樣得到S個(gè)bootstrap 樣本,在每個(gè)bootstrap 樣本中計(jì)算一般優(yōu)勢(shì)指標(biāo),就得到了指標(biāo)的抽樣分布。模擬樣本中一般優(yōu)勢(shì)指標(biāo)的bootstrap 抽樣分布如圖5 所示。
圖5 一般優(yōu)勢(shì)指標(biāo)的bootstrap 抽樣分布
根據(jù)抽樣分布即可計(jì)算優(yōu)勢(shì)指標(biāo)或指標(biāo)差異的標(biāo)準(zhǔn)誤、置信區(qū)間等。Bootstrap 提供了百分位置信區(qū)間和BCa (bias-corrected and accelerated)置信區(qū)間,95%置信區(qū)間的下限和上限分別是bootstrap 抽樣的2.5%和97.5%分位數(shù),BCa 置信區(qū)間用偏差校正加速方法對(duì)百分位置信區(qū)間進(jìn)行調(diào)整,得到更精確的結(jié)果。根據(jù)估計(jì)值和標(biāo)準(zhǔn)誤可以構(gòu)造Wald 統(tǒng)計(jì)量,并計(jì)算其顯著性。由于一般優(yōu)勢(shì)指標(biāo)總是非負(fù)的,因此對(duì)該指標(biāo)的顯著性計(jì)算是單邊的。以模擬樣本為例,學(xué)科能力的一般優(yōu)勢(shì)指標(biāo)1d估計(jì)值為 0.57,標(biāo)準(zhǔn)誤為 0.04,bootstrap 百分位置信區(qū)間為[0.49,0.65],BCa 置信區(qū)間為[0.49,0.65],Wald 統(tǒng)計(jì)量為14.36,P 值小于0.001,因此學(xué)科能力的一般優(yōu)勢(shì)指標(biāo)顯著不為0。學(xué)科能力和復(fù)習(xí)時(shí)長(zhǎng)一般優(yōu)勢(shì)指標(biāo)差異d1-d2的估計(jì)值為0.49,標(biāo)準(zhǔn)誤為0.06,bootstrap 百分位置信區(qū)間為[0.37,0.59],BCa 置信區(qū)間為[0.37,0.60],Wald 統(tǒng)計(jì)量為8.79,P 值小于0.001,可知學(xué)科能力的一般優(yōu)勢(shì)指標(biāo)顯著大于復(fù)習(xí)時(shí)長(zhǎng),也即在解釋或預(yù)測(cè)考試成績(jī)上,學(xué)科能力比復(fù)習(xí)時(shí)長(zhǎng)重要。Wald 檢驗(yàn)和bootstrap 方法只能推斷兩個(gè)自變量的相對(duì)重要性次序。在涉及三個(gè)及以上的比較時(shí),仍然需要多重檢驗(yàn)。
變量重要性指標(biāo)估計(jì)值的大小次序在bootstrap樣本中出現(xiàn)的頻率稱為相對(duì)重要性次序的復(fù)現(xiàn)性。以一般優(yōu)勢(shì)指標(biāo)為例,模擬樣本中的估計(jì)值為,重要性次序d1>d2>d3。進(jìn)行1000 次bootstrap 抽樣,并分別計(jì)算一般優(yōu)勢(shì)指標(biāo),其中980 個(gè)bootstrap 樣本中滿足d1>d2>d3,則重要性次序的復(fù)現(xiàn)性為98%。
涉及變量相對(duì)重要性的心理學(xué)理論可以由次序假設(shè)表示。例如,H1:d1>d2>d3表示在解釋或預(yù)測(cè)考試成績(jī)時(shí),三個(gè)自變量在一般優(yōu)勢(shì)指標(biāo)下的重要性由高到低依次為學(xué)科能力、復(fù)習(xí)時(shí)長(zhǎng)和焦慮程度。貝葉斯檢驗(yàn)可以直接評(píng)估次序假設(shè),貝葉斯因子是貝葉斯檢驗(yàn)的核心指標(biāo)。與傳統(tǒng)方法相比,貝葉斯檢驗(yàn)有以下一些優(yōu)勢(shì)(Hoijtink et al.,2019):貝葉斯檢驗(yàn)?zāi)軌蚪邮芰慵僭O(shè)而顯著性檢驗(yàn)不能;貝葉斯因子量化了數(shù)據(jù)支持假設(shè)的證據(jù);貝葉斯因子能夠同時(shí)檢驗(yàn)兩個(gè)及以上可能的次序假設(shè),不需要考慮多重檢驗(yàn)修正;此外,貝葉斯因子能夠隨著數(shù)據(jù)的不斷收集而更新。
貝葉斯因子為數(shù)據(jù)在兩個(gè)假設(shè)下的邊際似然比值(marginal likelihood ratio)。由于零假設(shè)或次序假設(shè)都嵌套于無(wú)約束的備擇假設(shè),零假設(shè)與備擇假設(shè)的貝葉斯因子可簡(jiǎn)化為待檢驗(yàn)指標(biāo)在零假設(shè)下的后驗(yàn)與先驗(yàn)密度的比值,次序假設(shè)與備擇假設(shè)的貝葉斯因子可簡(jiǎn)化為待檢驗(yàn)指標(biāo)在次序假設(shè)限定下的后驗(yàn)與先驗(yàn)概率的比值。貝葉斯因子的簡(jiǎn)化表達(dá)被稱為Savage-Dickey 密度比或概率比(Mulder et al.,2022)。先驗(yàn)密度或先驗(yàn)概率可由設(shè)置的指標(biāo)先驗(yàn)分布直接計(jì)算,如正態(tài)先驗(yàn)在指標(biāo)為0 時(shí)的密度即為先驗(yàn)密度。后驗(yàn)密度或后驗(yàn)概率可借助后驗(yàn)抽樣進(jìn)行估計(jì),如后驗(yàn)樣本服從次序假設(shè)的比例即為后驗(yàn)概率。零假設(shè)或次序假設(shè)的貝葉斯因子計(jì)算可利用R 軟件包bain,更多的理論細(xì)節(jié)參見(jiàn)Gu 等人(2018)和Gu (2021)。貝葉斯因子對(duì)數(shù)據(jù)證據(jù)的衡量標(biāo)準(zhǔn)參見(jiàn)表5(胡傳鵬等,2018)。三個(gè)及以上假設(shè)的比較可將貝葉斯因子轉(zhuǎn)換為后驗(yàn)?zāi)P透怕省?/p>
表5 貝葉斯因子標(biāo)準(zhǔn)
以標(biāo)準(zhǔn)化回歸系數(shù)為例,貝葉斯因子不僅可以檢驗(yàn)單個(gè)變量重要性的顯著性及兩個(gè)變量重要性差異的顯著性,還能評(píng)估包含更多信息的次序假設(shè),如。以模擬樣本為例,與備擇假設(shè)Hu相比,對(duì)應(yīng)的BF1u=8.17 > 3表示接受H1,復(fù)習(xí)時(shí)長(zhǎng)的標(biāo)準(zhǔn)化回歸系數(shù)不顯著;對(duì)應(yīng)的表示拒絕H2,學(xué)科能力和復(fù)習(xí)時(shí)長(zhǎng)的標(biāo)準(zhǔn)化回歸系數(shù)有顯著差異;對(duì)應(yīng)的BF3u=4.14 >3 表示接受H3,三個(gè)自變量在標(biāo)準(zhǔn)化回歸系數(shù)下的重要性次序?yàn)閷W(xué)科能力、焦慮程度和復(fù)習(xí)時(shí)長(zhǎng)。
一般優(yōu)勢(shì)指標(biāo)同樣可以用貝葉斯方法檢驗(yàn)。例如,我們認(rèn)為學(xué)科能力對(duì)解釋或預(yù)測(cè)考試成績(jī)毫無(wú)疑問(wèn)最為重要,而不確定復(fù)習(xí)時(shí)長(zhǎng)比焦慮程度重要還是二者有相等的重要性,考慮相互競(jìng)爭(zhēng)的兩個(gè)假設(shè):
計(jì)算可得,BF4u=8.63,BF5u=0.92,BF45=BF4u/BF5u=9.44表明假設(shè)H4比H5受到的數(shù)據(jù)支持更多。
根據(jù)頻率與貝葉斯統(tǒng)計(jì)推斷的論述與比較可知,bootstrap 抽樣方法原理簡(jiǎn)單,適用于各種指標(biāo)下的單變量重要性和兩變量重要性差異的推斷。但是涉及三個(gè)及以上變量的重要性比較時(shí),bootstrap 方法僅能給出重要性次序的復(fù)現(xiàn)性,無(wú)法進(jìn)行統(tǒng)計(jì)檢驗(yàn)。與此相對(duì),貝葉斯方法能夠檢驗(yàn)重要性次序的任意假設(shè),為相對(duì)重要性評(píng)估提供了直接、有效的方法。但是貝葉斯方法的統(tǒng)計(jì)原理和計(jì)算較為復(fù)雜,在相對(duì)重要性研究中的應(yīng)用還不如bootstrap 方法廣泛。
基于標(biāo)準(zhǔn)化回歸系數(shù)的變量相對(duì)重要性評(píng)估可直接拓展到多因變量回歸模型、Logistic 回歸模型、結(jié)構(gòu)方程模型等。只需在各模型中估計(jì)出標(biāo)準(zhǔn)化系數(shù)及其標(biāo)準(zhǔn)誤,就可以對(duì)變量重要性進(jìn)行排序以及統(tǒng)計(jì)推斷,分析過(guò)程與回歸模型標(biāo)準(zhǔn)化系數(shù)的估計(jì)、排序與推斷類似,這里不再贅述。下面主要討論優(yōu)勢(shì)分析和相對(duì)權(quán)重方法在各類模型中的應(yīng)用。
將優(yōu)勢(shì)分析拓展到其他模型的關(guān)鍵是選擇合適的方差解釋效應(yīng)量R2(Azen & Budescu,2006)。R2與模型擬合有關(guān),應(yīng)滿足:(a)有界性:R2在0到1 之間,0 表示完全缺乏擬合,1 表示完美的擬合;(b)線性不變性:R2對(duì)于非奇異的變量轉(zhuǎn)換是不變的;(c)單調(diào)性:在模型中增加一個(gè)自變量,R2不應(yīng)該減少;(d)可解釋性:R2直觀上易于理解。確定了R2后,自變量對(duì)特定模型的獨(dú)特貢獻(xiàn)就可以由自變量加入模型時(shí)的R2增量得到。Azen 和Budescu (2006) 使用基于典型相關(guān)(canonical correlation)的多元關(guān)聯(lián)測(cè)量(multivariate association measure)作為多元R2,將一般優(yōu)勢(shì)分析指標(biāo)拓展到多因變量回歸模型。Logistic 回歸模型適用于二分類因變量的情況,Azen 和Traxel (2009)使用基于似然比的R2對(duì)自變量進(jìn)行優(yōu)勢(shì)分析。Luo 和Azen (2013)將優(yōu)勢(shì)分析應(yīng)用于多水平模型。多水平模型R2效應(yīng)量測(cè)量的綜合框架參見(jiàn)Rights 和Sterba (2019),研究者可根據(jù)感興趣的水平層次選取恰當(dāng)?shù)腞2,評(píng)估不同水平下自變量的相對(duì)重要性。結(jié)構(gòu)方程模型可以分析潛變量間的關(guān)系,Gu (2022)將優(yōu)勢(shì)分析方法拓展到結(jié)構(gòu)方程模型,通過(guò)模型隱含相關(guān)矩陣(model-implied correlation matrix)計(jì)算潛變量回歸模型的R2,得到優(yōu)勢(shì)分析指標(biāo)。
相對(duì)權(quán)重分析拓展到其他模型的關(guān)鍵是設(shè)計(jì)正交過(guò)程以及合適地估計(jì)系數(shù)。對(duì)于多因變量的線性回歸模型,直接估計(jì)系數(shù)不能考慮因變量的內(nèi)在相關(guān)性,LeBreton 和Tonidandel (2008)同樣創(chuàng)建因變量的正交逼近,作為正交變量和因變量之間的過(guò)渡。對(duì)于Logistic 回歸模型,最小二乘框架不再適用,Tonidandel 和LeBreton (2009)使用標(biāo)準(zhǔn)化Logistic 回歸系數(shù)作為正交變量與因變量的系數(shù)。在以上模型中,相對(duì)權(quán)重與優(yōu)勢(shì)分析表現(xiàn)出一致性。相對(duì)權(quán)重方法也被擴(kuò)展到了包含交互項(xiàng)、二次項(xiàng)或其他高階項(xiàng)的回歸模型中以評(píng)估這些效應(yīng)的相對(duì)重要性(Tonidandel & LeBreton,2011)。
相對(duì)重要性的應(yīng)用已從線性回歸模型拓展到二分Logistic 回歸模型、多因變量回歸模型、多水平模型、潛變量回歸模型等,但是還未見(jiàn)有廣義線性混合模型和結(jié)構(gòu)方程模型這兩大類模型的系統(tǒng)應(yīng)用。例如,中介模型是心理學(xué)研究中廣泛應(yīng)用的模型,評(píng)估不同中介變量重要性的常用方法是比較各中介變量的特定間接效應(yīng)(specific indirect effect),中介變量的特定間接效應(yīng)可以用該變量所在路徑的系數(shù)乘積來(lái)衡量(Preacher & Hayes,2008;Preacher & Kelley,2011)。計(jì)算特定間接效應(yīng)之后,可使用bootstrap 方法構(gòu)建兩個(gè)中介變量特定間接效應(yīng)差值(contrast)的bootstrap 百分位和偏差校正置信區(qū)間進(jìn)行推斷,若置信區(qū)間不包括0,則表明兩個(gè)特定間接效應(yīng)有顯著的差異(Preacher & Hayes,2008;方杰 等,2014)。多重中介效應(yīng)的比較與推斷可在Mplus 和R 軟件包lavaan 等結(jié)構(gòu)方程模型軟件中實(shí)現(xiàn)。但是,在相對(duì)重要性評(píng)估中,多重中介變量的間接效應(yīng)指標(biāo)存在與回歸模型中標(biāo)準(zhǔn)化系數(shù)指標(biāo)相同的問(wèn)題,即某一中介變量的重要性可能被其他中介變量隱藏。而回歸模型中評(píng)估自變量重要性推薦的優(yōu)勢(shì)分析和相對(duì)權(quán)重方法并未拓展到多重中介模型,可能的原因是多重中介模型涉及的路徑較回歸模型更為復(fù)雜,模型R2的解釋、計(jì)算和分解較為困難。此外,已有的模型應(yīng)用研究均未關(guān)注分類自變量的情形,相對(duì)重要性評(píng)估應(yīng)用到分類數(shù)據(jù)時(shí)的穩(wěn)健性還有待探討。
近年來(lái),為了推廣相對(duì)重要性方法的實(shí)際應(yīng)用,研究者在SPSS、Stata、SAS、R 等多個(gè)平臺(tái)下開(kāi)發(fā)了各種相對(duì)重要性指標(biāo)計(jì)算和統(tǒng)計(jì)推斷的相關(guān)軟件(Kraha et al.,2012;Luchman,2021;Groemping & Matthias,2021;Mulder et al.,2021)。其中R 軟件包提供了全面、靈活的分析工具,R 包dominanceanalysis 可以對(duì)線性回歸模型(單因變量和多因變量)、廣義線性模型以及多水平線性模型進(jìn)行優(yōu)勢(shì)分析并計(jì)算bootstrap 復(fù)現(xiàn)性;R 包yhat可以在線性回歸模型中實(shí)現(xiàn)優(yōu)勢(shì)分析和相對(duì)權(quán)重方法并計(jì)算bootstrap 置信區(qū)間(Nimon & Oswald,2013);R 包bain 可以利用相對(duì)重要性指標(biāo)的估計(jì)值和協(xié)方差矩陣計(jì)算一般統(tǒng)計(jì)模型下任意重要性指標(biāo)的零假設(shè)和次序假設(shè)的貝葉斯因子,進(jìn)行多變量重要性排序的統(tǒng)計(jì)推斷(Gu et al.,2018)。
隨著相對(duì)重要性方法的研究發(fā)展與軟件實(shí)現(xiàn),相對(duì)重要性評(píng)估廣泛應(yīng)用于心理學(xué)研究中。許多研究者使用優(yōu)勢(shì)分析和相對(duì)權(quán)重方法從因變量方差貢獻(xiàn)比例的角度比較變量的相對(duì)重要性(Casillas et al.,2012;Hakanen et al.,2021;Richardson et al.,2021;Modersitzki et al.,2021)。例如Casillas 等人(2012)使用優(yōu)勢(shì)分析比較了社會(huì)心理和行為因素(如動(dòng)機(jī)、自我調(diào)節(jié)和社會(huì)控制)及先前學(xué)業(yè)成就對(duì)高中生學(xué)業(yè)成績(jī)的重要性。Modersitzki 等人(2021)使用相對(duì)權(quán)重比較了新冠疫情下社會(huì)人口變量和人格特征變量(包括大五人格、黑暗人格等)對(duì)預(yù)測(cè)心理結(jié)果的相對(duì)貢獻(xiàn)。相對(duì)權(quán)重方法因其在計(jì)算效率上的優(yōu)勢(shì),更適用于自變量較多的模型,也有許多元分析使用這種方法來(lái)評(píng)估相對(duì)重要性(Young et al.,2018;MacCann et al.,2020)。例如,Young 等人(2018)的一項(xiàng)元分析使用相對(duì)權(quán)重確定不同人格特質(zhì)在預(yù)測(cè)員工敬業(yè)度中的相對(duì)重要性。
國(guó)內(nèi)使用相對(duì)重要性方法的心理學(xué)研究也有不少,主要集中在心理健康、教育心理和組織研究領(lǐng)域(周浩,龍立榮,2014;宋勃東 等,2015;張純霞,馮廷勇,2018;胥彥,李超平,2019;Zhang et al.,2021;胡詠梅,元靜,2021)。例如張純霞和馮廷勇(2018)使用優(yōu)勢(shì)分析比較了沖動(dòng)性各維度對(duì)學(xué)習(xí)拖延行為的相對(duì)貢獻(xiàn)。胥彥和李超平(2019)的一項(xiàng)元分析使用相對(duì)權(quán)重比較了不同領(lǐng)導(dǎo)風(fēng)格對(duì)員工敬業(yè)度的解釋力。胡詠梅和元靜(2021)使用Shapley 值,比較了家庭投入和學(xué)校投入對(duì)于中小學(xué)教育產(chǎn)出的重要性。
除了相對(duì)重要性的描述性評(píng)估,部分心理學(xué)研究關(guān)注重要性的統(tǒng)計(jì)推斷(Vaessen & Blomert,2010;Dalal et al.,2012;Ainsworth & Oldfield,2019)。例如Vaessen 和Blomert (2010)使用優(yōu)勢(shì)分析指標(biāo)的置信區(qū)間進(jìn)行統(tǒng)計(jì)推斷,比較不同年級(jí)的語(yǔ)音意識(shí)和快速自動(dòng)命名對(duì)閱讀流利性的貢獻(xiàn)。Ainsworth 和Oldfield (2019)使用相對(duì)權(quán)重方法比較了促進(jìn)教師韌性的各種因素在預(yù)測(cè)工作滿意度、倦怠和幸福感中的相對(duì)重要性并使用置信區(qū)間推斷顯著性。
對(duì)應(yīng)用文獻(xiàn)進(jìn)行分析,發(fā)現(xiàn)相對(duì)重要性的應(yīng)用研究存在以下幾點(diǎn)問(wèn)題:(1)不恰當(dāng)?shù)闹笜?biāo)使用與解釋,前文提到重要性的評(píng)估指標(biāo)有不同解釋,應(yīng)根據(jù)具體研究問(wèn)題確定。(2)應(yīng)用模型大多為線性回歸,可能的原因是其他模型下的相對(duì)重要性評(píng)估方法開(kāi)發(fā)主要集中在近10 年,比如多水平模型與結(jié)構(gòu)方程模型的變量重要性評(píng)估的方法研究與軟件開(kāi)發(fā)還未完善。(3)重要性評(píng)估報(bào)告主要為描述性的,尤其是多變量的排序,忽略了統(tǒng)計(jì)推斷信息(Braun et al.,2019)。(4)缺乏綜述類文獻(xiàn)的指導(dǎo),近二十年來(lái),相對(duì)重要性領(lǐng)域出現(xiàn)了很多新發(fā)展與新模型,而心理學(xué)領(lǐng)域缺乏相關(guān)的綜述文章指導(dǎo)。
本節(jié)以觀看芝麻街兒童電視節(jié)目(Sesame)的一項(xiàng)研究為例(Stevens,2002)說(shuō)明一般優(yōu)勢(shì)分析的實(shí)際應(yīng)用。研究者試圖探究?jī)和瘮?shù)字知識(shí)的影響因素。該研究數(shù)據(jù)可見(jiàn)R 包bain 中的“sesamesim”數(shù)據(jù)集,它包括240 名34 到69 個(gè)月的兒童。因變量為Postnumb,是觀看芝麻街節(jié)目一年后兒童的數(shù)字知識(shí)測(cè)驗(yàn)得分。自變量為兒童觀看節(jié)目前的數(shù)字知識(shí)得分Prenumb、年齡Age以及Peabody心理年齡得分Peabody。它們的關(guān)系可以用線性回歸模型表示:
表6 展示了因變量和自變量的相關(guān)矩陣和自變量標(biāo)準(zhǔn)化回歸系數(shù)的估計(jì)值。
表6 相關(guān)系數(shù)與標(biāo)準(zhǔn)化回歸系數(shù)估計(jì)值
根據(jù)表6 的相關(guān)矩陣計(jì)算各自變量的一般優(yōu)勢(shì)指標(biāo),并通過(guò) bootstrap 抽樣得到標(biāo)準(zhǔn)誤、bootstrap 百分位置信區(qū)間和BCa 置信區(qū)間以及Wald 檢驗(yàn)結(jié)果,如表7 所示。Wald 檢驗(yàn)結(jié)果表明三個(gè)自變量在預(yù)測(cè)因變量上的重要性都是顯著的。
表7 一般優(yōu)勢(shì)指標(biāo)、標(biāo)準(zhǔn)誤、置信區(qū)間和Wald 檢驗(yàn)
研究者可根據(jù)心理學(xué)理論構(gòu)建并檢驗(yàn)特定的自變量重要性排序,同時(shí)也可以對(duì)所有重要性次序進(jìn)行探索與評(píng)估,這里為探索自變量的重要性次序,評(píng)估以下假設(shè):
其中θ表示重要性指標(biāo)。以標(biāo)準(zhǔn)化回歸系數(shù)和一般優(yōu)勢(shì)指標(biāo)為例,表8 展示了上述假設(shè)的貝葉斯統(tǒng)計(jì)推斷結(jié)果,包括每個(gè)假設(shè)的貝葉斯因子。對(duì)于標(biāo)準(zhǔn)化回歸系數(shù),與備擇假設(shè)Hu相比,BF1u=0.44表示數(shù)據(jù)不支持也不反對(duì)H1,BF2u=5.77表明H2得到數(shù)據(jù)的支持。對(duì)于一般優(yōu)勢(shì)指標(biāo),BF2u=5.54表明數(shù)據(jù)支持H2;其他假設(shè)的貝葉斯因子都小于1/3,表明數(shù)據(jù)更支持備擇假設(shè)Hu。在所有考慮的假設(shè)中,H2的貝葉斯因子BF2u最大,表明其得到了最多的數(shù)據(jù)支持。標(biāo)準(zhǔn)化回歸系數(shù)和一般優(yōu)勢(shì)指標(biāo)的貝葉斯檢驗(yàn)給出了同樣的結(jié)果,也即在預(yù)測(cè)觀看芝麻街后的數(shù)字知識(shí)測(cè)驗(yàn)得分上,觀看前的數(shù)字知識(shí)最重要,Peabody 心理年齡的重要性次之,而年齡的重要性最小。
表8 貝葉斯統(tǒng)計(jì)推斷
變量相對(duì)重要性的研究對(duì)心理學(xué)、教育學(xué)等社會(huì)科學(xué)有重要意義。盡管目前的研究中習(xí)慣于使用標(biāo)準(zhǔn)化回歸系數(shù)等傳統(tǒng)指標(biāo)來(lái)比較變量的重要性,在自變量相關(guān)時(shí),這些指標(biāo)不能同時(shí)考慮自變量對(duì)因變量的直接影響和控制其他自變量后的影響。不同進(jìn)入次序R2增量的平均值、Shapley值、優(yōu)勢(shì)分析和相對(duì)權(quán)重等給出了變量相對(duì)重要性的統(tǒng)一評(píng)估指標(biāo),得到幾乎相同的分析結(jié)果。優(yōu)勢(shì)分析與相對(duì)權(quán)重指標(biāo)同時(shí)考慮自變量對(duì)因變量的單獨(dú)和獨(dú)特貢獻(xiàn),對(duì)R2進(jìn)行分解,并能夠衡量分類變量和變量組的重要性,是比較推薦的指標(biāo)。更具體地,當(dāng)研究關(guān)注的重點(diǎn)是重要性分析的不同模式時(shí),更推薦優(yōu)勢(shì)分析;當(dāng)自變量個(gè)數(shù)較多時(shí),更推薦使用相對(duì)權(quán)重方法。由于優(yōu)勢(shì)分析與相對(duì)權(quán)重指標(biāo)的抽樣分布往往是未知的,bootstrap 置信區(qū)間是推薦的統(tǒng)計(jì)推斷工具。當(dāng)比較三個(gè)及以上自變量的相對(duì)重要性時(shí),更推薦使用基于貝葉斯因子的統(tǒng)計(jì)推斷方法評(píng)估多自變量的重要性次序。
變量相對(duì)重要性的研究仍然存在很多值得探索的地方。首先,優(yōu)勢(shì)分析和相對(duì)權(quán)重方法的模型應(yīng)用仍較為有限,沒(méi)有系統(tǒng)地應(yīng)用在廣義線性混合模型、結(jié)構(gòu)方程模型中。如前文所述,在多重中介模型中比較不同中介變量的重要性時(shí),目前常用的基于系數(shù)乘積的特定間接效應(yīng)比較方法可能導(dǎo)致對(duì)某些中介變量重要性的低估。中介效應(yīng)同樣可以使用R2度量,可以理解為由自變量和中介變量共同解釋的因變量的方差(Lachowicz et al.,2018),將優(yōu)勢(shì)分析和相對(duì)權(quán)重方法拓展到中介變量的相對(duì)重要性評(píng)估是未來(lái)的一個(gè)研究方向。
其次,盡管優(yōu)勢(shì)分析和相對(duì)權(quán)重分析是當(dāng)前最為推薦的相對(duì)重要性評(píng)估方法,它們都有各自的不足。優(yōu)勢(shì)分析要對(duì)所有可能的子集計(jì)算R2增量,因而當(dāng)變量較多時(shí)計(jì)算效率較低?;谝话銉?yōu)勢(shì)分析對(duì)R2分解的性質(zhì),可能的改進(jìn)思路是對(duì)大量變量進(jìn)行分組降維、并行計(jì)算。此外,在一些較為復(fù)雜的模型中,R2的選擇和計(jì)算較為困難。例如多水平模型中有很多不同的R2(Rights & Sterba,2019),研究者需要選取恰當(dāng)?shù)腞2進(jìn)行優(yōu)勢(shì)分析。建議優(yōu)勢(shì)分析方法研究能給出這類模型的具體應(yīng)用指南。相對(duì)權(quán)重方法因其與一般優(yōu)勢(shì)分析相似的結(jié)果及較高的計(jì)算效率而被廣泛使用,但是該方法在將正交變量解釋的方差分配到原始自變量時(shí)使用的方法仍是基于相關(guān)系數(shù)的方法,從而可能導(dǎo)致解釋方差不恰當(dāng)?shù)膭澐?。相?duì)權(quán)重方法如果要拓展到更廣泛的模型,須解決這個(gè)問(wèn)題。
再次,實(shí)際分析中不同數(shù)據(jù)類型的變量重要性指標(biāo)估計(jì)與推斷的穩(wěn)健性還有待探討。例如,心理學(xué)研究常使用李克特量表測(cè)量研究變量,為了滿足回歸模型的基本要求,可能假定量表得分服從正態(tài)分布。違背正態(tài)性假定會(huì)對(duì)相對(duì)重要性評(píng)估產(chǎn)生怎樣的影響是值得研究的問(wèn)題。又如,心理學(xué)研究常涉及分類變量,同一分類自變量(如受教育水平)類別劃分較多時(shí)(如研究生、本科、專科、高中、初中及以下)與類別較少時(shí)(如專科及以上、高中及以下)對(duì)R2的貢獻(xiàn)有何不同,即分類自變量的相對(duì)重要性評(píng)估是否會(huì)受到類別數(shù)量的影響也是值得進(jìn)一步探討的問(wèn)題。因此,相對(duì)重要性評(píng)估的穩(wěn)健性模擬研究是未來(lái)研究的一個(gè)方向。最后,相對(duì)重要性評(píng)估缺乏集成的分析軟件,同時(shí)執(zhí)行評(píng)估指標(biāo)的計(jì)算與統(tǒng)計(jì)推斷。因此,未來(lái)相對(duì)重要性評(píng)估方法研究應(yīng)更關(guān)注模型的應(yīng)用、數(shù)據(jù)的適用與軟件的開(kāi)發(fā)。