国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

CB-SEM與PLS-SEM:結(jié)構(gòu)方程模型在教育實(shí)證研究中的應(yīng)用辨析

2023-01-01 00:00:00秦超
湖北社會(huì)科學(xué) 2023年5期

摘要:實(shí)踐性和應(yīng)用性決定了實(shí)證研究是教育科學(xué)中的重要研究范式。結(jié)構(gòu)方程模型是實(shí)證研究的有力分析工具,其在分析學(xué)生學(xué)習(xí)行為、新技術(shù)接受度、網(wǎng)絡(luò)學(xué)習(xí)環(huán)境滿意度等議題中有著廣闊的應(yīng)用空間。相較于基于協(xié)方差的結(jié)構(gòu)方程模型CB-SEM,基于方差的偏最小二乘法結(jié)構(gòu)方程模型PLS-SEM具有小樣本適用、數(shù)據(jù)非正態(tài)適用、兼容形成型測(cè)量模型和適用于復(fù)雜模型等多重優(yōu)點(diǎn),與CB-SEM形成優(yōu)勢(shì)互補(bǔ)。在深入辨析和討論了CB-SEM和PLS-SEM適用情境、測(cè)量模型類型、評(píng)估參數(shù)等方面的差異后,提出了模型使用中應(yīng)注意的若干問(wèn)題。

關(guān)鍵詞:CB-SEM;PLS-SEM;結(jié)構(gòu)方程模型;教育實(shí)證研究

中圖分類號(hào):G434" " " "文獻(xiàn)標(biāo)識(shí)碼:A" " " "文章編號(hào):1003-8477(2023)05-0146-09

近年來(lái),實(shí)證方法在教育研究領(lǐng)域日益受到重視,許多教育研究者開始使用數(shù)理統(tǒng)計(jì)工具進(jìn)行量化實(shí)證研究。其中,結(jié)構(gòu)方程模型(Structural Equation Modeling,簡(jiǎn)稱SEM)是最重要的分析工具之一。從方法論層面看,SEM已成為社會(huì)科學(xué)實(shí)證研究中最重要的一種統(tǒng)計(jì)分析范式。以SSCI收錄的國(guó)際教育技術(shù)學(xué)頂級(jí)期刊Computers amp; Education為例,SEM已被廣泛用于研究MOOCs學(xué)習(xí)者的學(xué)習(xí)行為、①計(jì)算思維培養(yǎng)中的編程學(xué)習(xí)效能感、②在線外語(yǔ)學(xué)習(xí)的學(xué)習(xí)策略與動(dòng)機(jī)、③教師信息技術(shù)整合能力、④在線學(xué)習(xí)者的異步討論行為與參與度⑤等多種議題。相比國(guó)際研究,SEM在國(guó)內(nèi)教育學(xué)相關(guān)領(lǐng)域的應(yīng)用起步較晚。近年來(lái),在教育研究范式轉(zhuǎn)型的推動(dòng)下,國(guó)內(nèi)教育學(xué)領(lǐng)域的研究者們也逐漸開始熟悉SEM,并使用SEM開展本土研究。

SEM方法支持在測(cè)量模型(outer or measurement model)中估計(jì)潛變量,在結(jié)構(gòu)模型(inner or structural model)中檢驗(yàn)潛變量間的相互關(guān)系,比第一代統(tǒng)計(jì)分析技術(shù)具有更強(qiáng)的分析能力。執(zhí)行SEM的算法有很多,基于協(xié)方差(Covariance-based)的結(jié)構(gòu)方程模型(簡(jiǎn)稱CB-SEM)是目前使用最廣泛的方法之一,常用軟件有LISREL與AMOS,前述列舉的文獻(xiàn)使用的均是CB-SEM方法。而另一種基于方差的偏最小二乘法(Variance-based Partial Least Squares)結(jié)構(gòu)方程模型(簡(jiǎn)稱PLS-SEM)卻不太為國(guó)內(nèi)教育界研究者所了解。

PLS-SEM是Herman Wold在1975年基于經(jīng)濟(jì)計(jì)量分析的需求開發(fā)的一種建模技術(shù)。[1](p307)雖然與CB-SEM幾乎同時(shí)期產(chǎn)生,但因其理論的成熟速度及分析軟件包的開發(fā)比CB-SEM要遲滯,所以PLS-SEM的普及程度遠(yuǎn)不及CB-SEM。近年來(lái),隨著PLS-SEM的理論研究愈加成熟,PLS-SEM所具有的獨(dú)特優(yōu)勢(shì)逐漸被研究者所了解,PLS-SEM的應(yīng)用進(jìn)入逐步升溫階段。

相較于CB-SEM方法,PLS-SEM具有小樣本適用、不受數(shù)據(jù)多元正態(tài)分布限制、能同時(shí)兼容反映型和形成型測(cè)量模型等多重優(yōu)點(diǎn),[2](piii-xiv)而日漸成為采用SEM分析時(shí)的另一優(yōu)選工具。PLS-SEM在求解結(jié)構(gòu)方程模型中的諸多優(yōu)點(diǎn),與CB-SEM在應(yīng)用中的較多限制形成了互補(bǔ)優(yōu)勢(shì)。本文將深入分析PLS-SEM與CB-SEM的適用情境差異及應(yīng)用時(shí)的學(xué)術(shù)規(guī)范與標(biāo)準(zhǔn),希望有助于深化教育學(xué)研究者對(duì)結(jié)構(gòu)方程模型的理解和規(guī)范使用,激發(fā)更多元的研究可能性。

一、適用情境比較

結(jié)構(gòu)方程模型的一個(gè)重要特性就是能夠?qū)Τ橄蟮臉?gòu)面(construct)及其之間的影響關(guān)系進(jìn)行估計(jì)與檢驗(yàn)。這些難以被直接觀測(cè)到、復(fù)雜抽象的變量又稱為潛變量(latent variables)??梢赃M(jìn)行具體測(cè)量或被直接觀察到的變量,稱為指標(biāo)(indicators)、顯變量(manifest variable)、觀察變量(observed variable)或測(cè)量變量(measured variable)。本文統(tǒng)一使用潛變量和顯變量之稱。

(一)研究目的

CB-SEM具有驗(yàn)證式(confirmatory)而非探索型(exploratory)的技術(shù)特性,必須建立在一定的理論基礎(chǔ)上,通常用于檢驗(yàn)?zāi)骋幌绕谔岢龅睦碚撃P褪欠衽c現(xiàn)實(shí)數(shù)據(jù)適切。潛變量間的關(guān)系假設(shè)、顯變量對(duì)潛變量的外在表達(dá)、參數(shù)的設(shè)定和模型的修正等每一個(gè)步驟都必須要有清楚的理論基礎(chǔ)或邏輯推演。[3](p7)

PLS-SEM的應(yīng)用則偏向探索式而非驗(yàn)證式,適用于尚未有文獻(xiàn)表明潛變量間的關(guān)系或影響路徑時(shí),也經(jīng)常被研究者用于對(duì)現(xiàn)有理論模型的擴(kuò)展探索。PLS-SEM基于普通最小平方法(ordinary least squares,OLS),以目標(biāo)構(gòu)面R2值最大化為目的進(jìn)行路徑系數(shù)的估算,以達(dá)成對(duì)目標(biāo)變量的預(yù)測(cè)。[4](p143)因此,當(dāng)研究者的研究目標(biāo)是預(yù)測(cè)或解釋目標(biāo)構(gòu)面時(shí),PLS-SEM是較為適切的統(tǒng)計(jì)分析技術(shù)。

(二)數(shù)據(jù)正態(tài)性

CB-SEM通常使用最大似然法ML(Maximum Likelihood)進(jìn)行參數(shù)估計(jì),其基本假設(shè)是:收集到的數(shù)據(jù)都是從總體中抽取到的,這些樣本是所有可能抽取樣本中概率最大的,據(jù)此估計(jì)參數(shù)最能反映總體的特性。[3](p61)使用ML法必須保證數(shù)據(jù)具有正態(tài)性,否則難以得到無(wú)偏估計(jì)值。在進(jìn)行CB-SEM參數(shù)估計(jì)前,應(yīng)檢查顯變量數(shù)據(jù)的偏態(tài)與峰度,考察其是否符合正態(tài)分布。

與CB-SEM相比,PLS-SEM是一個(gè)無(wú)分布要求(Distribution-free)的加權(quán)回歸分析過(guò)程,因此對(duì)顯變量數(shù)據(jù)沒(méi)有硬性的正態(tài)分布要求,即在數(shù)據(jù)分布偏態(tài)的情況下,PLS-SEM也可獲得穩(wěn)定的估計(jì)解,[5](p342)但需要相應(yīng)增加樣本的數(shù)量。[6](piv)因此,實(shí)證研究中,如果數(shù)據(jù)不滿足正態(tài)分布的條件,PLS-SEM是一個(gè)較好的替代方法。

(三)樣本數(shù)量

CB-SEM基于最大似然法(Maximum Likelihood),其參數(shù)的估計(jì)是一個(gè)漸進(jìn)過(guò)程,為了獲得穩(wěn)定的參數(shù)估計(jì)及標(biāo)準(zhǔn)誤,CB-SEM必須使用較大規(guī)模的樣本。CB-SEM的樣本數(shù)量依據(jù)研究規(guī)模及潛變量數(shù)量而有較大差異。Ding等(1995)認(rèn)為100~150是最小樣本量,[7](p119-143)Schumacker等(2004)通過(guò)文獻(xiàn)研究認(rèn)為少于100~150個(gè)樣本,統(tǒng)計(jì)結(jié)果將是不穩(wěn)定的,大部分研究使用了250~500個(gè)樣本。如果模型潛變量超過(guò)10個(gè),樣本數(shù)低于200時(shí),則參數(shù)評(píng)估不穩(wěn)定。[8](p110)Jackson(2003)認(rèn)為在最大似然法估計(jì)下,模型潛變量與樣本數(shù)比值應(yīng)為1∶20,其中1∶10是樣本的最低要求,如果比值低于1∶5,則統(tǒng)計(jì)分析結(jié)果可信度不足。[9](p128-141)因此,對(duì)于一般的CB-SEM研究來(lái)說(shuō),大于200以上的樣本數(shù),可以稱為一個(gè)中型樣本。[3](p9)如果樣本數(shù)大于500,則執(zhí)行最大似然法時(shí),卡方值會(huì)膨脹嚴(yán)重,可能帶來(lái)模型適配度不佳的問(wèn)題。[10](p33)因此,對(duì)于CB-SEM而言,200~500應(yīng)該是一個(gè)比較合理的樣本區(qū)間。

小樣本適用是PLS-SEM的一個(gè)基本特性。Reinartz等(2009)的模擬研究表明,即使在小樣本(例如:100個(gè)樣本)情況下,PLS-SEM也能有較高水準(zhǔn)的統(tǒng)計(jì)檢定力。[5](p341)Hair等(2012)統(tǒng)計(jì)分析了1981—2010年發(fā)表在市場(chǎng)營(yíng)銷領(lǐng)域排名前30的國(guó)際期刊中的所有PLS-SEM模型——204項(xiàng)研究中共出現(xiàn)了311個(gè)PLS-SEM模型,其中24.44%的模型樣本數(shù)少于100,最小的樣本量甚至只使用了18個(gè)。[11](p420)Barclay等(1995)由此提出了一個(gè)十倍數(shù)原則,該原則認(rèn)為使用PLS-SEM方法時(shí),樣本量應(yīng)滿足下列情形之一:以單一構(gòu)面中具有最大顯變量的潛變量為基準(zhǔn),樣本數(shù)為該潛變量的顯變量數(shù)量的10倍;或結(jié)構(gòu)模型中單一潛在構(gòu)面中最多結(jié)構(gòu)路徑數(shù)量的10倍。以上原則屬于一般性原則,具體的樣本數(shù)量仍然要根據(jù)模型的復(fù)雜程度及數(shù)據(jù)特征做出綜合評(píng)估。[12](p285-309)

二、適用的測(cè)量模型比較

一個(gè)典型的SEM模型通常包括測(cè)量模型(measurement model)和結(jié)構(gòu)模型(structural model)兩個(gè)部分。在PLS-SEM中,這兩部分也被稱為外部模型(outer model)和內(nèi)部模型(inner model)。[13](p9)

(一)單一顯變量(題項(xiàng))

使用結(jié)構(gòu)方程模型開展實(shí)際研究時(shí),潛變量通常需要多個(gè)顯變量來(lái)指征,即設(shè)計(jì)問(wèn)卷時(shí)需要設(shè)計(jì)多個(gè)題項(xiàng)來(lái)完成對(duì)某個(gè)潛在構(gòu)面的測(cè)量。僅使用單一題項(xiàng)來(lái)測(cè)量和表征某個(gè)潛變量的情況比較少見(jiàn),采用單一顯變量而非多個(gè)顯變量,會(huì)使測(cè)量信度降低,測(cè)量效度不足。但單一顯變量這種情形卻也有其存在的現(xiàn)實(shí)意義,[13](p54)如:①確實(shí)存在某些潛在構(gòu)面對(duì)被調(diào)查者來(lái)說(shuō)是一維的,非常明確的,使用單一題項(xiàng)是最好的選擇;②從實(shí)測(cè)角度來(lái)看,相比冗長(zhǎng)的多題項(xiàng)問(wèn)答,單一題項(xiàng)的設(shè)計(jì)在實(shí)測(cè)時(shí)更容易實(shí)施,可以有效減少問(wèn)卷的長(zhǎng)度,降低被調(diào)查者不耐煩的情緒,提高問(wèn)卷的填答率和填答速度;③在一些模型中,需要引入可直接測(cè)量的變量,例如入學(xué)率、學(xué)習(xí)者容量、教育投入等,單一題項(xiàng)的使用是不可避免的。

單一題項(xiàng)在CB-SEM中會(huì)導(dǎo)致模型的結(jié)果非正定,但在PLS-SEM中則無(wú)此限制。Hair等(2012)統(tǒng)計(jì)的204篇文章中的311個(gè)模型,有144個(gè)模型(46.30%)都使用了含有單一顯變量的測(cè)量模型。[11](p422)盡管PLS-SEM具有可以處理單一顯變量的優(yōu)勢(shì),但在使用時(shí),Diamantopoulos等(2012)依然建議僅在以下情況使用單一題項(xiàng):①當(dāng)樣本數(shù)量小于50時(shí);②結(jié)構(gòu)模型中的路徑系數(shù)可能低于0.3時(shí);③同一潛變量對(duì)應(yīng)的多個(gè)顯變量具有很高同質(zhì)性時(shí)(Cronbach’s ɑ>0.90);④題項(xiàng)的語(yǔ)義重疊時(shí)。當(dāng)研究者使用有單一顯變量的測(cè)量模型時(shí),應(yīng)能預(yù)見(jiàn)到效度可能低于預(yù)期的結(jié)果。[14](p434-449)

(二)反映型與形成型測(cè)量模型

測(cè)量模型是反映型(reflective)還是形成型(formative)是使用結(jié)構(gòu)方程模型時(shí)的一個(gè)重要議題,即使在頂級(jí)國(guó)際期刊中,很多基于結(jié)構(gòu)方程模型的實(shí)證研究都存在錯(cuò)誤設(shè)定測(cè)量模型的問(wèn)題。Jarvis等(2003)的研究發(fā)現(xiàn):發(fā)表于國(guó)際頂級(jí)市場(chǎng)營(yíng)銷類期刊上的學(xué)術(shù)文章中,有28%都存在測(cè)量模型誤用的情況。[15](p207)

反映型測(cè)量模型是社會(huì)科學(xué)實(shí)證研究中最常用的類型??芍苯訙y(cè)量的顯變量是潛變量的具體表現(xiàn)或外在效果,其因果關(guān)系是從潛變量(即構(gòu)面)到顯變量,圖形表示時(shí)箭頭是從潛變量指向顯變量,這意味著同一潛變量指向的顯變量都是同一構(gòu)面的影響結(jié)果,這些顯變量之間具有高度的相關(guān)性,也因此,這些顯變量是具有可替代性的,只要構(gòu)面具有足夠的信度,刪除任一顯變量不會(huì)對(duì)構(gòu)面的內(nèi)涵造成減損。

形成型測(cè)量模型則相反,因果關(guān)系是從顯變量到潛變量,即顯變量的變化導(dǎo)致潛變量(構(gòu)面)的變化,顯變量是因,潛變量是果,多個(gè)顯變量共同導(dǎo)致潛變量的改變,在圖形中表示為從多個(gè)顯變量指向潛變量的箭頭。形成型測(cè)量模型中,顯變量之間不具有同一性,具有不可替代性,每一個(gè)顯變量都代表了所指潛變量?jī)?nèi)涵的一部分,所有顯變量合起來(lái)才形成潛變量的完整內(nèi)涵,因此,刪除任何顯變量都會(huì)造成所指潛變量?jī)?nèi)涵的減損。對(duì)于形成型測(cè)量模型來(lái)說(shuō),對(duì)應(yīng)顯變量的全面性是很重要的,以確保潛變量的內(nèi)涵能完整呈現(xiàn)。

反映型和形成型測(cè)量模型的錯(cuò)誤設(shè)定是使用結(jié)構(gòu)方程模型時(shí)最常出現(xiàn)的誤用,往往會(huì)導(dǎo)致有偏的參數(shù)估計(jì)及錯(cuò)誤估算潛變量之間的路徑系數(shù)。最常見(jiàn)的錯(cuò)誤是將形成型測(cè)量模型指定為反映型,這可能源于研究者對(duì)反映型測(cè)量模型的認(rèn)知程度遠(yuǎn)高于形成型測(cè)量模型。

不同領(lǐng)域的學(xué)者就反映型和形成型測(cè)量模型給出過(guò)不同的實(shí)例。①本文以網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)滿意度為例進(jìn)行說(shuō)明(圖1)。左圖為反映型測(cè)量模型,“喜歡”“會(huì)持續(xù)使用”和“向他人推薦”都是“對(duì)網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)滿意”的外在表現(xiàn),滿意度的變化會(huì)改變“喜歡”“會(huì)持續(xù)使用”和“向他人推薦”這三個(gè)顯變量的測(cè)量值,當(dāng)滿意度一定時(shí),上述三個(gè)顯變量具有同一性,越喜歡這個(gè)系統(tǒng),也就越可能持續(xù)使用它并向他人推薦。右圖是形成型測(cè)量模型,“課后服務(wù)好”“教學(xué)認(rèn)真負(fù)責(zé)”和“學(xué)習(xí)功能齊備”共同構(gòu)成了對(duì)網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)滿意的原因。上述三個(gè)測(cè)量值(顯變量)不具有同一性:課后服務(wù)好,并不代表教師教學(xué)認(rèn)真負(fù)責(zé);教師教學(xué)好,也并不意味著系統(tǒng)的學(xué)習(xí)支持功能齊備。三個(gè)顯變量都僅代表學(xué)習(xí)者滿意度中的一個(gè)面向,相互間不具有可替代性,刪除任何一個(gè),都會(huì)導(dǎo)致滿意度這個(gè)潛變量?jī)?nèi)涵的改變。

可兼容兩種測(cè)量模型是PLS-SEM相較CB-SEM的一個(gè)重要特征。CB-SEM通常情況下較難處理形成型測(cè)量模型,需要做構(gòu)面設(shè)定修正,而PLS-SEM可以妥善處理反映型和形成型測(cè)量模型,甚至是兩者的混合模型——MIMIC(multiple indicators and multiple causes)。

(三)二階(高階)模型

實(shí)證研究并不局限于單一層次構(gòu)面的使用,更高層次的模型(higher-order constructs)也正在被研究者們所掌握。使用高階構(gòu)面可減少模型中的關(guān)系路徑數(shù)量,簡(jiǎn)化整體模型。另外,當(dāng)?shù)碗A構(gòu)面間相關(guān)程度較高時(shí),可能會(huì)帶來(lái)區(qū)別效度不佳問(wèn)題,構(gòu)建高階構(gòu)面能降低共線性問(wèn)題。[13](p188)

高階模型的構(gòu)建仍需辨識(shí)不同階層間的關(guān)系是反映型還是形成型。以二階模型(second-order constructs)為例,根據(jù)兩個(gè)層級(jí)間的不同關(guān)系可以構(gòu)造出四種類型的二階模型(見(jiàn)圖2)。這些二階模型中,包含兩個(gè)層級(jí)的潛變量,分別是更具抽象內(nèi)涵的高階成分(higher-order component,HOC)和呈現(xiàn)較低本質(zhì)內(nèi)涵的低階成分(low-order components,LOCs)。低階成分的潛變量本身具有反映型或形成型指標(biāo)(顯變量)。同時(shí),這些低階成分的潛變量也是構(gòu)成高階成分的反映型或形成型指標(biāo)。[2](p204)以類型2為例,低階潛變量與顯變量(指標(biāo))之間為反映型,但與高階潛變量間為形成型,因此構(gòu)成一個(gè)反映型—形成型二階模型。此時(shí)二階測(cè)量模型應(yīng)作為一個(gè)完整的測(cè)量模型來(lái)看待,它們可以再與其他一階或二階潛變量建立路徑,構(gòu)成更為復(fù)雜的結(jié)構(gòu)方程模型。

高階測(cè)量模型可經(jīng)由兩條路徑構(gòu)建:自下而上或自上而下。[13](p188)自下而上指的是,低階潛變量可從實(shí)踐研究中抽取構(gòu)建,之后研究者可能發(fā)現(xiàn)這些低階成分還能進(jìn)一步合并或抽象為一個(gè)更高階的概念。此種模型構(gòu)建可依據(jù)文獻(xiàn),并結(jié)合扎根理論、訪談法、焦點(diǎn)小組等質(zhì)性研究方法進(jìn)行。自上而下指的是,模型構(gòu)建由一個(gè)已有的廣泛或抽象的高階概念出發(fā),向下逐步分解為多個(gè)低階子構(gòu)面(潛變量)。此種模型構(gòu)建更多依賴文獻(xiàn)中的現(xiàn)有理論框架。

實(shí)踐中,類型1的反映型—反映型二階模型最為常見(jiàn),這是CB-SEM能夠處理的高階模型類型。由于對(duì)形成型測(cè)量模型處理的局限性,類型2、類型3、類型4這三種帶有形成型關(guān)系的二階模型都難以在CB-SEM中評(píng)估。而PLS-SEM因?yàn)閷?duì)形成型關(guān)系的支持,在高階模型的處理上,比CB-SEM更具優(yōu)勢(shì),能夠?qū)D2中的四種二階模型進(jìn)行參數(shù)估計(jì)。在PLS-SEM中,類型1和類型2是應(yīng)用較多的二階模型種類。[16](p198)

評(píng)估高階測(cè)量模型的信效度與一階模型有所不同,研究者常犯的錯(cuò)誤有:①僅評(píng)估和檢驗(yàn)了低階測(cè)量模型的信效度,而忽略了整個(gè)高階結(jié)構(gòu)作為一個(gè)整體的信效度;②錯(cuò)誤地將高階潛變量與低階潛變量之間的關(guān)系理解為普通潛變量間的路徑關(guān)系,而不是把低階潛變量作為高階潛變量的組成元素。[17](p198)PLS-SEM對(duì)高階測(cè)量模型的估計(jì)檢驗(yàn)有兩種常用的方法,分別為(擴(kuò)展的)重復(fù)指標(biāo)法(repeated indicators approach)和兩階段法(two-stage approach),這兩種方法在樣本量足夠大的情況下,可得到近似的結(jié)果。[16](p199)

三、模型適配度判斷

CB-SEM與PLS-SEM背后的統(tǒng)計(jì)學(xué)原理和參數(shù)估算法完全不同,因此在進(jìn)行模型評(píng)估檢驗(yàn)時(shí)所考察的指標(biāo)項(xiàng)也有著很大差異。當(dāng)進(jìn)行模型檢定評(píng)估時(shí),需要分別基于不同的評(píng)價(jià)指標(biāo)對(duì)結(jié)構(gòu)模型和測(cè)量模型進(jìn)行測(cè)評(píng)。

(一)CB-SEM

CB-SEM以多個(gè)模型整體適配度指標(biāo)來(lái)評(píng)判模型的優(yōu)劣。這些適配度指標(biāo)表明了研究者擬定的初始理論模型與所收集到的數(shù)據(jù)集適合匹配的程度。評(píng)估CB-SEM模型適配度的指標(biāo)有卡方檢驗(yàn)(χ2" test)、GFI指數(shù)、AGFI指數(shù)、NFI指數(shù)等,[3](p88)如表1所示。

(二)PLS-SEM

PLS-SEM傾向于預(yù)測(cè)研究,重點(diǎn)以能代表模型預(yù)測(cè)力的指標(biāo)來(lái)考察模型的優(yōu)劣,使用的是非參數(shù)估計(jì)的評(píng)估準(zhǔn)則。Hair等(2012)建議使用PLS-SEM時(shí)將模型評(píng)估分為外模型(測(cè)量模型)的評(píng)估和內(nèi)模型(結(jié)構(gòu)模型)的評(píng)估,各自采用不同的考察指標(biāo);[11](p423-427)另外,PLS-SEM可兼容反映型測(cè)量模型和形成型測(cè)量模型,但兩種測(cè)量模型的評(píng)估指標(biāo)也完全不同。

1.反映型外模型(測(cè)量模型)評(píng)估

反映型測(cè)量模型的評(píng)估內(nèi)容包括顯變量信度、內(nèi)部一致性、收斂效度和區(qū)別效度,與CB-SEM的測(cè)量模型評(píng)估內(nèi)容相似,如表2所示。

2.形成型外模型(測(cè)量模型)

形成型測(cè)量模型的評(píng)估指標(biāo)主要包括權(quán)重值(表明指標(biāo)對(duì)構(gòu)面的貢獻(xiàn)度)、權(quán)重的顯著性檢驗(yàn)和指標(biāo)的多重共線性診斷三個(gè)部分。[13](p98)Diamantopoulos(2006)認(rèn)為,當(dāng)模型中含有形成型測(cè)量模型(形成型指標(biāo))時(shí),信度不再是測(cè)度質(zhì)量的標(biāo)準(zhǔn)。[17](p7-17)因此使用PLS-SEM評(píng)估形成型外部模型的首要指標(biāo)變更為權(quán)重(weight),同時(shí)權(quán)重值應(yīng)達(dá)到顯著。

單個(gè)指標(biāo)之間的多重共線性問(wèn)題也是形成型外部模型需要考察的內(nèi)容,因?yàn)橹笜?biāo)間的高共線性會(huì)使得指標(biāo)的權(quán)重不穩(wěn)定。通常形成型指標(biāo)的權(quán)重值會(huì)小于反映型指標(biāo)的因素負(fù)荷量,這可能會(huì)使得研究者錯(cuò)誤地解釋指標(biāo)的相關(guān)性。因此,PLS-SEM中形成型外部模型要求報(bào)告方差膨脹因子VIF,以此評(píng)估指標(biāo)間的多重共線性程度。

3.內(nèi)模型(結(jié)構(gòu)模型)評(píng)估

如果外模型通過(guò)檢驗(yàn),有較高的信效度,下一步則進(jìn)行內(nèi)模型評(píng)估。檢驗(yàn)內(nèi)容包括:模型路徑系數(shù)、R2、f2效果值和Q2值。[13](p138)

路徑表征了模型中各潛變量之間的假設(shè)關(guān)系。標(biāo)準(zhǔn)化的路徑系數(shù)能表明內(nèi)部模型的質(zhì)量?jī)?yōu)劣。標(biāo)準(zhǔn)化路徑系數(shù)介于-1—1之間。路徑系數(shù)的絕對(duì)值越接近1,則表示兩個(gè)潛變量之間正(負(fù))相關(guān)度越高,且通常都會(huì)達(dá)到顯著。若路徑系數(shù)絕對(duì)值接近0,則表示兩個(gè)潛變量之間關(guān)系微弱,且通常難以達(dá)到顯著水平。

內(nèi)模型檢驗(yàn)的重要指標(biāo)是決定系數(shù)R2(coefficient of determination)。R2表明了對(duì)每個(gè)內(nèi)部潛變量的方差解釋力。該系數(shù)是內(nèi)因潛變量的實(shí)際值與預(yù)測(cè)值相關(guān)系數(shù)的平方,代表模型中所有外生變量對(duì)內(nèi)因變量的整體解釋效果。R2值介于0—1之間,數(shù)值越高代表解釋力越強(qiáng)。R2值的可接受閾值因?qū)W科的不同而有較大差異,在管理學(xué)中研究顧客行為時(shí),0.2的R2值屬于較高水平,但在滿意度研究中,可能需要達(dá)到0.75以上才認(rèn)為是可接受的。Hair(2011)建議R2的值為0.75、0.50或0.25時(shí)可被認(rèn)為是顯著的、中度和微弱的解釋力。[4](p145)

f2效果值(f2 effect size)是通過(guò)檢驗(yàn)R2值的變化來(lái)衡量外部潛變量對(duì)內(nèi)部潛變量相對(duì)影響的測(cè)度指標(biāo)。刪除模型中特定的外部潛變量會(huì)使R2值發(fā)生變化,并由此可用來(lái)評(píng)估被刪除的變量對(duì)內(nèi)部變量是否具有顯著影響。f2的閾值為0.02、0.15、0.35時(shí)分別代表小效果、中效果和較大效果。[18](p71)

在評(píng)估模型的預(yù)測(cè)準(zhǔn)確性時(shí),還可參考Geisser(1974)和Stone(1974)提出的預(yù)測(cè)效度Q2值。①Q(mào)2值是模型預(yù)測(cè)相關(guān)性的一個(gè)指標(biāo)。Q2值大于0表明路徑模型與預(yù)測(cè)構(gòu)面具有預(yù)測(cè)相關(guān)性。

四、適用情境對(duì)比總結(jié)

為了指導(dǎo)研究者們正確使用CB-SEM和PLS-SEM,Hair等(2011)給出了以下建議:

第一,從研究目的考慮。研究目的如果是預(yù)測(cè)導(dǎo)向的,或者是探索性質(zhì)的,如對(duì)現(xiàn)有的理論模型進(jìn)行擴(kuò)展,則可選用PLS-SEM;如果研究目的是對(duì)現(xiàn)有理論模型的驗(yàn)證,或者對(duì)多個(gè)理論模型進(jìn)行比較,則可選擇CB-SEM。

第二,如果假設(shè)模型中包含形成型測(cè)量模型部分,則選擇PLS-SEM。CB-SEM雖然也能處理形成型測(cè)量模型,但計(jì)算相對(duì)復(fù)雜且具有限制條件。因此,當(dāng)模型中存在形成型模型時(shí),可優(yōu)先選擇PLS-SEM。

第三,如果假設(shè)模型結(jié)構(gòu)相對(duì)復(fù)雜,例如具有較多的潛變量和很多的顯變量,則可選擇使用PLS-SEM。如果模型是非遞歸的,則選擇CB-SEM。

第四,在數(shù)據(jù)收集階段,如果能夠獲得符合CB-SEM要求的樣本數(shù)量,且數(shù)據(jù)符合正態(tài)分布,則可選擇CB-SEM;如果樣本數(shù)量較小,或者數(shù)據(jù)不符合正態(tài)分布,則可選擇PLS-SEM。但PLS-SEM的最小樣本數(shù)也必須達(dá)到以下數(shù)量:①單個(gè)潛變量所含顯變量數(shù)量的十倍;或②結(jié)構(gòu)模型中指向單個(gè)潛變量的最大路徑數(shù)量的十倍。在樣本數(shù)量充足,且數(shù)據(jù)符合正態(tài)分布的情況下,CB-SEM和PLS-SEM的結(jié)果會(huì)高度近似,但CB-SEM可得到更為準(zhǔn)確的模型估計(jì)值。

第五,就模型估計(jì)而言,如果需要評(píng)估模型的整體適配度,或檢驗(yàn)測(cè)量模型的不變性,則使用CB-SEM;如果在后續(xù)研究中需要使用潛變量的分?jǐn)?shù),則使用PLS-SEM。[4](p144)

五、建議與結(jié)論

教育學(xué)是一門與實(shí)踐緊密結(jié)合的學(xué)科,教育學(xué)領(lǐng)域內(nèi)研究問(wèn)題的實(shí)踐性、學(xué)科的應(yīng)用性都決定了實(shí)證研究是教育學(xué)的重要研究范式。整合了“因素分析”與“路徑分析”兩大主流技術(shù),比回歸更加強(qiáng)健有力的結(jié)構(gòu)方程模型無(wú)疑是教育學(xué)實(shí)證研究的有力分析工具,其在研究學(xué)習(xí)者學(xué)習(xí)行為、新信息技術(shù)的接受度、網(wǎng)絡(luò)學(xué)習(xí)環(huán)境等議題中有著廣闊的應(yīng)用空間,同時(shí),對(duì)鏈?zhǔn)街薪椤⒍嘀刂薪?、調(diào)節(jié)效應(yīng)、高階模型、群組比較等多種擴(kuò)展應(yīng)用的支持顯現(xiàn)出廣闊的發(fā)展空間。在研究者采用SEM方法進(jìn)行研究時(shí),應(yīng)注意以下問(wèn)題:

第一,使用基于SEM的量化研究范式前,應(yīng)先明確研究的目的是驗(yàn)證式還是探索式;

第二,要注意樣本數(shù)量是否滿足CB-SEM或PLS-SEM的基本樣本量要求,樣本量不足極易導(dǎo)致出現(xiàn)錯(cuò)誤的分析結(jié)果;

第三,研究設(shè)計(jì)時(shí)對(duì)測(cè)量模型的設(shè)定要分清是反映型還是形成型,正確設(shè)定模型箭頭方向,并選用合適的統(tǒng)計(jì)建模技術(shù);

第四,在撰寫論文的實(shí)證過(guò)程和結(jié)果時(shí),CB-SEM和PLS-SEM有不同的結(jié)果報(bào)告內(nèi)容和要求。Hair等(2012)建議,采用PLS-SEM方法的論文應(yīng)包含以下六個(gè)部分:①闡述采用PLS-SEM方法的理由,如:數(shù)據(jù)非正態(tài)、小樣本數(shù)據(jù)、使用了形成型測(cè)量模型、探索性而非驗(yàn)證性的研究、理論模型較為復(fù)雜等;②描述數(shù)據(jù)特征,如:抽樣方法、樣本數(shù)量、數(shù)據(jù)分布是否正態(tài)等;③描述模型特征;④外部模型估計(jì);⑤內(nèi)部模型估計(jì);⑥結(jié)果報(bào)告。[11](p427)研究者要依照所采用方法的學(xué)術(shù)規(guī)范,報(bào)告對(duì)應(yīng)的統(tǒng)計(jì)參數(shù)估計(jì)值及模型檢驗(yàn)結(jié)果。

第五,謹(jǐn)慎對(duì)待模型擬合驗(yàn)證后的結(jié)論推導(dǎo)。正如侯杰泰(2004)所指出的,實(shí)證數(shù)據(jù)對(duì)某一個(gè)假設(shè)理論模型的良好擬合,并不應(yīng)當(dāng)被解釋為該假設(shè)理論模型是完全正確的,它可能只是若干可能模型中較好的一個(gè),該模型可能是所有模型中尚未被否定的模型之一。[19](p145)因此,研究者在對(duì)假設(shè)模型進(jìn)行擬合檢驗(yàn)后,應(yīng)避免結(jié)論的過(guò)度引申和結(jié)論的絕對(duì)化傾向。[3](p397)

進(jìn)入大數(shù)據(jù)時(shí)代,各類決策與發(fā)現(xiàn)都越來(lái)越依賴量化數(shù)據(jù),以數(shù)據(jù)為導(dǎo)向的決策需要社會(huì)科學(xué)研究者熟練掌握數(shù)理統(tǒng)計(jì)研究工具。本文深入辨析和討論了結(jié)構(gòu)方程模型中的CB-SEM和PLS-SEM建模技術(shù)各自的適用情境,教育學(xué)領(lǐng)域的研究者可充分了解兩者各自的特性及差異,正確選用適宜的統(tǒng)計(jì)建模方法,進(jìn)而更好地提升研究品質(zhì)。

參考文獻(xiàn):

[1]Wold H. Path Models with Latent Variables: The NIPALS Approach[M]//Blalock H M, Aganbegian A, Borodkin F M, et al. Quantitative Sociaology: International Perspectives on Mathematical and Statistical Modeling. New York:Academic, 1975.

[2]Ringle C M, Sarstedt M, Straub D W. A Critical Look at the Use of PLS-SEM in MIS Quarterly[J]. MIS Quarterly,2012, 35(1).

[3]邱皓政,林碧芳.結(jié)構(gòu)方程模型的原理與應(yīng)用[M].北京:中國(guó)輕工業(yè)出版社,2012.

[4]Hair J F, Ringle C M, Sarstedt M. PLS-SEM: Indeed a Silver Bullet [J]. Journal of Marketing Theory and Practice,2011, 19(2).

[5]Reinartz W, Haenlein M, Henseler J. An Empirical Comparison of the Efficacy of Covariance-based and Variance-based SEM[J].International Journal of Research in Marking, 2009,(26).

[6]Marcoulides G A, Saunders C. PLS: A Silver Bullet? [J]. MIS Quarterly,2006, 30(2).

[7]Ding L, Velicer W, Harlow L. Effect of Estimation Methods, Number of Indicators Per factor and Improper Solutions on Structural Equation Modeling Fit Indices [J]. Structural Equation Modeling,1995, 2(2).

[8]Schumacker R E, Lomax R G. A Beginners Guide to Structural Equation Modeling (2nd ed.)[M]. Mahwah, NJ: Lawrence Erlbaum Associates, 2004.

[9]Jackson D L. Revisiting Sample Size and Number of Parameter Estimates: Some Support for the N:q Hypothesis[J]. Structural Equation Modeling, 2003, 10.

[10]張偉豪,鄭時(shí)宜.與結(jié)構(gòu)方程模型共舞:曙光初現(xiàn)[M].臺(tái)北:前程文化事業(yè)有限公司,2012.

[11]Hair J F, Sarstedt M, Ringle C M. An Assessment of the Use of Partial Least Squares Structural Equation Modeling in Marketing Research [J]. Journal of the Academy of Marketing Science,2012, 40.

[12]Barclay D W, Higgins C A, Thompson R. The Partial Least Squares Approach to Causal Modeling: Personal Computer Adoption and Use as Illustration[J]. Technology Studies, 1995,(2).

[13]Hair Joseph F.,Jr. G. Tomas M. Hult,Ringle Christian M.,等.結(jié)構(gòu)方程模式:偏最小平方法PLS-SEM[Z].湯家偉,譯.臺(tái)北:高教出版(臺(tái)灣),2016.

[14]Diamantopoulos A, Sarstedt M, Fuchs C, et al. Guidelines for Choosing Between Multi-item and Single-item Scales for Construct Measurement: A Predictive Validity Perspective[J]. Journal of the Academy of Marketing Science, 2012, 40.

[15]Jarvis C B, Mackenzie S B, Podsakoff P M. A Critical Review of Construct Indicators and Measurement Model Misspecification in Marketing and Consumer Research[J]. Journal of Consumer Research, 2003, 30(2).

[16]Sarstedt M, Hair J F, Cheah J H, et al. How to Specify, Estimate, and Validate Higher-order Constructs in PLS-SEM[J].Australasian Marketing Journal, 2019, 27.

[17]Diamantopoulos A. The Error Term in Formative Measurement Models: Interpretation and Modeling Implications [J]. Journal of Modeling in Management,2006, 1.

[18]Cohen J. Statistical Power" Analysis for the Behavioral Sciences[M]. Mahwah, NJ: Lawrence Erlbaum, 1988.

[19]侯杰泰,溫忠麟,成子娟.結(jié)構(gòu)方程模型及其應(yīng)用[M].北京:教育科學(xué)出版社,2004.

責(zé)任編輯" "王" "京

CB-SEM and PLS-SEM:Comparison of Structural Equation

Models in Educational Empirical Research

Qin Chao

(School of Education ,Yunnan Minzu University, Kunming, Yunnan 650504, China)

Abstract: The research of pedagogy is oriented towards practice and application, which determines that the empirical research method is an important paradigm. Structural equation modeling is a powerful statistical analysis tool for educational empirical research. It has broad application space in analyzing the learners behavior, new technology acceptance, and network learning environment satisfaction etc. CB-SEM is currently the most widely used method, while the squares structural equation model— PLS-SEM is not well known by academic researchers. Compared with CB-SEM, PLS-SEM has many advantages, such as suitable for small samples, non-normal data, and complex models and compatible with the formative measurement model. It is a good complementary method for CB-SEM. After in-depth analysis and discussion of the differences between CB-SEM and PLS-SEM in applicable context, measurement model types, evaluation parameters and other aspects, then puts forward some issues that should be paid attention to when use SEM, which may contribute to the improvement of the qualification of educational empirical research.

Keywords: CB-SEM; PLS-SEM; structural equation modeling; empirical research in education

乌拉特中旗| 沛县| 榕江县| 秦皇岛市| 沾化县| 色达县| 嘉鱼县| 东丰县| 亚东县| 新龙县| 离岛区| 长武县| 云安县| 天气| 安阳市| 信宜市| 屏东县| 白城市| 霍州市| 化德县| 时尚| 普洱| 库车县| 阿拉尔市| 肥乡县| 岳普湖县| 黔西县| 陆良县| 德化县| 锦屏县| 探索| 上犹县| 阿瓦提县| 乐安县| 陆河县| 巴塘县| 耿马| 五寨县| 武川县| 库伦旗| 秦皇岛市|