張晨,周云仙
隨著我國護(hù)理科研的發(fā)展,測量工具的開發(fā)及漢化日益廣泛。這其中常涉及信效度檢驗(yàn)。其中效度是指某一測量工具能真正反映其所要測量概念的程度,主要用內(nèi)容效度、結(jié)構(gòu)效度和效標(biāo)效度等指標(biāo)來反映[1]。內(nèi)容效度(Content Validity)是指測量工具中的條目能夠充分展現(xiàn)所測量內(nèi)容的程度[1],是測量工具質(zhì)量的重要體現(xiàn)[2]。有學(xué)者[3]認(rèn)為,提高一項(xiàng)測量工具的內(nèi)容效度是改善其結(jié)構(gòu)效度的早期關(guān)鍵步驟。內(nèi)容效度評價(jià)主要通過專家函詢來獲得條目與測量內(nèi)容的相關(guān)信息,并計(jì)算相應(yīng)的指標(biāo)。目前,在護(hù)理研究者中,對測量工具內(nèi)容效度進(jìn)行量化最常用的指標(biāo)是內(nèi)容效度指數(shù)(Content Validity Index,CVI)[2,4]。有學(xué)者將CVI與其他指標(biāo)進(jìn)行了比較,認(rèn)為其具有計(jì)算簡單、易于理解、注重相關(guān)性而非專家間的一致性以及能同時(shí)提供條目和測量工具評價(jià)信息等優(yōu)點(diǎn)[3-4]。然而,在實(shí)際護(hù)理研究報(bào)告中,常常存在對CVI認(rèn)識及應(yīng)用上的誤區(qū)。本文主要對我國護(hù)理文獻(xiàn)測量工具開發(fā)中應(yīng)用CVI進(jìn)行內(nèi)容效度檢驗(yàn)時(shí)存在的主要問題進(jìn)行剖析,并提出針對性的參考建議,以期減少相應(yīng)的不規(guī)范應(yīng)用,幫助護(hù)理研究者更加科學(xué)、有效地開發(fā)測量工具。
1.1一般資料 以中國期刊全文數(shù)據(jù)庫(CNKI)、萬方數(shù)據(jù)庫及中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(CBM)為檢索源。檢索內(nèi)容為護(hù)理領(lǐng)域涉及內(nèi)容效度的文獻(xiàn)。檢索策略為(量表OR問卷)AND(信效度OR效度)。納入標(biāo)準(zhǔn):①我國護(hù)理領(lǐng)域公開發(fā)表的測量工具開發(fā)方面涉及內(nèi)容效度的文獻(xiàn);②發(fā)表時(shí)間范圍為2018年7月1日至2019年6月30日;③發(fā)表期刊為2018年中國科技期刊引證報(bào)告中納入核心期刊庫的10種護(hù)理類期刊,分別是《中華護(hù)理雜志》、《護(hù)理學(xué)雜志》、《中國護(hù)理管理》、《中國實(shí)用護(hù)理雜志》、《護(hù)理學(xué)報(bào)》、《護(hù)理研究》、《解放軍護(hù)理雜志》、《現(xiàn)代臨床護(hù)理》、《中華現(xiàn)代護(hù)理雜志》和《護(hù)士進(jìn)修雜志》。排除標(biāo)準(zhǔn):①未應(yīng)用CVI進(jìn)行內(nèi)容效度檢驗(yàn)的文獻(xiàn);②重復(fù)的文獻(xiàn)。
1.2檢索結(jié)果 分別于CNKI、萬方數(shù)據(jù)庫及CBM中檢索得到文獻(xiàn)89篇、161篇及95篇。根據(jù)納排標(biāo)準(zhǔn)剔除文獻(xiàn)235篇,其中不符合納入標(biāo)準(zhǔn)的文獻(xiàn)28篇,未應(yīng)用CVI進(jìn)行內(nèi)容效度檢驗(yàn)的文獻(xiàn)33篇,重復(fù)文獻(xiàn)174篇。最終納入110篇文獻(xiàn)進(jìn)行評析。
1.3論文評析過程 根據(jù)內(nèi)容效度內(nèi)涵、測量工具內(nèi)容效度評價(jià)相關(guān)權(quán)威文獻(xiàn)[1-8]制定評價(jià)標(biāo)準(zhǔn),并提交1名公共衛(wèi)生、1名統(tǒng)計(jì)學(xué)及1名量表研制專家審核通過。為減少偏倚,由2名研究者分別根據(jù)評價(jià)標(biāo)準(zhǔn)分析現(xiàn)有文獻(xiàn),指出其中的錯(cuò)誤認(rèn)識及不當(dāng)做法,并提出參考性建議。若2名研究者的意見不完全相同,則在雙方討論基礎(chǔ)上請第3名測量工具研制專家獨(dú)立提出意見。
在我國護(hù)理領(lǐng)域相關(guān)文獻(xiàn)中,CVI的應(yīng)用主要在專家選擇與描述、專家函詢與評分、CVI的計(jì)算與描述這三方面存在問題。
2.1專家選擇與描述方面存在的問題 見表1。
表1 專家選擇與描述方面存在的問題(n=110)
2.2專家函詢與評分方面存在的問題 見表2。
表2 專家函詢與評分方面存在的問題(n=110)
2.3CVI的計(jì)算與呈現(xiàn)方面存在的問題 見表3。
表3 CVI的計(jì)算與呈現(xiàn)方面存在的問題(n=110)
本文通過對110篇相關(guān)文獻(xiàn)進(jìn)行分析整理、歸納出護(hù)理領(lǐng)域測量工具CVI應(yīng)用中存在的3大問題。其中,未闡明CVI的計(jì)算方法、未說明S-CVI的類型、未報(bào)道I-CVI的計(jì)算結(jié)果等問題與Polit等[5]的研究結(jié)果一致。筆者針對所歸納的問題提出了相應(yīng)的建議,具體如下。
3.1選擇合適的專家并詳細(xì)描述 目前沒有客觀的測量方法來檢驗(yàn)測量工具的內(nèi)容效度。研究人員通常依靠專家小組對測量工具進(jìn)行相關(guān)性評價(jià)來計(jì)算CVI[3]。因此,專家的選擇在內(nèi)容效度評價(jià)中十分重要。專家小組成員的信息是幫助讀者更好地判斷該測量工具內(nèi)容效度可靠性的重要因素,因此研究者在論文中詳細(xì)介紹專家的區(qū)域、職務(wù)、資歷等方面的信息十分重要。
本研究發(fā)現(xiàn),所納入的110篇文獻(xiàn)中,部分研究未能體現(xiàn)出專家所處專業(yè)或領(lǐng)域的豐富性,如均為護(hù)理臨床工作者或護(hù)理專業(yè)教師等,而無臨床醫(yī)生、心理學(xué)專家或醫(yī)院管理者等其他與研究內(nèi)容相關(guān)的專業(yè)人員;部分研究未從多個(gè)地區(qū)選擇進(jìn)行CVI評價(jià)的專家成員,可能會局限測量工具的使用范圍。在專家信息的描述上,部分研究未能詳細(xì)介紹專家的數(shù)量、學(xué)歷、職稱、測量工具構(gòu)建能力和所處地區(qū)等,從而無法判斷專家進(jìn)行CVI評價(jià)的資質(zhì)和CVI評價(jià)的有效性。
內(nèi)容效度的評價(jià)建立在大量文獻(xiàn)查閱、工作經(jīng)驗(yàn)以及綜合分析、判斷的基礎(chǔ)之上[1]。因此,建議選擇熟悉測量內(nèi)容,具有相關(guān)資質(zhì)并了解目標(biāo)人群的專家小組成員,且研究者在選擇專家時(shí)應(yīng)在專業(yè)和學(xué)科方面進(jìn)行良好地組合,如專家小組成員既包括臨床醫(yī)生、護(hù)士、教師和研究人員,也包括有豐富的工具構(gòu)建經(jīng)驗(yàn)的專家[6]。此外,如果測量工具將進(jìn)行廣泛應(yīng)用,因?yàn)檎Z言等可能存在區(qū)域差異,建議邀請不同國家或同一國家不同區(qū)域的專家[3]。在專家人數(shù)方面,由于一般建議進(jìn)行兩輪評價(jià),因此不同階段的專家選擇也有不同。在初始評價(jià)階段,建議選取由8~12名成員組成的專家小組來修訂或剔除有問題的條目,或增加新條目,以充分涵蓋有關(guān)范疇。研究者依照專家意見對測量工具進(jìn)行修改后再進(jìn)行第二輪評價(jià)。在第二輪評價(jià)中,可選擇3~10名專家小組成員,其目的是正式評價(jià)條目及測量工具內(nèi)容的有效性[3,6]。在該輪評價(jià)中,建議選用來自首次評價(jià)小組的部分專家,因?yàn)檫@樣可以根據(jù)首次專家評價(jià)的信息來選擇最合適的評價(jià)者。例如,可以基于第一輪評價(jià)結(jié)果識別出那些不理解或不熟悉評價(jià)內(nèi)容的專家,那些傾向于給高或低評級的專家,或者那些可能有偏見的專家[3]。2次評價(jià)的時(shí)間最好間隔10~14 d,以免由于時(shí)間過短,專家對第1次評價(jià)結(jié)果尚有印象,而影響第2次的評價(jià)結(jié)果[8]。
3.2選用恰當(dāng)?shù)淖稍兒虲VI評價(jià)表 專家函詢是內(nèi)容效度評價(jià)的主要組成部分,其能影響最終評價(jià)結(jié)果。其中,應(yīng)用CVI評價(jià)表進(jìn)行評分是專家函詢的重要環(huán)節(jié)。明確、恰當(dāng)?shù)脑u分表和評分標(biāo)準(zhǔn)是研究嚴(yán)謹(jǐn)性和可靠性的重要保證。可能由于對咨詢函的重視不足,僅少量研究描述了進(jìn)行專家函詢時(shí)所采用的咨詢函的基本內(nèi)容;僅少量研究在請專家進(jìn)行內(nèi)容效度評價(jià)的同時(shí)通過邀請專家補(bǔ)充條目等方式來評價(jià)測量工具的全面性。在評分方面,部分研究未描述進(jìn)行內(nèi)容效度評價(jià)時(shí)專家所采用的評分方法類型;有研究在進(jìn)行內(nèi)容效度評價(jià)時(shí),誤用德爾菲法的條目重要性評價(jià)來計(jì)算CVI。
介紹發(fā)給專家的咨詢函,能夠幫助讀者了解專家對該項(xiàng)測量工具評價(jià)的了解程度,增加可靠性。建議專家咨詢函包括介紹信、研究簡介、CVI評價(jià)表和意見征求表[7,9]。此外,還可以向?qū)<倚〗M簡要介紹相關(guān)文獻(xiàn)和參考書目[3]。介紹信建議說明開發(fā)該測量工具的原因及意義,選擇該名專家的原因及需要專家評價(jià)的內(nèi)容。研究簡介建議說明該項(xiàng)測量工具的主要內(nèi)容、相關(guān)概念的定義和概念所包含的維度等[6],從而讓專家了解理論背景以更好地提供評價(jià)。CVI的缺點(diǎn)在于其只關(guān)注測量工具已有條目與相應(yīng)內(nèi)容的相關(guān)性,對測量工具所包含的條目的綜合性和全面性的關(guān)注不足[5]。因此,建議在意見征求表中設(shè)置關(guān)于條目綜合性和全面性的問題,如增設(shè)“增加條目”欄,詢問專家條目是否有明顯的遺漏,測量工具中的每個(gè)維度是否有足夠數(shù)量的條目等[2-3]。在CVI評價(jià)表中,專家需對每一個(gè)條目進(jìn)行評價(jià)。因奇數(shù)等級評分制常出現(xiàn)矛盾的中間等級[8],一般推薦采用4分制,其中“1”代表該條目與研究內(nèi)容完全不相關(guān);“2”代表該條目與研究內(nèi)容弱相關(guān),若采用需要進(jìn)行重大修訂;“3”代表該條目與研究內(nèi)容比較相關(guān),若采用需要小的修改;“4”代表該條目與研究內(nèi)容非常相關(guān)[1]。若評分標(biāo)準(zhǔn)不明確,則讀者較難判斷內(nèi)容效度評價(jià)的有效性。另外,有研究采用德爾菲法的內(nèi)容進(jìn)行CVI計(jì)算,前者是建立在各條目的“有效性、適用性、可行性或重要性”的基礎(chǔ)上的,而后者則基于條目與研究內(nèi)容之間的相關(guān)性,表示各條目能否反映相應(yīng)的概念和維度。因此,在應(yīng)用時(shí)應(yīng)注意兩者間的區(qū)別,不宜混淆使用。
3.3正確計(jì)算并呈現(xiàn)CVI結(jié)果CVI的計(jì)算以及根據(jù)計(jì)算結(jié)果對測量工具內(nèi)容效度進(jìn)行判斷是內(nèi)容效度評價(jià)的重要步驟,準(zhǔn)確的計(jì)算和判斷是內(nèi)容效度檢驗(yàn)可靠的表現(xiàn)。因此,詳細(xì)、正確地呈現(xiàn)CVI計(jì)算和評價(jià)結(jié)果有助于讀者獲取有效信息。
本研究發(fā)現(xiàn),在CVI的計(jì)算方面,僅少量研究先計(jì)算評定者間一致性(Inter-rater Agreement)[6],在計(jì)算結(jié)果較好的情況下再對CVI進(jìn)行計(jì)算;部分研究計(jì)算CVI的方法不正確,如有研究誤將專家對某條目的評分相加后除以條目的最高可能總分作為條目水平內(nèi)容效度指數(shù)(Item-levelCVI,I-CVI)。在計(jì)算和計(jì)算結(jié)果呈現(xiàn)方面,少量未采用4分制評價(jià)的研究者未闡明計(jì)算I-CVI時(shí)選擇評分幾分以上的專家數(shù)除以專家總數(shù);部分研究僅報(bào)道測量工具水平的內(nèi)容效度指數(shù)(Scale-levelCVI,S-CVI)結(jié)果,而未報(bào)道I-CVI的計(jì)算結(jié)果;較多研究未在摘要或正文中標(biāo)識S-CVI的類型,僅簡單表述為“量表總CVI”等;部分研究在評價(jià)測量工具時(shí),其專家數(shù)量為5人或5人以下且I-CVI不為1.00,卻描述該項(xiàng)測量工具的內(nèi)容效度良好。
有學(xué)者建議,在計(jì)算CVI之前應(yīng)先算出評定者間一致性,具體方法為被所有專家評分為1或2的條目數(shù)加上被所有專家評分為3或4的條目數(shù)除以條目總數(shù)[7]。若評定者間一致性低于0.7,研究者應(yīng)與專家溝通以確認(rèn)專家間對函詢表中測量概念和維度的定義是否一致,評分等級的設(shè)計(jì)是否恰當(dāng)?shù)?;若評定者間一致性不低于0.7,可進(jìn)一步計(jì)算CVI[2,6]。
CVI分為I-CVI和S-CVI。采用4分制時(shí),I-CVI的計(jì)算方法為以單個(gè)條目為單位,評分為3或4的專家數(shù)除以專家總數(shù)[1]。若研究者采用3分制或5分制,建議說明具體的計(jì)算方法。Lynn[8]認(rèn)為I-CVI的評價(jià)標(biāo)準(zhǔn)應(yīng)根據(jù)專家人數(shù)而定:當(dāng)專家人數(shù)≤5人時(shí),所有專家均認(rèn)為該條目與相應(yīng)的概念內(nèi)容有較好的相關(guān)性,即I-CVI應(yīng)為1.00,才認(rèn)為這個(gè)條目的內(nèi)容效度良好;而當(dāng)專家人數(shù)≥6人時(shí),要求I-CVI的最小值為0.78[2,4]。由于各個(gè)條目的I-CVI可能不同,所以建議研究者呈現(xiàn)每個(gè)條目的I-CVI情況或各條目的I-CVI數(shù)值范圍。S-CVI有2種類型[3],①全體一致S-CVI(S-CVI/Universal Agreement,S-CVI/UA)。S-CVI/UA是指被所有專家評為3或4分的條目數(shù)占全部條目數(shù)的百分比,反映的是專家全體一致認(rèn)為相關(guān)的情況。若S-CVI/UA不低于0.8,則提示測量工具內(nèi)容效度較好[4]。S-CVI/UA的數(shù)值可隨專家數(shù)量而變化,當(dāng)專家人數(shù)增多時(shí),意見不完全一致的可能性增大,因此,可能出現(xiàn)每個(gè)條目的I-CVI都較好,但S-CVI/UA較低的情況[10]。②平均S-CVI(S-CVI/average,S-CVI/Ave)。S-CVI/Ave的計(jì)算方法有3種:測量工具所有I-CVI的均數(shù);每個(gè)專家評分為3或4的條目占所有條目的比例的均數(shù);評分為3或4出現(xiàn)的次數(shù)除以總評定數(shù)。這3種方法的結(jié)果均一致,多推薦使用第1種計(jì)算方法,因?yàn)槠淠軐-CVI做較好的承接,也便于理解[2]。若SCVI/Ave不低于0.90,則提示測量工具內(nèi)容效度較好[4]。由于對同一資料,2種S-CVI的計(jì)算結(jié)果可能相差較大,且相應(yīng)的評判標(biāo)準(zhǔn)不同,所以建議研究者標(biāo)明S-CVI類型或計(jì)算方式和所采用的評判標(biāo)準(zhǔn)。
此外,由于兩個(gè)或多個(gè)專家對條目與相應(yīng)維度的相關(guān)性評價(jià)一致可能是由于他們對選項(xiàng)的隨機(jī)選擇造成的[11],因此有學(xué)者建議,應(yīng)當(dāng)對這種隨機(jī)一致性(Chance Agreement)進(jìn)行校正,計(jì)算調(diào)整后的Kappa值[4]。Kappa值根據(jù)該條目的隨機(jī)一致性和I-CVI計(jì)算獲得,通常I-CVI越大,Kappa值也越高。校正隨機(jī)一致性后,I-CVI不小于0.78,提示該測量工具的內(nèi)容效度較好。
CVI在護(hù)理測量工具開發(fā)領(lǐng)域應(yīng)用廣泛,但研究者在論文書寫時(shí)往往對CVI相關(guān)內(nèi)容描述得較簡略,且存在一定的應(yīng)用誤區(qū),主要在專家選擇與描述、專家函詢與評分、CVI的計(jì)算與描述這三方面存在問題。護(hù)理研究者應(yīng)加強(qiáng)相關(guān)知識學(xué)習(xí),正確應(yīng)用該方法,如選擇合適的專家小組成員、采用恰當(dāng)?shù)腃VI評價(jià)表、保證CVI的計(jì)算正確等,并在論文書寫時(shí)增加關(guān)鍵信息的描述,以加強(qiáng)測量工具開發(fā)的科學(xué)性和嚴(yán)謹(jǐn)性。