南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計(jì)學(xué)系(510515) 安勝利張海蘭
基于對(duì)應(yīng)分析的分類變量一致性評(píng)價(jià)量化指標(biāo)的構(gòu)建*
南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計(jì)學(xué)系(510515) 安勝利△張海蘭
目的將對(duì)應(yīng)分析(correspondence analysis,CA)應(yīng)用于臨床診斷試驗(yàn)的一致性評(píng)價(jià),構(gòu)建基于CA的一致性評(píng)價(jià)量化指標(biāo),提高其在一致性評(píng)價(jià)應(yīng)用中的客觀性。方法根據(jù)CA的具體算法構(gòu)造出距離矩陣,參考kappa系數(shù)的原理,利用SAS9.1構(gòu)造一致性評(píng)價(jià)量化指標(biāo)(分別簡(jiǎn)稱CBD和CCBD);通過(guò)不同情形下的模擬數(shù)據(jù)和實(shí)例對(duì)量化指標(biāo)進(jìn)行可靠性和實(shí)用性考核。結(jié)果兩個(gè)待評(píng)價(jià)方法時(shí),CBD和kappa均與符合率存在較高的正相關(guān);多個(gè)待評(píng)價(jià)方法時(shí),CBD或CCBD分別與kappa或fleisskappa成正相關(guān)。對(duì)于存在kappa悖論的資料,CBD表現(xiàn)出相對(duì)于kappa較高的穩(wěn)定性。此外,CBD或CCBD與其相應(yīng)的對(duì)應(yīng)分析圖得出的結(jié)論亦吻合。結(jié)論基于CA所構(gòu)建的一致性評(píng)價(jià)量化指標(biāo)是客觀可靠的,對(duì)于臨床科研中的一致性評(píng)價(jià)具有重要的理論和實(shí)際意義。
對(duì)應(yīng)分析 一致性評(píng)價(jià) 量化指標(biāo)
隨著醫(yī)學(xué)不斷發(fā)展,新診斷方法、新治療方法層出不窮,在臨床科研中常常需研究它們與傳統(tǒng)方法或金標(biāo)準(zhǔn)的一致性。kappa是對(duì)分類變量進(jìn)行一致性評(píng)價(jià)的常用指標(biāo),但此方法不直觀,且存在要求測(cè)量結(jié)果分類數(shù)相等、kappa悖論等問(wèn)題[1]。所謂kappa悖論是指由于特定數(shù)據(jù)的分布原因,導(dǎo)致用kappa評(píng)價(jià)一致性的結(jié)果與實(shí)際觀察到的符合率結(jié)果相背離。Helena等人曾經(jīng)對(duì)kappa系數(shù)的缺陷進(jìn)行過(guò)探討和改進(jìn)[2-4]。對(duì)應(yīng)分析(correspondence analysis,CA)又稱R-Q型因子分析,是多維圖示分析技術(shù)的一種,主要用于分類變量的關(guān)聯(lián)性分析[5-8],可藉圖形直觀表達(dá)結(jié)果的一致性,但因其結(jié)論具有一定的主觀性,從而限制了CA在一致性評(píng)價(jià)中的應(yīng)用。近年來(lái),有學(xué)者曾提出通過(guò)構(gòu)造量化指標(biāo)來(lái)改進(jìn)對(duì)應(yīng)分析的構(gòu)想[9],但并未進(jìn)一步探討實(shí)現(xiàn)。本研究將以CA的原理和算法為基礎(chǔ),并參照kappa系數(shù)的原理[2,10-11],構(gòu)建能反映分類變量之間一致性情況的量化指標(biāo),即兩變量一致性指標(biāo)(correspondence based distance,CBD)和多變量一致性指標(biāo)(combined correspondence based distance,CCBD)。通過(guò)模擬不同情形下的數(shù)據(jù)和實(shí)例對(duì)量化指標(biāo)進(jìn)行考核,且與kappa系數(shù)比較,驗(yàn)證CBD和CCBD的實(shí)用性和可靠性,以期構(gòu)建一個(gè)相對(duì)客觀、直觀、可靠的一致性評(píng)價(jià)方法。
對(duì)應(yīng)分析中得到的慣量比例是指各維度(公因子)分別解釋總慣量的比例及累計(jì)百分比,一般取累計(jì)百分比達(dá)到較高時(shí)的維度,本研究將對(duì)三維以下維度的情況進(jìn)行研究。根據(jù)對(duì)應(yīng)分析原理可以得到對(duì)應(yīng)分析圖中各散點(diǎn)的坐標(biāo),通過(guò)計(jì)算可得到各散點(diǎn)之間的距離矩陣,本研究參照kappa系數(shù)的原理,應(yīng)用各散點(diǎn)之間的距離矩陣構(gòu)造出一個(gè)新的量化指標(biāo)。具體構(gòu)造步驟如下:
1.進(jìn)行對(duì)應(yīng)分析,得到對(duì)應(yīng)分析圖和各變量各分類的一維或二維坐標(biāo)(xij,yij),其中i是變量個(gè)數(shù),j是各變量的分類數(shù)。
2.利用以上各點(diǎn)坐標(biāo)構(gòu)建所有變量各分類之間的距離對(duì)稱矩陣Dij(所有變量所有分類數(shù)的總和,i=j(luò))。
3.參考kappa系數(shù)的原理[2,4],構(gòu)造一致性量化指標(biāo)(CBD和CCBD):kappa系數(shù)的原理和計(jì)算公式是根據(jù)行列表的邊緣概率構(gòu)造的,據(jù)此,本研究亦通過(guò)以上距離矩陣得到邊緣概率,構(gòu)造出基于距離矩陣的一致性量化指標(biāo)。兩變量和多變量的構(gòu)造方法有所不同,具體如下:
(1)只有兩個(gè)變量時(shí),所用距離矩陣為Dij的子集,行為第一個(gè)變量的各分類,列為第二個(gè)變量的各分類,一致性量化指標(biāo)CBD(取值范圍為[-1,1]):
上式中,cap0指各變量各類別之間的實(shí)際符合率指各變量各類別之間的期望符合率(i指兩個(gè)變量的相同分類第i類,j指第j類,dpi.是距離矩陣中第i行距離之和占總距離的比例,dp.j是距離矩陣中第j列距離之和占總距離的比例)。
(2)變量為三個(gè)或三個(gè)以上時(shí),距離矩陣為對(duì)稱矩陣Dij,一致性量化指標(biāo)CCBD(取值范圍為[-1,1]):
4.量化指標(biāo)的標(biāo)準(zhǔn)誤和95%置信區(qū)間。
(1)CBD的標(biāo)準(zhǔn)誤計(jì)算公式為:
上式中,dsum是各變量各分類的所有距離總和。該式因?qū)ape當(dāng)作一個(gè)常數(shù),將cap0當(dāng)作總體對(duì)待,故所得結(jié)果是一個(gè)近似值,。當(dāng)樣本量N較大時(shí),cape相對(duì)于CBD變化不大,且CBD近似服從正態(tài)分布,故CBD的95%置信區(qū)間為:CBD±Z0.05/2·SECBD。
(2)CCBD的標(biāo)準(zhǔn)誤計(jì)算公式為:
上式中,zsum是距離對(duì)稱矩陣中的距離總和。當(dāng)樣本量N較大時(shí)近似服從正態(tài)分布,故CCBD近似服從自由度為1的卡方分布,其95%置信區(qū)間
5.量化指標(biāo)之間比較的假設(shè)檢驗(yàn)[12]:
由于以上CBD近似服從正態(tài)分布,故兩個(gè)CBD的差異性假設(shè)檢驗(yàn)可通過(guò)下式實(shí)現(xiàn):
為減小抽樣誤差,對(duì)每種情形下的數(shù)據(jù)均進(jìn)行了500次樣本量為500的模擬,最后采用這500次各個(gè)分類組合的平均頻數(shù)進(jìn)行分析。
1.兩個(gè)待評(píng)價(jià)方法(以二分類測(cè)量結(jié)果為例)
此種設(shè)計(jì)可總結(jié)為四格表形式,共模擬了15次平均觀察符合率不同數(shù)據(jù)。結(jié)果顯示kappa系數(shù)、CBD均與符合率存在正相關(guān)關(guān)系(見(jiàn)表1),rCBD=0.98509,rkappa=1.00000,符合率與kappa的相關(guān)系數(shù)稍大于其與CBD的相關(guān)系數(shù),但兩者相差不大,且都反映出很強(qiáng)的正相關(guān)關(guān)系。此外,每次模擬數(shù)據(jù)所得CBD所反映結(jié)論均與其相應(yīng)的對(duì)應(yīng)分析圖一致。若其中一個(gè)方法為金標(biāo)準(zhǔn),則可計(jì)算相應(yīng)的靈敏度和特異度。
2.多個(gè)待評(píng)價(jià)方法(以三個(gè)待評(píng)價(jià)方法二分類測(cè)量結(jié)果為例)
模擬具有一定關(guān)聯(lián)性的兩個(gè)待評(píng)價(jià)方法Mb、Mc和一個(gè)金標(biāo)準(zhǔn)方法Ma的數(shù)據(jù),均為二分類(假定為normal和sick)進(jìn)行多重對(duì)應(yīng)分析,并利用其對(duì)應(yīng)分析圖上的各個(gè)點(diǎn)的坐標(biāo)建立距離矩陣,獲得總一致性量化指標(biāo)CCBD,同時(shí)分別求得Mb、Mc與標(biāo)準(zhǔn)方法Ma的一致性量化指標(biāo)CBD。所得結(jié)果見(jiàn)表2。兩個(gè)CBD的差異性假設(shè)檢驗(yàn)結(jié)果為Z=-2.048,P=0.0405,可認(rèn)為二者不等。與Mb相比,Mc與金標(biāo)準(zhǔn)Ma的一致性程度更好。
3.多個(gè)待評(píng)價(jià)方法(以三個(gè)待評(píng)價(jià)方法三分類測(cè)量結(jié)果為例)
模擬了10次不同情形的數(shù)據(jù),結(jié)果顯示待評(píng)價(jià)方法兩兩之間的CBD與其相應(yīng)的kappa系數(shù)呈正相關(guān)關(guān)系(見(jiàn)表3);CCBD和fleisskappa呈正相關(guān)關(guān)系。此外,各情形下得到的CCBD所反映結(jié)論均與其相應(yīng)的對(duì)應(yīng)分析圖一致。
表1 符合率、CBD、kappa系數(shù)和靈敏度、特異度匯總表
表2 符合率、各量化指標(biāo)、各kappa系數(shù)匯總表
甲、乙兩個(gè)醫(yī)師對(duì)相同的240個(gè)病人的X光胸片進(jìn)行診斷[3],其數(shù)據(jù)如表4:
表3 兩醫(yī)師對(duì)X光胸片診斷結(jié)果
經(jīng)計(jì)算,該數(shù)據(jù)CBD=0.667,kappa=0.0065,符合率=0.7042.由于kappa公式中的Pe與P0很接近,則分子P0-Pe接近于0,導(dǎo)致該資料的kappa取值很小,只有0.0065。若按照kappa系數(shù)評(píng)價(jià),則甲醫(yī)師和乙醫(yī)師的診斷結(jié)果幾乎是沒(méi)有一致性的,但從實(shí)際觀察符合率來(lái)看卻較高,此即所謂的kappa悖論。而本研究構(gòu)造的量化指標(biāo)CBD結(jié)合對(duì)應(yīng)分析圖則能得到甲醫(yī)師和乙醫(yī)師的診斷結(jié)果一致性較好的結(jié)論,與觀察符合率反映的情況一致,顯示了本研究所構(gòu)造量化指標(biāo)的實(shí)用性和可靠性。
本研究模擬了不同情況下的分類數(shù)據(jù),結(jié)果顯示所構(gòu)建的量化指標(biāo)能客觀正確地反映各方法測(cè)量結(jié)果之間的一致性程度,并適用于存在kappa悖論的數(shù)據(jù);同時(shí),本研究所構(gòu)建的一致性量化指標(biāo)并不像kappa那樣,要求待評(píng)價(jià)方法的結(jié)果分類數(shù)相同;另外,相對(duì)于金標(biāo)準(zhǔn),不同待評(píng)價(jià)方法之間的CBD大小還可進(jìn)行假設(shè)檢驗(yàn)。
值得注意的是,本研究構(gòu)建的一致性量化指標(biāo)是以對(duì)應(yīng)分析過(guò)程中得到的一維或二維坐標(biāo)數(shù)據(jù)為基礎(chǔ)的,因此在分析過(guò)程中,必須先明確對(duì)應(yīng)分析的一維或二維空間數(shù)據(jù)能包含大部分信息量,然后再計(jì)算量化指標(biāo)。
本研究構(gòu)建的量化指標(biāo)尚存在以下不足:符合率較小時(shí),CBD的抽樣誤差會(huì)很大,導(dǎo)致其置信區(qū)間較寬;對(duì)于有序變量數(shù)據(jù)是否存在更合理的加權(quán)對(duì)應(yīng)分析量化指標(biāo),本次研究尚未涉及。以上問(wèn)題擬在以后的研究中加以改進(jìn)和完善。
1.Feuerman M,M iller AR.Relationships between statisticalmeasures of agreement:sensitivity,specificity and kappa.JEval Clin Pract,2008,14(5):930-933.
2.Chmura KH,Periyakoil VS,Noda A.Kappa coefficients in medical research.Stat Med,2002,21(14):2109-2129.
3.王軍.Kappa系數(shù)在一致性評(píng)價(jià)中的應(yīng)用研究.四川大學(xué),2006.
4.閆巖,華琳,張建.對(duì)診斷一致性kappa系數(shù)及評(píng)價(jià)指標(biāo)的探討.中國(guó)衛(wèi)生統(tǒng)計(jì),2007,24(3):313-315.
5.高惠璇.應(yīng)用多元統(tǒng)計(jì)分析.北京大學(xué)出版社,2005.
6.陳明,陳景武.對(duì)應(yīng)分析方法及其在臨床上的應(yīng)用.數(shù)理醫(yī)藥學(xué)雜志,2007,20(2):132-134.
7.李寶紅,董時(shí)富,孫振球.對(duì)應(yīng)分析在生態(tài)學(xué)研究中的應(yīng)用.中華流行病學(xué)雜志,2007,28(9):914-917.
8.李寶紅,孫振球.對(duì)應(yīng)分析在探討疾病季節(jié)分布中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2007,24(6):593-596.
9.Nadia S,Christina W,Bin Z,et al.Correspondence analysis is a useful tool to uncover the relationships among categorical variables.Journal of Clinical Epidem iology.2010,63(6):638-646.
10.趙燕,屬性值測(cè)量系統(tǒng)分析的方法研究與應(yīng)用,天津大學(xué),2007.
11.夏邦世,吳金華.Kappa一致性檢驗(yàn)在檢驗(yàn)醫(yī)學(xué)研究中的應(yīng)用.中華檢驗(yàn)醫(yī)學(xué)雜志,2006,29(1):83-84.
12.Cohen J.A coefficient of agreement for nom inal scales.EDUCATIONAL AND PSYCHOLOGICAL MEASUREMENT,1960,1:37-46.
(責(zé)任編輯:郭海強(qiáng))
The Structure of Quantitative Index for Categorical Variables’Agreement Evaluation based on Correspondence Analysis
An Shengli,Zhang Hailan(DepartmentofBio-Statistics,SchoolofPublicHealthandTropicalMedicine,SouthernMedicalUniversity(510515),Guangzhou)
ObjectiveCorrespondence analysis(CA)can be applied to the consistency evaluation of clinical diagnosis trials.It is expected to build quantitative indexes for agreementevaluation system w ith correspondence analysis to improve its objectivity.MethodsFirst,the distance matrix is constructed according to the specific algorithm of CA.Then,referring to the principle of kappa,the quantitative indexes(CBD and CCBD)were built.The reliability and utility of the quantitative indexes were tested w ith the simulative data under different situation and some examples.ResultsFor two evaluated methods,positive correlations existamong kappa,CBD and concordance rate.In the casew ithmore than 3 evaluatedmethods,CBD and CCBD are proportional to kappa and fleiss kappa coefficient respectively.As for the data in which kappa paradox exists,the stability of CBD is better compared w ith kappa.In addition,the conclusions drawn by the correspondence analysis diagrams are the same as thatof CBD or CCBD.ConclusionThe quantitative indexes of consistency evaluation builtby CA is objective and reliable,and it is of important significance both in theory and in practice to the consistency evaluation in clinical research.
Correspondence analysis;Consistency evaluation;Quantitative indexes
*:南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院院長(zhǎng)基金(GW201421)
△通信作者:安勝利,E-mail:ASL0418@126.com