楊海濤 王瑩瑩 席海峰 閆麗娜 劉荷一 楊俊英
主成分logistic回歸與最大似然法在卵巢囊腫早期鑒別診斷上的聯(lián)合應(yīng)用及其軟件開發(fā)*
楊海濤1王瑩瑩2△席海峰3閆麗娜1劉荷一4楊俊英1
目的 聯(lián)合應(yīng)用主成分logistic回歸與最大似然法對(duì)卵巢囊腫進(jìn)行早期鑒別診斷,并實(shí)施相應(yīng)程序開發(fā),以提高疾病鑒別診斷的效率和準(zhǔn)確性。方法 分別利用兩種方法建立卵巢囊腫早期鑒別的判別函數(shù),并從真實(shí)性和可靠性兩方面評(píng)價(jià)兩種方法的判別效果;根據(jù)卵巢囊腫的疾病性質(zhì)和臨床診治情況,選用串聯(lián)形式完善診斷方法;利用Delphi7.0進(jìn)行軟件開發(fā)程序。結(jié)果 真實(shí)性結(jié)果顯示兩種方法的回顧性和前瞻性判別符合率均大于80%,相應(yīng)ROC曲線下的面積均在0.7~0.9之間,差別無統(tǒng)計(jì)學(xué)意義;可靠性結(jié)果顯示兩種方法的一致性檢驗(yàn)的Kappa值均大于0.5,說明兩種方法的結(jié)果具有較好的一致性;前瞻性診斷的靈敏度為0.667,特異度為0.978。結(jié)論 兩種方法的判別準(zhǔn)確度中等,具有應(yīng)用價(jià)值,能實(shí)現(xiàn)卵巢囊腫的早期鑒別診斷;串聯(lián)形式的聯(lián)合診斷提高了診斷的特異度;開發(fā)的軟件易于操作,提高了鑒別的效率,可以用于門診的輔助診斷。
主成分logistic回歸 最大似然法 聯(lián)合診斷 ROC曲線 軟件開發(fā)
*:河北省衛(wèi)生廳科研基金項(xiàng)目(20090318)
1.河北醫(yī)科大學(xué)流行病學(xué)與衛(wèi)生統(tǒng)計(jì)學(xué)教研室(050017)
2.石家莊市疾病與預(yù)防控制中心
3.河北省衛(wèi)生廳
4.河北醫(yī)科大學(xué)腫瘤醫(yī)院
△通訊作者:王瑩瑩,E-mail:pbying@163.com
非贅生性卵巢囊腫屬于生理性瘤樣病變,不宜手術(shù)治療,但它從形態(tài)、大小等方面與病理性真性腫瘤——贅生性卵巢囊性腫瘤極為相似,臨床特別容易混淆,輔助檢查(腹腔鏡、CT等)的效果也不理想,從而導(dǎo)致不必要的手術(shù)。為了減少不必要的手術(shù)和病人的痛苦,促進(jìn)患者早日康復(fù),本次研究聯(lián)合應(yīng)用兩種方法對(duì)卵巢囊腫進(jìn)行早期鑒別診斷,并在此基礎(chǔ)上實(shí)施了軟件開發(fā),以便提高鑒別診斷的準(zhǔn)確性和效率,從而盡快消除患者精神因素的影響,為指導(dǎo)精神療法和藥物療法提供客觀依據(jù)。
本次研究選取了卵巢囊腫臨床診斷中的14項(xiàng)指標(biāo)(圖1);所需要的訓(xùn)練樣本定為420例〔1〕(非贅生273例,贅生147例),驗(yàn)證樣本為74例〔2〕(非贅生44例,贅生30例)。
應(yīng)用主成分logistic回歸和最大似然法,數(shù)據(jù)處理分別應(yīng)用 SAS9.1、STATA10.0;兩相關(guān)診斷試驗(yàn)的ROC曲線分析應(yīng)用ROCKIT0.9β,ROC曲線下面積計(jì)算選用雙正態(tài)模型參數(shù)法。
(1)logistic回歸共線性診斷〔2〕
最大條件指數(shù)為17.1331時(shí)的孕次X4、產(chǎn)次X5、流產(chǎn)次數(shù)X13的方差分解比例為0.9034、0.8268和0.606,均大于0.5;最大的方差膨脹因子為7.61>5,據(jù)此可認(rèn)為X4、X5、X13變量間存在著中等程度的共線關(guān)系。為解決共線性問題進(jìn)一步選擇主成分logistic回歸分析方法。
(2)主成分logistic回歸分析〔3〕
分別求出回顧性與前瞻性判別符合率;并利用初始的logistic回歸方程計(jì)算出預(yù)報(bào)概率Pi,以Yi為卵巢囊腫的原始分類,然后以預(yù)報(bào)概率Pi為“診斷”結(jié)果值,實(shí)際Yi為“金標(biāo)準(zhǔn)”分類構(gòu)建ROC曲線。
擬合的logistic回歸方程為如下:
(3)應(yīng)用logistic回歸模型進(jìn)行鑒別診斷
將某患者各項(xiàng)指標(biāo)取值代入上式的logistic線性回歸方程中得到相應(yīng)的Y=4.738,則該患者可判定為A1(贅生性卵巢囊腫)〔4〕。
對(duì)兩種方法的回顧性與前瞻性判別結(jié)果(表1和3)的ROC曲線下面積進(jìn)行比較(表2和4)。
(1)真實(shí)性評(píng)價(jià)
表1 兩種方法回顧性判別效果比較
表2 兩種方法回顧性ROC曲線下面積比較
表3 兩種方法前瞻性判別效果比較
表4 兩種方法前瞻性ROC曲線下面積比較
兩種方法的回顧性和前瞻性判別符合率均大于80%,相應(yīng)ROC曲線下的面積均在0.7~0.9之間,說明兩種方法的判別準(zhǔn)確度中等〔5〕,具有應(yīng)用價(jià)值〔2〕;兩種方法的回顧性與前瞻性的ROC曲線下面積比較顯示兩種方法的判別準(zhǔn)確度的差別無統(tǒng)計(jì)學(xué)意義。
(2)可靠性評(píng)價(jià)
求出兩種方法的Kappa指數(shù),對(duì)兩種方法判別結(jié)果的一致性進(jìn)行檢驗(yàn)(表5和6)。結(jié)果顯示兩種方法0.4<k< 0.75,說明兩種方法的一致性較好〔6〕。
選用串聯(lián)形式完善診斷方法。聯(lián)合診斷結(jié)果的靈敏度和特異度計(jì)算公式〔7〕如下:
靈敏度:SeA×SeB,
特異度:SpA+SpB-SpA×SpB兩種方法判別結(jié)果均為贅生性,才考慮受試者為贅生性,否則歸為非贅生性。前瞻性串聯(lián)診斷的靈敏度為0.667,特異度為0.978,提高了診斷的特異度,從而可以減少不必要的手術(shù)和病人的痛苦。
表5 兩種方法的回顧性一致性檢驗(yàn)結(jié)果
表6 兩種方法的前瞻性一致性檢驗(yàn)結(jié)果
篇幅所限,僅給出軟件開發(fā)主界面的圖片形式(軟件中已將最大似然法的條件概率轉(zhuǎn)換成評(píng)分)。
圖1 兩種方法對(duì)卵巢囊腫類型的鑒別診斷
由于最大似然法等方法在判別診斷時(shí)關(guān)心的只是各個(gè)征候合計(jì)評(píng)分的相對(duì)大小,選最大的做出判斷,如果比較的評(píng)分總和相差甚遠(yuǎn),那么做出的判斷較為可靠,如果相差不大,還須進(jìn)一步觀察〔8〕。因此本文選用兩類型卵巢囊腫各個(gè)征候相關(guān)判別指標(biāo)的差值為“診斷”結(jié)果值建立ROC曲線,這樣不但可以得到ROC曲線下面積這一綜合的準(zhǔn)確度指標(biāo),還可以利用該差值為今后確定更為精確的最佳決策值做準(zhǔn)備。本次研究所涉及到的非贅生性卵巢囊腫一般不需處理,癥狀可自行消失。若患者在早期明確為非贅生性囊腫,可盡快消除精神焦慮,采用精神療法和中西醫(yī)治療相結(jié)合,可加速囊腫的消失,早日康復(fù)。串聯(lián)試驗(yàn)可以相應(yīng)提高試驗(yàn)的特異度,并且特別適用于不需迅速作出診斷者,故本文著重選擇了串聯(lián)試驗(yàn);但要注意的是當(dāng)住院、急診或外地的門診病人復(fù)診有困難急需迅速作出診斷時(shí),最好選用并聯(lián)試驗(yàn)〔9〕。因此應(yīng)根據(jù)實(shí)際情況選用合適的聯(lián)合診斷方法。
1.張文彤主編.SPSS11統(tǒng)計(jì)分析教程(高級(jí)篇).第1版.北京:北京希望電子出版社,2002:92,179.
2.孫振球.主編.醫(yī)學(xué)統(tǒng)計(jì)學(xué).第1版.北京:人民衛(wèi)生出版社,2002:297.
3.楊俊英,楊海濤.應(yīng)用stata軟件實(shí)現(xiàn)logistic回歸的共線性診斷.中國(guó)衛(wèi)生統(tǒng)計(jì),2005,22(3):174-176.
4.王煉,劉正明,陳彬,等.甲狀腺濾泡性腫瘤logistic判別分析及預(yù)后分析.診斷病理學(xué)雜志,1994,1(3):152.
5.余松林.主編.醫(yī)學(xué)統(tǒng)計(jì)學(xué).第1版.北京:人民衛(wèi)生出版社,2002:172.
6.方積乾.主編.醫(yī)學(xué)統(tǒng)計(jì)學(xué)與電腦實(shí)驗(yàn).第2版.上海:上??萍汲霭嫔?,2001:245.
7.宇傳華譯.診斷醫(yī)學(xué)統(tǒng)計(jì)學(xué).第1版.北京:人民衛(wèi)生出版社,2005:36.
8.郭祖超主編.醫(yī)用數(shù)理統(tǒng)計(jì)方法.第1版.北京:人民衛(wèi)生出版社,1988:464.
9.林果為,沈福民主編.現(xiàn)代臨床流行病學(xué).第2版.上海:復(fù)旦大學(xué)出版社,2007:62.
中國(guó)衛(wèi)生統(tǒng)計(jì)2012年6期