国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

優(yōu)化腫瘤標志物群建立的決策樹模型對肝癌輔助診斷的價值*

2016-01-29 05:25李曉勇周百中崔衛(wèi)東陳艷軍楊戰(zhàn)鋒
關鍵詞:決策樹肝癌

張 永,李曉勇#,宋 瑜,周百中,崔衛(wèi)東,趙 甦,陳艷軍,楊戰(zhàn)鋒,郜 宇,楊 華

1)鄭州大學第五附屬醫(yī)院肝膽胰腺外科 鄭州 450052 2)鄭州大學第五附屬醫(yī)院婦產(chǎn)科 鄭州 450052

?

優(yōu)化腫瘤標志物群建立的決策樹模型對肝癌輔助診斷的價值*

張永1),李曉勇1)#,宋瑜2),周百中1),崔衛(wèi)東1),趙甦1),陳艷軍1),楊戰(zhàn)鋒1),郜宇1),楊華1)

1)鄭州大學第五附屬醫(yī)院肝膽胰腺外科 鄭州 4500522)鄭州大學第五附屬醫(yī)院婦產(chǎn)科 鄭州 450052

關鍵詞肝癌;血清腫瘤標志物;決策樹;輔助診斷

摘要目的:探討血清腫瘤標志物檢測結合決策樹模型在肝癌診斷中的價值。方法:運用腫瘤標志物定量檢測試劑盒對119例肝部良性疾病及98例肝癌患者血清中9項腫瘤標志[甲胎蛋白(AFP)、癌胚抗原(CEA)、CA125、CA242、CA199、神經(jīng)元特異性烯醇化酶(NSE)、鐵蛋白(Ferritin)、人生長激素(HGH)和CA153]水平進行檢測,應用logistic回歸篩選腫瘤標志物,并于篩選前后建立決策樹模型和Fisher判別分析模型。結果:肝癌組9項血清腫瘤標志物水平均高于肝良性疾病組(P<0.05)。篩選前基于9項腫瘤標志物、篩選后基于3項腫瘤標志物分別建立Fisher判別分析模型、決策樹模型,其預測準確度分別為76.5%、91.2%、74.4%、90.8%。篩選前后決策樹模型ROC曲線的AUC分別為0.912 和0.908,高于Fisher判別分析的0.745和0.727(Z=4.512 和4.589,P均<0.05);但決策樹模型和Fisher判別分析篩選前后自身相比,差異均無統(tǒng)計學意義(Z=1.855和1.122,P均>0.05)。結論:基于3項血清腫瘤標志物建立的決策樹模型診斷肝癌的效果優(yōu)于 Fisher 判別分析。

AbstractAim: To establish decision tree model based on filtered biomarkers to achieve rapid diagnosis of liver cancer.Methods: The serum levels of 9 tumor markers(AFP,CEA,CA125,CA242,CA199,NSE,Ferritin,HGH and CA153) in 98 patients with liver cancer and 119 patients with benign liver lesion were measured by multiple tumor marker protein biochip, and the models of decision tree and Fisher discrimination analysis were developed based on the tumor markers before and after being filtered by logistic regression.Results: The serum levels of the 9 tumor markers in patients with liver cancer were significantly higher than those in patients with benign liver disease(P<0.05). The accuracies of Fisher discrimination analysis and dicision tree models based on 9 tumor markers and 3 tumor markers filtered by logistic regression were 76.5%, 91.2%, 74.4%, 90.8%, respectively. The area under receiver operating curve(AUC) of dicision tree model was higher than that of Fisher discrimination analysis in both of 9 tumor markers model and 3 tumor markers model(Z=4.512 and 4.589, P<0.05). However, there was no significant difference in AUC between before and after screening in both models(Z=1.855 and 1.122, P>0.05).Conclusion: Compared with the effect of Fisher discrimination analysis, the effect of the decision tree model is better in diagnosing liver cancer especially based on three tumor markers screened by logistic regression.

肝癌有著較高的發(fā)病率及病死率,其發(fā)病隱匿,易轉移,預后較差,因此早期診斷成為降低其病死率的關鍵所在[1]。甲胎蛋白(alpha fetal protein,AFP)是肝細胞癌篩查、診斷的經(jīng)典標記物[2],但是AFP對于肝癌的診斷有著很大的局限性,特別是在早期診斷中的價值不高,尋找新的肝癌診斷方法或新的腫瘤標記物或者腫瘤標志物的聯(lián)合檢測成為肝癌鑒別診斷的研究方向[3-6]。有研究[7]表明數(shù)據(jù)挖掘技術可進行肝癌的診斷,然而考慮到聯(lián)合檢測腫瘤標記物時,其中一部分標記物對肝癌診斷的貢獻率并不明顯,而且會有大量參數(shù)的引入,有時甚至對出現(xiàn)的結果難以做出合理的解釋,不同統(tǒng)計方法的聯(lián)合應用有望解決這一難題。該研究采用蛋白芯片檢測系統(tǒng)測定肝臟良、惡性疾病患者血清中9種腫瘤標志物[AFP、癌胚抗原(carcinoembryonic antigen,CEA)、CA125、CA242、CA199、神經(jīng)元特異性烯醇化酶(neuron specific enolase,NSE)、鐵蛋白(Ferritin)、人生長激素(human growth hormone,HGH)和CA153]的水平,采用logistic回歸分析篩選以上標志物,并分別建立篩選前后的判別分析模型和決策樹模型,探討其對肝癌輔助診斷的價值。

1對象與方法

1.1研究對象收集2005年1月至2013年12月于鄭州大學第五附屬醫(yī)院肝膽胰腺外科及腫瘤科住院的臨床背景清晰的肝臟良、惡性疾病患者的相關資料,共217例,其中肝癌98例,肝臟良性疾病119例。肝癌患者的診斷以病理切片為標準,肝臟良性疾病患者均無腫瘤疾病。血標本及流行病學資料由專業(yè)調(diào)查員和醫(yī)生收集,患者均知情同意。該研究經(jīng)鄭州大學第五附屬醫(yī)院倫理委員會批準。

1.2血清腫瘤標志物檢測方法嚴格按照多腫瘤標志蛋白芯片檢測試劑盒說明書進行標志物的檢測,操作由該院檢驗科醫(yī)師完成。檢測在短時間內(nèi)完成,并設置相應質控。結果由生物芯片閱讀儀顯示。

1.3腫瘤標志物的篩選對原始數(shù)據(jù)取以10為底的對數(shù)后,將因變量設定為疾病(肝癌=1,肝良性疾病=0),將自變量設定為腫瘤標志物血清水平,采用logistic回歸分析,入選和剔除標準α=0.10,逐步回歸分析采用偏最大似然估計前進法。

1.4訓練集和預測集隨機選取70%的樣本(肝癌68例,肝臟良性疾病89例)為訓練集,其余樣本(肝癌30例,肝臟良性疾病30例)為預測集,用于交互驗證。

1.5決策樹模型的建立對于輸出變量,定義1為肝癌,0為肝臟良性疾病。以訓練集建模,用預測集對模型進行交互驗證;為實現(xiàn)影響肝癌發(fā)生的血清腫瘤標志物的充分挖掘,結合該研究樣本量,設置父結點為20,子結點為10,最大生長深度3層。用篩選前后的腫瘤標志物分別建立決策樹模型。

1.6統(tǒng)計學處理采用SPSS 21.0進行統(tǒng)計學分析及Fisher判別分析和決策樹模型的建立,繪制ROC曲線并進行2種模型曲線下面積(AUC)的比較,篩選前后模型預測效果的評價采用篩檢試驗的評價指標和ROC曲線。9項腫瘤標志物的分布均為非正態(tài)分布,因此用中位數(shù)(M)和上、下四分位數(shù)(P25、P75)進行描述,用秩和檢驗的單樣本K-S檢驗進行比較。檢驗水準α=0.05。

2結果

2.1研究對象的一般情況兩組患者的年齡、飲酒情況差異均有統(tǒng)計學意義(P<0.05),而性別構成差異無統(tǒng)計學意義(P>0.05),見表1。

表1 兩組研究對象的一般特征

2.29項血清腫瘤標志物檢測結果見表2。

表2 9項血清腫瘤標志物檢測結果

2.3腫瘤標志物篩選結果經(jīng)logistic回歸分析篩選CA199、AFP、CA125進入回歸方程,見表 3。

表3 腫瘤標志物的多因素 logistic 回歸分析

2.4決策樹和Fisher判別分析模型的建立用logistic回歸分析篩選前后的血清腫瘤標志群分別建立決策樹模型和Fisher判別分析模型,訓練集和預測集的分類結果見表4,與Fisher判別分析模型相比,篩選前后決策樹模型的準確率均較高。

表4 各模型對訓練集和預測集的分類結果

2.5篩選前后2種模型預測結果的比較結果見表5。篩選前后的決策樹模型ROC曲線的AUC均高于Fisher判別分析(Z=4.512 和4.589,P均<0.05);但同一模型篩選前后比較,差異均無統(tǒng)計學意義(Z=1.855 和1.122,P>0.05)。

表5 篩選前后2 種模型對總體集的診斷結果

3討論

腫瘤標志蛋白芯片檢測系統(tǒng)可以全面定量地對肝癌患者和正常對照者血清中的蛋白質種類和數(shù)量變化進行檢測[8],在對腫瘤進行輔助診斷或者門診篩查,特別是對高危人群進行篩檢中有一定價值。研究[2,6-7]表明,與正常人及肝臟良性疾病者相比,肝癌患者血清AFP、磷脂酰肌醇蛋白聚糖3(GPC3)、甲胎蛋白異質體3(AFP-L3)、異常凝血酶原(DCP)、轉化生長因子β(TGF-β)、γ-谷氨酰轉肽酶(GGT)、α-L-巖藻糖苷酶(AFU)、CA199、CA125、高爾基體膜蛋白73(GP73)水平均升高;但單項檢測的靈敏度和特異度均不理想,腫瘤標志物的聯(lián)合檢測為靈敏度和特異度的提高提供了新的方向。

該研究檢測了AFP、CA199、Ferritin、NSE、CEA、HGH、CA153、CA125和CA242共9項血清腫瘤標志物,結果顯示肝癌組血清指標均高于肝臟良性疾病組。鑒于該研究樣本量有限,多因素logistic回歸分析放寬了入選和剔除標準,取α=0.10。未進入方程有CEA、NSE、HGH、CA242、CA153、Ferritin,這可能與此6項標志物在肝癌患者血清陽性率較低和特異性差有關[9-10]。

決策樹分析以樹型圖的方式將其分析過程以及多水平變量間復雜的相互作用關系加以展現(xiàn),建立人工智能最優(yōu)的分類診斷模型,從而達到減少主觀診斷的目的[11-13]。決策樹是一種非參數(shù)研究方法,其最重要的一個特點是不要求預測變量的數(shù)據(jù)分布類型,即任意分布資料均可,其模型的分類結果靈敏度、特異度較高,對于臨床診斷的實用性更高,該研究將決策樹模型引入肝癌的血清學診斷中,并顯示了較好的效果。而用Fisher判別分析確定判別函數(shù)時,其原則是依據(jù)類間方差最大和類內(nèi)方差最小[14]。作為傳統(tǒng)的統(tǒng)計分析方法,F(xiàn)isher判別分析的應用很廣泛,但該研究的結果顯示其效果欠佳。該研究經(jīng)logistic 回歸分析共篩選出3項腫瘤標志物:AFP、CA125和CA199,其決策樹模型的靈敏度、特異度、準確度均為90.8%,篩選后的決策樹模型ROC曲線的AUC為0.908,與Fisher判別分析相比,各項評價指標均較高。該模型能夠較好地應用于肝癌的輔助診斷;且該模型AUC與篩選前基于9項血清腫瘤標志物的決策樹模型相比,差異無統(tǒng)計學意義。

總之,經(jīng)過優(yōu)化的基于3項腫瘤標志物建立的決策樹模型能夠有效診斷肝癌。

參考文獻

[1]金世龍,黃中榮,陳華,等.CD13+CD133+和CD13-CD133-肝癌細胞的生物學差異及臨床意義[J].解放軍醫(yī)學雜志,2013,38(8):661

[2]李冰.肝細胞癌患者血清腫瘤標志物組合的診斷價值及針對GPC3腫瘤抗原特異性T細胞反應的研究[D].北京:首都醫(yī)科大學,2013.

[3]章琳,郝春香,陳蓓蓓,等.利用癌旁組織中基因表達的秩序關系識別肝癌的早期診斷特征[J].生物物理學報,2013,29(8):614

[4]熊洋,李云濤,郭嬿,等.結合多變量統(tǒng)計分析肝癌氧合血紅蛋白表面增強拉曼光譜[J].光譜學與光譜分析,2012,32(9):2427

[5]孫永亮. 高爾基體蛋白73(GP73)在肝癌患者血清及組織中的表達及其意義[D].北京:協(xié)和醫(yī)學院, 2011.

[6]張欣,張國梁.血清腫瘤標記物聯(lián)合檢測對原發(fā)性肝癌的診斷價值[J].中國實驗診斷學,2012,16(5):848

[7]白雪峰,王平瑜,吳擁軍.基于兩種判別模式的腫瘤標志物聯(lián)合檢測對肝癌輔助診斷的價值[J].解放軍醫(yī)學雜志,2012,37(11):1019

[8]張軍一,左強,廖旺軍,等.多種腫瘤標記物蛋白芯片檢測系統(tǒng)對原發(fā)性肝癌的診斷價值[J].腫瘤,2004,24(3):254

[9]Wang M,Mehta A,Block TM,et al.A comparison of statistical methods for the detection of hepatocellular carcinoma based on serum biomarkers and clinical variables[J].BMC Med Genomics,2013,6(Suppl 3):S9

[10]Zhu K,Dai Z,Zhou J.Biomarkers for hepatocellular carcinoma: progression in early diagnosis, prognosis, and personalized therapy[J].Biomark Res,2013,1(1):10

[11]Qin G,Luo L,Lv L,et al.Decision tree analysis of traditional risk factors of carotid atherosclerosis and a cutpoint-based prevention strategy[J].PLoS One,2014,9(11):e111769

[12]Verbakel JY,Lemiengre MB,De Burghgraeve T,et al.Diagnosing serious infections in acutely ill children in ambulatory care (Ernie 2 study protocol, part A): diagnostic accuracy of a clinical decision tree and added value of a point-of-care C-reactive protein test and oxygen saturation[J].BMC Pediatr,2014,14(3):207

[13]Chen G,Li X,Chen J,et al.Comparative study of biodegradability prediction of chemicals using decision trees, functional trees, and logistic regression[J].Environ Toxicol Chem,2014,33(12):2688

[14]Cao DS,Zeng MM,Yi LZ,et al.A novel kernel Fisher discriminant analysis: constructing informative kernel by decision tree ensemble for metabolomics data analysis[J].Anal Chim Acta,2011,706(1):97

*國家自然科學基金資助項目21402178

Application of decision tree combined with filtered biomarkers in the diagnosis of liver cancer

ZHANGYong1),LIXiaoyong1),SONGYu2),ZHOUBaizhong1),CUIWeidong1),ZHAOSu1),CHENYanjun1),YANGZhanfeng1),GAOYu1),YANGHua1)

1)DepartmentofHepatobiliaryPancreaticSurgery,theFifthAffiliatedHospital,ZhengzhouUniversity,Zhengzhou4500522)DepartmentofObstetricsandGynecology,theFifthAffiliatedHospital,ZhengzhouUniversity,Zhengzhou450052

Key wordsliver cancer; serum tumor marker; decision tree; auxiliary diagnosis

doi:10.13705/j.issn.1671-6825.2015.06.017

中圖分類號R735.7

通信作者#,男,1964年2月生,碩士,教授,研究方向:肝膽胰腺外科,E-mail:lixy@zzu.edu.cn

猜你喜歡
決策樹肝癌
基于決策樹和神經(jīng)網(wǎng)絡的高血壓病危險因素研究
XB130在肝癌組織中的表達及其對細胞侵襲、遷移的影響
原發(fā)性肝癌癌前病變中西醫(yī)研究進展
隱源性肝癌與病毒性肝癌臨床特征比較
LCMT1在肝癌中的表達和預后的意義
決策樹和隨機森林方法在管理決策中的應用
決策樹多元分類模型預測森林植被覆蓋
基于決策樹的出租車乘客出行目的識別
microRNA在肝癌診斷、治療和預后中的作用研究進展
決策樹在施工項目管理中的應用