濱州醫(yī)學(xué)院公共衛(wèi)生與管理學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室(264003) 邵姜超 劉文昊 祝貴明 王 玖
【提 要】 目的 探討乳腺腫瘤良惡性智能輔助判別診斷的價值。方法 回顧性分析煙臺市某三級醫(yī)院2017年1月至2019年6月經(jīng)病理切片和超聲影像檢查為良性乳腺腫瘤患者135例,惡性乳腺癌患者149例,采用非條件logistic回歸、ROC曲線和Bayes判別分析對其臨床指標以及癥狀體征等基本情況分析篩選,建立智能輔助診斷模型。結(jié)果 采用Bayes判別分析建立的智能輔助診斷模型的自身驗證總正確率為90.5%,交叉驗證總正確率為89.8%;采用logistic回歸建立的聯(lián)合智能輔助診斷模型的總正確率最高可達90.8%。結(jié)論 通過利用患者臨床指標以及癥狀體征等基本信息建立的模型對乳腺腫瘤良惡性診斷有良好的效果。
乳腺癌是危害婦女健康的主要惡性腫瘤[1]。近年來,乳腺癌的發(fā)病率呈逐年上升和年輕化的趨勢[2]。早期乳腺癌的病灶較小,在診斷時往往不能接觸到腫塊,其病變聲像學(xué)的特征也不是很典型,沒有明顯的臨床癥狀,不容易被察覺,因此有著較高的漏診及誤診[3-4]。目前乳腺腫瘤良惡性的人工分類費力、耗時,且診斷結(jié)果易受到主觀人為因素的影響[5],但隨著近年來計算機技術(shù)的應(yīng)用和人工智能技術(shù)的發(fā)展,利用人工智能和數(shù)字圖像處理等技術(shù),輔助臨床提高超聲診斷乳腺腫瘤的準確率、降低漏診率及誤診率具有重要意義[6-7]。本研究擬通過建立乳腺腫瘤良惡性的統(tǒng)計判別模型來輔助診斷乳腺腫瘤良惡性。
1.一般資料
回顧性分析煙臺市某三級醫(yī)院2017年1月至2019年6月經(jīng)病理切片和超聲影像檢查的乳腺腫瘤患者共284例,其中良性135例,惡性149例。資料包括乳腺腫瘤良惡性患者的個人基本信息、癥狀體征(胸部疼痛、腫塊位置等)、既往病史和輔助檢查結(jié)果(腫塊體積及表面積、結(jié)節(jié)血流信號、結(jié)節(jié)邊界清晰、結(jié)節(jié)形態(tài)規(guī)整等)。
2.方法
(1)納入標準女性乳腺腫瘤患者,有比較完整的癥狀體征及輔助檢查的相關(guān)指標。
(2)分組方法 ROC是綜合全面的評價方法,它能有效找出最佳臨界值,是臨床確定最佳閾值的經(jīng)典方法[8]。病理切片為ROC曲線制定診斷界值的金標準,將284例女性乳腺腫瘤患者的基本情況采用約登指數(shù)(Yuden Index,YI)最大法來選擇最佳臨界值。因此年齡分為小于52歲和52歲及以上,月經(jīng)初潮年齡分為小于15歲和15歲及以上。
(3)統(tǒng)計學(xué)方法采用SPSS 22.0軟件,在對乳腺腫瘤良惡性組間差異單因素χ2檢驗的基礎(chǔ)上,采用非條件logistic回歸、ROC曲線和Bayes判別分析,建立乳腺腫瘤良惡性判別診斷模型。
1.乳腺腫瘤患者基本情況
此次調(diào)查共有284例女性乳腺腫瘤患者,其中良性135例,占47.5%,惡性149例,占52.5%,良惡比為0.906:1,年齡范圍為13~84歲,平均年齡為(50.1±14.1)歲。
2.乳腺腫瘤患者的單因素分析
乳腺腫瘤患者年齡、來源地、月經(jīng)初潮年齡、體重指數(shù)(BMI)、腫塊位置以及影像資料中的乳腺結(jié)節(jié)血流信號、結(jié)節(jié)邊界和形態(tài)與乳腺腫瘤的良惡性有關(guān),差異均有統(tǒng)計學(xué)意義(P<0.001)。年齡小于52歲的患者多為良性,52歲及以上惡性腫瘤患者較多;城鎮(zhèn)患者良性腫瘤較多,農(nóng)村患者惡性腫瘤較多,詳見表1。
3.乳腺腫瘤患者的多因素分析(1)非條件logistic回歸分析根據(jù)病理切片和超聲影像檢查的結(jié)果,以乳腺腫瘤為因變量Y(良性=0,惡性=1),以表1中年齡等8個指標為自變量行非條件logistic回歸分析,結(jié)果見表2。通過logistic回歸構(gòu)建癥狀體征基本情況和超聲影像檢查,準確率為90.8%。
由表2建立logistic回歸方程:
Logit(π)=-16.98+2.28X1+2.32X5+2.04X6+2.62X7+2.24X8,分界值為0.5,當π≥0.5時為惡性,反之為良性。
表1 乳腺腫瘤良惡性的影響因素
表2 乳腺腫瘤良惡性患者癥狀體征基本情況與超聲影像檢查非條件logistic逐步回歸
*:變量賦值情況為年齡(歲)X1,<52=0,≥52=1;體重指數(shù)X4,正常=0,其他=1;腫塊位置X5,雙側(cè)=0,單側(cè)=1;結(jié)節(jié)血流信號X6,無=0,有=1;結(jié)節(jié)邊界清晰X7,清晰=0,不清晰=1;結(jié)節(jié)形態(tài)規(guī)整X8,規(guī)整=0,不規(guī)整=1。
(2)ROC曲線乳腺腫瘤良惡性患者癥狀體征基本情況與超聲影像檢查的ROC曲線下面積(AUC)為0.909,95%可信區(qū)間為0.870~0.948,見圖1。
圖1 乳腺癌患者癥狀體征與超聲影像檢查診斷的ROC曲線
(3)判別分析將表1中8個變量進行逐步判別分析,建立的乳腺腫瘤良惡性Bayes判別函數(shù)如下:
Y1(良性)=-29.742+4.922X1+5.372X4+13.697X5+6.009X6+5.236X7+7.641X8
Y2(惡性)=-51.820+7.391X1+6.369X4+15.784X5+7.783X6+8.778X7+11.593X8
根據(jù)判別函數(shù)分別計算出良性組與惡性組的評分,評分最高的組則為患者所歸類的組。對判別分析的結(jié)果采用自身驗證與交叉驗證,自身驗證結(jié)果顯示,良性判別正確率達91.1%,惡性判別正確率達89.9%,總正確率為90.5%;交叉驗證結(jié)果顯示,判別函數(shù)對良性組的判別正確率達91.1%,惡性組的判別正確率達88.6%,總正確率為89.8%。
乳腺鉬靶攝影被認為是診斷乳腺癌最先進、最可靠、最有效的方法,具有較高的特異性和敏感性[9]。因此除了病理切片檢查之外,乳腺腫瘤良惡性診斷主要采用鉬靶X線,但乳腺X線攝影對致密腺體型乳腺中非鈣化病灶顯示欠佳易發(fā)生漏診[10]。與此同時,鉬靶檢查的應(yīng)用也有一定的局限性。鉬靶檢查的費用在300元以上,其費用相對較高且對身體有一定的射線損傷,一般不作為普查初篩手段,更為現(xiàn)實的是在一般醫(yī)院尤其是基層醫(yī)院無法進行鉬靶檢查。但是本次研究將患者的基本癥狀體征信息與超聲影像檢查結(jié)果相結(jié)合,深入挖掘臨床醫(yī)生問診過程中不被重視的患者的個人基本信息,在與鉬靶檢查乳腺腫瘤良惡性準確率(85%~96%)相差不大的情況下,其費用大大降低,僅為120元左右的超聲影像檢查費用,更為重要的是對身體沒有害處,簡便易行,在一般醫(yī)院也可以實現(xiàn)。
年齡在診斷女性乳腺腫瘤良惡性中發(fā)揮非常重要的作用,其中52歲及以上的患者患惡性乳腺腫瘤是52歲以下患者患病風險的9.79倍。也有文獻報道[11-13],年齡因素是乳腺癌預(yù)后轉(zhuǎn)歸的重要因子之一。年齡不但在乳腺腫瘤良惡性的診斷中發(fā)揮著重要作用,而且對惡性乳腺腫瘤患者的預(yù)后也有著舉足輕重的作用。如若在乳腺腫瘤的可治愈期內(nèi)發(fā)現(xiàn)并得到及時合理的治療,可降低乳腺癌的死亡率約22%~44%[14]。
本次研究也存在一定的缺陷,目前國內(nèi)外均無針對老年人BMI的指導(dǎo)值?,F(xiàn)行的BMI標準可能并不適合老年人[15]。而本次研究的患者存在部分老年女性患者,因此在判別分析中該指標的納入有待商榷,但是該指標在該模型中判別效果顯著,由此探討老年人適宜的BMI范圍是也是十分必要的。