劉春艷 鄭佳連
1遼寧中醫(yī)藥大學(xué)附屬醫(yī)院醫(yī)學(xué)影像中心,沈陽 110032;2遼寧中醫(yī)藥大學(xué)附屬醫(yī)院感染科,沈陽 110032
卵巢癌是女性三大惡性腫瘤之一,占女性所有惡性腫瘤的2.5%,但因生存率低而占女性癌癥死亡的5%,全世界卵巢癌年齡標(biāo)準(zhǔn)化發(fā)病率為3.0/10 萬~11.4/10 萬,近十年間,亞洲發(fā)病率呈增長趨勢,其是一組具有極大病因、組織病理學(xué)和臨床特征異質(zhì)性的惡性腫瘤,90%的卵巢癌是上皮來源的,其中最常見的是漿液性腫瘤[1-2]。我國是卵巢癌發(fā)病率最高的國家之一,卵巢癌也是我國婦科腫瘤死亡的首要原因,這是因為大多數(shù)卵巢癌在確診時已是晚期[3]。目前腫瘤減滅術(shù)是提高晚期患者生存期的首選治療方法[4]。在術(shù)后隨訪中,糖類抗原(carbohydrate antigen,CA)125是最常用的生物標(biāo)志物,盡管其僅在約8 成的卵巢癌患者中升高,且會受到其他疾病如子宮內(nèi)膜異位癥、肝硬化或腹膜炎的影響,但它仍然是卵巢癌目前應(yīng)用最廣泛的生物標(biāo)記物[5-6]。盡管現(xiàn)在PET-CT 在卵巢癌患者腹腔復(fù)發(fā)的檢測上更為準(zhǔn)確,但CT 仍然是目前對卵巢癌患者進行隨訪最常用的影像學(xué)檢查[7]。然而,近年來的研究發(fā)現(xiàn) CA125 和 CT 的診斷效能有極大的不穩(wěn)定性,尚存在很大提升空間[8-9]。因此,有必要改進成像策略,使其更為簡便并且提高診斷效能,同時避免過度醫(yī)療和由此產(chǎn)生的額外成本和射線暴露。我們將這項研究集中在腹部疾病上。本研究的目的是利用機器學(xué)習(xí),在監(jiān)測晚期卵巢癌患者CA125 水平的基礎(chǔ)上,通過CT預(yù)測腹部復(fù)發(fā)。
1.1 臨床資料 本研究為回顧性隊列研究,回顧分析本院 2018 年 1 月至 2020 年 1 月接受 CT 檢查的卵巢癌患者。納入標(biāo)準(zhǔn):年齡18 歲以上;診斷為Ⅲ期和Ⅳ期高級別漿液性卵巢癌;初治接受腫瘤減滅術(shù)治療;術(shù)后接受NCCN 指南建議的規(guī)范化隨訪:在初始治療之后最初2 年每2~4 個月隨訪1 次,接下來的3 年中每6 個月隨訪1 次,隨訪包括CT檢查和對應(yīng)的CA125水平。排除妊娠、有子宮內(nèi)膜異位癥、肝硬化或腹膜炎等影響CA125的情況、嚴(yán)重臟器功能損害、臨床資料不全者。
1.2 研究方法
1.2.1 CT 評估患者腹腔復(fù)發(fā) 由兩位高年資醫(yī)師閱讀患者CT 影像評估是否腹腔復(fù)發(fā),其中一位為影像科副主任醫(yī)師,另一位為本科??浦髦吾t(yī)師,兩人分別對每位患者每一次隨訪CT 影像進行評估,兩人結(jié)論相同則采納結(jié)果,如出現(xiàn)分歧則由本科進行病例討論得到最終判讀結(jié)果,直至出現(xiàn)復(fù)發(fā)為終點。
1.2.2 CA125 采用CA125 ELISA 檢測試劑盒(上海翊圣生物科技有限公司CA125T)以酶聯(lián)免疫吸附法檢測患者血清CA125水平,計算以下4個測量指標(biāo):①與CT檢查同步的實際CA125水平(絕對值),②當(dāng)前CT 檢查時CA125水平與前一次檢查時CA125 的差值(絕對變化量),③當(dāng)前與前一次檢查時CA125 差值和前一次檢查時CA125 的比值(相對變化量),④當(dāng)前與前一次檢查時CA125 差值的隨訪間隔內(nèi)變化率(相對變化率)。
1.3 統(tǒng)計方法 應(yīng)用SPSS 26.0 及R3.4.1 軟件進行統(tǒng)計學(xué)處理,其中計數(shù)資料以百分率(%)表示,計量資料均呈正態(tài)分布,使用均數(shù)±標(biāo)準(zhǔn)差()表示,使用e1071軟件包構(gòu)建機器學(xué)習(xí)支持向量機來預(yù)測主要結(jié)果。對CA125絕對值、絕對變化量、相對變化量、相對變化率分別使用多項式模型、線性模型和徑向基核建模,總共建立12 個支持向量機模型。采用了基于精度的10×交叉驗證選擇最佳的擬合模型。通過機器學(xué)習(xí)使用Wilcoxon 檢驗比較CT 診斷的復(fù)發(fā)和無復(fù)發(fā)病例最佳的CA125閾值。采用對數(shù)秩檢驗和二元變量的Kaplan-Meier 曲線構(gòu)建單因素Cox 回歸進行單變量分析。采用Cox 比例風(fēng)險模型進行多變量分析。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 患者基線資料 共納入78 例患者,年齡(65.3±3.8)歲,原發(fā)腫瘤(5.5±2.7)cm,Ⅲ期患者54 例,Ⅳ期患者24例,完全腫瘤減滅術(shù)者66例,次全者12例,手術(shù)至首次隨訪間隔(3.2±1.1)個月,其中50 例出現(xiàn)腹腔復(fù)發(fā),無腹腔復(fù)發(fā)生存期(21.2±4.5)個月。
2.2 機器學(xué)習(xí)評估4種不同CA125算法的準(zhǔn)確性 對CA125 絕對值、絕對變化量、相對變化量、相對變化率分別使用多項式模型、線性模型和徑向基核建模,總共建立12 個支持向量機模型。為了選擇最佳的擬合模型,我們采用了基于精度的10×交叉驗證,最佳擬合模型為線性模型,其CA125 絕對值、絕對變化量、相對變化量、相對變化率分別為0.54、0.55、0.57、0.61;多項式模型CA125 絕對值、絕對變化量、相對變化量、相對變化率分別為0.53、0.51、0.55、0.59;徑向基核模型CA125 絕對值、絕對變化量、相對變化量、相對變化率分別為0.49、0.44、0.51、0.53。CA125相對變化率準(zhǔn)確度最高,見表1。
表1 機器學(xué)習(xí)評估4種不同CA125算法的準(zhǔn)確性
2.3 患者腹腔復(fù)發(fā)的相關(guān)因素的單因素回歸分析單因素回歸顯示年齡、原發(fā)腫瘤大小、腫瘤減滅術(shù)程度、CA125 相對變化率均與患者腹腔復(fù)發(fā)相關(guān),且OR由高至低依次為CA125 相對變化率、腫瘤減滅術(shù)程度、原發(fā)腫瘤大小、年齡,差異均有統(tǒng)計學(xué)意義(均P<0.01),見表2。
表2 78例漿液性卵巢癌患者腹腔復(fù)發(fā)的相關(guān)因素的單因素回歸分析
2.4 患者腹腔復(fù)發(fā)的相關(guān)因素的多因素回歸分析多因素回歸顯示年齡、原發(fā)腫瘤大小、腫瘤減滅術(shù)程度、CA125 相對變化率均與患者腹腔復(fù)發(fā)相關(guān),且OR由高至低依次為CA125 相對變化率、腫瘤減滅術(shù)程度、原發(fā)腫瘤大小、年齡,差異均有統(tǒng)計學(xué)意義(均P<0.05),見表3。
表3 78例漿液性卵巢癌患者腹腔復(fù)發(fā)的相關(guān)因素的多因素回歸分析
CA125 和盆腔CT 是卵巢癌患者腫瘤減滅術(shù)后的常規(guī)復(fù)查手段[10]。CA125 在 CT 顯示腹腔復(fù)發(fā)之前就可升高,然而,研究表明,CA125 水平在檢測腫瘤復(fù)發(fā)時并不準(zhǔn)確[11-12]。之前的研究根據(jù)CA125 水平確定了腫瘤復(fù)發(fā)或進展的定義,但CA125水平的變化與CT 對腫瘤的監(jiān)測之間的關(guān)系并未得到充分的研究,在治療決策中單獨使用CA125 并沒有改善患者的預(yù)后[13]。我們發(fā)現(xiàn)患者在接受CT 監(jiān)測的過程中,CA125 的變化與腫瘤復(fù)發(fā)的檢出密切相關(guān)。這些線索可能有助于臨床醫(yī)師確定進行CT 檢查的最佳間隔時間。
機器學(xué)習(xí)是人工智能的核心過程之一,許多不同的統(tǒng)計、概率和數(shù)學(xué)算法可以作為學(xué)習(xí)方法來實現(xiàn),如logistic回歸、人工神經(jīng)網(wǎng)絡(luò)、森林決策樹和樸素貝葉斯等等[14]。最大似然學(xué)習(xí)主要有兩種類型:有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。有監(jiān)督學(xué)習(xí)通過從已知類別學(xué)習(xí)來構(gòu)建模型。相比之下,無監(jiān)督學(xué)習(xí)方法從未知別中學(xué)習(xí)共同特征[15]。機器學(xué)習(xí)算法已經(jīng)被用于關(guān)鍵特征的訓(xùn)練和識別以及群體分類,其優(yōu)點是能夠從大批量的、有混雜的或復(fù)雜的數(shù)據(jù)集中檢測出難以識別的模式。這種能力特別適合復(fù)雜的數(shù)據(jù)比如腫瘤研究,腫瘤是一種基因疾病,其基因組特征模式或特征功能模式代表不同癌癥亞型、預(yù)后、腫瘤發(fā)生驅(qū)動因素或腫瘤特異性生物學(xué)過程[16-17]。因此,機器學(xué)習(xí)可以幫助我們在各種應(yīng)用中識別這些模式。機器學(xué)習(xí)也被應(yīng)用于腫瘤的預(yù)后和術(shù)后隨訪,特別是基于影像學(xué)的腫瘤隨訪過程非常適合使用機器學(xué)習(xí)來識別既定的參數(shù)[18-19]。有研究闡述了機器學(xué)習(xí)在頭頸部腫瘤放射治療的各個步驟中的應(yīng)用,然后對頭頸部腫瘤的放射學(xué)和機器學(xué)習(xí)預(yù)后預(yù)測模型進行了系統(tǒng)的回顧,報道稱機器學(xué)習(xí)在頭頸部腫瘤治療計劃中有著很好的應(yīng)用前景,其可以提高高危靶器官的描記能力,并適應(yīng)放療工作流程的自動化,放射組學(xué)與機器學(xué)習(xí)預(yù)測模型相結(jié)合可以獲得大量腫瘤預(yù)后數(shù)據(jù),包括其生存率、遠(yuǎn)處轉(zhuǎn)移的風(fēng)險、局部復(fù)發(fā)和淋巴結(jié)轉(zhuǎn)移等[20]。William 等[21]報道了在CHAMP 數(shù)字圖像軟件上使用機器學(xué)習(xí)算法閱讀宮頸細(xì)胞涂片來診斷宮頸癌的準(zhǔn)確率接近93.78%,其中K 近鄰算法和支持向量機算法是區(qū)分腫瘤與正常組織的較佳分類算法,分類準(zhǔn)確率分別在99.27%和98.5%以上。而且現(xiàn)有的大多數(shù)算法都適用于單個或多個宮頸涂片圖像,通過改變待提取特征等參數(shù),提高混雜去除率,采用多層次分類器等混合分割和分類技術(shù),可以提高分類精度;將K 近鄰算法與支持向量機等算法相結(jié)合可以進一步提高診斷效能。
我們的研究共納入78 例患者,年齡(65.3±3.8)歲,可見卵巢癌主要發(fā)生在老年女性,原發(fā)腫瘤大小為(5.5±2.7)cm,Ⅲ期患者54 例,Ⅳ期患者24 例,完全腫瘤減滅術(shù)者66 例,次全者12 例,可見大部分患者手術(shù)效果良好,手術(shù)至首次隨訪間隔(3.2±1.1)個月,其中50 例出現(xiàn)腹腔復(fù)發(fā),無腹腔復(fù)發(fā)生存期(21.2±4.5)個月。對CA125 預(yù)測患者腹腔復(fù)發(fā)使用機器學(xué)習(xí)算法,發(fā)現(xiàn)最佳擬合模型為線性模型,其CA125 絕對值、絕對變化量、相對變化量、相對變化率分別為0.54、0.55、0.57、0.61;多項式模型CA125 絕對值、絕對變化量、相對變化量、相對變化率分別為0.53、0.51、0.55、0.59;徑向基核模型CA125 絕對值、絕對變化量、相對變化量、相對變化率分別為0.49、0.44、0.51、0.53。在機器學(xué)習(xí)模型中,CA125 的相對變化率最能預(yù)測腹部復(fù)發(fā)并且其與腹腔復(fù)發(fā)相關(guān),因此,CA125 的相對變化率可能有助于優(yōu)化卵巢癌患者盆腔CT監(jiān)測策略。接下來,我們構(gòu)建了單因素COX回歸模型,結(jié)果顯示年齡、原發(fā)腫瘤大小、腫瘤減滅術(shù)程度、CA125 相對變化率均與患者腹腔復(fù)發(fā)相關(guān),且OR由高至低依次為CA125 相對變化率、腫瘤減滅術(shù)程度、原發(fā)腫瘤大小、年齡,差異均有統(tǒng)計學(xué)意義(均P<0.01)。在單因素模型基礎(chǔ)上進一步構(gòu)建多因素回歸模型顯示年齡(OR=1.48,95%CI:1.35~1.88)、原發(fā)腫瘤大?。∣R=1.58,95%CI:1.46~1.79)、腫瘤減滅術(shù)程度(OR=1.61,95%CI:1.53~1.82)、CA125 相對變化率(OR=1.75,95%CI:1.59~1.90)均與患者腹腔復(fù)發(fā)相關(guān),差異均有統(tǒng)計學(xué)意義(均P<0.05)。基于CA125 的機器學(xué)習(xí)能較好預(yù)測CT 監(jiān)測的漿液性卵巢癌腹腔復(fù)發(fā),相關(guān)因素危險程度由高及低為CA125 相對變化率、腫瘤減滅術(shù)程度、原發(fā)腫瘤大小、年齡。
利益沖突:作者已申明文章無相關(guān)利益沖突。