国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)算法預(yù)測早期結(jié)直腸腺癌病人內(nèi)鏡治療后的癌癥特異性生存狀態(tài)

2024-12-31 00:00:00李志宏蔡迎彬王巖樊華伊麗米奴爾?阿合買李紫梅
護(hù)理研究 2024年14期
關(guān)鍵詞:腺癌直腸機(jī)器

基金項目 新疆維吾爾自治區(qū)自然科學(xué)基金資助項目,編號:2022D01C299

作者簡介 李志宏,護(hù)士,碩士研究生在讀

通訊作者 蔡迎彬,E?mail:42912844@qq.com

引用信息 李志宏,蔡迎彬,王巖,等.基于機(jī)器學(xué)習(xí)算法預(yù)測早期結(jié)直腸腺癌病人內(nèi)鏡治療后的癌癥特異性生存狀態(tài)[J].護(hù)理研究,2024,38(14):2459?2467.

Prediction of cancer?specific survival status of patients with early colorectal adenocarcinoma after endoscopic therapy based on machine learning algorithms

LI Zhihong, CAI Yingbin, WANG Yan, FAN Hua, Yiliminuer Ahemai, LI Zimei

School of Nursing, Xinjiang Medical University, Xinjiang 830011 China

Corresponding Author" CAI Yingbin, E?mail: 42912844@qq.com

Abstract" Objective:To construct a cancer?specific survival status prediction model for patients with early colorectal adenocarcinomanbsp; after endoscopic treatment used machine learning algorithms.Methods:Based on SEER database,the data of 1 786 patients with early colorectal adenocarcinoma after endoscopic treatment were obtained,and the information" included" age,sex,race,cancer" primary" site,degree of cancer cell differentiation,pathological type of cancer tissue,radiotherapy,chemotherapy,tumor size,pathological condition,and marital status were extracted.After univariate Logistic regression and multivariate Logistic regression analysis,independent influencing factors of survival prognosis of patients with early colorectal adenocarcinoma after endoscopic treatment were determined.The patients were divided into training set and test set at a ratio of 8∶2.the factors with statistical differences in regression analysis were" substituted" into Logistic regression,random forest,extreme gradient boosting,support vector machine,decision tree,gradient boosting decision tree which were constructed by machine learning algorithm.To interpret results based on optimal" machine" learning" models.Results:The" results of multivariate Logistic regression showed that age,cancer primary site,degree of cancer cell differentiation,tumor size,pathological condition,and marital status were independent influencing factors of survival prognosis of patients with early colorectal adenocarcinoma after endoscopic treatment(Plt;0.05).The area under the curve of receiver operator characteristic of random forest in the training set and test set were 0.876 and 0.858,respectively.And the F1 score were 0.791 and 0.739,respectively.The interpretability analysis of the model based on random forest showed that age,marital status and tumor size were more important,while higher age,larger tumor diameter,poor differentiation,and existence of submucosal infiltration were risk factors for death,and married were protective factors.Patients with the primary site of cancer in the right colon had poorer survival compared to those with the primary site of cancer in the left colon.Conclusions:The prognostic model constructed by machine learning for patients with colorectal cancer has good performance.It can provide accurate individualized prediction.

Keywords""" machine learning; early colorectal cancer;" adenocarcinoma;" endoscopic" therapy;" survival state;" predictive models;" influencing factor; nursing

摘要" 目的:基于機(jī)器學(xué)習(xí)算法構(gòu)建早期結(jié)直腸腺癌病人經(jīng)內(nèi)鏡治療后的癌癥特異性生存狀態(tài)預(yù)測模型。方法:基于流行病學(xué)和最終結(jié)果數(shù)據(jù)庫獲取1 786例經(jīng)內(nèi)鏡治療后的早期結(jié)直腸腺癌病人資料,提取病人年齡、性別、種族、癌癥原發(fā)部位、癌細(xì)胞分化程度、癌癥組織病理學(xué)類型、放療情況、化療情況、腫瘤大小、病理情況、婚姻狀況信息。經(jīng)單因素Logistic回歸與多因素Logistic回歸分析確定早期結(jié)直腸腺癌病人內(nèi)鏡治療后生存預(yù)后的獨(dú)立影響因素。以8∶2的比例將病人分為訓(xùn)練集與測試集,將回歸分析中有統(tǒng)計學(xué)意義的因素代入以機(jī)器學(xué)習(xí)算法構(gòu)建的邏輯回歸、隨機(jī)森林、極限梯度提升、支持向量機(jī)、決策樹、梯度提升決策樹,基于最優(yōu)機(jī)器學(xué)習(xí)模型對結(jié)果進(jìn)行解釋。結(jié)果:多因素Logistic回歸結(jié)果顯示,年齡、癌癥原發(fā)部位、癌細(xì)胞分化程度、腫瘤大小、病理情況、婚姻狀態(tài)是早期結(jié)直腸腺癌病人內(nèi)鏡治療后生存預(yù)后的獨(dú)立影響因素(Plt;0.05),隨機(jī)森林在訓(xùn)練集與測試集中的受試者工作特征曲線下面積(AUC)分別為0.876和0.858,F(xiàn)1分?jǐn)?shù)分別為0.791和0.739,基于隨機(jī)森林的模型可解釋性分析結(jié)果表明,年齡、婚姻狀態(tài)、腫瘤大小重要性較高,年齡較高、腫瘤直徑較大、分化程度較差及存在黏膜下浸潤為死亡的危險因素,已婚為保護(hù)因素,癌癥原發(fā)部位為右半結(jié)腸的病人相較于左半結(jié)腸病人生存狀態(tài)較差。結(jié)論:機(jī)器學(xué)習(xí)構(gòu)建的結(jié)直腸癌病人預(yù)后模型性能較好,可提供精準(zhǔn)的個體化預(yù)測。

關(guān)鍵詞" 機(jī)器學(xué)習(xí);早期結(jié)直腸癌;腺癌;內(nèi)鏡治療;生存狀態(tài);預(yù)測模型;影響因素;護(hù)理

doi:10.12102/j.issn.1009-6493.2024.14.003

結(jié)直腸癌是一種具有多種危險因素、高度異質(zhì)性的原發(fā)性上皮惡性腫瘤。國際癌癥機(jī)構(gòu)統(tǒng)計數(shù)據(jù)顯示,結(jié)直腸癌發(fā)病率位居癌癥發(fā)病率第3位,是癌癥相關(guān)性死亡的第二大原因[1]。我國結(jié)直腸癌疾病負(fù)擔(dān)較重[2]。早期發(fā)現(xiàn)癌前病變并給予針對性干預(yù)和治療對于降低結(jié)直腸癌發(fā)病率及死亡率至關(guān)重要。早期結(jié)直腸癌是指病變局限于黏膜或黏膜下層,無論其有無淋巴結(jié)轉(zhuǎn)移。腺癌為結(jié)直腸癌的常見類型,由息肉發(fā)展至腺瘤最終演變?yōu)橄侔3]。近年來,隨著內(nèi)鏡技術(shù)的不斷發(fā)展,內(nèi)鏡下黏膜切除術(shù)(EMR)、內(nèi)鏡下黏膜剝離術(shù)(ESD)等內(nèi)鏡微創(chuàng)技術(shù)逐漸成熟,對于癌前病變及癌細(xì)胞局限于黏膜內(nèi)或黏膜下層的結(jié)腸癌,可采取內(nèi)鏡下治療作為首選方式[4]。但內(nèi)鏡治療也可能存在漏診或病灶切除不完整的問題,殘留局部具有復(fù)發(fā)病變的風(fēng)險[5],且受浸潤深度、腫瘤大小等因素影響,癌癥病人術(shù)后如發(fā)生淋巴結(jié)轉(zhuǎn)移或周圍組織浸潤,則需要追加手術(shù)或其他對癥治療,增加了過度治療風(fēng)險,影響病人生存狀態(tài)。因此,精準(zhǔn)預(yù)測早期結(jié)直腸腺癌的治療預(yù)后對于提高病人術(shù)后生存狀態(tài)具有重要意義。機(jī)器學(xué)習(xí)(machine learning,ML)作為計算機(jī)科學(xué)方法,是指機(jī)器從一組數(shù)據(jù)中識別和學(xué)習(xí)的能力[6]。機(jī)器學(xué)習(xí)可以依托大數(shù)據(jù),從廣泛數(shù)據(jù)中篩選出關(guān)鍵因素,挖掘數(shù)據(jù)潛在的規(guī)律并預(yù)測未來趨勢做出決策[7]。目前機(jī)器學(xué)習(xí)已廣泛應(yīng)用于腫瘤診斷、治療、預(yù)后等方面[8],部分學(xué)者探索并建立了新型、實用、具有前瞻性的機(jī)器學(xué)習(xí)理論及算法,通過整合臨床數(shù)據(jù),旨在更加契合臨床,推動醫(yī)學(xué)信息化、現(xiàn)代化的發(fā)展[9?10]。機(jī)器學(xué)習(xí)算法主要包括監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),二者的區(qū)別在于是否給定已知的標(biāo)簽類別[11],監(jiān)督學(xué)習(xí)廣泛應(yīng)用于臨床疾病風(fēng)險預(yù)測模型,其常見算法包括決策樹(decision tree,DT)、邏輯回歸(Logistic regression,LR)、支持向量機(jī)(support vector machine,SVM)、隨機(jī)森林(random forest,RF)等。流行病學(xué)和最終結(jié)果(Surveillance,Epidemiology,and End Results,SEER)數(shù)據(jù)庫是美國的大型公共癌癥數(shù)據(jù)平臺,收錄了大量癌癥病人的臨床信息。本研究通過SEER數(shù)據(jù)庫獲取病人信息,從而建立機(jī)器學(xué)習(xí)算法模型,以預(yù)測早期結(jié)直腸腺癌病人接受內(nèi)鏡治療后的癌癥特異性生存狀態(tài),為臨床決策提供有效的評估工具,制訂有效的治療策略。

1" 資料與方法

1.1 數(shù)據(jù)來源

在SEER*Stat軟件中調(diào)用SEER Research Data 17 Registries,Nov2022 Sub(2000-2020)版本,該版本于2023年4月發(fā)布,病人癌癥信息源自美國癌癥研究所(National Cancer Institute,NCI)及癌癥控制和人口科學(xué)部(Division of Cancer Control and Population Sciences,DCCPS)截至2022年11月統(tǒng)計的相關(guān)數(shù)據(jù)。在字段Primary Site?Labeled中選取“C18.0?C19.9,C20.9”作為原發(fā)部位,選取RX Summ?Surg Prim Site (1998+)字段“A20、A22、A26、A27、A28”作為內(nèi)鏡下治療,采用第7版美國癌癥聯(lián)合委員會(American Joint Committee on Cancer,AJCC)TNM分期。納入標(biāo)準(zhǔn):1)經(jīng)組織病理學(xué)診斷確診為結(jié)直腸癌;2)選擇T1N0M0或原位癌病人;3)結(jié)直腸癌為最先診斷的原發(fā)腫瘤,排除其他癌癥干擾;4)生存狀態(tài)為存活或由于結(jié)腸、直腸(包括直乙交界)癌癥導(dǎo)致死亡的病人。排除標(biāo)準(zhǔn):1)其他組織學(xué)類型,如神經(jīng)內(nèi)分泌瘤、胃腸道間質(zhì)瘤等;2)病人臨床信息(如分化程度、腫瘤大小、病理情況等)存在未知或空白情況;3)未隨訪或隨訪時間及生存時間信息缺失。

1.2 數(shù)據(jù)分類

在SEER數(shù)據(jù)庫中選擇年齡、性別、種族、癌癥原發(fā)部位、癌細(xì)胞分化程度、癌癥組織病理學(xué)類型、放療情況、化療情況、腫瘤大小、病理情況、婚姻狀況11個變量。年齡增長對于結(jié)直腸癌的進(jìn)展至關(guān)重要,≥60歲的老年病人發(fā)病率較高且癌前病變特征與lt;60歲的人群相比具有顯著差異[12?13],故將納入的病人分為兩個年齡組(lt;60歲,≥60歲);按照腫瘤大小常用分類節(jié)點(diǎn)[14]將腫瘤大小分為3組(直徑lt;2 cm、直徑2~5 cm、直徑gt;5 cm)。將所有數(shù)據(jù)中低頻變量合并,降低數(shù)據(jù)噪聲。

1.3 模型建立

機(jī)器學(xué)習(xí)建模與評估均使用Python(3.11.1),采用pandas庫進(jìn)行數(shù)據(jù)預(yù)處理,機(jī)器學(xué)習(xí)算法采用scikit?learn進(jìn)行模型訓(xùn)練和測試,將數(shù)據(jù)以8∶2的比例分為訓(xùn)練集與測試集,使用十折交叉驗證方法測試模型性能并防止過擬合,單因素及多因素Logistic回歸篩選機(jī)器學(xué)習(xí)模型的候選變量,采用6個機(jī)器學(xué)習(xí)算法[邏輯回歸、支持向量機(jī)、隨機(jī)森林、極限梯度提升(extreme gradient boosting,XGBoost)、決策樹、梯度提升決策樹(gradient boosting decision tree,GBDT)]建立模型。采用準(zhǔn)確率、精確率、召回率、F1分?jǐn)?shù)、受試者工作特征(ROC)曲線下面積(AUC)評估模型,AUC取值范圍為0.0~1.0,越接近于1.0表示模型判別能力越強(qiáng),近似于0.5表明趨于隨機(jī)猜測,模型無應(yīng)用價值?;赟EER數(shù)據(jù)庫的病人生存狀態(tài)存在不平衡,采用SMOTE過采樣算法進(jìn)行數(shù)據(jù)增強(qiáng)。采用SHAP包對模型進(jìn)行進(jìn)一步可解釋性分析。

1.4 統(tǒng)計學(xué)方法

采用SEER*Stat(8.4.1版本)獲取內(nèi)部建模病人,采用R 4.2.2進(jìn)行基本數(shù)據(jù)分析,定性資料以頻數(shù)及百分比(%)表示,采用χ2檢驗進(jìn)行組間比較,將單因素Logistic回歸篩選出的變量納入多因素Logistic回歸,并計算其比值比(odds ratio,OR)及95%置信區(qū)間(CI),以Plt;0.05為差異有統(tǒng)計學(xué)意義。

2" 結(jié)果

2.1 病人一般資料

從SEER數(shù)據(jù)庫中納入1 786例病人,將1 424例病人作為訓(xùn)練集,362例病人作為測試集。病人篩選""""""""" 流程見圖1,病人一般資料見表1。

結(jié)直腸癌為第一原發(fā)腫瘤、經(jīng)組織學(xué)確診為陽性(n=8 637)

2.2 訓(xùn)練集早期結(jié)直腸腺癌病人內(nèi)鏡治療后生存預(yù)后的影響因素

單因素Logistic分析結(jié)果顯示,年齡、癌癥原發(fā)部位、癌細(xì)胞分化程度、癌癥組織病理學(xué)類型、放療情況、化療情況、腫瘤大小、病理情況、婚姻狀態(tài)與生存預(yù)后相關(guān)(Plt;0.05)。將單因素Logistic分析中有統(tǒng)計學(xué)意義的因素納入多因素Logistic回歸,結(jié)果顯示,年齡≥60歲、癌癥原發(fā)部位為右半結(jié)腸與直腸、癌細(xì)胞分化程度為低分化及未分化、腫瘤直徑≥2 cm、存在黏膜下浸潤是早期結(jié)直腸腺癌病人內(nèi)鏡治療后生存預(yù)后較差的獨(dú)立危險因素(Plt;0.05),已婚是早期結(jié)直腸腺癌病人內(nèi)鏡治療后生存預(yù)后較差的獨(dú)立保護(hù)因素(Plt;0.05)。自變量賦值方式見表2,內(nèi)鏡治療后早期結(jié)直腸腺癌生存預(yù)后影響因素分析結(jié)果見表3。

2.3 10折交叉驗證結(jié)果及建模參數(shù)

通過設(shè)置樣本比例劃分訓(xùn)練集、測試集,將數(shù)據(jù)集隨機(jī)分配,可能造成過度擬合的偶然性,故應(yīng)用10折交叉驗證評估模型性能,有利于保證最終模型評估結(jié)果的客觀性、驗證方法的有效性。表4結(jié)果顯示,模型預(yù)期效果較好,隨機(jī)森林的整體測試性能均優(yōu)于其他模型,建立模型使用的參數(shù)見表5。

2.4 模型的建立與評估

鑒于癌癥組織病理學(xué)類型與結(jié)局事件具有效應(yīng)關(guān)系,將年齡、癌癥原發(fā)部位、癌細(xì)胞分化程度、癌癥組織病理學(xué)類型、腫瘤大小、病理情況、婚姻狀態(tài)7個特征變量代入機(jī)器學(xué)習(xí)模型,結(jié)果顯示,隨機(jī)森林模型的AUC高于其他模型,其在訓(xùn)練集與測試集中的AUC分別為0.876和0.858;梯度提升決策樹的AUC僅低于隨機(jī)森林,其在訓(xùn)練集與測試集中的AUC分別為0.786和0.764。F1分?jǐn)?shù)為精確率與召回率的調(diào)和平均數(shù),隨機(jī)森林在訓(xùn)練集與測試集中的F1分?jǐn)?shù)分別為0.791和0.739,表明該模型穩(wěn)健性較好。隨機(jī)森林、決策數(shù)精確率均較高,表明模型識別能力較強(qiáng)。極限梯度提升的召回率高于其他模型,其在訓(xùn)練集與測試集中的召回率均為0.845,表明該模型具有較好的預(yù)測陽性標(biāo)簽效果。隨機(jī)森林、極限梯度提升、梯度提升決策數(shù)的綜合性能均優(yōu)于Logistic回歸。6種模型在訓(xùn)練集的預(yù)測性能見表6,6種模型在測試集的預(yù)測性能見表7,6種模型在訓(xùn)練集中的ROC曲線見圖2,6種模型在測試集中的ROC曲線見圖3。

2.5 模型的可解釋性

基于隨機(jī)森林特征對不同因素的SHAP值進(jìn)行排序,結(jié)果表明,年齡、婚姻狀態(tài)、腫瘤大小對結(jié)直腸腺癌病人接受內(nèi)鏡治療后癌癥特性生存狀態(tài)至關(guān)重要,且對于模型的影響輸出結(jié)果較大,見圖4。年齡較高、腫瘤直徑較大、癌細(xì)胞分化程度較差及黏膜下浸潤對模型的貢獻(xiàn)具有正向影響,造成病人死亡的風(fēng)險較高,而已婚對于模型具有負(fù)向影響,為早期結(jié)直腸腺癌病人內(nèi)鏡治療后生存預(yù)后的保護(hù)因素,發(fā)病部位為右半結(jié)腸的病人相較于左半結(jié)腸的病人死亡風(fēng)險較高,此外,癌癥組織病理學(xué)類型顏色分布規(guī)律不規(guī)則,表明各腺瘤性息肉亞型均會增加結(jié)直腸罹患腺癌的風(fēng)險,而SHAP值較高的絨毛狀腺瘤相較于管狀絨毛狀腺瘤死亡風(fēng)險更高,見圖5。交互式SHAP圖為隨機(jī)提取數(shù)據(jù)中單個病人的可視化結(jié)果,紅色數(shù)值代表死亡風(fēng)險貢獻(xiàn),藍(lán)色數(shù)值代表生存貢獻(xiàn),箭頭向左表示SHAP值減少,箭頭向右表示SHAP值增加,箭頭越長表示對結(jié)果的貢獻(xiàn)越大。生存病人的交互式SHAP圖顯示,年齡lt;60歲、已婚、腫瘤直徑lt;2 cm為病人生存的保護(hù)因素,病人的最終SHAP值為0.01,見圖6。死亡病人的交互式SHAP圖顯示,年齡≥60歲、未婚、存在黏膜下浸潤是病人死亡的促進(jìn)因素,病人的最終SHAP值為0.17,見圖7。

3" 討論

本研究影響因素分析結(jié)果表明,年齡≥60歲、癌癥原發(fā)部位為右半結(jié)腸與直腸、癌細(xì)胞分化程度為低分化及未分化、腫瘤直徑≥2 cm、存在黏膜下浸潤是早期結(jié)直腸腺癌病人內(nèi)鏡治療后生存預(yù)后較差的獨(dú)立危險因素(Plt;0.05),已婚是早期結(jié)直腸腺癌病人內(nèi)鏡治療后生存預(yù)后較差的獨(dú)立保護(hù)因素(Plt;0.05)。隨著窄帶成像技術(shù)(NBI)結(jié)合放大內(nèi)鏡等內(nèi)鏡增強(qiáng)技術(shù)的應(yīng)用,醫(yī)務(wù)人員可清晰、直觀地觀察到黏膜表面微血管形態(tài),確定病灶程度及范圍,鏡下診斷及術(shù)后病理檢驗對病人預(yù)后具有重要意義[15]。但對于分化較差的腺癌及印戒細(xì)胞癌不建議行內(nèi)鏡下黏膜切除術(shù),原因為切緣陽性可能導(dǎo)致病灶復(fù)發(fā)或發(fā)生遠(yuǎn)處轉(zhuǎn)移。研究表明,癌細(xì)胞分化程度較低會增加早期結(jié)直腸癌淋巴結(jié)轉(zhuǎn)移風(fēng)險[16]。病灶是否徹底性切除、術(shù)中抬舉征是否為陽性均可能提示病變是否侵犯黏膜下層[17]。若術(shù)后切緣陽性,需追加內(nèi)鏡治療手術(shù)或外科手術(shù),明確病人的癌細(xì)胞分化程度、浸潤深度、腫瘤大小以及有無淋巴結(jié)轉(zhuǎn)移等危險因素,以減少內(nèi)鏡治療術(shù)帶來的負(fù)面效應(yīng),防止出現(xiàn)非治愈性切除(切緣腫瘤殘余)。腺瘤晚期是指gt;1 cm或伴有管狀、絨毛狀組織學(xué)特征的常規(guī)腺瘤[18]。Song等[19]研究結(jié)果顯示,各息肉亞型病人患結(jié)直腸腺癌的風(fēng)險均較高,且患有管狀腺瘤與絨毛狀腺瘤的病人死亡率較高。Myers等[20]指出,絨毛特征更強(qiáng)烈的腺瘤與高級別異型增生及癌變有關(guān),與本研究SHAP可解釋性分析結(jié)果一致。本研究發(fā)現(xiàn),結(jié)直腸癌發(fā)病的解剖位置對病人內(nèi)鏡治療后的生存預(yù)后具有影響,右半結(jié)腸血供豐富,利于腫瘤生長,且更易出現(xiàn)腸梗阻等現(xiàn)象,進(jìn)而導(dǎo)致臨床特征及癌癥轉(zhuǎn)歸與左半結(jié)腸有所不同。已有研究顯示,與原發(fā)腫瘤位置為右半結(jié)腸癌病人相比,左半結(jié)直腸癌病人生存率較高[21],右半結(jié)腸癌作為獨(dú)特的癌癥組織學(xué)亞型,預(yù)后較差。隨機(jī)森林重要性排名及SHAP可視化分析結(jié)果顯示,年齡、婚姻狀態(tài)、腫瘤大小對結(jié)直腸腺癌病人接受內(nèi)鏡治療后癌癥特性生存狀態(tài)至關(guān)重要。早期結(jié)直腸癌的治療效果可能受年齡影響,不同年齡段病人發(fā)病特點(diǎn)及術(shù)后生存狀態(tài)存在顯著差異。樊啟林等[22]的結(jié)直腸癌病人預(yù)后分析結(jié)果顯示,≥65歲的結(jié)直腸癌病人預(yù)后較差,隨著年齡增長,術(shù)后發(fā)生并發(fā)癥的風(fēng)險逐步升高, 這可能與老年人對身體不適的敏感性下降有關(guān)。本研究結(jié)果還顯示,腫瘤直徑≥2 cm是早期結(jié)直腸腺癌病人內(nèi)鏡治療后生存預(yù)后較差的獨(dú)立危險因素,與已有研究結(jié)果[23]相似。隨機(jī)森林重要性分析結(jié)果顯示,婚姻狀態(tài)對結(jié)直腸腺癌病人接受內(nèi)鏡治療后癌癥特性生存狀態(tài)至關(guān)重要。已有研究顯示,婚姻狀態(tài)與癌癥特異性生存率顯著相關(guān)[24],婚姻狀態(tài)對個人的生活習(xí)慣影響較大,同時也與社會心理狀況有關(guān)。已有研究結(jié)果顯示,結(jié)腸癌病人在接受手術(shù)治療后,已婚病人比未婚病人具有更高的術(shù)后生存率[25],這可能與婚姻會帶來幸福感與歸屬感,已婚病人生活質(zhì)量滿意度更高有關(guān)。

近年來,機(jī)器學(xué)習(xí)結(jié)直腸癌預(yù)測模型應(yīng)用廣泛[26?28],在算法中自動學(xué)習(xí)的架構(gòu)有利于更好地解釋癌癥變量,幫助醫(yī)務(wù)人員進(jìn)行更加精準(zhǔn)的診斷和治療。然而機(jī)器學(xué)習(xí)模型也存在“黑盒”問題[29],解釋性及透明度不佳。醫(yī)療決策要求基于循證理念,因此,本研究構(gòu)建了預(yù)測結(jié)直腸腺癌病人接受內(nèi)鏡治療后5年生存狀態(tài)的機(jī)器學(xué)習(xí)模型,臨床實踐中需要直觀地了解決策過程,因此模型增加了可解釋性,提供了用于個體化預(yù)測的合理依據(jù),有利于使醫(yī)生與病人更加清晰地了解危險因素。在機(jī)器學(xué)習(xí)的經(jīng)典算法中,隨機(jī)森林是基于Bagging原理,采用多個決策樹的集成算法思想,通過增強(qiáng)多個弱分類器提升整個模型的性能,因此優(yōu)于單個決策樹[30],且SHAP交互式算法可以個體化應(yīng)用,有利于針對病人的特異性表現(xiàn)。本研究比較了6種機(jī)器學(xué)習(xí)模型性能以選擇最優(yōu)模型,在AUC及F1分?jǐn)?shù)方面,隨機(jī)森林表現(xiàn)較優(yōu),與傳統(tǒng)的Logistic回歸分析相比,隨機(jī)森林能應(yīng)用隨機(jī)化策略降低學(xué)習(xí)器間的相關(guān)性,提高預(yù)測準(zhǔn)確性,同時基于隨機(jī)森林的可解釋性結(jié)果可提高實際應(yīng)用的泛化性。隨著醫(yī)學(xué)信息技術(shù)的進(jìn)一步發(fā)展,基于機(jī)器學(xué)習(xí)的方法能夠拓展結(jié)直腸癌更多的預(yù)后研究,促進(jìn)精準(zhǔn)醫(yī)療及個體化治療的推廣,構(gòu)建更加精確、實用的臨床預(yù)測模型。

4" 局限性

本研究的局限性在于基于SEER數(shù)據(jù)庫的回顧性信息缺乏內(nèi)鏡下治療有關(guān)的手術(shù)過程以及術(shù)后并發(fā)癥內(nèi)容,可能存在選擇偏倚;其次,數(shù)據(jù)庫中亞洲人數(shù)據(jù)較少,可能對模型的適用性造成影響。在未來應(yīng)納入更多樣本量以及多中心的外部測試數(shù)據(jù)以進(jìn)一步驗證模型可靠性。

5" 小結(jié)

年齡、婚姻狀態(tài)、腫瘤大小是早期結(jié)直腸腺癌病人內(nèi)鏡治療后生存預(yù)后的重要影響因素,對結(jié)直腸腺癌病人接受內(nèi)鏡治療后癌癥特異性生存狀態(tài)至關(guān)重要,基于隨機(jī)森林的機(jī)器學(xué)習(xí)模型預(yù)測性能較好,可為后續(xù)的臨床決策或術(shù)后隨訪提供依據(jù),可視化模型結(jié)果方便對個體病人進(jìn)行動態(tài)精準(zhǔn)評估。

參考文獻(xiàn):

[1]" SUNG H,F(xiàn)ERLAY J,SIEGEL R L,et al.Global cancer statistics 2020:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J].CA Cancer J Clin,2021,71(3):209-249.

[2]" 李娟娟,張新聞,陳曉云,等.1990和2019年中國與全球結(jié)直腸癌疾病負(fù)擔(dān)和危險因素比較分析[J].中華腫瘤防治雜志,2022,29(18):1317-1322.

LI J J,ZHANG X W,CHEN X Y,et al.Comparative analysis of disease burden and risk factors of colon and rectum cancer between China and the world in 1990 and 2019[J].Chinese Journal of Cancer Prevention and Treatment,2022,29(18):1317-1322.

[3]" LI J X,MA X D,CHAKRAVARTI D,et al.Genetic and biological hallmarks of colorectal cancer[J].Genes Dev,2021,35(11/12):787-820.

[4]" 宋世博,王貴齊.早期結(jié)直腸癌及癌前病變的內(nèi)鏡下治療進(jìn)展[J].腫瘤研究與臨床,2023,35(3):228-233.

SONG S B,WANG G Q.Progress of endoscopic treatment for early-stage colorectal cancer and precancerous lesions[J].Cancer Research and Clinic,2023,35(3):228-233.

[5]" 趙鑫,竇利州,張月明,等.早期結(jié)直腸癌經(jīng)內(nèi)鏡非治愈性切除術(shù)后癌殘留或淋巴結(jié)轉(zhuǎn)移的風(fēng)險因素分析[J].中華腫瘤雜志,2023,45(4):335-339.

ZHAO X,DOU L Z,ZHANG Y M,et al.Risk factors for residual cancer or lymph node metastasis after endoscopic noncurable resection of early colorectal cancer[J].Chinese Journal of Oncology,2023,45(4):335-339.

[6]" TING SIM J Z,F(xiàn)ONG Q W,HUANG W M,et al.Machine learning in medicine:what clinicians should know[J].Singapore Med J,2023,64(2):91-97.

[7]" 楊劍鋒,喬佩蕊,李永梅,等.機(jī)器學(xué)習(xí)分類問題及算法研究綜述[J].統(tǒng)計與決策,2019,35(6):36-40.

YANG J F,QIAO P R,LI Y M,et al.A review of machine-learning classification and algorithms[J].Statistics amp; Decision,2019,35(6):36-40.

[8]" 譚向龍,趙之明.機(jī)器學(xué)習(xí)在醫(yī)學(xué)中的應(yīng)用現(xiàn)狀[J].中華腔鏡外科雜志(電子版),2020,13(1):61-64.

TAN X L,ZHAO Z M.Application of machine learning in medicine[J].Chinese Journal of Laparoscopic Surgery(Electronic Edition),2020,13(1):61-64.

[9]" CHOI R Y,COYNER A S,KALPATHY-CRAMER J,et al.Introduction to machine learning,neural networks,and deep learning[J].Transl Vis Sci Technol,2020,9(2):14.

[10]" 周瑤群,方榮華.人工智能在護(hù)理領(lǐng)域的應(yīng)用現(xiàn)狀及發(fā)展前景[J].護(hù)理研究,2022,36(6):1053-1057.

ZHOU Y Q,F(xiàn)ANG R H.Application status and development prospect of artificial intelligence in nursing field[J].Chinese Nursing Research,2022,36(6):1053-1057.

[11]" GREENER J G,KANDATHIL S M,MOFFAT L,et al.A guide to machine learning for biologists[J].Nat Rev Mol Cell Biol,2022,23(1):40-55.

[12]" 張學(xué)云,鄭松柏.老年人結(jié)直腸息肉的相關(guān)危險因素、內(nèi)鏡及病理特征[J].老年醫(yī)學(xué)與保健,2021,27(4):877-880.

ZHANG X Y,ZHENG S B.Related risk factors and features of endoscopic and pathological of colorectal polyps in the elderly[J].Geriatrics amp; Health Care,2021,27(4):877-880.

[13]" SIEGEL R L,WAGLE N S,CERCEK A,et al.Colorectal cancer statistics,2023[J].CA Cancer J Clin,2023,73(3):233-254.

[14]" 童國俊,嚴(yán)強(qiáng),張貴陽,等.腫瘤大小分類對0~Ⅲ期結(jié)直腸癌預(yù)后的影響[J].浙江醫(yī)學(xué),2017,39(19):1664-1666;1734.

TONG G J,YAN Q,ZHANG G Y,et al.Correlation of tumor size classification with TNM classification and prognosis of colorectal cancer[J].Zhejiang Medical Journal,2017,39(19):1664-1666;1734.

[15]" 程慧,卯許有,孫金山.聯(lián)動成像技術(shù)在下消化道病變內(nèi)鏡診斷中的研究進(jìn)展[J].胃腸病學(xué),2021,26(7):433-437.

CHENG H,MAO X Y,SUN J S.Research progress of linked color imaging in endoscopic diagnosis of lower digestive tract diseases[J].Chinese Journal of Gastroenterology,2021,26(7):433-437.

[16]" 李琳,何池義.早期結(jié)直腸癌淋巴結(jié)轉(zhuǎn)移的危險因素分析[J].皖南醫(yī)學(xué)院學(xué)報,2023,42(1):36-39.

LI L,HE C Y.Analysis on the risk factors for lymph node metastasis in early colorectal cancer[J].Journal of Wannan Medical College,2023,42(1):36-39.

[17]" 亢倩玉,宋順喆,宮愛霞.結(jié)直腸側(cè)向發(fā)育型腫瘤黏膜下層侵犯的危險因素分析[J].中華消化內(nèi)鏡雜志,2020,37(12):930-933.

KANG Q Y,SONG S Z,GONG A X.Risk factors of submucosal invasion of laterally developing colorectal tumors[J].Chinese Journal of Digestive Endoscopy,2020,37(12):930-933.

[18]" HE X S,HANG D,WU K N,et al.Long-term risk of colorectal cancer after removal of conventional adenomas and serrated polyps[J].Gastroenterology,2020,158(4):852-861.

[19]" SONG M Y,EMILSSON L,BOZORG S R,et al.Risk of colorectal cancer incidence and mortality after polypectomy:a Swedish record-linkage study[J].Lancet Gastroenterol Hepatol,2020,5(6):537-547.

[20]" MYERS D J,ARORA K,ADENOMA V.Treasure Island[EB/OL].[2023-06-20].https://www.ncbi.nlm.nih.gov/books/NBK470272.

[21]" JANSSENS K,F(xiàn)RANSEN E,VAN CAMP G,et al.A Belgian population-based study reveals subgroups of right-sided colorectal cancer with a better prognosis compared to left-sided cancer[J].Oncologist,2023,28(6):e331-e340.

[22]" 樊啟林,張松,文峰,等.1 474例不同年齡段結(jié)直腸癌患者的臨床病理特征及預(yù)后分析[J].實用腫瘤雜志,2023,38(2):127-132.

FAN Q L,ZHANG S,WEN F,et al.Clinicopathological features and prognosis of 1 474 colorectal cancer patients of different ages[J].Journal of Practical Oncology,2023,38(2):127-132.

[23]" ALESE O B,ZHOU W,JIANG R J,et al.Predictive and prognostic effects of primary tumor size on colorectal cancer survival[J].Front Oncol,2021,11:728076.

[24]" CHEN Z H,YANG K B,ZHANG Y Z,et al.Assessment of modifiable factors for the association of marital status with cancer-specific survival[J].JAMA Netw Open,2021,4(5):e2111813.

[25]" YANG C C,CHENG L C,LIN Y W,et al.The impact of marital status on survival in patients with surgically treated colon cancer[J].Medicine,2019,98(11):e14856.

[26]" KINAR Y,AKIVA P,CHOMAN E,et al.Performance analysis of a machine learning flagging system used to identify a group of individuals at a high risk for colorectal cancer[J].PLoS One,2017,12(2):e0171759.

[27]" BIRKS J,BANKHEAD C,HOLT T A,et al.Evaluation of a prediction model for colorectal cancer:retrospective analysis of 2.5 million patient records[J].Cancer Med,2017,6(10):2453-2460.

[28]" 周欣毅,丁克峰,李軍.早期結(jié)直腸癌的淋巴結(jié)轉(zhuǎn)移風(fēng)險評估體系的現(xiàn)狀及研究進(jìn)展[J].中華胃腸外科雜志,2023,26(5):492-498.

ZHOU X Y,DING K F,LI J.Progress in evaluating the risk of lymph node metastasis in early colorectal cancer[J].Chinese Journal of Gastrointestinal Surgery,2023,26(5):492-498.

[29]" 陳珂銳,孟小峰.機(jī)器學(xué)習(xí)的可解釋性[J].計算機(jī)研究與發(fā)展,2020,57(9):1971-1986.

CHEN K R,MENG X F.Interpretation and understanding in machine learning[J].Journal of Computer Research and Development,2020,57(9):1971-1986.

[30]" ZELNIK-MANOR L,PERONA P.Self-tuning spectral clustering[G]//Proceedings of the 17th International Conference on Neural Information Processing Systems.Vancouver:Annual Conference on Neural Information Processing Systems Fund, Neurlps Fund.2004:1601-1608.

(收稿日期:2023-06-21;修回日期:2024-04-25)

(本文編輯 陳瓊)

猜你喜歡
腺癌直腸機(jī)器
機(jī)器狗
機(jī)器狗
18F-FDG PET/CT在結(jié)直腸偶發(fā)局灶性18F-FDG攝取增高灶診斷中的價值
未來機(jī)器城
電影(2018年8期)2018-09-21 08:00:06
益肺解毒方聯(lián)合順鉑對人肺腺癌A549細(xì)胞的影響
中成藥(2018年7期)2018-08-04 06:04:18
HIF-1a和VEGF-A在宮頸腺癌中的表達(dá)及臨床意義
無敵機(jī)器蛛
GSNO對人肺腺癌A549細(xì)胞的作用
彩超引導(dǎo)下經(jīng)直腸行盆腔占位穿刺活檢1例
老年胃腺癌中FOXO3a、PTEN和E-cadherin表達(dá)的關(guān)系
周至县| 新宁县| 屏东县| 嘉义市| 南木林县| 安乡县| 长海县| 合川市| 中超| 黎平县| 社旗县| 米脂县| 凌海市| 永川市| 新邵县| 古浪县| 三原县| 囊谦县| 河北区| 盘锦市| 屏东县| 平远县| 五寨县| 松潘县| 双流县| 慈溪市| 陕西省| 将乐县| 天峻县| 利川市| 商都县| 开远市| 白山市| 远安县| 遂溪县| 双柏县| 云林县| 漠河县| 扎赉特旗| 突泉县| 长武县|