国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

膀胱癌患者手術治療生存預后影響因素分析與人工智能推薦算法初探

2023-06-28 08:23:26沈惠文馬得原溫立潔譚萬龍
現(xiàn)代泌尿外科雜志 2023年6期
關鍵詞:膀胱癌白蛋白預測

張 玥,張 策,楊 玻,沈惠文,馬得原,溫立潔,譚萬龍,于 洋

(1.大連醫(yī)科大學附屬第二醫(yī)院泌尿外科,遼寧大連 116000;2.大連醫(yī)科大學附屬第二醫(yī)院發(fā)展規(guī)劃與質量管理部,遼寧大連 116000;3.大連醫(yī)科大學附屬第二醫(yī)院藥學部,遼寧大連 116000;4.南方醫(yī)科大學南方醫(yī)院泌尿外科,廣東廣州 510080)

膀胱尿路上皮癌(bladder urothelial carcinoma,BUC)是全球發(fā)病率排名前十的惡性腫瘤,在泌尿生殖系統(tǒng)惡性腫瘤中發(fā)病率位居第二[1-2]。經(jīng)尿道膀胱腫瘤電切術(transurethral resection of bladder tumor,TURBT)和膀胱全切術分別被認為是非肌層浸潤性和肌層浸潤性膀胱癌的標準治療術式,部分患者根據(jù)一般狀況、腫瘤生長部位、腫瘤負荷等具體情況選擇膀胱部分切除術治療[3-4]。目前研究普遍認為,腫瘤的術后病理分期及分級可作為BUC患者的主要生存預后因素,次要生存預后因素有年齡、性別、吸煙史等[5-6]。近年有研究報道諸如中性粒細胞/淋巴細胞比值、血清白蛋白/球蛋白比值等新的術前預后評估標志物具有一定價值[7-8]。然而將各預后指標進行綜合評價,并以量化的形式評估對不同腫瘤負荷患者采取不同手術方案治療后具體生存預后情況的研究不多。本文擬建立一種手術預后預測系統(tǒng),藉此評估采取不同術式治療膀胱癌患者的生存預后影響因素。同期探索人工智能模型軟件轉化途徑,以期實現(xiàn)術前導入已知因素,經(jīng)模型處理后,得到不同術式膀胱癌患者生存預后的預判輸出。與傳統(tǒng)研究對比,患者能直觀感受不同手術的治療效果,方便醫(yī)生與患者共同優(yōu)化治療決策,提高術前溝通效率,并有助于為患者制定個性化的隨訪方案。

1 對象與方法

1.1 研究對象及分組查詢大連醫(yī)科大學附屬第二醫(yī)院(大醫(yī)二院)和南方醫(yī)科大學南方醫(yī)院(南醫(yī))電子病歷系統(tǒng),收集2007年1月-2019年1月間于兩院初診、初治,接受手術,且病理證實為膀胱尿路上皮癌的成年患者共832名的臨床資料。所有患者均未接受新輔助治療或輔助放化療,保留膀胱者術后接受足療程以表柔比星為主的膀胱灌注化療,均有完整的臨床及隨訪數(shù)據(jù)。其中,大醫(yī)二院的438例患者被納入訓練組進行模型訓練,南方醫(yī)院的394例患者被納入測試組進行模型驗證,綜合評價模型是否存在過擬合,并考察模型的泛化能力。

1.2 數(shù)據(jù)收集為提高模型的臨床適用性,納入臨床常規(guī)的生理和實驗室指標,包括常見的腫瘤標志物,及與腫瘤負荷及惡性程度相關的病理指標進行生存預后分析?;颊咭话阗Y料、術前檢驗及檢查數(shù)據(jù)、術后病理報告采集自住院病歷,隨訪資料來源于門診病歷系統(tǒng)及電話回訪,本研究納入患者隨訪時間至少3年。

一般指標包括:年齡、性別、吸煙、高血壓或心腦血管疾病史、糖尿病史。病理學指標包括:腫瘤數(shù)量、TNM分期(Tumor-Node-Metastasis classification)及病理分級。術前實驗室指標包括白細胞計數(shù)、血紅蛋白濃度、中性粒細胞計數(shù)、淋巴細胞計數(shù)、中性粒細胞/淋巴細胞比值、血小板計數(shù)、血清白蛋白水平、血清球蛋白水平、血清白蛋白/球蛋白比值、谷丙轉氨酶、谷草轉氨酶、乳酸脫氫酶、堿性磷酸酶、血鈣、血磷及血肌酐水平。此外,肌酐清除率通過Cockcroft-Gault公式計算得到。

1.3 統(tǒng)計學分析使用社會科學統(tǒng)計軟件包(Statistical Package for the Social Sciences,SPSS)18.0 軟件進行統(tǒng)計學分析。計量資料采用均值和標準差表示,計數(shù)資料采用數(shù)值和百分率表示,單因素篩選采用卡方檢驗和兩獨立樣本t檢驗。單因素分析具有顯著差異性的變量確定為輸入變量,患者3年總體生存情況(overall survival,OS)確定為輸出變量。檢驗水準定為0.05。

應用Python3.7.4軟件建立深度神經(jīng)網(wǎng)絡(deep neural network,DNN)人工智能學習模型,其包含輸入層、輸出層和隱藏層,在較大數(shù)據(jù)集中,利用隱藏層自我學習的特征,不斷更新信息和網(wǎng)絡,持續(xù)提高分類精確度。其網(wǎng)絡拓撲結構如圖1所示,建立輸入特征和輸出特征的變量關系,以實現(xiàn)從輸入到輸出的預測。具體到本研究,就是建立患者術前各影響因素及術式選擇到患者3年OS間的模型關系,用于術前對患者采取不同手術治療可分別對應的遠期生存情況進行預測評估,并根據(jù)重要性高低對各影響因素賦予權重并排序,研發(fā)預測軟件。

圖1 深度神經(jīng)網(wǎng)絡結構示意圖

神經(jīng)網(wǎng)絡依賴于核心激活函數(shù)建立,本研究中我們采用四層神經(jīng)網(wǎng)絡,輸入層和隱含層應用Relu激活函數(shù),輸出層應用Sigmoid函數(shù),通過訓練集建立模型,再通過測試數(shù)據(jù)集進一步考察模型的準確率和泛化能力,避免由于輸出過于稀疏而導致的模型過度泛化。同時,采用python2.7軟件的Tensorflow軟件包,采用隨機梯度下降算法進行影響因素的權重計算。并通過反向傳播的方法提升模型擬合效果,即通過對誤差的反向傳播,將每次訓練得到的結果與預期結果進行誤差對比分析,通過梯度下降法進行迭代優(yōu)化求極小值。

Relu激活函數(shù):

f(x)=max(0,x)

Sigmoid激活函數(shù):

影響因素權重計算公式(隨機梯度下降算法):

ωji(n)=ωji(n-1)-ηΔωji(n-1)

準確率(Accuracy)測評函數(shù):

表1 預測類別與實際類別的擬合

TP:true positive,陽性,預測也是陽性,預測正確;TN:true negative,陰性,預測也是陰性,預測正確;FP:false positive,假陽性,實際是陰性,預測是陽性,預測錯誤;FN:false negative,假陰性,實際是陽性,預測是陰性,預測錯了。

2 結 果

2.1 患者的基本資料832例患者中,438(52.64%)例在大醫(yī)二院接受治療,394(47.36%)例就診于南醫(yī);最小年齡19歲,最大者96歲,平均年齡64歲;687名(82.6%)男性,145名(17.4%)女性;482例(57.9%)腫瘤為單發(fā),350例(42.1%)為多發(fā);腫瘤病理,Ta-T1期579例(69.6%),T2期158例(19%),T3期69例(8.3%),T4期26例(3.1%);其中低度惡性潛能99例(11.9%),低級別284例(34.1%),高級別449例(54%);539(64.8%)例采用經(jīng)尿道膀胱腫瘤電切術治療,66(7.9%)例接受膀胱部分切除,227(27.3%)例接受膀胱全切術治療。兩中心患者人群基本特征對比見表2,除性別、腫瘤單發(fā)/多發(fā)、N分期無明顯差異外,其余特征兩醫(yī)院間具備統(tǒng)計學差異,但趨勢一致,考慮原因為地區(qū)間經(jīng)濟和人群文化水平差異,以及醫(yī)院影響力的區(qū)域輻射效應不同。

表2 兩中心膀胱癌手術患者基本資料組間對比 [例(%)]

2.2 數(shù)據(jù)特征的提取將大醫(yī)二院治療的438名患者納入測試組,應用單因素分析進行數(shù)據(jù)特征工程的選擇,根據(jù)患者術后36個月時的生存情況將患者分為生存組和死亡組,單因素分析結果顯示兩組間患者年齡、吸煙、淋巴細胞計數(shù)、血紅蛋白、白蛋白、白蛋白/球蛋白比、肌酐清除率、血鈣、T分期、N分期、病理分級、術式具有顯著性差異(P<0.05),可將其作為輸入變量納入DNN模型,其中,高血壓或心腦血管疾病史(P=0.079,表3)在統(tǒng)計臨界狀態(tài),但因其有潛在的臨床指導意義,也一并納入分析,最終以上13個變量作為輸入變量納入最終深度學習模型。

表3 術后3年大醫(yī)二院膀胱癌手術患者死亡組與生存組一般資料組間對比 [例(%)]

2.3 DNN模型建立模型參數(shù)設置采用4層網(wǎng)絡,2個隱含層(圖2),各層神經(jīng)元個數(shù)分別為64、32、16和1,各層采用Dense全連接(緊密全連接),目標函數(shù)為隨機梯度下降,迭代次數(shù)為50(表4)。

表4 模型訓練概況表 (模型:“連續(xù)”)

圖2 深度學習神經(jīng)網(wǎng)絡模型架構

在DNN建模過程中,采用Tensorflow的Keras框架,數(shù)據(jù)結果可視化采用TensorBoard建模數(shù)據(jù)可視化面板。數(shù)據(jù)前期處理(缺失值和異常值)采用Python的Pandas模塊和Numpy模塊。將分類映射到三維,圖3為建模效果,很好的區(qū)分了患者隨訪截止點死亡與否。

圖3 各數(shù)據(jù)點在三維空間分布情況

圖4 模型訓練中各神經(jīng)網(wǎng)絡層收斂情況

DNN模型建立后,使用隨機梯度下降算法進行影響因素權重計算(表5),最終得出T分期是影響患者生存最重要的因素,后續(xù)依次是病理分級、高血壓或心腦血管疾病、血紅蛋白、血鈣、吸煙、白蛋白、淋巴細胞、年齡、白蛋白/球蛋白比、術式、N分期、肌酐清除率。

表5 影響術后并發(fā)癥因素的權重值

DNN模型建立后,應用南方醫(yī)院膀胱癌患者數(shù)據(jù)進行模型準確性驗證,最終測試訓練組模型準確率為88.57%,驗證組模型準確率為92.05%,證明本例DNN模型具有良好的預測效能,后續(xù)將根據(jù)各因素權重進行軟件轉化。

3 討 論

BUC是一種常見并具有高復發(fā)率的惡性腫瘤[2],腫瘤的病理分期及分級是主要的生存預后因素。近年來,不斷有新的預后因素被報道,如血清白蛋白、血清白蛋白/球蛋白比值、淋巴細胞計數(shù)、粒細胞/淋巴細胞比值等,檢測方便且經(jīng)濟有效。但目前生存預后相關報道多為單中心小樣本研究,且多用Logistic或COX單/多因素回歸模型進行分析,所得結論不一且各預后指標的重要程度無法量化。故將各預后指標進行綜合評估并得出準確性高且泛化良好的預后模型,用以量化評估不同腫瘤負荷患者接受不同術式治療后的生存預后情況,將非常值得期待。

神經(jīng)網(wǎng)絡技術起源于上世紀五十年代,擁有輸入層、輸出層和一個隱含層,通過隱含層的計算,每個變量在隱含層獲得相應權重,并將最終變化結果傳達到輸出層,得出預測結果。時至今日,已有部分研究者嘗試采用人工智能技術進行醫(yī)學建模用于疾病的診斷及治療[9-10]。在泌尿系統(tǒng)腫瘤領域,人工智能技術在改善前列腺癌、腎癌和膀胱癌的診斷和治療方面取得了諸多進步,但因其復雜性,利用機器學習和神經(jīng)網(wǎng)絡技術進行膀胱腫瘤的生存預后預測、治療計劃優(yōu)化和患者隨訪教育的研究不多,技術尚不成熟[11]。本文采用DNN算法建模,主要依賴反向傳播的方法提升模型擬合度,通過反復訓練,將每次得到的結果與預期結果進行誤差對比分析,根據(jù)對比結果修正每個神經(jīng)節(jié)點的權值和閾值,使模型不斷逼近預期結果,提高準確性。最終本例模型訓練組測試準確率為88.57%,外部驗證組測試準確率為92.05%,證明該模型具有良好的預測效能,后續(xù)可根據(jù)權重進行軟件轉化。

本研究納入的兩中心膀胱癌患者人群,除性別、腫瘤單發(fā)/多發(fā)、N分期無明顯差異外,其余特征存在統(tǒng)計學差異,考慮原因為地區(qū)間經(jīng)濟和人群文化水平,以及醫(yī)院影響力的區(qū)域輻射效應不同。即發(fā)達地區(qū)(廣州南醫(yī))人群更關注自身身體狀況,重視體檢并在疾病早期(如初次血尿)就診,故患者人群平均年齡較小,病理分級較低;同時,患者經(jīng)濟水平和對生活質量的要求較高,促使就醫(yī)選擇向影響力或規(guī)模更大的省會醫(yī)院傾斜,故南方醫(yī)院膀胱癌患者人群T分期更高,進而膀胱部分切及膀胱全切比例高于大醫(yī)二院。雖地區(qū)間患者基本特征存在統(tǒng)計學差異,但特征趨勢一致,差異不大,采用南北兩單位患者數(shù)據(jù)分別進行建模及驗證,可驗證所得模型對中國膀胱癌患者的普適度。

本研究以3年OS為研究終點進行單因素分析,將生存與死亡患者間具有明顯差異性的指標納入DNN模型中進行分析。其中年齡為基礎指標,反映體力儲備情況,高齡為幾乎所有惡性腫瘤疾病近、遠期生存的危險因素[12]。高血壓或心腦血管疾病史反映患者基礎疾病情況,可顯著影響患者全因死亡[13]。吸煙為導致膀胱癌復發(fā)的明確危險因素[14]。現(xiàn)研究證明維生素D缺乏可能與腫瘤復發(fā)及進展相關,血鈣水平可間接反映患者體內(nèi)維生素D水平,故低鈣可能是影響腫瘤患者生存的危險因素[15-16]。腫瘤病理T、N分期及分級反映腫瘤負荷及惡性程度,分期及分級越高,預后越差[17]。血紅蛋白、血清白蛋白水平及白蛋白/球蛋白比可反映患者營養(yǎng)水平、腫瘤消耗程度,營養(yǎng)不良被認為是術后并發(fā)癥發(fā)生率高的主要原因,患者的防御機制減弱,其術后并發(fā)癥的發(fā)生及癌癥的快速進展更為常見,多項研究證實貧血及低白蛋白血癥是需接受外科手術治療患者的不良預后因素[7-8,18]。淋巴細胞計數(shù)反映機體免疫能力,研究發(fā)現(xiàn)機體免疫能力的下降與腫瘤不良預后相關[8]。肌酐清除率反映患者腎功能情況,即基礎身體素質的高低。當然,同等情況下手術方案的不同對應患者不同的手術預后。以上因素均通過單因素分析證實與腫瘤患者生存預后相關,被納入進一步的DNN模型行進一步分析。

本例DNN模型分析后發(fā)現(xiàn)影響患者手術預后的前三位因素為:腫瘤T分期、病理分級及高血壓或心腦血管疾病,相較于其他指標對患者遠期生存擁有更高的預測效能;病理分期及腫瘤分級越高、基礎疾病狀態(tài)越差,預示患者手術預后越差,這與既往研究結果一致。其他影響因素按其重要性由高至低排序分別為血紅蛋白、血鈣、吸煙、白蛋白、淋巴細胞、年齡、白蛋白/球蛋白比、術式、N分期、肌酐清除率。本研究隨訪病例數(shù)量,且為多中心研究,納入南醫(yī)隨訪數(shù)據(jù)進行外部驗證。通過外部驗證,本例DNN模型對于患者3年OS預測準確率高達92%,證明本研究模型具有良好的預測效能。依據(jù)各預后因素所對應權重研發(fā)軟件,通過輸入各影響因素數(shù)值,即可得出患者對應3年全因生存率,并可計算出不同術式對應術后遠期生存率的差異,具有準確率高及量化對比性強的特點,在臨床工作中具有極好的應用前景。

本研究的局限:①本文是DNN人工智能算法在BUC手術生存預后方面的初步探索,病例數(shù)據(jù)來源有限,患者的基線情況和技術水平可能存在差異。②所有患者均未接受輔助或新輔助治療,后續(xù)可將輔助治療方案納入影響因素進行人工智能學習,完善生存預后模型。未來,研究組將利用DNN人工智能模型自學習的性質,納入更多中心的患者數(shù)據(jù),豐富預后因素,調整模型神經(jīng)單元權重,提升模型預測精度,提高其生存預測效能,從而對患者不同手術方案治療效果進行直觀的術前預判,便于醫(yī)患術前溝通并選擇適宜治療方法,制定個體化隨訪方案。

利益沖突:所有作者均聲明不存在利益沖突。

猜你喜歡
膀胱癌白蛋白預測
無可預測
黃河之聲(2022年10期)2022-09-27 13:59:46
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
VI-RADS評分對膀胱癌精準治療的價值
喜舒復白蛋白肽飲品助力大健康
缺血修飾白蛋白和肌紅蛋白對急性冠狀動脈綜合征的早期診斷價值
Analysis of compatibility rules and mechanisms of traditional Chinese medicine for preventing and treating postoperative recurrence of bladder cancer
不必預測未來,只需把握現(xiàn)在
膀胱癌患者手術后癥狀簇的聚類分析
miRNA-148a在膀胱癌組織中的表達及生物信息學分析
江西省| 客服| 江油市| 阿巴嘎旗| 曲沃县| 乌兰浩特市| 长春市| 五家渠市| 炉霍县| 沂源县| 且末县| 吴桥县| 临海市| 饶平县| 赫章县| 顺平县| 塘沽区| 滦平县| 旌德县| 永康市| 盱眙县| 普兰店市| 股票| 宁河县| 新和县| 六盘水市| 崇阳县| 东丽区| 江永县| 达尔| 太湖县| 渭南市| 郯城县| 叶城县| 珲春市| 衡南县| 道孚县| 额敏县| 延安市| 马边| 龙里县|