秦田田 沈徐寧
結(jié)直腸癌是目前美國(guó)癌癥死亡的第二大常見(jiàn)原因[1],近年來(lái)在我國(guó)的發(fā)病率呈逐級(jí)躍升之勢(shì),在所有腫瘤中已經(jīng)排第三位,嚴(yán)重威脅著人類(lèi)的健康。目前,美國(guó)癌癥聯(lián)合委員會(huì)(american joint committee on cancer,AJCC)TNM 分期系統(tǒng)是預(yù)測(cè)結(jié)直腸癌患者生存結(jié)局的基礎(chǔ)[2],TNM 最大的優(yōu)點(diǎn)是簡(jiǎn)單方便,是區(qū)分不同預(yù)后的唯一依據(jù),但是在預(yù)測(cè)準(zhǔn)確性方面不足[3]。精準(zhǔn)醫(yī)療時(shí)代,臨床預(yù)測(cè)模型作為一種預(yù)估風(fēng)險(xiǎn)和收益的工具在醫(yī)療決策和預(yù)后等方面具有重要的科研意義和臨床價(jià)值[4],適合解決疾病的診斷或預(yù)后相關(guān)問(wèn)題[5]。臨床預(yù)測(cè)模型的應(yīng)用可以有效促進(jìn)臨床研究轉(zhuǎn)化為臨床實(shí)踐,成為當(dāng)前研究熱點(diǎn)[6]。臨床預(yù)測(cè)模型常以列線圖、APP、評(píng)分系統(tǒng)、網(wǎng)頁(yè)的形式展示。然而,以往的一些研究表明,雖然列線圖具有良好的預(yù)測(cè)能力,但是臨床醫(yī)生使用的頻率較低。
列線圖又名為諾謨圖(Nomogram),醫(yī)學(xué)列線圖使用生物學(xué)和臨床變量來(lái)確定統(tǒng)計(jì)預(yù)測(cè)模型,生成臨床事件的概率[7],被廣泛用于腫瘤學(xué)。原理是通過(guò)構(gòu)建多因素回歸模型(如Cox回歸、Logistic 回歸),根據(jù)模型中每個(gè)變量對(duì)結(jié)局事件的影響程度比重,給每個(gè)變量賦分,然后所有變量的分?jǐn)?shù)相加之和與結(jié)果量表相匹配得出結(jié)局事件的預(yù)測(cè)概率,從而將復(fù)雜數(shù)學(xué)公式可視化[8]。
構(gòu)建列線圖首先是確定一個(gè)好的臨床問(wèn)題。其構(gòu)建步驟包括:確定結(jié)局變量和研究人群、選擇納入變量、構(gòu)建模型、驗(yàn)證和評(píng)價(jià)模型。
2.1 確定結(jié)局變量和研究人群 結(jié)局變量一般是疾病的復(fù)發(fā)(局部、遠(yuǎn)處或者兩者皆有)或死亡,結(jié)局變量的特點(diǎn)是定義明確和容易重復(fù)測(cè)量;研究人群應(yīng)該代表一般人群,并且易于鑒別。
2.2 選擇納入變量 根據(jù)試驗(yàn)中確定的臨床結(jié)局,選擇與結(jié)果有關(guān)的變量[9],包括臨床病理特征(組織分級(jí)、淋巴結(jié)陽(yáng)性數(shù)、遠(yuǎn)處轉(zhuǎn)移、血管神經(jīng)侵犯等)以及人口統(tǒng)計(jì)學(xué)特征(年齡、種族、婚姻狀況和性別)。如果驗(yàn)證數(shù)據(jù)不是由隨機(jī)臨床試驗(yàn)得出,治療方式一般避免作為變量選擇。
2.3 構(gòu)建模型 變量選擇后,需要選擇一個(gè)合適的統(tǒng)計(jì)模型。最常見(jiàn)的是采用多因素回歸分析以確定因變量和結(jié)局之間的關(guān)系并建立模型:Cox 比例風(fēng)險(xiǎn)模型通常用于生存分析,logistic 回歸通常用于預(yù)測(cè)腫瘤發(fā)生風(fēng)險(xiǎn)的概率[10]。
2.4 驗(yàn)證和評(píng)價(jià)模型 列線圖需要在不同數(shù)據(jù)集進(jìn)行反復(fù)驗(yàn)證來(lái)評(píng)估預(yù)測(cè)能力。驗(yàn)證分為內(nèi)部驗(yàn)證和外部驗(yàn)證,其中外部驗(yàn)證是評(píng)價(jià)模型性能的金標(biāo)準(zhǔn)[9],內(nèi)部驗(yàn)證則是原始數(shù)據(jù)集中按比例隨機(jī)獲取的子數(shù)據(jù)集進(jìn)行交叉驗(yàn)證,因此難以避免偏差,使得驗(yàn)證結(jié)果的準(zhǔn)確度具有一定的局限性[11]。模型的區(qū)分能力是判斷目標(biāo)人群發(fā)生或不發(fā)生結(jié)局事件的能力,主要通過(guò)一致性指數(shù)(the concordance index,C 指數(shù))或者受試者工作特征曲線的曲線下面積(areaunder curve,AUC)表示。C 指數(shù)或AUC<0.65 代表模型區(qū)分能力較差,0.65~0.75 表示模型有一定的區(qū)分能力,>0.75 則表示模型區(qū)分能力較好[11-12]。
3.1 預(yù)測(cè)結(jié)直腸癌的診斷 結(jié)直腸癌的早期5 年生存率達(dá)90%[13],早發(fā)現(xiàn)、早診斷、早治療能夠有效降低癌癥死亡率,我國(guó)結(jié)直腸癌篩查的主要方法為直腸指檢和直腸鏡檢查。目前發(fā)現(xiàn)結(jié)直腸癌的發(fā)病率與各地經(jīng)濟(jì)水平呈正相關(guān)[14],同時(shí)死亡率與發(fā)展水平呈負(fù)相關(guān)。經(jīng)濟(jì)發(fā)展水平是衡量一個(gè)地區(qū)社會(huì)發(fā)展最直觀的指標(biāo)[15],包括飲食、環(huán)境、文化水平、環(huán)境等。2015 年中國(guó)地區(qū)惡性腫瘤發(fā)病和死亡分析顯示:年齡、肥胖、飲食結(jié)構(gòu)、久坐、運(yùn)動(dòng)方式等是結(jié)直腸癌發(fā)病的重要危險(xiǎn)因素。針對(duì)這些因素,鄒夏慧等[16]于2022 年針對(duì)當(dāng)?shù)厝巳哼M(jìn)行結(jié)直腸癌及癌前病變的篩查,了解結(jié)直腸癌及進(jìn)展期腺瘤的發(fā)病率,采用多因素Logistic 回歸的方法,篩選進(jìn)展期腺瘤相關(guān)危險(xiǎn)因素,將年齡、性別、腺瘤大體形態(tài)、吸煙、結(jié)腸癌家族史、肥胖、飲酒、喜食紅肉等8 個(gè)指標(biāo)納入列線圖,繪制了進(jìn)展期結(jié)直腸腺瘤預(yù)測(cè)模型,結(jié)果顯示高齡、男性、肥胖、飲酒、吸煙、有結(jié)直腸腫瘤家族史對(duì)出現(xiàn)進(jìn)展期結(jié)直腸腺瘤的風(fēng)險(xiǎn)明顯升高,同時(shí)評(píng)價(jià)模型顯示上述因素構(gòu)建的列線圖模型預(yù)測(cè)價(jià)值較好。
3.2 預(yù)測(cè)結(jié)直腸癌術(shù)后并發(fā)癥 吻合口瘺是結(jié)直腸癌術(shù)后最可怕的并發(fā)癥之一[17-18],發(fā)病率和死亡率分別為12%[19]、30%[20],一旦發(fā)生,將會(huì)導(dǎo)致結(jié)直腸癌患者更長(zhǎng)的住院時(shí)間和更多的費(fèi)用。此前已有研究表明,外科醫(yī)生在腸道手術(shù)中缺乏對(duì)吻合口瘺的準(zhǔn)確預(yù)測(cè),從而無(wú)法篩選出高危吻合口瘺患者。吻合口瘺的發(fā)生受多種因素的影響,2015 年Matteo等[21]基于52 家醫(yī)院第一次設(shè)計(jì)了一項(xiàng)關(guān)于吻合口瘺的前瞻性研究,納入3,193 例患者,單因素及多因素分析確定結(jié)直腸癌術(shù)后吻合口瘺的術(shù)前或術(shù)中危險(xiǎn)因素,納入口服抗凝藥、術(shù)中并發(fā)癥、體重指數(shù)、術(shù)前血清總蛋白濃度、性別創(chuàng)建列線圖預(yù)測(cè)給定患者術(shù)后吻合口瘺的風(fēng)險(xiǎn),結(jié)果顯示肥胖、男性、抗凝治療、蛋白濃度低、手術(shù)技術(shù)和醫(yī)院都是術(shù)后吻合口瘺的重要決定因素。充分了解術(shù)后吻合口瘺的危險(xiǎn)因素,術(shù)前及時(shí)做出處理,對(duì)避免吻合口瘺的發(fā)生具有重要作用。術(shù)后早期腸梗阻是腹部手術(shù)后常見(jiàn)并發(fā)癥[22],尤其以結(jié)直腸癌術(shù)后多見(jiàn),結(jié)腸癌術(shù)后發(fā)生腸梗阻的概率為2%~15%[23],影響結(jié)直腸癌術(shù)后發(fā)生腸梗阻的因素較多,熟悉并掌握結(jié)腸癌患者切除術(shù)后發(fā)生腸梗阻的高危因素,可以早期預(yù)測(cè)腸梗阻的發(fā)生[24]。盡管一些預(yù)防術(shù)后腸梗阻的措施研究較多,但是效果一般[25-28]。李明東等[29]2021 年回顧性分析283 例行結(jié)直腸癌根治術(shù)患者,基于Logistic 回歸分析,結(jié)果顯示腫瘤TNM Ⅲ期、中轉(zhuǎn)開(kāi)腹、右半結(jié)腸切除術(shù)、手術(shù)時(shí)間、既往結(jié)腸腫瘤手術(shù)史是結(jié)直腸癌患者術(shù)后腸梗阻發(fā)生的獨(dú)立危險(xiǎn)因素(P<0.05);研究者將這些獨(dú)立危險(xiǎn)因素構(gòu)建了結(jié)腸癌術(shù)后發(fā)生腸梗阻的列線圖模型,結(jié)果顯示手術(shù)時(shí)間長(zhǎng)、TNM 分期晚、右半結(jié)腸切除術(shù)、開(kāi)腹手術(shù)這些因素導(dǎo)致術(shù)后發(fā)生腸梗阻概率越高,模型校準(zhǔn)AUC 為0.919(95%CI:0.862~0.975),校準(zhǔn)曲線斜率接近1。
3.3 預(yù)測(cè)結(jié)直腸癌患者術(shù)后復(fù)發(fā) 根治性切除術(shù)仍是結(jié)直腸癌首要治療手段,術(shù)后復(fù)發(fā)一直是治療上的重點(diǎn)和難點(diǎn)。研究發(fā)現(xiàn),20%~30%的Ⅱ~Ⅲ期結(jié)腸癌患者行根治術(shù)后會(huì)出現(xiàn)復(fù)發(fā)[30-31],對(duì)于復(fù)發(fā)患者,術(shù)后是否進(jìn)一步治療目前仍存在爭(zhēng)議[32]。目前臨床上主要根據(jù)影像學(xué)檢查和隨訪評(píng)估術(shù)后復(fù)發(fā),WEISER[33]設(shè)計(jì)了一項(xiàng)前瞻性研究,收集了2007~2014年1,095 例行根治性切除術(shù)治療的Ⅰ~Ⅲ期結(jié)腸癌患者的臨床病理資料,采用Logistic 逐步回歸分析,納入基因組表型、T 分期、總淋巴結(jié)數(shù)目、淋巴結(jié)陽(yáng)性數(shù)目、是否化療,構(gòu)建了結(jié)腸癌根治術(shù)后復(fù)發(fā)的列線圖預(yù)測(cè)模型。同時(shí),該模型聯(lián)合臨床計(jì)算器,這種用于預(yù)測(cè)治愈性結(jié)腸切除術(shù)后癌癥復(fù)發(fā)的第三代臨床計(jì)算器成功地結(jié)合了微衛(wèi)星基因組表型和腫瘤浸潤(rùn)淋巴細(xì)胞的存在,從而提高了鑒別和預(yù)測(cè)準(zhǔn)確性。模型AUC 為0.792(95%CI:0.749~0.837,P<0.05),外部驗(yàn)證一致性指數(shù)為0.738(95%CI:0.703~0.811,P<0.05),顯示該模型有較好的能力預(yù)測(cè)復(fù)發(fā)概率。
3.4 預(yù)測(cè)結(jié)直腸癌患者術(shù)后生存 預(yù)測(cè)術(shù)后生存模型的研究相比于術(shù)后復(fù)發(fā)和術(shù)前預(yù)測(cè)模型較多。由最初的納入臨床病理特征到現(xiàn)在與基因結(jié)合,XU 等[34]通過(guò)機(jī)器學(xué)習(xí)的方法,對(duì)結(jié)腸癌患者樣本的分析,通過(guò)差異表達(dá)分析,識(shí)別與結(jié)腸癌預(yù)后相關(guān)的自噬基因,納入年齡、性別、TNM 分期、風(fēng)險(xiǎn)評(píng)分和自噬基因,構(gòu)建自噬基因模型,以預(yù)測(cè)結(jié)腸癌患者的預(yù)后。該模型包含8 個(gè)自噬基因,包括CTSD、ULK3、CDKN2A、NRG1、ATG4B、ULK1、DAPK1 和SERPINA1,能較好地預(yù)測(cè)結(jié)腸癌患者的預(yù)后。同時(shí)這8 個(gè)基因可能成為調(diào)節(jié)細(xì)胞自噬和治療結(jié)腸癌患者的生物靶點(diǎn)。
列線圖在腫瘤的發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)與預(yù)后評(píng)估應(yīng)用越來(lái)越廣泛,近年來(lái)臨床預(yù)測(cè)模型的研究幫助臨床醫(yī)生與患者在決策上起到正向作用,在臨床工作中,醫(yī)生與患者由于對(duì)疾病的認(rèn)識(shí)不同,在與患者溝通時(shí),患者常無(wú)法直觀理解醫(yī)生選擇治療方案的原因,列線圖的直觀可視化具有重大價(jià)值。
列線圖應(yīng)該同時(shí)具有準(zhǔn)確和簡(jiǎn)單易于使用的特點(diǎn),如果模型對(duì)預(yù)測(cè)事件的發(fā)生預(yù)估不準(zhǔn)確,就會(huì)誤導(dǎo)醫(yī)生和患者對(duì)疾病的判斷,嚴(yán)重時(shí)進(jìn)行錯(cuò)誤的治療。另一方面,如果模型不夠簡(jiǎn)單,例如進(jìn)行復(fù)雜的運(yùn)算,就無(wú)法被更多人接受和使用,如果列線圖過(guò)于簡(jiǎn)單,可能會(huì)降低準(zhǔn)確性,因此列線圖應(yīng)該在準(zhǔn)確和簡(jiǎn)單中取得最優(yōu)解。
目前,列線圖仍存在一定的局限性,部分列線圖基于國(guó)外多中心數(shù)據(jù)庫(kù)如腫瘤基因組圖譜或者美國(guó)國(guó)立癌癥研究所數(shù)據(jù)庫(kù)[35],由于種族差異與當(dāng)?shù)蒯t(yī)療水平的差異,列線圖無(wú)法直接應(yīng)用于國(guó)人身上。另一方面,國(guó)內(nèi)的列線圖多局限于單一數(shù)據(jù)庫(kù),無(wú)法準(zhǔn)確驗(yàn)證列線圖準(zhǔn)確性和特異性,多數(shù)據(jù)庫(kù)多樣本納入列線圖顯得極為重要。理解和應(yīng)用經(jīng)過(guò)多數(shù)據(jù)庫(kù)驗(yàn)證有效的列線圖,未來(lái)有希望成為臨床決策診療中重要的部分。