賀婷,袁麗,楊小玲,葉子溦,李饒,古艷
2型糖尿?。═2DM)是患病人數(shù)最多的糖尿病類型,隨著病程進(jìn)展容易引起各種并發(fā)癥,是導(dǎo)致失明、腎功能衰竭、心臟病發(fā)作、卒中和死亡的主要原因[1]。國(guó)際糖尿病聯(lián)盟發(fā)布的第九版“全球糖尿病地圖”數(shù)據(jù)顯示,2019年全球約有5.37億成人糖尿病患者,糖尿病患病率達(dá)10.5%,其中約90%為T2DM[2]。過去十年,亞洲人群糖尿病患病率大幅上升,中國(guó)和印度是全球糖尿病患者人數(shù)最多的兩個(gè)國(guó)家,亞洲糖尿病的患病總?cè)藬?shù)占世界糖尿病患病人數(shù)的55%[2-3]。研究結(jié)果顯示,有超過50%的糖尿病患者未得到及時(shí)診斷和治療,T2DM的診斷延遲不僅會(huì)使個(gè)體醫(yī)療保健支出大幅度增長(zhǎng)、疾病負(fù)擔(dān)加重,還可能增加其出現(xiàn)嚴(yán)重并發(fā)癥,甚至死亡的風(fēng)險(xiǎn)[4-5]。基于T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果,醫(yī)務(wù)人員可早期發(fā)現(xiàn)未得到診斷的T2DM患者,以及T2DM高危人群,并通過采取針對(duì)性、個(gè)體化的預(yù)防/干預(yù)策略,降低T2DM發(fā)病概率/減緩病情進(jìn)展。在過去的幾十年里,國(guó)內(nèi)外研究者開發(fā)了多種基于亞洲人群的預(yù)測(cè)模型來預(yù)測(cè)其T2DM發(fā)病風(fēng)險(xiǎn),然而研究者對(duì)模型的構(gòu)建策略報(bào)告不夠明確,大多數(shù)預(yù)測(cè)模型使用受限,預(yù)測(cè)效果仍有待深入驗(yàn)證。本研究通過系統(tǒng)性地分析、評(píng)價(jià)亞洲T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型的開發(fā)過程和效能,旨在為T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型的選擇和深度開發(fā)提供依據(jù)與參考。本研究已在PROSPERO登記注冊(cè)并審核通過,注冊(cè)號(hào)為CRD42021244563。
1.1 文獻(xiàn)納入和排除標(biāo)準(zhǔn) 納入標(biāo)準(zhǔn):(1)研究對(duì)象為亞洲人群且基線時(shí)無糖尿??;(2)研究?jī)?nèi)容為T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型(不包括診斷模型),并且研究描述了模型的建立、驗(yàn)證和評(píng)價(jià)過程;(3)研究類型為隊(duì)列研究;(4)英文文獻(xiàn)。排除標(biāo)準(zhǔn):(1)細(xì)胞、分子及基因水平研究;(2)觀察對(duì)象為兒童/青少年/特定患病人群(如肥胖、高血壓患者)的研究;(3)預(yù)測(cè)結(jié)果包括T2DM,但不限于T2DM(如心血管疾?。┑难芯?;(4)未采用回歸法(如神經(jīng)網(wǎng)絡(luò)或決策樹)構(gòu)建預(yù)測(cè)模型的研究;(5)對(duì)既往開發(fā)的模型進(jìn)行驗(yàn)證的研究;(6)國(guó)際會(huì)議摘要、二次研究;(7)模型包含的預(yù)測(cè)因子數(shù)<2;(8)重復(fù)發(fā)表的文獻(xiàn)。
1.2 文獻(xiàn)檢索策略 于2021年4月,計(jì)算機(jī)檢索PubMed、EmBase、the Cochrane Library獲取有關(guān)亞洲T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型的研究,檢索時(shí)限均為建庫(kù)至2021-04-01。此外,追溯納入文獻(xiàn)的參考文獻(xiàn),以補(bǔ)充獲取相關(guān)文獻(xiàn)。檢索詞包括:type 2 diabetes mellitus、ketosis-resistant diabetes mellitus、non-insulin-dependent diabetes mellitus、stable diabetes mellitus、NIDDM、slowonset diabetes mellitus、adult-onset diabetes mellitus、prediction model、risk stratification model、risk factor score、risk score、risk assessment、algorithm。 以 the Cochrane Library為例,具體檢索策略請(qǐng)掃描本文二維碼獲取。
1.3 文獻(xiàn)篩選與資料提取 2名研究者獨(dú)立篩選文獻(xiàn)、提取資料并交叉核對(duì),若存在分歧,則征求第3方意見。文獻(xiàn)篩選時(shí),首先閱讀文題和摘要(初篩),在排除明顯不相關(guān)的文獻(xiàn)后,進(jìn)一步通讀全文根據(jù)納入和排除標(biāo)準(zhǔn)以最終確定是否納入(復(fù)篩)?;陬A(yù)測(cè)模型研究偏倚風(fēng)險(xiǎn)及適用性評(píng)估的要素和資料提取內(nèi)容制訂標(biāo)準(zhǔn)化表格[6]。資料提取內(nèi)容主要包括第一作者、發(fā)表年份、國(guó)家(地區(qū))、研究類型、研究對(duì)象年齡、樣本來源、樣本量(不包含缺失數(shù)據(jù))、發(fā)生結(jié)局事件的患者數(shù)、隨訪時(shí)長(zhǎng)、觀察終點(diǎn)、連續(xù)變量處理方法、缺失數(shù)據(jù)數(shù)量及處理方法、建模方法、變量選擇方法、驗(yàn)?zāi)7椒ā⑹茉囌吖ぷ魈卣髑€下面積(AUC)、擬合優(yōu)度、過度擬合情況、模型包含的預(yù)測(cè)因子、模型呈現(xiàn)形式、局限性(模型/研究)。
1.4 納入文獻(xiàn)的偏倚風(fēng)險(xiǎn)及適用性評(píng)估 由2名研究者獨(dú)立采用預(yù)測(cè)模型偏倚風(fēng)險(xiǎn)評(píng)估工具(PROBAST)對(duì)納入文獻(xiàn)的偏倚風(fēng)險(xiǎn)和適用性進(jìn)行嚴(yán)格評(píng)估,若存在分歧,則征求第3方意見。PROBAST由MOONS等[7]、WOLFF等[8]于2019年推出,包含研究對(duì)象(2個(gè)問題)、預(yù)測(cè)因子(3個(gè)問題)、結(jié)果(6個(gè)問題)和數(shù)據(jù)分析(9個(gè)問題)4個(gè)領(lǐng)域。每個(gè)領(lǐng)域的評(píng)估結(jié)果分為“低”“高”“不清楚”3個(gè)等級(jí)。每個(gè)問題采用“是/可能是”“可能不是/不是”或“沒有信息”進(jìn)行回答。若4個(gè)領(lǐng)域的偏倚風(fēng)險(xiǎn)評(píng)估結(jié)果均為“低”,則整體偏倚風(fēng)險(xiǎn)被判斷為“低”;若有≥1個(gè)領(lǐng)域的偏倚風(fēng)險(xiǎn)評(píng)估結(jié)果為“高”,則整體偏倚風(fēng)險(xiǎn)為“高”;若有領(lǐng)域的偏倚風(fēng)險(xiǎn)評(píng)估結(jié)果為“不清楚”,而其他領(lǐng)域的偏倚風(fēng)險(xiǎn)評(píng)估結(jié)果均為“低”,則認(rèn)為整體偏倚風(fēng)險(xiǎn)為“不清楚”。此外,對(duì)于模型構(gòu)建研究,即使所有領(lǐng)域的偏倚風(fēng)險(xiǎn)評(píng)估結(jié)果均為“低”,若模型未經(jīng)過外部驗(yàn)證,則整體偏倚風(fēng)險(xiǎn)仍為“高”。PROBAST主要從前3個(gè)領(lǐng)域?qū)m用性進(jìn)行評(píng)價(jià),適用性評(píng)價(jià)方法與偏倚風(fēng)險(xiǎn)評(píng)價(jià)方法相似。
1.5 統(tǒng)計(jì)學(xué)方法 采用描述性分析法對(duì)模型的基本特征及納入研究的偏倚風(fēng)險(xiǎn)與適用性評(píng)價(jià)結(jié)果進(jìn)行總結(jié)、分析。
2.1 文獻(xiàn)篩選流程及結(jié)果 通過檢索得到相關(guān)文獻(xiàn)12 550篇,經(jīng)過逐層篩選,最終納入研究31項(xiàng)[9-39]。文獻(xiàn)篩選流程見圖1。
圖1 文獻(xiàn)篩選流程Figure 1 Literature screening flowchart
2.2 納入文獻(xiàn)的基本特征 納入的31項(xiàng)研究主要來源于中國(guó)(n=15)、日本(n=6)和韓國(guó)(n=4);17項(xiàng)[9-11,14-18,20-21,26,28,30,34-35,37-38]為前瞻性隊(duì)列研究,14項(xiàng)[12-13,19,22-25,27,29,31-33,36,39]為 回 顧 性 隊(duì) 列 研究;樣本量(不包含缺失數(shù)據(jù))為1 851~366 009,發(fā)生結(jié)局事件的患者數(shù)為144~38 718例。30項(xiàng)[9-10,12-39]研究將空腹血糖(FBG)≥ 7.0 mmol/L作 為觀察終點(diǎn),12 項(xiàng)[18-20,22,25,30-31,33,35-38]研究將糖化血紅蛋白(HbA1c)≥6.5%作為觀察終點(diǎn),13項(xiàng)[9,11,14-17,19,25,29,31,34,36,38]研 究 將 餐 后 2 h 血 糖(2 h-PG)≥ 11.1 mmol/L 作為觀察終點(diǎn),3 項(xiàng)[22,33,36]研究將隨機(jī)血糖≥11.0 mmol/L作為觀察終點(diǎn),見表1。
表1 納入的亞洲T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型研究的基本信息Table 1 Basic characteristics of included studies on risk prediction models for T2DM in Asian adults
2.3 納入預(yù)測(cè)模型的基本特征
2.3.1 模型的建立與驗(yàn)證 3項(xiàng)[26,34,37]研究保持了連續(xù)變量的連續(xù)性,2項(xiàng)[18,31]研究保持了部分連續(xù)變量的連續(xù)性,26 項(xiàng)[9-17,19-25,27-30,32-33,35-36,38-39]研究將全部連續(xù)變量轉(zhuǎn)化為分類變量。數(shù)據(jù)缺失及其處理方法方面,3項(xiàng)[14,19,38]研究存在著較為嚴(yán)重的數(shù)據(jù)缺失現(xiàn)象(缺失率>30%),RHEE等[39]采用多重插補(bǔ)法處理缺失值,ASGARI等[37]使用單一插補(bǔ)法對(duì)缺失數(shù)據(jù)進(jìn)行填補(bǔ),22 項(xiàng)[9-11,14,17-24,27-30,32-36,38]研究采用了完整個(gè)案分析法。納入研究多采用Cox回歸、Logistic回歸建立模型。WANG等[34]在采用Logistic回歸建立模型的同時(shí),建立了矩陣多項(xiàng)式模型;LIU等[24]通過建立亞分布風(fēng)險(xiǎn)模型,避免數(shù)據(jù)競(jìng)爭(zhēng);ASGARI等[37]在采用Cox回歸建立靜態(tài)預(yù)測(cè)模型的同時(shí),建立了基于混合效應(yīng)模型和Cox模型的縱向和生存數(shù)據(jù)聯(lián)合模型。20 項(xiàng)[10,12-14,16-19,22-23,25,27,29-35,39]研 究 報(bào) 告 在 篩 選變 量 時(shí) 采 用 了 逐 步 選 擇 法,7 項(xiàng)[9,15,19,21,24,28,38]研 究 采 用 了 單 因 素 分 析,SHAO 等[36]則基于LASSO算法進(jìn)行變量篩選。4項(xiàng)[11,16,31,34]研 究 建 立 了 基 于 性 別 的 T2DM 發(fā)病風(fēng)險(xiǎn)差異化預(yù)測(cè)模型。模型驗(yàn)證方面,5 項(xiàng)[9,15,17-18,31]研 究 僅對(duì) 模型 進(jìn) 行了 外 部驗(yàn) 證,22 項(xiàng)[10-14,16,19-21,23-30,32-33,35,38-39]研 究 僅 對(duì) 模 型進(jìn)行了內(nèi)部驗(yàn)證,4項(xiàng)[22,34,36-37]研究采用內(nèi)部驗(yàn)證與外部驗(yàn)證相結(jié)合的方法對(duì)模型進(jìn)行了驗(yàn)證。納入模型的AUC為0.62~0.92,提示模型預(yù)測(cè)性能 較 好。15 項(xiàng)[10,14,19-21,23-24,26-27,30,32,34,36-38]研究考慮了模型的過度擬合情況,并對(duì)其進(jìn)行了校準(zhǔn),見表2。
表2 亞洲T2MD發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型建立和驗(yàn)證的基本特征Table 2 Basic characteristics of development and validation included risk prediction models for T2DM in Asian adults
2.3.2 模型中的預(yù)測(cè)因子及其呈現(xiàn)形式 模型包含的預(yù)測(cè)因子數(shù)量為3~24個(gè),預(yù)測(cè)因子可主要分為人口學(xué)因素、體格檢查指標(biāo)、實(shí)驗(yàn)室檢查指標(biāo)三類。其中人口學(xué)因素以年齡、性別和糖尿病家族史較為常見,體格檢查指標(biāo)以體質(zhì)指數(shù)(BMI)和腰圍較為常見,而實(shí)驗(yàn)室指標(biāo)以FBG、HbA1c和三酰甘油(TG)較為常見。模型呈現(xiàn)形式主要以風(fēng)險(xiǎn)評(píng)分和風(fēng)險(xiǎn)計(jì)算公式為主,3項(xiàng)[23,34,36]研究采用列線圖的方式呈現(xiàn)模型,見表3。
表3 亞洲T2MD發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型的預(yù)測(cè)因子、呈現(xiàn)形式及其局限性Table 3 Predictors,presentation and limitations of included risk prediction models for T2DM in Asian adults
2.4 納入文獻(xiàn)的偏倚風(fēng)險(xiǎn)和適用性評(píng)價(jià)結(jié)果
2.4.1 納入文獻(xiàn)的偏倚風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果 納入研究均存在較高的偏倚風(fēng)險(xiǎn)。
2.4.1.1 研究對(duì)象領(lǐng)域 4項(xiàng)[10,33-34,36]研究將特定人群,如心血管疾病、癌癥、卒中患者、妊娠者排除在研究對(duì)象之外,這可能會(huì)對(duì)T2DM發(fā)病率的準(zhǔn)確性造成不利影響,故此4項(xiàng)研究在該領(lǐng)域的偏倚風(fēng)險(xiǎn)評(píng)估結(jié)果為“高”,其余研究均為“低”,見表4。
2.4.1.2 預(yù)測(cè)因子領(lǐng)域 XU等[21]和 NANRI等[22]的研究為多中心研究,但各中心對(duì)預(yù)測(cè)因子采用的測(cè)量方法有差異;WANG等[23]的研究則未報(bào)告預(yù)測(cè)因子測(cè)量相關(guān)信息。2項(xiàng)[21-22]研究在該領(lǐng)域的偏倚風(fēng)險(xiǎn)評(píng)估結(jié)果為“高”,1項(xiàng)[23]研究為“不清楚”,其余研究均為“低”,見表4。
2.4.1.3 結(jié)果領(lǐng)域 2項(xiàng)[16,28]研究中,F(xiàn)BG既是T2DM的診斷標(biāo)準(zhǔn),亦是模型中的預(yù)測(cè)因子,但此2項(xiàng)研究均未明確基于FBG的模型適用條件。NANRI等[22]、YATSUYA等[30]、HU等[33]的研究中,接受降糖治療的定義及結(jié)局變量的測(cè)量方法在各中心間有所不同。OH等[38]的研究中,對(duì)于葡萄糖耐量試驗(yàn)和HbA1c數(shù)據(jù)缺失的個(gè)案,僅憑借FBG診斷T2DM,這可能會(huì)導(dǎo)致診斷性偏倚。上述 6 項(xiàng)[16,22,28,30,33,38]研究在該領(lǐng)域的偏倚風(fēng)險(xiǎn)評(píng)估結(jié)果為“高”,其余研究均為“低”,見表4。
(續(xù)表2)
(續(xù)表3)
2.4.1.4 數(shù)據(jù)分析領(lǐng)域 除3項(xiàng)[23,27,29]研究在該領(lǐng)域的偏倚風(fēng)險(xiǎn)評(píng)估結(jié)果為“不清楚”,其余研究均為“高”。10 項(xiàng)[9-10,12,14,16-18,21-22,24]研究在轉(zhuǎn)化連續(xù)變量的過程中未檢驗(yàn)連續(xù)變量間是否存在非線性關(guān)系或未對(duì)分類變量進(jìn)行標(biāo)準(zhǔn)的定義,故在相應(yīng)問題上被評(píng)價(jià)為“否”。10項(xiàng)[10,14,18,22,25,29,30,35-37]研究未將所有的研究對(duì)象納入分析(研究數(shù)據(jù)多來源于數(shù)據(jù)庫(kù),或?yàn)榈怯洈?shù)據(jù)),這可能會(huì)導(dǎo)致結(jié)果出現(xiàn)偏差。采用完整個(gè)案分析法處理缺失數(shù)據(jù)的研究中,4項(xiàng)[9,14,20,24]研究對(duì)剔除樣本與納入分析樣本的基本特征進(jìn)行了組間比較分析,發(fā)現(xiàn)差異無統(tǒng)計(jì)學(xué)意義,該處理方法相對(duì)合理;而其余研究在采用完整個(gè)案分析法處理缺失數(shù)據(jù)后,在不確定數(shù)據(jù)缺失是否完全隨機(jī)的情況下,并未對(duì)剔除樣本的特征進(jìn)行分析,可引起偏倚。僅1項(xiàng)[24]研究明確表示考慮了數(shù)據(jù)競(jìng)爭(zhēng)問題,在相應(yīng)問題上被評(píng)價(jià) 為“ 是 ”。16 項(xiàng)[10-13,15-16,18-19,24,26-27,32,34,35,38]研究由于未報(bào)告模型的校準(zhǔn)度,或僅以H-L擬合優(yōu)度檢驗(yàn)的統(tǒng)計(jì)量值和P值反映模型的校準(zhǔn)度而未能提供校準(zhǔn)圖等因素,在相應(yīng)問題上被評(píng)價(jià)為“否/可能否”,見表4。
2.4.2 適用性評(píng)價(jià)結(jié)果 納入模型總體及在各領(lǐng)域上的適用性較好,見表4。
表4 納入文獻(xiàn)偏倚風(fēng)險(xiǎn)及適用性評(píng)價(jià)結(jié)果Table 4 Results of the assessment of risk of bias and applicability of included studies on the risk prediction model of T2DM
3.1 亞洲T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型的研究尚處于發(fā)展階段 本研究系統(tǒng)檢索了亞洲T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型相關(guān)研究,經(jīng)過逐層篩選,最終納入了31項(xiàng)研究。納入模型的AUC為0.62~0.92,其中12 項(xiàng)[12-14,18,22,25,33-37,39]研 究 開 發(fā) 的 40 個(gè) 模 型 的AUC>0.8,2 項(xiàng)[18,36]研究中的 2 個(gè)模型的 AUC>0.9,提示模型預(yù)測(cè)性能較好。所有納入的研究均存在高偏倚風(fēng)險(xiǎn),主要原因?yàn)閷?duì)連續(xù)變量的處理不合理、對(duì)缺失數(shù)據(jù)的處理不合理、存在樂觀偏差、忽略了模型的過度擬合問題、未規(guī)范地對(duì)模型進(jìn)行評(píng)價(jià)及缺乏外部驗(yàn)證等。
3.2 亞洲T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型存在同質(zhì)化現(xiàn)象 T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型包含的預(yù)測(cè)因子以年齡、性別、糖尿病家族史、BMI、腰圍、FBG、HbA1c和血脂指標(biāo)為多見。一方面提示臨床醫(yī)務(wù)工作者應(yīng)重視上述指標(biāo)對(duì)T2DM發(fā)病的預(yù)警作用,加強(qiáng)對(duì)其的評(píng)估;另一方面也說明T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型存在較為嚴(yán)重的同質(zhì)化問題。探索新的、個(gè)性化預(yù)測(cè)因子可能有助于突破現(xiàn)有發(fā)展“瓶頸”,提升模型的預(yù)測(cè)性能,提高個(gè)體化治療水平[40-42]。流行病學(xué)研究結(jié)果表明,心理因素、飲食習(xí)慣、貧困、受教育程度、職業(yè)壓力水平、睡眠障礙與T2DM發(fā)病高風(fēng)險(xiǎn)相關(guān)[43-44]。但由于上述部分指標(biāo)缺乏統(tǒng)一的評(píng)估標(biāo)準(zhǔn)且主觀性較強(qiáng),少有研究者將其列為候選預(yù)測(cè)因子或?qū)⑵浼{入預(yù)測(cè)模型。下一步,可探究上述因子對(duì)模型預(yù)測(cè)性能提升的影響。同時(shí)考慮到T2DM發(fā)病率具有性別與年齡差異[45-46],故也可深入開發(fā)基于性別、年齡的T2DM發(fā)病風(fēng)險(xiǎn)差異化預(yù)測(cè)模型。
3.3 亞洲T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型存在高偏倚風(fēng)險(xiǎn)PROBAST是由Cochrane協(xié)助組推薦的預(yù)測(cè)模型研究偏倚風(fēng)險(xiǎn)評(píng)估工具。研究均于該工具發(fā)布前實(shí)施、模型開發(fā)過程中應(yīng)注意的細(xì)節(jié)問題較多可能是導(dǎo)致偏倚風(fēng)險(xiǎn)較高的原因之一。未來,研究者可按照PROBAST開展T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型的開發(fā)與驗(yàn)證工作,并嚴(yán)格遵循多變量預(yù)測(cè)模型報(bào)告規(guī)范,進(jìn)而盡可能地減少研究中存在的偏倚。
3.3.1 連續(xù)變量與缺失數(shù)據(jù)處理 本研究中,83.9%(26/31)的研究對(duì)連續(xù)變量進(jìn)行了分類處理,但此方法可能導(dǎo)致重要信息丟失、變量間的關(guān)系被破壞及模型預(yù)測(cè)能力的下降[47]。有研究者認(rèn)為,對(duì)于連續(xù)變量,宜保持其連續(xù)性,若連續(xù)變量間存在非線性關(guān)系,可運(yùn)用分段多項(xiàng)式函數(shù)(如樣條函數(shù))處理數(shù)據(jù)[48]。除了未報(bào)告缺失數(shù)據(jù)處理方法的研究外,91.7%(22/24)的研究采用完整個(gè)案分析法處理缺失數(shù)據(jù),該方法雖簡(jiǎn)單易用,但可能會(huì)消減數(shù)據(jù)特征、降低數(shù)據(jù)和研究的效力[49]。多重插補(bǔ)、單一插補(bǔ)法的運(yùn)用能有效降低數(shù)據(jù)缺失對(duì)統(tǒng)計(jì)分析、模型穩(wěn)定性造成的不利影響,提高研究精度和結(jié)果可靠性,是合適的數(shù)據(jù)缺失處理方法[50]。
3.3.2 模型的過度擬合和存在的樂觀偏差 模型的不確定性和參數(shù)的不確定性可導(dǎo)致模型的過度擬合,連續(xù)變量的離散化處理、基于單因素分析的變量篩選方法等可使模型出現(xiàn)樂觀偏差的可能性增高,而兩者(模型的過度擬合、模型出現(xiàn)樂觀偏差)均可致使預(yù)測(cè)模型的泛化能力下降[51]。本文納入的研究中,48.4%(15/31)的研究考慮了模型的過度擬合問題,這也提示研究人員對(duì)模型過度擬合問題及其存在的樂觀偏差重視程度不夠。隨機(jī)將數(shù)據(jù)集拆分為兩個(gè)子集并將其中一個(gè)子集用于內(nèi)部驗(yàn)證,已經(jīng)被證實(shí)為一個(gè)不太恰當(dāng)?shù)臏y(cè)量樂觀偏差的方法[52-53]。今后,在開發(fā)T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型時(shí),可使用自舉法、交叉驗(yàn)證法等對(duì)模型擬合進(jìn)行校驗(yàn),校驗(yàn)時(shí)須重復(fù)整套建模流程,包括變量轉(zhuǎn)換、缺失值處理、變量篩選和模型擬合,否則可能無法衡量模型存在的實(shí)際樂觀偏差水平[54]。此外,開發(fā)動(dòng)態(tài)預(yù)測(cè)模型也可能是解決模型過度擬合的有效方法,如ASGARI等[37]通過使用縱向數(shù)據(jù)(即重復(fù)測(cè)量數(shù)據(jù),如FBG)和事件發(fā)生時(shí)間數(shù)據(jù)進(jìn)行聯(lián)合建模,使開發(fā)的T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型具備了動(dòng)態(tài)性。聯(lián)合模型的原則是先定義兩個(gè)子模型,即混合效應(yīng)模型和Cox模型,然后使用其共同的潛在結(jié)構(gòu)將其鏈接起來。下一步,研究者可深入開發(fā)基于混合效應(yīng)模型和Cox模型的縱向和生存數(shù)據(jù)聯(lián)合模型,盡量做到將縱向數(shù)據(jù)與事件發(fā)生時(shí)間數(shù)據(jù)聯(lián)合起來進(jìn)行分析,進(jìn)而使參數(shù)估計(jì)的偏差進(jìn)一步減小,提高統(tǒng)計(jì)推斷的效率。
3.3.3 模型驗(yàn)證與應(yīng)用 本研究發(fā)現(xiàn),29.0%(9/31)的研究對(duì)模型進(jìn)行了外部驗(yàn)證(其中4項(xiàng)研究采用內(nèi)部驗(yàn)證與外部驗(yàn)證相結(jié)合的方法對(duì)模型進(jìn)行了驗(yàn)證),大部分模型仍處于內(nèi)部驗(yàn)證階段,這使得現(xiàn)有模型的轉(zhuǎn)化率較低且偏倚風(fēng)險(xiǎn)較高。外部驗(yàn)證和重新校準(zhǔn)有助于增強(qiáng)模型的泛化能力,與開發(fā)新模型相比,具有更高的成本效益。醫(yī)務(wù)工作者可基于本研究結(jié)果選取高質(zhì)量的T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型并對(duì)其進(jìn)行外部驗(yàn)證(大樣本、多中心數(shù)據(jù))后,將其應(yīng)用于臨床;或通過開展多中心、跨國(guó)預(yù)測(cè)模型構(gòu)建研究,提高T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)模型的臨床應(yīng)用率、轉(zhuǎn)化率。也可基于電子病歷系統(tǒng)構(gòu)建自動(dòng)化的T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)工具;或?qū)鹘y(tǒng)預(yù)測(cè)工具與計(jì)算機(jī)技術(shù)相結(jié)合,如基于網(wǎng)絡(luò)的交互式列線圖,使模型可以與電子病歷系統(tǒng)相結(jié)合的同時(shí),也可借由網(wǎng)頁(yè)在移動(dòng)設(shè)備、個(gè)人計(jì)算機(jī)上呈現(xiàn),進(jìn)而:(1)同時(shí)滿足醫(yī)務(wù)人員和社區(qū)糖尿病患者對(duì)T2DM發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)工具的使用需求;(2)使模型在得到復(fù)雜算法支撐的同時(shí),減少人工計(jì)算的工作量;(3)使模型更易于理解,用戶使用模型的積極性得以提高。
本文存在一定的局限性。首先,受限于文獻(xiàn)納入與排除標(biāo)準(zhǔn),本研究納入的文獻(xiàn)可能不夠全面,存在一定的選擇偏倚;其次,由于納入文獻(xiàn)在研究對(duì)象及方法上存在明顯的異質(zhì)性,本研究未對(duì)納入研究進(jìn)行定量分析。
作者貢獻(xiàn):賀婷負(fù)責(zé)文章的構(gòu)思、設(shè)計(jì)與撰寫,并對(duì)文章整體負(fù)責(zé),監(jiān)督管理;賀婷、葉子溦、李饒負(fù)責(zé)文獻(xiàn)、資料的收集與整理;賀婷、袁麗,楊小玲負(fù)責(zé)文獻(xiàn)偏倚風(fēng)險(xiǎn)和適用性評(píng)估、論文的修訂;賀婷、古艷負(fù)責(zé)文章的質(zhì)量控制及審校。
本文無利益沖突。