楊金盤 馬秋平 張佳琳 劉裕君 楊春曉
廣西中醫(yī)藥大學(xué),南寧市 530200
缺血性腦卒中(ischemic stroke,IS)是我國成年人殘疾、死亡的主要病因,我國IS患者腦卒中后抑郁(post-stroke depression,PSD)的發(fā)病率為20%~40%[1]。PSD可繼發(fā)于發(fā)病后的任何階段,常伴有興趣缺失、睡眠紊亂、自責(zé)自罪和易疲勞等癥狀[2]。PSD可影響患者功能康復(fù),延長住院時(shí)長,增加治療成本,甚至增加死亡風(fēng)險(xiǎn)[3-4]。加拿大《最佳實(shí)踐建議:卒中后抑郁、認(rèn)知、疲勞》指出,醫(yī)務(wù)人員應(yīng)重視PSD的早期識(shí)別,但目前仍缺乏PSD的特異性評(píng)估工具[5]。PSD風(fēng)險(xiǎn)預(yù)測(cè)模型是以PSD的多病因?yàn)榛A(chǔ)構(gòu)建的數(shù)理統(tǒng)計(jì)模型,可量化IS患者發(fā)生PSD的概率[6],為醫(yī)務(wù)人員早期識(shí)別PSD高?;颊咛峁┯行У脑u(píng)估工具。目前,已有學(xué)者開發(fā)了IS患者PSD風(fēng)險(xiǎn)預(yù)測(cè)模型,但文獻(xiàn)質(zhì)量和結(jié)果不一,模型的預(yù)測(cè)效能和適用性有待評(píng)價(jià)。本研究對(duì)IS患者PSD風(fēng)險(xiǎn)預(yù)測(cè)模型進(jìn)行系統(tǒng)性評(píng)價(jià),以期為醫(yī)務(wù)人員選擇合適的PSD高?;颊咦R(shí)別模型提供參考。
本研究已在PROSPERO平臺(tái)注冊(cè),注冊(cè)號(hào)為CRD42022360733。
1.1 文獻(xiàn)納入與排除標(biāo)準(zhǔn)
1.1.1 納入標(biāo)準(zhǔn) (1)研究對(duì)象為IS患者,且年齡≥18周歲;(2)研究內(nèi)容為IS患者PSD風(fēng)險(xiǎn)預(yù)測(cè)模型,描述了模型構(gòu)建、驗(yàn)證和評(píng)價(jià)全過程;(3)研究類型為橫斷面研究、病例對(duì)照研究和隊(duì)列研究。
1.1.2 排除標(biāo)準(zhǔn) (1)使用虛擬數(shù)據(jù)、未標(biāo)明數(shù)據(jù)來源或數(shù)據(jù)不完整,不能獲取原文;(2)綜述、述評(píng)、動(dòng)物或細(xì)胞分子水平研究;(3)學(xué)術(shù)會(huì)議摘要、灰色文獻(xiàn)等非正式發(fā)表的文獻(xiàn);(4)重復(fù)發(fā)表的文獻(xiàn);(5)非中英文文獻(xiàn)。
1.2 文獻(xiàn)檢索策略 采用主題詞和自由詞相結(jié)合的方式,檢索CINAHL、Embase、Medline、The Cochrane Library、Web of Science、PubMed、中國知網(wǎng)、維普、中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(Chinese Biomedical Literature Database,CBM)和萬方數(shù)據(jù)庫中有關(guān)IS患者PSD風(fēng)險(xiǎn)預(yù)測(cè)模型的文獻(xiàn),檢索時(shí)限為自建庫至2022年7月13日。中文檢索詞:“卒中/中風(fēng)/腦血管意外/腦血管障礙/腦梗死”“抑郁/卒中后抑郁”“預(yù)測(cè)模型/預(yù)測(cè)因素/風(fēng)險(xiǎn)預(yù)測(cè)/早期預(yù)警/風(fēng)險(xiǎn)因素”;英文檢索詞:“Stroke/Cerebrovascular Accident/Cerebrovascular Apoplexy/Brain Vascular Accident/Acute Cerebrovascular Accident/Cerebrovascular Stroke/Cerebral Infarction” “Depression/Post-stroke Depression/Post Stroke Depression/Poststroke Depression/Depression after Stroke/Depressive Symptoms/Depressive Symptom/Symptom, Depressive/Symptoms,Depressive/Emotional Depression/Depression, Emotional”“Prediction Model/Prognostic Model/Predictive Factors/Risk Prediction/Early-warning/Risk Stratification Model”。
1.3 文獻(xiàn)篩選和數(shù)據(jù)提取 采用EndNote X9軟件剔除重復(fù)文獻(xiàn)。由2名研究者通過閱讀文獻(xiàn)標(biāo)題、摘要、全文,按照納入和排除標(biāo)準(zhǔn)獨(dú)立篩選文獻(xiàn),意見不一致時(shí),與第3名研究者協(xié)商裁決。2名研究者使用預(yù)測(cè)模型研究系統(tǒng)評(píng)價(jià)的關(guān)鍵評(píng)估和數(shù)據(jù)提取(Critical Appraisal and Data Extraction for Systematic Reviews of Prediction Modelling Studies,CHARMS)清單[7]獨(dú)立提取數(shù)據(jù)并交叉核對(duì)。提取數(shù)據(jù)包括第一作者、發(fā)表年份、國家、研究對(duì)象、研究類型、研究設(shè)計(jì)、隨訪時(shí)間、預(yù)測(cè)結(jié)局、樣本量、缺失數(shù)據(jù)、預(yù)測(cè)因子、模型呈現(xiàn)形式、驗(yàn)證方法、建模方法和模型性能等。
1.4 納入文獻(xiàn)的偏倚風(fēng)險(xiǎn)和適用性評(píng)價(jià) 由2名研究者獨(dú)立使用預(yù)測(cè)模型偏倚風(fēng)險(xiǎn)評(píng)估工具(Prediction Model Risk of Bias Assessment Tool,PROBAST)[8-9]評(píng)價(jià)納入文獻(xiàn)的偏倚風(fēng)險(xiǎn)和適用性,并交叉核對(duì)結(jié)果,意見不一致時(shí),與第3名研究者協(xié)商裁決。
1.5 統(tǒng)計(jì)學(xué)處理 對(duì)CHARMS和PROBAST語句中的域和納入文獻(xiàn)結(jié)果進(jìn)行系統(tǒng)評(píng)價(jià)。
2.1 文獻(xiàn)篩選流程與結(jié)果 初檢共獲得相關(guān)文獻(xiàn)1 597篇,通過閱讀文獻(xiàn)標(biāo)題、摘要和全文進(jìn)行初篩和復(fù)篩后,最終納入文獻(xiàn)9篇[10-18],其中中文文獻(xiàn)[10,12-15,17]6篇,英文文獻(xiàn)[11,16,18]3篇。文獻(xiàn)篩選流程與結(jié)果見圖1。
圖1 文獻(xiàn)篩選流程與結(jié)果
2.2 納入文獻(xiàn)的基本特征與預(yù)測(cè)結(jié)果 共納入橫斷面研究1個(gè),回顧性研究4個(gè),前瞻性研究4個(gè);文獻(xiàn)發(fā)表年份為2020年至2022年;納入文獻(xiàn)的結(jié)果事件數(shù)與協(xié)變量個(gè)數(shù)比(events per independent variable,EPV)均小于10。9篇文獻(xiàn)中,6篇[10-12,14-15,17]未報(bào)告缺失數(shù)據(jù),2篇[16,18]報(bào)告了缺失數(shù)據(jù)并采取多重插補(bǔ)法進(jìn)行處理,1篇[13]報(bào)告研究過程無數(shù)據(jù)缺失。納入文獻(xiàn)的基本特征與預(yù)測(cè)結(jié)果見表1。
表1 納入研究的基本特征與預(yù)測(cè)結(jié)果
2.3 模型構(gòu)建情況 納入文獻(xiàn)中,8篇[10,12-18]采用logistic回歸,1篇[11]采用了LASSO回歸;3篇[10,15,18]未報(bào)告校準(zhǔn)度,8篇[10-14,16-18]使用受試者工作特征曲線的曲線下面積(Area Under the Curve,AUC)評(píng)價(jià)模型區(qū)分度,AUC均大于0.7,表示預(yù)測(cè)模型的區(qū)分度良好。3項(xiàng)研究[11-12,17]進(jìn)行了外部驗(yàn)證并表現(xiàn)出較好的區(qū)分度(AUC 0.793~0.885),僅1項(xiàng)研究[13]進(jìn)行隨機(jī)拆分驗(yàn)證。納入文獻(xiàn)的模型包含3~7個(gè)預(yù)測(cè)因子,其中次數(shù)出現(xiàn)最多的是美國國立衛(wèi)生研究院卒中量表(National Institutes of Health Stroke Scale,NIHSS)評(píng)分、Barthel指數(shù)(Barthel index,BI)、年齡、高血壓,均為各級(jí)醫(yī)療機(jī)構(gòu)易獲取、可測(cè)量的指標(biāo)。3篇[13-15]以公式、6篇[10-13,16-17]以列線圖作為呈現(xiàn)模型,僅1篇[18]進(jìn)一步將模型轉(zhuǎn)化為量表。納入文獻(xiàn)均對(duì)模型的應(yīng)用進(jìn)行了評(píng)價(jià)、討論。以上內(nèi)容見表2。
表2 模型構(gòu)建情況
2.4 納入文獻(xiàn)的偏倚風(fēng)險(xiǎn)評(píng)價(jià)
2.4.1 與研究對(duì)象有關(guān)的偏倚 在研究對(duì)象領(lǐng)域,納入的9項(xiàng)研究偏倚風(fēng)險(xiǎn)均低,見表3。
表3 納入研究的研究對(duì)象、預(yù)測(cè)因子、結(jié)果和分析領(lǐng)域評(píng)價(jià)
2.4.2 與預(yù)測(cè)因子有關(guān)的偏倚 在預(yù)測(cè)因子領(lǐng)域,4項(xiàng)研究[13,15-16,18]偏倚風(fēng)險(xiǎn)低,5項(xiàng)研究[10-12,14,17]的偏倚風(fēng)險(xiǎn)不清楚。對(duì)預(yù)測(cè)因子評(píng)估者的施盲情況和與預(yù)測(cè)因子有關(guān)的偏倚風(fēng)險(xiǎn)的高低相關(guān)[8],對(duì)評(píng)估者施盲的研究的偏倚風(fēng)險(xiǎn)較低[9]。由因及果的前瞻性隊(duì)列研究[13,15-16,18]默認(rèn)對(duì)預(yù)測(cè)因子的評(píng)估者施盲,而橫斷面研究[10]和回顧性隊(duì)列研究[11-12,14,17]對(duì)預(yù)測(cè)因子評(píng)估者的施盲情況不得而知,故偏倚風(fēng)險(xiǎn)不清楚,見表3。
2.4.3 與結(jié)果有關(guān)的偏倚 在結(jié)果領(lǐng)域,納入的9項(xiàng)研究均為低風(fēng)險(xiǎn)偏倚,見表3。
2.4.4 與分析有關(guān)的偏倚 在分析領(lǐng)域,9篇文獻(xiàn)均為高風(fēng)險(xiǎn)偏倚,見表3。在開發(fā)模型時(shí)[19],EPV<10會(huì)造成模型過擬合,EPV>20則可提高統(tǒng)計(jì)效能以減少混雜因素的干擾,而9篇文獻(xiàn)的EPV均<10,說明其有效樣本不足。將連續(xù)型變量轉(zhuǎn)換為分類變量會(huì)丟失部分?jǐn)?shù)據(jù)信息,進(jìn)而影響模型準(zhǔn)確性;3篇文獻(xiàn)[12,15-16]將連續(xù)型變量轉(zhuǎn)化為分類變量,導(dǎo)致其偏倚風(fēng)險(xiǎn)增高。數(shù)據(jù)是否有缺失及其缺失程度直接影響數(shù)據(jù)質(zhì)量的高低[20],從而影響模型預(yù)測(cè)效能。9篇文獻(xiàn)中,6篇[10-12,14-15,17]未報(bào)告相關(guān)信息,1篇[18]采用多重插補(bǔ)法但未報(bào)告缺失數(shù)量,1篇[16]報(bào)告缺失數(shù)據(jù)占比為2.78%并采用多重插補(bǔ)法進(jìn)行填補(bǔ),僅1篇[13]無數(shù)據(jù)缺失。變量篩選需以臨床專業(yè)知識(shí)為最基本的考量,綜合考慮樣本量和自變量大小以確定統(tǒng)計(jì)方法、檢驗(yàn)水準(zhǔn),如脫離臨床則會(huì)出現(xiàn)較大偏差[20]。如變量較少可直接全部納入回歸模型進(jìn)行分析。5項(xiàng)研究[10,12,14-15,17]僅采用單因素分析法篩選變量,未考慮數(shù)據(jù)的復(fù)雜性和臨床特點(diǎn),因此其偏倚風(fēng)險(xiǎn)較高。在性能評(píng)估方面,6項(xiàng)研究[11-14,16-17]同時(shí)報(bào)告了區(qū)分度和校準(zhǔn)度。3項(xiàng)研究[11-12,17]進(jìn)行外部驗(yàn)證,1項(xiàng)研究[15]未進(jìn)行驗(yàn)證,其余均進(jìn)行內(nèi)部驗(yàn)證。納入文獻(xiàn)的偏倚風(fēng)險(xiǎn)見表4。
表4 納入文獻(xiàn)的偏倚風(fēng)險(xiǎn)評(píng)價(jià)
2.5 適用性評(píng)價(jià) 在適用性評(píng)價(jià)方面,9個(gè)模型在研究對(duì)象、結(jié)果領(lǐng)域的適用性均較高,有4個(gè)模型[10,12,14,17]在預(yù)測(cè)因子領(lǐng)域的適用性不清楚;4個(gè)模型[10,12,14,17]的總體適用性不清楚。納入文獻(xiàn)的適用性評(píng)價(jià)結(jié)果見表5。
表5 納入文獻(xiàn)的適用性評(píng)價(jià)
3.1 IS患者PSD風(fēng)險(xiǎn)預(yù)測(cè)模型仍處于發(fā)展階段 本研究最終納入4項(xiàng)模型開發(fā)研究、5項(xiàng)模型開發(fā)及驗(yàn)證研究,共計(jì)9項(xiàng)研究,共包含9個(gè)模型。9個(gè)模型的AUC為0.780~0.928,其中6個(gè)模型的AUC>0.8,預(yù)測(cè)性能較好。但9項(xiàng)研究偏倚風(fēng)險(xiǎn)均高,偏倚風(fēng)險(xiǎn)主要集中在分析領(lǐng)域,其原因大致包括:未報(bào)告盲法、因變量事件數(shù)不足、模型過擬合、未報(bào)告或未處理缺失數(shù)據(jù)和僅依據(jù)單因素分析篩選預(yù)測(cè)因子等。此外,9項(xiàng)研究關(guān)于PSD的定義和診斷標(biāo)準(zhǔn)存在異質(zhì)性,而不同的診斷評(píng)估標(biāo)準(zhǔn)會(huì)影響模型的外部驗(yàn)證、臨床實(shí)踐轉(zhuǎn)化和推廣性。建議研究者未來選用目前廣泛使用且《最佳實(shí)踐建議》[21]推薦的漢密爾頓抑郁評(píng)分量表。
3.2 IS患者PSD預(yù)測(cè)模型的整體偏倚風(fēng)險(xiǎn)較高 本研究納入的9項(xiàng)研究的總體偏倚風(fēng)險(xiǎn)均較高,5項(xiàng)研究[11,13,15-16,18]的總體適用性較高,其余4項(xiàng)研究[10,12,14,17]的總體適用性均不清楚。未來,需開發(fā)偏倚風(fēng)險(xiǎn)低,適用性高的預(yù)測(cè)模型。對(duì)未來護(hù)理實(shí)踐和臨床研究的啟示如下。(1)NIHSS評(píng)分、BI、年齡、高血壓是納入的9個(gè)模型中包含的主要預(yù)測(cè)因子,應(yīng)注意對(duì)上述變量的評(píng)估。(2)優(yōu)化研究設(shè)計(jì):建議在評(píng)估預(yù)測(cè)因子、結(jié)局事件時(shí)對(duì)評(píng)估人員施盲,診斷性的預(yù)測(cè)模型適合采用橫斷面的研究設(shè)計(jì),預(yù)后模型可采用前瞻性隊(duì)列的研究設(shè)計(jì)[20],以減少因研究設(shè)計(jì)而產(chǎn)生的偏倚。未來可參照PROBAST[8]進(jìn)行研究設(shè)計(jì)以減少偏倚。(3)樣本量應(yīng)充足:依據(jù)PROBAST[8],建議模型開發(fā)研究應(yīng)擴(kuò)大樣本量使EPV>20以獲取足夠的統(tǒng)計(jì)學(xué)效能甄別混雜因素對(duì)結(jié)局的影響[20],而模型驗(yàn)證研究則需使結(jié)局事件數(shù)>100以降低偏倚風(fēng)險(xiǎn)[22]。(4)科學(xué)處理缺失數(shù)據(jù):依據(jù)缺失原因和數(shù)據(jù)形式選擇適當(dāng)?shù)奶幚矸椒ā?項(xiàng)研究未報(bào)告缺失數(shù)據(jù)相關(guān)信息[10-12,14-15,17],可看作研究者忽略了缺失數(shù)據(jù)的處理,由此產(chǎn)生較大偏倚。常見的處理方法有刪除法、加權(quán)法、插補(bǔ)法[23]。(5)切忌只依賴單因素分析篩選預(yù)測(cè)因子,預(yù)測(cè)因子的篩選需綜合考慮其臨床重要性、客觀性、適用性、易獲取性和經(jīng)濟(jì)成本[8],而非單純依靠統(tǒng)計(jì)方法。(6)選用更優(yōu)的建模方法。Qiao等[11]采用LASSO回歸建模。LASSO回歸是一種機(jī)器學(xué)習(xí)算法,通過構(gòu)造一個(gè)懲罰函數(shù)得到一個(gè)較為精煉的模型,可以處理復(fù)雜的臨床數(shù)據(jù),有效地解決過擬合和多重共線性問題[24]。從預(yù)測(cè)性能來看,Qiao等[11]LASSO回歸模型在外部驗(yàn)證集的AUC為0.885,與其他logistic回歸模型[12,17]相比,其外部驗(yàn)證AUC更高,預(yù)測(cè)性能更優(yōu)。這提示,隨著醫(yī)療數(shù)據(jù)的不斷整合與結(jié)構(gòu)化,以及數(shù)據(jù)挖掘技術(shù)的進(jìn)步,研究者可嘗試使用機(jī)器學(xué)習(xí)算法處理復(fù)雜數(shù)據(jù)并構(gòu)建模型。(7)模型呈現(xiàn)應(yīng)以臨床使用便捷為原則。有2項(xiàng)研究[14-15]僅以公式作為呈現(xiàn)形式,未來可借助R語言rms包繪制列線圖,或開發(fā)網(wǎng)絡(luò)計(jì)算器[25]、評(píng)分系統(tǒng),以方便臨床使用。此外,未來研究者應(yīng)參照個(gè)體預(yù)后或診斷的多變量預(yù)測(cè)模型透明報(bào)告(Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis,TRIPOD)[26],以規(guī)范其研究報(bào)告。
本研究共納入9項(xiàng)研究,包括9個(gè)IS患者PSD風(fēng)險(xiǎn)預(yù)測(cè)模型,偏倚風(fēng)險(xiǎn)均較高。研究結(jié)果提示,IS患者PSD風(fēng)險(xiǎn)預(yù)測(cè)模型的研究仍處于發(fā)展階段,未來應(yīng)參照PROBAST和TRIPOD優(yōu)化研究設(shè)計(jì)和研究報(bào)告,建議開展多中心、大樣本量研究,結(jié)合機(jī)器學(xué)習(xí)等人工智能算法,開發(fā)準(zhǔn)確性和簡便性兼?zhèn)涞哪P?同時(shí)對(duì)模型進(jìn)行外部驗(yàn)證或?qū)嵶C研究以優(yōu)化模型。