任媛淵, 丁 福, 徐志會, 付榮娟
(重慶醫(yī)科大學(xué)附屬第一醫(yī)院, 1. 全科醫(yī)學(xué)科, 2. 護(hù)理部, 重慶, 400016;3. 重慶市合川區(qū)人民醫(yī)院 護(hù)理部, 重慶, 401533; 4. 重慶市墊江縣人民醫(yī)院 護(hù)理部, 重慶, 408300)
跌倒是全世界范圍內(nèi)的主要公共衛(wèi)生問題之一,也是全球意外傷害死亡的第2大原因,更是住院患者最常見的安全事件之一[1], 不僅延長患者住院時間,加重個人、家庭和社會的經(jīng)濟(jì)負(fù)擔(dān)[2-3], 而且可導(dǎo)致殘疾和功能損害[4-5], 甚至死亡[6-8]。防范跌倒是評價醫(yī)院護(hù)理質(zhì)量的重要指標(biāo)[9], 也是全球范圍內(nèi)患者安全領(lǐng)域被持續(xù)關(guān)注的目標(biāo)之一[10], 盡早識別跌倒風(fēng)險并給予護(hù)理干預(yù),能將院內(nèi)跌倒發(fā)生率降低20%~30%[11]。跌倒風(fēng)險預(yù)測模型作為重要的預(yù)測工具,對早期預(yù)測跌倒風(fēng)險并實施預(yù)見性護(hù)理,進(jìn)而降低跌倒發(fā)生率具有重要意義。本文對國內(nèi)外住院患者跌倒風(fēng)險預(yù)測模型的研究現(xiàn)狀進(jìn)行綜述,以期為臨床選用及構(gòu)建跌倒風(fēng)險預(yù)測工具提供參考依據(jù)。
基于Pubmed數(shù)據(jù)庫,以“inpatients/patients in hospital/hospitalized patients”“fall/fall down/tumble/slip/stumble”“risk prediction model/prediction model”為主題詞精確搜索2017年12月—2022年12月文獻(xiàn),共獲得住院患者跌倒風(fēng)險預(yù)測模型構(gòu)建相關(guān)文獻(xiàn)45篇,其中通過傳統(tǒng)方法建模的文獻(xiàn)17篇,通過機(jī)器學(xué)習(xí)方法建模的文獻(xiàn)28篇。文獻(xiàn)分析結(jié)果顯示,國外住院患者跌倒風(fēng)險預(yù)測模型的構(gòu)建具有以下特點。
美國學(xué)者HARRINGTON P[12]認(rèn)為,機(jī)器學(xué)習(xí)是將無序的數(shù)據(jù)轉(zhuǎn)換成有用的信息。英國學(xué)者FLACH P[13]則將機(jī)器學(xué)習(xí)概括為“使用正確的特征構(gòu)建正確的模型,以完成既定的任務(wù)”。雖然機(jī)器學(xué)習(xí)的定義并不統(tǒng)一,但學(xué)習(xí)的關(guān)鍵在于利用計算機(jī)的運算能力從大量數(shù)據(jù)中發(fā)現(xiàn)“函數(shù)”或“模型”,并通過其來模擬現(xiàn)實世界事物間的關(guān)系,從而實現(xiàn)預(yù)測或判斷的功能[14]。機(jī)器學(xué)習(xí)的核心要素為數(shù)據(jù)、算法和模型[15], 具有從經(jīng)驗中學(xué)習(xí),利用系統(tǒng)進(jìn)行自我改進(jìn),并隨著學(xué)習(xí)提高性能的特點[16-17], 主要分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)3大類[18]?,F(xiàn)有文獻(xiàn)顯示,國外基于機(jī)器學(xué)習(xí)構(gòu)建住院患者跌倒風(fēng)險預(yù)測模型多采用監(jiān)督學(xué)習(xí)方法。荷蘭學(xué)者DORMOSH N等[19]借助Bolasso回歸分析開發(fā)涵蓋跌倒史、記憶或注意力問題、骨關(guān)節(jié)炎等10個危險因素的跌倒風(fēng)險預(yù)測模型; 韓國CHO I等[20]基于貝葉斯網(wǎng)絡(luò)構(gòu)建的模型包括人口學(xué)特征、認(rèn)知因素、行為因素等6大類預(yù)測因子; 日本NAKANISHI T等[21]基于決策樹構(gòu)建的模型由9個分支構(gòu)成,第1分支是譫妄,第2分支為跌倒史,其余為使用助行器、步態(tài)不穩(wěn)、攜帶輸液管道等。美國OSHIRO C E S等[22]基于Lasso回歸分析構(gòu)建模型,共納入年齡、行走問題、多重用藥等13個關(guān)鍵預(yù)測因子; YE C Y等[23]和LINDBERG D S等[24]分別采用隨機(jī)森林、極限梯度提升、支持向量機(jī)、k-近鄰法、分類樹、Bagging、自適應(yīng)提升等集成學(xué)習(xí)算法構(gòu)建跌倒風(fēng)險預(yù)測模型,納入一般信息、入院信息、臨床數(shù)據(jù)等預(yù)測因子。
雖然應(yīng)用機(jī)器學(xué)習(xí)建模已成為研究熱點,但機(jī)器學(xué)習(xí)方法是否在任何條件下均優(yōu)于傳統(tǒng)方法尚無定論。VOLOVICI V等[25]認(rèn)為,現(xiàn)有研究存在濫用和誤用機(jī)器學(xué)習(xí)現(xiàn)象。濫用機(jī)器學(xué)習(xí)建模將增大臨床對模型的解釋難度,誤用機(jī)器學(xué)習(xí)可能導(dǎo)致機(jī)器學(xué)習(xí)“黑匣子”原理支撐的臨床決策與臨床實踐相悖[25]。為了比較機(jī)器學(xué)習(xí)與傳統(tǒng)方法的建模效果,韓國JUNG H等[26]比較Logistic回歸、Cox比例風(fēng)險回歸和決策樹3種方法的效果,發(fā)現(xiàn)基于Logistic回歸分析構(gòu)建的模型性能最佳。因此,在機(jī)器學(xué)習(xí)成為構(gòu)建住院患者跌倒風(fēng)險預(yù)測模型主要方法的大趨勢下,研究者更應(yīng)審慎考慮機(jī)器學(xué)習(xí)的必要性和適當(dāng)性,以實際臨床問題和需求為導(dǎo)向,充分考慮數(shù)據(jù)集的類型、規(guī)模和維度,選用恰當(dāng)?shù)慕7椒?并以統(tǒng)計指標(biāo)為依據(jù)、以臨床實際為基礎(chǔ)從多角度合理解讀所得的模型。
國外研究者無論采用傳統(tǒng)方法還是機(jī)器學(xué)習(xí)方法建模,大多數(shù)據(jù)都來源于某一家醫(yī)院的電子病歷,從Pubmed數(shù)據(jù)庫檢索到的45篇構(gòu)建住院患者跌倒風(fēng)險預(yù)測模型的相關(guān)文獻(xiàn)中,僅CHOI Y等[27]和WANG Y等[28]基于多中心數(shù)據(jù)建模,其余均為單中心數(shù)據(jù)。單中心數(shù)據(jù)可在一定程度上降低數(shù)據(jù)采集難度,但數(shù)據(jù)可能缺乏代表性,數(shù)據(jù)偏頗還會影響模型的預(yù)測性能及臨床適用性。此外,即使是采用傳統(tǒng)方法建模,數(shù)據(jù)也主要來自電子病歷系統(tǒng)。美國學(xué)者LOHSE K R等[29]和韓國學(xué)者JUNG H等[26]均基于電子病歷數(shù)據(jù)建模,總體數(shù)據(jù)量為2 007、15 480人,跌倒數(shù)據(jù)量為131、310人,采集數(shù)據(jù)的時間線為1.5、3.0年。另有多項研究[19-24,27-28]采用機(jī)器學(xué)習(xí)方法建模,數(shù)據(jù)同樣來源于電子病歷,數(shù)據(jù)量為814~176 816人,跌倒數(shù)據(jù)量為238~4 778人,數(shù)據(jù)采集周期長短不一,為1~10年。隨著醫(yī)療信息化技術(shù)和電子病歷系統(tǒng)的不斷發(fā)展與完善,雖然電子病歷數(shù)據(jù)已成為臨床大數(shù)據(jù)的主要來源,但國外研究者在應(yīng)用電子病歷數(shù)據(jù)建模的過程中,總體樣本量和跌倒數(shù)據(jù)量差距較大,數(shù)據(jù)類別不平衡問題突出,基于這類偏數(shù)據(jù)構(gòu)建的跌倒風(fēng)險預(yù)測模型可能無法完整描述臨床跌倒問題,甚至?xí)糯笮詣e歧視、種族歧視等問題[25]。
對于構(gòu)建的模型,研究者可采用不同方法在不同測試人群中進(jìn)行驗證。一方面,國外研究者驗證模型的方法呈現(xiàn)多樣化特點,韓國JUNG H等[26]、美國LOHSE K R等[29]和LINDBERG D S等[24]分別采用5倍交叉驗證和10倍交叉驗證對模型進(jìn)行驗證,荷蘭DORMOSH N等[19]和韓國CHO I等[20]分別將10倍交叉驗證和Bootstrap、跨時間站點相結(jié)合進(jìn)行模型驗證,日本NAKANISHI T等[21]基于留出法驗證模型,美國學(xué)者YE C Y等[23]采用保序回歸方法進(jìn)行模型驗證。雖然各國學(xué)者采用的驗證方法有所不同,但這些方法均是機(jī)器學(xué)習(xí)的經(jīng)典方法,具有較強(qiáng)的科學(xué)性。研究者應(yīng)根據(jù)臨床數(shù)據(jù)的性質(zhì)選用不同的驗證方法: 如果研究數(shù)據(jù)量非常大,可以選用留出法; 如果研究數(shù)據(jù)量較大,可以選用交叉驗證法; 如果研究數(shù)據(jù)無序性較強(qiáng),則可以選擇保序回歸法。另一方面,模型驗證可分為內(nèi)部驗證和外部驗證,測試人群相同或相似為內(nèi)部驗證,測試人群不同則為外部驗證[30]。對檢索到的文獻(xiàn)進(jìn)行分析,僅法國學(xué)者BEAUCHET O等[31]對模型進(jìn)行外部驗證,其余研究[19-21, 27-28]均采用內(nèi)部驗證評價模型,提示各研究所得模型并未落實于臨床實踐,且尚未在臨床應(yīng)用及推廣。
基于CNKI數(shù)據(jù)庫,以“住院患者/住院病人”“跌倒”“風(fēng)險/預(yù)測/風(fēng)險預(yù)測/預(yù)測模型/模型”為主題詞精確檢索2017年12月—2022年12月文獻(xiàn),共獲取住院患者跌倒風(fēng)險預(yù)測模型構(gòu)建相關(guān)文獻(xiàn)6篇(均采用傳統(tǒng)方法建模); 基于Pubmed數(shù)據(jù)庫,以“inpatients/patients in hospital/hospitalized patients”“fall/fall down/tumble/slip/stumble”“risk prediction model/prediction model”為主題詞精確搜索2017年12月—2022年12月中國研究者發(fā)表的文獻(xiàn),獲得相關(guān)文獻(xiàn)4篇(均采用機(jī)器學(xué)習(xí)方法建模)。文獻(xiàn)分析結(jié)果顯示,中國住院患者跌倒風(fēng)險預(yù)測模型的構(gòu)建具有以下特點。
中國大陸地區(qū)研究者主要采用傳統(tǒng)統(tǒng)計學(xué)方法構(gòu)建住院患者跌倒風(fēng)險預(yù)測模型。林麗娜等[32]、程正楠等[33]均采用單因素分析和Logistic回歸分析建模,分別納入活動受限、跌倒史、用藥等7個危險因素和性別、抑郁、疲乏等6個風(fēng)險因素; 陳森蕓等[34]采用多因素Logistic回歸分析和列線圖構(gòu)建的模型包含Morse跌倒風(fēng)險評分、血鉀濃度、夜尿/排便增多、跌倒風(fēng)險認(rèn)知4個預(yù)測因子。近年來,中國香港和中國臺灣地區(qū)學(xué)者更傾向于采用機(jī)器學(xué)習(xí)方法建模。WANG H L等[35]基于張量分解算法探索患者、跌倒時間、地點和科室之間的內(nèi)在關(guān)系,從而預(yù)測住院患者不同科室和地點的跌倒事件。HSU Y C等[36]基于極限梯度提升方法構(gòu)建包括教育水平、體溫、脈率等高危因素的跌倒風(fēng)險預(yù)測模型; LIU C H等[37]采用決策樹、貝葉斯網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林、Bagging及自適應(yīng)提升4種監(jiān)督學(xué)習(xí)和2種集成學(xué)習(xí)方法建模,得出Bagging和隨機(jī)森林相結(jié)合的集成學(xué)習(xí)方法構(gòu)建的模型預(yù)測性能最佳,該模型共納入入院診斷、手術(shù)記錄、用藥記錄等54個危險因子。分析中國學(xué)者的相關(guān)文獻(xiàn)可發(fā)現(xiàn),臺灣、香港地區(qū)學(xué)者[35-38]已采用機(jī)器學(xué)習(xí)方法建模,大陸地區(qū)學(xué)者[32-34]仍主要采用傳統(tǒng)的Logistic回歸分析方法建模。Logistic回歸分析實現(xiàn)簡單、計算量小,常用于危險因素分析、疾病風(fēng)險預(yù)測及疾病診斷,但其不能解決非線性問題,難以處理不平衡數(shù)據(jù),且準(zhǔn)確度不高[39]。構(gòu)建方法的選擇是開發(fā)預(yù)測模型的關(guān)鍵,相較于國外,中國目前的建模方式(以傳統(tǒng)方法為主)一定程度上限制了跌倒風(fēng)險預(yù)測模型的整體性能和臨床適用性。
中國的研究者通過不同數(shù)據(jù)源構(gòu)建住院患者跌倒風(fēng)險預(yù)測模型,例如現(xiàn)場詢問、電話調(diào)查[32]、半結(jié)構(gòu)式訪談或問卷調(diào)查[33]等方法采集的原始資料。近年來,中國港臺地區(qū)學(xué)者開始嘗試應(yīng)用電子病歷[36]、電子健康記錄[38]、跌倒安全報告系統(tǒng)[35-36]等電子信息系統(tǒng)數(shù)據(jù)構(gòu)建模型。雖然建模的數(shù)據(jù)源存在差異,但無論是基于傳統(tǒng)方法還是機(jī)器學(xué)習(xí)方法建模,數(shù)據(jù)均為單中心數(shù)據(jù),且總體樣本量和跌倒樣本量均偏小。采用傳統(tǒng)方法建模的研究中,總體樣本量最小僅226人[34], 最大950人[33]; 跌倒樣本量最小僅93人[33], 最大113人[34]; 數(shù)據(jù)收集周期最短僅4個月[33],最長3.5年[34]。采用機(jī)器學(xué)習(xí)方法建模的研究中,雖然總體樣本量最大可達(dá)108 940人[37], 但跌倒樣本量仍偏小,為256~349人[35-38], 采集數(shù)據(jù)的時間段為9個月~4.5年[35-38]。相較于國外,中國該領(lǐng)域的數(shù)據(jù)類別不平衡問題更加突出,偏數(shù)據(jù)建模將直接影響模型的預(yù)測性能。此外,雖然HSU Y C等[36]和CHU W M等[38]采用機(jī)器學(xué)習(xí)方法建模,但其樣本量僅639人和1 101人,既不符合臨床大數(shù)據(jù)的建模條件,也不適用于機(jī)器學(xué)習(xí)這種以大數(shù)據(jù)為基礎(chǔ)的建模方法。
在驗證方法方面,中國絕大多數(shù)研究者仍習(xí)慣對模型進(jìn)行傳統(tǒng)統(tǒng)計學(xué)驗證[32-33, 36-37], 而忽視對機(jī)器學(xué)習(xí)驗證方法的探索,僅CHU W M等[38]和陳森蕓等[34]對交叉驗證和Bootstrap進(jìn)行了嘗試,整體而言模型驗證方法較單一。在驗證過程方面,中國學(xué)者大多僅對模型進(jìn)行內(nèi)部驗證[32-38], 缺乏將模型應(yīng)用于不同測試人群的外部驗證,且未對模型進(jìn)行重新校準(zhǔn)和動態(tài)更新,故構(gòu)建的風(fēng)險預(yù)測模型并未真正發(fā)揮作用。在驗證結(jié)果方面,中國研究者構(gòu)建的模型,受試者工作特征曲線的曲線下面積為0.57~0.90[32-38], 區(qū)分度顯著低于國外研究[19-24, 26-29, 31]的0.70~0.99; 無論采用傳統(tǒng)方法還是機(jī)器學(xué)習(xí)方法建模,中國學(xué)者構(gòu)建的跌倒風(fēng)險預(yù)測模型的靈敏度和特異度均低于國外研究[26, 32-33, 38]。
良好的風(fēng)險預(yù)測模型是早期識別住院患者跌倒風(fēng)險的重要保障[40-44], 從電子病歷系統(tǒng)直接采集數(shù)據(jù),并以機(jī)器學(xué)習(xí)為主要方法建模,正成為這一領(lǐng)域的研究熱點[45-47]。但現(xiàn)有研究顯示,住院患者跌倒風(fēng)險預(yù)測模型的構(gòu)建尚存在數(shù)據(jù)規(guī)模與方法不匹配,數(shù)據(jù)普適性、平衡性較差,經(jīng)外部驗證的模型較少,臨床適用性不強(qiáng)等問題。未來,護(hù)理研究者應(yīng)特別注意算法與大數(shù)據(jù)“4V”特性[48]的匹配性,根據(jù)數(shù)據(jù)特征,科學(xué)選擇機(jī)器學(xué)習(xí)方法,同時加強(qiáng)醫(yī)療機(jī)構(gòu)信息互通與合作,收集實時、多中心、大樣本數(shù)據(jù),以推動跌倒風(fēng)險預(yù)測模型的真實世界研究,并立足臨床,以研究結(jié)果反哺臨床問題的解決,提升住院患者跌倒風(fēng)險預(yù)測模型的科學(xué)性和臨床適用性。