秦 源,呂苗華,郝曉楠,李 昆
吉林大學護理學院,吉林 130021
近年來,老年人口數(shù)量增加、平均壽命延長的同時帶來了新的健康問題,衰弱成為老年學研究的熱點問題,也給社會和公共衛(wèi)生系統(tǒng)帶來沉重負擔。研究顯示,65 歲以上社區(qū)老年人衰弱發(fā)生率為10.7%~19.6%[1-2]。衰弱是一種生理系統(tǒng)累積量減少的非特異性狀態(tài),表現(xiàn)為機體抵抗應激能力減退、易損性增加[3],并伴隨一系列臨床不良結局的發(fā)生,如跌倒、骨折、入院、死亡等[4-7],嚴重影響老年人生存質(zhì)量。衰弱是一個隨年齡增長緩慢進展的動態(tài)過程,并且具有潛在可逆性。因此,對衰弱狀態(tài)早期識別和預警,并進行相應干預對延緩或逆轉衰弱狀態(tài)尤為重要。現(xiàn)對社區(qū)老年衰弱預測模型的發(fā)展和研究現(xiàn)狀進行綜述,促進我國對老年衰弱預測模型的使用,加強對老年衰弱早期關注和預測的重視,為制定個性化干預措施提供科學依據(jù),減緩老年衰弱的發(fā)生、發(fā)展。
風險預測模型通過向多個預測因子分配相應權重,獲取個體特定結果存在(診斷)或未來發(fā)生(預測)的概率或風險[8]。風險預測模型最早在心血管領域用于預測術前危險因素及術后并發(fā)癥[9],目前已廣泛用于其他領域,如慢性病篩查[10]、乳腺癌術后并發(fā)癥風險預測等[11]。
1.1 風險預測模型的驗證 預測模型的驗證主要分為內(nèi)部驗證和外部驗證。內(nèi)部驗證是利用來源于模型構建的相同數(shù)據(jù)集的數(shù)據(jù)進行的驗證,其中隨機拆分法較為常見,即將數(shù)據(jù)集隨機分成兩部分,一部分用于構建模型,另一部分用于驗證模型[12]。除借助數(shù)據(jù)分割外,交叉驗證法和Bootstrap 抽樣法也可驗證模型內(nèi)部有效性。外部驗證則是利用不同于模型構建的數(shù)據(jù)對模型進行評價。根據(jù)數(shù)據(jù)來源可分為3 類:①時間驗證,即利用不同時間段的數(shù)據(jù)對模型進行評估;②空間驗證,即利用其他研究中心的數(shù)據(jù)對模型進行評價;③領域驗證,即利用其他環(huán)境中的樣本數(shù)據(jù)對模型進行評估[13]。
1.2 風險預測模型評價標準 預測模型通過區(qū)分度和校準度進行評估,區(qū)分度是指模型對事件發(fā)生或不發(fā)生的正確預測的能力,通常用受試者工作特征曲線下面積(area under curve,AUC)進行評估[14],AUC 取值范圍為0.5~1.0,取值越趨近于1.0,則代表模型的區(qū)分度越好[15]。校準度則是反映模型正確估計絕對風險的程度[16],Hosmer-Lemeshow 擬合優(yōu)度檢驗(H-L 檢驗)是最常用的評價方法,主要比較事件發(fā)生的預期概率和實際概率之間的差異是否具有統(tǒng)計學意義,P>0.05,則提示模型擬合優(yōu)度效果較好。
2.1 基于回歸分析的衰弱風險預測模型
2.1.1 獨立風險因素預測衰弱發(fā)生風險 識別與衰弱相關的風險因素是預測衰弱發(fā)生風險的前提,是制定預防、干預措施的基礎。目前,有研究針對使用特定獨立風險因素對衰弱發(fā)生風險進行預測,提出相應的干預措施。此類研究主要集中在呼吸功能和運動功能方面。呼吸功能方面:有研究表明,衰弱與肺損傷有關,如呼吸肌力量降低、氣流受限和限制性呼吸模式等。Santos 等[17]驗證了肺功能和社區(qū)老年人衰弱之間的聯(lián)系,并進行了肺功能相關測量值預測衰弱的研究,采用了用力肺活量(FVC)、1 秒用力肺活量(FEV1)評估肺功能。結果顯示,F(xiàn)VC≤2.30 L 和FEV1≤1.86 L為衰弱前期的截斷值;FVC≤2.07 L 和FEV1≤1.76 L為衰弱的截斷值。Vidal 等[18]將最大吸氣和最大呼氣壓力作為呼吸肌力的評估指標,通過Logistic 回歸分析并調(diào)整相關協(xié)變量后確定呼吸肌力對衰弱具有預測作用。結果顯示,最大呼氣壓力<65 cmH2O(1 cmH2O=0.098 kPa)為衰弱前期的截斷值,最大吸氣壓力>-50 cmH2O 和最大呼氣壓力<60 cmH2O 為衰弱的截斷值。Magave 等[19]也驗證了呼吸流量峰值(PEF)是衰弱的獨立預測因子,男性PEF≤350 L/min是衰弱最佳截斷值,女性PEF≤220 L/min 是衰弱最佳截斷值。在運動功能方面,老年人衰弱發(fā)生、發(fā)展與功能衰退有關,運動表現(xiàn)測試可以構成篩查和監(jiān)測老年人衰弱的可行工具。2016 年,Santos 等[20]探討了運動測試在社區(qū)老人中對衰弱的預測價值。運動測試包括“椅子站立”測試和“撿筆”測試。受試者工作特征曲線(ROC)結果顯示,“椅子站立”測試>14 s 為衰弱的最佳截斷值,“撿筆”測試>1 s 為衰弱的最佳截斷值。Jung 等[21]進行了功能年齡對衰弱風險預測的研究,功能年齡的概念是基于簡易體能狀況量表通過線性回歸分析建立,功能年齡方程式為83.61-1.98×平衡分數(shù)-5.21×步行速度(m/s)+0.23×椅子測試時間(s),在驗證隊列中確定了功能年齡對衰弱的預測作用,研究結果顯示,功能年齡≥77.2 歲是衰弱的最佳截斷值,但由于驗證隊列的樣本人群年齡更大,身體功能表現(xiàn)更差會對結果造成偏差。衰弱的發(fā)生、發(fā)展與多方面的風險因素相關。因此,通過單一風險因素對老年人群的衰弱進行預測是否準確,仍需開展更多的多中心研究進行驗證,研究結果也需謹慎推廣。
2.1.2 多個風險因素預測衰弱發(fā)生風險 Rivan 等[22]在馬來西亞一項老齡化縱向研究中,對282 名社區(qū)老年人進行社會人口學資料、營養(yǎng)狀況、身體功能、認知功能、心理社會情況、臨床生化指標等全面的問卷訪談,基于χ2檢驗和Logistic 回歸分析設計了認知衰弱的早期預測模型,其中認知衰弱是由Fried 衰弱表型和簡易精神評價量表共同測量。最終模型納入年齡、數(shù)字符號測試分數(shù)(認知能力測試)、起立行走測試、抑郁、維生素D 和身體衰弱6 個變量。Setiati 等[23]在印度尼西亞的一項前瞻性隊列研究中,根據(jù)衰弱狀態(tài)、功能狀態(tài)、營養(yǎng)狀況、認知狀況、合并癥、服用藥物數(shù)量、生活質(zhì)量、握力和步速等,開發(fā)了一個預測衰弱過渡狀態(tài)的評分系統(tǒng)。該研究中衰弱過渡狀態(tài)為二分類因變量:①衰弱狀態(tài)改善(即衰弱過渡到衰弱前期或衰弱前期過渡到衰弱)和持續(xù)衰弱狀態(tài)(即衰弱狀態(tài)沒有改變);②衰弱狀態(tài)惡化(即健康過渡到衰弱前期或衰弱或衰弱前期過渡到衰弱),根據(jù)Logistic 回歸分析結果顯示,模型最終納入年齡(≥70 歲)、生活質(zhì)量(差)和步速(<0.8 m/s),將每個變量賦值1 分,ROC 曲線結果顯示衰弱的最佳截點為≥2 分。該模型雖然有較好的內(nèi)部有效性,但缺乏外部驗證。目前,國內(nèi)研究中也有相關探索。許麗娟等[24]通過分析老年衰弱不同階段的危險因素,構建衰弱風險預測模型。通過收集508 名社區(qū)老年人相關資料,利用Logistic 回歸分析建立預測模型,發(fā)現(xiàn)社區(qū)老年衰弱前期危險因素包括文化程度低、合并多病、多重用藥、跌倒史及住院史,模型AUC 值為0.80,衰弱前期轉化為衰弱的危險因素包括獨居、合并多病、多重用藥、跌倒史、住院史及日常生活功能障礙,模型AUC 值為0.93。此外,余靜雅[25]在橫斷面研究的基礎上通過分析社會學資料、老年綜合征及心理社會因素等方面資料,利用Logistic 回歸分析構建老年人衰弱風險預測模型,結果顯示AUC 值為0.749,模型具有較好的預測效能。值得注意的是,國內(nèi)研究雖然結果顯示有較好的預測效能,但均為橫斷面研究,且缺少外部驗證。
以上衰弱風險預測模型的研究目前僅處于構建階段,缺乏內(nèi)部驗證和外部驗證,對模型結果進行轉化和應用較少,提示今后相關研究應更加注重模型構建、內(nèi)部驗證、外部驗證及模型結果在臨床上的轉化、應用等方面的綜合探討。
2.2 基于機器學習算法的衰弱預測模型 2019 年,Kuo 等[26]開發(fā)了一個基于機器學習方法的社會脆弱預測系統(tǒng),以識別老年人的社會脆弱,通過專家組確定的14 個預測因子使用分類與回歸樹(CART)、神經(jīng)網(wǎng)絡、隨機森林、C5.0、極值梯度增強、隨機梯度增強6 種機器學習算法構建預測模型,并基于5 項性能指標比較,選出具有最佳預測性能的模型,作為開發(fā)衰弱決策支持系統(tǒng)的主要算法。研究結果顯示,C5.0 在整體表現(xiàn)上為最優(yōu)算法,也在驗證集中表現(xiàn)出較好的預測性能。同時,通過AUC 值評估了預測因子的重要性,篩選AUC 值>0.5 的預測因子,結合信息增益比結果,確定5 個重要的預測因子,包括健康素養(yǎng)、共病、宗教參與、體育活動和老年抑郁癥評分。該研究結果通過RESTful 網(wǎng)絡應用開發(fā)方式轉化為一個基于網(wǎng)絡的社會衰弱預測系統(tǒng),該預測系統(tǒng)可以與臨床經(jīng)驗相結合,幫助醫(yī)生更好地預測和識別衰弱。2017 年,Closs 等[27]以巴西老年人的身體測量指標為預測因子,比較了通過人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)算法與Logistic 回歸構建的模型在識別老年衰弱方面的預測能力。研究基于收集的26 項身體測量指標進行建模,篩選AUC 值>0.6 的預測因子,最終模型包括體重、腰圍、二頭肌皮褶、臍水平的矢狀腹徑和年齡5 個預測因素,結果顯示ANN 的AUC 值(0.78)優(yōu)于邏輯回歸模型(0.71),提示基于ANN 算法構建的預測模型相較于邏輯回歸分析的建模具有更好的預測效能。該研究納入樣本量較少,預測因子的選取維度較窄,缺少其他風險因素對衰弱的影響,一定程度上限制了ANN模型的結構。
2.3 基于其他分析方法構建衰弱預測模型 有研究認為,衰弱不是一種側重于醫(yī)療或護理需求的概念,而是基于多維度和多學科結構的綜合概念模型。2016年,Vernerey 等[28]構建了一種新的衰弱風險問卷篩查工具(Frailty Groupe Iso-Ressarce Evaluation,FRAGIRE),涉及身體、認知、功能、心理社會/家庭和環(huán)境,主要用于法國自理能力較差的老年人衰弱風險預測。研究分3個階段進行:①通過多學科專家小組綜合文獻回顧,全面評估潛在衰弱相關因素,構建FRAGIRE 預網(wǎng)絡,包括10 個維度、共65 個項目。②采用主成分分析法對相關變量進行維度分析,根據(jù)主成分矩陣中項目的貢獻率、識別能力以及專家組的選擇對問卷項目進行篩選和縮減,確定最終的FRAGIRE 網(wǎng)絡,包括9 個維度、19 個項目。③開發(fā)基于FRAGIRE 問卷的評分系統(tǒng),將各條目作為連續(xù)變量,采用多元邏輯回歸分析構建衰弱風險預測分數(shù),預測得分為0~100 分。結果顯示,AUC 值為0.756,模型具有較好的預測能力。盡管問卷評估比老年人自我報告評估更加合適,仍缺少FRAGIRE 問卷和Fried 等衰弱評估方法的比較,并且問卷開發(fā)過程耗時費力,加大數(shù)據(jù)收集的負擔。該研究為橫斷面研究,仍需進行前瞻性研究驗證。除了開發(fā)衰弱問卷對衰弱進行風險預測,衰弱相關標志性指數(shù)也能從臨床和生理特征中提供與衰弱有關的信息。2010 年,Kamaruzzaman 等[29]利用因子分析法開發(fā)英國衰弱指數(shù),模型數(shù)據(jù)來源于英國女性心臟和健康研究隊列,研究者提取數(shù)據(jù)庫中35 個衰弱指標進行評估和校正,計算與衰弱的相對權重,通過探索性因子分析法將數(shù)據(jù)簡化后進行驗證性因子分析,主要將探索性因子分析構建的結構與觀測數(shù)據(jù)進行擬合來驗證模型內(nèi)部一致性,通過Cox 回歸分析比較新開發(fā)的英國衰弱指數(shù)與加拿大健康和老齡化研究衰弱指數(shù)的不良結局的風險比。結果顯示共有7 個因素與潛在衰弱相關,包括體能、心臟癥狀/疾病、呼吸系統(tǒng)癥狀/疾病、生理測量、心理狀況、共病和視力障礙。Cox 回歸分析結果顯示,英國衰弱指數(shù)較加拿大健康和老齡化研究衰弱指數(shù)更能有效預測死亡、住院和進入養(yǎng)老機構的概率。衰弱模型雖然在英國女性群體中構建,但研究過程也在英國老年人肌力分級評估研究中得到復制,該模型具有較高可信度和有效性。
衰弱早期識別與風險預測是國外研究熱點,預測模型以回歸分析法構建居多,預測因子選取多為非侵入性,但多數(shù)模型缺少外部驗證。目前,國內(nèi)研究較少,分析方法較單一。因此,國內(nèi)應積極開展衰弱風險相關研究,針對我國老年人特點探索多種方法構建模型,評估效能,合理驗證,擇優(yōu)挑選,發(fā)展適用于我國老年人群的衰弱風險預測模型。在老年人健康管理及養(yǎng)老照護領域,與衰弱相關的篩查尚未納入社區(qū)老年健康管理的工作流程中??赡苡捎谀壳吧鐓^(qū)衛(wèi)生服務中心主要關注疾病管理,缺乏對老年人群整體健康的重視,社區(qū)醫(yī)護工作者對老年人衰弱的認識及相關知識不足,且目前構建的大部分模型尚未經(jīng)過前瞻性、多中心外部驗證,限制其在臨床的推廣和應用。因此,社區(qū)護理人員應加強對老年人群的整體健康保護意識,組織醫(yī)護人員開展衰弱相關知識培訓,積極開展衰弱預測模型在社區(qū)護理應用方面的研究。未來人工智能領域不斷進步,將預測模型與社區(qū)醫(yī)療信息系統(tǒng)相結合,可為老年人衰弱提供準確、高效的識別和預警;護理人員也可通過建立健康檔案,對老年人進行與衰弱相關的健康教育和個性化行為干預,提高護理人員的工作效率,從而改善老年人群生活質(zhì)量。