曠小羿,徐巧玲,徐偉,張海峰,耿新玲,侯惠如
1.中國人民解放軍醫(yī)學(xué)院,北京 100853;2.中央軍委聯(lián)合參謀部警衛(wèi)局衛(wèi)生保健處;3.中國人民解放軍第三〇五醫(yī)院藥局;4.首都醫(yī)科大學(xué)生物醫(yī)學(xué)工程學(xué)院;5.中國人民解放軍總醫(yī)院第二醫(yī)學(xué)中心護理部
我國糖尿病患者人數(shù)龐大,已成為主要的公共衛(wèi)生負擔(dān)[1],其中2型糖尿病(T2DM)占90%以上[2-3]。生活方式的自我管理(飲食攝入、體力活動、用藥情況、血糖監(jiān)控等)是優(yōu)化血糖的關(guān)鍵[4-6]。對于患者而言,堅持持續(xù)有效的自我管理比較困難[7-8]。建立血糖趨勢預(yù)測模型[9]可實現(xiàn)血糖水平的短期預(yù)測(15、30、45、60 min),利于患者積極采取干預(yù)措施,達到優(yōu)化血糖的目的。動態(tài)血糖監(jiān)測(CGM)設(shè)備能提供較為完整的血糖圖譜[10],促進了人工智能模型的構(gòu)建[11]。支持向量回歸(SVR)是使用較早且較為普及的模型構(gòu)建方法[12],而基于長短期記憶(LSTM)單元的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)是目前較為前沿且使用最多的人工智能算法[13]。因此,本研究采用SVR與LSTM-RNN這2種方式構(gòu)建老年T2DM患者血糖趨勢預(yù)測模型,并對比模型表現(xiàn)。
1.1 研究對象 選擇2020年11月至2021年5月于中央軍委聯(lián)合參謀部警衛(wèi)局保健處門診部就診且符合納入標(biāo)準的T2DM患者12例。2例因無法堅持記錄生活數(shù)據(jù)而退出,1例因記錄的數(shù)據(jù)質(zhì)量不合格而剔除,最終獲得9例數(shù)據(jù)(回收率75%)。其中女5例,男4例,年齡(68.4±6.7)歲,糖尿病病程1~21(7.0±2.2)年,體重指數(shù)(BMI)21.89~26.35(23.85±1.82)kg/m2。8例口服降糖藥,1例接受胰島素治療,糖化血紅蛋白(HbA1c) 4.8%~9.8%(6.77%±1.76%),CGM值為(7.17±2.05)mmol/L。納入標(biāo)準:①具有一定的閱讀能力,自愿參與并簽署知情同意書;②符合2020年版《中國2型糖尿病防治指南》[1]診斷;③年齡≥60且<80歲;④交流無障礙;⑤具有基本運動能力者;⑥未患有精神疾病,具備學(xué)習(xí)能力者;⑦能按時提交連續(xù)血糖監(jiān)測期間的個人飲食、運動等數(shù)據(jù);⑧能做到遵醫(yī)囑按時服藥。排除標(biāo)準:①合并嚴重心、腦、腎、眼、足及其他限制活動的致殘性疾??;②基本運動能力差,生活不能自理者;③未能按時服藥者;④課題組認為不適合入組的其他情形。
1.2 研究方法
1.2.1 數(shù)據(jù)收集 使用9例各14 d的數(shù)據(jù)組成數(shù)據(jù)庫。包括個人血糖數(shù)據(jù)及生活數(shù)據(jù)。血糖數(shù)據(jù)的收集采用雅培輔理善瞬感(Abbott Free Style Libre),每名患者連續(xù)監(jiān)測14 d,設(shè)備以15 min的時間間隔自行記錄血糖值。血糖監(jiān)測期間的生活數(shù)據(jù)由患者根據(jù)課題組發(fā)放的數(shù)據(jù)采集表自行記錄,分為:飲食、運動、用藥及睡眠。飲食數(shù)據(jù)根據(jù)《中國食物成分表標(biāo)準版(第6版)》,依照食物種類及量,采用各供能營養(yǎng)素(蛋白質(zhì)、脂肪、碳水化合物)克重量乘以相應(yīng)的能量轉(zhuǎn)換系數(shù),再求和而得,能量單位為kJ。運動數(shù)據(jù)根據(jù)薄荷健康運動卡路里計算器,將受試對象記錄的運動內(nèi)容轉(zhuǎn)換為消耗的熱量值(kJ)。睡眠數(shù)據(jù)根據(jù)睡眠時長,轉(zhuǎn)換為時間數(shù)據(jù)(單位:s)。用藥數(shù)據(jù)為時間點的有或無(1或0)。運用python軟件構(gòu)建數(shù)據(jù)轉(zhuǎn)換程序,將血糖與生活數(shù)據(jù)轉(zhuǎn)為可用于機器學(xué)習(xí)的,以15 min為時間戳的五維數(shù)據(jù)。數(shù)據(jù)不做平滑處理,均為原始數(shù)據(jù)納入模型。
1.2.2 模型構(gòu)建 采用LSTM-RNN與SVR兩種方法構(gòu)建模型。模型的數(shù)據(jù)納入中,CGM結(jié)合飲食簡寫為CGM+D,CGM結(jié)合飲食、運動簡寫為CGM+D+E。在此次模型構(gòu)建中,為減少數(shù)據(jù)類型的復(fù)雜度及噪聲,睡眠及用藥數(shù)據(jù)僅作為患者個體的特征體現(xiàn),不進行相應(yīng)的納入對比。LSTM-RNN中,采用遷移學(xué)習(xí)(TL)策略[14],以縮減時間,并提高預(yù)測患者的準確性,即先使用所有患者的數(shù)據(jù)創(chuàng)建遷移學(xué)習(xí)數(shù)據(jù)集,用于預(yù)訓(xùn)練全局LSTM 模型。然后根據(jù)每個患者的個人記錄,對全局模型進行個性化處理。模型均采用過去60 min的數(shù)據(jù)來預(yù)測未來血糖水平,預(yù)測范圍(PH)為15、30、45、60 min。
2.1 數(shù)據(jù)基本情況描述 數(shù)據(jù)總量為15 678條,其中CGM數(shù)據(jù)12 382條(占比79%),飲食記錄數(shù)據(jù)2 521條(占比16%),藥物數(shù)據(jù)359條(占比2.4%),運動數(shù)據(jù)290條(占比1.8%),睡眠數(shù)據(jù)126條(占比0.8%)。
2.2 模型表現(xiàn)
2.2.1 模型預(yù)測評價 SVR構(gòu)建血糖預(yù)測模型,在相同數(shù)據(jù)輸入下,模型表現(xiàn)隨著PH的延長而下降,差異有統(tǒng)計學(xué)意義(P<0.05)。在相同PH下,PH=30 min時,3種數(shù)據(jù)輸入模式其RMSE值差異有統(tǒng)計學(xué)意義(P<0.05),其中CGM+D的RMSE值最低(見表1);組間比較顯示飲食與運動數(shù)據(jù)的加入提升模型表現(xiàn),差異有統(tǒng)計學(xué)意義(P<0.05);而飲食與運動數(shù)據(jù)之間的比較,差異無統(tǒng)計學(xué)意義(見表2)。
表1 SVR模型不同組別及PH的血糖預(yù)測結(jié)果比較
表2 SVR模型PH=30 min時不同數(shù)據(jù)輸入的結(jié)果比較
神經(jīng)網(wǎng)絡(luò)技術(shù)復(fù)雜,結(jié)構(gòu)層次多,對數(shù)據(jù)量的要求更大,因此本研究LSTM-RNN模型在預(yù)測60 min時無法收斂,只預(yù)測到未來45 min。該算法的模型呈現(xiàn)更具復(fù)雜性,整體而言,隨著PH的延長,模型表現(xiàn)差異無統(tǒng)計學(xué)意義(見表3)。
表3 LSTM-RNN模型不同組別及PH的血糖預(yù)測結(jié)果比較
在相同PH下,PH=45 min時,飲食數(shù)據(jù)的加入提升了模型表現(xiàn),差異有統(tǒng)計學(xué)意義(P<0.05),而運動數(shù)據(jù)的加入對模型的影響差異無統(tǒng)計學(xué)意義(見表4)。
表4 LSTM-RNN模型PH=45 min時不同數(shù)據(jù)輸入的結(jié)果比較
比較這兩種模型,PH=15 min時,SVR優(yōu)于LSTM-RNN,差異有統(tǒng)計學(xué)意義(P<0.05);PH=30 min時,模型表現(xiàn)差異無統(tǒng)計學(xué)意義;而隨著PH的延長,到SVR(45/60 min)與LSTM-RNN(45 min)時,LSTM-RNN的模型表現(xiàn)提升,差異有統(tǒng)計學(xué)意義(P<0.05)(見表5)。
表5 SVR與LSTM-RNN模型性能比較
2.2.2 Clarke誤差網(wǎng)絡(luò)分析結(jié)果(EGA) 兩種模型均表現(xiàn)出個體化的高度匹配,以血糖波動最大的4號患者為例。在SVR模型下,PH=60 min時的CGM+D+E數(shù)據(jù)輸入EGA表現(xiàn)為:A(91.12%),B(7.23%);PH=15 min時,LSTM-RNN模型下的CGM+D+E數(shù)據(jù)輸入EGA表現(xiàn)為:A(93.82%),B(6.18%),模型預(yù)測結(jié)果均達到臨床可接受度(見圖1)。
圖1 4號患者2種構(gòu)建模型下的Clarke-EGA表現(xiàn)圖
我國糖尿病患者血糖控制達標(biāo)率僅45.8%~58.4%,且年齡越大達標(biāo)率越低[15-16],與2025年糖尿病患者規(guī)范管理率需達到70%[17]的國家目標(biāo)相比,還有不小的差距。血糖預(yù)測模型的構(gòu)建能提升醫(yī)護人員血糖管理效率并幫助患者更直觀地理解生活方式如何影響血糖水平,并以此促進生活方式的持續(xù)有效管理[18],減少因血糖不良波動而導(dǎo)致的危害[19]。血糖預(yù)測模型的研究中,絕大多數(shù)是針對T1DM患者[13],與其對胰島素的絕對依賴、人工胰腺的使用和使用CGM設(shè)備的普及性有關(guān)。而目前針對老年T2DM患者的個體化血糖趨勢預(yù)測模型的研究仍鮮有報道。因此本課題組根據(jù)保健工作實際需要,研究針對老年T2DM患者的血糖預(yù)測模型。
本研究構(gòu)建的血糖預(yù)測模型能反映出不同個體基于個體特征,對熱量值(攝入為正值,運動消耗為負值)的不同反應(yīng)。該模型能解決兩個問題:一是在當(dāng)前時刻(t0)預(yù)測未來一定時間內(nèi)的血糖值,二是預(yù)測攝入一定熱量值時,個體后續(xù)時段(t0+n)的血糖反應(yīng)。這兩個功能,將有利于醫(yī)護人員對患者血糖趨勢的預(yù)判及熱量相關(guān)措施的選擇,使得精準化保健工作成為一種可能。模型表現(xiàn)RMSE及Clarke誤差分析證實了模型的可實用性。
從模型表現(xiàn)來看,在當(dāng)前研究人群中,飲食是血糖的主要影響因素。2種模型在加入飲食數(shù)據(jù)后,模型表現(xiàn)均提升,且優(yōu)于運動數(shù)據(jù)。這與運動方式效率不夠,對血糖的影響小,在模型里影響輕微,甚至拉低了部分模型表現(xiàn)。回看患者的運動記錄,大部分為散步,該方式效率低,既耗時又能量消耗小。對于老年人而言,該運動方式較為和緩且單一,對血糖調(diào)控力差,在后續(xù)的生活方式指導(dǎo)中,應(yīng)該調(diào)整該類人群安全、有效的運動方式。SVR模型短時表現(xiàn)優(yōu)于LSTM-RNN,但LSTM-RNN表現(xiàn)出更為復(fù)雜的特性,隨著PH的延長,模型表現(xiàn)提升且優(yōu)于SVR算法,這與神經(jīng)網(wǎng)絡(luò)算法擅長處理各輸入數(shù)據(jù)與血糖水平之間的高度異質(zhì)且非線性關(guān)系有關(guān)[13]。隨著患者記錄的數(shù)據(jù)越來越多,該模型將變得更加個體化,從而在預(yù)測血糖方面達到更高的準確性[20]。在此次研究中,SVR的60 min/CGM+D+E與LSTM-RNN的45 min/CGM+D+E,其模型表現(xiàn)均是臨床可接受。
綜上所述,飲食是該類人群主要的影響因素,運動方式有待改善。模型可對患者進行有效的熱量相關(guān)指導(dǎo)。課題組會在數(shù)據(jù)的深度(延長CGM設(shè)備佩戴周期)和廣度(增加受試對象)2個方面進行擴充,進一步提升血糖趨勢預(yù)測模型性能,達到有效輔助醫(yī)護人員管理老年T2DM患者血糖,促進其健康、有效的生活方式,優(yōu)化血糖水平的目的。