解夕黎,孫明,賈雯涵,皮靜波,馬亞楠*
隨著我國社會經(jīng)濟(jì)的發(fā)展、城市化進(jìn)程的不斷加快、居民生活行為/方式等的改變,以癌癥、高血壓等為代表的慢性非傳染性疾?。ê喎Q慢性?。┑幕疾÷手鹉晟?,慢性病正嚴(yán)重威脅著我國居民的健康[1]。2019年,我國因慢性病死亡人數(shù)占總死亡人數(shù)的88.5%[2]??v觀全球,慢性病已成為全球性的重大公共衛(wèi)生問題,全球因慢性病死亡人數(shù)占全因死亡人數(shù)的60%以上[3]。近年來,信息技術(shù)和互聯(lián)網(wǎng)的飛速發(fā)展,使我國醫(yī)療衛(wèi)生領(lǐng)域積累了種類繁多、形式多樣的健康“大數(shù)據(jù)”資源[4]?!按髷?shù)據(jù)時代”的到來,為我國慢性病防控難題的解決提供了新模式、新方法。在信息化快速發(fā)展的大背景下,如何利用“大數(shù)據(jù)”制定出新的信息化慢性病防控方案,以適應(yīng)居民日益增長的慢性病管理需求,改善日益嚴(yán)峻的慢性病防控形勢,已成為當(dāng)今慢性病管理領(lǐng)域的一大研究熱點[5]。本文通過對“大數(shù)據(jù)”在國內(nèi)外慢性病防控中的應(yīng)用情況進(jìn)行梳理,以期為慢性病防控新模式的開發(fā)與深入研究提供參考與依據(jù)。
傳統(tǒng)慢性病管理模式主要包括生物醫(yī)學(xué)管理模式、認(rèn)知行為干預(yù)模式和心理動力干預(yù)模式,是長久以來醫(yī)學(xué)各領(lǐng)域通過積極探索而形成的有效模式[6]。然而,傳統(tǒng)慢性病管理模式仍存在一定不足:(1)人群監(jiān)測范圍受限,監(jiān)測的危險因素種類少,監(jiān)測數(shù)據(jù)的準(zhǔn)確性、連續(xù)性和完整性難以保證;(2)預(yù)防和管理策略多具有通用性,在制定和實施時未能充分考慮個體需求的差異;(3)個體自我管理能力較弱、缺乏慢性病相關(guān)知識、依從性較差,導(dǎo)致健康干預(yù)效果減弱[6]。而“大數(shù)據(jù)”的利用成為改變現(xiàn)狀、突破“瓶頸”的關(guān)鍵點。
近年來,在數(shù)據(jù)爆炸式增長的背景下,“大數(shù)據(jù)”這一術(shù)語應(yīng)運(yùn)而生。“大數(shù)據(jù)”的特點可用“3v”概括,即大量(volume)、高速(velocity)和多樣(variety);還有一部分學(xué)者認(rèn)為“大數(shù)據(jù)”具有“5v”特點,即大量(volume)、高速(velocity)、多樣(variety)、價值(value)和真實性(veracity)[7-9]。在“大數(shù)據(jù)時代”,數(shù)據(jù)已成為世界各國的基礎(chǔ)性戰(zhàn)略資源。做好數(shù)據(jù)治理不僅有助于提高政府的社會治理能力,還有利于提升公共服務(wù)水平。此外,“大數(shù)據(jù)”技術(shù)的產(chǎn)生與發(fā)展也推動了信息技術(shù)的飛速發(fā)展。過去的二十年里,組學(xué)、可穿戴設(shè)備、傳感器、人工智能、數(shù)字醫(yī)療與創(chuàng)新技術(shù)取得了巨大的進(jìn)步,并被應(yīng)用于精準(zhǔn)化、個體化醫(yī)療領(lǐng)域[10]。移動健康管理設(shè)備可通過人體體征傳感器獲取個體的健康“大數(shù)據(jù)”,如慢性病特征(心率、血壓、血糖等)及生活/行為習(xí)慣(吸煙、飲酒、睡眠情況等)等方面的信息,并將其上傳至云平臺,進(jìn)而使患者/醫(yī)務(wù)人員能夠隨時隨地對自身/患者的健康狀況進(jìn)行監(jiān)測,有效地改善了傳統(tǒng)慢性病管理模式下,人群健康數(shù)據(jù)可獲得性水平較低、連續(xù)性不足和時效性較差等問題[11]。除了可助益?zhèn)€體水平上的慢性病防控外,醫(yī)療健康“大數(shù)據(jù)”的應(yīng)用還能為群體水平上的慢性病防控帶來新模式,助力實現(xiàn)慢性病群體特征刻畫、慢性病發(fā)展預(yù)測等,進(jìn)而可促進(jìn)慢性病并發(fā)癥風(fēng)險防范和預(yù)警效果、慢性病防治工作水平的提升[12]。隨著“大數(shù)據(jù)”逐步應(yīng)用于慢性病防治管理領(lǐng)域,國內(nèi)外許多學(xué)者對慢性病防控新模式開展了研究,且相關(guān)研究工作已取得了一定的成效。
隨著“大數(shù)據(jù)時代”的到來,“大數(shù)據(jù)”逐漸成為產(chǎn)學(xué)兩界共同關(guān)注的焦點。作為分析“大數(shù)據(jù)”價值的關(guān)鍵技術(shù),機(jī)器學(xué)習(xí)技術(shù)使研究人員能夠更好地分析健康醫(yī)療“大數(shù)據(jù)”復(fù)雜多變的內(nèi)部聯(lián)系,已被廣泛應(yīng)用于數(shù)據(jù)挖掘、病因探索等領(lǐng)域,在疾病早期預(yù)測與診斷及預(yù)后評估中發(fā)揮著重要作用[13]。周陽等[14]選取了約20萬份居民健康檔案,通過機(jī)器學(xué)習(xí)中的邏輯回歸、隨機(jī)森林和支持向量機(jī)算法建立了3種高血壓風(fēng)險預(yù)測模型,并對3種模型在高血壓風(fēng)險預(yù)測中的應(yīng)用價值進(jìn)行比較、分析。研究結(jié)果顯示,基于支持向量機(jī)建立的高血壓風(fēng)險預(yù)測模型的預(yù)測性能最為優(yōu)異,預(yù)測準(zhǔn)確率達(dá)87%。GUIDA等[15]利用邏輯回歸算法構(gòu)建了基于循環(huán)蛋白生物標(biāo)志物的肺癌風(fēng)險預(yù)測模型。相比于傳統(tǒng)基于吸煙情況建立的肺癌風(fēng)險預(yù)測模型,該模型的靈敏度和特異度均得到明顯改善。根據(jù)美國預(yù)防服務(wù)工作組(USPSTF)發(fā)布的篩選標(biāo)準(zhǔn):(1)當(dāng)總體特異度為0.83時,基于循環(huán)蛋白生物標(biāo)志物、吸煙情況建立的肺癌風(fēng)險預(yù)測模型的靈敏度分別為0.63、0.43;(2)當(dāng)總體靈敏度為0.42時,基于循環(huán)蛋白生物標(biāo)志物、吸煙情況構(gòu)建的肺癌風(fēng)險預(yù)測模型的特異度分別為0.95、0.86。REZAEE等[16]通過遞歸特征消除法(RFE)自動篩選用于預(yù)測的最佳變量集(變量集中的變量不僅包括傳統(tǒng)危險因素,還包括多種血液生物標(biāo)志物和合并癥),構(gòu)建了具有良好預(yù)測性能和可重復(fù)性的異質(zhì)性心血管疾病風(fēng)險預(yù)測模型,該模型對冠狀動脈疾病、卒中的區(qū)分能力均處于中等水平(C指數(shù)分別為0.794、0.778)。未來仍需要在大樣本人群中對上述基于生物標(biāo)志物建立的疾病風(fēng)險預(yù)測模型進(jìn)行驗證和校準(zhǔn)。
而在人工智能技術(shù)探索的道路上,更多高性能、靈活性更強(qiáng)的機(jī)器學(xué)習(xí)算法被開發(fā)出來。WANG等[17]利用縱向監(jiān)測病例隨訪隊列信息數(shù)據(jù)庫,基于長短時記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)開發(fā)了一種多疾病風(fēng)險預(yù)測模型,該模型能夠較好地預(yù)測患者未來發(fā)生疾病的風(fēng)險。我國學(xué)者黃旭等[18]采用隨機(jī)森林、梯度提升決策樹和極端梯度提升3種集成學(xué)習(xí)算法對慢性病進(jìn)行分類,將多疾病風(fēng)險預(yù)測問題轉(zhuǎn)化為多標(biāo)簽分類問題,并進(jìn)一步建立了神經(jīng)網(wǎng)絡(luò)模型,以實現(xiàn)對多種疾病風(fēng)險的預(yù)測。雖然該方法提高了模型對數(shù)據(jù)的適應(yīng)能力、運(yùn)算速度和高維參數(shù)尋優(yōu)速度,但研究者仍需進(jìn)一步利用不同數(shù)據(jù)處理方法,構(gòu)建更為復(fù)雜多變的神經(jīng)網(wǎng)絡(luò)模型,同時在進(jìn)行問題轉(zhuǎn)化的過程中也要考慮標(biāo)簽間關(guān)聯(lián)性的問題。此外,在基因測序等技術(shù)快速發(fā)展的背景下,研究者也嘗試將多組學(xué)研究引入慢性病風(fēng)險預(yù)測領(lǐng)域。CHOI等[19]考慮了逐步邏輯回歸(SLR)等變量選擇和預(yù)測方法對2型糖尿病風(fēng)險預(yù)測模型性能的影響,以及單核苷酸多態(tài)性(SNP)數(shù)據(jù)集對風(fēng)險預(yù)測效能的影響,發(fā)現(xiàn)包含人口統(tǒng)計變量和遺傳變量的預(yù)測模型與僅包含人口統(tǒng)計變量的預(yù)測模型相比,在預(yù)測2型糖尿病發(fā)生上更準(zhǔn)確。MARS等[20]評價了全基因組多基因風(fēng)險評分(PRS)在冠心病、2型糖尿病等5種慢性病風(fēng)險預(yù)測中的附加價值,并評估了不同PRS水平下個體的終生患病風(fēng)險及不同PRS水平對疾病發(fā)病和風(fēng)險預(yù)測的影響。研究結(jié)果顯示,與平均PRS水平相比,高PRS可能會導(dǎo)致個體終生患病風(fēng)險增加21%~38%、疾病發(fā)病時間提前4~9年。調(diào)整年齡和性別的影響后,PRS還有助于改善模型對2型糖尿病、心房顫動、乳腺癌和前列腺癌的預(yù)測價值。除傳統(tǒng)的三大組學(xué)外,轉(zhuǎn)錄組學(xué)、表觀基因組學(xué)等新興組學(xué)的出現(xiàn)也促進(jìn)了研究者對疾病風(fēng)險預(yù)測的理解[21]。但值得注意的是,多基因、多組學(xué)技術(shù)在臨床中的實際應(yīng)用效果仍有待進(jìn)一步研究確認(rèn)。
疾病風(fēng)險預(yù)測是預(yù)防控制慢性病的有效措施之一。近年來,各種算法和模型不斷被應(yīng)用于慢性病風(fēng)險預(yù)測領(lǐng)域,多疾病、多基因、多組學(xué)研究取得的成果也進(jìn)一步推動了慢性病風(fēng)險預(yù)測研究的深入開展。但目前,國內(nèi)外相關(guān)風(fēng)險預(yù)測模型中變量的種類較為局限,模型構(gòu)建時使用的算法較為單一。同時,訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集的代表性不足,也可能導(dǎo)致研究結(jié)果的論證強(qiáng)度受限。未來在開展慢性病風(fēng)險預(yù)測研究時應(yīng)注意以下3點:(1)將膳食、睡眠等健康相關(guān)因素和生物標(biāo)志物納入模型;(2)合理選擇建模方法,提高模型的實用價值;(3)利用針對不同地區(qū)、人群開展的大型隊列研究數(shù)據(jù)對模型進(jìn)行驗證。此外,還應(yīng)注重對慢性病風(fēng)險預(yù)測模型的轉(zhuǎn)化及推廣,進(jìn)而助力實現(xiàn)慢性病的早期發(fā)現(xiàn)、慢性病防控“關(guān)口前移”。疾病風(fēng)險預(yù)測模型的開發(fā)也為慢性病綜合防控平臺的搭建奠定了堅實的基礎(chǔ)。
截至2020年8月,我國已經(jīng)建成了488個國家級慢性病綜合防控示范區(qū)[22]。北京、上海等地均已啟動并初步完成了省級衛(wèi)生信息化平臺建設(shè)。上海市基于3 000多萬份居民電子健康檔案數(shù)據(jù)和100億條臨床診療記錄,建立了“上海健康云”信息平臺,該平臺不僅能夠為居民提供慢性病管理、預(yù)約掛號、預(yù)防接種、家庭醫(yī)生等線上服務(wù),還支持通過個體健康風(fēng)險評估細(xì)化對慢性病患者的分類管理,可更好地為居民提供覆蓋全生命周期的慢性病健康服務(wù)[23]。徐匯區(qū)將營養(yǎng)干預(yù)與“互聯(lián)網(wǎng)+”深度融合,基于糖尿病患者的健康數(shù)據(jù)研發(fā)并啟用了“合理營養(yǎng)自評系統(tǒng)”和“營養(yǎng)門診咨詢管理系統(tǒng)”,兩大系統(tǒng)的應(yīng)用使糖尿病患者的血糖、血脂水平得到了有效改善,并為系統(tǒng)化的慢性病營養(yǎng)干預(yù)模式的建立奠定了基礎(chǔ);閔行區(qū)利用居民電子健康檔案開展糖尿病等疾病患者的篩查、管理及干預(yù)工作,通過采用基于“大數(shù)據(jù)”構(gòu)建的、具備自動評分與識別功能的糖尿病篩查評分系統(tǒng)對轄區(qū)居民進(jìn)行糖尿病篩查,目前已使近萬名糖尿病前期患者得到了及時治療,這一措施有效地提高了慢性病的早期發(fā)現(xiàn)率、篩查準(zhǔn)確率[24]。近年來,浙江省寧波市鄞州區(qū)基于“互聯(lián)網(wǎng)+健康”推出了系列管理工具。2015年搭建了“健康教育云平臺”,已助力健康教育宣傳在全區(qū)醫(yī)療衛(wèi)生服務(wù)機(jī)構(gòu)實現(xiàn)“全覆蓋”,并逐步走向家庭;自2016年起,逐步開發(fā)和使用的“大數(shù)據(jù)”平臺也為高脂血癥、糖尿病及高血壓等慢性病的篩查和干預(yù)提供了更加科學(xué)、精確的依據(jù),使慢性病管理工作的效率及效果得到了明顯的提高,全區(qū)高脂血癥患者規(guī)范管理率達(dá)到了 85.5%[25]。
然而,不同地區(qū)在工作開展機(jī)制、資源稟賦、經(jīng)濟(jì)基礎(chǔ)和適宜技術(shù)開展情況等方面存在差異,要建立符合自身特色的慢性病綜合防控平臺還需要不斷探索。因此,許多學(xué)者也開展了慢性病綜合防控平臺搭建研究。馮陽等[26]通過整合互聯(lián)網(wǎng)、APP、“大數(shù)據(jù)”云計算等技術(shù),實現(xiàn)了各級醫(yī)療衛(wèi)生機(jī)構(gòu)患者健康信息的交流共享,并結(jié)合臨床經(jīng)驗、專業(yè)知識構(gòu)建了慢性病健康網(wǎng),開發(fā)了“以患者為中心”、基于移動互聯(lián)的慢性病個體化管理與診療平臺。該平臺具有移動化、個性化和精準(zhǔn)化三大特征,通過收集患者基本信息、身體體征、日常運(yùn)動、健康體檢等方面的數(shù)據(jù),并利用以國內(nèi)外風(fēng)險評估模型為基礎(chǔ),結(jié)合“大數(shù)據(jù)”算法所形成的新型、具備動態(tài)運(yùn)算能力的風(fēng)險評估模型,為慢性病患者提供具有針對性的個體化健康管理及干預(yù)方案,提高了慢性病防控工作的質(zhì)和量。陳平等[27]開發(fā)了基于“大數(shù)據(jù)”技術(shù)和醫(yī)療線上到線下(O2O)模式的“慢性病防控云平臺”?!奥圆》揽卦破脚_”不僅可以提供“南京都市圈”中各醫(yī)療衛(wèi)生機(jī)構(gòu)的診療信息,還可實現(xiàn)對慢性病高危人群及患者的遠(yuǎn)程監(jiān)測與管理。此外,“慢性病防控云平臺”還能夠收集患者生命體征、就診信息等方面的數(shù)據(jù),并支持采用谷歌Word2Vec模型、BP神經(jīng)網(wǎng)絡(luò)模型等對輸入的數(shù)據(jù)進(jìn)行自然語言處理和語義識別,最終實現(xiàn)智能應(yīng)答,即將智能搜索結(jié)果通過應(yīng)答輸出模塊輸出給用戶。慢性病本體知識庫系統(tǒng)也為智能咨詢提供了基礎(chǔ)支撐,使慢性病患者隨時自診自查成為可能。
可穿戴設(shè)備和傳感器等技術(shù)的創(chuàng)新使得醫(yī)務(wù)人員能夠為更多慢性病(如輕度認(rèn)知障礙、年齡相關(guān)障礙等)患者及重點人群(如老年人、兒童等)提供健康管理服務(wù),也為慢性病綜合防控平臺的建設(shè)提供了更多創(chuàng)新思路。KYRIAZAKOS等[28]提出打造一個基于云的開源電子健康平臺——eWALL?!癳WALL”面向慢性病患者和衰弱的老年人群,主要由“eWALL家庭”和“eWALL云”兩部分組成?!癳WALL家庭”承載了整體感知功能,負(fù)責(zé)收集環(huán)境、生活、健康等方面的相關(guān)參數(shù),上傳、儲存并追蹤患者各項數(shù)據(jù);“eWALL云”負(fù)責(zé)管理和分析來自患者家庭的數(shù)據(jù)。“eWALL”還提供了多種應(yīng)用程序,以幫助患者進(jìn)行自我健康管理,有效地減輕了患者及其家庭的負(fù)擔(dān)。
基于“大數(shù)據(jù)”的慢性病綜合防控平臺覆蓋范圍廣、服務(wù)類型多,能夠提升慢性病健康管理系統(tǒng)整體效益,充分發(fā)揮醫(yī)療健康“大數(shù)據(jù)”的價值,讓優(yōu)質(zhì)的慢性病防控資源惠及更多患者,為慢性病及精準(zhǔn)醫(yī)療領(lǐng)域研究深入開展提供了不竭動力。今后,應(yīng)進(jìn)一步根據(jù)國家各項政策措施,擴(kuò)大基于“大數(shù)據(jù)”的慢性病綜合防控平臺的推廣和使用范圍,充分調(diào)動慢性病患者的參與積極性,進(jìn)而提高其對慢性病綜合防控平臺的知曉率和使用率。并且,隨著信息化技術(shù)的發(fā)展,應(yīng)不斷完善、創(chuàng)新平臺建設(shè),提高慢性病患者健康相關(guān)數(shù)據(jù)上傳的實時性,優(yōu)化平臺/APP的服務(wù)功能和細(xì)節(jié)問題,努力實現(xiàn)對患者全生命周期電子健康記錄的采集、儲存和管理,最終助力數(shù)字醫(yī)療發(fā)展。
盡管我國慢性病防控策略與技術(shù)經(jīng)過了多年的研究與發(fā)展,但慢性病仍是危害我國居民身體健康的重大公共衛(wèi)生問題。若要進(jìn)一步提升慢性病防治工作水平,最主要的就是順應(yīng)時代變化和發(fā)展,結(jié)合“大數(shù)據(jù)時代”背景下的多種新興信息技術(shù),搭建起包括遺傳與環(huán)境交互作用效應(yīng)評估、生活/行為方式評估、疾病風(fēng)險預(yù)警評估等功能在內(nèi)的智能化慢性病綜合防控平臺。慢性病綜合防控平臺通過對不同人群(包括健康人群、高危人群及慢性病患者)的健康醫(yī)療數(shù)據(jù)進(jìn)行采集,并利用基于數(shù)據(jù)挖掘、深度機(jī)器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)等技術(shù)構(gòu)建的慢性病風(fēng)險預(yù)測模型,可識別出個體發(fā)生慢性病的危險因素,為健康人群提供健康生活、行為方式等方面的指導(dǎo),對高危人群發(fā)生慢性病的危險因素進(jìn)行監(jiān)測、評估和干預(yù),為慢性病患者提供精準(zhǔn)化的治療方案及健康監(jiān)測服務(wù)??傊?,“大數(shù)據(jù)時代”的到來為慢性病綜合防控帶來了更多的可能。
作者貢獻(xiàn):解夕黎負(fù)責(zé)文章的構(gòu)思與設(shè)計、可行性分析、論文撰寫與修訂;孫明負(fù)責(zé)文獻(xiàn)/資料收集;賈雯涵負(fù)責(zé)文獻(xiàn)/資料整理;皮靜波負(fù)責(zé)文章的質(zhì)量控制及審校;馬亞楠對文章整體負(fù)責(zé),監(jiān)督管理。
本文無利益沖突。