張凱鈞,諸海燕,董 奧,周科群,徐佳敏
紹興市人民醫(yī)院,浙江紹興 312000
隨著移動(dòng)互聯(lián)技術(shù)的發(fā)展,醫(yī)護(hù)人員能夠通過更加便捷的途徑搜尋到大量患者的個(gè)人健康數(shù)據(jù)[1]。據(jù)研究[2]表明,高血壓形成受到多種復(fù)雜致病因子的影響,這些因素同時(shí)也伴隨著高血壓的后續(xù)發(fā)展。因此,對(duì)高血壓患者的個(gè)人健康數(shù)據(jù)進(jìn)行分析,挖掘出影響高血壓形成和發(fā)展時(shí)各個(gè)致病因子的影響情況,對(duì)后期的血壓預(yù)測(cè)以及高血壓的治療具有重要的意義。為了高效且準(zhǔn)確地分析出數(shù)據(jù)之間的隱藏規(guī)律,許多學(xué)者應(yīng)用機(jī)器學(xué)習(xí)方法同有創(chuàng)和無創(chuàng)血壓預(yù)測(cè)方法相結(jié)合,對(duì)患者或志愿者的相關(guān)數(shù)據(jù)進(jìn)行挖掘、分析和管理,同時(shí)還建立了相關(guān)的血壓預(yù)測(cè)模型,對(duì)后續(xù)血壓預(yù)測(cè)起到良好的輔助作用,并取得了顯著的成效[3-5]。為此,本研究基于各種機(jī)器學(xué)習(xí)方法在血壓預(yù)測(cè)領(lǐng)域的研究進(jìn)行綜述,探尋未來該種方法在血壓預(yù)測(cè)領(lǐng)域內(nèi)的發(fā)展前景,加強(qiáng)醫(yī)護(hù)工作者對(duì)其的認(rèn)知。
機(jī)器學(xué)習(xí)方法屬于人工智能領(lǐng)域,該方法可以從有限的觀測(cè)數(shù)據(jù)中分析并獲取規(guī)律,并利用這些規(guī)律對(duì)未知的數(shù)據(jù)進(jìn)行預(yù)測(cè)。傳統(tǒng)的醫(yī)療信息領(lǐng)域是通過對(duì)已有數(shù)據(jù)進(jìn)行整合,進(jìn)而得到相關(guān)的特征,這種方法的效率往往過低,而且難以獲得較好的效果。而多數(shù)機(jī)器學(xué)習(xí)方法是基于數(shù)據(jù)驅(qū)動(dòng),自行發(fā)現(xiàn)數(shù)據(jù)與數(shù)據(jù)之間的深層聯(lián)系,無論是對(duì)于線性還是非線性關(guān)系,都能在保證較高精度和效率的前提下獲得良好的效果[6]。因此,機(jī)器學(xué)習(xí)方法可以為醫(yī)護(hù)工作者在處理相關(guān)臨床工作時(shí)提供一定的參考,使得做出的決策更加精準(zhǔn)有效[7]。利用機(jī)器學(xué)習(xí)進(jìn)行預(yù)測(cè)一般包括4個(gè)步驟:數(shù)據(jù)預(yù)處理、特征提取、特征轉(zhuǎn)換和預(yù)測(cè),其中預(yù)測(cè)是機(jī)器學(xué)習(xí)的核心部分,通過挖掘數(shù)據(jù)與數(shù)據(jù)之間的映射關(guān)系,學(xué)習(xí)一個(gè)函數(shù),并進(jìn)行預(yù)測(cè)。常見的機(jī)器學(xué)習(xí)方法有多種,包括神經(jīng)網(wǎng)絡(luò)方法、支持向量機(jī)(support vector machine,SVM)、隨機(jī)森林算法、貝葉斯學(xué)習(xí)算法等。
神經(jīng)網(wǎng)絡(luò)方法是一種受到人腦啟發(fā)的機(jī)器學(xué)習(xí)算法,神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括3層:輸入層、隱含層和輸出層。神經(jīng)網(wǎng)絡(luò)方法具有很強(qiáng)的聯(lián)想記憶、非線性映射、分類識(shí)別以及知識(shí)處理能力,基于此,目前許多類型的神經(jīng)網(wǎng)絡(luò)方法應(yīng)用到了血壓預(yù)測(cè)中。中醫(yī)通過面部診斷可以良好地確定身體器官的健康狀況(包括心臟)?;诖?Xing等[8]提出了一個(gè)使用深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)預(yù)測(cè)血壓的人工智能框架,將人臉診斷理論同計(jì)算機(jī)視覺相結(jié)合。首先通過652個(gè)面部視頻提取脈搏波信號(hào),然后建立神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,結(jié)果表明,真實(shí)預(yù)測(cè)率在90%以上。李帆等[9]基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(long short term memory,LSTM),利用光電容積脈搏波(photoplethysmography,PPG)信號(hào),對(duì)人體血壓進(jìn)行了預(yù)測(cè),同時(shí)還與循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)模型對(duì)比,發(fā)現(xiàn)LSTM網(wǎng)絡(luò)對(duì)人體血壓的預(yù)測(cè)更為準(zhǔn)確,且性能優(yōu)于RNN模型。朱林[10]針對(duì)血壓值波動(dòng)具有周期性和非平穩(wěn)性等特點(diǎn),提出將添有注意機(jī)制的雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(bidirectional long short term memory,Bi LSTM)和CNN相結(jié)合,形成血壓預(yù)測(cè)的模型,能夠很好地吻合血壓的變化趨勢(shì),且預(yù)測(cè)誤差也在允許范圍內(nèi)。Rong等[11]利用深度學(xué)習(xí)模型自動(dòng)提取PPG特征,該模型包括兩個(gè)用于PPG信號(hào)形態(tài)和頻譜特征訓(xùn)練的CNN和一個(gè)訓(xùn)練PPG信號(hào)時(shí)間特征的BiLSTM,其預(yù)測(cè)結(jié)果符合美國(guó)醫(yī)療器械促進(jìn)學(xué)會(huì)(The Association for the Advancement of Medical Instrumentation,AAMI)以及英國(guó)高血壓協(xié)會(huì)的國(guó)際標(biāo)準(zhǔn)。除此之外,諸如廣義回歸神經(jīng)網(wǎng)絡(luò)[12-14]、自組織映射神經(jīng)網(wǎng)絡(luò)[15]、鄰近算法[16]等方法也應(yīng)用到了相關(guān)領(lǐng)域。由此看出,神經(jīng)網(wǎng)絡(luò)方法對(duì)于血壓預(yù)測(cè)有著良好的效果,而且已被廣泛應(yīng)用,其技術(shù)也比較成熟,對(duì)于不同特征的血壓數(shù)據(jù),可以選用不同的神經(jīng)網(wǎng)絡(luò)方法進(jìn)行擬合,給血壓預(yù)測(cè)的實(shí)施帶來了靈活性和便利性。但也存在著一些不足,比如在構(gòu)建神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型時(shí),特征的選取很大程度會(huì)影響預(yù)測(cè)模型的預(yù)測(cè)精度,研究者往往會(huì)選取同高血壓相關(guān)的特征進(jìn)行預(yù)測(cè),這在一定程度上存在局限性,后續(xù)研究需要進(jìn)一步分析潛在的影響特征,從而提升模型的性能。
SVM是一種建立在統(tǒng)計(jì)學(xué)基礎(chǔ)上的機(jī)器學(xué)習(xí)方法。通俗來講,SVM的目的是去尋求兩類數(shù)據(jù)的分割線(超平面),該種方法可以很好地解決小樣本情況下的相關(guān)問題,有著良好的泛化能力。目前有學(xué)者使用該方法進(jìn)行血壓預(yù)測(cè)。彭莉[17]通過采集多名受試者的透射式手指PPG信號(hào)和反射式前額PPG信號(hào)建立了SVM血壓預(yù)測(cè)模型,并與偏最小二乘血壓模型對(duì)比,同時(shí)還利用可穿戴式的血壓計(jì)獲得參考血壓值,結(jié)果顯示,預(yù)測(cè)模型的血壓預(yù)測(cè)結(jié)果良好。Zhang等[18]提出利用SVM回歸算法對(duì)血壓進(jìn)行預(yù)測(cè),并且利用六種典型機(jī)器學(xué)習(xí)評(píng)價(jià)指標(biāo)驗(yàn)證該方法的有效性,結(jié)果表明,該預(yù)測(cè)模型可以準(zhǔn)確有效地預(yù)測(cè)血壓,可以大幅度提高傳統(tǒng)血壓測(cè)量的準(zhǔn)確性。樊海霞等[19]使用遺傳算法和主成分分析法改進(jìn)SVM學(xué)習(xí)模型,將PPG和心電信號(hào)等進(jìn)行處理,建立優(yōu)化后血壓預(yù)測(cè)模型,并通過水銀血壓計(jì)測(cè)得實(shí)時(shí)血壓值,以此作為對(duì)照的真值。結(jié)果表明,優(yōu)化后的預(yù)測(cè)模型其預(yù)測(cè)精度更高,能滿足不同人體特征的預(yù)測(cè),符合實(shí)際需求。Rong等[20]通過網(wǎng)絡(luò)攝像頭采集191名志愿者的面部視頻,然后利用成像光電體積掃記術(shù)從視頻中提取脈搏波信號(hào),共提取26種特征,隨后利用SVM等4種方法建立血壓預(yù)測(cè)模型,結(jié)果顯示SVM是最佳血壓預(yù)測(cè)模型,收縮壓和舒張壓的標(biāo)準(zhǔn)差和平均相對(duì)誤差都很小。整體而言,SVM方法在血壓預(yù)測(cè)方面的使用較少,主要原因是SVM方法較適用于小樣本數(shù)據(jù),當(dāng)今屬于大數(shù)據(jù)時(shí)代,數(shù)據(jù)量越來越大是大趨勢(shì)。但是SVM方法可以和其他方法相結(jié)合,這樣既能發(fā)揮出該方法的優(yōu)勢(shì),同時(shí)還能克服超出其限度的問題。因此,SVM方法對(duì)于血壓預(yù)測(cè)的研究還有較大的潛力。
隨機(jī)森林算法是基于決策樹的集成學(xué)習(xí)算法??梢詫Q策樹當(dāng)作一個(gè)樹狀的預(yù)測(cè)模型,而隨機(jī)森林算法則是將多個(gè)樹整合,利用整體進(jìn)行預(yù)測(cè)。該方法有著一定的抗噪聲能力,對(duì)于數(shù)據(jù)集的適應(yīng)能力也比較強(qiáng)。目前該方法已被廣泛應(yīng)用于各個(gè)領(lǐng)域。孟麗芳[21]基于重癥監(jiān)護(hù)醫(yī)療信息數(shù)據(jù)集,利用隨機(jī)森林算法等方法建立不同的血壓預(yù)測(cè)模型并對(duì)比預(yù)測(cè)結(jié)果,結(jié)果表明提出的預(yù)測(cè)方法和模型都能較好地提升血壓預(yù)測(cè)的精度。黃曉祥[22]采集55名志愿者的多種與血壓相關(guān)的生理參數(shù),將遺傳算法結(jié)合到隨機(jī)森林算法中,用以分析貢獻(xiàn)度較大的生理參數(shù),然后利用隨機(jī)森林算法建立血壓預(yù)測(cè)模型,并與SVM方法對(duì)比,結(jié)果顯示模型預(yù)測(cè)結(jié)果滿足AAMI的標(biāo)準(zhǔn),但是相對(duì)而言受試者量偏少,帶來的問題是預(yù)測(cè)模型的說服力不足,因此后續(xù)還需增加受試者數(shù)量。Chiang等[23]研究血壓與健康行為之間的關(guān)系,從可穿戴設(shè)備和家庭血壓監(jiān)測(cè)儀器中收集數(shù)據(jù),利用隨機(jī)森林算法建立預(yù)測(cè)模型,結(jié)果顯示該方法的血壓預(yù)測(cè)精度較高,并且能生成健康行為的個(gè)性化推薦。Zhou等[24]基于隨機(jī)森林算法和高斯核SVM回歸等8種機(jī)器學(xué)習(xí)方法,提取光電體積掃記圖的8個(gè)特征建立預(yù)測(cè)模型,并對(duì)收縮壓進(jìn)行預(yù)測(cè),結(jié)果顯示基于隨機(jī)森林算法回歸和高斯核SVM回歸的組合預(yù)測(cè)模型的預(yù)測(cè)精度最高??傮w而言,隨機(jī)森林算法在血壓預(yù)測(cè)的領(lǐng)域中應(yīng)用較為廣泛,預(yù)測(cè)性能較好,且擬合能力也比較強(qiáng)。但這里值得注意的是,上述的研究中建立的隨機(jī)森林算法血壓預(yù)測(cè)模型多數(shù)為短時(shí)間的血壓預(yù)測(cè)模型,在長(zhǎng)時(shí)間內(nèi)的血壓預(yù)測(cè)方面,還需要進(jìn)一步的驗(yàn)證。
貝葉斯學(xué)習(xí)算法是基于貝葉斯定理與特征條件獨(dú)立假設(shè)的分類方法,其基本原理是在已知先驗(yàn)概率與類條件概率的情況下獲得后驗(yàn)概率分布。目前在血壓預(yù)測(cè)領(lǐng)域,貝葉斯學(xué)習(xí)算法多數(shù)同其他機(jī)器學(xué)習(xí)算法一同應(yīng)用,并分析對(duì)比。馬文彬[25]將貝葉斯學(xué)習(xí)算法同隨機(jī)森林算法、SVM等方法共同構(gòu)建高血壓預(yù)測(cè)模型,然后利用多個(gè)指標(biāo)對(duì)這些預(yù)測(cè)模型進(jìn)行對(duì)比,最終發(fā)現(xiàn)隨機(jī)森林算法模型的各項(xiàng)指標(biāo)最好。孫斌等[26]運(yùn)用貝葉斯學(xué)習(xí)算法對(duì)極端梯度增強(qiáng)算法的超參數(shù)進(jìn)行尋優(yōu),建立優(yōu)化后的血壓預(yù)測(cè)模型,結(jié)果顯示,預(yù)測(cè)結(jié)果與水銀血壓計(jì)測(cè)得的結(jié)果有著良好的一致性。Zhu等[27]基于LSTM算法和貝葉斯學(xué)習(xí)算法,使用長(zhǎng)期環(huán)境參數(shù)建立高血壓疾病模型,以預(yù)測(cè)老年人在其環(huán)境建筑中的高血壓風(fēng)險(xiǎn),結(jié)果表明男性和女性的綜合環(huán)境風(fēng)險(xiǎn)不同,在單一環(huán)境因素下,男性的高收縮壓風(fēng)險(xiǎn)更高,而女性的高舒張壓和高血壓的風(fēng)險(xiǎn)更高。也有學(xué)者單獨(dú)基于貝葉斯學(xué)習(xí)算法進(jìn)行血壓預(yù)測(cè),Shen等[28]提出基于貝葉斯模型平均方法的無袖血壓預(yù)測(cè)模型,以減少其中的不確定性??傮w而言,國(guó)內(nèi)貝葉斯學(xué)習(xí)算法在血壓預(yù)測(cè)方面的應(yīng)用還較少,但是考慮到該方法有著穩(wěn)定的分類效率且能處理多分類任務(wù),因此該方法在血壓預(yù)測(cè)領(lǐng)域還是有必要進(jìn)行更加深入的研究。
相對(duì)而言,機(jī)器學(xué)習(xí)方法在血壓預(yù)測(cè)領(lǐng)域的研究處于迅速發(fā)展的階段,有著良好的應(yīng)用和發(fā)展前景,而且該方法血壓預(yù)測(cè)領(lǐng)域的應(yīng)用對(duì)于醫(yī)護(hù)工作者能起到良好的輔助作用,因此有必要加強(qiáng)醫(yī)護(hù)工作者對(duì)其的認(rèn)知,提升機(jī)器學(xué)習(xí)的相關(guān)能力。目前機(jī)器學(xué)習(xí)方法有多種,包括神經(jīng)網(wǎng)絡(luò)方法、SVM、隨機(jī)森林算法、貝葉斯學(xué)習(xí)算法等,在血壓預(yù)測(cè)領(lǐng)域獲得較好應(yīng)用。伴隨而來的也存在一些不足之處,比如考慮到實(shí)際的臨床情況和數(shù)據(jù)特征,單一的機(jī)器學(xué)習(xí)方法不具備普適性,因此,有必要去探尋更多其他種類的機(jī)器學(xué)習(xí)算法在該領(lǐng)域的適用性。除此之外,在該領(lǐng)域中多數(shù)使用的還是機(jī)器學(xué)習(xí)中有監(jiān)督學(xué)習(xí)的方法,而無監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的應(yīng)用較少,后續(xù)的研究可考慮將這兩類方法應(yīng)用在血壓預(yù)測(cè)中。