李帆 程云章 邊俊杰
摘 要:為通過光電容積脈搏波信號獲取動(dòng)脈血壓參數(shù),并將其作為判斷個(gè)人健康狀況的依據(jù),基于Tensorflow框架訓(xùn)練LSTM網(wǎng)絡(luò)模型與傳統(tǒng)RNN模型,使用625 000條光電容積脈搏波數(shù)據(jù)序列通過忘記、選擇記憶、輸出階段得出符合生理規(guī)律的血壓參數(shù),將兩種模型放在125 000條樣本的測試集中進(jìn)行有效性驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,訓(xùn)練后的LSTM模型對血壓的預(yù)測比傳統(tǒng)RNN模型更準(zhǔn)確,LSTM預(yù)測評價(jià)指標(biāo)MAE、RMSE、STD和R2_score分別為4.05、8.78、7.42和0.89,且預(yù)測結(jié)果符合美國醫(yī)療儀器促進(jìn)協(xié)會(huì)標(biāo)準(zhǔn)(MAE<5mmHg,STD<8mmHg),而傳統(tǒng)RNN模型則為11.58、17.03、14.54和0.73。LSTM模型能較好地預(yù)測血壓參數(shù),在生物醫(yī)學(xué)領(lǐng)域有較高的應(yīng)用價(jià)值,其效果優(yōu)于傳統(tǒng)RNN模型。
關(guān)鍵詞:同步血壓預(yù)測;PPG信號;LSTM網(wǎng)絡(luò);循環(huán)神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí)
DOI:10. 11907/rjdk. 192606 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
中圖分類號:TP312文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2020)008-0044-05
Abstract: In order to obtain the parameters of arterial blood pressure through the photoplethysmography signal, which is the basis of judging personal health status,the LSTM network model and the traditional RNN model were trained based on tensorflow framework, and 625 000 photoplethysmography data sequences were used to obtain the blood pressure parameters that conform to the physiological rules through forgetting, selecting memory and outputting stages, and the validity of the two models was verified in 125 000 sample test sets. The experimental results showed that the prediction of blood pressure of the trained LSTM model was more accurate than that of the traditional RNN model. The MAE, RMSE, STD and R2_score of LSTM were 4.05, 8.78, 7.42 and 0.89 respectively, and the prediction results were in line with the standards (MAE < 5mmhg, STD < 8mmhg) proposed by the American Association for the promotion of medical instruments, while the traditional RNN model was 11.58, 17.03, 14.54 and 0.73. The results show that LSTM model can predict the parameters of blood pressure better and has higher application value in biomedical field, and the effect is better than the traditional RNN model.
Key Words: synchronous blood pressure prediction; photoplethysmography signal; LSTM network; recurrent neural network; deep learning
0 引言
血壓(Blood Pressure,BP)是表征人類身體狀況的重要生理指標(biāo)之一,也是防治心血管疾病的重要血流動(dòng)力學(xué)參數(shù)。持續(xù)較高水平血壓會(huì)誘發(fā)中風(fēng)、心肌梗死等心血管疾病[1]。因此對于該類人群的持續(xù)血壓監(jiān)測十分重要,可預(yù)見、方便、低成本的連續(xù)無創(chuàng)血壓監(jiān)測的重要性日益凸顯。
傳統(tǒng)侵入式血壓測量雖然測量結(jié)果精確,且其中動(dòng)脈插管法被譽(yù)為“金標(biāo)準(zhǔn)”[2],但因?qū)颊邆Υ?、操作?fù)雜等原因逐漸被無創(chuàng)方式取代。無創(chuàng)測量也分為間歇式和連續(xù)式,其中間歇式有柯氏音法和示波法等,連續(xù)式有扁平張力法、恒定容積法和脈搏波傳遞時(shí)間測量法等[3]。
以扁平張力法為原理的產(chǎn)品,如浙江善時(shí)醫(yī)療公司的T-Line系列[4],雖然可測得實(shí)現(xiàn)較長時(shí)間連續(xù)的人體血壓,結(jié)果較準(zhǔn)確,但在使用中需長時(shí)間定位在一個(gè)位置,壓力傳感器難以保證位置不會(huì)有偏差,同時(shí)長時(shí)間壓迫手腕使受試者感覺不舒適;而以恒定容積法為原理的袖帶式測量則不便于長時(shí)間觀測血壓,且會(huì)壓迫大臂,同樣產(chǎn)生不適。
近年來,利用機(jī)器學(xué)習(xí)[5]算法進(jìn)行血壓測量的方法逐漸興起。2005年,Kim 等[6]綜合考慮了PTT、體重、身高、體質(zhì)比、臂長等不同的生理因素,挑選出兩個(gè)與血壓相關(guān)性最高的特征,然后將這兩個(gè)特征輸入到人工神經(jīng)網(wǎng)絡(luò)中建立血壓估算模型,其精度高于線性和非線性回歸方法;2016年,Kachue 等[7從ECG(Electrocardiogram)和PPG(photoplethysmography)信號中提取許多生理參數(shù)并進(jìn)行多重回歸,然后采用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到了不錯(cuò)的結(jié)果;2016年,He等[8]通過隨機(jī)森林的方法篩選有用特征,結(jié)果發(fā)現(xiàn)隨機(jī)森林方法優(yōu)于線性回歸以及普通的PTT模型。總的來說,使用機(jī)器學(xué)習(xí)方法訓(xùn)練的血壓模型在一定程度上提高了估計(jì)精度,然而該方法目前最大阻礙是找到合適的特征集合,并且計(jì)算機(jī)模型背后的潛在機(jī)制尚不明確,有待進(jìn)一步研究。
由于PPG信號與動(dòng)脈血壓值均是與時(shí)間有強(qiáng)烈關(guān)聯(lián)性的數(shù)據(jù),且兩者本身有明顯的呼應(yīng)關(guān)系,所以可采用深度學(xué)習(xí)算法中對存在規(guī)律的時(shí)間序列有良好處理能力的傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)模型[9]。通過已知PPG信號同步預(yù)測血壓值,從而避免傳統(tǒng)血壓監(jiān)測方法繁瑣的操作與帶給受試者的不適感。但由于傳統(tǒng)RNN模型在前向傳播過程中只能考慮最近時(shí)刻的生理狀態(tài),然而血壓預(yù)測需全面考慮先前的多種生理狀態(tài),所以本文采用RNN的變種——長短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)模型[10]。LSTM可決定之前的哪些狀態(tài)需被強(qiáng)化或弱化,完全符合血壓預(yù)測的真實(shí)狀況。本文將系統(tǒng)介紹PPG信號原理與LSTM網(wǎng)絡(luò)原理,分析實(shí)驗(yàn)結(jié)果并提出改進(jìn)之處。
1 PPG信號數(shù)據(jù)集
1.1 PPG信號原理
PPG信號是通過光電容積脈搏波描計(jì)法獲得的一種波形信號,其測量原理為:將光照射到皮膚表面,由于人體組織(肌肉、皮膚等)可吸收光從而削減光強(qiáng),光電探測器接收到的光強(qiáng)減弱,整個(gè)血液循環(huán)過程中減弱的光強(qiáng)值是穩(wěn)定的。因此,當(dāng)血液隨心臟搏動(dòng)呈現(xiàn)出容積變化時(shí),接收到的光強(qiáng)也呈同步脈動(dòng)變化,將接收到的這種光強(qiáng)信號轉(zhuǎn)換為電信號,即為光電容積脈搏波[11]。其理論基礎(chǔ)是朗伯·比爾定律[12],其關(guān)系式為:
其中,A為吸光度,I0為入射光光強(qiáng),It為被介質(zhì)吸收后透射光光強(qiáng),K為吸收系數(shù),l為吸收介質(zhì)厚度,c表示吸光物質(zhì)濃度。
由于人體指端血流感受面積大,測量靈活方便,因此光電容積脈搏波描計(jì)法通常通過測量指端血流吸光度獲得PPG信號。
1.2 數(shù)據(jù)預(yù)處理
本文使用麻省理工學(xué)院計(jì)算生理學(xué)實(shí)驗(yàn)室提供的多參數(shù)重癥監(jiān)護(hù)智能監(jiān)測(Multi-parameter Intelligent Monitoring in Intensive Care,MIMIC-II)在線波形數(shù)據(jù)庫[13]作為實(shí)驗(yàn)數(shù)據(jù)集。2001—2008年期間,各醫(yī)院監(jiān)測員記錄了心血管病患者上千萬個(gè)血流動(dòng)力學(xué)參數(shù),波形信號以125 Hz的頻率、至少8位精度采樣。本實(shí)驗(yàn)從該數(shù)據(jù)庫中提取了2組共約75萬個(gè)PPG、動(dòng)脈血壓(ABP)數(shù)字信號共6 000秒采樣時(shí)間,分別作為訓(xùn)練集與測試集。
由于MIMIC數(shù)據(jù)庫信號包含了大量失真和偽影部分,導(dǎo)致最終結(jié)果誤差巨大,所以為了使神經(jīng)網(wǎng)絡(luò)能準(zhǔn)確提取出數(shù)據(jù)特征,首先通過預(yù)處理進(jìn)行去噪。預(yù)處理總體思路是將數(shù)據(jù)集按照同一標(biāo)準(zhǔn)分割成若干波形段,然后對每個(gè)波形段進(jìn)行包含4個(gè)步驟的處理:①使用簡單的平均濾波器平滑所有信號;②去除明顯不合邏輯的動(dòng)脈壓值;③去除嚴(yán)重不連續(xù)信號;④計(jì)算PPG信號的自相關(guān)度,即波段間的相似度,并去除產(chǎn)生數(shù)值突變的信號。
數(shù)據(jù)集均經(jīng)過以上步驟處理后方可劃分成神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集與測試集。處理后的PPG信號與ABP信號如圖1、圖2所示。
1.3 PPG信號特征
PPG信號中包含大量與血壓相關(guān)的特征,這些特征會(huì)幫助LSTM網(wǎng)絡(luò)提高預(yù)測精度。將單個(gè)周期PPG信號波形數(shù)據(jù)歸一化至[0,1]區(qū)間內(nèi),可得如圖3所示特征。
LSTM內(nèi)部結(jié)構(gòu)如上所述,通過門控狀態(tài)控制傳輸狀態(tài),記住需要長時(shí)間記憶的,忘記不重要的信息,而普通RNN只能以僅有的一種記憶疊加方式。LSTM對很多需要“長期記憶”的任務(wù),如血壓監(jiān)測、股價(jià)預(yù)測等優(yōu)勢尤為突出。
2.2.3 LSTM網(wǎng)絡(luò)參數(shù)調(diào)節(jié)
數(shù)據(jù)集預(yù)處理后,使用默認(rèn)的超參數(shù)設(shè)置,觀察loss的變化,初步定下各個(gè)超參數(shù)范圍,再依次進(jìn)行調(diào)參。本實(shí)驗(yàn)遇到的loss變化主要為train loss不斷減小,test loss不斷增大,是較為明顯的過擬合現(xiàn)象,即模型已記住所有訓(xùn)練數(shù)據(jù),對訓(xùn)練集數(shù)據(jù)預(yù)測效果非常好,但對測試集數(shù)據(jù)的預(yù)測效果非常差。由于數(shù)據(jù)集已經(jīng)過預(yù)處理并且樣本量足夠,實(shí)驗(yàn)將采取以下兩種解決方法。
(1)使用L2正則化。正則化方法包括L0、L1和L2正則,LSTM通常使用L2正則。正則一般是在目標(biāo)函數(shù)之后加上對象范數(shù),L2范數(shù)指先求向量各元素平方和然后求平方根,可使應(yīng)受懲罰影響的權(quán)重W的每個(gè)元素都加劇減小且不等于0。更小的W意味著模型復(fù)雜度更低,適用于訓(xùn)練數(shù)據(jù)擬合,不會(huì)過分?jǐn)M合訓(xùn)練數(shù)據(jù),避免過擬合,從而提高模型泛化能力。
(2)使用Dropout。Dropout方法在神經(jīng)網(wǎng)絡(luò)中十分常見,該方法在訓(xùn)練時(shí)讓神經(jīng)元以一定概率不工作,即在訓(xùn)練時(shí)以一定概率P跳過指定百分比數(shù)量的神經(jīng)元。
3 實(shí)驗(yàn)結(jié)果與分析
3.1 訓(xùn)練過程
整個(gè)LSTM網(wǎng)絡(luò)訓(xùn)練過程預(yù)測值與真實(shí)值對比如圖8所示,可明顯看出訓(xùn)練前期預(yù)測值與真實(shí)值差距較大,隨著訓(xùn)練樣本的不斷增多,預(yù)測值與真實(shí)值重合度越來越大,模型準(zhǔn)確率也越來越高。
3.2 評價(jià)指標(biāo)
LSTM網(wǎng)絡(luò)與傳統(tǒng)RNN測試集中模型結(jié)果各項(xiàng)指標(biāo)對照如表1所示,指標(biāo)包括:平均絕對誤差(MAE)、均方根誤差(RMSE)、標(biāo)準(zhǔn)差(STD)、R2值(R2_score),圖9進(jìn)一步展示了兩種模型四大指標(biāo)實(shí)時(shí)對比曲線,顯然LSTM網(wǎng)絡(luò)在同一測試集中各項(xiàng)指數(shù)均表現(xiàn)更佳。同時(shí)LSTM測試指標(biāo)中平均絕對誤差不大于5mmHg,標(biāo)準(zhǔn)差不大于8mmHg,符合美國醫(yī)療儀器促進(jìn)協(xié)會(huì)(AAMI)提出的標(biāo)準(zhǔn),模型可靠性得到證明。
本實(shí)驗(yàn)中平均絕對誤差(MAE)反映ABP預(yù)測誤差實(shí)際大小。均方根誤差(RMSE)衡量ABP預(yù)測值同真值之間的偏差。標(biāo)準(zhǔn)差(STD)反映了ABP誤差值離散程度。R2值(R2_score)表示ABP預(yù)測值與真值的擬合優(yōu)度,R2_score=1,達(dá)到最大值,意味著樣本中預(yù)測值和真實(shí)值完全相等,沒有任何誤差,模型最為理想,此后小于1且越遠(yuǎn)離1即意味著預(yù)測值與真實(shí)值相差越多,模型越差。
3.3 誤差分布
LSTM與RNN誤差數(shù)值頻數(shù)分布如圖10所示。RNN模型訓(xùn)練在測試集中誤差多集中在-10~10mmHg,而LSTM模型則更多集中在-5~5mmHg。且RNN誤差在-20mmHg之前以及10mmHg之后仍有一定量分布,而LSTM則基本沒有。
4 結(jié)語
無創(chuàng)血壓預(yù)測方法雖然有很多種,但多數(shù)存在一定缺陷,例如數(shù)據(jù)樣本少導(dǎo)致不同受試者預(yù)測結(jié)果差異巨大[18]、更換受試者需要不斷校準(zhǔn)[19]等問題。本文方法利用神經(jīng)網(wǎng)絡(luò)結(jié)合大數(shù)據(jù)很好地解決了這些問題,同時(shí)為穩(wěn)定、免校準(zhǔn)的血壓估計(jì)提供了足夠的實(shí)驗(yàn)支持。另外,本文使用的MIMIC-II數(shù)據(jù)庫包含從醫(yī)院獲得的臨床數(shù)據(jù),由于對患者隱私的保護(hù),缺少一些有價(jià)值的參數(shù),例如年齡和身高,如能將這些重要特征添加到神經(jīng)網(wǎng)絡(luò)輸入中,將獲得更準(zhǔn)確的結(jié)果。
參考文獻(xiàn):
[1] LIM S S, VOS T, FLAXMAN A D, et al. A comparative risk assessment of burden of disease and injury attributable to 67 risk factors and risk factor clusters in 21 regions, 1990-2010: a systematic analysis for the Global Burden of Disease Study 2010 [J]. The Lancet, 2012, 380(9859): 2224-2260.
[2] KASHANI A, DOYLE M, HORTON M, et al. Direct innominate artery cannulation as a sole systemic and cerebral perfusion technique in aortic surgery[J]. Heart Lung Circ, 2019, 28(4): 67-70.
[3] 李頂立. 基于脈搏波的無創(chuàng)連續(xù)血壓測量方法研究[D]. 杭州:浙江大學(xué), 2008.
[4] DUECK R,GOEDJE O,CLOPTON P. Noninvasive continuous beat-to-beat radial artery pressure via TL-200 applanation tonometry [J]. Journal of Clinical Monitoring Computation, 2012, 26(2): 75-83.
[5] 周志華. 機(jī)器學(xué)習(xí)[M]. 北京: 清華大學(xué)出版社,2016.
[6] KIM J Y, CHO B H, IM S M, et al. Comparative study on artificial neural network with multiple regressions for continuous estimation of blood pressure [C]. Proceedings of the 27th IEEE Annual Conference of Engineering in Medicine and Biology, 2005: 6942-6945.
[7] XING X M, SUN M S. Optical blood pressure estimation with photoplethysmography and FFT-based neural networks [J]. Biomed Opt Express, 2016, 7(8): 3007-3020.
[8] HE R, HUANG Z P, JI L Y, et al. Beat-to-beat ambulatory blood pressure estimation based on random forest [C]. Proceedings of the 13th IEEE ?International Conference on Wearable and Implantable Body Sensor Networks , 2016: 194-198.
[9] 王敏, 曾浩. 循環(huán)神經(jīng)網(wǎng)絡(luò)語言模型定點(diǎn)化優(yōu)化算法研究 [J]. 軟件導(dǎo)刊, 2017, 16(2): 63-66.
[10] 李佳, 黃之豪, 陳冬蘭. 基于 LSTM 等深度學(xué)習(xí)方法的股指預(yù)測研究 [J]. 軟件導(dǎo)刊, 2019, 18(9): 17-21.
[11] DING X R, ZHANG Y T, LIU J, et al. Continuous cuffless blood pressure estimation using pulse transit time and photoplethysmogram intensity ratio [J]. IEEE Transactions on Biomedical Engineering, 2016, 63(5): 964-972.
[12] MOSOROV V. The Lambert-Beer law in time domain form and its application [J]. Applied Radiation and Isotopes,2017,128(10): 1-5.
[13] SAEED M, VILLARROEL M, REISNER A, et al. Multiparameter intelligent monitoring in intensive care II: a public-access intensive care unit database[J]. Critical Care Medicine,2011, 39(5): 952-960.
[14] ELGENDI M. On the analysis of fingertip photoplethysmogram signals [J]. Current Cardiology Reviews, 2012, 8(1): 14-25.
[15] PALOMBO C, KOZAKOVA M. Arterial stiffness is associated with adipokine dysregulation in non-hypertensive obese mice [J]. Vascul Pharmacol, 77(2): 1-7.
[16] TAI K S, SOCHER R, MANNING C D. Improved semantic representations from tree-structured long short-term memory networks [DB/OL]. https://arxiv.org/abs/1503.00075.
[17] HOCHREITER S,SCHMIDHUBER J. Long short-term memory [J]. Neural Computation, 1997, 9(8): 1735-1780.
[18] GESCHE H, GROSSKURTH D, KUCHLER G, et al. Continuous blood pressure measurement by using the pulse transit time: comparison to a cuff-based method [J]. European Journal of Applied Physiology, 2012, 112(1): 309-315.
[19] WONG M Y, POON C C, ZHANG Y T. An evaluation of the cuffless blood pressure estimation based on pulse transit time technique: a half year study on normotensive subjects [J]. Cardiovascular Engineering, 2009, 9(1): 32-38.
(責(zé)任編輯:江 艷)