陳森路,劉育梁*,徐團(tuán)偉
(1. 中國(guó)科學(xué)院 半導(dǎo)體研究所 光電系統(tǒng)實(shí)驗(yàn)室,北京 100083;2. 中國(guó)科學(xué)院大學(xué) 材料與光電研發(fā)中心,北京 100049)
心率是指心臟一分鐘跳動(dòng)的次數(shù),是最重要的人體參數(shù)之一。心率數(shù)值是重要的生理指標(biāo),正常的心率在60~100 次/分,心率過(guò)高和過(guò)低都是異常表現(xiàn)[1]。實(shí)時(shí)監(jiān)測(cè)心率可以應(yīng)用于心血管病的預(yù)防和治療。目前,心率測(cè)量的標(biāo)準(zhǔn)方法是心電圖法,但是心電圖需要使用電極接觸皮膚,會(huì)對(duì)人體產(chǎn)生不適,并且不適合皮膚病患者和嬰幼兒人群。以光電容積脈搏波(Photoplethysmo graphy,PPG)技術(shù)為基礎(chǔ)的心率測(cè)量是合適的替代方法。PPG 是一種低成本的非侵入性技術(shù),測(cè)量由于血管容積變化導(dǎo)致的透射或者反射光強(qiáng)度變化,實(shí)現(xiàn)心率監(jiān)測(cè)、血氧監(jiān)測(cè)和血壓測(cè)量[2]。傳統(tǒng)的接觸式PPG 需要專(zhuān)用的光源和接觸式探頭,而基于人臉視頻的非接觸PPG 技術(shù)則僅使用數(shù)碼相機(jī)來(lái)實(shí)現(xiàn)PPG 功能,無(wú)需接觸探針和專(zhuān)用光源,實(shí)現(xiàn)舒適的心率監(jiān)測(cè),相對(duì)于接觸式設(shè)備具有操作方便的優(yōu)點(diǎn)。
Verkruysse[3]發(fā) 現(xiàn) 人 臉 視 頻 的 像 素 變 化 可 以用于估計(jì)心率。Poh[4]研究出從人臉視頻提取PPG 的通用框架,選取人臉視頻的中部區(qū)域作為感興趣區(qū)域(Region of Interest,ROI),統(tǒng)計(jì)該區(qū)域的像素均值得到源信號(hào),處理源信號(hào)得到非接觸PPG 信號(hào)和心率?;赗OI 的方法旨在從錄制的視頻中選擇良好的ROI,提供更高質(zhì)量的非接觸PPG 信號(hào)。但是,由于頭發(fā)密度,表皮厚度,毛細(xì)血管密度和面部特征等的差異,不同皮膚區(qū)域攜帶的PPG 信號(hào)的質(zhì)量也不同。研究發(fā)現(xiàn),選取額頭和兩側(cè)臉頰作為ROI 的非接觸PPG 信號(hào)與接觸式PPG 信號(hào)的相關(guān)度更高[5-11]。許多研究以此為基礎(chǔ)對(duì)源信號(hào)處理方法進(jìn)行改進(jìn),Wei[5]使用多種盲源分離算法處理源信號(hào)提取心率,誤差均值在2~3 次/分之間,Macwan[7]使用自相關(guān)系數(shù)改良獨(dú)立成分分析(Independent Component Analysis,ICA)算法處理原始像素序列,心率誤差均值為3.34 次/分,Tulyakov[12]使用矩陣補(bǔ)全的思想對(duì)臉頰ROI 的源信號(hào)處理得到心率,心率誤差為(3.19±5.81)次/分。王蒙軍[13]使用基于對(duì)角累積量算法處理人臉中部ROI 得到心率。此外,由于皮膚包含的信號(hào)質(zhì)量高于非皮膚區(qū)域,李曉媛[14]通過(guò)皮膚檢測(cè)選擇所有皮膚區(qū)域作為ROI 獲取源信號(hào)后處理,誤差均值在1~2 次/分之間。
現(xiàn)有研究都集中于PPG 信號(hào)提取方法的優(yōu)化上,存在心率誤差相對(duì)較大、PPG 質(zhì)量不高的缺點(diǎn)。對(duì)于ROI 選擇的研究較少,缺乏一種有效的方法來(lái)定量評(píng)估不同面部區(qū)域上的非接觸PPG 信號(hào)的質(zhì)量,以進(jìn)行ROI 選擇,從提升源信號(hào)質(zhì)量的角度來(lái)提高心率的準(zhǔn)確率。不同的面部皮膚區(qū)域提供不同質(zhì)量的非接觸PPG 信號(hào),通過(guò)計(jì)算非接觸PPG 信號(hào)在面部上的質(zhì)量分布和各區(qū)域的相關(guān)程度,從包含高質(zhì)量非接觸PPG 信號(hào)和內(nèi)部相關(guān)性高的面部區(qū)域中提取PPG 信號(hào),可以改善最終的非接觸PPG 信號(hào)質(zhì)量。
本文提出一種基于獨(dú)立向量分析(Independent Vector Analysis,IVA)和歸一化分割的方法(Normalized Cuts,Ncuts)實(shí)現(xiàn)自適應(yīng)ROI 選取,提高非接觸PPG 信號(hào)質(zhì)量與心率的準(zhǔn)確率。使用IVA 實(shí)現(xiàn)人臉的多區(qū)塊盲源分離,再通過(guò)歸一化分割算法根據(jù)源信號(hào)的信噪比和相關(guān)程度選定自適應(yīng)ROI,進(jìn)而提取心率和非接觸PPG 信號(hào),通過(guò)實(shí)驗(yàn)對(duì)比靜止和運(yùn)動(dòng)狀態(tài)下自適應(yīng)ROI方法與其他ROI 方法的誤差,結(jié)果表明自適應(yīng)ROI 方法能夠顯著提高心率的準(zhǔn)確率。進(jìn)一步對(duì)比與接觸式PPG 方法的一致程度,發(fā)現(xiàn)該方法與標(biāo)準(zhǔn)方法的一致性高,可用于日常和醫(yī)療場(chǎng)景,最后對(duì)比多種方法的非接觸PPG 信號(hào)的質(zhì)量,表明該方法明顯提高PPG 信號(hào)的質(zhì)量,可以進(jìn)一步用于PPG 特征提取。
PPG 信號(hào)的原理為心臟的舒張與收縮會(huì)導(dǎo)致血液容積的周期性變化,皮膚反射和透射的光的強(qiáng)度也隨之周期性變化。人體臉部皮下毛細(xì)血管豐富,通過(guò)錄制視頻提取面部像素的變化,經(jīng)過(guò)算法處理可以得到非接觸PPG 信號(hào)。
非接觸心率與PPG 信號(hào)獲取的方法流程如圖1 所示。它包括區(qū)域劃分和空間均值,獨(dú)立向量分析和信號(hào)篩選,基于歸一化分割算法的自適應(yīng)ROI 選定和PPG 信號(hào)獲取。
圖1 非接觸心率和PPG 信號(hào)提取的流程Fig.1 Flow chart for obtaining non-contact heart rate and PPG signal
錄制人臉視頻后,在每一幀圖像中使用Viola-Jones 算法對(duì)人臉進(jìn)行識(shí)別與跟蹤,獲得人臉區(qū)域后,使用開(kāi)源圖像處理庫(kù)Opencv 和Dlib 的人臉檢測(cè)記錄特征點(diǎn),根據(jù)特征點(diǎn)定位人臉的正中區(qū)域,劃分為4×4 的小區(qū)塊。初始ROI 區(qū)域的選取范圍不小于人臉的60%。選取面積過(guò)小對(duì)實(shí)驗(yàn)結(jié)果有兩方面的影響:(1)相鄰幀之間的特征點(diǎn)存在偏差,ROI 位置相對(duì)人臉存在不穩(wěn)定性;(2)可能缺失含有高質(zhì)量PPG 信號(hào)的區(qū)域。
如圖2 所示,根據(jù)68 個(gè)人臉特征點(diǎn)獲取初始ROI。首先計(jì)算眼部基線(xiàn)和眉毛基線(xiàn)的縱坐標(biāo)yeye和yeyebow,分別為:
圖2 初始ROI 獲取Fig.2 Obtain of initial ROI
式中p(i)x代表第i個(gè)特征點(diǎn)的橫坐標(biāo)。
通過(guò)皮膚檢測(cè)得到皮膚區(qū)域的掩碼,將RGB空間轉(zhuǎn)換成YCbCr 空間(使用Opencv 庫(kù)函數(shù)cvtcolor()),Y,Cb,和Cr 像素判斷依據(jù)為:
將原始圖像與皮膚掩碼與值運(yùn)算后,計(jì)算各小區(qū)塊不為0 的像素平均值,得到初始信號(hào)。對(duì)于缺失人臉圖像的幀,使用上一幀的位置信息劃分。針對(duì)人臉位姿傾斜的情況,通過(guò)眼部的基線(xiàn)矯正位姿至水平,再進(jìn)行區(qū)域劃分,整個(gè)過(guò)程如圖3 所示。
圖3 分區(qū)域初始信號(hào)獲取Fig.3 Acquisition of raw signal by divided block
2.2.1 獨(dú)立向量分析
ICA 是一種利用統(tǒng)計(jì)原理進(jìn)行信號(hào)處理的方法。通過(guò)線(xiàn)性變化變換把數(shù)據(jù)或信號(hào)分離成非高斯的信號(hào)組合。在單區(qū)域的PPG 提取處理中得到較好的結(jié)果[4,9,13],但對(duì)于將人臉?lè)譃槎鄥^(qū)域的源信號(hào)的場(chǎng)景,ICA 存在輸出信號(hào)順序不確定的缺點(diǎn)。為解決此問(wèn)題,本文應(yīng)用聯(lián)合盲源分離的思想采用IVA[15]的方法處理2.1 中得到的多區(qū)塊的統(tǒng)計(jì)信號(hào)。
假定有K個(gè)觀測(cè)數(shù)據(jù)集合,x[]k∈RL×N表示第k個(gè)觀測(cè)數(shù)據(jù)集合,L表示變量個(gè)數(shù),N代表采樣點(diǎn)數(shù)(在本文中L=3,對(duì)應(yīng)RGB 的3 個(gè)通道,N對(duì)應(yīng)視頻的總幀數(shù),K=16 對(duì)應(yīng)16 個(gè)數(shù)據(jù)集合),IVA 可以寫(xiě)成多個(gè)盲源分離的組合:
通過(guò)聯(lián)合盲源分離處理各區(qū)塊的觀測(cè)信號(hào),保證輸出的每部分信號(hào)都是按順序?qū)?yīng)的,從而更準(zhǔn)確地篩選PPG 信號(hào)。如圖4 所示,受篇幅所限,只畫(huà)出前3 個(gè)區(qū)塊經(jīng)過(guò)IVA 分離后的對(duì)應(yīng)結(jié)果,每列的3 個(gè)信號(hào)為同一區(qū)域的RGB 初始信號(hào)經(jīng)過(guò)IVA 得到。
圖4 同一區(qū)域的RGB 初始信號(hào)經(jīng)過(guò)獨(dú)立向量分析處理的結(jié)果Fig.4 Result for RGB initial signals in same area after independent vector analysis processing
POH[4]使 用ICA 后 的 第2 個(gè) 信 號(hào) 作 為PPG信號(hào),這種方法具有明顯缺陷,因?yàn)镮CA 的結(jié)果的順序是不固定的,本文使用信噪比來(lái)篩選出PPG 信號(hào)。
2.2.2 信號(hào)篩選
PPG 信號(hào)具有較強(qiáng)的周期性,頻率與心率重疊,因此以心率所在頻率附近的功率為有效功率[16]定義信噪比(Signal Noise Ratio,SNR),得到:
式中:S(fall)表示該信號(hào)全頻率波段的功率,S(fPPG)表示PPG 信號(hào)的功率,定為0.6~3.0 Hz。經(jīng)過(guò)IVA 處理后,針對(duì)每一個(gè)原信號(hào)集合s?[m],計(jì)算每個(gè)成分的信噪比,標(biāo)記信噪比最高的信號(hào)的序號(hào),以該序號(hào)作為PPG 在原始信號(hào)集合的序號(hào)。該方法基于這樣一個(gè)事實(shí),在計(jì)算信噪比的過(guò)程中,信噪比最高的成分在該集合的序號(hào)等于大部分原始信號(hào)集合中信噪比最高的成分的序號(hào)。
2.3.1 原理
在圖論中,圖的分割定義為[17]:將一個(gè)圖G(V,E) 劃 分 為 兩 個(gè) 集 合A,B滿(mǎn) 足A∪B=V,A∩B=?,圖分割的目標(biāo)為使得兩個(gè)集合的相異度cut(A,B)最小的集合解。
式中w(u,v)表示兩個(gè)成員之間的權(quán)重。但是僅使用cut(A,B)作為評(píng)判標(biāo)準(zhǔn),很容易導(dǎo)致局部最優(yōu)而在非全局最優(yōu)的解,因此在歸一化圖分割算法中引入新的標(biāo)準(zhǔn)歸一化分割[17],即有:
衡量該部分與整個(gè)圖的所有點(diǎn)的連接度,通過(guò)引入一個(gè)全局的度量找到全局最優(yōu)解。歸一化分割在滿(mǎn)足圖分割的目標(biāo)的同時(shí)也要求同一子集間點(diǎn)的權(quán)重和最大,適用于選取多個(gè)小區(qū)域組合為自適應(yīng)ROI。
2.3.2 自適應(yīng)ROI 選定
使用歸一化分割方法處理篩選后的PPG 信號(hào),兩個(gè)PPG 信號(hào)a(t)和b(t)的權(quán)重定義為:式中:ρa(bǔ),b表示皮爾遜相關(guān)系數(shù),SNR表示該信號(hào)的信噪比,γ為調(diào)整系數(shù),r=1。選取信號(hào)個(gè)數(shù)最多的一組信號(hào)為輸出,根據(jù)該組信號(hào)與視頻對(duì)應(yīng)的區(qū)域組合,作為自適應(yīng)ROI。
本次處理中,輸入信號(hào)的個(gè)數(shù)為16,經(jīng)過(guò)歸一化分割處理后得到6 個(gè)集群。其中最大的集群中含有4 個(gè)信號(hào),圖5(a)為該集群的4 個(gè)原始信號(hào)的波形,圖5(b)對(duì)應(yīng)每一個(gè)信號(hào)的傅里葉變換頻譜圖。從頻譜圖可以發(fā)現(xiàn),除去骨骼肌肉組織對(duì)應(yīng)的低頻強(qiáng)度外,所有信號(hào)在1 Hz 左右對(duì)應(yīng)于PPG 頻率的頻譜峰值f相等,表明該組信號(hào)之間的相關(guān)性更優(yōu)。求出每個(gè)信號(hào)在0.8~3.0 Hz 的波峰頻率fhr,計(jì)算心率得到:
圖5 歸一化分割結(jié)果Fig.5 Result of normalized cuts
式中HR表示心率。計(jì)算集群心率的平均值得到最終心率。然后,標(biāo)記該組每個(gè)信號(hào)所對(duì)應(yīng)的區(qū)域作為ROI,作為自適應(yīng)的ROI,如圖6 所示。
圖6 自適應(yīng)ROI 選定Fig.6 Select adaptive ROI
通過(guò)歸一化分割確定最大集群后,將集群中所有信號(hào)按照對(duì)應(yīng)區(qū)域的像素?cái)?shù)量加權(quán)平均得到源PPG 信號(hào),通過(guò)0.6~3.0 Hz 的帶通濾波處理即得到非接觸PPG 信號(hào)。
使用網(wǎng)絡(luò)攝像頭(480 pixel,30 frame/s)攝像頭正對(duì)實(shí)驗(yàn)參與人員,距離鏡頭約25 cm,在外部光源穩(wěn)定的情況下錄制30 s 視頻,同時(shí)使用右手的食指尖通過(guò)指尖PPG 儀器記錄心率和接觸式PPG 信號(hào)。實(shí)驗(yàn)參與人員13 名(8 名男性,5 名女性),每人錄制10 次,隨后參與者在頭部緩慢運(yùn)動(dòng)情況下錄制10 次視頻,運(yùn)動(dòng)路徑為在鏡頭內(nèi)在水平和垂直方向緩慢移動(dòng),共得到130 段靜止情況下的視頻和130 段運(yùn)動(dòng)情況的視頻。
使用自適應(yīng)ROI、Sun[14]方法(選定人臉中部區(qū)域,通過(guò)主成分分析得到PPG 信號(hào))和皮膚掩碼 方 法[18]計(jì) 算 心 率HRcal,與PPG 儀 器 測(cè) 量 得 到的心率HRstd做對(duì)比,計(jì)算實(shí)驗(yàn)誤差HRerr=HRstd-HRcal。計(jì)算誤差的統(tǒng)計(jì)數(shù)據(jù)包括心率誤差的均值μ,標(biāo)準(zhǔn)差SD,根均方誤差(Root Means Square Error,RMSE)以及平均誤差率Mr。Mr定 義 為:
實(shí)驗(yàn)從非接觸心率測(cè)量的準(zhǔn)確性、一致性以及非接觸PPG 信號(hào)的質(zhì)量三個(gè)方面分析自適應(yīng)ROI 方法的表現(xiàn)。
表1 展示多種方法的在靜坐情況下的心率誤差統(tǒng)計(jì)結(jié)果對(duì)比,誤差最小的數(shù)值用加粗表示,與固定ROI 的Sun 方法比較,自適應(yīng)ROI 方法計(jì)算得到的心率的誤差從4.72 次/分降低至0.52次/分,標(biāo)準(zhǔn)差從6.46 次/分降低至1.49 次/分,RMSE 從7.96 次/分降低至1.50 次/分,平均誤差率從9.45% 降低至1.73%??傮w上自適應(yīng)ROI 方法的準(zhǔn)確率和誤差分布得到了提高。表2列出運(yùn)動(dòng)情況下心率誤差統(tǒng)計(jì),誤差均值和標(biāo)準(zhǔn)差為(1.02±2.91)次/分,自適應(yīng)ROI 的平均誤差為2.43%,均比其他兩種方法降低50%以上,其中最大誤差率為7.7%,達(dá)到了中華人民共和國(guó)醫(yī)藥行業(yè)規(guī)定的誤差標(biāo)準(zhǔn),即單次測(cè)量誤差不超過(guò)心率的±10%且最大不超過(guò)5 次/分。由此表明,自適應(yīng)ROI 方法能夠顯著提高非接觸心率測(cè)量的準(zhǔn)確率,在人臉靜止和運(yùn)動(dòng)情況下均降低了心率測(cè)量誤差,并且達(dá)到了國(guó)家相關(guān)標(biāo)準(zhǔn),可以在醫(yī)療和日常場(chǎng)景下使用。
表1 靜坐條件下各方法的心率統(tǒng)計(jì)數(shù)據(jù)Tab. 1 Statistic result of different methods in static situation
表2 緩慢運(yùn)動(dòng)情況下各方法的心率數(shù)據(jù)對(duì)比Tab. 2 Statistic result of different methods in move situation
醫(yī)學(xué)檢測(cè)中使用Bland-Altman 圖分析新的測(cè)量方法與標(biāo)準(zhǔn)測(cè)量方法的一致程度。這里使用Bland-Altman 一致性分析方法對(duì)比自適應(yīng)ROI 方法與接觸式PPG 方法的結(jié)果,如圖7 和圖8 所 示。Mean±1.96SD 代 表95% 置 信 區(qū) 間,Mean 值越接近于0,95%置信區(qū)間越小,誤差位于置信區(qū)間的數(shù)量越多,說(shuō)明兩種測(cè)量方法結(jié)果的一致性越高。在靜坐情況下,自適應(yīng)ROI 方法與接觸式PPG 方法測(cè)量結(jié)果差值的均值為0.52次/分,95%置信區(qū)間為-2.44~3.48 次/分,僅有兩次測(cè)量誤差位于置信區(qū)間以外。在運(yùn)動(dòng)情況下,自適應(yīng)ROI 方法的置信區(qū)間為-2.76~4.79次/分,置信區(qū)間相對(duì)增大,但大多數(shù)誤差位于置信區(qū)間內(nèi),該方法得到的心率與標(biāo)準(zhǔn)心率仍然表
圖7 人臉靜止情況下自適應(yīng)ROI 方法心率與接觸式PPG 心 率 比 較 的Bland-Altman 圖Fig.7 Heart rate(HR)Bland-Altman plot of adaptive ROI and contact PPG in static situation
圖8 人臉運(yùn)動(dòng)情況下自適應(yīng)ROI 方法心率與接觸式PPG 心 率 比 較 的Bland-Altman 圖Fig.8 Heart rate(HR)Bland-Altman plot of adaptive ROI and contact PPG in move situation
最后分析自適應(yīng)ROI 方法提取的非接觸PPG 信號(hào)的質(zhì)量。圖9 展示3 種非接觸式PPG現(xiàn)出較高的一致性。兩種場(chǎng)景下的Bland-Altman分析表明,自適應(yīng)ROI方法心率的一致性較高。信號(hào)與接觸式PPG 信號(hào)的波形和波峰數(shù)量。接觸式PPG 信號(hào)的波峰數(shù)量為23,與自適應(yīng)ROI方法和皮膚掩碼ROI 方法的波峰數(shù)量相等,而固定ROI 方法的PPG 信號(hào)質(zhì)量最低,周期性不明顯,無(wú)法合理地標(biāo)記和計(jì)算波峰數(shù)量。與皮膚掩碼ROI 方法相比,自適應(yīng)ROI 方法提取的非接觸PPG 信號(hào)質(zhì)量最高,細(xì)節(jié)保留更完善,保留了PPG 波形的主峰以及從峰,單位周期的波形與接觸式PPG 信號(hào)的相似程度更高。這是由于自適應(yīng)ROI 方法通過(guò)分區(qū)域評(píng)估中PPG 信噪比與相關(guān)程度,排除信號(hào)質(zhì)量低的區(qū)域后,選擇信號(hào)質(zhì)量最高的區(qū)域獲取PPG,避免了大面積均值導(dǎo)致的細(xì)節(jié)丟失,保留了PPG 信號(hào)的細(xì)節(jié),得到更高質(zhì)量的PPG 信號(hào),可以更好地做后續(xù)特征的分析。
圖9 四種方法的PPG 信號(hào)對(duì)比Fig.9 Comparison of PPG signals by four methods
本文針對(duì)非接觸式心率誤差大和PPG 信號(hào)質(zhì)量低的問(wèn)題,提出一種新的提升非接觸心率獲取的準(zhǔn)確率的方法,通過(guò)自適應(yīng)地選取ROI,提升源信號(hào)的質(zhì)量來(lái)提升非接觸PPG 信號(hào)的質(zhì)量與心率的準(zhǔn)確度。將人臉?lè)謪^(qū)域統(tǒng)計(jì)像素信號(hào)后使用IVA 處理,再使用歸一化分割以信噪比和相關(guān)性為基準(zhǔn)選取ROI,自適應(yīng)地選取源信號(hào)質(zhì)量最高的ROI 提取非接觸PPG 信號(hào)和心率。相比于預(yù)選定ROI 的方法,自適應(yīng)ROI 方法顯著提高非接觸心率的準(zhǔn)確率,將心率誤差的均值和標(biāo)準(zhǔn)差從(4.72±6.46)次/分降低至(0.52±1.49)次/分,根均方誤差從7.96 次/分降低至1.50 次/分,平均誤差率從9.45%降低至1.73%。頭部運(yùn)動(dòng)狀態(tài)下該方法的誤差為(1.02±2.91)次/分,RMSE 為2.11 次/分,平均誤差率為2.43%。通過(guò)對(duì)該方法與標(biāo)準(zhǔn)接觸式PPG 設(shè)備得到的心率進(jìn)行Bland-Altman 一致性分析,頭部靜止?fàn)顟B(tài)下95% 置 信區(qū)間為-2.44~3.48 次/分,運(yùn)動(dòng)時(shí)為-2.76~4.79 次/分。該方法與接觸式PPG設(shè)備測(cè)量的心率有很高的一致性。通過(guò)對(duì)比非接觸PPG 信號(hào)與接觸式PPG 信號(hào)的波形,證明該方法提升了PPG 信號(hào)的質(zhì)量,對(duì)于遠(yuǎn)程醫(yī)療和家用心率監(jiān)測(cè)有著重要意義。此外,在該方法的基礎(chǔ)上深入探索在人臉快速運(yùn)動(dòng)情況下的自適應(yīng)ROI 選擇,消除運(yùn)動(dòng)偽影,進(jìn)一步提升非接觸心率測(cè)量和PPG 信號(hào)獲取的適用場(chǎng)景。