徐馨荷, 王曉飛
(北京信息科技大學 儀器科學與光電工程學院,北京 100192)
血糖是人體一項極為重要的生理指標,血糖濃度的相對恒定對維持機體,尤其是腦、神經(jīng)的正常生理功能有著非常重要的意義[1-2]。目前血糖濃度測量方法主要有自動生化儀測量法和快速血糖儀測量法[3],都是通過采血的方式來檢測血糖值,給患者帶來創(chuàng)傷,對患者長時間的血糖監(jiān)測不利,故無創(chuàng)血糖檢測的實現(xiàn)具有十分重要的現(xiàn)實意義。然而,由于信號微弱、測量條件變化復雜、人體生理背景難以定量等問題對光譜測量的影響進而導致血糖預測精度不高,達不到臨床使用需求,是目前近紅外無創(chuàng)光譜血糖測量突出的難題[4-5]。因此探究新的測量方法以克服測量條件、人體生理背景等對光譜測量的影響來提高測量精度,對全面實現(xiàn)血糖的無創(chuàng)測量具有重要意義。
“M+N”理論[6-7]從誤差理論的角度分析測量系統(tǒng)和測量過程,將被測對象自身的差異和其他干擾因素一同歸于整個測量系統(tǒng)中,系統(tǒng)地考慮兩者對測量精度的影響。本文研究無創(chuàng)血糖測量中的影響因素,并根據(jù)“M+N”理論將影響因素分成“M”因素和“N”因素,依據(jù)影響因素的特性采用不同的方法減小其對血糖預測值的影響。
“M+N”理論中“M”表示被測對象中的M種非測量組分;“N”表示影響被測成分測量精度的N種外界干擾因素[6]。其提高測量精度的關鍵在于將“M”因素與“N”因素同等對待,判斷其為系統(tǒng)誤差還是隨機誤差,同時提出必要的解決辦法。圖1所示為“M+N”理論框圖。
圖1中影響因素E1、E2、E3、E4如表1所示。其中:E1為影響血糖測量的血液組分及其他非測量組分[8];E3是現(xiàn)今無創(chuàng)血糖測量研究的熱門之一;E2和E4分別是“M”因素和“N”因素中隨機誤差的典型代表。
根據(jù)各因素的不同屬性對其有不同的處理方法來降低其對血糖測量值的影響,本文采用單沿提取法減小接觸壓力帶來的影響,并將甘油三酯、高密度脂蛋白膽固醇、血清總膽固醇、年齡納入模型中,系統(tǒng)地考慮這4種因素對血糖測量值的影響[8-9]。
圖1“M+N”理論結構框圖
表1 “M”因素和“N”因素的分類
圖2所示為基于“M+N”理論的人體試驗系統(tǒng),其中光源為50 W的溴鎢燈,實驗所用光譜儀為AvaSpec-HS1024x58TEC高靈敏度型光纖光譜儀,波長范圍為200~1 160 nm。本次實驗被測對象為239名患者,受測者平臥放松將食指指端完全遮擋住光纖入口,光源發(fā)出的光聚焦透過手指后,由光譜儀直接進行光譜數(shù)據(jù)的采集,并由計算機保存采集到的光譜數(shù)據(jù)。
光譜數(shù)據(jù)采集完成后,對受試者進行靜脈抽血,獲得血糖真值以及膽固醇、甘油三酯等血液其他組分數(shù)據(jù)并記錄患者的年齡。由于在脈搏波的采集過程中,光強及其他檢測條件的影響,本次實驗選取的波長范圍是580.43~900.81 nm。波長間隔為0.94 nm,約560個波長。
圖221基于“M+N”理論的人體試驗系統(tǒng)
為了提高基于動態(tài)光譜的多波長血糖建模方法的穩(wěn)定性和可靠性,需要評判動態(tài)光譜質量。本文采用的方法是利用動態(tài)光譜數(shù)據(jù)穩(wěn)定波長數(shù)的多少來進行光譜數(shù)據(jù)質量的評判[10]。穩(wěn)定波長數(shù)是各波長下對數(shù)脈搏波頻域基波分量頻率持續(xù)一致的波長個數(shù)。圖3所示為單個樣本的脈搏波頻率圖,可看出,對數(shù)脈搏波在1.2 Hz處連續(xù)出現(xiàn),共560個波長,在該處所覆蓋的波長個數(shù)即為穩(wěn)定波長數(shù)。穩(wěn)定波長數(shù)越大則表明各波長下對數(shù)脈搏波越相似,即動態(tài)光譜數(shù)據(jù)質量越高。根據(jù)穩(wěn)定波長數(shù)這一標準在原有的239組光譜樣本中選取了192組光譜樣本。
圖3單個樣本的脈搏波頻率
單沿提取法的基本思想是用統(tǒng)計平均的方法提取各波長下峰峰值的對應比例關系,并非直接提取峰峰值。該方法利用了對數(shù)脈搏波的疊加平均效應來剔除和校正各波長下脈搏波的波形誤差,同時也利用了單沿動態(tài)光譜的疊加平均效應剔除含有粗大誤差的單沿動態(tài)光譜,從兩方面降低誤差對波形的影響[11-13]。因此在數(shù)據(jù)預處理階段選取單沿法提取動態(tài)光譜,可以減小“N”因素的系統(tǒng)誤差——接觸壓力帶來的影響。
單沿提取法的提取步驟如下:
(1) 對采集到的光電容積脈搏波信號取對數(shù),并將其中強度較大的信號進行疊加平均,作為脈搏波的模板。
(2) 找到每個周期內的波峰與波谷值,通過峰谷值來確定上升沿和下降沿,將所有波長的有效上升沿與模板的有效上升沿進行最小二乘擬合,以此來校正對數(shù)脈搏波的上升沿。
任意波長λ下對數(shù)脈搏波在時域上如下式所示:
yλ(t)=ΔAλ·x(t)+DCλ
(1)
式中:ΔAλ為脈動動脈血液的吸光度值;x(t)為對數(shù)脈搏波的波形函數(shù);DCλ為對數(shù)脈搏波的直流分量;對數(shù)脈搏波隨時間t變化的出射光強為yλ(t)。
由于各波長下對數(shù)脈搏波的波形具有相似性,即x(t)是不變的,故對數(shù)脈搏波模板的出射光強值y0(t)可表示為:
y0(t)=ΔA0·x(t)+DC0
(2)
式中:ΔA0為對數(shù)脈搏波模板的平均吸光度;DC0為對數(shù)脈搏波模板的平均直流分量。
將式(1)、(2)合并,可以得到:
(3)
從式(3)可以看出,對數(shù)脈搏波模板的出射光強y0(t)為自變量,各波長對數(shù)脈搏波的出射光強yλ(t)為因變量,兩者呈線性關系;斜率α=ΔAλ/ΔA0為經(jīng)過最小二乘擬合得到的各波長的擬合斜率,將所有波長下的擬合斜率作為動態(tài)光譜的等效值,構成一系列單沿動態(tài)光譜。
(3) 采用歐式距離來判定單沿動態(tài)光譜與疊加平均值的相似性。計算每一個波長下單沿動態(tài)光譜與疊加平均值的歐式距離di(x,y)(i為單沿動態(tài)光譜樣本數(shù)量),其幾何表達式如下:
(4)
若d(x,y)越小,則表明單沿動態(tài)光譜與疊加平均值之間的相似程度越高。
(4) 按照萊以特準則(3σ準則)判別單沿動態(tài)光譜是否含有粗大誤差,
|δi|>3σ
(8)
若某單沿動態(tài)光譜滿足3σ準則,則可判定該單沿動態(tài)光譜含有粗大誤差,應予以剔除;否則認為該樣本中不含粗大誤差。對剔除粗大誤差后的單沿動態(tài)光譜再進行上述操作步驟,直到全部剔除含有粗大誤差的單沿動態(tài)光譜,篩選得到最終的有效動態(tài)光譜,之后進行疊加平均作為最終的單沿動態(tài)光譜輸出。圖4為單個樣本經(jīng)單沿提取法提取后的動態(tài)光譜圖,其中該樣本有效沿的個數(shù)為59個。
圖4 單沿法提取的動態(tài)光譜
偏最小二乘法[14-17](Partial Least Squares Regression,PLS)是一種數(shù)學優(yōu)化技術,它提供一種線性回歸建模的方法。PLS的原理如下: 將自變量矩陣X和因變量矩陣Y分別做標準化處理,得到:
E0=(E01,E02,…,E0p)n×p,F(xiàn)0=(F01,F02,…,F0q)n×q
由拉格朗日算法可得出ε1和θ1:
(10)
(11)
(12)
式中:E1和F1分別為以上2個回歸方程的殘差矩陣;回歸系數(shù)向量p1和q1表示為:
(13)
此時若回歸方程能夠達到所需精度,可終止算法。否則,將利用X被t1解釋后的殘差和Y被u1解釋后的殘差來進行第2成分t2和u2的提取。即用殘差矩陣E1和F1取代E0和F0求得ε2和θ2,并得到第2成分t2和u2,建立回歸方程,有:
(14)
(15)
同樣地,E2和F2為殘差矩陣,回歸系數(shù)向量是:
(16)
以此類推,設秩為A,可得到:
由于t1,t2,…,tA均可以表示為E0中各向量的線性組合,式(17)與(18)結合可表示為
(19)
式中:
本文采用PLS建立模型并進行血糖預測,將“M”因素系統(tǒng)誤差中的甘油三酯、膽固醇、高密度脂蛋白膽固醇和年齡4個影響因素作為自變量矩陣
X=[x1,x2,x3,x4]
經(jīng)單沿法提取后的光譜數(shù)據(jù)作為因變量矩陣Y=[y1,y2,…,yq],將這兩部分數(shù)據(jù)作為模型的輸入,模型輸出為血糖預測值,如圖5所示。
圖5建立模型
采用相關系數(shù)和平均預測相對誤差兩個指標來評價模型,計算公式如下:
在192例樣本中隨機選取144例樣本進行建模,48例樣本進行預測?;凇癕+N”理論的血糖模型預測值、未考慮其他非測量組分影響的預測值和血糖真實值的數(shù)據(jù)對比如表2所示。圖6為基于“M+N”理論的血糖模型預測值與血糖真實值之間的相對誤差。
基于“M+N”理論測量方法的血糖預測值和血糖真值的相關系數(shù)為0.929 5,平均預測相對誤差為0.033,而未考慮其他非測量組分影響下的光譜數(shù)據(jù)與血糖真值的相關系數(shù)為0.828 5,平均預測相對誤差為0.046。結果表明,基于“M+N”理論考慮非測量組分對血糖的影響這一測量方法的測量精度優(yōu)于傳統(tǒng)的測量方法。
表2 預測值與真實值的對比
圖6 基于“ M+N”理論的血糖預測值與真值的相對誤差
“M+N”理論將被測對象和其他影響因素一同歸于整個測量系統(tǒng)中,全面考慮了兩者對血糖測量精度的影響。本文通過將“M”因素系統(tǒng)誤差中的膽固醇、甘油三酯、年齡和高密度脂蛋白膽固醇四種非測量組分納入模型,利用單沿提取法減小“N”因素系統(tǒng)誤差中接觸壓力對血糖測量值帶來的影響,使得血糖測量精度得以提高。這一方法可推廣應用到其他血液組分的無創(chuàng)測量中。
參考文獻(References):
[1]王連明, 辛曉敏, 劉曉民,等. 血糖測定的影響因素研究[J]. 中國實驗診斷學, 2006, 10(11):1345-1347.
[2]Tamura K, Ishizawa H, Fujita K,etal. Application to noninvasive measurement of blood components based on infrared spectroscopy[J]. Ieej Transactions on Electronics Information & Systems, 2007, 127(5):686-691.
[3]石博雅. 牙齒與皮膚組織光學相干層析成像建模及應用研究[D]. 天津:天津大學, 2014.
[4]劉蓉, 徐可欣. 近紅外光譜無創(chuàng)血糖檢測中體溫變化的影響分析[J]. 天津大學學報(自然科學與工程技術版), 2008, 41(1):1-6.
[5]Maruo K, Oota T, Tsurugi M,etal. New methodology to obtain a calibration model for noninvasive near-infrared blood glucose monitoring[J]. Applied Spectroscopy, 2006, 60(4):441-449.
[6]李剛, 李哲, 王曉飛,等. 測量模式的演進與“M+N”理論的提出[J]. 北京信息科技大學學報(自然科學版), 2013(2):9-13.
[7]李剛, 李哲, 李曉霞,等. 基于“M+N”理論的光譜分析中光源電壓對預測精度影響的研究[J]. 光譜學與光譜分析, 2013, 33(6):1456-1461.
[8]李曼. 老年2型糖尿病患者腰圍、體重指數(shù)與血糖、血壓、血脂、尿酸的相關性研究[J]. 中西醫(yī)結合心腦血管病雜志, 2015, 13(11):1351-1352.
[9]李麗, 王曉飛, 盧愷. 基于“M+N”理論的近紅外光譜血氧飽和度無創(chuàng)測量方法[J]. 生物醫(yī)學工程學雜志, 2016(5):885-889.
[10]李剛,王慧泉,趙喆,等. 動態(tài)光譜數(shù)據(jù)質量的評價[J]. 光譜學與光譜分析,2010,30(10);2802-2806.
[11]李剛, 熊嬋,王慧泉,等.動態(tài)光譜的單拍提取[J].光譜學與光譜分析,2011,31(7):1857-1861.
[12]李剛, 周梅, 王慧泉,等. 動態(tài)光譜提取方法的對比研究[J]. 光譜學與光譜分析, 2012, 32(5):1324-1328.
[13]李剛, 王慧泉, 趙喆,等. 提高DS法無創(chuàng)血液成分檢測信噪比的方法與分析[J]. 光譜學與光譜分析, 2012, 32(8):2290-2294.
[14]張寶菊,賈萍,張志勇,等. PLS在基于動態(tài)光譜的人體血液中性粒細胞無創(chuàng)測量中的應用[J]. 光譜學與光譜分析,2010(2):466-469.
[15]李朋成,朱軍桃,馬云棟,等. 基于偏最小二乘法的近紅外光譜分析應用[J]. 測繪地理信息,2015(2):53-56.
[16]Delwiche S, Reeves J I. The effect of spectral pre-treatments on the partial least squares modelling of agricultural products[J]. Journal of Near Infrared Spectroscopy, 2004, 12(1):177.
[17]Fang J, Qiang J, Wei X. Simultaneous determination of main composition and additive in vinegar by NIR and partial least squares[J]. Computers & Applied Chemistry, 2010, 27(3):351-354.