楊 麗,高美婷
(中國民航大學理學院,天津300300)
生物組織的光學特性參量能夠反映組織內部結構及病理狀況,因此,利用激光技術無損測量生物組織光學特性參量具有重要意義。近年來,空間分辨測量技術即通過組織表面的漫反射光分布來測量組織光學參量,得到了快速發(fā)展。參考文獻[1]~參考文獻[2]中采用漫射近似方法得到光學參量;參考文獻[3]中WARNCKE等人利用神經網絡方法,通過蒙特卡洛模擬的數據建立反演模型,獲得光學參量。漫射近似理論解出的是近似值,應用于復雜結構組織時測量精度不夠,且只適用于有效散射系數遠大于吸收系數的介質。神經網絡為機器學習方法,即在漫反射光和光學參量之間,通過訓練或擬合,建立一個非線性的反演回歸模型,將測得的漫反射光輸入該模型,可快速得到相應的光學參量。但其預測誤差較大且預測能力依賴大量的樣本數據[4]。支持向量機(support vector machine,SVM)是 CORTES 和 VAPNIK[5]最初提出采用結構風險最小化原則取代經驗風險最小化原則[6],具有出色的學習泛化能力,已廣泛應用于各個領域[7],但在測量生物組織光學參量方面尚未可見。
最小二乘支持向量機(least squares support vector machine,LS-SVM)[8]采用最小二乘線性系統(tǒng)代替?zhèn)鹘y(tǒng)的支持向量機的二次規(guī)劃方法,簡化了計算過程,加快了運算速度,提高了預測準確度[9]。本文中利用CCD實驗裝置測量模擬液表面的漫反射光分布[10],其克服了光纖掃描方法的測量時間長、近光源區(qū)的漫反射光無法測量等不足,建立測量生物組織模擬液光學參量的LS-SVM模型,分析了漫反射光的數據長度對LSSVM模型預測精度的影響,以及LS-SVM用于小樣本預測的可行性和有效性。
對于給定的訓練樣本集:(x1,y1),…,(xs,ys)∈Rn×R,(i=1,2,3,…,s),最佳回歸函數為:
式中,w∈Rn,b∈R,φ(x)為一種從 Rn到高維空間的非線形映射,并且滿足以下的結構風險最小化:
式中,c為懲罰因子,‖w‖2控制模型的復雜度,Remp為損失函數。損失函數一般有一次損失函數、Huber損失函數及二次損失函數,不同的損失函數可構造不同形式的支持向量機[11-12]。由二次損失函數構造的支持向量機即為最小二乘支持向量機,其表達式Remp=∑iξi2,ξ是模型對訓練集的訓練誤差[13],基于結構風險最小化原則LS-SVM的目標優(yōu)化函數為:
約束條件為:yi=φ(xi)w+b+ξi,i=1,…,l。
為求解上述問題,把約束優(yōu)化問題變成無約束優(yōu)化問題,建立Lagrange函數:
式中,ai為拉格朗日乘子,對(4)式求偏導:?L/?w=0,?L/?b=0,?L/?ξ=0,?L/?a=0。
消去方程組中的ξi和w得到方程組:
式中,y=[y1y2… yN],L=[1 1 … 1],a=[a1a2… aN]T,Qi,j= φ(xi)Tφ(xj);i,j=1,2,…,N。
核函數 k(xi,xj)= φ(xi)Tφ(xj),k(xi,xj)是符合Mercer條件的核函數。這里采用徑向基核函數(radial basis function,RBF)k(xi,x)=exp{- ‖x-xi‖2/δ2},解得上式b和a,故回歸問題(1)式化為:
只需確定核函數的參量,簡化了計算,提高了運算速度。常見的核函數有線性核函數k(xi,xj)=xixj,d 階多項式核函數 k(xi,xj)=(xixj+1)d以及本文中采用的 RBF[14]。
實驗中所用光源為波長為632.8nm的激光束(He-Ne激光器產生),成像設備為CCD相機(分辨率為1392像素 ×1040像素),使用 Simple-PCI軟件(Hamamatsu公司開發(fā))對圖像進行分析和處理,獲取圖像的方法類似參考文獻[15]。
以脂肪乳注射液Intralipid(質量分數為0.20)作為散射介質(波長為632.8nm時,其散射系數μs=49.44mm-1,吸收系數 μa=0.117mm-1[16]),在可見光區(qū),其光學特性參量與人體組織相當,且化學性質穩(wěn)定。墨水作為吸收介質(天津鴕鳥牌中性墨水,632.8nm時吸收系數為 65.84mm-1[17]),穩(wěn)定性好,無散射作用。使用Intralipid(質量分數為0.20)、墨水(0.75mL)和蒸餾水配制40組具有不同吸收系數(0.4cm-1~0.9cm-1)和散射系數(27cm-1~100cm-1)的組織模擬液,其中模擬液的有效散射系數μs′=5.4cm-1~20cm-1(各向異性因子g=0.8)。用CCD測量樣品表面的漫反射光分布,獲得40組實驗樣本,表1中列出其中15組樣品的配制情況。
Table 1 Optical parameters of tissue-simulation phantoms
樣品1表面的漫反射光分布見圖1;Simple-PCI軟件對該圖像進行分析和處理,獲取漫反射相對光強隨距離變化的情況如圖2所示。從圖2可以看出,在0mm~10mm范圍內,樣品表面的漫反射相對光強值不斷減小;10mm以后,距離光束入射點較遠的表面漫反射光很小且變化微弱,25mm處時減小為0。選取距離光入射點不同長度的漫射光數據,建立LS-SVM預測模型,分析漫射光數據長度對預測光學參量的影響。
Fig.1 Diffuse reflectance distribution on tissue simulation phantoms
Fig.2 Diffuse relative intensity vs.distance
從40組樣本中,隨機選擇30組作為訓練集,其漫射光的數據長度分別選為15mm,20mm和25mm,將不同長度的漫射光數據輸入到LS-SVM模型中,輸出為光學參量,建立3種LS-SVM預測模型,對余下的10組樣本進行預測。預測結果用10個測試樣本的平均相對誤差表示,計算公式為:ε100%,其中P(i)為預測值,T(i)為實驗值。3種模型下,測試集中樣本的吸收系數、有效散射系數的平均相對誤差見圖3。
Fig.3 Average predicted errors of different models
由圖3可見,漫射光數據長度為15mm時,距離光入射點較近,所得數據未能完全反映樣品表面的漫反射光分布,預測誤差稍大;數據長度延長至20mm時,吸收系數和散射系數的平均預測誤差均為5%,對光學參量的預測最準確。但是,過長的數據長度,如25mm,照射到樣品表面的漫射光強明顯降低,同時背景光和暗電流對其影響作用增強,造成較大誤差??梢?,利用漫反射光反演獲得光學參量時存在最佳的漫射光數據長度,以下實驗均選擇漫射光數據長度20mm。
從40組樣本中,隨機選取10組(均勻抽樣)作為測試集,從剩下的樣本中分別選取樣本數為30,15,7(均勻抽樣)作為訓練集1,2,3,建立LS-SVM 預測模型,對不同數量學習樣本的LS-SVM預測能力進行測試和比較。
為獲得一個LS-SVM模型(徑向基核函數RBF)需要兩個優(yōu)化參量,上述提及的懲罰因子c及RBF內核函數的參量σ2,參量選擇的好壞直接影響到模型的預測能力,本文中采用網格搜索法和10倍交叉驗證法確定最優(yōu)(c,σ)。將訓練集輸入到LS-SVM模型中,網格搜索各種可能的最優(yōu)參量對(c,σ),然后進行交叉驗證,直到找到使交叉驗證精度最高的參量對,建立預測模型[18]。將不同數量的學習樣本輸入到LS-SVM模型中,通過尋優(yōu)法找到最優(yōu)參量,建立3種模型,對測試集中的樣品進行預測,預測結果見圖4。
Fig.4 Predicted results of three LS-SVM models
由圖4直觀地看出,建立的3種LS-SVM模型對10個未知樣品的μs′和μa的預測值都十分接近真實值,即使訓練樣本數量為7情況,結果也較靠近真實值。3種模型對訓練集中的樣品也進行了預測,訓練誤差和預測誤差見表2。
Table 2 Average predicted errors and training errors of three models
顯然,訓練集中的樣品都得到精準的預測。對于測試集,訓練集樣本數為15時,LS-SVM模型對μs′和μa的平均預測誤差均為6.2%,與學習樣本為30的平均預測誤差相比僅增加了1.2%,特別是在學習樣本為7時,其預測精度高達93.6%。說明小樣本情況下最小二乘支持向量機對光學參量有良好的預測效果。
為了進一步評估建立的小樣本下的LS-SVM模型的性能,與人工神經網絡(artificial neural network,ANN)和支持向量機兩種方法進行比較。選擇15個學習樣本,分別建立3種方法的預測模型,對10個測試樣品進行預測。平均預測誤差及運行時間見表3。
Table 3 Predicted results of three methods
由表3可以看出,人工神經網絡模型運算時間較短,但平均預測誤差大;支持向量機模型的預測精度較神經網絡模型有了明顯提高,但耗時長;本文中采用的LS-SVM模型的預測結果最佳,用時僅為1s??梢姡琇S-SVM模型不僅提高了預測精度,而且加快了運算速度,充分表現了小樣本條件下優(yōu)越的預測性能。
利用最小二乘支持向量機結合CCD測量技術對確定生物組織的光學參量進行了實驗研究。結果表明:光學參量的預測存在最佳的漫射光數據長度;建立的小樣本LS-SVM模型的預測效果較其它機器學習方法有了明顯提高,對未知樣本的μs′和μa的預測誤差僅為5%,具有良好的預測性能。綜上所述,利用最小二乘支持向量機結合CCD測量技術能夠準確測量組織模擬液的光學參量,在實際測量生物組織的光學參量方面有廣闊的應用前景。
[1] WAN Ch M.Analysis of the effective application range of diffusion approximation theory[J].Optical Technique,2002,28(2):137-138(in Chinese).
[2] ZHANG L,LI J.Experiment research for non-invasive measurement of optical parameters of biological tissues[J].Journal of North China Institute of Science and Technology,2008,5(2):75-77(in Chinese).
[3] WARNCKE D,LEWIS E,LOCHMANN S,et al.A neural network based approach for determination of optical scattering and absorption coefficients of biological tissue[J].Journal of Physics,2009,178(1):012047.
[4] ZHAO G H,LI Y,ZHAO J.Financial distress forecast of least squares support vector machines based on genetic algorithm parameter optimization[J].Science and Management,2011(5):56-61(in Chinese).
[5] VAPNIK V N.The nature of statistical leaning theory[M].New York,USA:Springer,1995:32-45.
[6] ZHU J Y,YANG Y,ZHANG H X.Data prediction with few observations based on optimized least squares support vector machines[J].Acta Aeronautica et Astronautica Sinica,2004,25(6):566-568(in Chinese).
[7] YAN W W,SHAO H H.Application of support vector machines and least squares support vector machines to heart disease diagnoses[J].Control and Decision,2003,18(3):359-360(in Chinese).
[8] LI L J.The study of modeling algorithm based on LS-SVM and predictive control algorithm[D].Hangzhou:Zhejiang University,2008:1-109(in Chinese).
[9] YANG Y R,YANG R J,ZHANG Zh Y.Discrimination of adulterated milk using least square support vector machines combined with two-dimensional correlation infrared spectroscopy[J].Acta Photonica Sinica,2013,42(9):1124-1127(in Chinese).
[10] KIENLE A,LILGE L,PATTERSON M S,et al.Spatially resolved absolute diffusereflectance measurements for noninvasive determination of the opticalscattering and absorption coefficients of biological tissue[J].Applied Optics,1996,35(13):2304-2314.
[11] JIANG A N,LIANG B.Nonlinear time series prediction model for dam seepage flow based on PSO_SVM[J].Journal of Hydraulic Engineering,2006,37(3):331-335(in Chinese).
[12] YAN W W,ZHU H D,SHAO H H.Soft sensor modeling based on support vector machines[J].Journal of System Simulation,2003,15(10):1494-1496(in Chinese).
[13] GU Y P,ZHAO W J,WU Zh S.Least squares support vector machine algorithm[J].Journal of Tsinghua University(Science and Technology Edition),2010,50(7):1064-1071(in Chinese).
[14] ZHOU Y R,TENG Zh Sh,ZHAO X W.Fast online system identification for MIMO using LSSVM[J].Journal of Computer Applications,2009,29(8):2282-2314(in Chinese).
[15] YANG L,SHUN J H,ZHANG L Sh.Experimental research for noninvasive measurement of optical parameters of biological tissues by using CCD[J].Journal of Civil Aviation University of China,2010,28(3):42-44(in Chinese).
[16] di MINNI P,MARTELLI F,ZACCANTI G.Effect of dependent scattering on the optical properties of Intralipid tissue phantoms[J].Biomedical Optics Express,2011,2(8):2265-2278.
[17] ZHANG L Sh,WANG Zh Zh,ZHOU M Y.Determination of the optical coefficients of biological tissue by neural network[J].Journal of Modern Optics,2010,57(13):1164-1170.
[18] WANG K Q,YANG Sh Ch,DAI T H.Method of optimizing parameter of least squares supportvector machines by genetic algorithm[J].Computer Applications and Software,2009,26(7):110-111(in Chinese).