国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于主成分分析結(jié)合拉曼光譜快速識(shí)別血液歸屬的研究

2016-06-30 03:01白鵬利王鈞尹煥才田玉冰姚文明高靜
光散射學(xué)報(bào) 2016年2期
關(guān)鍵詞:識(shí)別主成分分析血液

白鵬利,王鈞,2,尹煥才,田玉冰,姚文明,高靜*

(1.中國科學(xué)院蘇州生物醫(yī)學(xué)工程技術(shù)研究所,蘇州 215163;2.浙江工業(yè)大學(xué)海洋學(xué)院,杭州 310014)

基于主成分分析結(jié)合拉曼光譜快速識(shí)別血液歸屬的研究

白鵬利1,王鈞1,2,尹煥才1,田玉冰1,姚文明1,高靜1*

(1.中國科學(xué)院蘇州生物醫(yī)學(xué)工程技術(shù)研究所,蘇州215163;2.浙江工業(yè)大學(xué)海洋學(xué)院,杭州310014)

摘要:以3種不同的動(dòng)物(3×10)血樣以及21個(gè)人血液作為分析對(duì)象,采用主成分分析(PCA)結(jié)合拉曼光譜進(jìn)行血液定性識(shí)別檢測(cè),通過矢量歸一化對(duì)拉曼信號(hào)進(jìn)行預(yù)處理,以及杠桿值與殘差值得分圖剔除異樣點(diǎn),使得人與動(dòng)物血樣的識(shí)別率均高于95%,并在此基礎(chǔ)上進(jìn)一步采用PCA進(jìn)行動(dòng)物血樣之間的識(shí)別,使得個(gè)體的識(shí)別率高于90%。實(shí)驗(yàn)結(jié)果表明PCA在血液識(shí)別檢測(cè)中具有較好的應(yīng)用前景和可行性,該方法也可以為刑偵、生命科學(xué)等應(yīng)用領(lǐng)域提高借鑒。

關(guān)鍵詞:血液;識(shí)別;主成分分析(PCA);拉曼光譜

1引言

血液是流動(dòng)在血管和心臟內(nèi)的不透明紅色液體,主要成分為血細(xì)胞和血漿。血液中含有各種營養(yǎng)成分,如無機(jī)鹽、氧、代謝產(chǎn)物、激素、酶和抗體等[1-2]。動(dòng)物血和人血在這些成分上沒有明顯的差異。由于血液中含有大量的遺傳信息,所以人與動(dòng)物血液樣品種屬的識(shí)別在出入境檢驗(yàn)檢疫中有著重要的意義[3]。但是血液直接取樣分析檢測(cè)會(huì)產(chǎn)生血液之間的污染,同時(shí)血液中的致病因子也會(huì)帶來人員感染風(fēng)險(xiǎn)。目前對(duì)血液種屬進(jìn)行區(qū)分識(shí)別方法,多為使用HPLC[4]、LC-MS[5]等一些傳統(tǒng)的分析方法,但是這類方法操作繁瑣,并且樣品需要經(jīng)過復(fù)雜的前處理。所以急需一種簡(jiǎn)單快速、無損的血液種屬識(shí)別方法。

拉曼光譜技術(shù)(Raman Spectroscopy)是近幾年快速發(fā)展的一種具有前景的快速識(shí)別分析方法,具有零污染、無需或極少的前處理、非接觸、樣品量少等諸多優(yōu)點(diǎn),在石油、食品、珠寶等各行業(yè)得到初步的探索和應(yīng)用[6-8]。同時(shí)拉曼光譜技術(shù)具有易操作,測(cè)定時(shí)間短,高靈敏度且所需樣品量少等優(yōu)點(diǎn),適合于定量研究、數(shù)據(jù)庫搜索以及運(yùn)用差異分析進(jìn)行定性研究[9]。血液的拉曼光譜信息非常豐富,血紅蛋白結(jié)構(gòu)對(duì)拉曼光譜的分子振動(dòng)有較大的貢獻(xiàn),不同歸屬的血液拉曼光譜的差異及其微小[10]。Zhang等人運(yùn)用PLS-DA模型結(jié)合可見光譜對(duì)人血和動(dòng)物血進(jìn)行識(shí)別,識(shí)別率達(dá)到95%以上[11]。McLaughlin等人通過化學(xué)計(jì)量學(xué)結(jié)合拉曼光譜對(duì)人和動(dòng)物血斑進(jìn)行識(shí)別,其識(shí)別結(jié)果令人滿意[12]。

本文利用拉曼光譜儀,以不同來源的血液作為研究對(duì)象,結(jié)合PCA法對(duì)分析處理樣品數(shù)據(jù)及其品質(zhì)特性進(jìn)行評(píng)價(jià),從而達(dá)到對(duì)樣品歸屬的識(shí)別,為拉曼光譜結(jié)合PCA法在血液識(shí)別和控制中的應(yīng)用提供試驗(yàn)數(shù)據(jù)。

2材料與方法

2.1材料與儀器

21個(gè)血液(EDTA抗凝劑)樣品(由志愿者提供),30個(gè)動(dòng)物血液(EDTA抗凝劑)樣品(狗10只,兔10只,大鼠10只由蘇州大學(xué)動(dòng)物研究中心提供),95%乙醇(分析純),去離子水,拉曼光譜儀為雷尼紹公司inVia顯微共焦拉曼光譜,鍍鋁載玻片。

將血液樣品加入鍍鋁的載玻片上,采集血液樣品的拉曼散射光譜圖。激發(fā)波長(zhǎng)為785 nm,拉曼位移范圍為300~1700 cm-1,20倍目鏡聚焦,分辨率為2 cm-1,1%的激發(fā)功率(約0.6 mW),每個(gè)樣品掃描7次,取其平均光譜作為該樣品的原始光譜。

2.2主成分分析方法

主成分分析(principal component analysis,PCA)是模型識(shí)別分析中最基本的多元統(tǒng)計(jì)分析方法,在多元分析、模式識(shí)別等眾多領(lǐng)域中得到廣泛的應(yīng)用[12]。其目的是在保留原始主要信息變量的前提下將多指標(biāo)的問題轉(zhuǎn)化為少數(shù)幾個(gè)綜合性指標(biāo)的問題,起到降維和簡(jiǎn)化的作用,從而在研究復(fù)雜體系的問題時(shí)更加容易抓住問題的主要矛盾。綜合性指標(biāo)即主成分,是指原始變量信息的線性或非線性的組合。主成分分析的結(jié)果主要是以載荷因子圖和得分圖來表示。載荷因子圖常常用于表示樣品變量對(duì)樣品的差異的貢獻(xiàn);主成分得分圖是以散點(diǎn)圖為基礎(chǔ),每一個(gè)散點(diǎn)代表了一個(gè)樣品,點(diǎn)之間距離意味著樣品之間的特征差異的大小[13-14]。

2.3判斷指標(biāo)

在模型的識(shí)別分析中,通常會(huì)使用總體樣品識(shí)別率和單樣品識(shí)別率對(duì)模型識(shí)別的性能評(píng)價(jià)[15]。設(shè)人血樣本數(shù)為n1,動(dòng)物血液樣本數(shù)為m1,人血液樣品中正確識(shí)別數(shù)為n2,動(dòng)物樣本正確識(shí)別的是m2,則人血液樣品的識(shí)別率%=n2/n1;動(dòng)物血液樣品的識(shí)別率%=m2/m1;總體樣品的識(shí)別率%=(n2+m2)/(n1+m1)[16]。

3結(jié)果與討論

3.1拉曼光譜的采集

采用雷尼紹顯微共焦拉曼光譜儀采集血液樣品的拉曼光譜。由于待測(cè)的樣品為液體,因此采用鍍鋁的載玻片,以避免干擾血液的拉曼信號(hào)。所有的血液樣品沒有經(jīng)過任何前處理,每次測(cè)量前均用75%乙醇清洗鍍鋁載玻片,從而避免了樣品間的交叉污染。血液樣品的拉曼圖譜如圖1所示。

Fig.1Average Raman spectra of human blood,dog blood,rabbit blood,and rat blood

圖1是血液樣品的平均光譜圖,由圖1可以得出,兩者之間有著一致的拉曼吸收峰,吸收強(qiáng)度存在著差異。在1300~1400 cm-1處是血紅蛋白的吸收峰[17],存在著微小的差異,同時(shí)樣本的吸收強(qiáng)度不在同一水平,所以要針對(duì)光譜進(jìn)行預(yù)處理,同時(shí)結(jié)合化學(xué)計(jì)量學(xué)對(duì)樣品進(jìn)一步的分析和識(shí)別。

3.2血液拉曼光譜預(yù)處理以及樣品異樣點(diǎn)剔除

矢量歸一化(Vector normalize)的目的是處理用于消除光程的變化或樣品的稀釋等變化對(duì)光譜產(chǎn)生的影響[18]。由于人與人之間、動(dòng)物與動(dòng)物之間以及人與動(dòng)物之間的血液粘稠度之間的差異,所以本論文將所有的光譜經(jīng)過矢量歸一化預(yù)處理。圖2是人血的平均光譜和動(dòng)物血的平均光譜圖經(jīng)矢量歸一化處理的結(jié)果,根據(jù)圖2很明顯可以得到在1000~1200 cm-1之間拉曼圖譜的形狀有細(xì)微的差異,而在1200~1400cm-1之間圖譜在強(qiáng)度方面也存在一定的差異,這也為識(shí)別人血和動(dòng)物血提供了理論的依據(jù)。

Fig.2Average spectrum of all human spectra and all animal spectra with the pretreatment of vector normalize

Fig.3 Results of outlier test

樣品杠桿值表示樣品對(duì)所建立的模型影響的重要程度,殘差值表示與樣品值對(duì)應(yīng)的樣品的預(yù)測(cè)能力的優(yōu)劣[19]。一般情況下,當(dāng)一個(gè)樣品杠桿值和殘差值都比較高時(shí),該樣品就是異常樣品,在分析前應(yīng)該予以剔除。圖3是從PC1(a)和PC2(b)角度分別對(duì)所有樣品的杠桿值和殘差值進(jìn)行分析,而PC1和PC2的累積貢獻(xiàn)率達(dá)到96.985%(如表1所示)。由圖2a中可以看出1號(hào)和22號(hào)殘差值明顯高于其他值,圖2b中也可以看出1號(hào)的杠桿值明顯高于其他值,同時(shí)22號(hào)樣品的殘差值也明顯高于其他值,所以在分析之前將1號(hào)和22號(hào)血液樣本剔除。

Tab.1 Explained variance of the top 6 PCs of samples

Fig.4the plot of different blood samples between PC1 and PC2

3.3主成分分析

由表1可知,血液樣品拉曼光譜的前6個(gè)主成分保持了原始數(shù)據(jù)97.899%的信息量,并且大量的原始信息壓縮到了主成分1和主成分2當(dāng)中,占原始信息量的96.985%。圖4為主成分1和主成分2得分圖可以看出,圖4對(duì)人血與動(dòng)物血進(jìn)行了很好的區(qū)分,不同歸屬的血液樣品的得分值可以很好的落在各自的區(qū)域范圍內(nèi)而不互相干擾。并且血液樣品的各個(gè)區(qū)域內(nèi)點(diǎn)的離散度相對(duì)較小,其總體識(shí)別率達(dá)到95.92%,進(jìn)一步說明拉曼光譜結(jié)合主成分分析可以很好地對(duì)人和動(dòng)物血樣歸屬進(jìn)行區(qū)分識(shí)別。

Fig.5the plot of different animal blood samples between PC4 and PC5

盡管人血和動(dòng)物血可以很好的分離(圖3),但是在主成分1和主成分2的得分圖中,動(dòng)物血之間的得分交叉比較大。為了進(jìn)一步對(duì)不同動(dòng)物血液樣本的識(shí)別,結(jié)合主成分4和主成分5的得分圖,結(jié)果如圖5??梢园l(fā)現(xiàn),狗血和兔血的主成分得分點(diǎn)靠的比較近,可以達(dá)到很好的分離效果,同時(shí)狗血和鼠血可以很好的區(qū)分,但是鼠血和兔血存在著一定的交叉。從表2可以得到,以兔為主體,相對(duì)于鼠的識(shí)別正確率達(dá)到了77.78%,但是總體的識(shí)別率達(dá)到90%。進(jìn)一步說明了拉曼光譜結(jié)合主成分分析不僅可以區(qū)別人血和動(dòng)物血,還可以區(qū)分動(dòng)物之間的血樣,與目前研究這種細(xì)微差異體系辨識(shí)區(qū)分的方法相比較,拉曼光譜在同源性差異體系識(shí)別上具有較好的潛力,能夠在海關(guān)檢驗(yàn)檢疫中得到充分的應(yīng)用。

Tab.2 The identification rate of different animal blood samples

4結(jié)論

本文采用了PCA方法針對(duì)血液樣品種類識(shí)別的研究,通過杠桿值和殘差值剔除了異樣點(diǎn),大大提高了模型的識(shí)別率,在人與動(dòng)物血樣的識(shí)別中,識(shí)別率達(dá)到了95%;在動(dòng)物血液之間識(shí)別過程中,總體的識(shí)別率達(dá)到了90%。實(shí)驗(yàn)結(jié)果表明PCA方法在血液定性識(shí)別中具有較好的應(yīng)用前景和可行性,并可探索將此方法運(yùn)用到類似的定性識(shí)別檢驗(yàn)中。但是,從應(yīng)用統(tǒng)計(jì)學(xué)的角度而言,血液樣本(種類和數(shù)量)的收集是否合理是影響到模型實(shí)用性的根本,同時(shí)針對(duì)不同抗凝劑的血液也要進(jìn)一步的分析。因此本工作后期將從統(tǒng)計(jì)學(xué)的分類角度進(jìn)一步的收集血樣的樣本,探索解決基于PCA血液定性識(shí)別模型的實(shí)用化過程中遇到的問題。

參考文獻(xiàn)

[1]顧亞軍.血液檢驗(yàn)標(biāo)準(zhǔn)誤差原因分析 [J].中國繼續(xù)醫(yī)學(xué)教育,2015,13(7):24-25.(Gu Yajun.Analysis Error Causes of Blood Test Specimen [J].China Continuing Medical Education,2015,13(7):24-25.)

[2]蔡銳波,郭景元.用熒光抗體法作血痕的種屬鑒定[J].法醫(yī)學(xué)雜志,1990,5(1):33-34.(Cai Ruibo,Guo Jingyuan.The Species Identification of Bloodstain by the Immunofluorescence Test [J].J Forensic Sci,1990,5(1),33-34)

[3]Gregory M,Doty K C,Lednev I K.Raman spectroscopy of blood species identification [J].Anal Chem,2014,86(6):11628-11633.

[4]Andrasko J,Rosen B.Sensitive identification of hemoglobin in bloodstains from different species by high-performance liquid-chromatography with combined UV and fluorescence detection [J].J Forensic Sci,1994,39(4):1018-1025.

[5]Steendam K,De C M,Dhaenens M,et al.Mass spectrometry-based proteomics as a tool to identify biological matrices in forensic science [J].Int J Legal Med,2013,127(2):287-298.

[6]吳靜珠,石瑞杰,陳巖,等.基于PLS-DA和拉曼光譜快速定性識(shí)別食用植物油 [J].食品工業(yè)科技,2014,35(6):55-58.(Wu Jingzhu,Shi Ruijie,Chen Yan,etal.Rapid qualitative identification method of edible vegetable oil based on PLS-LDA and Ramam[J].Science and Technology of Food Industry,2014,35(6):55-58)

[7]Virkler K,Lednev I K.Raman spectroscopy offers great potential for the nondestructive confirmatory identification of body fluids [J].Forensic Sci Int,2008,181:e1-e5.

[8]陳健,肖凱軍,林福蘭.拉曼光譜在食品分析中的應(yīng)用[J].食品科學(xué),2007,28(12):554-558.(Chen Jian,Xiao Kaijun,Lin Fulan.Review on Raman Spectroscopy Application in Food Analysis [J].Food Science,2007,28(12):554-558)

[9]褚小立.化學(xué)計(jì)量學(xué)方法與分子光譜分析技術(shù) [M].北京:化學(xué)工業(yè)出版社,2011(Cu Xiaoli.Stoichiometry and molecular spectroscopy [M].Beijing:Chemical Industry Press,2011)

[10]盧明子,郭延軍,趙蓮,等.拉曼光譜在血紅蛋白結(jié)構(gòu)及功能中的應(yīng)用進(jìn)展 [J].光譜學(xué)與光譜分析,2014,34(2):439-444.(Lu Mingzi,Guo Yanjun,Zhao Liao,etal.Application of Raman Spectroscopy to the Research on Hemoglobin Structure and Function [J].Spectroscopy and Spectral Analysis,2014,34(2):439-444)

[11]Zhang Linna,Zhou Mei,Li Xiaoxia,etal.Discrimination of human and nonhuman blood using visible diffuse reflectance spectroscopy[J].Analytical Methods,2014,6:9419-9423.

[12]Gregory M,Doty K C,Lednev I K.Discrimination of human and animal blood traces via Raman spectroscopy[J].Forensic Sci Int,2014,238:91-95.

[13]談國風(fēng),田師一,沈宗根,等.電子舌檢測(cè)奶粉中抗生素的殘留 [J].農(nóng)業(yè)工程學(xué)報(bào),2011,27(4):361-365.(Tan Guofeng,Tian Shiyi,Shen Zonggen,etal.Electronic tongue detection for residual antibiotic in milk powder [J].Transactions of the CSAS,2011,27(4):361-365)

[14]夏益華,羅榴彬,李曉麗,等.共聚焦顯微拉曼光譜研究堿處理對(duì)稻秸發(fā)酵制沼氣的影響 [J].光譜學(xué)與光譜分析,2015,35(3):657-662(Xia Yihua,Luo Liubin,Li Xiaoli,etal.Studies on Effect of Alkali Pretreatment on Anaerobic Digestion of Rice Straw with Confocal Raman Microscopy [J].Spectroscopy and Spectral Analysis,2015,35(3):657-662)

[15]楊忠,呂斌,黃安民,等.近紅外光譜技術(shù)快速識(shí)別針葉材和闊葉材的研究 [J].光譜學(xué)與光譜分析學(xué),2012,32(7):1785-1789(Yang Zhong,Lv Bin,Huang Anmin,etal.Rapid Identification of Softwood and Hardwood by Near Infrared Spectroscopy of Cross-sectional Surfaces [J].Spectroscopy and Spectral Analysis,2012,32(7):1785-1789)

[16]劉心如,張利平,王建福,等.可見-近紅外漫反射光譜技術(shù)對(duì)羊毛和羊絨的鑒別研究 [J].光譜學(xué)與光譜分析,2013,33(8):2092-2095(Liu Xinru,Zhang Liping,Wang Jianfu,etal.Use of Visible and Near Infrared Reflectance Spectroscopy to Identify the Cashmere and Wool [J].Spectroscopy and Spectral Analysis,2013,33(8):2092-2095)

[17]Virkler K,Lednev I K.Blood species identification for forensic purposes using Raman Spectroscopy combined with advanced statistical analysis [J].Anal Chem,81(18):7773-7777.

[18]陸婉珍,袁洪福,徐廣通.現(xiàn)代近紅外光譜分析技術(shù)[M].北京,中國石化出版社,2000:1-25(Lu Wanzhen,Yuan Hongfu,Xu Guangtong.Modern Near Infrared Spectroscopy [M].Beijing,China Petrochemical Press,2000:1-25)

[19]梁秀英,李小昱,楊萬能.奇異數(shù)據(jù)篩選法在玉米籽粒蛋白質(zhì)近紅外光譜檢測(cè)中的應(yīng)用 [J].激光生物學(xué)報(bào),2015,24(1):38-45(Liang Xiuying,Li Xiaoyu,Yang Wanneng.Outlier Detection for Measurement of Protein Content in Maize Kernels Based on Near-infrared and Reflectance Spectroscopy [J].Acta Laser Biology Sinica,2015,24(1):38-45)

Rapid Qualitative Identification Method of Species of Blood Based on PCA with Raman Spectroscopy

BAI Peng-li1,WANG Jun1,2,YIN Huan-cai1,TIAN Yu-bing1,YAO Wen-ming,GAO Jing1*

(1.SuZhouInstituteofbiomedicalengineeringandtechnology,ChineseAcademyofScience,Suzhou,215163,China;2.OceanCollege,ZhejiangUniversityofTechnology,Hangzhou,310014,China)

Abstract:In the paper 3 kinds of animal for a total of 30 animal blood samples and 21 human blood samples were chosen as the typical tested objects.Principle component analysis(PCA)method was employed to quickly identify the species of blood samples based on Raman spectroscopy.Vector normalization was used to preprocess the Raman spectroscopy signal.According to the plot of Leverage value vs.Studentized residue,outlier sample was detected and removed.By the PCA method,the correct rate between animal blood samples and human blood samples was up to 95% based on PC1 and PC2.Further on the basis of PC4 and PC5,the correct rate of identification the animal blood sample was above 90%.The experiment results showed that the PCA method had good application prospects and feasibility to identify the species of blood samples.This method provided a reference for processing the similar problems in the field of forensic science and life science.

Key words:blood;identification;principal component analysis;Raman spectroscopy

收稿日期:2015-09-06; 修改稿日期:2015-10-28

基金項(xiàng)目:國家863項(xiàng)目(2015AA021106);蘇州市技術(shù)專項(xiàng)(ZXY2012014);江蘇省產(chǎn)學(xué)研項(xiàng)目(BY2013033);蘇州市應(yīng)用基礎(chǔ)研究計(jì)劃(SYG201305,SYG201404); 江蘇省自然科學(xué)基金(面上)(BK20131170)

作者簡(jiǎn)介:白鵬利(1983-),男,副研究員,從事高分子材料合成生物診斷試劑以及紅外拉曼光譜的研究,E-mail:baipl@sibet.ac.cn 通訊作者:高靜(1982-),男,研究員,主要從事醫(yī)用激光技術(shù)與光譜儀器的研究。E-mail:owengaojing@126.com

文章編號(hào):1004-5929(2016)02-0163-05

中圖分類號(hào):O657.37

文獻(xiàn)標(biāo)志碼:A

doi:10.13883/j.issn1004-5929.201602012

猜你喜歡
識(shí)別主成分分析血液
多彩血液大揭秘
神奇血液
主成分分析法在大學(xué)英語寫作評(píng)價(jià)中的應(yīng)用
江蘇省客源市場(chǎng)影響因素研究
SPSS在環(huán)境地球化學(xué)中的應(yīng)用
青島市中山公園園林樹木易混淆品種識(shí)別
論犯罪危險(xiǎn)人格的識(shí)別
報(bào)廢血液的初步分析
血液偏型