朱毅寧 楊平 楊新艷 李嘉銘 郝中騏 李秋實(shí) 郭連波 李祥友 曾曉雁 陸永楓
摘要為提高激光誘導(dǎo)擊穿光譜技術(shù)(Laserinduced breakdown spectroscopy, LIBS)對(duì)鮮肉品種的識(shí)別率, 采用支持向量機(jī)結(jié)合主成分分析算法輔助LIBS技術(shù)對(duì)鮮肉品種進(jìn)行識(shí)別。對(duì)鮮肉切片用載玻片壓平, 采用LIBS技術(shù)對(duì)鮮肉組織(豬肉、牛肉和雞肉)表面進(jìn)行光譜數(shù)據(jù)的采集, 每種鮮肉采集150幅光譜并進(jìn)行隨機(jī)排列, 取前75幅光譜作為訓(xùn)練集建立模型, 后75幅作為測(cè)試集測(cè)試建模結(jié)果。研究選取K、Ca、Na、Mg、Al、H、O等元素的49條歸一化譜線數(shù)據(jù)進(jìn)行主成分分析, 并用所得數(shù)據(jù)建立支持向量機(jī)分類(lèi)模型。結(jié)果表明, 通過(guò)主成分分析降維, 輸入變量從49個(gè)優(yōu)化減少到18個(gè), 模型建模速度從88.91 s降至55.52 s, 提高了支持向量機(jī)的建模效率; 并使預(yù)測(cè)集的平均識(shí)別率提高到89.11%。本研究為激光誘導(dǎo)擊穿光譜技術(shù)在鮮肉品種快速分類(lèi)領(lǐng)域提供了方法和數(shù)據(jù)參考。
關(guān)鍵詞激光誘導(dǎo)擊穿光譜; 支持向量機(jī); 主成分分析; 組織分類(lèi)
1引 言
肉類(lèi)品種多樣、價(jià)格不一, 一些不良商家以次充好, 不斷出現(xiàn)“豬肉充當(dāng)牛肉”、“鼠肉充當(dāng)羊肉”、“摻假牛羊肉”、“僵尸肉”等嚴(yán)重危害消費(fèi)者利益和食品安全的事件。因此, 肉類(lèi)品種的快速分類(lèi)分析有著重要的現(xiàn)實(shí)意義。傳統(tǒng)的肉類(lèi)檢測(cè)技術(shù)有聚合酶鏈反應(yīng)技術(shù)(Polymerase chain reaction)[1]、氣相層析質(zhì)譜分析技術(shù)(Gas chromatography mass spectrometer)[2]、芯片毛細(xì)管凝膠電泳(Capillary gel electrophoresis)[3]等。雖然上述方法檢測(cè)準(zhǔn)確度高, 但需要專(zhuān)業(yè)人員對(duì)樣品進(jìn)行DNA或蛋白質(zhì)的萃取, 操作過(guò)程復(fù)雜耗時(shí)[4], 不能滿(mǎn)足快速檢測(cè)的需求, 因此亟需開(kāi)發(fā)一種快速肉類(lèi)品種區(qū)分的檢測(cè)技術(shù)。
激光誘導(dǎo)擊穿光譜(Laserinduced breakdown spectroscopy, LIBS)是一種原子發(fā)射光譜分析技術(shù)[5], 已廣泛用于固、液、氣等物質(zhì)的檢測(cè)[6~13], 并逐漸進(jìn)入工業(yè)生產(chǎn)檢測(cè)領(lǐng)域[14], 尤其以微損、非接觸、快速分析的特點(diǎn)在生物組織檢測(cè)方面受到越來(lái)越多的關(guān)注[15~18]。近年來(lái), 將LIBS技術(shù)與化學(xué)計(jì)量學(xué)方法相結(jié)合識(shí)別生物組織已成為研究熱點(diǎn)[19]。Kumar等[20]使用LIBS技術(shù)對(duì)狗肝正常組織和惡性腫瘤組織進(jìn)行光譜區(qū)分, 實(shí)驗(yàn)表明, 組織中不同元素譜線強(qiáng)度比值差異可以有效區(qū)分正常組織和腫瘤組織。Yueh等[21]使用層析聚類(lèi)分析(Hierarchical cluster analysis, HCA)、主成分分析(Principal components analysis, PCA)、偏最小二乘判別分析(Partial least square discriminant analysis, PLSDA)和BP神經(jīng)網(wǎng)絡(luò)(Back propagation artificial neural networks, BPANN)4種算法對(duì)冰凍雞肉組織的不同部位(大腦、肝、肺、脾臟、腎臟、肌肉)進(jìn)行LIBS實(shí)驗(yàn)分析, HCA對(duì)44個(gè)樣品驗(yàn)證,僅有3個(gè)沒(méi)有正確識(shí)別, 其它算法(如PLSDA、BPANN)由于訓(xùn)練集建模樣品數(shù)據(jù)太少及訓(xùn)練集與驗(yàn)證集采集時(shí)間不一致, 不能有效地建立訓(xùn)練模型, 造成對(duì)驗(yàn)證集的識(shí)別率差。Bilge等[22]采用LIBS技術(shù)結(jié)合PCA算法對(duì)烘干壓片處理的肉類(lèi)組織(豬、牛、雞)進(jìn)行種類(lèi)區(qū)分, 識(shí)別率為83.37%。除此之外, 還對(duì)相互摻雜的肉制品進(jìn)行了PLS定量分析的研究。上述研究表明, LIBS對(duì)肉類(lèi)組織的識(shí)別率有待提高, 且樣品的制作方法如冰凍、壓片法, 制樣耗時(shí)、復(fù)雜, 需要改善。
相對(duì)于以上所使用的分類(lèi)算法, 支持向量機(jī)[23](Support vector machines, SVM)具有在小樣本建模、訓(xùn)練速度、預(yù)測(cè)穩(wěn)定等方面的優(yōu)勢(shì), 被廣泛用于LIBS分類(lèi)研究中。 Yu等[24]利用LIBS結(jié)合SVM對(duì)11種塑料的識(shí)別率達(dá)到了100%, 但SVM常會(huì)受輸入變量過(guò)多和噪聲的影響, 使得建模效率和穩(wěn)定性降低。鑒于PCA具有降維、除噪[25]的優(yōu)勢(shì), 目前已有研究者將PCA引入SVM算法, 提高SVM的建模效率和穩(wěn)定度, 并成功應(yīng)用于土壤[26]、巖石[27]、柑橘葉[28]和蛋白質(zhì)[29]等LIBS的分類(lèi)研究中, 識(shí)別率分別達(dá)到100%, 91.33%, 97.5%和98%。然而, 將SVM與PCA結(jié)合用于LIBS鮮肉品種分類(lèi)方面的研究鮮有報(bào)道。
本研究采用載玻片壓制鮮肉樣品的簡(jiǎn)單處理方法, 使用SVM輔助LIBS技術(shù)對(duì)豬肉、牛肉、雞肉等6種不同品種的鮮肉進(jìn)行快速、準(zhǔn)確地分類(lèi)識(shí)別, 并利用PCA算法優(yōu)化SVM建模效率, 以期提高建模的速度和識(shí)別準(zhǔn)確率, 從而證實(shí)了PCASVM方法對(duì)于識(shí)別鮮肉品種有較好的效果。
2實(shí)驗(yàn)部分
2.1實(shí)驗(yàn)裝置
實(shí)驗(yàn)裝置如圖1所示, 采用調(diào)Q開(kāi)關(guān)Nd∶YAG脈沖激光器(Quantel Brilliant B, 波長(zhǎng)532 nm, 脈沖寬度8 ns, 最大重復(fù)頻率10 Hz)。激光經(jīng)過(guò)反射鏡和平凸透鏡(焦距為100 mm)聚焦到樣品表面, 激發(fā)出等離子光譜。
2.2樣品處理
本實(shí)驗(yàn)所采用的鮮肉樣品為: 恩施土豬里脊肉(簡(jiǎn)稱(chēng)為恩施土豬)、黑豬里脊肉(簡(jiǎn)稱(chēng)黑豬)、中糧豬特級(jí)里脊肉(中糧集團(tuán)有限公司, COFCO, 簡(jiǎn)稱(chēng)中糧豬)、牛里脊、牛后腿和雞脯肉, 實(shí)驗(yàn)材料均購(gòu)自當(dāng)?shù)爻?。鮮肉組織制樣的具體步驟為: (1)用醫(yī)用切片刀將鮮肉組織切成長(zhǎng)寬約為50 mm×18 mm、厚2~3 mm的小片, 放在普通載玻片(25.4 mm×76.2 mm)上; (2)用另一塊載玻片壓在肉片上, 并用10 kg重物將其壓制1 min, 使得肉片平鋪在下面的載玻片上, 壓片效果如圖2所示。(3)利用LIBS系統(tǒng)對(duì)制作好的樣品進(jìn)行光譜采集。
3結(jié)果與討論
3.1數(shù)據(jù)采集與提取
采用優(yōu)化的實(shí)驗(yàn)參數(shù), 能量30 mJ/脈沖, 頻率5 Hz。光譜儀積累模式的采集參數(shù): 曝光時(shí)間1 s, 積累次數(shù)為2, 采集延時(shí)時(shí)間為0.9 μs, 門(mén)寬為10 μs, 每幅光譜積累10個(gè)激光脈沖。每種鮮肉壓制5個(gè)樣品, 每樣品采集30幅光譜, 因此6種鮮肉組織樣品共獲得900幅光譜數(shù)據(jù)。
為降低光譜強(qiáng)度的波動(dòng)性的影響, 以生物組織基體元素C 247.86 nm光譜強(qiáng)度對(duì)其它元素譜線強(qiáng)度進(jìn)行歸一化處理。圖3所示為牛里脊LIBS光譜強(qiáng)度歸一化后的全譜圖, 部分分析譜線位置也在全譜中予以標(biāo)出。實(shí)驗(yàn)中所使用的49條譜線也在表1中列出。不同組織間部分主量元素歸一化譜線強(qiáng)度的差異如表2所示。
由表2可知, 價(jià)格較低的中糧豬, 其歸一化譜線Ca/C、Na/C、K/C、Al/C強(qiáng)度明顯低于價(jià)格高的恩施土豬和黑豬; 而兩種不同價(jià)格的牛肉其譜線Ca/C、Na/C、K/C、Al/C強(qiáng)度則高于恩施土豬和黑豬。這表明不同種鮮肉組織元素含量存在較大差異, 這為鮮肉樣品的分類(lèi)奠定了基礎(chǔ)。
3.2主成分分析
主成分分析算法(PCA)是一種高效的信息壓縮方法, 采用特征分解方法獲得最大方差的主成分(PC)來(lái)代替原有變量, 可以消除原始數(shù)據(jù)的相關(guān)性和信息冗雜[31], 通過(guò)優(yōu)化主成分個(gè)數(shù)代替原有變量個(gè)數(shù)進(jìn)行數(shù)學(xué)建模, 提高建模速度和穩(wěn)定度, 并使用得到的主要主成分對(duì)數(shù)據(jù)進(jìn)行聚類(lèi)分析。分析所用的PCA算法和SVM算法程序均在Matlab R2010b環(huán)境下實(shí)現(xiàn)。
獲得的900幅組織光譜經(jīng)譜線強(qiáng)度提取、C線歸一化處理后, 對(duì)其進(jìn)行PCA降維分析。圖4為前3個(gè)主成分下不同種組織光譜的散點(diǎn)圖, 所使用3個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到了95.79%。由圖4可知, 除了部分牛里脊光譜數(shù)據(jù)在三維主成分圖中可聚集到同一區(qū)域, 其它種類(lèi)的鮮肉組織光譜交互在一起, 難以區(qū)分, 因此需結(jié)合其它算法進(jìn)一步區(qū)分。
3.3SVM與PCASVM對(duì)比分析
支持向量機(jī)(SVM)是一種通過(guò)尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小來(lái)提高學(xué)習(xí)機(jī)泛化能力的方法, 實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍最小化, 從而達(dá)到在取樣少亦能達(dá)到良好統(tǒng)計(jì)規(guī)律的目的。其很重要的特點(diǎn)是可以將線性不可分的數(shù)據(jù)通過(guò)構(gòu)造核函數(shù)的方式映射到高維空間中, 從而在高維空間得到線性區(qū)分[20]。本研究采用Chang等[32]開(kāi)發(fā)的支持向量機(jī)軟件工具箱(Library for Support Vector Machines, LIBSVM)進(jìn)行數(shù)據(jù)分類(lèi)處理。數(shù)據(jù)集等分為訓(xùn)練集和測(cè)試集。每個(gè)類(lèi)別設(shè)置標(biāo)簽進(jìn)行區(qū)分, 相同類(lèi)使用相同的標(biāo)簽。因?yàn)閮?nèi)核選擇的是映射徑向基函數(shù), 需要選擇合適的懲罰參數(shù)C和徑向基函數(shù)系數(shù)g才能獲得較佳的預(yù)測(cè)結(jié)果。設(shè)置的方式和優(yōu)化選擇參數(shù)的方法詳見(jiàn)文獻(xiàn)[33], 不同的是本研究使用的是3折交互驗(yàn)證。
為使SVM分類(lèi)模型更加穩(wěn)健, 將每種鮮肉樣品的150幅光譜數(shù)據(jù)隨機(jī)排列, 選擇前75幅光譜進(jìn)行訓(xùn)練, 剩余的75幅光譜進(jìn)行預(yù)測(cè)。在訓(xùn)練過(guò)程中使用交叉驗(yàn)證法選擇最佳的懲罰參數(shù)C和內(nèi)核參數(shù)g。結(jié)果表明, 單獨(dú)的SVM模型平均訓(xùn)練、
在SVM算法中, 輸入變量越多, 訓(xùn)練時(shí)間越長(zhǎng); 且難免存在變量共線性和光譜噪聲的影響。因此采用PCA算法對(duì)原始變量進(jìn)行線性組合對(duì)數(shù)據(jù)進(jìn)行壓縮, 去除多余的變量, 減弱光譜噪聲影響。通過(guò)使用PCA算法對(duì)49個(gè)光譜變量重新組合得到新的49個(gè)主成分, 不同主成分變量數(shù)對(duì)SVM訓(xùn)練集識(shí)別結(jié)果的影響如圖5所示, 主成分?jǐn)?shù)分別在18, 19, 21, 28, 29, 30, 33時(shí)均可達(dá)到最佳的平均訓(xùn)練識(shí)別率88.22%。在同樣的訓(xùn)練識(shí)別率下, 取最小數(shù)目的主成分個(gè)數(shù)可以加快SVM算法的建模效率, 因此本研究采用18個(gè)主成分進(jìn)行建模和分類(lèi)識(shí)別, 其平均預(yù)測(cè)識(shí)別率可達(dá)到89.11%, 高于未降維SVM的識(shí)別效果, 此時(shí)的(C, g)優(yōu)化參數(shù)為(1024.00, 0.0030), 對(duì)比文獻(xiàn)[22]中對(duì)豬肉、牛肉和雞肉識(shí)別率, 提高了5.74%, 具體的識(shí)別結(jié)果如表3所示。SVM與PCASVM建模結(jié)果對(duì)比見(jiàn)表4, 在不降低SVM算法識(shí)別率的情況下, PCA算法的引入大大縮短了SVM建模的時(shí)間, 使得建模時(shí)間從89.11 s降至55.52 s。
4結(jié) 論
通過(guò)對(duì)6種鮮肉進(jìn)行簡(jiǎn)單的載破片壓制處理, 聯(lián)合PCA和SVM算法對(duì)LIBS采集的光譜數(shù)據(jù)進(jìn)行分析和建模, 提高了SVM的建模效率, 獲得較好的識(shí)別效果, 其中建模時(shí)間縮短至55.52 s, 平均預(yù)測(cè)識(shí)別率達(dá)到89.11%。以上結(jié)果表明, LIBS結(jié)合PCA與SVM算法可以用于快速檢測(cè)新鮮肉類(lèi)品種, 為市場(chǎng)鮮肉的快速識(shí)別提供一種新途徑。
References
1Rodríguez M A, García T, González I, Hernández P E, Martín R. Meat Sci., 2005, 70(1): 113-120
2Hites R A. Handbook of Instrumental Techniques For Analytical Chemistry, 1997: 609-626
3VallejoCordoba B, CotaRivas M. J. Capillary Electrophor., 1997, 5(56): 171-175
4Kumar A, Kumar R R, Sharma B D, Gokulakrishnan P, Mendiratta S K, Sharma D. Crit. Rev. Food Sci., 2015, 55(10): 1340-1351
5Radziemski L J. Spectrochim. Acta, 2002, 57(7): 1109-1113
6Radziemski L, Cremers D. Spectrochim. Part B, 2013, 87: 3-10
7CHEN QiMeng, DU Min, HAO ZhongQi, ZOU XiaoHeng, LI JiaMing, YI RongXing, LI XiangYou, LU YongFeng, ZENG XiaoYan. Spectroscopy and Spectral Analysis, 2016, 36(5): 1473-1477
陳啟蒙, 杜 敏, 郝中騏, 鄒孝恒, 李嘉銘, 易榮興, 李祥友, 陸永楓, 曾曉雁. 光譜學(xué)與光譜分析, 2016, 36(5): 1473-1477
8Li C M, Zou Z M, Yang X Y, Hao Z Q, Guo L B, Li X Y, Lu Y F, Zeng X Y. J. Anal. Atom. Spectrom., 2014, 29(8): 1432-1437
9LI JiaMing, CHU YingBo, ZHAO Nan, ZHOU Ran, YI RongXing, GUO LianBo, LI JinYan, LI XiangYou, ZENG XiaoYan, LU YongFeng. Chinese J. Anal. Chem., 2016, 44(7): 1042-1046
李嘉銘, 褚應(yīng)波, 趙 楠, 周 冉, 易榮興, 郭連波, 李進(jìn)延, 李祥友,曾曉雁, 陸永楓. 分析化學(xué), 2016, 44(7): 1042-1046
10SHAO Yan, ZHANG YanBo, GAO Xun, DU Chuang,LIN JingQuan. Spectroscopy and Spectral Analysis, 2013, 33(10): 2593-2598
邵 妍, 張艷波, 高 勛, 杜 闖, 林景全. 光譜學(xué)與光譜分析, 2013, 33(10): 2593-2598
11LIU Li. Las. Optoelect. Prog., 2015, 52(7): 295-299
劉 莉. 激光與光電子學(xué)進(jìn)展, 2015, 52(7): 295-299
12Zeng Q, Guo L, Li X, He C, Shen M, Li K, Duan J, Zeng X, Lu Y. J. Anal. Atom. Spectrom., 2015, 30(2): 403-409
13Hao Z, Guo L, Li C, Shen M, Zou X, Li X, Lu Y, Zeng X. J. Anal. Atom. Spectrom., 2014, 29(12): 2309-2314
14Sun L X, Yu H B, Cong Z B, Xin Y, Li Y, Qi L F. Spectrochim. Acta B, 2015, 112: 40-48
15Rehse S, Salimnia H, Miziolek A. J. Med. Eng. Technol., 2012, 36(2): 77-89
16CHEN TianBing, LIU MuHua, HUANG Lin, ZHOU HuaMao, WANG CaiHong, YANG Hui, HU HuiQin, YAO MingYin. Chinese J. Anal. Chem., 2016, 44(7): 1029-1034
陳添兵, 劉木華, 黃 林, 周華茂, 王彩虹, 楊 暉, 胡慧琴, 姚明印. 分析化學(xué), 2016, 44(7): 1029-1034
17Liu X Y, Zhang W J. J. Med. Biol. Eng., 2008, 1(3): 147
18Yao M, Huang L, Zheng J, Fan S, Liu M. Opt. Laser. Technol., 2013, 52: 70-74
19Singh V K, Rai A K. Laser Med. Sci., 2011, 26(5): 673-687
20Kumar A, Yueh F Y, Singh J P, Burgess S. Appl. Optics, 2004, 43(28): 5399-5403
21Yueh F Y, Zheng H, Singh J P, Burgess S. Spectrochim. Acta B, 2009, 64(10): 1059-1067
22Bilge G, Velioglu H M, Sezer B, Eseller K E, Boyaci I H. Meat Sci., 2016, 119: 118-122
23Cortes C, Vapnik V. Mach. Learn., 1995, 20(3): 273-297
24Yu Y, Guo L, Hao Z, Li X, Shen M, Zeng Q, Li K, Zeng X, Lu Y, Ren Z. Opt. Express, 2014, 22(4): 3895-3901
25Shi Q, Niu G, Lin Q, Xu T, Li F, Duan Y. J. Anal. Atom. Spectrom., 2015, 30(12): 2384-2393
26Yu K Q, Zhao Y R, Liu F, He Y. Sci. Rep., 2015, 6: 27574-27574
27Yang H X, Fu H B, Wang D H, Jia J W, Dong F Z. Chinese Phys. B, 2016, 25(6): 290-295
28Sankaran S, Ehsani R, Morganc K T. Appl. Spectrosc., 2015, 69(8): 913-919
29Pokrajac D, Lazarevic A, Kecman V, Marcano A, Markushin Y, Vance T, Reljin N, McDaniel S, Melikechi N. Appl. Spectrosc., 2014, 68(9): 1067-1075
30Pearse R W B, Gaydon A G, Pearse R W B, Gaydon A G. The Identification Of Molecular Spectra (Chapman and Hall London), 1976, Vol. 297
31YIN Fei, FENG DaZheng. Comput. Technol. Dev., 2008, 18(10): 31-33
尹 飛, 馮大政. 計(jì)算機(jī)技術(shù)與發(fā)展, 2008, 18(10): 31-33
32Chang C C, Lin C J. Acm. T. Intel. Syst. Tec., 2011, 2(3): 27
33YU Yang, HAO ZhongQi, LI ChangMao, GUO LianBo, LI KuoHu, ZENG QinDong, LI XiangYou, REN Zhao, ZENG XiaoYan. Acta. Phys. Sin, 2013, 62(21): 215201-215201
于 洋, 郝中騏, 李常茂, 郭連波, 李闊湖, 曾慶棟, 李祥友, 任 昭, 曾曉雁. 物理學(xué)報(bào), 2013, 62(21): 215201-215201
AbstractTo improve the classification accuracy of fresh meat species using laserinduced breakdown spectroscopy (LIBS), the support vector machine (SVM) and principal component analysis (PCA) were combined to classify fresh meat species (including pork, beef, and chicken). A simple sample preparation to flatten fresh meat by glass slides was proposed. For each meat sample, 150 spectra were recorded and randomly arranged. The first 75 spectra were used to train a model while the others were used for model validation. By analyzing the 49 normalized spectral lines (K, Ca, Na, Mg, Al, H, O, etc.) in the different tissues, the classification model was built. The results showed that the dimensionality of input variables was decreased from 49 to 10 and modeling time was reduced from 89.11 s to 55.52 s using PCA, thus improving the modeling efficiency. The mean classification accuracy of 89.11% was achieved. The method and reference data are provided for further study of fresh meat classification by laserinduced breakdown spectroscopy technique.
KeywordsLaserinduced breakdown spectroscopy; Support vector machine; Principal component analysis; Tissue classification