国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于近紅外光譜分析技術(shù)的水蜜桃產(chǎn)地溯源

2020-05-27 09:41:48孫曉明陳小龍余向陽卞立平孫愛東
關(guān)鍵詞:近紅外光譜水蜜桃支持向量機(jī)

孫曉明 陳小龍 余向陽 卞立平 孫愛東

摘要:利用近紅外光譜分析技術(shù)對(duì)來自3個(gè)省份的水蜜桃進(jìn)行研究,比較主成分分析-線性判別分析(PCA-LDA)、 判別偏最小二乘法(DPLS)、 支持向量機(jī)(SVM)等方法對(duì)光譜數(shù)據(jù)識(shí)別的有效性差異。結(jié)果表明, SVM的準(zhǔn)確率和召回率均高達(dá)94.47%,明顯優(yōu)于 PCA-LDA和DPLS,更適用于水蜜桃產(chǎn)地溯源。

關(guān)鍵詞:水蜜桃;產(chǎn)地溯源;近紅外光譜;主成分分析-線性判別分析;判別偏最小二乘;支持向量機(jī)

中圖分類號(hào):TS207.7文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1000-4440(2020)02-0507-06

Abstract:In this study, honey peaches from three provinces were analyzed by ?near infrared spectroscopy analysis technique, and the effectiveness of principal component analysis-linear discriminant analysis (PCA-LDA), discriminant partial least squares (DPLS) and support vector machine (SVM) for spectral data recognition was compared. The results showed that the precision and recall rate of SVM were 94.47%. The SVM method was obviously better than PCA-LDA and DPLS, and it was more suitable for traceability of honey peach origin.

Key words:honey peach;geographical origin traceability;near infrared spectroscopy;principal component analysis-linear discriminant analysis;discriminant partial least squares;support vector machine

隨著生活水平的提高,人們的食品安全意識(shí)大大增強(qiáng),地域特色產(chǎn)品越來越受到市場(chǎng)的認(rèn)可。這些產(chǎn)品通常會(huì)帶來良好的經(jīng)濟(jì)效益。針對(duì)地域特色產(chǎn)品的以假亂真、以次充好現(xiàn)象大量存在,既損害了消費(fèi)者權(quán)利,又打擊了生產(chǎn)者積極性[1-2]。因此,開展地域特色產(chǎn)品產(chǎn)地溯源技術(shù)研究,對(duì)于推動(dòng)溯源體系的建立與完善,促進(jìn)農(nóng)產(chǎn)品安全有效監(jiān)管具有重要意義。產(chǎn)地溯源技術(shù)主要分兩大類[3-6]:一是電子信息編碼技術(shù),即將農(nóng)產(chǎn)品產(chǎn)地信息及生產(chǎn)、加工等環(huán)節(jié)的相關(guān)信息關(guān)聯(lián)到電子信息載體,消費(fèi)者通過二維碼等識(shí)別農(nóng)產(chǎn)品的產(chǎn)地;二是化學(xué)生物分析技術(shù),即通過檢測(cè)農(nóng)產(chǎn)品的成分來獲知產(chǎn)地信息,包括近紅外光譜分析技術(shù)、同位素分析技術(shù)等。其中,近紅外光譜分析技術(shù)因具有操作簡(jiǎn)單、檢測(cè)速度快、重現(xiàn)性好、綠色環(huán)保、成本低等特點(diǎn)[7],已經(jīng)成為一種重要的農(nóng)產(chǎn)品產(chǎn)地溯源識(shí)別技術(shù)手段。

近紅外光譜主要反映有機(jī)物分子中C-H、N-H、O-H等含氫基團(tuán)振動(dòng)的倍頻和合頻吸收信息。不同產(chǎn)地的農(nóng)產(chǎn)品,因?yàn)槠贩N、產(chǎn)地環(huán)境、加工方法等不同,其有機(jī)物組成和含量存在較大差異,形成近紅外光譜中的差異。通過分析近紅外光譜,可以對(duì)農(nóng)產(chǎn)品進(jìn)行產(chǎn)地溯源、真?zhèn)舞b別和品質(zhì)檢測(cè)[8-16]。目前近紅外光譜分析技術(shù)已得到廣泛應(yīng)用,李勇等采用主成分分析和線性判別分析對(duì)大米進(jìn)行產(chǎn)地溯源分析[17]。姜亦南等采用傅里葉變換近紅外光譜法結(jié)合SIMCA模式識(shí)別算法對(duì)三七進(jìn)行產(chǎn)地鑒別[18]。對(duì)水蜜桃的相關(guān)研究較少。李劍等采用主成分分析結(jié)合最小二乘法建立了水蜜桃采摘期的鑒別模型[19]。王銘海等建立了3個(gè)不同品種桃可溶性固形物含量預(yù)測(cè)模型[20]。

鑒于目前應(yīng)用近紅外光譜分析技術(shù)識(shí)別水蜜桃產(chǎn)地的研究較少,本研究采用此技術(shù),通過光譜預(yù)處理等手段結(jié)合模式識(shí)別方法進(jìn)行水蜜桃產(chǎn)地識(shí)別研究,并在江蘇、山東、福建3個(gè)省份的水蜜桃上進(jìn)行試驗(yàn),為水蜜桃產(chǎn)地溯源提供依據(jù)。

1材料與方法

1.1數(shù)據(jù)采集

1.1.1水蜜桃樣品采集分別采集產(chǎn)自江蘇省、山東省、福建省的“湖景”水蜜桃樣品各50個(gè)。樣品放置于空氣溫度25 ℃、濕度75%的環(huán)境中。

1.1.2近紅外光譜數(shù)據(jù)采集利用Thermo Antaris II傅里葉變換近紅外分析儀,采用漫反射方式采集水蜜桃樣品的近紅外光譜。以儀器內(nèi)部空氣為背景,光譜掃描波數(shù)為4 000~10 000 cm-1,掃描間隔為3.856 cm-1,每條光譜有1 557個(gè)點(diǎn),掃描次數(shù)32次,4倍增益。在果實(shí)赤道上選擇3個(gè)相距120°的位置測(cè)定漫反射光譜,3個(gè)位置的平均值作為該果實(shí)的光譜測(cè)定值。

1.2數(shù)據(jù)分析

1.2.1主成分分析-線性判別分析主成分分析(Principal component analysis,PCA)是最常用的無監(jiān)督降維方法,該方法把原始高維變量轉(zhuǎn)化為幾個(gè)主成分,使得每一維上的樣品方差都很大[21]。這些主成分通常表示為原始變量的線性組合,不僅能夠反映原始變量的大部分信息,而且各主成分之間相互獨(dú)立。線性判別分析(Linear discriminant analysis,LDA)是一種監(jiān)督學(xué)習(xí)的判別分析方法,首先通過訓(xùn)練集建立線性判別函數(shù),該判別函數(shù)使得類內(nèi)方差最小、類間方差最大,即具有最佳的可分離性,然后利用判別函數(shù)對(duì)測(cè)試集樣品進(jìn)行識(shí)別[22]。對(duì)PCA分析過的數(shù)據(jù)使用LDA進(jìn)一步降維,可以將最佳描述特征轉(zhuǎn)化為最佳判別特征進(jìn)行分類識(shí)別[23]。

1.2.2判別偏最小二乘法判別偏最小二乘法(Discriminant partial least squares,DPLS)是一種將定量偏最小二乘法(Partial least squares,PLS)用于判別分析的方法,通過建立自變量與因變量之間的多元統(tǒng)計(jì)回歸模型進(jìn)行分析[24]。和PCA方法類似,該方法同樣采取了成分提取的方式,不同的是,提取成分時(shí)不僅僅要求成分能夠較好地概括自變量的信息,同時(shí)要求對(duì)因變量的解釋能力達(dá)到最大。成分通過迭代法逐步提取,成分個(gè)數(shù)通過交叉有效性檢驗(yàn)來確定。根據(jù)PLS模型的預(yù)測(cè)值確定樣品的類別。

1.2.3支持向量機(jī)支持向量機(jī)(Support vector machine,SVM)是一個(gè)經(jīng)典的分類模型,主要思想是在特征空間上建立最優(yōu)超平面使得類之間的間隔最大,在解決小樣本、非線性及高維數(shù)據(jù)等問題中表現(xiàn)出許多特有的優(yōu)勢(shì)[25-26]。SVM首先通過非線性映射函數(shù)將樣品從原始特征空間映射到高維特征空間,然后構(gòu)造最優(yōu)決策函數(shù),綜合考慮結(jié)構(gòu)風(fēng)險(xiǎn)最小化和經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,確定模型參數(shù),同時(shí)引入間隔的概念。SVM的優(yōu)化目標(biāo)為:

采用十折交叉驗(yàn)證法將樣品劃分為訓(xùn)練集和測(cè)試集,取每類的10%作為測(cè)試集,隨機(jī)使用不同的劃分10次,10次十折交叉試驗(yàn)的均值作為最終的試驗(yàn)結(jié)果。所有數(shù)據(jù)分析均在MATLAB R2016a中編程實(shí)現(xiàn)。

2結(jié)果分析

2.1水蜜桃樣品的近紅外光譜

圖1a是所有水蜜桃樣品的原始光譜,圖1b是不同省份水蜜桃樣品的原始光譜均值。圖1b中3個(gè)省份的均值光譜明顯區(qū)分開,且江蘇省和山東省的距離較近。而圖1a中近紅外光譜之間重疊嚴(yán)重,不能直接區(qū)分產(chǎn)地,存在光散射、基線漂移等問題,對(duì)試驗(yàn)結(jié)果影響較大,需要采取適當(dāng)?shù)墓庾V預(yù)處理方法去除干擾[28],以便更好地分析。常見的光譜預(yù)處理方法有平滑(Smoothing)、一階導(dǎo)數(shù)(1st Der)、二階導(dǎo)數(shù)(2nd Der)、標(biāo)準(zhǔn)正態(tài)變換(SNV)、多元散射校正(MSC)、小波變換(WT)等。試驗(yàn)中采用SNV方法對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,處理后的光譜見圖2。

2.2PCA-LDA方法分析

首先對(duì)全波段光譜數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后使用奇異值分解進(jìn)行主成分分析。累計(jì)貢獻(xiàn)率達(dá)到99%時(shí)即可確定主成分?jǐn)?shù)目。前10個(gè)主成分的貢獻(xiàn)率見表1,主成分?jǐn)?shù)目為7時(shí),累計(jì)貢獻(xiàn)率超過99%。圖3為前2個(gè)主成分的得分圖,主成分1和主成分2分別解釋了總方差的65.81%和17.78%。由圖3可見,利用前2個(gè)主成分時(shí),山東省和福建省的水蜜桃樣品在距離上基本分開,但均和江蘇省的有重疊,且江蘇省和山東省的重疊區(qū)域較大,僅使用PCA方法不能直接區(qū)分3個(gè)省份的樣品。

2.5不同分析方法的分類結(jié)果對(duì)比

不同方法的分類結(jié)果見表3。可以發(fā)現(xiàn),PCA-LDA方法對(duì)江蘇省、山東省、福建省的水蜜桃預(yù)測(cè)正確率分別為81.40%、87.40%和100.00%,DPLS方法的預(yù)測(cè)正確率分別為66.40%、83.60%和78.60%,SVM方法的預(yù)測(cè)正確率分別為89.20%、95.00%和99.20%,3類基本區(qū)分開,SVM方法的分類識(shí)別正確率最高。江蘇省和山東省的水蜜桃之間最容易發(fā)生誤判,可能是因?yàn)榻K省和山東省地理位置比較接近,生長(zhǎng)環(huán)境、氣候等方面更加相似??傮w上看,PCA-LDA方法的準(zhǔn)確率為89.51%,召回率為89.60%。DPLS方法的識(shí)別結(jié)果最不理想,準(zhǔn)確率僅為79.50%,召回率僅為76.20%,可能是由于沒有選擇合適的預(yù)處理方法導(dǎo)致。SVM方法通過間隔的概念,得到對(duì)數(shù)據(jù)分布的結(jié)構(gòu)化描述,基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,泛化能力強(qiáng),因此分類效果最好,準(zhǔn)確率達(dá)到94.47%,召回率達(dá)到94.47%。綜合來看,采用近紅外光譜分析技術(shù)對(duì)水蜜桃進(jìn)行產(chǎn)地溯源是可行的,結(jié)果令人滿意。

3結(jié)論

本研究采用近紅外光譜分析技術(shù)實(shí)現(xiàn)水蜜桃的產(chǎn)地識(shí)別,在對(duì)近紅外光譜數(shù)據(jù)進(jìn)行SNV預(yù)處理的基礎(chǔ)上,利用PCA-LDA、DPLS、SVM方法對(duì)江蘇、山東、福建3個(gè)省份的150個(gè)水蜜桃樣品進(jìn)行產(chǎn)地溯源研究。試驗(yàn)結(jié)果表明,3種方法均可識(shí)別水蜜桃的產(chǎn)地,其中SVM方法的識(shí)別結(jié)果最優(yōu),對(duì)江蘇省、山東省、福建省的水蜜桃識(shí)別正確率分別為89.20%、95.00%、99.20%,準(zhǔn)確率和召回率均達(dá)到94.47%。該方法可為農(nóng)產(chǎn)品產(chǎn)地溯源研究提供參考。下一步研究將考慮提取與地域相關(guān)的特征波長(zhǎng),去除干擾信息,加快訓(xùn)練速率,進(jìn)一步提高該方法的性能。

參考文獻(xiàn):

[1]管驍,古方青,楊永健. 近紅外光譜技術(shù)在食品產(chǎn)地溯源中的應(yīng)用進(jìn)展[J]. 生物加工過程, 2014, 12(2):77-82.

[2]錢麗麗,于果,遲曉星,等. 農(nóng)產(chǎn)品產(chǎn)地溯源技術(shù)研究進(jìn)展[J]. 食品工業(yè), 2018, 39(1):246-249.

[3]COZZOLINO D. An overview of the use of infrared spectroscopy and chemometrics in authenticity and traceability of cereals[J]. Food Research International, 2014, 60(6):262-265.

[4]LOHUMI S, LEE S, LEE H, et al. A review of vibrational spectroscopic techniques for the detection of food authenticity and adulteration[J]. Trends in Food Science & Technology, 2015, 46(1):85-98.

[5]陳璐,谷曉紅,張丙春,等. 食品產(chǎn)地溯源技術(shù)研究進(jìn)展[J].安徽農(nóng)業(yè)科學(xué), 2015, 43(36):109-111.

[6]曾楚鋒,張麗芬,徐娟娣,等.農(nóng)產(chǎn)品產(chǎn)地溯源技術(shù)研究進(jìn)展[J].食品工業(yè)科技, 2013,34(6):367-371.

[7]張勇,王督,李雪,等.基于近紅外光譜技術(shù)的農(nóng)產(chǎn)品產(chǎn)地溯源研究進(jìn)展[J].食品安全質(zhì)量檢測(cè)學(xué)報(bào),2018,9(23):6161-6166.

[8]HU X, LIU S, LI X, et al. Geographical origin traceability of cabernet sauvignon wines based on infrared fingerprint technology combined with chemometrics[J]. Scientific Reports, 2019, 9:8256-8263.

[9]EISENSTECKEN D, STRZ B, ROBATSCHER P, et al. The potential of near infrared spectroscopy (NIRS) to trace apple origin:Study on different cultivars and orchard elevations[J]. Postharvest Biology and Technology, 2019, 147:123-131.

[10]MANFREDI M, ROBOTTI E, QUASSO F, et al. Fast classification of hazelnut cultivars through portable infrared spectroscopy and chemometrics[J]. Spectrochim Acta A Mol Biomol Spectrosc, 2018, 189:427-435.

[11]MOSCETTI R, HAFF R P, STELLA E, et al. Feasibility of NIR spectroscopy to detect olive fruit infested by Bactrocera oleae[J]. Postharvest Biology and Technology, 2015, 99:58-62.

[12]仇遜超. 紅松仁脂肪的近紅外光譜定量檢測(cè)[J]. 江蘇農(nóng)業(yè)學(xué)報(bào), 2018, 34(3):217-223.

[13]廖秋紅,何紹蘭,謝讓金,等. 基于近紅外光譜的紐荷爾臍橙產(chǎn)地識(shí)別研究[J]. 中國農(nóng)業(yè)科學(xué), 2015, 48(20):4111-4119.

[14]羅微,杜焱喆,章海亮. PCA和SPA的近紅外光譜識(shí)別白菜種子品種研究[J]. 光譜學(xué)與光譜分析, 2016, 36(11):3536-3541.

[15]顧玉琦,劉瑞婷,壽國忠,等. 應(yīng)用近紅外光譜技術(shù)快速鑒別鐵皮石斛的產(chǎn)地[J]. 江蘇農(nóng)業(yè)科學(xué), 2016, 44(5):365-368.

[16]向伶俐,李夢(mèng)華,李景明,等. 近、中紅外光譜法融合判定葡萄酒產(chǎn)地[J]. 光譜學(xué)與光譜分析, 2014, 34(10):2662-2666.

[17]李勇,嚴(yán)煌倩,龍玲,等. 化學(xué)計(jì)量學(xué)模式識(shí)別方法結(jié)合近紅外光譜用于大米產(chǎn)地溯源分析[J]. 江蘇農(nóng)業(yè)科學(xué), 2017, 45(21):193-195.

[18]姜亦南,藺明煊,何帥,等. 基于紅外光譜法結(jié)合SIMCA模式識(shí)別不同產(chǎn)地三七[J]. 中醫(yī)藥學(xué)報(bào), 2019, 47 (1):54-57.

[19] 李劍,李臻峰,宋飛虎,等. 基于近紅外光譜的水蜜桃采摘期的鑒別方法[J]. 傳感器與微系統(tǒng), 2017, 36(10):48-50.

[20]王銘海,郭文川,商亮,等. 基于近紅外漫反射光譜的多品種桃可溶性固形物的無損檢測(cè)[J]. 西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2014, 42(2):142-148.

[21]JOLLIFFE I T. Principal component analysis[M]. New York:Springer, 2002.

[22]邵圣枝,陳元林,張永志,等. 稻米中同位素與多元素特征及其產(chǎn)地溯源PCA-LDA判別[J]. 核農(nóng)學(xué)報(bào), 2015, 29(1):119-127.

[23]陳慶,黃蕾,李雪梅. 基于主成分判別分析的高光譜遙感影像分類方法[J]. 地理空間信息, 2016, 14(1):76-78.

[24]賈文珅. 基于多源信息融合的龍井茶產(chǎn)地鑒別研究[D]. 長(zhǎng)春:吉林大學(xué), 2014.

[25]NELLO C, JOHN S. 支持向量機(jī)導(dǎo)論[M]. 北京:電子工業(yè)出版社, 2004:82-98.

[26]褚璇,王偉,趙昕,等. 近紅外光譜和特征光譜的山茶油摻假鑒別方法研究[J]. 光譜學(xué)與光譜分析, 2017, 37(1):75-79.

[27]周志華. 機(jī)器學(xué)習(xí)[M]. 北京:清華大學(xué)出版社, 2016:30.

[28]褚小立. 近紅外光譜分析技術(shù)實(shí)用手冊(cè)[M]. 北京:機(jī)械工業(yè)出版社, 2016:115-117.

(責(zé)任編輯:張震林)

猜你喜歡
近紅外光譜水蜜桃支持向量機(jī)
七彩夏令營“戀”上水蜜桃
聰聰吃水蜜桃
芳香甜美的水蜜桃兒
水蜜桃價(jià)格下跌 后期恐難以走高
動(dòng)態(tài)場(chǎng)景中的視覺目標(biāo)識(shí)別方法分析
論提高裝備故障預(yù)測(cè)準(zhǔn)確度的方法途徑
基于近紅外光譜法的藜麥脂肪含量快速檢測(cè)
基于熵技術(shù)的公共事業(yè)費(fèi)最優(yōu)組合預(yù)測(cè)
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
中國當(dāng)代醫(yī)藥(2016年19期)2016-09-30 20:42:57
汉中市| 湘潭市| 佛冈县| 陆良县| 三台县| 东山县| 贵溪市| 宁德市| 健康| 平利县| 五家渠市| 华蓥市| 乐陵市| 什邡市| 彭阳县| 迁西县| 溧阳市| 龙山县| 长寿区| 泾阳县| 中卫市| 镇康县| 丹寨县| 徐闻县| 余干县| 湖南省| 偃师市| 松滋市| 安福县| 蛟河市| 新干县| 桃园市| 湛江市| 灌云县| 蒙自县| 海兴县| 汾西县| 晋中市| 禄劝| 秦皇岛市| 芮城县|