李勇 嚴煌倩 龍玲 余向陽
摘要:對江蘇、遼寧、湖北、黑龍江4個省份的169個大米樣品,利用波數(shù)測定范圍為10 000~4 000 cm-1的Thermo Antaris Ⅱ傅里葉變換近紅外分析儀,采用化學計量學模式識別主成分分析(PCA)和線性判別分析(LDA)方法進行產(chǎn)地溯源分析。結果表明,PCA方法基于前2個主成分可基本區(qū)分大米產(chǎn)地,但各類樣品有部分重疊;采用PCA-LDA法可更有效區(qū)分大米產(chǎn)地,利用蒙特卡羅模擬方法隨機重復選取訓練集和預測集判別4個省份的大米產(chǎn)地準確率在9300%以上,識別準確率相對較高。因此,化學計量學模式識別方法結合紅外光譜用于大米產(chǎn)地溯源分析具有一定的可行性和應用價值。
關鍵詞:大米;產(chǎn)地溯源;化學計量學;主成分分析(PCA);線性判別分析(LDA)
中圖分類號: TS2077文獻標志碼: A
文章編號:1002-1302(2017)21-0193-03
收稿日期:2017-06-14
基金項目:國家自然科學基金(編號:31601665);江蘇省自然科學基金(編號:BK20160576)。
作者簡介:李勇(1987—),男,黑龍江鶴崗人,博士,助理研究員,主要從事農(nóng)產(chǎn)品質量安全研究。Tel:(021)84391229;E-mail:liyong_213@163com。
通信作者:余向陽,博士,研究員,主要從事農(nóng)產(chǎn)品質量安全研究。E-mail:yuxy@jaasaccn。
地理標志產(chǎn)品具有獨特的品質和較高的經(jīng)濟效益,備受消費者青睞。然而,假冒偽劣的地理標志產(chǎn)品極為普遍,嚴重擾亂市場秩序,損害消費者利益,因此,為整頓市場秩序,急需建立完善的地理標志產(chǎn)品產(chǎn)地溯源分析方法。目前,常用的產(chǎn)地溯源分析方法有近紅外光譜(NIR)分析技術、色譜分析技術、DNA溯源技術、同位素分析技術等,均有一定的應用前景1-2],其中,近紅外光譜技術作為一種新型的快速檢測技術,具有分析速度快、成本低、無損檢測、重現(xiàn)性好等特點,常應用于食品、農(nóng)產(chǎn)品、藥品中感興趣成分的快速定性定量分析3-4]。
來源不同產(chǎn)地的地理標志產(chǎn)品其化學成分及各組分含量存在差異,致使近紅外光譜也存在差異,而使近紅外光譜能夠反映出地理標志產(chǎn)品的產(chǎn)地特征信息。近紅外光譜屬分子吸收光譜,主要反映有機物分子中C—H、N—H、O—H等含氫基團振動光譜信息,檢測波數(shù)范圍為12 820~4 000 cm-1,由于其光譜吸收帶相對較寬,譜帶重疊較為嚴重,利用傳統(tǒng)分析方法鑒定產(chǎn)地信息比較困難5],而近紅外光譜結合化學計量學模式識別方法可更加有效地區(qū)分不同產(chǎn)地產(chǎn)品的光譜差異6]。目前,常用的化學計量學模式識別方法分為2類,即無監(jiān)督模式識別和有監(jiān)督模式識別5-8]。無監(jiān)督模式識別法又稱為聚類分析法,包括系統(tǒng)聚類法、最小生成樹、主成分分析法(PCA)等5],類似樣本在多維空間中彼此距離相對較近,而不相似樣品的空間距離相對較遠,“物以類聚”;有監(jiān)督模式識別包括距離判別法、線性判別分析(LDA)、偏最小二乘判別分析法(PLS-DA)等,是利用已知類別的樣品作為訓練集,建立判別模型,再利用模型對未知樣品類別進行預測5]。
近紅外光譜結合化學計量學模式識別方法(SIMCA)已廣泛應用于食品、農(nóng)產(chǎn)品品質鑒定及真?zhèn)舞b別中9-16]。劉威等利用近紅外光譜結合主成分分析及聚類分析研究法國波爾多、我國河北昌黎和沙城葡萄酒產(chǎn)地的溯源分析,準確率達到889%17];湯麗華等利用SIMCA方法結合近紅外光譜區(qū)分寧夏回族自治區(qū)、甘肅省、青海省、內蒙古自治區(qū)、河北省等8個產(chǎn)地的枸杞,所建模型識別率達到80%以上18];周健等采用PLS和歐氏距離結合近紅外光譜方法實現(xiàn)了茶葉原料的鑒別19];錢麗麗等基于PLS-DA結合近紅外方法對黑龍江省五常、佳木斯、齊齊哈爾、雙鴨山、牡丹江5個水稻產(chǎn)區(qū)進行溯源研究20]。本研究利用化學計量學模式識別方法結合近紅外光譜對江蘇、遼寧、湖北、黑龍江4個省份的169個大米樣品進行產(chǎn)地溯源分析,建立大米產(chǎn)地溯源模型,為大米產(chǎn)地溯源研究提供理論依據(jù)。
1材料與方法
11材料
試驗于2016年進行,共采集江蘇、遼寧、湖北、黑龍江4個省份的大米樣品169個,分別為江蘇省泰州市45個樣品,品種為南梗46;遼寧省盤錦市45個樣品,品種為盤錦大米;湖北省荊門市39個樣品,品種為橋米;黑龍江省五常市45個樣品,品種為五常香米。大米樣品進行脫殼、脫糙,封存,待測。
12數(shù)據(jù)采集
Thermo Antaris Ⅱ傅里葉變換近紅外分析儀采用反射積分球模式采集大米近紅外光譜,儀器參數(shù)為波數(shù)范圍 10 000~4 000 cm-1,掃描間隔3856 cm-1,每條光譜包含 1 557個點。每個樣品采集60次,取平均值作為樣品最終光譜;以樣品為行變量,以近紅外光譜波數(shù)為列變量,獲得大小為169×1 557的數(shù)據(jù)陣。
13數(shù)據(jù)分析
利用Matlab軟件對近紅外光譜數(shù)據(jù)進行預處理、主成分分析、線性判別分析,相關程序為筆者所在實驗室科研人員自編。
2結果與分析
21數(shù)據(jù)預處理
由圖1-a可見,利用近紅外漫反射光譜采集大米樣品光譜會存在一定的散射和噪聲干擾,且同一省份大米樣品的光譜差異較大,會對后續(xù)數(shù)據(jù)分析產(chǎn)生很大影響。試驗采用標準正態(tài)變換(SNV)方法對近紅外數(shù)據(jù)進行預處理,以去除數(shù)據(jù)中散射和噪聲的干擾。由圖1-b可見,經(jīng)預處理后,4個省份的大米樣品光譜均重疊在一起,幾乎不能用肉眼來進行區(qū)分。
22主成分分析(PCA)
主成分分析是一種常用的數(shù)據(jù)降維方法,主要是對數(shù)據(jù)中的原始變量進行線性組合,得到幾個正交的成分即主成分,對原數(shù)據(jù)的協(xié)方差陣進行解釋,在主成分分析投影圖中相近的樣品將會聚到一起,而不相似的樣品空間距離相對較遠21]。本試驗利用奇異值分解方法對試驗數(shù)據(jù)進行主成分分析,在數(shù)據(jù)分析前,對數(shù)據(jù)進行歸一化處理。分析結果表明,前6個主成分的累計方差貢獻率分別為6041%、2803%、446%、242%、151%、033%,其中前5個主成分的累計方差貢獻率為9683%,確定主成分數(shù)為5。由圖2可見,利用前2個主成分基本可以區(qū)分4個省份的大米樣品,但部分樣品有重疊;利用其他主成分投影時,不同類別樣品重疊則更為嚴重。endprint
23線性判別分析(LDA)
線性判別分析是一種有監(jiān)督學習型的簡單線性判別函數(shù)分析方法,其訓練集構建函數(shù)要求組內方差最小、組間方差最大,再利用構建函數(shù)對未知樣品類別進行預測22]。本試驗利用蒙特卡洛模擬方法,將大米樣品隨機分為訓練集、預測集,利用LDA對訓練集樣品建立大米產(chǎn)地溯源模型,并利用已建立的模型對預測樣品進行判定。根據(jù)PCA結論,該數(shù)據(jù)的組分數(shù)為5,因此,LDA對前5個主成分進行分析?;谟柧毤?,得到3個判別函數(shù),即Function1、Function2、Function3:
Function1=0017×PC1+0010×PC2+0011×PC3-0095×PC4+0104×PC5+0027;
Function2=0018×PC1+0121×PC2-0277×PC3+0537×PC4-0739×PC5+0146;
Function3=0674×PC1-0958×PC2+3131×PC3-0064×PC4+1732×PC5+0715。
式中:Function1用于區(qū)分江蘇產(chǎn)地與其他3個省份的大米樣品,F(xiàn)unction2用于區(qū)分遼寧省和湖北、黑龍江2個省份的大米樣品,F(xiàn)unction3用于區(qū)分湖北省和黑龍江省的大米樣品。利用蒙特卡洛模擬方法隨機重復計算1 000次,結果由表1可見,在訓練集中,識別江蘇省大米的準確率為9625%,375% 的江蘇省大米樣品錯誤判別為湖北省大米,遼寧、湖北2個省份的大米樣品識別準確率均為10000%,黑龍江省大米識別率為9409%,591%的黑龍江省大米樣品被判定為江蘇省大米,總體而言,預測結果的正確率在9400%以上,訓練集結果的準確率相對較高,令人滿意;在預測集中,識別江蘇、遼寧、湖北、黑龍江4個省份大米樣品的準確率分別為 9491%、10000%、10000%、9397%,預測結果的準確率也較高。因此,PCA-LDA方法可有效區(qū)分不同地區(qū)的大米。
3結論
利用化學計量學主成分分析(PCA)和線性判別分析(LDA)結合近紅外光譜,對江蘇、遼寧、湖北、黑龍江4個省份的169個大米樣品進行產(chǎn)地溯源分析,結果表明,利用Thermo Antaris Ⅱ傅里葉變換近紅外分析儀測定大米近紅外光譜會存在散射和噪聲的干擾,在采用標準正態(tài)變換(SNV)方法去雜、去噪的基礎上,PCA方法基本可區(qū)分大米產(chǎn)地,但各類樣品有部分重疊,而PCA-LDA法可更有效地區(qū)分大米產(chǎn)地,利用蒙特卡羅模擬方法重復隨機篩選訓練集和預測集,識別4個省份大米品種的準確率在9300%以上。因此,化學計量學模式識別方法結合紅外光譜可對大米產(chǎn)地進行溯源分析,具有一定的可行性和應用價值。LL]
參考文獻:
1]ZK(#]魏益民,郭波莉,魏帥,等 食品產(chǎn)地溯源及確證技術研究和應用方法探析J] 中國農(nóng)業(yè)科學,2012,45(24):5073-5081
2]張曉焱,蘇學素,焦必寧,等 農(nóng)產(chǎn)品產(chǎn)地溯源技術研究進展J] 食品科學,2010,31(3):271-278
3]褚小立,劉慧穎,燕澤程 近紅外光譜分析技術實用手冊M] 北京:機械工業(yè)出版社,2016:114-161
4]褚小立,陸婉珍 近五年我國近紅外光譜分析技術研究與應用進展J] 光譜學與光譜分析,2014,34(10):2595-2605
5]梁逸曾,俞汝勤 分析化學手冊:化學計量學M] 北京:化學工業(yè)出版社,2000
6]許祿 化學計量學:一些重要方法的原理及應用M] 北京:科學出版社,2004:1-25
7]吳海龍,俞汝勤 化學多維校正的若干新進展J] 化學通報,2011,74(9):771-782
8]Wold S Chemometrics:what do we mean with it,and what do we want from it?J] Chemometrics and Intelligent Laboratory Systems,1995,3(1):109-115
9]趙杰文,畢夏坤,林顥,等 雞蛋新鮮度的可見-近紅外透射光譜快速識別J] 激光與光電子學進展,2013,50(5):209-216
10]ZK(#]Pholpho T,Pathaveerat S,Sirisomboon P Classification of long an fruit bruising using visible spectroscopyJ] Journal of Food Engineering,2011,104(1):169-172
11]呂強,湯明杰,趙杰文,等 近紅外光譜預測獼猴桃硬度模型的簡化研究J] 光譜學與光譜分析,2009,29(7):1768-1771
12]邵圣枝,陳元林,張永志,等 稻米中同位素與多元素特征及其產(chǎn)地溯源PCA-LDA判別J] 核農(nóng)學報,2015,29(1):119-127
13]楊春艷,劉飛,王元忠 紅外光譜結合判別分析對瑪咖產(chǎn)地的鑒別J] 江蘇農(nóng)業(yè)科學,2017,45(5):170-173
14]顧玉琦,劉瑞婷,壽國忠,等 應用近紅外光譜技術快速鑒別鐵皮石斛的產(chǎn)地J] 江蘇農(nóng)業(yè)科學,2016,44(5):365-368
15]劉飛,楊春艷,道永艷,等 傅里葉變換紅外光譜對滇重樓生長年限的鑒別研究J] 江蘇農(nóng)業(yè)科學,2016,44(2):300-303,304
16]武小紅,孫俊,武斌,等 基于聯(lián)合區(qū)間偏最小二乘判別分析的豬肉近紅外光譜定性建模分析J] 激光與光電子學進展,2015,52(4):242-247
17]劉威,戰(zhàn)吉宬,董衛(wèi)東,等 基于近紅外光譜技術的葡萄酒原產(chǎn)地辨識方法J] 農(nóng)業(yè)工程學報,2010(增刊1):374-378
18]湯麗華,劉敦華 基于近紅外光譜技術的枸杞產(chǎn)地溯源研究J] 食品科學,2011,32(22):175-178
19]周健,成浩,曾建明,等 基于近紅外的多相偏最小二乘模型組合分析實現(xiàn)茶葉原料品種鑒定與溯源的研究J] 光譜學與光譜分析,2010,30(10):2650-2653
20]錢麗麗,冷候喜,宋雪健,等 基于PLS-DA判別法對黑龍江大米產(chǎn)地溯源的研究J] 食品工業(yè),2017,38(1):171-174
21]Brereton G,Brereton Chemometrics for pattern recognitionM] New Jersey:John Wiley & Sons Inc,2009
22]Galdón B R,Rodríguez L H,Mesa D R,et al Differentiation of potato cultivars experimentally cultivated based on their chemical composition and by applying linear discriminant analysisJ] Food Chemistry,2012,133(4):1241-1248endprint