諶蓓,夏立婭,竇玉蕾,馬澤洋,熊娜
(1.東方匯理銀行(中國)有限公司北京分行,北京 100020;2.河北大學化學與環(huán)境科學學院,河北保定 071002;3.河北大學質(zhì)量技術(shù)監(jiān)督學院,河北保定 071002)
地理標志產(chǎn)品是指產(chǎn)自特定地域,所具有的質(zhì)量、聲譽或其他特性本質(zhì)上取決于該產(chǎn)地的自然因素和人文因素,經(jīng)審核批準以地理名稱進行命名的產(chǎn)品.目前中國已經(jīng)對近千個地理標志產(chǎn)品實施了專門保護,產(chǎn)地范圍涵蓋全國30個省、自治區(qū)、直轄市.地理標志產(chǎn)品的品質(zhì)和特征體現(xiàn)了其原產(chǎn)地的自然因素和人文因素,具有良好的口碑和知名度,贏得了消費者的認可,其價格也遠高于市場中同類普通產(chǎn)品.在經(jīng)濟利益的驅(qū)動下,假冒偽劣的地理標志產(chǎn)品廣泛存在于市場中.甚至一些像響水大米、涪陵榨菜、武昌魚等知名地理標志產(chǎn)品,因沒有得到有效的保護,地理標志被濫用,導致正宗產(chǎn)品被假冒偽劣產(chǎn)品屢屢圍攻.消費者和正規(guī)企業(yè)的合法權(quán)益被侵犯,嚴重敗壞了地理標志產(chǎn)品的信譽.為整頓市場秩序,迫切需要發(fā)展地理標志產(chǎn)品的有效鑒別技術(shù)和方法.
目前,地理標志產(chǎn)品的鑒別方法主要集中于穩(wěn)定性同位素、礦物元素指紋、有機組分特征含量、近紅外光譜等方面[1-9].其中近紅外光譜由于其快速、無損、成本低廉等特點受到廣泛關(guān)注.由于不同產(chǎn)地食品中化學成分差異較小,各成分間存在很強的協(xié)同效應,利用多元統(tǒng)計學方法對數(shù)據(jù)進行分析成為有效的技術(shù)手段.本課題組分別利用無監(jiān)督模式的聚類分析法和監(jiān)督模式的判別分析方法建立了地理標志產(chǎn)品響水大米的近紅外光譜鑒別方法,結(jié)果表明監(jiān)督模式的分析方法在產(chǎn)地鑒別中準確性更高[10].本文擬在此基礎上,對比另外2種同屬于監(jiān)督模式分析方法的多元線性回歸和BP人工神經(jīng)網(wǎng)絡算法在產(chǎn)地鑒別中的應用效果.
從響水大米的主產(chǎn)地共采集119個響水大米樣本,從天津、湖南等大米主產(chǎn)區(qū)采集對比樣本90個,所有樣本均為粳米.
采用德國BRUKER公司MPA型傅里葉近紅外光譜儀,OPUS光譜采集軟件.
將大米樣品在30℃干燥48h后,采用四分法取50g置于旋轉(zhuǎn)非透射樣品杯中,在室溫25℃,空氣濕度50%的條件下掃描近紅外吸收光譜.掃描波數(shù)為4 000~10 000cm-1,分辨率為8cm-1.每個樣本掃描32次,以其平均光譜作為最終的透射光譜.采用儀器自帶的OPUS光譜分析軟件對原始光譜進行一階導數(shù)及平滑處理.
利用SPSS19.0軟件進行主成分和多元線性回歸判別分析,利用Matlab7.0進行BP人工神經(jīng)網(wǎng)絡分析.
從不同產(chǎn)地大米近紅外光譜圖(圖1)可見,不同的大米樣本近紅外光譜圖稍有差異,但總體上比較相近,難以通過肉眼識別.對原始光譜進行一階求導后,不同產(chǎn)地大米的近紅外光譜差異稍加顯著,可以更加細致地反映樣品的光譜特征.
由于樣本的光譜數(shù)據(jù)龐大,數(shù)據(jù)間存在一定關(guān)聯(lián)性,不利于多元統(tǒng)計學分析,因此采用主成分分析對數(shù)據(jù)進行降維處理.由于PCA分析的前3個主成分已包含了絕大部分的分類信息,因此,可根據(jù)前3個主成分的載荷值分析大米產(chǎn)地分類的特征波段.不同產(chǎn)地大米的光譜進行PCA分析后,以波譜區(qū)域?qū)C1的貢獻值為主要參考指標,并綜合考慮對PC2與PC3的貢獻值,得出7 700~6 700cm-1與5 700~4 300cm-12個波段為大米產(chǎn)地鑒別的特征波段.
對不同產(chǎn)地大米的全光譜與特征光譜分別進行PCA分析,前22個主成分的累積可信度如圖2所示.全波段方法前22個主成分的累積可信度在97.11%以上,特征波段前22個主成分的累積可信度在98.43%,包含了光譜數(shù)據(jù)絕大部分的特征信息,因此可以選用主成分得分進行后續(xù)的多元統(tǒng)計學分析.
圖2 全波段和特征波段前22個主成分累積可信度Fig.2 Accumulative reliabilities plot of the top 22principal components of whole wave band and characteristic wave band
多元線性回歸(MLR)研究一個因變量和多個自變量之間數(shù)量上相互依存的線性關(guān)系.在該部分分析中,響水大米的產(chǎn)地變量值為1,非響水大米的產(chǎn)地變量值為2,所有樣本的主成分數(shù)據(jù)導入SPSS軟件中,作為自變量的數(shù)據(jù)采用逐步進入的方式,自變量的選擇依據(jù)是F值小于0.05進入,大于0.10將被棄去.逐步分析終止的時候,篩選了10個變量(表1).利用這些變量建立的多元線性方程計算大米樣本的產(chǎn)地,判斷依據(jù)是:數(shù)值大于1.5為非響水大米,小于1.5為響水大米.分析結(jié)果(圖3)可知,響水大米樣本的預測結(jié)果為0.960~1.188,非響水大米的預測結(jié)果為1.834~2.116,產(chǎn)地判別正確率為100%,標準殘差為0.539.其中主成分1、主成分2、主成分3和主成分6對于回歸方程的影響最大(圖4),進一步說明主成分分析后,前3個主成分保留了更多的原有數(shù)據(jù)的信息,對后續(xù)多元統(tǒng)計學分析的影響較大.
表1 DMLR分析判別函數(shù)系數(shù)Tab.1 Standardized canonical discriminant function coefficients of stepwise DLMR
圖3 多元判別大米產(chǎn)地結(jié)果Fig.3 Standardized predicted geographical origin of rice by stepwise DMLR
圖4 主成分與預測結(jié)果的相關(guān)性Fig.4 Correlation diagram of principal components and predictions
若把全部光譜數(shù)據(jù)作為BP人工神經(jīng)網(wǎng)絡的輸入,不僅加大了計算量,而且某些區(qū)域的光譜信息與樣品的組成或性質(zhì)缺乏一定的相關(guān)性.在本文分析中,將提取的前9個獨立主成分作為BP神經(jīng)網(wǎng)絡的輸入,建立人工神經(jīng)網(wǎng)絡結(jié)構(gòu).使用1和2的分別代表響水大米樣品和非響水大米樣品.隱層傳遞函數(shù)設為logsig,輸出層傳遞函數(shù)設為線性函數(shù).輸入層、隱含層和輸出層節(jié)點分別為9,10和1個.目標方差為2.0×e-3,最大訓練次數(shù)為20 000次.對于每一類樣本,均采用一半作為網(wǎng)絡訓練,另一半作為測試.通過網(wǎng)絡訓練,網(wǎng)絡達到要求,網(wǎng)絡誤差收斂曲線較為理想(圖5).測試結(jié)果表明:分類的正確率能保持在100%.
比較分析結(jié)果表明,對于響水大米和非響水大米的分類,多元線性回歸判別和BP人工神經(jīng)網(wǎng)絡算法都能達到100%正確.也說明了同屬于有監(jiān)督模式的多元線性回歸判別和BP人工神經(jīng)網(wǎng)絡算法都適用于地理標志產(chǎn)品的鑒別分析,由于多元線性回歸判別算法簡單,易于實現(xiàn),更具有推廣性.該方法將為響水大米地理標志產(chǎn)品及相關(guān)產(chǎn)品的保護提供技術(shù)支撐.
圖5 Sigmoid函數(shù)誤差迭代收斂曲線Fig.5 Sigmoid function error iteration convergence curve
[1] KELLY S,BAXTER M,CHAPMAN S.The Application of isotopic and elemental analysis to determine the geographical origin of premium long grain rice[J].Eur Food Res Techno l,2002,214(1):72-78.
[2] KAWASAKI A,ODA H,HIRATA T.Determination of strontium isotope ratio of brown rice for estimating its provenance[J].Jap Soc SoilSci Plant Nutri,2002,48(5):635-640.
[3] MONTALVAN R,ANDO A,ECHEVERRIGARAY S.Use of seed protein polymorphism for discrimination of improvement level and geographic origin of upland rice cultivars[J].Genetics and Molecular Biology,1998,21:531-535.
[4] RHYU M R,KIM E Y,KIM S S,et al.Regional differences of four major rice cultivars in Korea by capillary electrophoresis[J].Food Science &Biotechnology,2001,10(3):299-304.
[5] CASALE M,CASOLINO C,OLIVERI P,et al.The potential of coupling information using three analytical techniques for identifying the geographical origin of Liguria extra virgin olive oil[J].Food Chemistry,2010,118:163-170.
[6] WOODCOCK T,DOWNEY G,O'DONNELLl C P.Near infrared spectral fingerprinting for confirmation of claimed PDO provenance of honey[J].Food Chemistry,2009,114:742-746.
[7] 李勇,魏益民,潘家榮,等.基于FTIR指紋光譜的牛肉產(chǎn)地溯源技術(shù)研究[J].光譜學與光譜分析,2009,29(3):647-651 LI Yong,WEI Yimin,PAN Jiarong,et al.Determination of geographical origin of beef based on FTIR spectroscopy analysis[J].Spectroscopy and Spectral Analysis,2009,29(3):647-651.
[8] YU Haiyan,ZHOU Ying,F(xiàn)U Xiaping,et al.Discrimination between Chinese rice wines of different geographical origins by NIRS and AAS[J].European Food Research and Technology,2007,225:313-320.
[9] 陳永明,林萍,何勇.基于遺傳算法的近紅外光譜橄欖油產(chǎn)地鑒別方法研究[J].光譜學與光譜分析,2009,29(3):671-674.CHEN Yongming,LIN Ping,HE Yong.Study on discrimination of producing area of olive oil using near infrared spectra based on genetic algorithms[J].Spectroscopy and Spectral Analysis,2009,29(3):671-674.
[10] 夏立婭,申世剛,劉崢顥,等.基于近紅外光譜和模式識別技術(shù)鑒別大米產(chǎn)地的研究[J].光譜學與光譜分析,2013,33(1):102-105.XIA Liya,SHEN Shigang,LIU Zhenhao,et al.Identification of geographical origins of rice with pattern recognition technique by near infrared spectroscopy[J].Spectroscopy and Spectral Analysis,2013,33(1):102-105.