呂晨菲,楊靜慧,通信作者,劉艷軍,楊仁杰,張超,吳楠
(1.天津農(nóng)學(xué)院 a.園藝園林學(xué)院,b.工程技術(shù)學(xué)院,天津 300384; 2.天津天獅學(xué)院,天津 301700)
紅提即紅地球葡萄,屬歐亞種,原產(chǎn)美國,因其果粒大、不脫粒、果肉硬脆、品質(zhì)優(yōu)、耐貯運、可周年供應(yīng)等優(yōu)點,成為鮮食葡萄品種中最珍貴且最具有商業(yè)價值的品種之一,發(fā)展前景廣闊[1]。研究發(fā)現(xiàn),紅提果實品質(zhì)和風(fēng)味會因產(chǎn)地的生態(tài)環(huán)境不同而呈現(xiàn)顯著差異[2]。而較大的市場價格差異造成了鮮果商品的產(chǎn)地仿冒現(xiàn)象,不利于優(yōu)質(zhì)果品產(chǎn)地的生產(chǎn)發(fā)展。研究建立高效的紅提果實產(chǎn)地識別技術(shù),對促進栽培區(qū)域布局優(yōu)化、優(yōu)質(zhì)生產(chǎn)、名特優(yōu)產(chǎn)地品牌保護等都具有重要的實踐意義。
近紅外光譜技術(shù)檢測速度快、無損傷、無污染、操作簡單[3-9],已成為農(nóng)產(chǎn)品品種定性鑒別的一個重要手段,已經(jīng)成功應(yīng)用于蘋果[10]、臍橙[11]、山楂[12]、石榴[13]、沙棘[14]、枸杞[15]等農(nóng)產(chǎn)品的產(chǎn)地識別。但基于NIRS與PLS-DA的紅提產(chǎn)地鑒別研究還未見報道。
試驗樣品是從超市購置的美國紅提、秘魯紅提、國產(chǎn)紅提(新疆紅提),所有樣品經(jīng)過篩選,每個品種選留45個,共135個,并對樣品進行編號。每個樣品大小均勻,無明顯損傷,清洗干凈并擦干,放置在待測的實驗室環(huán)境中平衡24 h。
試驗采用美國PerkinElmer公司的傅里葉變換近紅外光譜儀,漫反射采集附件為積分球。光譜儀開機預(yù)熱15 min,扣除背景后,在近紅外波段4 000~12 000 cm-1逐個采集樣品光譜(從紅提的赤道部位等距依次采集3次漫反射光譜,取平均值),采集間隔為2 cm-1,掃描次數(shù)為64次,光譜分辨率8 cm-1。共采集135張紅提近紅外原始光譜圖,如圖1所示。
圖1 3種紅提的原始光譜圖
采用 K-S(Kennard-Stone)方法對樣品集進行劃分,從美國紅提、秘魯紅提、國產(chǎn)紅提樣品中選擇了具有代表性的90個樣品光譜進行建模,其余45個樣品作為驗證集,用于分類模型驗證。
采用課題組編寫的偏最小二乘算法 Matlab代碼,來建立紅提產(chǎn)地判別模型。PLS-DA模型建立方法:基于PLS回歸方法,利用校正集樣品的自變量矩陣X和分類變量Y建立回歸模型,根據(jù)待分類樣本的 PLS預(yù)測值判斷樣本所屬類別。PLS-DA模型判別過程:(1)建立校正集樣品的分類變量;(2)分類變量與光譜數(shù)據(jù)的PLS分析,建立分類變量與光譜數(shù)據(jù)間的PLS模型;(3)根據(jù)校正集建立的分類變量和光譜特征的 PLS模型,計算驗證集的分類變量值(ypretict)。
具體判別標準為:將3種紅提,即美國紅提、秘魯紅提、國產(chǎn)紅提的分類變量分別賦值為1,2,3;①當(dāng) 0.5<ypretict<1.5,判定樣品屬于第一類,美國紅提;②1.5<ypretict<2.5,判定樣品屬于第二類,秘魯紅提;③2.5<ypretict<3.5,判定樣品屬于第三類,國產(chǎn)紅提。
運用Matlab和 Unscrambler軟件進行數(shù)據(jù)處理。利用Origin進行圖像處理。
圖 2是美國紅提、秘魯紅提和國產(chǎn)紅提在4 000~12 000 cm-1近紅外范圍扣除背景后的漫反射光譜圖。由圖2可知,整個光譜范圍內(nèi)3個產(chǎn)地的紅提樣品光譜形狀,譜峰位置幾乎相同,不能直觀的根據(jù)圖譜看出3類樣品的區(qū)別。
圖2 不同產(chǎn)地紅提的近紅外漫反射光譜圖
對上述 3類紅提采用主成分分析(PCA)法進行聚類。圖3為原始光譜數(shù)據(jù)進行主成分分解,保留前3個主成分的樣品散點分布圖。由圖3可知,不同產(chǎn)地樣品的界限不明顯,有多處重疊現(xiàn)象,無法直觀地進行品種判別。為了準確地判別3類紅提的產(chǎn)地,需要利用監(jiān)督性判別方法來進一步區(qū)分。
圖3 保留前3個主成分的樣品散點分布圖
在4 000~12 000 cm-1光譜范圍內(nèi)對校正集樣品進行PLS回歸并進行內(nèi)部交叉驗證,采用交互驗證的均方根誤差(RMSECV)來選擇模型的最佳主成分數(shù)。圖4為交互驗證的均方根誤差隨主成分數(shù)變化的散點折線圖,由圖 4可知,當(dāng)主成分為 6時,模型的 RMSECV不再顯著降低,因此確定PLS-DA 模型的主成分數(shù)為6,建立判別模型。
圖4 主成分的均方根誤差(RMSECV)曲線
采用課題組編寫的偏最小二乘算法 Matlab代碼,對4 000~12 000 cm-1波段內(nèi)采用K-S法挑選出的90個校正集樣品數(shù)據(jù)進行建模和內(nèi)部檢測。由圖5可知,模型校正集內(nèi)部預(yù)測結(jié)果準確無誤,3類樣品均得到正確識別,判別正確率100%,所建模型具有良好的自我預(yù)測能力,模型的實際預(yù)測能力還需要通過外部驗證集檢驗做進一步的驗證。
利用K-S法挑選出的45個樣品作為驗證集,對所建立的分類模型進行驗證集預(yù)測。由圖6可知,模型驗證集外部預(yù)測結(jié)果準確無誤,3類樣品均得到正確識別,判別正確率100%。利用PLS-DA建立的3種產(chǎn)地紅提的分類模型具有較高的預(yù)測準確度和預(yù)測穩(wěn)定性。
圖5 校正集樣本的PLS-DA預(yù)測結(jié)果
圖6 驗證集樣本的PLS-DA預(yù)測結(jié)果
利用傅里葉變換近紅外光譜儀測出美國紅提、秘魯紅提和國產(chǎn)紅提的近紅外光譜,通過PLS-DA算法在Matlab中建立判別模型。此方法可有效判別出3種產(chǎn)地紅提品種,該研究為果品產(chǎn)地的無損定性鑒別提供了一定的理論基礎(chǔ)。