成 雪,李占明,溫倫沖,馬銀幸,沈 鑫,俞 玥*
(1.江蘇科技大學糧食學院,江蘇鎮(zhèn)江 212100;2.昆山市糧油購銷有限責任公司,江蘇昆山 215300)
稻米的品質、口感及營養(yǎng)價值,受稻米產地氣候和土壤條件、種植方式、品種、加工精度及儲藏條件等多因素影響[1]。近年來,稻米新陳摻雜、品種真假混賣等問題屢見不鮮,成為社會關注的焦點。稻米品質控制及溯源分析是關系國計民生的重要問題之一[2]。
傳統(tǒng)的稻米品質檢測方法為采用理化指標分析和蒸煮感官評價對稻米品質進行定性和定量分析。由于理化指標分析方法處理方法繁瑣,檢測時效性差,樣品前處理破壞性大;而蒸煮感官評價技術效果受蒸煮方法、品評者飲食習慣及環(huán)境等多因素影響。市場日益增長的稻米消費量及對優(yōu)質稻米品質控制的需求亟需快速、無損的新型稻米檢測方法。
近紅外光譜(near-infrared spectroscopy,NIRS)技術是采用化學計量法對樣品近紅外光譜數(shù)據(jù)和理化數(shù)據(jù)建立關聯(lián)模型(或稱校正模型),并在構建模型的基礎上對未知樣品值進行預測的一項快速無損檢測技術。因其操作簡單、快速、無損、儀器小型化等優(yōu)點,已被廣泛用于農產品檢測分析領域,是不可或缺的快速無損檢測方法[3-4]。目前,NIRS 技術已在稻米品質檢測等研究中得到了廣泛的應用,但在實際生產應用中仍存在模型預測效果不佳、樣品量需求高、無法跨品系預測等不足。鑒于此,本文對國內外近年來NIRS 技術在稻米的營養(yǎng)成分、產地溯源及摻假鑒別等方面的研究進行了分析,總結了NIRS 技術在稻米檢測中的應用現(xiàn)狀,相關研究有助于提升稻米的品質控制水平,并有利于維持良好的市場秩序。
淀粉占稻米總質量的70%~80%,是主要的營養(yǎng)物質,淀粉組成及含量是決定稻米品質的重要因素。其中,直鏈淀粉含量是稻米品質評價中的一項重要評價指標,稻米蒸煮品質中的糊化溫度、膠稠度等食用品質均受稻米中直鏈淀粉含量的影響[5]。
利用NIRS 對稻米直鏈淀粉進行檢測已有較多報道。如Delwiche 等[6]采用NIRS 對美國產的97 份稻谷樣本進行檢測并建立了直鏈淀粉的定標模型,其相關系數(shù)達到0.95。Kuo 等[7]采用NIRS 進行稻米淀粉碘藍值的分析,使用偏最小二乘法(partial least-square,PLS)并結合多元線性回歸(multiple linear regression,MLR)所建立模型的精確度較好。馮光[8]對203 份水稻樣品進行處理后,采集精米的NIRS 數(shù)據(jù),并結合直鏈淀粉含量數(shù)據(jù),采用PLS 建立的定量分析模型,對測定精米中的直鏈淀粉含量具有良好的實用性。除此之外,稻米的物理形態(tài)對模型的精度存在影響。Fazeli 等[9]采用NIRS 對大米直鏈淀粉等主要營養(yǎng)品質實現(xiàn)了快速檢測,結合PLS 進行建模,結果表明顆粒狀態(tài)樣品的建模效果更優(yōu)。
淀粉模型的優(yōu)化及特征變量篩選有助于提升模型的判別準確度。為提高模型的預測能力,Sampaio 等[10]選用聯(lián)合偏最小二乘回歸(partial least squares regression,PLSR)進行特征光譜區(qū)域篩選,提升了NIRS 用于直鏈淀粉含量測定的研究水平。Xu 等[11]采用不同的預處理方法得到高質量的NIRS 漫反射和透射數(shù)據(jù)的融合光譜,隨后用PLS 進行建模的優(yōu)化和校正,結果表明一階導數(shù)處理的融合光譜模型具有最佳的預測精度。胡斌等[12]采用全校準技術對99 份秈米樣品的稻谷、精米、米粉3 種物理狀態(tài)下的NIRS 數(shù)據(jù)的相關性進行研究,建立了直鏈淀粉含量的定量模型,使米粉物理狀模型的預測相關系數(shù)達到0.927。
稻米蛋白是優(yōu)質的植物蛋白,其氨基酸類型和組成均衡,致敏率低。稻米蛋白含量是影響稻米食味口感的關鍵因素,其含量越高,蒸煮后米飯的硬度越高、彈性越低,且顏色呈黃褐色,食味品質與蛋白含量呈負相關性,因此稻米蛋白含量檢測是評價稻米品質的重要指標之一[13-14]。俞法明等[15]采用PLS 對同批次秈稻樣品的稻米、糙米、精米、精米粉4 種狀態(tài)的蛋白質含量建模,結果表明,精米和精米粉狀態(tài)樣品的相關系數(shù)分別為0.911 和0.951,PLS 可以實現(xiàn)對稻米的鑒別。然而,PLS 難以反映光譜數(shù)據(jù)與待測目標組分之間的非線性關系。劉明博等[16]采用Martens 不確定性檢驗方法篩選特征波長,并利用主成分回歸(principal component regression,PCR)對稻米樣品的NIRS 數(shù)據(jù)進行建模,預測集的相關系數(shù)達到0.936 4,但建模中使用的樣品數(shù)量僅28 個,因此準確性仍有待提高。殷坤等[17]采集150 個稻米粉末樣品的NIRS數(shù)據(jù),利用支持向量機(support vector machine,SVM)、主成分分析(principal component analysis,PCA)和反向區(qū)間偏最小二乘(Bi-PLS)構建BiPLS-PCA-SVM 模型,在保證足夠的樣品數(shù)量前提下,BiPLS-PCA-SVM 方法所建立的模型魯棒性良好。
不同的數(shù)據(jù)預處理方式對蛋白質含量模型的預測精度有較大影響。田翔等[18]對191 份山西產區(qū)稻谷樣品的光譜數(shù)據(jù),采用一階導數(shù)+矢量歸一化進行預處理,分別建立稻谷蛋白質和淀粉含量的校正模型,進一步驗證了在稻谷完整顆粒狀態(tài)下進行谷物蛋白質和淀粉定量檢測的可行性。Lin 等[19]利用近紅外成像系統(tǒng)測定大米的蛋白質含量,并運用MLR、PLSR 和人工神經網絡模型對6.18%~9.43%的水稻蛋白進行了數(shù)據(jù)分析,結果表明,該近紅外成像系統(tǒng)具有操作簡單、檢測精度高的優(yōu)點,在大米蛋白質含量的無損檢測中具有一定的應用潛力。除了上述的NIRS 技術在稻米蛋白質量含量檢測的研究外,也有部分研究者針對稻米中的氨基酸含量進行快速檢測,如Zhang 等[20]篩選了279 個糙米顆粒及其粉狀樣品進行NIRS 數(shù)據(jù)的采集,利用NIRS 對糙米中的氨基酸總量和組成進行預測,結果表明,所建立的13 種氨基酸的模型可用于糙米中氨基酸的估算。
脂肪酸值是在稻米檢測系統(tǒng)中對稻米新陳度進行判定的最主要指標。稻米脂肪酸值的高低與稻米品質和霉變均有很高的相關性。林家永等[21]采用修正偏最小二乘法(modified partial least square,MPLS)、PLS、PCR 三種方法建模,結果表明,模型的脂肪酸值的預測相關系數(shù)達到0.961,準確性較高,并采用此模型研制了便攜式稻谷品質測定儀。陳曉玲等[22]利用MPLS 建模,相關系數(shù)達0.993。Liu 等[23]采集稻米兩種物理形態(tài)(顆粒、米粉)的NIRS 數(shù)據(jù),采用PLS 和競爭自適應重加權抽樣(competitive adaptive reweighted sampling,CARS)建立水稻游離脂肪酸測定的最優(yōu)回歸模型。結果表明,利用精米顆粒光譜與CARS 方法結合建立的游離脂肪酸模型效果更好,與米粉光譜相比,精米顆粒光譜更好地保留了樣品游離脂肪酸值的信息。
特征變量的篩選有助于提升模型的判別準確度。楊東等[24]利用鄰域粗糙集(neighborhood rough set,NRS)算法最終選出最優(yōu)的10 個特征波長;結合隨機森林(random forest,RF)算法建立了稻谷貯藏品質鑒別模型,模型測試集判別率達到93.68%,表明了NIRS 數(shù)據(jù)結合NRS 和RF 算法用于稻谷判別的可行性。Jiang 等[25]采集不同的儲存時間稻谷的NIRS 數(shù)據(jù),將變量選擇乘性散射校正算法加權用于散射校正,利用特征波長實現(xiàn)大米儲藏中脂肪酸值的快速監(jiān)測,結果表明基于變量選擇乘性散射校正算法的最優(yōu)PLS 模型的性能顯著優(yōu)于PLS模型,該研究還成功應用于便攜式稻米脂肪酸值NIRS動態(tài)監(jiān)測系統(tǒng)的研發(fā)。
地理標志稻米和優(yōu)質品種稻米均因其品質優(yōu)、營養(yǎng)價值高、口感佳等優(yōu)點成為稻米選購市場中的優(yōu)選品。但其價格相對于普通大米略高,因此市場上不法商販以次充好、摻假賣假的現(xiàn)象屢見不鮮[26],嚴重影響了市場經營秩序和消費者利益。因此,稻米產地和品種溯源的研究和應用也非常迫切。
近年來關于地理標志稻米的溯源研究較多。李勇等[27]采集了黑龍江、湖北、江蘇、遼寧4 省份的169 個稻米的光譜數(shù)據(jù),結果證明采用PCA-線性判別法可有效實現(xiàn)大米產地的溯源,識別準確率高達93%。錢麗麗等[28]采用Fisher 判別法對產自黑龍江省5 個稻米主產區(qū)的118 份稻米粉末樣品的光譜數(shù)據(jù)進行建模,初步認定NIRS 可用于黑龍江稻米的產地溯源。除此之外,有研究針對150 份三江及非三江地區(qū)的大米的NIRS 數(shù)據(jù),采用因子化法進行鑒別分析,模型的正確判別率均在90%以上[29]。
為進一步提高判別率,錢麗麗等[30]對212 份稻米樣品進行數(shù)據(jù)采集,采用PLS 建立產區(qū)溯源判別模型,研究結果表明,各模型均適用于產地溯源研究,判別正確率均在95%以上。與此同時,對查哈陽地理標志稻米進行溯源判別研究的結果表明,因子化法定性模型的鑒別正確率為100%,PLS 定量分析模型的鑒別正確率為95.83%,且研究發(fā)現(xiàn)提高單類品種的樣品數(shù)量有助于提升判別準確率[31]。除了利用PLS 方法建模之外,也有其他方法可用于稻米產地溯源鑒別[32]。錢麗麗等[33]研究證實5 136~5 501 cm-1范圍內產地因素差異顯著,建模結果表明因子化法定性分析模型及聚類分析模型對五常和三江地區(qū)稻米產區(qū)的正確判別率均高于97.00%。
除了稻米產地的溯源研究外,稻米品種的鑒別的研究也是農業(yè)研究中亟需關注的?,F(xiàn)有研究證實了NIRS結合PLS、BP 神經網絡等模型可應用于水稻品種真?zhèn)舞b別的建模開發(fā)。Dowell 等[34]對單粒麥粒進行NIRS 數(shù)據(jù)采集并進行自動分類,研究結果表明其可準確地區(qū)別野生型麥粒、糯麥和偏糯麥。Davrieux 等[35]采用NIRS 對泰國香味稻米進行真假鑒別,運用PLS 建立模型,模型鑒別準確率達到97.4%。周子立等[36]采用PCA 對不同稻米品種光譜數(shù)據(jù)進行聚類后用小波變換技術提取特征光譜信息,運用BP 神經網絡方法建立稻米品種鑒別模型,所建立的大米品種鑒別模型的識別率達到100%。林萍等[37]采集了東北長粒香、泰國香米和御貢香米這3 個品種稻米的NIRS 數(shù)據(jù),用遺傳算法結合PLS 進行預處理,并利用BP 神經網絡建模,使預測集的預測準確率達到100%,遺傳算法結合PLS 提高了BP 神經網絡預測的精確度。不同的預處理方法對模型判別準確率的貢獻有所不同。王欣卉等[38]采用一階導數(shù)+矢量歸一化+5 點平滑對光譜數(shù)據(jù)進行預處理,結合PCA 建立的定性模型的鑒別準確率為94%;采用二階導數(shù)+9 點平滑進行預處理并利用PLS 建立的定量模型鑒別準確率為100%。
市場中不同品種和品質的稻米由于營養(yǎng)成分的差異性造成了價格的差距。食品摻假的一個關鍵特征是使用低價值的成分來模仿真實的產品。周曉璇[39]將稻花香大米(高檔米)摻入江蘇品種(低檔米)大米中,并采集130 個樣品的NIRS 數(shù)據(jù),采用4 種不同的方法對光譜數(shù)據(jù)進行預處理,并分別結合PLS 建立定量分析模型,結果表明,最大最小歸一化法進行光譜預處理的模型效果最優(yōu),訓練集的相關系數(shù)和均方根誤差分別為0.969 8 和8.66,預測集的相關系數(shù)和均方根誤差分別為0.984 5 和6.46。劉亞超等[40]選擇東北米、金龍魚長粒香等6 種肉眼難分辨的稻米以不同比例摻入五常稻米中,并以五常大米NIRS 的平均光譜作為參考譜,將摻雜米光譜和五常米光譜分別與參考譜進行二維相關運算,結果表明,摻雜比例在20%及以上的樣品鑒別正確率為100%。該方法可有效解決NIRS 對樣本需求量大的缺陷,為快速進行稻米摻偽鑒別提供研究思路。
此外,秦潤蒙[41]利用KNN、SVM 及以及基于Adaboost算法改進的Adaboost-KNN 模型、Adaboost-SVM 模型四種機器學習方法建立大米摻假的快速鑒別模型,結果證實,KNN、SVM、Adaboost-KNN 及Adaboost-SVM 這4 種模型的最低檢測下限是2%,預測準確度均高于97%。Liu等[42]運用PLS-DA 和SVM 針對不同物理形態(tài)的樣品(全顆粒、40 目、70 目、100 目)樣品的光譜數(shù)據(jù)建立定性模型、采用PLS 進行定量模型。研究結果表明,PLS-DA 和SVM 的定性模型的檢出下限均為5%;在PLS 定量分析模型方面,預測模型的性能與樣品物理狀態(tài)相關,樣品尺寸為100 目>70 目>40 目>全谷物。
稻米的主要營養(yǎng)成分多分布在米糠層,會隨著加工而被碾除,使營養(yǎng)成分不能被充分利用,因此研究加工精度對稻米品質特性的影響較大。Liew 等[43]采集了123 個摻假稻米的NIRS 數(shù)據(jù),運用PCA 和邏輯回歸(logistic regression,LR)建立摻假模型,模型的訓練準確率達到94.4%,獨立測試集準確率達到99.4%,表明PCA 和LR相結合在稻米摻假檢測中具有可行性。周軍琴[44]利用NIRS研究稻米的不同加工精度,結果顯示PLS-DA 建模預測稻米加工精度的準確率為89.5%,該研究表明了利用NIRS 在線監(jiān)測大米的加工精度的可行性。
綜上所述,NIRS 在稻米無損檢測研究中得到了很好的應用,在稻米的營養(yǎng)品質分析、產地溯源、摻雜溯源等領域取得了一定的成效,且與化學計量學結合提高了溯源分析的準確性。盡管如此,NIRS 技術用于稻米分析仍然存在一些問題。一是,在稻米的營養(yǎng)品質檢測中,在采集樣品過程中,品種的差異性較大,只能針對每種樣品單獨進行研究,所建立的模型缺乏普適性。二是,在稻米的產地溯源和品種鑒別研究中,需要單品種或單種類樣品數(shù)量足夠多,才可能保證模型鑒別率的準確性。三是,稻米加工方式和精度的鑒別分析研究較少,隨著谷物質量和營養(yǎng)需求的日益增高,相關研究亟待加強,為提高稻米營養(yǎng)與質量安全建立快速完善的溯源分析體系。