郭 成 馬 月 梁夢醒 顏 輝
(江蘇科技大學生物技術(shù)學院,江蘇 鎮(zhèn)江 212000)
?
基于近紅外光譜結(jié)合波長優(yōu)選檢測單顆葡萄的SSC含量
郭 成 馬 月 梁夢醒 顏 輝
(江蘇科技大學生物技術(shù)學院,江蘇 鎮(zhèn)江 212000)
葡萄;可溶性固形物;近紅外光譜;隨機蛙算法;無信息變量消除法
據(jù)統(tǒng)計[1],2014年中國葡萄總產(chǎn)量達1 254.6 萬t,如此多的產(chǎn)量,需要有效的田間與采后管理。葡萄為葡萄科葡萄屬木質(zhì)藤本植物,是世界性的水果。葡萄中的可溶性固形物含量(Soluble Solids Content,SSC)是衡量葡萄品質(zhì)的重要指標之一。SSC傳統(tǒng)的檢測方法是從每穗摘取l~3粒葡萄,做成葡萄汁再進行含量的測定,但該方法費時、費力,并且具有破壞性[2]。由于葡萄不同果穗以及相同果穗上不同個體的成熟度不一致,如能在果穗上不同位置無損檢測單粒葡萄的SSC,首先可以獲得葡萄個體和整體的情況,用以指導果農(nóng)采用合理的田間管理方法,提高葡萄的品質(zhì);其次,根據(jù)葡萄中SSC含量,選擇最佳的儲存條件,延長儲存時間;對于客戶,通過無損檢測SSC,選擇購買適合自己口感的葡萄。
近紅外光譜 (Near Infrared,NIR)分析技術(shù)具有分析速度快、綠色、無損等優(yōu)點[3],正逐漸廣泛應(yīng)用于蘋果[4]、臍橙[5]、西瓜[6]、梨[7]等水果SSC的檢測。呂剛等[8]采用基于USB4000的自制手持式光譜儀,建立LV-SVM模型預(yù)測葡萄活體生長期單個果粒的糖度,該系統(tǒng)功耗較大,不利于長期現(xiàn)場分析。吳桂芳等[2]采用Handheld FieldSpec光譜儀建立的PLS-ANN模型預(yù)測葡萄漿果的糖度,該儀器價格昂貴。陳辰等[9]使用NIRS DS2500,采用可見/近紅外漫反射光譜技術(shù)建立MPLS模型預(yù)測單個葡萄SSC,但該光譜儀體積大,耗能高,價格昂貴。徐洪宇等[10]采用MPATM 型傅里葉變換近紅外光譜儀,使用積分球采譜,建立PLS模型預(yù)測釀酒葡萄的糖度,該方法所需樣品數(shù)多,無法分析單個樣品的品質(zhì),且光譜儀體積大,不便于實時現(xiàn)場檢測。因此,目前多數(shù)NIR分析儀器體積大(通常采用光纖光譜儀)、光源功耗高、價格高昂,難以適合現(xiàn)場檢測的需求[11]。
由于便攜式NIR儀器的分辨率不如研究型儀器高,所以建立的模型預(yù)測精度也不如研究型儀器[12]。通過NIR與偏最小二乘回歸(Partial Least Squares,PLS)方法結(jié)合進行建模,一般認為PLS具有較強的全波長建模能力。通過波長優(yōu)選可以簡化模型,更主要是可以剔除不相關(guān)或非線性變量,從而得到穩(wěn)健性好、預(yù)測能力強的校正模型[13-14]。目前,波長優(yōu)選方法主要有隨機蛙(Random Frog,RF)[15]、移動窗(Moving Window,MW)[16]、無信息變量消除法(Uninformative Variable Elimination,UVE)[17]、間隔偏最小二乘法(Interval PLS,iPLS)[18]、自適應(yīng)量加權(quán)采樣(Competitive Adaptive Reweighted Sampling,CARS)[19]和遺傳算法(Genetic Algorithms,GA)[20]等。
本研究擬采用低功耗的便攜式近紅外光譜儀,探討UVE與RF兩種波長優(yōu)選方法與PLS的結(jié)合,建立最適于實時現(xiàn)場預(yù)測單顆葡萄SSC含量的近紅外無損檢測模型,用以克服前人研究中分析儀器體積大、光源功耗高、價格高昂、不利于現(xiàn)場開展工作等缺點,以期應(yīng)用于葡萄田間管理與摘后儲藏。
1.1 材料與儀器
1.1.1 材料
葡萄:采自江蘇省鎮(zhèn)江市丹徒區(qū)公琴水果合作社,分別在目視成熟度不同的20個葡萄果穗上采摘,從每個果穗的穗節(jié)部、穗尖部各采摘一顆,穗中部采摘兩顆,共采摘80顆葡萄。
1.1.2 儀器設(shè)備與軟件
折光儀:WZ-103型,浙江托普云農(nóng)科技股份有限公司;
便攜式近紅外光譜儀:MicroNIR1700型,美國捷迪訊通訊技術(shù)有限公司(JDSU);
軟件:近紅外光譜預(yù)處理與PLS建模使用MATLAB R2009a在PLS Toolbox 6.2工具箱中實現(xiàn),UVE與RF波長優(yōu)選分別使用ChemoAC和LibPLS工具箱實現(xiàn)。
1.2 方法
1.2.1 近紅外光譜采集 用MicroNIR1700采集葡萄的近紅外反射光譜,光譜范圍為950~1 650 nm。光譜采樣間隔為12.5 nm,積分時間15 ms,掃描次數(shù)50 次。每個樣品采集赤道一點作為一個樣本,共有80 個。每個點采集光譜3 次,以3 次平均值作為最終光譜。
1.2.2 SSC測定 采集光譜后即刻采用折光儀測量葡萄SSC含量。
1.2.3 校正集和預(yù)測集定義 所有樣本按照SSC升序排序,根據(jù)3∶1的比例分為校正集和預(yù)測集,校正集含60個樣本,預(yù)測集含20個樣本,其中SSC最大和最小樣品應(yīng)為校正集。預(yù)測集樣品SSC范圍應(yīng)被包含在校正集樣品SSC范圍。
1.2.4 光譜預(yù)處理 通常采用的預(yù)處理方法包括均值中心化(mean centering)、標準化(autoscaling)、不同點移動平滑(move smoothing)、一階導數(shù)(1stD)、標準正態(tài)變量變換(standard normal variable transformation,SNV)、多元散射校正(multiplicative scatter correction,MSC)等。
選擇多種方法對原始光譜進行預(yù)處理,比較以下預(yù)處理方法的組合,1stD、1stD+SNV、1stD+SNV+Mean Center、1stD+MSC+Mean Center,分別使用上述4種預(yù)處理方法進行PLS建模。
1.2.5 偏最小二乘回歸法 PLS是一種多元回歸分析方法,模型建立在成分提取的方法之上。PLS在提取成分的過程中,同時考慮到預(yù)測變量數(shù)據(jù)和因變量數(shù)據(jù)中的信息,使從兩者中提取的信息之間的相關(guān)性達到最大,然后用所獲得的成分建立多元回歸分析模型[21]。
將光譜數(shù)據(jù)與相應(yīng)的SSC數(shù)據(jù)導入PLS工具箱,選擇光譜最佳預(yù)處理方法,采用留一法(Leave one out,LOO)進行交叉驗證。
1.2.6 波長優(yōu)選 NIR分析一般采用線性方法建立模型,波長優(yōu)選能夠剔除與分析目的性質(zhì)無關(guān)或呈非線性關(guān)系的波長變量,從而達到簡化模型、提高預(yù)測精度的目的。本研究中,擬采用無信息變量消除法(UVE)、隨機蛙算法(RF)進行波長優(yōu)選,以期達到提高模型精度的目的。
(1) 無信息變量消除法:UVE是建立在分析PLS回歸系數(shù)基礎(chǔ)上的算法,目的是消除那些不提供有用信息的波長變量。在NIR的PLS多元回歸模型中,UVE是把相同于自變量矩陣的變量數(shù)目的隨機變量矩陣加入光譜矩陣中,然后通過交叉驗證,逐一剔除無信息的變量,建立PLS多元回歸模型,從而得到回歸系數(shù)的矩陣,通過分析回歸系數(shù)矩陣中回歸系數(shù)向量的均值和標準偏差的商的穩(wěn)定性,最后根據(jù)商值的絕對值大小決定是否把該變量用于最終的模型中[22]。
(2) 隨機蛙算法:RF是一種新型的波長優(yōu)選算法,特點是能夠利用少量的變量迭代進行建模,是一種非常有效的高維數(shù)據(jù)變量選擇方法。該算法針對每個波長變量選擇可能性進行輸出,根據(jù)可能性的大小進行波長選擇[23]。
2.1 SSC測定結(jié)果
由表1可知,校正集和預(yù)測集的SSC值范圍相近,分別為6.15~18.20 °Brix和6.80~17.85 °Brix,且校正集和預(yù)測集樣品的標準差相近,分別為3.24和3.26,因此校正集和預(yù)測劃分合理,為建立可靠的模型奠定了基礎(chǔ)。
2.2 光譜特征
圖1為80個葡萄樣品的原始近紅外光譜曲線。由圖1可知,各個樣品的光譜曲線類似,無明顯異常的樣品。光譜在970 nm和1 440 nm處出現(xiàn)O—H吸收峰,在1 190 nm出現(xiàn)了C—H鍵二級倍頻吸收峰[24-25]。原始光譜曲線呈現(xiàn)的吸收特征變化反映了葡萄內(nèi)部不同組分信息含量的差異。
表1 樣本SSC 參考值統(tǒng)計結(jié)果
2.3 模型的分析與比較
2.3.1 PLS 由表2可知,選擇1stD+SNV+Mean Center進行預(yù)處理的效果最好,其均方根誤差小,相關(guān)系數(shù)大。
圖1 原始光譜
表2 預(yù)處理方法對PLS的影響
2.3.2 UVE-PLS 采用UVE進行特征波長的提取。圖2是UVE方法進行波長優(yōu)選的結(jié)果,橫坐標方向上,垂直線左邊的部分為實際光譜變量,右邊的為光譜的系統(tǒng)噪聲變量,該部分由隨機噪聲模擬產(chǎn)生,縱坐標方向上是每個變量的穩(wěn)定性數(shù)值,水平兩條虛線代表選擇實際變量的穩(wěn)定性數(shù)值的閾值,在閾值范圍內(nèi)的穩(wěn)定性數(shù)值對應(yīng)的變量是與葡萄SSC無關(guān)的信息量,在閾值范圍外的穩(wěn)定性數(shù)值對應(yīng)的變量則是與葡萄SSC有關(guān)的信息量,據(jù)此,保留有關(guān)的信息量對應(yīng)的波長變量,去除無關(guān)的信息量對應(yīng)的波長變量,最后根據(jù)保留的波長變量建立PLS模型。
圖2 無信息變量消除法選擇變量圖
圖4是兩種波長優(yōu)選的結(jié)果,優(yōu)選后的波長主要集中在970,1 190,1 450 nm附近。優(yōu)選波長是基于數(shù)學方法隨機選擇所得,部分波長會被重復(fù)選中,說明這些區(qū)域數(shù)據(jù)信息與被測對象含量有較高的相關(guān)性。優(yōu)選波長包含了葡萄糖和蔗糖等可溶性固形物官能團的合頻和倍頻吸收區(qū),如970 nm附近與糖相關(guān)的O—H鍵合頻吸收,1 190 nm附近是與糖相關(guān)的C—H鍵合頻吸收,1 450 nm附近是與糖相關(guān)的O—H鍵1倍頻吸收。上述分析說明波長優(yōu)選結(jié)果和化學結(jié)構(gòu)分析具有一致性。
圖3 隨機蛙算法選擇變量圖
圖4 兩種的特征波長選擇
方法LVsRMSECR2cRMSECVR2cvRESEPR2pPLS80.67470.95590.98000.90731.00370.9006UVE?PLS70.64150.96010.85340.92950.89980.9246RF?PLS70.63820.96050.82990.93340.86880.9304
本研究結(jié)果表明了基于MicroNIR1700的近紅外光譜技術(shù)在葡萄SSC預(yù)測中的高度可行性。通過減少冗余的無信息變量,可增加模型的穩(wěn)定性和預(yù)測精度。其中RF-PLS算法對于葡萄SSC的預(yù)測效果優(yōu)于UVE-PLS算法。本工作的完成對水果種植的田間管理、采摘后貯藏以及消費者的使用提供了非常有效的工具。
[1] 國家統(tǒng)計局. 中國統(tǒng)計年鑒[Z]. 北京: 中國統(tǒng)計出版社, 2015: 267.
[2] 吳桂芳, 黃凌霞, 何勇. 葡萄漿果糖度可見/近紅外光譜檢測的研究[J]. 光譜學與光譜分析, 2008, 28(9): 2 090-2 093.
[3] 李敏. 近紅外光譜技術(shù)在水果無損檢測中的最新研究進展[J]. 綠色科技, 2013(10): 215-218.
[4] 屈亞堃, 宮元娟. 近紅外光譜技術(shù)在蘋果品質(zhì)無損檢測中的應(yīng)用[J]. 農(nóng)業(yè)科技與裝備, 2014(6): 32-33.
[5] 趙珂, 熊艷, 趙敏. 基于近紅外光譜技術(shù)的臍橙快速無損檢測[J]. 激光與紅外, 2011, 41(6): 649-652.
[6] 介鄧飛, 謝麗娟, 饒秀勤, 等. 近紅外光譜變量篩選提高西瓜糖度預(yù)測模型精度[J]. 農(nóng)業(yè)工程學報, 2013(12): 264-270.
[7] 崔秀帥, 唐榮年, 楊舉華, 等. 芒果無損檢測方法的研究現(xiàn)狀及發(fā)展趨勢[J]. 貴州農(nóng)業(yè)科學, 2013, 41(7): 167-170.
[8] 呂剛, 楊海清. 基于光譜技術(shù)的葡萄活體可溶性固體含量在線檢測研究[J]. 紅外, 2012, 33(10): 43-48.
[9] 陳辰, 魯曉翔, 張鵬, 等. 玫瑰香葡萄貯藏期間糖酸品質(zhì)的近紅外檢測[J]. 食品與發(fā)酵工業(yè), 2015(6): 175-180.
[10] 徐洪宇, 張京芳, 侯力璇, 等. 基于FT-NIR光譜技術(shù)檢測釀酒葡萄中可溶性固形物含量[J]. 中國食品學報, 2013, 13(11): 153-159.
[11] 王亞紅. 葡萄中糖含量的近紅外檢測技術(shù)研究與儀器開發(fā)[D]. 桂林: 桂林電子科技大學, 2014: 121-125.
[12] YAN Hui, LU Dao-li, CHEN Bin, et al. Development of a hand-held near infrared system based on an Android OS and MicroNIR, and its application in measuring soluble solids content in Fuji apples[J]. NIR news, 2014, 25(4): 16.
[13] ZOU Xiao-bo, ZHAO Jie-wen, POVEY M J W, et al. Variables selection methods in near-infrared spectroscopy[J]. Analytica Chimica Acta, 2010, 667(1/2): 14-32.
[14] 褚小立, 袁洪福, 陸婉珍. 近紅外分析中光譜預(yù)處理及波長選擇方法進展與應(yīng)用[J]. 化學進展, 2004, 16(4): 528-542.
[15] LI Hong-dong, XU Qing-song, LIANG Yi-zeng. Random frog: an efficient reversible jump Markov Chain Monte Carlo-like approach for variable selection with applications to gene selection and disease classification[J]. Anal Chim Acta, 2012(740): 20-26.[16] KASEMSUMRAN S, DU Yi-ping, LI Bo-yan, et al. Moving window cross validation: a new cross validation method for the selection of a rational number of components in a partial least squares calibration model[J]. Analyst, 2006, 131(4): 529-537.
[17] KOSHOUBU J, IWATA T, MINAMI S. Elimination of the uninformative calibration sample subset in the modified UVE(Uninformative Variable Elimination)-PLS (Partial Least Squares) method[J]. Anal Sci., 2001, 17(2): 319-22.
[18] JIANG Hui, LIU Guo-hai, MEI Cong-li, et al. Measurement of process variables in solid-state fermentation of wheat straw using FT-NIR spectroscopy and synergy interval PLS algorithm[J]. Spectrochimica Acta Part a-Molecular and Biomolecular Spectroscopy, 2012(97): 277-283.
[19] LI Jiang-bo, GUO Zhi-ming, HUANG Wen-qiang, et al. Near-infrared spectra combining with CARS and SPA algorithms to screen the variables and samples for quantitatively determining the soluble solids content in strawberry[J]. Guang Pu Xue Yu Guang Pu Fen Xi, 2015, 35(2): 372-8.
[20] CAO Nan-ning, WANG Jia-hua, LI Peng-feng, et al. Study on Variable Selection of NIR Spectral Information Based on GA and SCMWPLS[J]. Spectroscopy and Spectral Analysis, 2010, 30(4): 915-919.
[21] 丁光輝. PLS和GA應(yīng)用于部分有機污染物的QSAR研究[D]. 大連: 大連理工大學, 2006: 97-99.
[22] 吳迪, 吳洪喜, 蔡景波, 等. 基于無信息變量消除法和連續(xù)投影算法的可見—近紅外光譜技術(shù)白蝦種分類方法研究[J]. 紅外與毫米波學報, 2009, 28(6): 423-427.
[23] 陳立旦, 趙艷茹. 可見—近紅外光譜聯(lián)合隨機蛙跳算法檢測生物柴油含水量[J]. 農(nóng)業(yè)工程學報, 2014(8): 168-173.
[24] 唐建平. 近紅外光譜在水果品質(zhì)檢測中的應(yīng)用[J]. 北京農(nóng)業(yè), 2014(24): 232-232.
[25] YAN Hui, HAN Bang-xing, WU Qiong-ying, et al. Rapid detection of Rosa laevigata polysaccharide content by near-infrared spectroscopy[J]. Spectrochim Acta A Mol Biomol Spectrosc, 2011, 79(1): 179-84.
[26] 丁姣, 蔡建榮, 張海東, 等. 近紅外結(jié)合Si-ELM檢測食醋品質(zhì)指標[J]. 食品與機械, 2012, 28(1): 93-96.
[27] 安泉鑫, 陳莉, 龐林江, 等. 近紅外光譜技術(shù)在食品中的應(yīng)用進展[J]. 食品與機械, 2012, 28(5): 239-242.
Determination of SSC content in single grape based on NIR combined with wavelength selection
GUO ChengMAYueLIANGMeng-xingYANHui
(SchoolofBiotechnology,JiangsuUniversityofScienceandTechnology,Zhenjiang,Jiangsu212000,China)
grapes; soluble solids content; NIRS; random frog; uninformative variable elimination
鎮(zhèn)江市農(nóng)業(yè)科技支撐項目(編號:NY2014032)
郭成,男,江蘇科技大學碩士研究生。
顏輝(1971—),男,江蘇科技大學副教授,博士。
E-mail: yanh1006@163.com
2016-07-02