余懷鑫, 潘新星,朱旭, 葉子凡,祝志慧,劉繼紅
1.華中農(nóng)業(yè)大學(xué)工學(xué)院,武漢430070;2.浠水縣長福水稻專業(yè)合作社,浠水 438200;3.華中農(nóng)業(yè)大學(xué)園藝林學(xué)學(xué)院,武漢 430070
含水率是衡量柑橘品質(zhì)的重要指標(biāo)之一,水分豐富的柑橘更受市場青睞。溫州蜜柑是我國柑橘栽培的重要鮮食品種,至今已有2 400多年的栽培歷史,果肉及果汁具有解熱生津、開胃、利尿、祛痰止咳的功效,橘皮及絡(luò)可做中藥,具有很大的經(jīng)濟(jì)價(jià)值。目前對(duì)溫州蜜柑等水果的外部品質(zhì)檢測方法主要有光電分選法,通常用于外部品質(zhì)的分級(jí),通過分析水果外部的特征以大小、顏色、缺陷等作為分選的依據(jù)。而內(nèi)部品質(zhì)的檢測方法還不成熟,主要有人工試吃和通過化學(xué)實(shí)驗(yàn)進(jìn)行分析兩種,前者存在很強(qiáng)的主觀性,后者檢測時(shí)間長、成本高且為有損檢測[1],無法滿足溫州蜜柑含水率無損檢測和實(shí)現(xiàn)品質(zhì)的快速評(píng)定分級(jí)的需求,給消費(fèi)者帶來了極大的不便。因此,對(duì)溫州蜜柑含水率進(jìn)行快速無損檢測具有重要意義。
近些年來,光譜技術(shù)的出現(xiàn)為無損檢測提供了良好的手段,可以進(jìn)行定量和定性檢測[2-3]。許多學(xué)者利用可見/近紅外光譜對(duì)柑橘品質(zhì)進(jìn)行了無損檢測,主要的研究指標(biāo)為柑橘的可溶性固形物、糖度、酸度以及維生素C含量等[4-8],對(duì)柑橘水分研究甚少。但也有學(xué)者通過高光譜/近紅外光譜對(duì)梨[9]、黑寶石李[10]和南疆紅棗[11]等進(jìn)行了水分無損檢測,均取得了較好的效果。光譜技術(shù)作為一種新興的無損檢測技術(shù),具有效率高、成本低且易于實(shí)現(xiàn)自動(dòng)化生產(chǎn)的特點(diǎn)[12]。本研究利用光譜技術(shù)對(duì)溫州蜜柑的含水率進(jìn)行研究,旨在考察基于光譜技術(shù)檢測溫州蜜柑含水率的可行性。
2019年11月份從湖北省武漢市農(nóng)業(yè)科學(xué)院林業(yè)果樹研究所采摘的新鮮溫州蜜柑樣本40個(gè),樣本的最大橫向直徑45~60 mm、質(zhì)量為60~120 g/個(gè)。將樣本用抹布清理掉表面污漬,置于常溫下、通風(fēng)處儲(chǔ)存,讓其自然風(fēng)干。每2 d采集1次透射光譜,并用精度為1 mg的電子天平稱質(zhì)量,共采集10次,最后用蘇珀電熱恒溫鼓風(fēng)干燥箱進(jìn)行脫水,根據(jù)GB 5009.3―2016方法測定40個(gè)樣本在試驗(yàn)過程中的含水率,共得到400組數(shù)據(jù)。測量過程如下:用精度為1 mg的電子天平對(duì)試驗(yàn)當(dāng)天的樣本稱質(zhì)量并記錄,待到19 d試驗(yàn)結(jié)束后,將全部樣本放入烘干箱中以105 ℃烘干72 h,再記錄烘干后樣本的質(zhì)量。含水率=(初始質(zhì)量-烘干后質(zhì)量)/初始質(zhì)量×100%。
采用如圖1所示的光譜采集暗箱,暗箱上端1處安裝光譜采集探頭,與電腦相連,下部中間位置安裝光源,由于需要采集透射光譜,而柑橘果皮厚度不一,故要選用穿透性強(qiáng)、能量強(qiáng)度高的光源。本次光源選用的是MR16鹵素?zé)?,鹵素?zé)襞c水平面垂直朝向中央采集窗口。由于MR16鹵素?zé)艄β蚀?、溫度高,?dǎo)致暗箱內(nèi)部散熱差,易使設(shè)備老化,故在暗箱下端兩側(cè)安裝散熱風(fēng)扇進(jìn)行散熱。光譜儀采用的是海洋光學(xué)的Maya2000pro光譜儀,光譜儀參數(shù)設(shè)置:掃描范圍為200~1 100 nm,平滑次數(shù)為5,積分時(shí)間為100 ms,得到的每條光譜含有2 068個(gè)變量。
1.光纖探頭 Optical fiber probe; 2.取物口 Sampling port; 3.樣本放置口 Sample placing port; 4.散熱風(fēng)扇 Cooling fan; 5.光源 Light source; 6.電腦 Computer.
圖2為使用Maya2000pro光譜儀采集同一個(gè)樣本的果肉和完整果實(shí)的透射光譜。由圖2可知,果肉的透過率比完整果實(shí)透過率高,是因?yàn)楣さ拇嬖趯?dǎo)致的。果肉和完整果實(shí)光譜圖在680、720、780 nm處均出現(xiàn)峰值,光譜相似度較高。隨著柑橘的逐漸成熟,葉綠素會(huì)逐漸轉(zhuǎn)化為類胡蘿卜素與類黃酮,這也是柑橘表皮顏色出現(xiàn)變化的原因,在400~700 nm這一部分主要是受到葉綠素的影響,而在700~800 nm之間出現(xiàn)高吸收峰則是由類胡蘿卜素造成的,這也是完整果實(shí)的透射光譜吸收強(qiáng)度遠(yuǎn)比果肉大的原因。由于需要進(jìn)行無損檢測,因此相比其果肉,選擇完整果實(shí)的透射光譜進(jìn)行建模是可行的。
圖2 樣本完整果實(shí)和果肉的透射光譜圖
在未進(jìn)行試驗(yàn)前,溫州蜜柑的含水率無法得知,由于是同一批采摘的蜜柑,其含水率差異不大,為了擴(kuò)大試驗(yàn)樣本的含水率范圍,采用常溫保存讓其自動(dòng)失水的方法。每隔2 d測量溫州蜜柑的質(zhì)量,得到其含水率均值變化趨勢(圖3)。由圖3可知,隨著時(shí)間的變化,溫州蜜柑的水分含量不斷減少,且40個(gè)樣本的含水率變化趨勢大致相同,表明在該試驗(yàn)條件下該批柑橘的變化趨勢一致。當(dāng)進(jìn)行第10次采集時(shí),即試驗(yàn)進(jìn)行至第19天時(shí),柑橘表皮已經(jīng)出現(xiàn)了明顯的硬化,表明柑橘在試驗(yàn)期間散失了一定水分,從試驗(yàn)結(jié)果來看,水分平均散失了4~5個(gè)百分點(diǎn),水分梯度也進(jìn)一步擴(kuò)大,表明通過常溫儲(chǔ)存的方法擴(kuò)大含水率梯度是可行的。在蜜柑貯存過程中存在呼吸作用等影響內(nèi)部變化的因素,會(huì)造成蜜柑質(zhì)量的變化,但對(duì)質(zhì)量影響最大的還是水分,其他物質(zhì)如糖、酸、類黃酮等含量變化較小,因此不考慮其對(duì)含水率測量結(jié)果的影響。
圖3 溫州蜜柑水分隨時(shí)間變化
1)光譜預(yù)處理。由于儀器對(duì)于外界環(huán)境的變化比較敏感,采集到的光譜中會(huì)含有部分的噪聲信息,采用合適的預(yù)處理方法能夠有效地消除噪聲及特定物理因素的干擾,確保光譜信息的準(zhǔn)確性[13]。因此,將無預(yù)處理和SD、MSC/SNV、SG平滑、標(biāo)準(zhǔn)化5種預(yù)處理方法根據(jù)不同預(yù)處理的作用按照表1進(jìn)行排列組合(其中0表示不進(jìn)行預(yù)處理),共得到2×3×2×2=24種預(yù)處理方式,用數(shù)字1~24對(duì)所有組合進(jìn)行編號(hào),最后根據(jù)預(yù)處理后建立的PLS模型的建模效果,得到較優(yōu)的預(yù)處理方法。
表1 預(yù)處理方法 Table 1 Pretreatment methods
2)光譜特征波長選擇。采集的光譜波段為200~1 100 nm,光譜范圍較寬、波段數(shù)目較多(2 068維),部分波段存在較強(qiáng)的相關(guān)性,原始光譜除了包含反映內(nèi)部成分差異的信息外還含有大量冗余信息,分類時(shí)可能會(huì)產(chǎn)生“維數(shù)災(zāi)難”現(xiàn)象[14],且會(huì)影響分類的精度。因此降維就顯得十分必要,本研究采用CARS來篩選特征波長以達(dá)到降維目的。競爭性自適應(yīng)重加權(quán)采樣算法(CARS)采用“適者生存”法則,利用蒙特卡羅采樣(MCS)法采樣N次,對(duì)比每次產(chǎn)生的PLS回歸模型的交互驗(yàn)證均方差值(root mean square error of cross validation,RMSECV),RMSECV值最小的那個(gè)模型所對(duì)應(yīng)的變量子集被選為最優(yōu)變量子集[15]。
PLS分析是一種新型的多元數(shù)據(jù)分析方法,通過投影將預(yù)測變量和觀測變量投影到一個(gè)新的空間之中以尋找一個(gè)線性回歸的模型,集主成分分析、典型相關(guān)分析以及多元線性回歸于一身,因此被廣泛應(yīng)用于多種分析統(tǒng)計(jì)領(lǐng)域。BP神經(jīng)網(wǎng)絡(luò)主要由輸入層、隱含層和輸出層組成,輸入層的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)自變量,輸出層的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)1個(gè)應(yīng)變量,而各層的節(jié)點(diǎn)數(shù)則代表了該模型的訓(xùn)練效果。當(dāng)節(jié)點(diǎn)越多,得到的信息會(huì)越全面,但訓(xùn)練時(shí)間也會(huì)隨之延長。LSSVM采用最小二乘線性系統(tǒng)作為損失函數(shù),替代傳統(tǒng)的支持向量機(jī)所用的二次規(guī)劃方法,簡化了計(jì)算的復(fù)雜性,是一種可以同時(shí)處理線性和非線性信息的建模方法[16]。
本研究將柑橘的含水率測量值作為因變量,光譜的波長值作為自變量,建立PLS、BP以及LSSVM模型。建立模型的好壞由訓(xùn)練集相關(guān)系數(shù)(Rc)、訓(xùn)練集均方根誤差(RMSEC)、測試集相關(guān)系數(shù)(Rp)以及測試集均方根誤差(RMSEP)決定,其中相關(guān)系數(shù)越接近1,均方根誤差越小,模型的效果就越好,上述計(jì)算均由MATLAB 2014a完成。
將試驗(yàn)得到的400個(gè)溫州蜜柑樣本的初始可見/近紅外光譜通過馬氏距離法剔除異常樣本,如圖4所示,位于綠色實(shí)線上方的樣本被當(dāng)做異常樣本剔除,共23個(gè)。為了將差異性大的樣本劃入訓(xùn)練集中,保證訓(xùn)練集的樣本具有較強(qiáng)的代表性,采用Kennard-Stone算法[17]以3∶1劃分校正集和驗(yàn)證集,并將24種排列組合預(yù)處理后的光譜建立基于含水率的PLS模型,得到的建模結(jié)果如圖5所示。
圖4 馬氏距離法剔除異常樣本
從圖5可知,當(dāng)采用FD(編號(hào)13~24)后,訓(xùn)練集相關(guān)系數(shù)較高,測試集相關(guān)系數(shù)較低,出現(xiàn)了過擬合現(xiàn)象。通過對(duì)比相關(guān)系數(shù)(越大越好)和均方根誤差(越小越好)可以發(fā)現(xiàn),相較于第1組(無預(yù)處理),2~12組建模結(jié)果均有所提升,表明有效的預(yù)處理可以去除外界干擾信息,提高建模效果,其中建模效果最好的是第5組,采用的預(yù)處理方式為SNV。
圖5 24種不同預(yù)處理組合方式下的PLS建模結(jié)果
本研究采用的特征波長的提取方法為CARS,采樣次數(shù)設(shè)定為50次,交叉驗(yàn)證設(shè)定為5次,以建立LSSVM為例,特征波長提取的過程如圖6所示,其中橫坐標(biāo)均為采樣次數(shù)。從圖6A可以看出,選用的變量數(shù)先急劇減少后趨于穩(wěn)定,這是指數(shù)衰減函數(shù)造成的;圖6B表示RMSECV值的變化情況,在采樣第7次時(shí)為最小值,表明采樣第7次時(shí)剔除后剩余的波長點(diǎn)與溫州蜜柑含水率相關(guān)性較大;圖6C中各線是隨著采樣次數(shù)的增加回歸系數(shù)的變化,圖6中的“*”線為RMSECV最小值處,與圖6B相對(duì)應(yīng),利用CARS算法進(jìn)行多次篩選后最終確定第7次篩選出的359個(gè)特征波長變量作為最終入選的特征值。經(jīng)過CARS處理后可以極大地減少參與建模的波數(shù),提高建模效率。
圖6 CARS篩選特征波長過程
將經(jīng)過SNV預(yù)處理后的光譜利用CARS算法提取特征波長,分別建立PLS模型、BP神經(jīng)網(wǎng)絡(luò)模型以及LSSVM模型。BP神經(jīng)網(wǎng)絡(luò)模型選用LM函數(shù)作為訓(xùn)練函數(shù),并確定隱含層節(jié)點(diǎn)個(gè)數(shù)為10;LSSVM模型中選用徑向基函數(shù)(RBF)作為核函數(shù),因其能夠?qū)崿F(xiàn)非線性映射,且相比于多項(xiàng)式核函數(shù)它所需參數(shù)較少,模型復(fù)雜程度較低,計(jì)算速度較快。核函數(shù)參數(shù)為100,懲罰因子為30,3個(gè)模型的建模結(jié)果如表2所示。
表2 基于CARS的不同模型建模結(jié)果 Table 2 Modeling results of different models based on CARS
由表2可知,效果最佳的是經(jīng)過CARS提取特征波長后建立的LSSVM模型,經(jīng)過CARS篩選后參與建模的波數(shù)由2 068個(gè)減少為359個(gè),僅占原始波數(shù)的17.36%,提高了模型的運(yùn)算效率,該模型的校正集相關(guān)系數(shù)和均方根誤差分別為0.937 5和0.008 6,驗(yàn)證集相關(guān)系數(shù)和均方根誤差分別為0.831 6和0.012 0。圖7是LSSVM含水率預(yù)測模型效果圖,表明利用SNV+CARS+LSSVM檢測溫州蜜柑水分是可行的。
圖7 LSSVM含水率預(yù)測模型
水分作為柑橘品質(zhì)的一項(xiàng)重要指標(biāo),對(duì)采收后柑橘的貯存和加工具有重要的意義。前人對(duì)柑橘品質(zhì)檢測的研究重點(diǎn)集中在糖度、酸度、維生素C等營養(yǎng)物質(zhì)方面,對(duì)水分的研究大都集中在柑橘種植期的水分供給方面。本試驗(yàn)對(duì)溫州蜜柑進(jìn)行了水分檢測,得到的測試集相關(guān)系數(shù)為0.831 6,與文獻(xiàn)[18]預(yù)測砂糖橘水分結(jié)果相近,但相比其0.82~0.87的水分梯度[18],本試驗(yàn)通過自然貯存的方式將含水率梯度擴(kuò)大到了0.73~0.85,提高了模型的適應(yīng)性,且能夠滿足蜜柑水分的檢測要求,為便攜式儀器的開發(fā)提供了理論基礎(chǔ)。后續(xù)研究可以將不同品種、種植區(qū)域的蜜柑進(jìn)行試驗(yàn),并比較不同成熟期蜜柑的水分差異性,實(shí)現(xiàn)對(duì)不同成熟期柑橘的預(yù)測,探究通過控制烘干時(shí)長來進(jìn)一步擴(kuò)大含水率范圍,并改進(jìn)光譜特征提取方法以及建模方法來進(jìn)一步提高模型的準(zhǔn)確性和適應(yīng)性。同時(shí)可以探究不同貯藏期水分含量的變化趨勢,便于根據(jù)水分信息合理安排柑橘的貯藏條件與時(shí)間,有利于提高整體經(jīng)濟(jì)效益。