姜鳳利,楊 磊,田有文,孫炳新,羅子旋
(沈陽農(nóng)業(yè)大學(xué)a.信息與電氣工程學(xué)院/農(nóng)業(yè)農(nóng)村部園藝作物農(nóng)業(yè)裝備重點(diǎn)實(shí)驗(yàn)室,b.食品學(xué)院,沈陽 110161)
軟棗獼猴桃(Actinidia argute)別名軟棗子、迷你獼猴桃,屬于獼猴桃科獼猴桃屬。軟棗獼猴桃主要分布于中國、日本、朝鮮半島和俄羅斯遠(yuǎn)東地區(qū),在國內(nèi),東北三省資源最為豐富,其中遼寧省的主產(chǎn)區(qū)種植面積超過2000 hm2[1]。軟棗獼猴桃果皮光滑細(xì)嫩,果肉大多呈綠色,口味獨(dú)特,營養(yǎng)價值高,富含多種維生素和氨基酸[2]。但是軟棗獼猴桃屬于呼吸躍變型漿果,耐貯性差,采后果實(shí)迅速軟化,并伴有嚴(yán)重的脫水、皺縮現(xiàn)象,在室溫下一般只能貯藏一周左右[3]。軟棗獼猴桃成熟時其外部特征變化不明顯,而其內(nèi)部最明顯的生理變化是淀粉降解,可溶性固形物含量(soluble solids content,SSC)上升[4]。SSC與軟棗獼猴桃的成熟度密切相關(guān),是評價軟棗獼猴桃食用品質(zhì)的關(guān)鍵指標(biāo)[5]。SSC的測定通常采用物理或者化學(xué)方法,不僅耗時費(fèi)力,且具有破壞性和局限性。因此,尋找一種能夠?qū)崿F(xiàn)軟棗獼猴桃SSC快速、高效的檢測手段具有重要意義。
高光譜成像技術(shù)結(jié)合了樣本的光譜信息和圖像信息,能夠快速、無損地獲取樣本內(nèi)部信息和外部特征[6],已成功應(yīng)用于水果硬度、可溶性固形物和pH等理化指標(biāo)檢測等方面[7-12]。SHAO等[13]應(yīng)用高光譜成像技術(shù)結(jié)合特征波段選擇方法對殼聚糖涂膜葡萄的可溶性固形物含量建立預(yù)測模型,結(jié)果表明競爭性自適應(yīng)重加權(quán)采樣算法(competitive adaptive reweighted sampling, CARS)結(jié)合偏最小二乘回歸(partial least squares regression,PLSR)模型效果最佳,測試集精度可達(dá)到0.8 以上。楊寶華等[14]利用高光譜成像技術(shù)提取鮮桃的光譜信息,結(jié)合普適性堆棧自動編碼器建立粒子群優(yōu)化支持向量回歸(particle swarm optimization-support vector regression,PSO-SVR)模型對可溶性固形物含量進(jìn)行預(yù)測,其決定系數(shù)(R2p)在0.87 以上,具有良好的預(yù)測精度。程麗娟等[15]運(yùn)用高光譜成像技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法建立了靈武長棗蔗糖預(yù)測模型,其中基于CARS 提取特征波長的主成分回歸(principal component regression,PCR)模型效果最佳,預(yù)測集的相關(guān)系數(shù)(Rp)和均方根誤差(RM?SEP)分別為0.843和0.014。上述文獻(xiàn)對水果的理化指標(biāo)進(jìn)行了定量預(yù)測并取得較好的預(yù)測效果,然而水果內(nèi)部品質(zhì)在空間分布上具有差異性,因此研究者們進(jìn)一步對樣本像素點(diǎn)品質(zhì)可視化進(jìn)行了研究。LI等[16]利用近紅外高光譜成像技術(shù)建立不同成熟期櫻桃SSC 和pH 的預(yù)測模型,通過比較不同的建模方法,選擇多元線性回歸(multiple linear regression,MLR)作為最終建模方法,其SSC和pH預(yù)測模型的R2p分別為0.863和0.819,并實(shí)現(xiàn)了SSC 和pH 的分布可視化。邵園園等[17]通過高光譜成像技術(shù)對不同成熟期的肥城桃進(jìn)行分類,并建立預(yù)測SSC 和硬度的MLR 模型,Rp2分別為0.952 和0.877,并實(shí)現(xiàn)SSC 和硬度的可視化檢測。HU 等[18]通過高光譜成像技術(shù)檢測1-甲基環(huán)丙烯(1-Methylcyclopropene, 1-MCP)催熟的獼猴桃含糖量變化情況,基于特征波長建立MLR 模型的最佳預(yù)測結(jié)果Rp2為0.934,并通過可視化圖像展示含糖量分布情況。盡管高光譜成像技術(shù)在水果內(nèi)部品質(zhì)可視化檢測方面已有諸多應(yīng)用,但關(guān)于軟棗獼猴桃SSC分布可視化的研究還未見報(bào)道。
本研究以軟棗獼猴桃為研究對象,采集室溫25 ℃條件下不同貯藏天數(shù)軟棗獼猴桃高光譜信息,基于特征波長構(gòu)建其可溶性固形物含量的定量預(yù)測模型,并繪制SSC分布圖,揭示不同貯藏時間軟棗獼猴桃內(nèi)部SSC變化規(guī)律及空間分布特征。
試驗(yàn)研究的軟棗獼猴桃品種為綠佳人,2021年9月12 日采摘于遼寧省丹東市振安區(qū)果園,采摘預(yù)冷后立即放入保鮮箱內(nèi)快速運(yùn)回實(shí)驗(yàn)室。選取大小、成熟度一致,無病蟲害和機(jī)械傷的軟棗獼猴桃作為試驗(yàn)樣本,每盒6 個軟棗獼猴桃放置于BOPP 托盒中(22.3×13.3×4.0 cm3),共20 盒(120 個)軟棗獼猴桃樣本。將所有樣本置于智能人工氣候箱(RTOP-268D,浙江拓普云農(nóng)科技股份有限公司)中貯藏,溫度設(shè)置為25 ℃。在貯藏0(采摘當(dāng)天),3,5,7 d時,分別取出5盒(30個)樣本在室溫條件下進(jìn)行高光譜圖像采集。圖1為不同貯藏天數(shù)軟棗獼猴桃整體及橫切面的RGB圖像。
圖1 不同貯藏天數(shù)軟棗獼猴桃樣本Figure 1 Actinidia argute samples at different storage days
采用的高光譜圖像采集系統(tǒng)如圖2,該系統(tǒng)主要由高光譜成像光譜儀(ImSpector V10E)、像素為392×1040的CCD 相機(jī)(IGV-B1410M)、位移平臺(IRCP0076-1)、2 個150 W 的光纖鹵素?zé)簦?900-Illuminatior)、暗箱(120cm×50 cm×140 cm)和計(jì)算機(jī)(DELL Vostro 5560D-1528)等組成。高光譜成像系統(tǒng)的波長采集范圍為400~1 000 nm,光譜分辨率為1.27 nm,共472個波段。
圖2 高光譜圖像采集系統(tǒng)Figure 2 Hyperspectral imaging acquisition system
在開始試驗(yàn)前先對高光譜成像系統(tǒng)進(jìn)行預(yù)熱,預(yù)熱時間設(shè)置為30 min。將軟棗獼猴桃樣本每6個按照2排3列擺放在位移平臺上,調(diào)整鏡頭與樣本之間的距離為320 mm,設(shè)置相機(jī)的曝光時間為3 ms,位移平臺的移動速度為1.8 mm?s-1。
在進(jìn)行高光譜圖像采集時,為消除相機(jī)暗電流和光照不均等對圖像帶來的影響,需要對采集到的高光譜圖像(軟棗獼猴桃校正前的高光譜圖像Is)進(jìn)行黑白板校正。首先掃描反射率接近100%的白色校正板得到全白標(biāo)定圖像Iw,然后將鏡頭蓋蓋上獲取全黑標(biāo)定圖像Id,按照公式(1)進(jìn)行計(jì)算得到校正后的高光譜圖像I。
本研究首先分割出每幅高光譜圖像中單個軟棗獼猴桃,如圖3 所示,通過對比背景和軟棗獼猴桃的光譜曲線可知,背景和樣本相對反射率值在883 nm 處差異較為顯著,因此選取883 nm 的灰度圖像作為特征圖像,采用閾值分割方法分割出背景和軟棗獼猴桃,并通過膨脹和腐蝕運(yùn)算,得到二值化圖像,對每個樣本高光譜圖像進(jìn)行掩膜操作,最后,將所有軟棗獼猴桃分割出來,并將分割出的整個軟棗獼猴桃樣本作為感興趣區(qū)域(region of interest,ROI),計(jì)算每個ROI 的平均光譜值作為該樣本的反射光譜值。
圖3 軟棗獼猴桃的感興趣區(qū)域提取Figure 3 Extraction of interested region of Actinidia argute
軟棗獼猴桃樣本高光譜圖像采集完成后,硬度測試采用數(shù)顯果實(shí)硬度計(jì)(GY-4 型,北京金科利達(dá)電子有限公司),測頭直徑7.9 mm,下壓深度10 mm,選取軟棗獼猴桃赤道位置進(jìn)行測量。SSC測量時,將果實(shí)研磨后,經(jīng)4 層紗布過濾,用吸管吸取0.3 mL 軟棗獼猴桃汁滴于數(shù)字折光儀(DBR45 型,深圳佛蘭德電子有限公司)上進(jìn)行測定,測量指標(biāo)范圍為0~45°Brix,測量精度為0.1°Brix,理化指標(biāo)測定時每個樣本重復(fù)3 次,取平均值作為其真實(shí)值。
1.6.1 樣本劃分與數(shù)據(jù)預(yù)處理 采用光譜-理化值共生距離(samples set partitioning based on joint X-Y distanc?es,SPXY)[19]對光譜數(shù)據(jù)和測定的SSC進(jìn)行訓(xùn)練集和測試集的劃分。然后通過計(jì)算訓(xùn)練集和測試集樣本的最大值、最小值、平均值、標(biāo)準(zhǔn)差以及變異系數(shù)來評估樣本劃分是否合理。
為去除光譜數(shù)據(jù)中噪聲干擾,增強(qiáng)光譜有效信息并提高建模的準(zhǔn)確性,本研究采用多元散射校正(multipli?cative scatter correction,MSC)、卷積平滑(savitzky golay,SG)和標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate,SNV)等方法對原始光譜信息進(jìn)行預(yù)處理[20],通過對比不同預(yù)處理方法的建模效果,確定最佳的預(yù)處理方法。
1.6.2 特征波長提取 原始光譜數(shù)據(jù)維數(shù)高,波段間高度相關(guān)性導(dǎo)致共線性和信息冗余問題,從而增加計(jì)算量降低建模效率。為此采用競爭性自適應(yīng)重加權(quán)采樣算法(competitive adaptive reweighted sampling,CARS)、連續(xù)投影算法(successive projections algorithm, SPA)和無信息變量消除算法(uninformative variable elimination,UVE)進(jìn)行特征波長選取,實(shí)現(xiàn)數(shù)據(jù)降維。
CARS 是一種以迭代競爭的方式從偏最小二乘模型中篩選回歸系數(shù)絕對值較大的波段,再通過抽樣篩選特征變量,選取交叉驗(yàn)證均方根誤差(RMSECV)值最低的子集,其中包含的變量為篩選出的最佳波長組合[21]。
SPA 是一種前向變量選擇方法。首先通過投影獲得具有最小共線性的候選變量子集,然后在多元線性回歸模型中獲得交叉驗(yàn)證均方根誤差(RMSECV)值最小的子集,從而獲得最優(yōu)變量組合[22]。
UVE是一種基于PLS系數(shù)分析的變量選擇方法,通過將隨機(jī)噪聲加入到光譜矩陣中,根據(jù)引入穩(wěn)定性值來評價模型中每個變量被選中的可能性,進(jìn)而消除光譜數(shù)據(jù)中無用數(shù)據(jù),達(dá)到降維的效果[23]。
1.6.3 建模方法與模型評價 將特征波長作為輸入,實(shí)測SSC作為輸出,構(gòu)建偏最小二乘回歸(partial least squares regression, PLSR)、極限學(xué)習(xí)機(jī)(extreme learning machine, ELM)和粒子群優(yōu)化的極限學(xué)習(xí)機(jī)(particle swarm optimization-extreme learning machine,PSO-ELM)3種定量預(yù)測模型。PLSR是一種結(jié)合了多元線性回歸分析、相關(guān)分析和主成分分析技術(shù)的建模方法,可以解決樣本數(shù)量少于波長數(shù)量以及輸入變量相關(guān)性高的問題[24]。ELM是由單隱含層前饋神經(jīng)網(wǎng)絡(luò)發(fā)展起來的一種神經(jīng)網(wǎng)絡(luò)算法,具有學(xué)習(xí)速度快且訓(xùn)練誤差較小的優(yōu)點(diǎn)[25]。但因?yàn)镋LM的輸入權(quán)重和隱含層偏差均是隨機(jī)生成,所以其建立的預(yù)測模型的準(zhǔn)確性和穩(wěn)定性不高。因此,本研究提出一種采用粒子群優(yōu)化算法對ELM模型的輸入權(quán)重和隱含層偏差進(jìn)行優(yōu)化,以提高ELM模型的預(yù)測精度和泛化能力。
粒子群優(yōu)化(particle swarm optimization,PSO)算法是1995 年由EBERHART 和KENNEDY 提出的一種模擬鳥群捕食行為的群集智能算法[26]。算法中每1個粒子代表優(yōu)化問題的潛在解(由位置和速度2個參數(shù)表達(dá)),求解過程是根據(jù)個體極值和全局極值不斷更新自己的位置和速度,從而找到最優(yōu)解。
粒子群優(yōu)化極限學(xué)習(xí)機(jī)模型算法的流程如下。
(1)通過輸入輸出數(shù)據(jù)確定ELM網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),設(shè)置激活函數(shù)、隱含層神經(jīng)元個數(shù)等基本參數(shù)。
(2)初始化PSO 參數(shù):種群中每個粒子代表ELM 模型的連接權(quán)值和偏差,設(shè)置粒子的初始位置Xi,初始飛行速度vi,學(xué)習(xí)因子c1,c2,初始化種群數(shù)量,慣性權(quán)重的最大值和最小值以及最大迭代次數(shù)。
(3)選擇ELM 模型均方根誤差作為適應(yīng)度函數(shù),將粒子當(dāng)前值作為個體極值Pkid,通過和各粒子的適應(yīng)度值進(jìn)行比較,確定全局最優(yōu)解Pkgd。
(4)根據(jù)式(2)和式(3)更新粒子的速度和位置。
式中:k為迭代次數(shù);ω為慣性因子用以平衡局部尋優(yōu)能力和全局尋優(yōu)能力之間的關(guān)系;c1,c2為加速度常數(shù)分別表示個體學(xué)習(xí)因子和社會學(xué)習(xí)因子,r1,r2是兩個隨機(jī)產(chǎn)生的加速度權(quán)重系數(shù),取值在0~1之間;Pkid和Pkgd分別為第d維粒子i在第k次迭代時的個體極值和全局極值。
(5)根據(jù)粒子更新后的位置和速度,繼續(xù)進(jìn)行迭代尋優(yōu),不斷更新Pkid和Pkgd,直到滿足最大迭代次數(shù)或適應(yīng)度值達(dá)到給定閾值時,停止參數(shù)的尋優(yōu)操作,否則返回到步驟(3)。
(6)將最終獲得的最優(yōu)權(quán)值和偏差應(yīng)用到ELM模型中。
預(yù)測模型建好后,通過5個指標(biāo)評價模型的預(yù)測性能,分別為訓(xùn)練集的決定系數(shù)(decision coefficient of cali?bration set,Rc2)和均方根誤差(root mean square error of calibration set,RMSEC)、測試集的決定系數(shù)(decision co?efficient of prediction set,Rp2)和均方根誤差(root mean square error of prediction set,RMSEP)以及樣本標(biāo)準(zhǔn)偏差與測試集均方根誤差的比值(residual prediction deviation,RPD)。其中,Rc2和Rp2越接近1,RMSEC 和RMSEP 越小,RPD越大,表明模型的預(yù)測能力越強(qiáng)[27]。
SSC 和硬度的變化與果蔬的成熟度有關(guān),是反映其后熟狀態(tài)的重要指標(biāo)[4]。圖4為軟棗獼猴桃不同貯藏天數(shù)下SSC 和硬度的統(tǒng)計(jì)結(jié)果。由圖4 可知,隨著貯藏時間的延長,軟棗獼猴桃逐漸成熟,SSC 不斷上升,這是因?yàn)楣麑?shí)采后一直進(jìn)行呼吸等生理活動,大量淀粉、有機(jī)酸等大分子物質(zhì)分解,形成可溶性固形物,隨著果實(shí)成熟度的增加,果實(shí)達(dá)到后熟甚至衰老,這是由于樣本內(nèi)部的淀粉等多糖物質(zhì)逐漸降解導(dǎo)致的;與之相反的是,軟棗獼猴桃的硬度逐漸降低,這是由于細(xì)胞結(jié)構(gòu)的變化導(dǎo)致的果實(shí)軟化,隨著貯藏天數(shù)的增加軟棗獼猴桃隨著呼吸作用導(dǎo)致的能量消耗加劇,硬度會明顯下降。
圖4 軟棗獼猴桃貯藏過程中理化指標(biāo)的變化Figure 4 Changes of physicochemical indexes of Actinidia argute during storage
圖5為軟棗獼猴桃貯藏0,3,5,7 d的全部樣本平均光譜曲線,分析發(fā)現(xiàn)不同貯藏天數(shù)光譜曲線整體變化趨勢基本一致。在450~500 nm,反射率緩慢上升,并在510 nm 呈現(xiàn)明顯的反射峰,該波段樣本中葉綠素、花青素和類胡蘿卜素含量豐富[28]。在510~650 nm,反射率呈現(xiàn)緩慢下滑現(xiàn)象,在650 nm 出現(xiàn)較為明顯的吸收帶。在650~730 nm 范圍內(nèi),光譜曲線差異較小,曲線幾乎重合,但反射率急劇增加,主要是因?yàn)檐洍棲J猴桃對近紅外波段吸收較少。在730~920 nm 范圍內(nèi)形成主要的反射率平臺[29],可以看出在此區(qū)間隨著貯藏天數(shù)的增加,光譜反射率呈現(xiàn)逐漸升高的單調(diào)變化規(guī)律,原因是由于軟棗獼猴桃隨著貯藏時間的延長,顏色逐漸加深,而且其主要成分及理化性質(zhì)發(fā)生改變,從而使光譜反射率發(fā)生變化。970 nm 附近出現(xiàn)的吸收帶,主要由樣本的水分引起的,為O-H 二級倍頻特征吸收峰[30],當(dāng)軟棗獼猴桃成熟軟化后,果實(shí)內(nèi)水分和其他可溶性物質(zhì)增多,因此SSC也會受到影響。
圖5 平均光譜曲線Figure 5 Average spectral curve
實(shí)驗(yàn)將不同貯藏天數(shù)軟棗獼猴桃每組30個樣本(共120個),采用SPXY按照7∶3劃分為訓(xùn)練集21個(共84個),預(yù)測集9個(共36個),劃分結(jié)果如表1。
表1 軟棗獼猴桃SSC含量統(tǒng)計(jì)結(jié)果Table 1 Statistics of SSC content in Actinidia argute
由表1 可知,訓(xùn)練集包含了測試集SSC 的最大值和最小值,且分布范圍廣,說明SPXY 劃分的數(shù)據(jù)集合理,有利于后續(xù)定量預(yù)測建模效果。
為驗(yàn)證預(yù)處理方法效果,分別建立原始光譜和3 種預(yù)處理方法后的光譜與SSC 的PLSR 預(yù)測模型,結(jié)果如表2。由表2可知,經(jīng)過MSC預(yù)處理后的光譜數(shù)據(jù)與軟棗獼猴桃SSC的相關(guān)性得到提高,獲得了較高的Rp2值和較低的RMSEP 值,說明MSC 能夠有效減少光譜數(shù)據(jù)中噪聲的影響,提高模型的預(yù)測效果,因此,后續(xù)研究均采用經(jīng)過MSC預(yù)處理后的光譜數(shù)據(jù)。
表2 不同預(yù)處理方法建模結(jié)果Table 2 The modeling results of different pretreatment methods
分別采用CARS,SPA 和UVE 算法提取與軟棗獼猴桃SSC 相關(guān)性最大的特征波長,3 種方法提取的特征波長分布如圖6~圖8。采用CARS 算法對預(yù)處理后的光譜數(shù)據(jù)進(jìn)行特征波長提取時,設(shè)定蒙特卡洛(Monte-Car?lo)采樣次數(shù)為50,當(dāng)采樣運(yùn)行24次時,RMSECV 值達(dá)到最小值,共提取24個特征波長,占全光譜波段的5.1%。SPA 算法提取特征波長時,設(shè)置特征光譜變量數(shù)的變化范圍為7~25,當(dāng)RMSECV=1.595 即最小值時,此時提取20 個特征光譜變量,占全光譜波段的4.2%。采用UVE 算法提取特征波長時,設(shè)置主成分個數(shù)為10,隨機(jī)變量個數(shù)為472個,當(dāng)閾值為±20.34時,經(jīng)UVE算法篩選出60個波長變量,占波長總數(shù)的12.7%。
圖6 CARS算法提取特征波長分布Figure 6 Distribution of characteristic wavelengths selected by CARS
圖7 SPA算法提取特征波長分布Figure 7 Distribution of characteris‐tic wavelengths selected by SPA
圖8 UVE算法提取特征波長分布Figure 8 Distribution of characteris‐tic wavelengths selected by UVE
由圖6~圖8可知,3種方法篩選的特征波段主要集中在700~1 000 nm 范圍內(nèi),主要是因?yàn)樵谠摬ǘ畏秶鷥?nèi)軟棗獼猴桃的光譜數(shù)據(jù)差異明顯(圖5),說明該波段范圍為軟棗獼猴桃SSC變化敏感的區(qū)間。
2.6.1 PLSR和ELM模型的建立 分別采用CARS,SPA和UVE算法提取的特征波長作為輸入,構(gòu)建PLSR和ELM 的SSC預(yù)測模型。調(diào)整各模型參數(shù)至最佳狀態(tài),確定ELM模型參數(shù):激活函數(shù)為“Sigmoid”函數(shù),隱含層神經(jīng)元個數(shù)為15。預(yù)測結(jié)果見圖9和圖10。
圖9 不同特征波長提取方法的PLSR模型預(yù)測效果Figure 9 PLSR model prediction results of different feature band extraction method
圖10 不同特征波長提取方法的ELM模型預(yù)測效果Figure 10 ELM model prediction results of different feature band extraction method
由圖9和圖10可知,從整體來看,ELM 模型預(yù)測效果優(yōu)于PLSR 模型,PLSR 模型預(yù)測結(jié)果整體存在一定的分散性,而ELM 模型部分預(yù)測結(jié)果偏離直線y=x較多。PLSR 模型訓(xùn)練集和預(yù)測集的決定系數(shù)Rc2和Rp2值均高于0.683,均方根誤差RMSEC和RMSEP值均低于1.766,RPD最小值為1.699;ELM 模型訓(xùn)練集的決定系數(shù)Rc2和值均高于0.737,均方根誤差RMSEC和RMSEP值均低于1.891,RPD最小值為1.772。其中,CARS-ELM 預(yù)測效果最好,Rc2和Rp2值分別為0.831 和0.850,RMSEC 和RMSEP 值分別為1.488 和1.520;而UVE-PLSR 預(yù)測效果最差,Rc2和Rp2值分別為0.712和0.683,RMSEC和RMSEP值分別為1.682和1.701。對比不同特征波長提取方法建模效果,與SPA和UVE算法相比,CARS算法提取的特征波長建模效果最好。值得注意的是,UVE-ELM 模型訓(xùn)練集取得了相對較好的預(yù)測效果,其Rc2和RMSEC 分別為0.849 和1.316,然而預(yù)測集預(yù)測效果下降明顯,Rp2和RMSEP分別為0.737和1.891,表明UVE特征波長提取算法所建模型存在一定的過擬合現(xiàn)象。
2.6.2 PSO-ELM模型的建立 同樣,將3種不同特征提取算法提取的特征波長分別作為模型輸入,實(shí)測SSC作為模型輸出,構(gòu)建PSO-ELM模型。模型的粒子種群規(guī)模設(shè)置為60,學(xué)習(xí)因子c1=2.4,c2=1.6,慣性因子最大值0.8,最小值0.4,迭代次數(shù)k=100次。建模效果如圖11。
圖11 不同特征波長提取方法的PSO-ELM模型預(yù)測效果Figure 11 PSO-ELM model prediction results of different feature band extraction method
由圖11 可知,以不同方法提取的特征波長作為PSO-ELM 模型的輸入,均取得了較高的預(yù)測精度,其預(yù)測結(jié)果較緊密地分布在直線y=x上,只有極少數(shù)點(diǎn)稍微偏離直線y=x,表明該模型預(yù)測值與實(shí)測值間存在較小的偏差,模型預(yù)測性能優(yōu)異。PSO-ELM 模型的訓(xùn)練集和測試集的Rc2和Rp2均在0.845 以上,RMSEC 和RMSEP 均低于1.359。與PLSR 模型和ELM 模型類似,CARS 提取的特征波長建模效果優(yōu)于SPA 和UVE,Rc2和Rp2分別為0.927 和0.934,RMSEC 和RMSEP 分別為0.938 和0.952,RPD 為2.277,由此進(jìn)一步說明,CARS 算法提取的特征波長作為輸入所建模型最穩(wěn)定,預(yù)測準(zhǔn)確性最高??赡苁且?yàn)镾PA 在減少數(shù)據(jù)冗余時導(dǎo)致了部分相關(guān)信息被剔除,UVE 提取的冗余信息過多,不僅降低了模型精度還增加了模型運(yùn)行時間,而CARS 能在減少數(shù)據(jù)冗余的同時保留了更多與SSC相關(guān)的光譜數(shù)據(jù),提高了模型的預(yù)測精度。
2.6.3 CARS-PLSR、CARS-ELM和CARS-PSO-ELM模型結(jié)果比較 進(jìn)一步比較基于CARS特征波長提取的PLSR、ELM和PSO-ELM模型建模效果,(表3)。由表3可知,相比其他兩種模型,CARS-PSO-ELM取得了最好的預(yù)測精度。訓(xùn)練集Rc2的預(yù)測結(jié)果分別比CARS-PLSR和CARS-ELM提升23.4%和11.6%,RMSEC分別降低40.1%和37%;預(yù)測集Rp2的預(yù)測結(jié)果分別比CARS-PLSR和CARS-ELM提升26.2%和9.9%,RMSEP分別降低45.7%和37.4%,可以看出,不論是訓(xùn)練集還是預(yù)測集,CARS-PSO-ELM模型在預(yù)測軟棗獼猴桃SSC時均表現(xiàn)出色。由此可見,經(jīng)過PSO對ELM模型的輸入權(quán)重和隱含層偏差不斷進(jìn)行優(yōu)化,可顯著改善模型的預(yù)測性能,提高模型的精確性和穩(wěn)定性,說明PSO算法能夠保持種群多樣性,避免了ELM模型的慣性權(quán)重與偏差的隨機(jī)性。
表3 基于CARS特征波長提取的3種模型結(jié)果比較Table 3 Comparison of three models with CARS
將高光譜圖像每個像素點(diǎn)的特征波段輸入CARSPSO-ELM 模型,計(jì)算SSC,運(yùn)用偽彩圖處理技術(shù)生成軟棗獼猴桃SSC分布圖,用綠黃紅色階的變化表示軟棗獼猴桃不同貯藏天數(shù)SSC 的變化,綠色表示含量最低,紅色表示含量最高,結(jié)果如圖12。從總體顏色變化來看,軟棗獼猴桃SSC 隨著貯藏時間延長而不斷上升。由于軟棗獼猴桃表面曲率的變化,使得果實(shí)表皮在靠近背景時,預(yù)測的SSC 偏低。剛采摘的軟棗獼猴桃SSC 主要集中在3~7 °Brix,整體SSC 偏低,顏色呈青綠,貯藏3 d的軟棗獼猴桃SSC 主要集中在6~10°Brix,顏色呈黃綠色,少部分區(qū)域呈橙色,貯藏5 d 的軟棗獼猴桃SSC 主要集中在9~13°Brix,樣本大多呈橙紅色,貯藏7 d的軟棗獼猴桃SSC主要集中在12~15°Brix,樣本整體呈紅色,局部摻雜著少量的黃色區(qū)域,這與表1中SSC 實(shí)測數(shù)據(jù)保持一致。因此,利用SSC 可視化分布圖有利于更加精確的對軟棗獼猴桃進(jìn)行后熟品質(zhì)的快速評估。
圖12 SSC可視化Figure 12 Visualization of SSC
采用高光譜成像技術(shù)對軟棗獼猴桃可溶性固形物含量進(jìn)行定量檢測,并基于最優(yōu)預(yù)測模型對不同貯藏天數(shù)的軟棗獼猴桃的SSC 分布進(jìn)行可視化分析,從而為直觀分析軟棗獼猴桃采后后熟過程中SSC 變化規(guī)律與空間分布特征提供依據(jù)。
本研究結(jié)果表明,(1)基于MSC、SNV和SG平滑對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,建立PLSR預(yù)測模型。分析不同預(yù)處理方法對模型精度的影響。結(jié)果表明MSC的預(yù)處理效果優(yōu)于SG和SNV 預(yù)處理方法。(2)對MSC預(yù)處理后的光譜分別采用CARS、SPA、UVE提取特征波長,分布提取了24,20,60個特征波長變量。以特征波長作為模型的輸入構(gòu)建PLSR、ELM和PSO-ELM軟棗獼猴桃SSC預(yù)測模型。對比分析,CARS-PSO-ELM模型預(yù)測效果最優(yōu),Rc2和Rp2分別為0.927和0.934,RMSEC和RMSEP分別為0.938和0.952,RPD達(dá)到2.277。(3)利用CARS-PSO-ELM 模型計(jì)算貯藏不同天數(shù)軟棗獼猴桃每個像素點(diǎn)的SSC,生成可視化分布圖,實(shí)現(xiàn)貯藏過程中軟棗獼猴桃SSC變化和空間分布的無損檢測。
本研究通過提取的特征波長結(jié)合線性和非線性模型預(yù)測軟棗獼猴桃SSC,取得了較好的預(yù)測效果,能為軟棗獼猴桃后熟過程中內(nèi)部生理變化提供參考依據(jù)。今后研究的重點(diǎn)在于,選擇其他有效的特征波長提取方法以及組合特征波長提取方法以解決波長變量自相關(guān)性的問題,并在本研究的基礎(chǔ)上考慮不同品種、不同貯藏方式等因素的影響以進(jìn)一步提升模型的魯棒性。