国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

近紅外光譜結(jié)合變量優(yōu)選和GA-ELM模型的干制哈密大棗水分含量研究

2020-02-25 08:06:16王文霞馬本學(xué)羅秀芝李小霞雷聲淵李玉潔孫靜濤
光譜學(xué)與光譜分析 2020年2期
關(guān)鍵詞:哈密大棗波長

王文霞, 馬本學(xué), 羅秀芝, 李小霞, 雷聲淵, 李玉潔, 孫靜濤

1. 石河子大學(xué)機(jī)械電氣工程學(xué)院, 新疆 石河子 832003 2. 農(nóng)業(yè)農(nóng)村部西北農(nóng)業(yè)裝備重點(diǎn)實(shí)驗(yàn)室, 新疆 石河子 832003 3. 石河子大學(xué)食品學(xué)院, 新疆 石河子 832003

引 言

哈密大棗是新疆特色優(yōu)勢果品, 個(gè)大肉厚, 外觀紫紅有光澤, 食之有藥香, 是上等的滋補(bǔ)食品和藥用食品[1]。 哈密大棗的鮮食期較短, 大量的鮮棗收獲后進(jìn)行干制, 將鮮棗的水分含量從70%降低到25%左右, 使其可溶性固形物的濃度達(dá)到微生物難以生存和利用的程度[2], 以便貯藏和運(yùn)輸。 水分含量(MC)作為干制哈密大棗重要品質(zhì)參數(shù)之一, 干制過程中若含水量過少, 會(huì)使硬度增加, 口感變差; 若水分含量過高, 會(huì)使細(xì)菌容易繁殖, 在貯藏和運(yùn)輸過程中易腐爛變質(zhì)。 因此, 如何實(shí)現(xiàn)干制哈密大棗水分含量的快速、 無損檢測就顯得尤為重要。

近紅外光譜在農(nóng)產(chǎn)品品質(zhì)定量分析領(lǐng)域中得到廣泛應(yīng)用[3-6]。 由于光譜變量中含有大量冗余信息, 從全波長中提取出對模型有效的特征波長變量, 可以進(jìn)一步提高模型的穩(wěn)定性和準(zhǔn)確性[7]。 彭云發(fā)等[8]利用近紅外光譜結(jié)合遺傳算法(genetic algorithm, GA), 對白熟期灰棗的總糖含量進(jìn)行預(yù)測, 建立的偏最小二乘(partial least squares, PLS)預(yù)測模型Rp達(dá)到0.9583; 胡曉男等[9]使用近紅外光譜結(jié)合無信息變量消除法(uninformative variable elimination, UVE), 對晚熟期駿棗總酸進(jìn)行預(yù)測, 建立的PLS模型Rp為0.8778; 彭海根等[10]利用近紅外光譜結(jié)合聯(lián)合區(qū)間偏最小二乘法(synergy interval partial leset squares, si-PLS), 對南疆灰棗進(jìn)行糖度預(yù)測, 建立的PLS預(yù)測模型, 相關(guān)系數(shù)達(dá)到0.942; 以上研究主要以鮮棗為研究對象, 而對干制哈密大棗的研究卻鮮有報(bào)道。 另外, 有國內(nèi)外學(xué)者通過近紅外高光譜對農(nóng)產(chǎn)品水分含量進(jìn)行研究。 Anisur Rahman等[11]使用高光譜成像對番茄水分含量進(jìn)行預(yù)測, PLS模型相關(guān)系數(shù)為0.81; 楊傳得等[12]使用近紅外光譜技術(shù)對鮮食花生水分含量進(jìn)行預(yù)測, PLS模型決定系數(shù)達(dá)到0.936 2。 他們的工作對干制哈密大棗水分檢測具有一定的啟示和借鑒作用。

采用多種預(yù)處理方法結(jié)合變量篩選方法, 將篩選出的與水分含量相關(guān)性較高波長變量, 作為遺傳算法優(yōu)化極限學(xué)習(xí)機(jī)(GA-ELM)的輸入量, 建立干制哈密大棗水分含量的預(yù)測模型, 并評(píng)價(jià)相應(yīng)的模型預(yù)測效果, 以此驗(yàn)證了GA-ELM模型應(yīng)用于干制哈密大棗水分含量預(yù)測的可行性, 實(shí)現(xiàn)快速、 科學(xué)和準(zhǔn)確的干制哈密大棗水分含量檢測。

1 實(shí)驗(yàn)部分

1.1 材料

選取220個(gè)新疆哈密五堡鄉(xiāng)果園采摘的哈密大棗為研究樣本, 果實(shí)成熟后采用自然晾曬干, 顏色深紅, 果實(shí)飽滿有彈性, 大小均勻, 無損傷, 平均果重9 g左右。 將挑選好的干制哈密大棗表面擦拭干凈, 并進(jìn)行編號(hào), 在室溫條件下(28~31 ℃, 27~30% RH)放置48 h, 使樣本溫度和環(huán)境溫度達(dá)到一致。 在樣本赤道上選取3個(gè)點(diǎn)(間隔約120°)作為光譜采集點(diǎn), 每個(gè)點(diǎn)采集1次, 對3條光譜取平均, 作為該樣本的代表光譜。 使用SPXY方法將220個(gè)干制哈密大棗樣本分為170個(gè)校正集和50個(gè)預(yù)測集樣本, 用于建模分析。

1.2 儀器

近紅外光譜系統(tǒng)主要由光譜儀(NIRQuest 256-2.5, Ocean Inc., USA), 光源(鹵鎢燈, 30 W, 12 V, QP400-1-VIS-NIR, VIVO, Ocean Optics Inc., USA), 漫反射光纖, 暗箱和計(jì)算機(jī)組成, 如圖1所示。 光譜范圍為869.19~2 501.14 nm, 共256個(gè)波長, 分辨率為9.5 nm。 設(shè)置積分時(shí)間為18 ms, 掃描次數(shù)和平滑度分別為32和3, 最后將樣本放置于VIVO光源載物臺(tái)上進(jìn)行近紅外漫反射光譜采集。

圖1 近紅外光譜采集系統(tǒng)的結(jié)構(gòu)示意圖

1.3 干制哈密大棗水分含量的測量

在近紅外光譜數(shù)據(jù)采集后將完整的干制哈密大棗使用電子秤(JY/YP30002, 上海樂平科學(xué)儀器有限公司, 精度為0.000 1 g)測量干制哈密大棗的濕重。 然后放入烘干箱(DHG-9070 A, 220 V, 50 Hz, 1 550 W, 溫控范圍: 10~250 ℃)進(jìn)行脫水, 干燥溫度設(shè)定為105 ℃, 4 h后取出稱重, 然后繼續(xù)放入烘干箱干燥0.5 h, 重復(fù)操作直至前后兩次重量誤差不超過2 mg, 記錄此時(shí)重量作為樣本的干重值。 將濕重與干重的差值, 除以濕重, 計(jì)算出每個(gè)樣本的水分含量。 表1為測得220個(gè)干制哈密大棗樣本劃分為校正集和預(yù)測集的水分含量統(tǒng)計(jì)結(jié)果。

水分含量

1.4 數(shù)據(jù)處理方法

1.4.1 預(yù)處理方法

由于受到外部環(huán)境和儀器暗電流的影響, 在光譜數(shù)據(jù)采集過程中存在譜線重疊、 噪音信號(hào)和基線漂移等問題, 影響后續(xù)建模精度和穩(wěn)定性[13]。 通過分析, 在869.19~927.77 nm光譜范圍內(nèi)存在較大的噪音, 因此采用927.77~2 501.14 nm范圍內(nèi)的光譜(共247個(gè)波段)用于下一步的數(shù)據(jù)分析。 為進(jìn)一步消除干擾因素影響, 應(yīng)用標(biāo)準(zhǔn)正態(tài)變換(standard normal variate, SNV)、 多元散射(multiplicative scatter correction, MSC)和矢量歸一化(normalization, Norm)等方法處理。

1.4.2 變量優(yōu)選方法

在建立預(yù)測模型時(shí), 若模型中存在較多與干制哈密大棗水分含量無關(guān)的光譜信息, 會(huì)影響模型準(zhǔn)確性和計(jì)算速度。 光譜特征波段的篩選對后續(xù)建模和預(yù)測效果具有較大影響。 因此, 采用聯(lián)合區(qū)間偏最小二乘法(si-PLS)、 遺傳算法(GA)、 連續(xù)投影算法(successive projections algorithm, SPA)及其算法組合等方法來提取特征波長以簡化模型。

1.4.3 GA-ELM建模方法

極限學(xué)習(xí)機(jī)(extreme learning machine, ELM)是一種求解單隱含層前饋型神經(jīng)網(wǎng)絡(luò)(SLFN)的學(xué)習(xí)算法, 其學(xué)習(xí)速度快, 泛化性能好, 具有高效處理非線性數(shù)據(jù)回歸擬合問題的能力[14]。 ELM與傳統(tǒng)的函數(shù)逼近理論不同, 其預(yù)測精度與隱含層節(jié)點(diǎn)的個(gè)數(shù)密切相關(guān)。 輸入層與隱含層間的連接權(quán)值wi和隱含層神經(jīng)元閾值bi是隨機(jī)生成的, 在給定參數(shù)時(shí)可能存在部分?jǐn)?shù)值為0的情況, 導(dǎo)致隱含層輸出矩陣不滿秩, 使得部分隱含層節(jié)點(diǎn)失效, 進(jìn)而降低模型的預(yù)測精度。 為增強(qiáng)ELM網(wǎng)絡(luò)穩(wěn)定性和預(yù)測精度, 用遺傳算法(GA)對ELM神經(jīng)網(wǎng)絡(luò)的wi和bi進(jìn)行優(yōu)化選擇, 以確定最優(yōu)的ELM模型。

訓(xùn)練步驟如下:

(1)根據(jù)ELM神經(jīng)網(wǎng)絡(luò)的基本拓?fù)浣Y(jié)構(gòu), 將輸入權(quán)值和閾值級(jí)聯(lián)起來, 產(chǎn)生k個(gè)初始種群。

(1)

其中,Qλ為種群中的第λ(1≤λ≤k)個(gè)個(gè)體,wij為第i個(gè)神經(jīng)元與隱含層第j個(gè)神經(jīng)元的連接權(quán)值,bl為第l個(gè)隱含層節(jié)點(diǎn)的閾值, 且均為區(qū)間[-1, 1]中的隨機(jī)數(shù)。 適應(yīng)度函數(shù)用于評(píng)價(jià)種群優(yōu)劣程度, 將模型對驗(yàn)證集的預(yù)測均方根誤差作為適應(yīng)度函數(shù), 適應(yīng)度函數(shù)越小, 則模型精度越高。

(2)

(2)利用ELM算法隱含層激活函數(shù)(“sig”函數(shù))計(jì)算出輸出權(quán)值矩陣。 將歸一化后的樣本數(shù)據(jù)代入模型, 逐個(gè)計(jì)算每個(gè)個(gè)體的適應(yīng)度(Fitness_best), 根據(jù)適應(yīng)度函數(shù)值來確定適應(yīng)度較優(yōu)的個(gè)體。

(3)對適應(yīng)度較優(yōu)的個(gè)體利用交叉、 變異對種群進(jìn)行進(jìn)化, 得到新種群。 并檢查進(jìn)化代數(shù)g值, 當(dāng)g小于P時(shí), 返回到第(2)步, 直至g等于P則結(jié)束運(yùn)算, 選出最優(yōu)個(gè)體, 并將其拆分為初始權(quán)值和隱含層閾值, 即可確定最優(yōu)的ELM模型。

1.5 模型評(píng)價(jià)

模型校正和預(yù)測性能采用校正相關(guān)系數(shù)(Rc)、 預(yù)測相關(guān)系數(shù)(Rp)、 校正均方根誤差(RMSEC)、 預(yù)測均方根誤差(RMSEP)表示, 以及剩余預(yù)測偏差(RPD)作為評(píng)價(jià)模型預(yù)測能力的指標(biāo)。 Nicolar[15]指出當(dāng)RPD小于1.5時(shí), 說明模型預(yù)測性能較差; 當(dāng)RPD值在1.5~2之間說明模型對檢測指標(biāo)有一定的預(yù)測能力; 當(dāng)在2~2.5之間說明可以粗略對檢測指標(biāo)進(jìn)行定量分析; 當(dāng)在2.5~3之間, 說明具有較好的預(yù)測精度。

2 結(jié)果與討論

2.1 GA-ELM預(yù)測模型參數(shù)優(yōu)化

在GA-ELM算法中, 參數(shù)的設(shè)置直接影響算法的尋優(yōu)速度和質(zhì)量。 其中, 核函數(shù)的類別和隱含層神經(jīng)元個(gè)數(shù)對模型預(yù)測能力和穩(wěn)定性的影響最直接, 因此針對GA-ELM模型中核函數(shù)選擇和隱含層神經(jīng)元個(gè)數(shù)進(jìn)行研究。

(1)核函數(shù)對網(wǎng)絡(luò)的影響: 核函數(shù)的種類一般有“sig”, “sin”和“hardlim”等3種。 將220個(gè)干制哈密大棗樣本的原始光譜作為GA-ELM模型輸入量, 使用不同核函數(shù)建立的GA-ELM模型預(yù)測結(jié)果如表2所示。 從表中可以看出, 使用“sig”核函數(shù)建立的GA-ELM預(yù)測模型相關(guān)系數(shù)達(dá)到0.9以上, 具有較強(qiáng)的預(yù)測能力, 因此選擇“sig”作為最優(yōu)核函數(shù)。

(2)隱含層神經(jīng)元個(gè)數(shù)對模型的影響: 隱含層神經(jīng)元數(shù)目太少會(huì)導(dǎo)致ELM網(wǎng)絡(luò)“欠擬合”, 而數(shù)目太多會(huì)導(dǎo)致ELM網(wǎng)絡(luò)“過擬合”。 分別選取10, 20, …, 120個(gè)隱含層節(jié)點(diǎn), 得到12種不同情況下GA-ELM網(wǎng)絡(luò)的預(yù)測結(jié)果, 再次進(jìn)行3次重復(fù)測試, 求平均值以比較其擬合情況, 結(jié)果如圖2所示。 當(dāng)隱含層神經(jīng)元個(gè)數(shù)小于50時(shí),Rp大于Rc, 模型存在過擬合現(xiàn)象; 當(dāng)隱含層神經(jīng)元個(gè)數(shù)在50~100時(shí),Rp和Rc呈平穩(wěn)上升趨勢, 且Rc上升趨勢較Rp要快, 模型穩(wěn)定性顯著提高; 當(dāng)隱含層神經(jīng)元個(gè)數(shù)大于100時(shí),Rp急劇下降, RMSEP急劇上升, 模型精度大幅度下降。 因此, 本文選擇隱含層神經(jīng)元個(gè)數(shù)為100時(shí), 作為最優(yōu)隱含層神經(jīng)元個(gè)數(shù)。

表2 不同核函數(shù)建立GA-ELM模型的預(yù)測結(jié)果

圖2 隱含層神經(jīng)元個(gè)數(shù)對網(wǎng)絡(luò)的影響

圖3 經(jīng)過SNV后得到的反射光譜

2.2 光譜預(yù)處理

干制哈密大棗樣本在光譜數(shù)據(jù)采集過程中易受到多種因素的干擾, 需要對其做必要的預(yù)處理[16]。 分別使用標(biāo)準(zhǔn)正態(tài)變換(SNV)、 多元散射(MSC)和矢量歸一化(Norm)等方法對原始光譜進(jìn)行預(yù)處理來減弱或消除干擾因素, 主要處理結(jié)果如表3所示。

表3 不同光譜預(yù)處理方法的SVM, ELM和GA-ELM水分含量預(yù)測結(jié)果

通過不同預(yù)處理方法處理后建立的SVM, ELM和GA-ELM建模比較分析, 利用SNV處理后的GA-ELM建模效果最佳, 相關(guān)系數(shù)Rp和Rc分別達(dá)到0.980 8和0.962 7, RMSEC和RMSEP分別達(dá)到0.006 8和0.008 2, RPD達(dá)到3.697 2。 因此選SNV處理后的光譜進(jìn)一步進(jìn)行特征波長篩選。

2.3 特征波長篩選

2.3.1 聯(lián)合區(qū)間偏最小二乘法(si-PLS)

使用si-PLS方法將光譜數(shù)據(jù)劃分為20個(gè)子區(qū)間, 嘗試聯(lián)合4個(gè)區(qū)間篩選干制哈密大棗水分含量的特征波長。 運(yùn)行結(jié)果選擇的最優(yōu)子區(qū)間為[3 11 13 15], 交互驗(yàn)證均方根誤差(RMSECV)為0.010 5, 同時(shí)該區(qū)間組合所對應(yīng)的特征波長范圍為1 096.99~1 175.04, 1 769.98~1 846.85, 1 936.23~2 012.57和2 101.29~2 177.00 nm共52個(gè)波長變量, 占全波段的21%, 如圖4所示。 將選出的特征波長作為輸入量, 建立GA-ELM預(yù)測模型, 結(jié)果如表4所示。

圖4 si-PLS波長提取

2.3.2 遺傳算法(GA)

遺傳算法(genetic algorithm, GA)是一種通過模擬自然進(jìn)化過程搜索最優(yōu)解的方法。 本研究中, 遺傳算法的參數(shù)設(shè)定為: 初始種群50, 變異概率0.005, 遺傳迭代次數(shù)為100和收斂率為0.5。 圖5為GA迭代所選光譜變量的頻率圖, 圖6表示被選波長變量數(shù)所對應(yīng)的RMSECV值的變化, 圖中綠色圓點(diǎn)表示當(dāng)選取115個(gè)波長變量時(shí), 其PLS模型的RMSECV最低(0.01), 所選取的波長變量占全波段的46.5%, 建立GA-ELM預(yù)測模型, 結(jié)果如表4所示。

圖5 GA篩選波段的頻率分布

圖6 GA波長提取

2.3.3 連續(xù)投影算法(SPA)

連續(xù)投影算法(successive projections algorithm, SPA)是一種新興的特征波長篩選方法, 能夠有效消除波長變量之間共線性的影響, 進(jìn)而有效提取出特征波長變量[14]。 在干制哈密大棗水分含量特征波長篩選中, 指定波長數(shù)N范圍設(shè)定為1~50。 圖7為RMSECV值隨SPA選擇變量數(shù)增加變化圖, 當(dāng)m_max=14時(shí), RMSECV值最低, 模型擬合效果最佳, 篩選出14個(gè)特征波長(927.77, 966.83, 1 090.48, 1 129.51, 1 298.49, 1 467.04, 1 680.03, 1 789.22, 1 840.45, 1 917.11, 1 974.44, 2 227.3, 2 314.97和2 464.1 nm)占全波長的5.6%。 將篩選的特征波長作為輸入量建立GA-ELM預(yù)測模型,Rc和Rp分別達(dá)到0.984 2和0.967 5, RMSEC和RMSEP分別達(dá)到0.006 1和0.007 9, RPD為3.952 8。 其中Rp較全波長預(yù)測模型提高0.004 8, RMSEP降低0.000 3, RPD提高了0.255 6, 說明SPA能夠從全波長中刪除與水分含量不相關(guān)的光譜信息, 提取有效光譜信息, 提高模型預(yù)測精度。 圖8表示所篩選的干制哈密大棗水分含量特征波段在全波段中的分布狀況。

圖7 RMSECV值隨SPA選擇變量數(shù)增加變化圖

圖8 SPA選擇的14個(gè)特征波長分布圖

2.4 建立干制哈密大棗水分含量預(yù)測模型

為比較不同特征波長篩選方法對GA-ELM模型性能的影響, 對SNV處理后的全波段光譜、 GA、 si-PLS和SPA及組合算法提取的特征波長光譜數(shù)據(jù)分別建立對應(yīng)的預(yù)測模型, 結(jié)果如表4所示。

表4 不同波長提取方法的水分含量GA-ELM建模結(jié)果

結(jié)果顯示, 采用SPA和GA-SAP方法篩選出的14個(gè)和13個(gè)特征波長建立的GA-ELM模型均得到較高的預(yù)測結(jié)果, 且SPA+GA-ELM預(yù)測結(jié)果中Rc和Rp的0.984 2和0.967 5均高于全波長的0.980 8和0.962 7, 進(jìn)一步提高了模型的精度和穩(wěn)定性, 圖9和圖10分別為GA優(yōu)化進(jìn)化過程和ELM預(yù)測結(jié)果。

圖9 進(jìn)化過程

圖10 校正集和預(yù)測集干制哈密大棗水分含量預(yù)測值與真實(shí)值的關(guān)系

Fig.10 Correlation of predicted value and actual value of dried Hami big jujubes MC for calibration set and validation set

3 結(jié) 論

采用近紅外光譜結(jié)合GA-ELM神經(jīng)網(wǎng)絡(luò)建立干制哈密大棗水分含量預(yù)測模型, 通過多種預(yù)處理方法結(jié)合波段篩選方法, 能夠有效提高模型的預(yù)測精度, 實(shí)現(xiàn)干制哈密大棗水分含量的準(zhǔn)確預(yù)測。 以220個(gè)干制哈密大棗樣本為研究對象, 按照170∶50劃分校正集和驗(yàn)證集, 使用多種預(yù)處理方法結(jié)合特征波長篩選方法(si-PLS, GA, SPA及它們的組合), 分別建立SVM, ELM和GA-ELM定量預(yù)測模型。 采用SNV+SPA組合提取的14個(gè)特征波長建立的GA-ELM預(yù)測模型效果最佳,Rc和Rp分別為0.984 2和0.967 5, RMSEC和RMSEP分別為0.006 1和0.007 9, RPD為3.678 8, 得到了較為理想的預(yù)測結(jié)果。 結(jié)果表明: GA-ELM預(yù)測模型具有較好的魯棒性和泛化能力, 通過遺傳算法對網(wǎng)絡(luò)連接權(quán)值和閾值進(jìn)行優(yōu)化, 改善了普通ELM連接權(quán)值和閾值的隨意性所帶來預(yù)測精度不穩(wěn)定性。 同時(shí)由于ELM神經(jīng)元個(gè)數(shù)的大幅度縮減, 使得網(wǎng)絡(luò)訓(xùn)練時(shí)間大大縮短, 且預(yù)測精度的有效提高, 對解決近紅外光譜技術(shù)在農(nóng)產(chǎn)品無損檢測中數(shù)據(jù)量大、 數(shù)據(jù)波動(dòng)大的問題具有重要的意義。

猜你喜歡
哈密大棗波長
HPLC-PDA雙波長法同時(shí)測定四季草片中沒食子酸和槲皮苷的含量
甘麥大棗湯研究進(jìn)展
京新高速全線通車哈密實(shí)現(xiàn)縣縣通高速目標(biāo)
石油瀝青(2021年4期)2021-01-11 13:21:02
關(guān)于對哈密維吾爾族刺繡的研究
雙波長激光治療慢性牙周炎的療效觀察
哈密墾區(qū)棉花超寬膜1膜3行稀植高產(chǎn)栽培技術(shù)
日本研發(fā)出可完全覆蓋可見光波長的LED光源
中國照明(2016年4期)2016-05-17 06:16:15
大棗化學(xué)成分的研究進(jìn)展
便攜式多用途光波波長測量儀
哈密方言“走”字句
語言與翻譯(2014年2期)2014-07-12 15:49:25
和田县| 钟祥市| 台中市| 绥中县| 那曲县| 东明县| 庆安县| 彭水| 龙川县| 通辽市| 鱼台县| 赤水市| 南丹县| 尚义县| 汤原县| 漠河县| 河曲县| 太白县| 新丰县| 吉首市| 樟树市| 宝清县| 清水河县| 广河县| 鄯善县| 福海县| 廉江市| 积石山| 濮阳市| 措美县| 大城县| 南阳市| 宜君县| 东乌珠穆沁旗| 出国| 临海市| 驻马店市| 新丰县| 临朐县| 鄂托克前旗| 恩平市|