国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于NIR和SOM-RBF網(wǎng)絡(luò)的蘭州百合關(guān)鍵營養(yǎng)物質(zhì)定量分析方法

2022-07-06 05:36:00廉小親湯燊淼吳靜珠吳葉蘭
光譜學與光譜分析 2022年7期
關(guān)鍵詞:百合蘭州波長

廉小親,陳 群,湯燊淼,吳靜珠,吳葉蘭,高 超

1. 北京工商大學人工智能學院,北京 100048 2. 北京工商大學中國輕工業(yè)工業(yè)互聯(lián)網(wǎng)與大數(shù)據(jù)重點實驗室,北京 100048

引 言

蘭州百合作為甘肅省蘭州市特產(chǎn),是中國國家地理標志產(chǎn)品。 其為多年生麟莖類草本植物,莖塊由數(shù)十瓣鱗片相疊抱合,有百片合成之意而得名。 具有很高的食用、 藥用和觀賞價值,是我國衛(wèi)生部首批審批通過的藥食兩用植物之一。 研究表明,蘭州百合的地下麟莖的糖分和蛋白質(zhì)含量要明顯高于其他產(chǎn)地和品種的百合,這兩種生物活性物質(zhì)最能代表蘭州百合的營養(yǎng)價值[1]。

目前常見蘭州百合蛋白質(zhì)和多糖的檢測方法有比色測定法和凱氏定氮法,這些方法雖然精確,但缺點是樣本的檢測耗時長、 操作復雜繁瑣、 對樣本具有破壞性且需要專業(yè)的技術(shù)人員,因此需要一種快速無損、 便捷有效的檢測方法[2-3]。 近紅外光譜(NIRS)技術(shù)由于具有快速、 精確、 高靈敏度和綠色無污染等優(yōu)點,已經(jīng)成功應(yīng)用于食品追溯、 石油檢測、 農(nóng)業(yè)產(chǎn)品鑒別等多方面的研究[4]。 近些年來,國內(nèi)外學者建立了基于近紅外光譜的靈芝、 大米、 藜麥、 馬鈴薯以及蘭州百合等作物品質(zhì)的評價模型,用以快速實現(xiàn)蛋白質(zhì)和多糖等含量的檢測。 在對各類產(chǎn)品蛋白質(zhì)和多糖檢測方面,賴長江生等[5]利用近紅外分析方法構(gòu)建了靈芝多糖含量快速預測模型,結(jié)果顯示在5折交互檢驗優(yōu)化參數(shù)下,最優(yōu)模型的測試集相關(guān)系數(shù)為0.851 6,驗證均方根差為0.023 6; 李路等[6]采用近紅外光譜技術(shù)對大米蛋白質(zhì)和總糖等物質(zhì)進行了檢測,結(jié)果表明采用BP網(wǎng)絡(luò)方法對蛋白質(zhì)的預測精度為91.2%,采用PLS法對總糖的預測精度為91.89%; 石振興等[7]開展了藜麥的蛋白質(zhì)等物質(zhì)的近紅外反射光譜預測建模研究,結(jié)果表明采用最佳預處理方法FD+MSC處理后所建立的蛋白質(zhì)模型預測精度為95.88%; 蒙慶琰等[8]基于近紅外光譜實現(xiàn)馬鈴薯蛋白質(zhì)的無損檢測,結(jié)果表明在最優(yōu)預處理方法MSC下,采用PLSR系數(shù)法進行特征波長提取,最終所建立的蛋白質(zhì)檢測模型預測精度為97.79%; 廉小親等[9]基于近紅外利用OSC最佳預處理建立蛋白質(zhì)和多糖的PLS模型,結(jié)果顯示,蛋白質(zhì)和多糖PLS模型Rp分別為0.924和0.920,RMSEP分別為0.878和1.898。 以上研究表明,近紅外光譜技術(shù)結(jié)合不同的預處理和特征波長提取方法在物質(zhì)的蛋白質(zhì)和多糖檢測方面具有較好的效果。

本研究采用近紅外光譜技術(shù)采集12 000~4 000 cm-1波數(shù)范圍內(nèi)的蘭州百合近紅外光譜信息,通過光譜預處理和特征波長提取,減少光譜信息中的冗余信息,提升光譜信息的有效性。 在研究分析蘭州百合關(guān)鍵營養(yǎng)物質(zhì)蛋白質(zhì)和多糖方面,通過利用百合光譜特征波長建立的PLSR無損檢測模型,發(fā)現(xiàn)其預測精度未能達到預期的85%以上,且預測均方根誤差未低于2.0,這在實際應(yīng)用中是不可取的。

雖然在參數(shù)預測領(lǐng)域BP網(wǎng)絡(luò)應(yīng)用的較多,但由于BP網(wǎng)絡(luò)自身存在易形成局部最小、 訓練次數(shù)多、 收斂速度慢等缺陷,因此其應(yīng)用受到一定限制。 而RBF由于其自身具有較強的泛化、 信息處理及非線性映射等能力,且算法簡單,分析能力很強,在處理非線性問題方面有較為廣泛的應(yīng)用。 但對于RBF,其隱層節(jié)點的數(shù)目、 隱層徑向基函數(shù)的中心和寬度卻難以確定,這就需要一種方法來確定上述參數(shù)。 SOM以其清晰的聚類原則和簡單的結(jié)構(gòu)設(shè)計正好彌補了RBF自身的缺點[10]。 因此利用基于SOM改進的RBF網(wǎng)絡(luò),來預測蘭州百合關(guān)鍵營養(yǎng)物質(zhì)蛋白質(zhì)和多糖的含量。 該方法在目前的近紅外定量模型構(gòu)建和蘭州百合的關(guān)鍵營養(yǎng)物質(zhì)快速預測領(lǐng)域還鮮有報道。 SOM-RBF法可以實現(xiàn)蘭州百合蛋白質(zhì)和多糖含量的快速預測,為研發(fā)蘭州百合關(guān)鍵營養(yǎng)物質(zhì)快速無損檢測設(shè)備提供了技術(shù)支撐。

1 實驗部分

1.1 材料

新鮮百合可食用的部分進行鱗片選料、 清洗、 焯水、 烘干等步驟,粉碎制成百合粉(過40目篩),共計獲得59個樣本,分別裝入袋中進行編號,放置在20 ℃室溫環(huán)境中,等待采集近紅外光譜信息。

1.2 儀器

光譜采集用儀器為BRUKER公司生產(chǎn)的Vertex70型傅里葉變換近紅外光譜儀,其外觀如圖1所示。

圖1 VERTEX70型傅里葉變換近紅外光譜儀Fig.1 Vertex70 Fourier transform infrared spectrometer

1.3 近紅外光譜采集

光譜儀的掃描波長范圍為12 000~4 000 cm-1,分辨率為8 cm-1,掃描次數(shù)為64次[11]。 將百合樣本置于石英杯,采用大樣品杯旋轉(zhuǎn)采樣方式進行光譜掃描。 通過重新加載將每個樣品連續(xù)掃描3次,并將獲得的3條光譜曲線的平均值作為蘭州百合的最終光譜數(shù)據(jù)。

1.4 蘭州百合蛋白質(zhì)和多糖含量測定結(jié)果

根據(jù)國標法GB/T 5009.5—2016《食品安全國家標準 食品中蛋白質(zhì)的測定》測定百合粉中蛋白質(zhì)的含量,根據(jù)國標法DB12/T 884—2019《百合鱗莖中多糖的含量測定 紫外/可見分光光度法》測定百合粉中多糖的含量,實驗重復3次取平均值。 采用K-S算法按照3∶1原則將樣本劃分為建模集和預測集,其中45個樣本用于定量建模,14個樣本用于模型預測。 蘭州百合樣本的基本統(tǒng)計值如表1所示。

表1 蘭州百合樣本基本統(tǒng)計表Table 1 Basic statistics of Lanzhou lily samples

1.5 光譜數(shù)據(jù)預處理與建模分析

為了減少背景環(huán)境噪聲、 基線漂移和樣本不均勻等影響,需要對原始光譜進行預處理[12]。 使用常用的光譜預處理方法包括卷積平滑(S-G)、 歸一化(Normalize)、 標準正態(tài)變換(SNV)、 多元散射校正(MSC)、 去趨勢(Detrend)、 正交信號校正(OSC)以及這幾種方法與一階微分(FD)的組合方法對原始光譜進行預處理,以選出最合適的預處理方法。 進一步采用競爭性自適應(yīng)重加權(quán)采樣(CARS)法、 連續(xù)投影法[13-15](SPA)和主成分分析(PCA)分別進行特征波長篩選,去除全光譜中冗余和無用的信息,降低模型復雜度,提高建模效率。 最后應(yīng)用PLSR和SOM-RBF網(wǎng)絡(luò)法分別對蘭州百合關(guān)鍵營養(yǎng)物質(zhì)蛋白質(zhì)和多糖的含量進行建模分析。

1.6 模型評價

在確定最佳預處理方法和最優(yōu)特征波長提取方法中,通過建立PLSR模型,根據(jù)訓練集相關(guān)系數(shù)(correlation coefficient of calibration,Rc)、 訓練集交叉驗證相關(guān)系數(shù)(correlation coefficient of cross validation,Rv)、 預測集相關(guān)系數(shù)(correlation coefficient of prediction,Rp)、 建模均方根誤差(root mean squared error of calibration,RMSEC)、 預測均方根誤差(root mean squared error of prediction,RMSEP)和交叉驗證均方根誤差(root mean squared error of cross calibration,RMSECV)等模型的評價系數(shù)確定最佳預處理方法和特征波長提取方法。 相關(guān)系數(shù)R和均方根誤差RMSEC的計算如式(1)和式(2)所示

(1)

(2)

在建立PLSR和SOM-RBF網(wǎng)絡(luò)模型中,根據(jù)Rp和RMSEP,來評價模型的預測精度。 評價依據(jù)為: 當Rp越接近1且RMSEC、 RMSEP、 RMSECV越接近于0,表明所建模型的預測精度越高[10]。 蘭州百合光譜數(shù)據(jù)的預處理工作在The Unscrambler X 10.4軟件中進行,特征波長的篩選和模型的建立在MATLAB R2017a中進行。

2 結(jié)果與討論

2.1 光譜數(shù)據(jù)預處理

將近紅外光譜儀測得的蘭州百合光譜數(shù)據(jù)導入軟件The Unscrambler X 10.4中進行分析,得到蘭州百合的近紅外光譜原始圖譜。 由于原始光譜中不僅包含有用信息,還包含噪聲信號,同時還可能存在基線平移和漂移等問題,為了消除這些干擾,對原始光譜采用SG、 Normalize、 SNV、 MSC、 Detrend、 OSC、 SG+1D、 SG+Normalize、 SG+SNV和SG+Detrend十種方法進行預處理。 為了研究不同預處理方法對建模的影響,分別對全波段下預處理的光譜曲線建立蛋白質(zhì)和多糖含量的PLSR模型,建模結(jié)果如表2和表3所示。

表2 不同光譜預處理的蘭州百合蛋白質(zhì)的PLSR建模結(jié)果Table 2 PLSR modeling results of Lanzhou lily protein using the spectra pretreated by different methods

表3 不同光譜預處理的蘭州百合多糖的PLSR建模結(jié)果Table 3 PLSR modeling results of Lanzhou lily polysaccharide using the spectra pretreated by different methods

由表2和表3可知,不同的光譜預處理方法對模型的建立有明顯的影響。 蛋白質(zhì)和多糖建立的PLSR模型中,蛋白質(zhì)含量模型的最佳預處理方法為SG+Detrend,其Rc=0.915 3,RMSEC=0.699 4,Rv=0.827 5,RMSECV=0.989 0,Rp=0.870 1,RMSEP=1.081 1; 多糖含量模型的最佳預處理方法為Detrend,其Rc=0.966 7,RMSEC=0.697 3,Rv=0.903 1,RMSECV=1.171 7,Rp=0.921 6,RMSEP=1.692 1。 因此,采用SG+Detrend作為蛋白質(zhì)含量模型的預處理方法,Detrend作為多糖含量模型的預處理方法,后續(xù)特征波長以及預測模型的建立都是基于這兩種最優(yōu)預處理之上。 59組原始光譜經(jīng)SG+Detrend和Detrend預處理后得到的光譜如圖2和圖3所示。 可以看到經(jīng)SG+Detrend和Detrend處理的光譜信息在保留原有光譜主要信息的同時,有效的消除了噪聲和漂移的影響。

圖2 SG+Detrend方法處理的近紅外光譜圖Fig.2 NIR spectra of the SG+Detrend method

2.2 波長的確定

近紅外光譜主要由有機分子中含氫官能團的倍頻和合頻吸收峰組成,但是由于這些吸收峰強度低、 靈敏性弱、 吸收帶較寬、 重疊區(qū)較為嚴重,因此利用全波段建模會引入冗余信息和共線性變量[14]。 通過對全波段的特征提取,不僅可以降低模型復雜度,提高模型的運行速度,節(jié)省時間,還可以用最少的有用信息表征全波段信息,從而提高模型的預測精度。

圖3 Detrend方法處理的近紅外光譜圖Fig.3 NIR spectra of the Detrend method

目前常用的特征波長提取方法有CARS、 SPA、 PCA、 無信息變量消除法(UVE)、 隨機蛙跳法(RF)等。 CARS是近些年來提出的新型特征信息篩選方法,該方法是通過自適應(yīng)重加權(quán)采樣技術(shù)篩選出PLS模型中回歸系數(shù)絕對值大的波長點,去除權(quán)重小的波長點,交叉驗證得到均方根誤差RMSECV最小的最優(yōu)波段子集。 SPA是一種前向循環(huán)選擇方法,是從一個波長開始,每次循環(huán)計算它在未選入波長上的投影,將投影向量最大的波長引入到波長組合,直到循環(huán)N次,它通過選擇含有最少冗余信息的波長變量組合以最小化信息重復疊加[15]。 PCA是用原數(shù)據(jù)在主元空間上的映射來表示原數(shù)據(jù)矩陣,因為在主元空間上可以用更少的量來表示,從而實現(xiàn)了數(shù)據(jù)的降維,消除隨機噪聲,保留了主要信息。 利用CARS、 SPA和PCA方法分別提取經(jīng)過相同預處理的光譜特征波段,然后對所提取的特征波長建立PLSR模型,結(jié)果如表4所示。

表4 基于CARS、 SPA和PCA方法的PLSR建模結(jié)果對比Table 4 Comparison of PLSR modeling results based on CARS, SPA and PCA methods

由表4可知,與全波段的建模比較發(fā)現(xiàn),經(jīng)過特征提取之后所建立的蛋白質(zhì)和多糖模型,預測集相關(guān)系數(shù)和預測均方根誤差與全光譜建模相差并不大。 但由于全波段的建模包含了更多的冗余信息,數(shù)據(jù)處理較慢,運行較為耗時,而特征波長提取的方法可有效的去除這些冗余信息,使模型的性能得到優(yōu)化。 通過比較CARS、 SPA和PCA三種方法可以發(fā)現(xiàn),SPA無論是在相關(guān)系數(shù),還是均方根誤差均優(yōu)于其他兩種方法。 對于蛋白質(zhì)而言,Rc=0.884 5,RMSEC=0.722 8,Rv=0.853 8,RMSECV=0.807 6,Rp=0.810 6,RMSEP=1.195 3,選擇的特征波長數(shù)為2個; 對于多糖而言,Rc=0.967 8,RMSEC=0.632 7,Rv=0.920 3,RMSECV=0.988 6,Rp=0.810 9,RMSEP=2.094 6,選擇的特征波長數(shù)為14個。 故選用SPA作為特征波長提取方法。

2.3 預測模型的建立與比較

利用所建立的PLSR和SOM-RBF模型預測測試集中的14份蘭州百合樣品的蛋白質(zhì)和多糖含量,同時與用標準方法測定的蛋白質(zhì)和多糖的標準理化值進行比較,以此驗證蘭州百合關(guān)鍵營養(yǎng)物質(zhì)蛋白質(zhì)和多糖預測模型的精度。

2.3.1 PLSR預測模型的建立

首先利用PLSR分別建立SG+Detrend_SPA_PLSR蛋白質(zhì)模型和Detrend_SPA_PLSR多糖模型。 蛋白質(zhì)和多糖含量的建模結(jié)果對比如表4所示,預測結(jié)果如圖4和圖5所示。 蛋白質(zhì)和多糖的相關(guān)系數(shù)R分別為0.810 6和0.810 9。 預測均方根誤差RMSEP分別為1.195 3和2.094 6。

圖4 SG+Detrend_SPA_PLSR法對蛋白質(zhì)的預測結(jié)果圖Fig.4 SG+Detrend_SPA_PLSR method for theprediction results of protein

圖5 Detrend_SPA_PLSR法對多糖的預測結(jié)果圖Fig.5 Detrend_SPA_PLSR method for the predictionresults of polysaccharide

2.3.2 SOM-RBF預測模型的建立

利用SOM自組織聚類的特點以及RBF非線性逼近能力,設(shè)計SOM-RBF網(wǎng)絡(luò)模型用于建立蘭州百合的SG+Detrend_SPA_SOM-RBF蛋白質(zhì)模型和Detrend_SPA_SOM-RBF多糖模型。 模型建立主要分為兩個步驟:

首先,利用SOM網(wǎng)絡(luò)分別對提取特征波長后的蛋白質(zhì)和多糖樣本進行聚類訓練,確定出聚類類別數(shù),即聚類中心的個數(shù)。 同時得到聚類中心向量,即各獲勝神經(jīng)元節(jié)點與樣本輸入節(jié)點相連的權(quán)值向量,亦稱神經(jīng)元獲勝節(jié)點的內(nèi)星權(quán)向量。 然后計算各獲勝神經(jīng)元的內(nèi)星權(quán)向量和映射到該獲勝神經(jīng)元的所有樣本之間的歐式距離,將其中最小歐式距離判定為SOM網(wǎng)絡(luò)聚類中心的半徑。 蛋白質(zhì)和多糖的SOM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)拓撲圖如圖6所示。

圖6 蛋白質(zhì)和多糖的SOM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 SOM neural network structure of proteinand polysaccharide

其次,待SOM網(wǎng)絡(luò)訓練完成后,將得到的聚類中心個數(shù)作為RBF網(wǎng)絡(luò)隱層節(jié)點的個數(shù); 將得到的各聚類中心向量作為RBF網(wǎng)絡(luò)隱層節(jié)點的中心向量; 并將計算出的各聚類中心半徑作為隱層節(jié)點中心的寬度。 蛋白質(zhì)和多糖的RBF網(wǎng)絡(luò)結(jié)構(gòu)拓撲圖如圖7所示。 其中輸入樣本與SOM網(wǎng)絡(luò)相同; RBF網(wǎng)絡(luò)隱層節(jié)點的徑向基函數(shù)采用最常用的高斯函數(shù); 輸出層節(jié)點采用線性函數(shù); 輸出即為預測的蛋白質(zhì)或多糖值。

圖7 蛋白質(zhì)和多糖的RBF網(wǎng)絡(luò)拓撲結(jié)構(gòu)Fig.7 RBF network topology of protein and polysaccharide

圖8 蛋白質(zhì)和多糖的SOM-RBF預測算法流程圖[10]Fig.8 SOM-RBF prediction algorithm flow chartfor protein and polysaccharide[10]

SOM-RBF神經(jīng)網(wǎng)絡(luò)對蘭州百合關(guān)鍵物質(zhì)蛋白質(zhì)和多糖進行預測,得到的結(jié)果如圖9和圖10所示。 蛋白質(zhì)和多糖的相關(guān)系數(shù)R分別為0.866 6和0.868 1。 預測均方根誤差RMSEP分別為1.038 5和1.799 4。 比較可得出,SOM-RBF的預測能力要優(yōu)于PLSR。

圖9 SOM-RBF網(wǎng)絡(luò)對蛋白質(zhì)的預測結(jié)果圖Fig.9 SOM-RBF network prediction results of protein

圖10 SOM-RBF網(wǎng)絡(luò)對多糖的預測結(jié)果圖Fig.10 SOM-RBF network prediction resultsof polysaccharide

2.3.3 預測模型的比較

為了便于將經(jīng)典的PLSR法和提出的SOM-RBF神經(jīng)網(wǎng)絡(luò)方法進行比較,將這兩種預測模型的結(jié)果匯總?cè)绫?所示。

表5 PLSR和SOM-RBF預測模型建模結(jié)果比較Table 5 Comparison of modeling results between PLSRand SOM-RBF prediction models

由表5中可得,對于蛋白質(zhì)而言,采用SOM-RBF法要比PLSR法的Rp高出5.6%、 RMSEP低0.156 8; 對于多糖而言,采用SOM-RBF法要比PLSR法的Rp高出5.72%、 RMSEP低0.295 2,因此提出的SOM-RBF神經(jīng)網(wǎng)絡(luò)預測模型在本研究中是可行的。

3 結(jié) 論

利用近紅外光譜技術(shù)在12 000~4 000 cm-1波段范圍內(nèi)對蘭州百合關(guān)鍵營養(yǎng)物質(zhì)蛋白質(zhì)和多糖含量進行無損檢測研究。 建立了基于近紅外光譜技術(shù)的蛋白質(zhì)和多糖含量檢測方法和模型。 首先利用10種不同預處理方法對原光譜進行處理,確定出蛋白質(zhì)最佳預處理方法為SG+Detrend,多糖最佳預處理方法為Detrend; 然后利用特征波長提取方法SPA提取原光譜的特征波長; 最后利用PLSR法和SOM-RBF法構(gòu)建了蛋白質(zhì)和多糖含量的預測模型。 通過比較得出,PLSR法對蛋白質(zhì)含量預測中Rp和RMSEP分別為0.810 6和1.195 3; 對多糖含量預測中Rp和RMSEP分別為0.810 9和2.094 6; SOM-RBF法對蛋白質(zhì)含量預測中Rp和RMSEP分別為0.866 6和1.038 5; 對多糖含量預測中Rp和RMSEP分別為0.868 1和1.799 4。

實驗結(jié)果表明,采用SOM-RBF預測模型具有較高的預測精度和較低的預測均方根誤差,該方法可以實現(xiàn)對蘭州百合內(nèi)部關(guān)鍵營養(yǎng)物質(zhì)蛋白質(zhì)和多糖的快速無損預測,為快速檢測蘭州百合內(nèi)部營養(yǎng)物質(zhì)含量提供新思路。 但由于目前對百合樣本的獲取需經(jīng)過采集、 風干、 碾碎和營養(yǎng)物質(zhì)的理化分析等一系列操作,蛋白質(zhì)和多糖理化值的測量周期較長,因此所獲得的樣本數(shù)量較少,品種也不多,并且模型的精度有限,在后續(xù)的研究中將會盡力擴大樣本數(shù)量并研究新模型以期獲得更高的預測精度。

猜你喜歡
百合蘭州波長
HPLC-PDA雙波長法同時測定四季草片中沒食子酸和槲皮苷的含量
我的蘭州夢
黃河之聲(2021年8期)2021-07-23 03:34:32
蘭州石化推進改革正當時
我憶蘭州好(四)
當代音樂(2020年10期)2020-10-26 18:34:52
蘭州瑣記
學生天地(2020年19期)2020-06-01 02:11:36
風吹百合香
學生天地(2020年19期)2020-06-01 02:11:30
清心消暑話百合
雙波長激光治療慢性牙周炎的療效觀察
百合依依
傳記文學(2017年4期)2017-04-25 23:09:32
日本研發(fā)出可完全覆蓋可見光波長的LED光源
中國照明(2016年4期)2016-05-17 06:16:15
原阳县| 阳城县| 溧水县| 资溪县| 淮安市| 绥中县| 叙永县| 承德县| 固始县| 吉木萨尔县| 呼图壁县| 绩溪县| 江口县| 阿尔山市| 余江县| 梧州市| 榆中县| 彭阳县| 若尔盖县| 延安市| 华坪县| 竹山县| 松溪县| 抚松县| 河曲县| 思茅市| 怀集县| 清苑县| 金阳县| 静安区| 汽车| 石首市| 堆龙德庆县| 怀化市| 朝阳区| 长垣县| 察哈| 邮箱| 绥德县| 永仁县| 彭山县|