国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于拉曼光譜結(jié)合CNN-LSTM深度學(xué)習(xí)方法的鐵皮石斛總黃酮含量快速檢測研究

2024-04-08 12:59:34劉宗溢張彩虹蔣健康沈斌國丁艷菲張雷蕾
光譜學(xué)與光譜分析 2024年4期
關(guān)鍵詞:曼光譜鐵皮石斛

劉宗溢, 張彩虹, 蔣健康, 沈斌國, 丁艷菲, 張雷蕾*, 朱 誠*

1. 中國計量大學(xué)生命科學(xué)學(xué)院, 浙江 杭州 310018

2. 浙江省特色農(nóng)產(chǎn)品品質(zhì)及危害物控制技術(shù)重點實驗室, 浙江 杭州 310018

3. 浙江鳳凰源生物科技股份有限公司, 浙江 臺州 318000

引 言

鐵皮石斛(Dendrobiumofficinale)屬于蘭科石斛屬, 《中國藥典》2020版單獨列出其干燥莖為珍稀名貴中藥材。 鐵皮石斛的主要活性成分包括多糖、 黃酮、 生物堿等, 其具有增強免疫力、 抗腫瘤、 降低血糖等功效[1]。 鐵皮石斛因地理條件的不同會導(dǎo)致其品質(zhì)差異, 而活性成分含量決定了鐵皮石斛質(zhì)量。 由于不同質(zhì)量的鐵皮石斛價格差異巨大, 在經(jīng)濟利益的驅(qū)使下, 存在部分不法商販以次充好、 虛標(biāo)來源等現(xiàn)象。 傳統(tǒng)方法例如紫外分光光度法、 高效液相色譜法等可以準(zhǔn)確測量鐵皮石斛的質(zhì)量屬性[2-3], 然而以上技術(shù)難以大規(guī)模檢測單個樣品的活性成分, 在單一樣品水平上進(jìn)行快速、 準(zhǔn)確、 無損的品質(zhì)屬性測定, 可以為鐵皮石斛的品質(zhì)評價提供指導(dǎo)。

利用拉曼光譜結(jié)合CNN-LSTM深度學(xué)習(xí)模型快速檢測了鐵皮石斛總黃酮含量, 并比較了傳統(tǒng)的機器學(xué)習(xí)模型(PLS、 SVM模型)在鐵皮石斛總黃酮含量檢測方面的能力, 為鐵皮石斛質(zhì)量管理研究提供穩(wěn)定可靠的方法。 本研究所提出的評價模式可為不同的資源評價系統(tǒng)提供技術(shù)支持, 為同類藥食同源植物的質(zhì)量評價提供實際參考, 對藥食同源植物產(chǎn)地溯源提供了技術(shù)支撐。

1 實驗部分

1.1 樣本

根據(jù)資源調(diào)查和文獻(xiàn)綜述, 為了擴大分布特性, 購買了四個代表性產(chǎn)地的鐵皮石斛樣品共130組, 分別來自云南文山(一年生, 文山市皓霖商貿(mào)有限公司)32組, 廣西金秀(三年生, 金秀縣瑤山綠農(nóng)生態(tài)農(nóng)業(yè)開發(fā)有限公司)32組, 安徽霍山(五年生, 霍山牙尖土特產(chǎn)有限公司)32組, 浙江臺州(三年生, 浙江鳳凰源生物科技股份有限公司)34組, 采集到的干燥莖樣品放在帶有標(biāo)簽的保存袋中進(jìn)行下一步分析。

1.2 儀器

QE-Pro拉曼光譜儀(Ocean opticis公司, 光譜范圍: 2 870~200 cm-1, 分辨率: 0.42 nm)。 RPB4拉曼探頭(如海光電)。 785 nm激光器(如海光電)。 UV6100紫外-可見分光光度計(上海元析儀器)。 SMART-N純水儀(Heal Force公司)。

1.3 拉曼光譜的采集

拉曼光譜采集系統(tǒng): 激光器、 QE-Pro拉曼光譜儀、 光纖、 計算機系統(tǒng)等, 鐵皮石斛光譜采集過程與數(shù)據(jù)前處理過程如圖1所示。 實驗參數(shù)設(shè)置: 積分時間2 000 ms(在不損傷樣品的情況下信噪比最高), 平均次數(shù)2次, 激光功率為320 mW, 采樣間距為1 mm。 采集前對鐵皮石斛干條表面進(jìn)行擦拭處理, 避免其他無關(guān)痕量物質(zhì)干擾。 將每份鐵皮石斛樣品采集五次拉曼光譜, 取均值作為樣品最終拉曼譜。 整個采集光譜過程均在暗室內(nèi)操作以減少熒光干擾。 每組數(shù)據(jù)光譜范圍為2 870~200 cm-1, 后續(xù)將光譜數(shù)據(jù)隨機排列后輸入建立的預(yù)測模型中, 80%的數(shù)據(jù)作為校正集, 20%的樣品作為測試集。

圖1 鐵皮石斛光譜采集與數(shù)據(jù)前處理流程示意

1.4 鐵皮石斛總黃酮含量的測定

鐵皮石斛總黃酮含量的測定參考2020年版《中國藥典》總黃酮含量檢測方法[11]。 對照品溶液的制備: 稱取對照品蘆丁20 mg溶解于80%乙醇溶液中, 轉(zhuǎn)移至100 mL容量瓶定容。 取0、 0.4、 0.8、 1.2、 1.6、 2.0、 2.4 mL對照品溶液分別置于10 mL玻璃試管中, 分別加蒸餾水至2.4 mL, 加入5%NaNO2溶液0.4 mL, 混勻放置6 min; 加入10%Al(NO3)3溶液0.4 mL, 混勻放置6 min; 加入4%NaOH溶液4 mL, 混勻放置15 min; 于吸收波長510 nm處測定吸光度, 橫坐標(biāo)為蘆丁含量、 縱坐標(biāo)為吸光度得出回歸曲線方程。 準(zhǔn)確稱取2.0 g過三號篩鐵皮石斛粉末, 濾紙封住后置于索氏提取器, 加入120 mL 80%乙醇加熱回流1.5 h。 適量活性碳脫色1 h, 過濾, 光照15 min, 取處理好的樣品溶液12 mL用80%乙醇定容至25 mL。 精密量取供試品溶液2.4 mL, 自“加入5%NaNO2溶液0.4 mL”起測定吸光度, 利用回歸曲線方程計算出溶液中總黃酮含量。

1.5 光譜數(shù)據(jù)預(yù)處理和特征波長篩選

合理的數(shù)據(jù)預(yù)處理能有效的減少干擾并最大限度地挖掘出特征光譜信息。 采用的光譜數(shù)據(jù)預(yù)處理方法有基線校正、 歸一化、 Savitzky-Golay卷積平滑(SG平滑)、 標(biāo)準(zhǔn)正態(tài)變量變換(SNV)、 多元散射校正(MSC)[12]。 以上方法可以減小儀器噪聲、 光散射等影響。 特征波長選擇從原始光譜中選擇一些對研究對象貢獻(xiàn)最大的波長。 選擇特征波長降低變量的數(shù)量, 減少建模復(fù)雜度, 有助于獲得更準(zhǔn)確的性能。 本研究采用CARS來選擇最優(yōu)波長[13]。

1.6 模型的建立

預(yù)測模型的選取對于預(yù)測樣品中的活性成分至關(guān)重要。 對比PLS、 SVM和CNN-LSTM模型來預(yù)測鐵皮石斛中總黃酮含量。 傳統(tǒng)的機器學(xué)習(xí)算法不具有自動提取特征并調(diào)節(jié)自身參數(shù)的能力, 而對于深度學(xué)習(xí)模型, CNN模型采用權(quán)值共享與局部連接的方式, 可直接自動提取光譜數(shù)據(jù)的局部特征[14]。 LSTM將提取出來的特征進(jìn)行訓(xùn)練, 不斷調(diào)整自身參數(shù)達(dá)到有效預(yù)測鐵皮石斛總黃酮含量的目的[15]。

針對CNN-LSTM模型, 采用拉曼光譜數(shù)據(jù)數(shù)據(jù)作為預(yù)測模型的輸入, 對應(yīng)的鐵皮石斛總黃酮含量數(shù)據(jù)作為輸出。 通過反復(fù)的迭代實驗發(fā)現(xiàn), 只通過提高CNN-LSTM網(wǎng)絡(luò)層數(shù)不能提高預(yù)測的準(zhǔn)確度, 在提高網(wǎng)絡(luò)的層數(shù)之后, 訓(xùn)練的參數(shù)在不斷增加, 而需要預(yù)測的總黃酮含量信息簡單, 在經(jīng)過多次迭代之后, 網(wǎng)絡(luò)的預(yù)測模型過度提取校正集特征, 從而造成了過擬合現(xiàn)象, 在訓(xùn)練期間, 采用Dropout方法來減少模型的過擬合現(xiàn)象[16]。 Dropout方法主要通過將CNN-LSTM網(wǎng)絡(luò)中的神經(jīng)元以P的概率隨機丟棄, 從而使這些神經(jīng)元不參與CNN-LSTM網(wǎng)絡(luò)的訓(xùn)練過程, 使得模型能夠合理提取校正集信息, 從而具有較強的抗過擬合性能。

整個CNN-LSTM網(wǎng)絡(luò)訓(xùn)練模型結(jié)構(gòu)如圖2所示。 輸入數(shù)據(jù)通過CNN-LSTM網(wǎng)絡(luò)的過程: 光譜數(shù)據(jù)在經(jīng)過合適的預(yù)處理后, 經(jīng)過卷積層和池化層的特征篩選和降維處理后進(jìn)入LSTM網(wǎng)絡(luò), LSTM網(wǎng)絡(luò)中的遺忘門、 輸入門和輸出門通過對CNN處理過的數(shù)據(jù)進(jìn)行非線性變換等操作后不斷迭代, 從而尋找合適的參數(shù), 使得LSTM網(wǎng)絡(luò)能夠從CNN篩選過的特征數(shù)據(jù)中學(xué)習(xí)到鐵皮石斛的產(chǎn)地信息, 最后將訓(xùn)練好的CNN-LSTM網(wǎng)絡(luò)數(shù)據(jù)通過回歸層輸出預(yù)測值。 CNN-LSTM網(wǎng)絡(luò)需要通過對校正集的鐵皮石斛光譜數(shù)據(jù)和總黃酮含量信息進(jìn)行訓(xùn)練確定模型的最優(yōu)參數(shù), 本文采用Adam算法進(jìn)行參數(shù)優(yōu)化。 將一維的拉曼光譜數(shù)據(jù)輸入到CNN-LSTM網(wǎng)絡(luò)中, 所構(gòu)造的CNN-LSTM網(wǎng)絡(luò)模型以及相關(guān)的參數(shù)為:

圖2 CNN-LSTM結(jié)構(gòu)

(1)卷積神經(jīng)網(wǎng)絡(luò)層: 卷積層包括卷積核和池化核, 卷積核大小為1, 數(shù)量32, 大小設(shè)定維度向量, 對應(yīng)拉曼光譜數(shù)據(jù), 激活函數(shù)為ReLu。

(2)長短期記憶神經(jīng)網(wǎng)絡(luò)層: LSTM網(wǎng)絡(luò)設(shè)置2層, 隱藏單元數(shù)目設(shè)置為128和32, 激活函數(shù)設(shè)置為為ReLu。

(3)Dropout層: 以25%的概率對神經(jīng)元進(jìn)行隨機化清零。

(4)全連接層: 神經(jīng)元個數(shù)設(shè)置為1, 對應(yīng)總黃酮含量數(shù)據(jù)。

(5)回歸輸出層: 該層為輸出層, 用于計算回歸任務(wù)的均方根誤差損失。

(6)訓(xùn)練參數(shù): 最大迭代次數(shù)400, 批尺寸20, 學(xué)習(xí)率0.005。

1.7 模型的評價

光譜數(shù)據(jù)預(yù)處理和提取以及預(yù)測模型的建立均在MATLAB R2020b上進(jìn)行。 通過校正集、 測試集相關(guān)系數(shù)(Rc、Rp); 校正集、 測試集均方根誤差(RMSEC、 RMSEP)評價模型的預(yù)測性能。 以Rc和Rp最高、 RMSEC和RMSEP最低的模型作為最優(yōu)模型。

2 結(jié)果與討論

2.1 鐵皮石斛拉曼光譜分析

圖3為樣品的拉曼原始光譜。 由于光譜的頭部和末端均存在噪聲, 故只選取了2 806~900 cm-1范圍內(nèi)的光譜進(jìn)行建模。 將四個產(chǎn)地拉曼光譜進(jìn)行背景扣除后, 再進(jìn)行標(biāo)準(zhǔn)正態(tài)變量變換, 如圖4所示, 其中731、 1 115、 1 180、 1 592和1 656 cm-1處峰的形成是由于黃酮類物質(zhì)的C—C—O等基團振動引起[17-19]。 但是鐵皮石斛成分復(fù)雜, 拉曼光譜反映的是其多種生物活性物質(zhì)疊加的整體效應(yīng)。 由于化合物分子間的相互作用, 鐵皮石斛拉曼特征峰和某個單獨的活性成分拉曼峰相比會有所偏移。 所以這些波長不能簡單地用于檢測特定成分的含量, 后續(xù)采用數(shù)據(jù)分析方法探討光譜與總黃酮含量的關(guān)系。

圖3 鐵皮石斛原始拉曼光譜

圖4 光譜特征

2.2 鐵皮石斛總黃酮含量分析

蘆丁對照品吸光度與含量回歸方程為y=0.537x+0.016,R2=0.999, 表示蘆丁在0.08~0.48 mg含量范圍內(nèi)與吸光度線性關(guān)系良好。 測定四個產(chǎn)地的鐵皮石斛總黃酮含量如表1所示, 校正集鐵皮石斛總黃酮含量覆蓋了預(yù)測集的范圍, 使模型更加穩(wěn)定。

表1 鐵皮石斛總黃酮含量

2.3 PLS和SVM模型的總黃酮含量測定結(jié)果

建立了鐵皮石斛中總類黃酮預(yù)測校準(zhǔn)模型的傳統(tǒng)方法(PLS和SVM模型)。 將鐵皮石斛歸一化光譜數(shù)據(jù)作為模型輸入, 比較不同的預(yù)處理方法, 使用CARS篩選波長或全波長, 鐵皮石斛總黃酮含量數(shù)據(jù)作為模型預(yù)測輸出。 通過使用全光譜和波長篩選, 兩個模型的輸入變量數(shù)量有所不同, 預(yù)測結(jié)果如表2所示。 從圖5可以看出, 采樣運行次數(shù)為9時, 交叉驗證均方根誤差(RMSECV)最低, 此時篩選的變量數(shù)量為639個, 經(jīng)MSC預(yù)處理, 設(shè)置主因子數(shù)為6后, PLS模型具有較高的預(yù)測準(zhǔn)確度,Rc、Rp分別為0.982和0.948, RMSEC、 RMSEP分別為0.028和0.050 mg·g-1, 預(yù)測結(jié)果圖如圖7(a)所示。 而對于SVM模型, 基于網(wǎng)格搜索法對參數(shù)C和γ進(jìn)行篩選, 從圖6可以看出, 最佳C和γ分別為32和0.041, 此時Rc、Rp分別為0.997和0.943, RMSEC、 RMSEP分別為0.013和0.056 mg·g-1, 準(zhǔn)確率較高。 SVM模型預(yù)測結(jié)果如圖7 (b)所示。

表2 PLS和SVM模型預(yù)測總黃酮含量結(jié)果

圖5 CARS特征波長篩選過程

圖6 網(wǎng)格搜索法尋優(yōu)過程

圖7 模型預(yù)測結(jié)果

2.4 CNN-LSTM深度學(xué)習(xí)模型總黃酮含量測定結(jié)果

使用CNN-LSTM作為建模方法, 鐵皮石斛光譜數(shù)據(jù)處理方式同2.3節(jié)。 訓(xùn)練過程過程如圖8(a, b)所示。 表3顯示了CNN-LSTM的預(yù)測精度。 在使用SNV預(yù)處理后選擇全光譜, CNN-LSTM模型的Rc、Rp分別為0.983和0.964, RMSEC、 RMSEP分別為0.032和0.047 mg·g-1, 該模型預(yù)測鐵皮石斛總黃酮含量精度最高, CNN-LSTM對鐵皮石斛總黃酮含量預(yù)測效果如圖9所示。 研究發(fā)現(xiàn)CNN-LSTM模型只需要通過CNN對特征進(jìn)行提取并結(jié)合LSTM對冗余長序列數(shù)據(jù)進(jìn)行有效去除并調(diào)節(jié)自身參數(shù)的能力, 便可以有效地對鐵皮石斛總黃酮含量進(jìn)行預(yù)測。

表3 CNN-LSTM模型預(yù)測總黃酮含量結(jié)果

圖8 CNN-LSTM模型訓(xùn)練過程

圖9 CNN-LSTM模型預(yù)測結(jié)果

比較傳統(tǒng)機器學(xué)習(xí)模型(PLS和SVM)和CNN-LSTM深度學(xué)習(xí)模型對鐵皮石斛總黃酮含量預(yù)測性能結(jié)果, CNN-LSTM深度學(xué)習(xí)模型預(yù)測準(zhǔn)確性有了提高。 與PLS模型相比, CNN-LSTM模型的Rc、Rp分別增加了0.001、 0.016, 而且PLS需要采用CARS算法對拉曼光譜數(shù)據(jù)波長進(jìn)行篩選才能達(dá)到最優(yōu)效果, 面對不同的數(shù)據(jù), 主因子數(shù)也需要不斷地調(diào)整; 而與SVM模型相比, CNN-LSTM模型的Rp增加了0.021,Rc反而降低0.014, 這主要是因為SVM模型訓(xùn)練校正集數(shù)據(jù)時由于通過網(wǎng)格搜索法調(diào)參, 存在搜索到局部最優(yōu)解的情況, 可能產(chǎn)生過擬合, 因此在面對不同的數(shù)據(jù)的情況下, 尋優(yōu)算法存在著一定缺陷; 而對于CNN-LSTM模型, 采用Dropout方法便可以減少自身訓(xùn)練時的過擬合情況, 且CNN-LSTM深度學(xué)習(xí)模型融合了CNN(自動提取光譜數(shù)據(jù)局部特征屬性)和LSTM(負(fù)責(zé)推導(dǎo)光譜特征數(shù)據(jù)攜帶的化學(xué)物質(zhì)含量屬性)的優(yōu)點, 對鐵皮石斛總黃酮含量預(yù)測具有一定的優(yōu)勢, 而且隨著數(shù)據(jù)量的增加, CNN-LSTM模型能自動學(xué)習(xí)新特征進(jìn)行性能的提升。 另外SVM和CNN-LSTM模型均為全波段光譜數(shù)據(jù)建模結(jié)果最優(yōu), 主要因為CARS是一種基于PLS模型回歸系數(shù)的波長選擇方法, 在使用以上兩個模型進(jìn)行訓(xùn)練時, 存在著非線性光譜信息丟失的可能。

3 結(jié) 論

將拉曼光譜與CNN-LSTM模型相結(jié)合, 作為評估鐵皮石斛質(zhì)量的工具之一, 具有巨大的應(yīng)用潛力。 研究了SG、 SNV、 MSC等不同預(yù)處理方法以及特征波長篩選方法CARS對不同模型預(yù)測能力的影響, 結(jié)果表明SNV與深度學(xué)習(xí)算法(CNN-LSTM)相結(jié)合, 對鐵皮石斛總黃酮含量預(yù)測效果最好, 相關(guān)系數(shù)均大于0.95, 均方根誤差均小于0.05 mg·g-1, 對比傳統(tǒng)的機器學(xué)習(xí)方法, CNN-LSTM深度學(xué)習(xí)模型適合大數(shù)據(jù)時代, 傳統(tǒng)的模型方法無法高效處理海量數(shù)據(jù), 而且對于新的數(shù)據(jù)無法進(jìn)行有效學(xué)習(xí), 需要人工對參數(shù)和特征進(jìn)行調(diào)整, 本研究將為智能化檢測提供一種新的思路。 本研究不僅為消費者提供了一種簡單、 快速的藥食同源植物質(zhì)量檢測方法, 并且為相關(guān)檢測機構(gòu)的質(zhì)量安全管理提供了技術(shù)支持。 在未來的研究中將擴大代表性數(shù)據(jù)集以及活性成分指標(biāo), 多層次多角度對鐵皮石斛進(jìn)行評價, 以提供更加可靠和準(zhǔn)確的方法。

猜你喜歡
曼光譜鐵皮石斛
飛鼠與石斛
鐵皮俠的裝備
鐵皮園
趣味(語文)(2020年4期)2020-07-27 01:43:14
35 種石斛蘭觀賞價值評價
金釵石斛化學(xué)成分的研究
中成藥(2018年5期)2018-06-06 03:11:56
鐵皮石斛家庭種植技術(shù)探索
正交設(shè)計在觀賞石斛種胚離體培養(yǎng)中的應(yīng)用
鐵皮桶樂隊
BMSCs分化為NCs的拉曼光譜研究
便攜式薄層色譜-拉曼光譜聯(lián)用儀重大專項獲批
文安县| 洛宁县| 泉州市| 黄梅县| 津市市| 柳河县| 成都市| 海淀区| 新化县| 靖边县| 通许县| 九龙县| 新乐市| 宁安市| 义马市| 嘉义县| 宜兴市| 平山县| 西青区| 阳曲县| 灵宝市| 巩义市| 通榆县| 蒙自县| 定安县| 临安市| 海城市| 灵山县| 信宜市| 同江市| 从江县| 孝义市| 自贡市| 平和县| 杂多县| 宿松县| 衡阳市| 游戏| 哈尔滨市| 平昌县| 巧家县|