国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高光譜結(jié)合機(jī)器學(xué)習(xí)鑒別林下參參齡

2025-02-14 00:00:00韓路生王昱丹李宇航李根悅宋欣宏楊凱麗譚鑫王恩鵬
應(yīng)用化學(xué) 2025年1期
關(guān)鍵詞:鑒別

摘要 建立一種基于高光譜技術(shù)結(jié)合機(jī)器學(xué)習(xí)快速、無損鑒別市售林下生曬參參齡的方法。 以常見市售林下生曬參為研究對(duì)象,采集不同年限的林下生曬參高光譜圖像并基于閾值分割方法從感興趣區(qū)域提取光譜數(shù)據(jù),然后對(duì)數(shù)據(jù)進(jìn)行多元散射矯正(MSC)-Savitzky-Golay smoothing(S-G smoothing)-一階導(dǎo)數(shù)(FD)和MSC-S-G smoothing-二階導(dǎo)數(shù)(SD)預(yù)處理消除干擾,將預(yù)處理后的數(shù)據(jù)進(jìn)行3種機(jī)器學(xué)習(xí),包括支持向量機(jī)回歸(SVR)、主成分回歸(PCR)和偏最小二乘回歸(PLSR)。高光譜數(shù)據(jù)存在冗余性,采用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣法(CARS)、連續(xù)投影算法(SPA)和無信息變量消除算法(UVE)3種算法篩選波段去除無用的波長(zhǎng)信息。 CARS-MSC-S-G smoothing-SD-SVR有較低的均方根誤差RMSEC(0. 0027),RMSEP(0. 0120),較高的決定系數(shù)R2C(0. 9998),R2P(0. 9993),以及相對(duì)分析誤差RPD(38),競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣法(CARS)結(jié)合SVR模型效果最好,能夠?qū)崿F(xiàn)對(duì)林下生曬參年限的準(zhǔn)確分類。 基于高光譜成像技術(shù)結(jié)合機(jī)器學(xué)習(xí)能夠?qū)崿F(xiàn)對(duì)林下生曬參參齡的快速、無損鑒別。

關(guān)鍵詞 林下生曬參;不同年限;高光譜成像;鑒別

中圖分類號(hào):O657. 3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1000-0518(2025)01-0069-09

國家自然科學(xué)基金(No. 82073969)、長(zhǎng)春市科技局項(xiàng)目(No. 21ZGY10)和吉林省科技發(fā)展計(jì)劃項(xiàng)目(Nos. 20210401108YY,20220401104YY)資助

高光譜成像技術(shù)(HSI)[1]是將光譜與圖像相結(jié)合,獲得圖像數(shù)據(jù)并得到圖像中每個(gè)像素的光譜信息,具有無需前處理、快速、無損和綠色的特點(diǎn)。 高光譜技術(shù)被廣泛應(yīng)用于農(nóng)產(chǎn)品、中藥材等的快速鑒別。 如采用高光譜技術(shù)能夠快速無損的實(shí)現(xiàn)對(duì)高粱摻假[2]、三七粉質(zhì)量等級(jí)[3]以及柑橘屬水果[4]的有效鑒別,準(zhǔn)確率可達(dá)90%以上。 HSI的發(fā)展為人參年限的快速無損鑒定提供了新思路。

人參(Panax ginseng C. A. Mey.)是五加科多年生草本植物的干燥根及根莖[5],歷史悠久,具有大補(bǔ)元?dú)?、補(bǔ)脾益肺和安神益智的功效[6]。 林下參是在野外環(huán)境中生長(zhǎng),通過人工將種子播種于深山中,若干年后采收[7]。 林下生曬參易于儲(chǔ)存和運(yùn)輸,目前在業(yè)內(nèi)和商界對(duì)于參齡鑒別仍然采用感官性狀經(jīng)驗(yàn)鑒別方法,對(duì)于消費(fèi)者來說,難以根據(jù)感官經(jīng)驗(yàn)對(duì)人參的生長(zhǎng)年限進(jìn)行鑒別,容易購買到偽品、贗品。因此,人參參齡的識(shí)別對(duì)于保護(hù)人參品牌和質(zhì)量、保證人參市場(chǎng)的穩(wěn)定發(fā)展至關(guān)重要。 林下參常用薄層鑒別[8]、超高效液相色譜-質(zhì)譜聯(lián)用(UHPLC-MS)[9]、氣相色譜-質(zhì)譜聯(lián)用(GC-MS)[10]、傅里葉變換紅外光譜(FT-IR)[11]和核磁共振波譜(NMR)[12]等方法鑒別,但這些方法往往具有前處理過程繁瑣、重現(xiàn)性差和對(duì)樣品造成破壞等缺點(diǎn)。

目前,鮮有林下生曬參快速無損鑒別的報(bào)道。 本研究利用HSI結(jié)合機(jī)器學(xué)習(xí)擬初步建立對(duì)林下生曬參參齡的快速、無損鑒別的方法,為林下生曬參的質(zhì)量控制、鑒別標(biāo)準(zhǔn)建立提供理論依據(jù)。

1 實(shí)驗(yàn)部分

1. 1 儀器、試劑和材料

高光譜成像設(shè)備是由中國科學(xué)院長(zhǎng)春光學(xué)精密力學(xué)和物理研究所自主搭建的,采用Imec快照掃描高光譜成像系統(tǒng),波長(zhǎng)在400~1000 nm之間,空間分辨率為2048×1088像素。 高光譜成像系統(tǒng)結(jié)構(gòu)如圖1所示,該成像系統(tǒng)采用線性掃描傳感器技術(shù),通過推掃的掃描方法獲取物體的反射率數(shù)據(jù),利用立方體的x和λ尺寸逐線進(jìn)行采集。 本章內(nèi)容使用的高光譜成像系統(tǒng),波段數(shù)為300個(gè),積分時(shí)間是3089 μs,幀周期為68 fps,速度為5. 6 mm/s。 ENVI 5. 3是一種高光譜圖像處理軟件,具備圖像增強(qiáng)、校正等功能。

實(shí)驗(yàn)所用的306份林下參樣本采挖于2023年9月,地點(diǎn)為吉林省集安市車道嶺鎮(zhèn),由吉林省人參科學(xué)研究院陳長(zhǎng)寶研究員鑒定為10、15和20年的二馬牙品種林下參。 隨后對(duì)鮮林下參用蒸餾水進(jìn)行簡(jiǎn)單的淋洗和程序干燥,干燥過程如下,晾曬后的林下參置于60~70 ℃的干燥箱干燥2 h,在40~50 ℃下干燥10 h左右,然后35~40 ℃再干燥6 h左右,干燥過程中注意適時(shí)排潮,直至林下參最終含水質(zhì)量分?jǐn)?shù)為13%。 如圖2所示,圖2A?2C分別為10年、15年和20年干燥后的林下生曬參樣本。

1. 2 實(shí)驗(yàn)方法

1. 2. 1 高光譜采集及校正

式中, R表示經(jīng)過校正后的圖像,I0表示原始圖像,IW表示白板圖像,ID表示黑板圖像。

1. 2. 2 光譜數(shù)據(jù)提取及數(shù)據(jù)預(yù)處理

利用ENVI 5. 3軟件在每個(gè)林下生曬參樣品高光譜圖像基于閾值分割方法選取一個(gè)大小相近的感興趣區(qū)域(ROI),提取每個(gè)ROI內(nèi)的平均光譜作為本實(shí)驗(yàn)樣本的光譜數(shù)據(jù)。 高光譜數(shù)據(jù)包含大量的信息,易受到環(huán)境中多種因素的影響[13]。 在建模之前對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理可改善環(huán)境因素影響、提高模型的準(zhǔn)確率[14]。 高光譜預(yù)處理包括多元散射校正(MSC)、平滑法和導(dǎo)數(shù)法等方法。 本研究采用多元散射矯正(MSC)-Savitzky-Golay smoothing(S-G smoothing)-一階導(dǎo)數(shù)(FD)和多元散射矯正(MSC)-Savitzky-Golay smoothing(S-G smoothing)-二階導(dǎo)數(shù)(SD)2種方法對(duì)高光譜數(shù)據(jù)進(jìn)行預(yù)處理,找到最佳的數(shù)據(jù)預(yù)處理方法。

1. 2. 3 數(shù)據(jù)集劃分

收集了來自同一產(chǎn)地的3個(gè)不同生長(zhǎng)年限(10、15和20年)的306份人參樣本,利用高光譜成像系統(tǒng)共獲取306條高光譜數(shù)據(jù),將采集到的306條林下生曬參高光譜數(shù)據(jù),利用Kennard-stone(K-S)算法按照2∶1的比例劃分訓(xùn)練集和預(yù)測(cè)集。

1. 2. 4 判別模型方法

采用偏最小二乘回歸(PLSR)[15]、主成分分析回歸(PCR)[16]和支持向量機(jī)回歸(SVR)[17]3種判別模型對(duì)林下生曬參參齡進(jìn)行判別分析。

PLSR[15]是一種將預(yù)測(cè)變量簡(jiǎn)化為一組較小的不相關(guān)分量并對(duì)這些分量而不是原始數(shù)據(jù)執(zhí)行最小二乘回歸的技術(shù)。 與多元回歸不同,PLSR假定預(yù)測(cè)變量是可變的,從而可以有效地增加預(yù)測(cè)準(zhǔn)確性。根據(jù)預(yù)測(cè)變量,PLS可以更有效地檢測(cè)不確定性,從而增加其魯棒性。

PCR[16]以主成分為自變量進(jìn)行的回歸分析。 用主成分分析法對(duì)回歸模型中的多重共線性進(jìn)行消除后,將主成分變量作為自變量進(jìn)行回歸分析,然后根據(jù)得分系數(shù)矩陣將原變量代回得到的新的模型。

SVR[17]將每個(gè)樣本數(shù)據(jù)表示為空間中的點(diǎn),使不同類別的樣本點(diǎn)盡可能明顯地區(qū)分開。 通過將樣本的向量映射到高維空間中,尋找最優(yōu)化區(qū)分2類數(shù)據(jù)的超平面,使各類到超平面的距離最大化,距離越大表示分類誤差越小,即使數(shù)據(jù)集的邊緣點(diǎn)到分界超平面的距離最大,稱邊緣點(diǎn)為支持向量。 通過非線性映射將原始數(shù)據(jù)空間映射到高維特征空間并在新空間中求取最優(yōu)化線性分類面。

1. 2. 5 模型的評(píng)價(jià)指標(biāo)

模型構(gòu)建完成后,為了能夠直觀地評(píng)價(jià)模型,通過多個(gè)統(tǒng)計(jì)參數(shù)來評(píng)價(jià)所建模型的穩(wěn)定性與可靠性。 本研究采用決定系數(shù)(R2)[18]、均方根誤差 (RMSE)[19]以及相對(duì)分析誤差(RPD)[20]3種參數(shù)作為模型評(píng)價(jià)指標(biāo)比較所建模型PLSR、PCR和SVR的穩(wěn)定性。 R2取值范圍從0~1,越接近1,說明模型能夠解釋觀測(cè)數(shù)據(jù)的變化,表示模型對(duì)數(shù)據(jù)的擬合程度好[18]。 R2C代表訓(xùn)練集的決定系數(shù); R2CV代表訓(xùn)練集交叉驗(yàn)證的決定系數(shù); R2P代表預(yù)測(cè)集的決定系數(shù)。 RMSE表示模型預(yù)測(cè)值與實(shí)際觀測(cè)值之間的差異,用于衡量模型的預(yù)測(cè)精度[19]。 RMSE的計(jì)算結(jié)果越小,表示模型的預(yù)測(cè)精度越高,預(yù)測(cè)值與實(shí)際觀測(cè)值的差異較小,其中RMSEC是訓(xùn)練集的均方根誤差; RMSECV是訓(xùn)練集交叉驗(yàn)證的均方根誤差; RMSEP是訓(xùn)練集的均方根誤差。 RPD是評(píng)估模型性能的一項(xiàng)重要指標(biāo)[20],其具有明確的評(píng)判標(biāo)準(zhǔn): 當(dāng)RPD<1. 4時(shí),表明所構(gòu)建的模型在可靠性方面存在明顯不足,難以滿足實(shí)際應(yīng)用需求,故而認(rèn)為該模型不可靠;若1. 42. 0時(shí),充分顯示出所構(gòu)建的模型具備較高的可靠性水平,能夠精準(zhǔn)且穩(wěn)定地用于各類模型分析任務(wù)。 一般來說,預(yù)測(cè)能力強(qiáng)的模型具有低的均方根誤差值和高的決定系數(shù)值以及殘差預(yù)測(cè)偏差值。

1. 2. 6 特征波段提取

高光譜數(shù)據(jù)量大且無關(guān)變量多,通過特征波段提取算法可以去除大量繁瑣無用的波譜信息,以達(dá)到增強(qiáng)模型的預(yù)測(cè)能力,提高模型的運(yùn)算速度。 本研究采用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣法(Competitive adapative reweighted sampling,CARS)[21]、連續(xù)投影法(Successive projections algorithm,SPA)[22]和無信息變量消除法(Uninformative variable elimination,UVE)[23]3種篩選特征算法提取特征波段。

CARS是一種結(jié)合蒙特卡洛采樣與PLS模型回歸系數(shù)的特征變量選擇方法,模仿達(dá)爾文理論中的“適者生存”的原則[21]。 CARS算法中,每次通過自適應(yīng)加權(quán)采樣(ARS)保留PLS模型中回歸系數(shù)絕對(duì)值權(quán)重較大的點(diǎn)作為新的子集,去掉權(quán)值較小的點(diǎn),然后基于新的子集建立PLS模型,經(jīng)過多次計(jì)算,選擇PLS模型交互驗(yàn)證均方根誤差(RMSECV)最小的子集中的波長(zhǎng)作為特征波長(zhǎng)。

SPA是前向特征變量選擇方法[22]。 SPA利用向量的投影分析,通過將波長(zhǎng)投影到其他波長(zhǎng)上,比較投影向量大小,以投影向量最大的波長(zhǎng)為待選波長(zhǎng),然后基于矯正模型選擇最終的特征波長(zhǎng)。

UVE能夠去除對(duì)建模共效率較小的波長(zhǎng)變量,選出特征波長(zhǎng)變量,被去除的波長(zhǎng)變量我們稱之為無信息變量[23]。 無信息變量去除算法的建立是基于偏最小二乘(PLS)算法。

1. 2. 7 實(shí)驗(yàn)數(shù)據(jù)處理

使用ENVI 5. 3軟件提取每個(gè)感興趣區(qū)域內(nèi)的平均光譜數(shù)據(jù),使用The Unscrambler X 10. 4(64-bit)軟件對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理及建立林下參參齡的判別模型,使用Matlab 2022b軟件對(duì)光譜數(shù)據(jù)篩選特征波段。

2 結(jié)果與討論

2. 1 不同年限林下生曬參的光譜曲線

分別對(duì)10、15和20年3個(gè)年份的林下生曬參高光譜數(shù)據(jù)求平均值,繪制3個(gè)年份的林下生曬參平均光譜曲線圖,如圖3所示,3個(gè)年限的林下生曬參光譜曲線趨勢(shì)大體相同,但光譜反射率值有明顯的差異,其中在500~900 nm之間,20年林下生曬參的反射率值最大,15年次之,10年最小,反射率值與年限呈正相關(guān)。

2. 2 全波段林下生曬參高光譜數(shù)據(jù)預(yù)處理結(jié)果

對(duì)不同生長(zhǎng)年限的林下生曬參高光譜數(shù)據(jù)進(jìn)行預(yù)處理操作,包括MSC-S-G smoothing-FD以及MSC-S-G smoothing-SD,經(jīng)預(yù)處理后所獲得的光譜曲線圖如圖4所示。 由圖4可知,經(jīng)過預(yù)處理后的光譜曲線形狀較為復(fù)雜,在不同波長(zhǎng)處有多個(gè)波峰和波谷,這些曲線在整體趨勢(shì)上有相似之處,但在具體的波峰和波谷位置以及數(shù)據(jù)值大小上存在差異。

2. 3 基于全波段對(duì)林下生曬參數(shù)據(jù)預(yù)處理方式以及參齡判別模型的篩選

首先,將高光譜原始數(shù)據(jù)以及預(yù)處理后的高光譜數(shù)據(jù)作為輸入變量,構(gòu)建PCR判別模型,實(shí)現(xiàn)對(duì)不同生長(zhǎng)年限林下參的精準(zhǔn)預(yù)測(cè),結(jié)果見表1。 通過表1可知,在同一判別模型下,預(yù)處理方式MSC-S-G smoothing-SD的R2更接近于1,RMSEP更接近于0,意味著林下參預(yù)測(cè)值和實(shí)際值之間的差異非常小,RPD值為3且大于2,說明所建模型可靠。 綜上所述,MSC-S-G smoothing-SD方法更適于林下生曬參高光譜數(shù)據(jù)的預(yù)處理,能夠?qū)崿F(xiàn)不同生長(zhǎng)年限林下參的預(yù)測(cè)。

在光譜預(yù)處理采用MSC-S-G smoothing-SD方法之后,構(gòu)建了PCR、PLSR和SVR判別模型,建模結(jié)果見表2。 由表2可知,使用SVR判別模型在預(yù)測(cè)林下生曬參參齡方面表現(xiàn)優(yōu)異,具有較高的R2值,RPD值以及較低的RMSEP值,表明SVR判別模型在林下生曬參參齡的預(yù)測(cè)方面表現(xiàn)良好。 相對(duì)于PCR與PLSR,SVR適合處理復(fù)雜的數(shù)據(jù)集,在高維數(shù)據(jù)空間中表現(xiàn)突出,通過核函數(shù)將數(shù)據(jù)映射到更高維的空間,對(duì)異常值不太敏感,數(shù)據(jù)點(diǎn)影響極小[24]。 綜合上述分析與研究結(jié)果可知,在預(yù)測(cè)林下生曬參參齡方面,MSC-S-G smoothing-SD與SVR相結(jié)合的方法構(gòu)成了最優(yōu)組合策略。

2. 4 特征波段篩選結(jié)果

基于不同生長(zhǎng)年限林下生曬參的Vis-NIR高光譜數(shù)據(jù),利用特征波段算法進(jìn)行特征選擇,篩選過程和結(jié)果如圖5所示。 使用CARS篩選特征波段,設(shè)定蒙特卡羅迭代次數(shù)為50次,進(jìn)行5折交叉驗(yàn)證策略以確保篩選的可靠性與穩(wěn)定性。 經(jīng)實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)?shù)螖?shù)為6次時(shí),RMSECV值達(dá)到最小,其數(shù)值為0. 014,此時(shí)成功篩選出169個(gè)波段,占全部波段的比例為 56. 3%; 同時(shí),使用SPA算法進(jìn)行篩選最終確定43個(gè)波段,占全波段的 14. 3%; 采用UVE算法篩選出168個(gè)波段,占全波段56. 00%。

2. 5 基于特征波段篩選算法對(duì)MSC-S-G smoothing-SD-SVR方法的優(yōu)化

在MSC-S-G smoothing-SD-SVR方法基礎(chǔ)上,運(yùn)用CARS、SPA和UVE 3種特征波段算法篩選特征波段以實(shí)現(xiàn)優(yōu)化,進(jìn)而構(gòu)建了CARS-MSC-S-G smoothing-SD-SVR、SPA-MSC-S-G smoothing-SD-SVR、UVE-MSC-S-G smoothing-SD-SVR 3種模型,結(jié)果見表3。 由表3可知,CARS-MSC-S-G smoothing-SD-SVR具有較低的均方根誤差RMSEC(0. 0091),RMSEP(0. 0015),較高的相關(guān)系數(shù)R2C(0. 9999),R2P(0. 9999),以及RPD(38),CARS-MSC-S-G smoothing-SD-SVR的RMSEP值和R2值以及RPD值均優(yōu)于其他2種算法,表明經(jīng)過CARS算法優(yōu)化后的模型在林下生曬參參齡預(yù)測(cè)方面表現(xiàn)良好。 相較于SPA和UVE,CARS篩選特征波段算法有效的篩選了林下生曬參光譜數(shù)據(jù)變量,提高了模型精確度。 研究結(jié)果表明,在林下生曬參參齡預(yù)測(cè)方面,CARS 算法更契合MSC-S-G smoothing-SD-SVR判別模型的優(yōu)化需求。 而劉子健等[25]在基于特征波段建立山楂分類模型時(shí),發(fā)現(xiàn)SPA算法為最佳特征波段提取方法,與本研究得到的結(jié)果不同,這說明對(duì)于不同的檢測(cè)對(duì)象,應(yīng)當(dāng)選用不同的特征提取方法,而對(duì)于林下生曬參樣本,CARS相比于SPA特征波長(zhǎng)提取效果更好。

與MSC-S-G smoothing-SD-SVR相比,經(jīng)CARS算法優(yōu)化后的模型在訓(xùn)練集和預(yù)測(cè)集均呈現(xiàn)出更為優(yōu)異的表現(xiàn),其R2值更高且RMSEP值更低。 綜合上述研究結(jié)果可知,CARS算法與SVR模型相結(jié)合的方式在林下生曬參參齡鑒別方面具有更強(qiáng)的適用性與有效性,能夠精準(zhǔn)地判定林下生曬參參齡,為林下生曬參參齡鑒別提供了一種可靠且高效的方法。

3 結(jié) 論

本研究開發(fā)了一種基于高光譜成像技術(shù)結(jié)合機(jī)器學(xué)習(xí)的快速、無損鑒別市售林下生曬參參齡的方法。 研究以10、15和20年的林下生曬參為對(duì)象,通過高光譜成像獲取光譜數(shù)據(jù),并利用多種預(yù)處理方法消除干擾。 利用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣法(CARS)、連續(xù)投影算法(SPA)和無信息變量消除算法(UVE)篩選出特征波段,最終結(jié)合支持向量機(jī)回歸(SVR)模型實(shí)現(xiàn)對(duì)林下生曬參參齡的準(zhǔn)確分類。 結(jié)果表明,CARS結(jié)合SVR模型在參齡鑒別中表現(xiàn)最佳。本研究的創(chuàng)新之處在于將高光譜成像技術(shù)與機(jī)器學(xué)習(xí)結(jié)合,實(shí)現(xiàn)了林下生曬參參齡的快速、無損鑒別,為人參的質(zhì)量控制和市場(chǎng)監(jiān)管提供了新的方法。 與傳統(tǒng)的鑒別方法相比,基于高光譜成像技術(shù)的方法具有無需前處理、快速、無損和綠色環(huán)保的優(yōu)點(diǎn)。 特別是CARS-SVR模型的應(yīng)用,顯著提高了參齡預(yù)測(cè)的準(zhǔn)確性和效率。 在實(shí)驗(yàn)過程中,通過對(duì)高光譜數(shù)據(jù)的預(yù)處理和特征波段的篩選,有效地減少了數(shù)據(jù)冗余,提升了模型的預(yù)測(cè)能力。 然而,本研究也存在一些局限性,例如樣本量適中,未來可以擴(kuò)大樣本量并引入更多年限的人參樣本進(jìn)行驗(yàn)證。 此外,環(huán)境因素對(duì)高光譜數(shù)據(jù)的影響也是需要進(jìn)一步研究的問題,未來可以結(jié)合更多的數(shù)據(jù)校正和處理方法,以進(jìn)一步提高模型的魯棒性和泛化能力。 總體而言,本研究為林下生曬參參齡的鑒別提供了一個(gè)可行的解決方案,具有重要的應(yīng)用前景和研究?jī)r(jià)值。

參考文獻(xiàn)

[1]PAN Y, ZHANG H, CHEN Y, et al. Applications of hyperspectral imaging technology combined with machine learning in quality control of traditional Chinese medicine from the perspective of artificial intelligence: a review[J]. Crit Rev Anal Chem, 2023, 29: 1-15.

[2]BAI Z, HU X, TIAN J, et al. Rapid and nondestructive detection of sorghum adulteration using optimization algorithms and hyperspectral imaging[J]. Food Chem, 2020, 30(331): 127-290.

[3]姚坤杉, 孫俊, 陳晨, 等. 基于高光譜技術(shù)的三七不同部位粉末的無損鑒別[J]. 光譜學(xué)與光譜分析, 2023, 43(7):2027-2031. YAO K S, SUN J, CHEN C, et al. Nondestructive identification of powder from different parts of Panax pseudoginseng based on hyperspectral technique[J]. Spectrosc Spectral Anal, 2023, 43(7): 2027-2031.

[4]高梁?jiǎn)? 基于高光譜技術(shù)的柑橘品質(zhì)檢測(cè)研究[D]. 雅安: 四川農(nóng)業(yè)大學(xué), 2023. GAO L L. Research on citrus quality detection based on hyperspectral technology[D]. Ya′an: Sichuan Agricultural University,2023.

[5]DE OLIVEIRA ZANUSO B, DE OLIVEIRA DOS SANTOS A R, MIOLA V F B, et al. Panax ginseng and aging related disorders: a systematic review[J]. Exp Gerontol, 2022, 161: 111731.

[6]LEE I S, KANG K S, KIM S Y. Panax ginseng pharmacopuncture: current status of the research and future challenges[J]. Biomolecules, 2019, 10(1): 33.

[7]余江鋒, 羅吉, 黃億健, 等. 吉林省不同種類人參UPLC-PDA指紋圖譜及化學(xué)模式識(shí)別研究[J]. 中藥材, 2019, 42(4): 822-827.YU J F, LUO J, HUANG Y J, et al. UPLC-PDA fingerprinting and chemical pattern recognition of different species of ginseng in Jilin Province[J]. Chin Mater Med, 2019, 42(4): 822-827.

[8]肖霞, 曹俊凱. 人參當(dāng)歸顆粒的薄層鑒別[J]. 中國實(shí)用醫(yī)藥, 2012, 7(9): 249-250. XIA X, CAO J K. Thin-layer identification of ginseng and angelica granules[J]. Chin Practical Med, 2012, 7(9):249-250.

[9]ZHU H, LIN H, TAN J, et al. UPLC-QTOF/MS-based nontargeted metabolomic analysis of mountain-and garden-cultivated ginseng of different ages in northeast China[J]. Molecules, 2018, 24(1): 33.

[10]ZHANG L, WANG P, LI S, et al. Differentiation of mountain- and garden-cultivated ginseng with different growth years using HS-SPME-GC-MS coupled with chemometrics[J]. Molecules, 2023, 28(5): 2016.

[11]LEE B J, KIM H Y, LIM S R, et al. Discrimination and prediction of cultivation age and parts of Panax ginseng by Fourier-transform infrared spectroscopy combined with multivariate statistical analysis[J]. PLoS One, 2017, 12(10):e 0186664.

[12]YANG S, SHIN Y S, HYUN S H, et al. NMR-based metabolic profiling and differentiation of ginseng roots according to cultivation ages[J]. J Pharm Biomed Anal, 2012, 58: 19-26.

[13]劉秋安, 徐芳芳, 張欣, 等. 基于近紅外光譜技術(shù)和分類與回歸樹算法建立天舒片崩解時(shí)間預(yù)測(cè)模型[J]. 中草藥,2021, 52(16): 4837-4843. LIU Q A, XU F F, ZHANG X, et al. Establishment of a disintegration time prediction model for Tianshu tablets based on near-infrared spectroscopy and classification and regression tree algorithms[J]. Chin Herbal Med, 2021, 52(16): 4837-4843.

[14]LI X, WEI Y, XU J, et al. SSC and pH for sweet assessment and maturity classification of harvested cherry fruit based on NIR hyperspectral imaging technology[J]. Postharvest Biol Technol, 2018, 143: 112-118.

[15]ABDI H, WILLIAMS L J. Partial least squares methods: partial least squares correlation and partial least square regression[J]. Methods Mol Biol, 2013, 930: 549-579.

[16]HEMMATEENEJAD B, MIRI R, ELYASI M. A segmented principal component analysis--regression approach to QSAR study of peptides[J]. J Theor Biol, 2012, 305: 37-44.

[17]MCKEARNAN S B, VOCK D M, MARAI G E, et al. Feature selection for support vector regression using a genetic algorithm[J]. Biostatistics, 2023, 24(2): 295-308.

[18]傅晨, 王開軍. 決定系數(shù)與相關(guān)系數(shù)相關(guān)系數(shù)輔助的LASSO回歸[J]. 福建師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2024,40(2): 57-63, 89. FU C, WANG K J. LASSO regression assisted by coefficient of determination and correlation coefficient[J]. J Fujian Norm Univ (Nat Sci Ed), 2024, 40(2): 57-63, 89.

[19]徐萍, 米琪, 羅文秀, 等. 滇重樓皂苷近紅外光譜快速定量分析模型建立[J/OL]. 中成藥, 1-7[2024-05-20]. XU P, MI Q, LUO W X, et al. Modeling of near-infrared spectroscopy for rapid quantitative analysis of Dianthus annuus saponins[J/OL]. Proprietary Chin Med, 1-7[2024-05-20].

[20]陳露萍, 徐芳芳, 張欣, 等. 基于偏最小二乘法建立大株紅景天片素片硬度近紅外光譜預(yù)測(cè)模型[J]. 中草藥,2023, 54(8): 2446-2452. CHEN L P, XU F F, ZHANG X, et al. Establishment of a near-infrared spectral prediction model for the hardness of Rhodiola rosea tablets based on the partial least squares method[J]. Chin Herbal Med, 2023, 54(8): 2446-2452.

[21]LI H, LIANG Y, XU Q, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Anal Chim Acta, 2009, 648(1): 77-84.

[22]ZHU H, CHU B, ZHANG C, et al. Hyperspectral imaging for presymptomatic detection of tobacco disease with successive projections algorithm and machine-learning classifiers[J]. Sci Rep, 2017, 7(1): 4125.

[23]HAN Q, WU H, CAI C, et al. An ensemble of Monte Carlo uninformative variable elimination for wavelength selection[J]. Anal Chim Acta, 2008, 612(2): 121-125.

[24]YU H, LU J, ZHANG G. Continuous support vector regression for nonstationary streaming data[J]. IEEE Trans Cybern,2022, 52(5): 3592-3605.

[25]劉子健, 顧佳盛, 周聰, 等. 基于高光譜成像技術(shù)的山楂產(chǎn)地判別研究[J]. 食品工業(yè)科技, 2024, 45(10): 282-291. LIU Z J, GU J S, ZHOU C, et al. Research on the origin discrimination of hawthorn based on hyperspectral imaging technology[J]. Food Ind Sci Technol, 2024, 45(10): 282-291.

Identification of Age of Forest Sun-Dried Ginseng Based on Hyperspectral Imaging Technology

HAN Lu-Sheng1, WANG Yu-Dan1, LI Yu-Hang2, LI Gen-Yue1, SONG Xin-Hong1, YANG Kai-Li1,TAN Xin2*, WANG En-Peng1*

1(Jilin Ginseng Academy, Changchun University of Chinese Medicine, Changchun 130117, China)2(Changchun Institute of Optics, Fine Mechanics and Physics, Chinese Academy of Sciences,Changchun 130033, China)

Abstract The study establishes a method for rapid and non-destructive identification of the age of commercially available forest sun-dried ginseng based on hyperspectral technology combined with machine learning. Using common commercially available forest sun-dried ginseng as the research object, hyperspectral images of ginseng of different ages were first collected, and spectral data were extracted from regions of interest using a threshold segmentation method. The data were then preprocessed using Multiplicative Scatter Correction (MSC)-SavitzkyGolay smoothing (S-G smoothing)-First Derivative (FD) and MSC-S-G smoothing-Second Derivative (SD) to eliminate interference. Three machine learning models, including Support Vector Machine Regression (SVR),Principal Component Regression (PCR), and Partial Least Squares Regression (PLSR), were applied to the preprocessed data. Due to the redundancy in hyperspectral data, three algorithms—Competitive Adaptive Reweighted Sampling (CARS), Successive Projections Algorithm (SPA), and Uninformative Variable Elimination (UVE) were used to select bands and remove redundant wavelength information. The CARS-MSCS-G smoothing-SD-SVR model showed the best performance, with lower Root Mean Square Errors (RMSEC:0. 0027, RMSEP: 0. 0120), higher Correlation Coefficients (R2C: 0. 9998, R2P: 0. 9993), and RPD (38). This model effectively achieved accurate classification of the age of forest sun-dried ginseng. Combining hyperspectral imaging technology with machine learning enables rapid and non-destructive identification of the age of forest sun-dried ginseng.

Keywords Forest sun-dried ginseng; Different ages; Hyperspectralimaging; Identification

Received 2024?07?03; Accepted 2024?12?20

Supported by the National Natural Science Foundation of China (No. 82073969), the Science and Technology Bureau Project of Changchun (No. 21ZGY10) and the Science and Technology Development Program Project of Jilin Province (Nos. 20210401108YY,20220401104YY)

猜你喜歡
鑒別
山羊絨檢驗(yàn)綜述
中國纖檢(2016年12期)2017-01-20 09:32:50
基于PCR技術(shù)的水貂毛皮鑒別研究
胎母輸血綜合征1例及文獻(xiàn)復(fù)習(xí)
粉色蛋白石與相似寶玉石品種的鑒別
利用溶解性表,提高學(xué)生在酸、堿、鹽等物質(zhì)鑒別中的能力
顯微技術(shù)在牛黃清心丸(局方)質(zhì)量控制中的應(yīng)用
血液檢驗(yàn)在貧血鑒別診斷中的作用探討
今日健康(2016年12期)2016-11-17 19:20:27
中藥肉桂與食用肉桂的比較與鑒別研究
今日健康(2016年12期)2016-11-17 14:47:33
探究中醫(yī)四診合參理論對(duì)于高校貧困生的鑒別作用
考試周刊(2016年36期)2016-05-28 01:35:05
氨咖黃敏片鑒別方法的改進(jìn)及各主藥含量的考察
沈阳市| 民丰县| 抚州市| 防城港市| 赫章县| 德保县| 兰西县| 洛扎县| 津市市| 通州区| 惠安县| 海晏县| 大名县| 磐安县| 大余县| 崇仁县| 青田县| 漳浦县| 南靖县| 涡阳县| 扬中市| 嵊泗县| 洞头县| 南京市| 婺源县| 玉田县| 资中县| 梅河口市| 彭州市| 怀化市| 丽水市| 庆阳市| 镇平县| 陕西省| 长治县| 桂东县| 鲁甸县| 海城市| 延吉市| 若尔盖县| 伊吾县|