国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于貝葉斯優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的金線蓮偽品鑒別

2022-03-03 12:56柴琴琴
浙江農(nóng)業(yè)學(xué)報 2022年2期
關(guān)鍵詞:金線貝葉斯卷積

柴琴琴,曾 建,張 勛

(1.福州大學(xué) 電氣工程與自動化學(xué)院,福建 福州 350108;2.福州大學(xué) 教育部醫(yī)療器械與制藥技術(shù)重點(diǎn)實(shí)驗室,福建 福州 350108;3.福州大學(xué) 晉江科教園,福建 晉江 362251;4.福建中醫(yī)藥大學(xué) 藥學(xué)院,福建 福州 350122)

珍貴中藥材金線蓮(,)主要分布在在中國福建、浙江、江西等南方省份,其含有糖類、黃酮及苷類等活性成分,具有抗癌、降血糖、抗氧化等藥效。雖然金線蓮藥用價值高,但生長環(huán)境非??量?,供應(yīng)短缺造成金線蓮市場價格較高。不法商家為了提高利潤,常常用金線蓮?fù)仆瑢俚呐_灣銀線蓮冒充金線蓮在市場上出售,甚至使用外形相似的同科不同屬斑葉蘭或血葉蘭摻雜在金線蓮中出售。雖然金線蓮和臺灣銀線蓮活性成分相似,但是比例不同,干燥的全植金線蓮與臺灣銀線蓮的多糖提取率將近相差3倍。為了更好地規(guī)范金線蓮市場,保證金線蓮質(zhì)量,需要一種快速可靠的金線蓮及其偽品的鑒別方法。

文獻(xiàn)報道的金線蓮質(zhì)量檢測方法主要有性狀鑒定法、顯微鑒定法、DNA鑒定法、高效液相色譜法等。這些傳統(tǒng)分析方法雖然分析精度非常高,但是分析過程時間長、效率低,需要大量的專業(yè)知識,并且會破壞樣本。因此,建立一種準(zhǔn)確可靠、簡便易行、低成本且適用于快速檢測金線蓮及其偽品的檢測方法成為了新的研究方向。近紅外光譜(near infrared spectroscopy,NIRS)技術(shù)是一種高性能、快速、綠色、高靈敏度的無損檢測方法。當(dāng)前,NIRS結(jié)合傳統(tǒng)機(jī)器學(xué)習(xí)模型已廣泛應(yīng)用于中藥材定性分析。然而傳統(tǒng)機(jī)器學(xué)習(xí)模型在實(shí)際應(yīng)用中往往需通過數(shù)據(jù)降維方法或波長優(yōu)選方法來降低NIRS數(shù)據(jù)的維度以提高模型性能,同時也增加了識別方法的主觀性和復(fù)雜性。

近年來,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)在高維數(shù)據(jù)中表現(xiàn)了出色的特征提取能力,并在圖像分類,目標(biāo)檢測等任務(wù)中取得了巨大的成功。CNN強(qiáng)大的特征提取能力非常適合應(yīng)用于高維度NIRS數(shù)據(jù)特征提取。針對NIRS數(shù)據(jù)為序列數(shù)據(jù)的特點(diǎn),一般使用一維卷積神經(jīng)網(wǎng)絡(luò)(1D convolutional neural network,1D-CNN)應(yīng)用于NIRS數(shù)據(jù)分析。然而,目前基于1D-CNN的NIRS中藥材質(zhì)量分析模型的參數(shù)選擇主要為實(shí)驗試湊法,不僅耗費(fèi)了大量的時間成本,還可能得不到最優(yōu)模型參數(shù)。

針對這些問題,本文以金線蓮及其3種摻雜偽品的NIRS數(shù)據(jù)作為研究對象,構(gòu)建基于簡化1D-CNN的質(zhì)量鑒別模型,并結(jié)合貝葉斯優(yōu)化算法對1D-CNN進(jìn)行參數(shù)尋優(yōu),得到最佳鑒別模型參數(shù),實(shí)現(xiàn)金線蓮及其偽品的高準(zhǔn)確度預(yù)測判定。為了進(jìn)一步驗證提出的模型性能,通過結(jié)合貝葉斯優(yōu)化算法分別對1D-CNN,最近鄰算法(K-nearest neighbor,KNN)和支持向量集(support vector machine,SVM)的超參數(shù)進(jìn)行尋優(yōu),將最優(yōu)的超參數(shù)組合建立模型,并對判別效果進(jìn)行比較。實(shí)驗表明,1D-CNN結(jié)合貝葉斯優(yōu)化方法可以快速有效地鑒別金線蓮及其偽品。

1 材料與方法

1.1 樣本獲取和光譜數(shù)據(jù)集劃分

分別收集了不同批次的80批金線蓮樣本和80批臺灣銀線蓮樣本,每批大約180 g。另外,收集了用于摻雜的斑葉蘭和血葉蘭共2 000 g。分批清洗新鮮樣品3~5遍,置于60 ℃烘箱烘干至恒重,粉碎過60目篩。金線蓮及其摻偽樣品的近紅外光譜數(shù)據(jù)在溫度25 ℃、濕度60%的條件下由NIRFlex N-500 近紅外光譜分析儀所采集,掃描范圍為4 000~10 000 cm,掃描次數(shù)為32,分辨率為8 cm。金線蓮及其偽品樣本平均近紅外光譜圖如圖1所示。其中光譜數(shù)據(jù)點(diǎn)有1501維,范圍在4 000~10 000 cm。

A1,金線蓮;A2,金線蓮摻雜斑葉蘭;A3,金線蓮摻雜血葉蘭;A4,臺灣銀線蓮。下同。

所有樣本中,純金線蓮和純臺灣銀線蓮各有80個,摻雜的斑葉蘭和摻雜的血葉蘭樣本各有84個,共328個樣本數(shù)量。樣本集中25%的樣本被隨機(jī)分為測試集,剩余75%以3∶1的比例隨機(jī)分為訓(xùn)練集和驗證集。數(shù)據(jù)集詳細(xì)信息如表1所示。訓(xùn)練集數(shù)據(jù)用于建立鑒別模型,驗證集用于選擇模型的參數(shù),測試集用于評估模型的性能。

表1 金線蓮及其偽品樣本信息

1.2 方法及模型

1.2.1 1D-CNN卷積神經(jīng)網(wǎng)絡(luò)

CNN的基本結(jié)構(gòu)由輸入層、卷積層、池化層、全連接層以及輸出層構(gòu)成,一般卷積層和池化層需交替設(shè)置多層。卷積層和池化層用于從輸入層光譜數(shù)據(jù)提取特征。全連接層用于進(jìn)一步選擇波長信息,然后將樣本分類并通過SoftMax分類器輸出結(jié)果。本研究采用文獻(xiàn)[13]中的1D-CNN結(jié)構(gòu),結(jié)構(gòu)如圖2所示。1D-CNN主要分為6層,分別是輸入層F0,卷積層C1,池化層S2,兩個全連接層(F3和F4)和輸出層F5。其中,1D-CNN模型的詳細(xì)參數(shù)如下:F0輸入維度為1×1501的近紅外光譜數(shù)據(jù),C1尺寸為64×1×15,表示卷積核數(shù)量為64,卷積核尺寸為1×15,步長stride為1,S2為最大值池化,池化核尺寸為1×2,步長stride為1。F3和F4的神經(jīng)元個數(shù)分別為512和4。F5經(jīng)過SoftMax分類器輸出樣本類別的概率置信度。

圖2 1D-CNN結(jié)構(gòu)圖

研究表明,CNN對超參數(shù)敏感,相同的CNN結(jié)構(gòu)采用不同的超參數(shù)模型性能可能差異巨大。然而文獻(xiàn)[13]中超參數(shù)選擇采用實(shí)驗試湊法,不僅耗費(fèi)了大量的時間成本,還可能得不到最優(yōu)模型參數(shù)。因此,需進(jìn)一步研究實(shí)現(xiàn)超參數(shù)自動優(yōu)化調(diào)節(jié),提高CNN的模型性能。

1.2.2 基于貝葉斯優(yōu)化算法的CNN超參數(shù)優(yōu)化

CNN模型的泛化性能往往取決于其預(yù)設(shè)超參數(shù)的選取。常用的參數(shù)選擇方法有網(wǎng)格搜索算法和隨機(jī)搜索,其中網(wǎng)格搜索算法是窮舉搜索,使得模型訓(xùn)練時間和計算成本相對高昂,不能用于實(shí)際CNN模型的參數(shù)搜索;隨機(jī)搜索算法隨機(jī)性強(qiáng),容易漏掉重要的信息。貝葉斯優(yōu)化算法是一種全局的優(yōu)化算法,通過給定的黑盒目標(biāo)函數(shù),不斷添加樣本點(diǎn),更新目標(biāo)函數(shù)的后驗分布,直到后驗分布基本貼合真實(shí)分布,只需要少次數(shù)的迭代即可獲得理想解,并且在非凸優(yōu)化問題中的表現(xiàn)依然穩(wěn)健。因此,本文使用貝葉斯優(yōu)化算法對1D-CNN、SVM、KNN的超參數(shù)進(jìn)行優(yōu)化,優(yōu)化變量如表2所示。其中,1D-CNN優(yōu)化的超參數(shù)包括:卷積核數(shù)量(Filters),卷積核大小(Kernel-size),最大池化窗口大小(Pooling-size),全連接層神經(jīng)元數(shù)量(Units),批大小(Bath-size),訓(xùn)練回數(shù)(Epoch)。SVM優(yōu)化參數(shù)有懲罰項系數(shù)(C)和核函數(shù)(Kernel),其中核函數(shù)rbf,linear,sigmoid,poly分別表示高斯核函數(shù),線性核函數(shù),邏輯核函數(shù)和多項式核函數(shù)。KNN的優(yōu)化參數(shù)為近鄰個數(shù)(Neighbors)和距離度量方法(Metric),其中距離度量方法包括閔可夫斯基距離(Minkowski),歐式距離(Euclidean),曼哈頓距離(Manhattan)和切比雪夫距離(Chebyshev)。

表2 1D-CNN、SVM和KNN超參數(shù)尋優(yōu)設(shè)置

1.2.3 模型性能評價指標(biāo)

實(shí)驗結(jié)果采用正確識別率(correct identification rate,CIR)來評估模型性能,CIR的計算公式如下:

(1)

其中,為正確分類樣本數(shù)量,為總樣本數(shù)量。CIR值越高,表示模型的預(yù)測性能越好。

2 結(jié)果與討論

為比較本文提出模型的分類性能,基于金線蓮及其偽品訓(xùn)練集分別建立1D-CNN、SVM和KNN分類模型,并各自使用貝葉斯優(yōu)化算法對表2中的模型參數(shù)進(jìn)行優(yōu)化,迭代次數(shù)為100,優(yōu)化目標(biāo)函數(shù)為:

=1-CIR。

(2)

1D-CNN模型的超參數(shù)尋優(yōu)結(jié)果如圖3所示。圖3中當(dāng)?shù)螖?shù)為80時,目標(biāo)函數(shù)值為0,獲得了最佳的結(jié)果。但隨著迭代次數(shù)的增加,目標(biāo)函數(shù)值仍在變化,表明貝葉斯優(yōu)化算法在接近最優(yōu)值的同時,仍在嘗試探索其它最優(yōu)位置。

圖3 1D-CNN模型超參數(shù)尋優(yōu)結(jié)果

經(jīng)過貝葉斯優(yōu)化后的1D-CNN模型最優(yōu)參數(shù)(1D-CNN-B)如下,Epoch為200,Max pooling-size為5,Batch-size為64,Units為200,F(xiàn)ilters為12,Kernel-size為15。經(jīng)過貝葉斯優(yōu)化后的KNN模型(KNN-B)最優(yōu)參數(shù)如下,Neighbors為9,Metric為chebyshev。經(jīng)過貝葉斯優(yōu)化后的SVM模型(SVM-B)最優(yōu)參數(shù)如下,C=466.046 05,Kernel為poly。為了進(jìn)一步對比參數(shù)優(yōu)化后的模型性能,采用1.2.2節(jié)中介紹的超參數(shù)訓(xùn)練1D-CNN模型,參數(shù)如下Epoch為50,Max pooling-size為2,Batch-size為12,Units為512,F(xiàn)ilters為12,Kernel-size為15。

1D-CNN,1D-CNN-B,SVM-B和KNN-B模型性能對比如表3所示,從表3性能指標(biāo)分析可得,相比KNN-B和SVM-B模型,1D-CNN模型性能更具有競爭力,而1D-CNN-B精度最高,說明,經(jīng)過貝葉斯優(yōu)化超參數(shù)能提高模型分類性能。

表3 KNN、SVM和1D-CNN鑒別性能對比

3 結(jié)論

本文基于NIRS技術(shù)建立了1D-CNN模型應(yīng)用于金線蓮及其摻雜品的鑒別。為了解決實(shí)驗試湊法選擇1D-CNN超參數(shù)導(dǎo)致時間成本高和易陷入局部最優(yōu)的缺點(diǎn),使用貝葉斯優(yōu)化算法對CNN模型的參數(shù)進(jìn)行尋優(yōu),充分挖掘1D-CNN的模型性能。通過對比貝葉斯優(yōu)化超參數(shù)的1D-CNN模型和人為選定超參數(shù)的1D-CNN 模型的性能,結(jié)果表明,超參數(shù)自動優(yōu)化調(diào)節(jié)后,可以進(jìn)一步提高1D-CNN的模型性能。另外,本文還建立了傳統(tǒng)模型包括KNN和SVM模型,用于論證1D-CNN的性能。實(shí)驗結(jié)果表明,1D-CNN模型的分類性能比SVM和KNN更高,進(jìn)一步論證了在高維數(shù)據(jù)中,1D-CNN模型比傳統(tǒng)的機(jī)器學(xué)習(xí)模型的學(xué)習(xí)能力更強(qiáng)。綜上所述,基于NIRS技術(shù)的1D-CNN模型可以快速有效地鑒別金線蓮及其摻雜品。

猜你喜歡
金線貝葉斯卷積
基于ITS2和psbA-trnH序列鑒別金線蘭及其近緣種
基于全卷積神經(jīng)網(wǎng)絡(luò)的豬背膘厚快速準(zhǔn)確測定
基于圖像處理與卷積神經(jīng)網(wǎng)絡(luò)的零件識別
一種基于卷積神經(jīng)網(wǎng)絡(luò)的地磁基準(zhǔn)圖構(gòu)建方法
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實(shí)現(xiàn)
租賃房地產(chǎn)的多主體貝葉斯博弈研究
租賃房地產(chǎn)的多主體貝葉斯博弈研究
貝葉斯網(wǎng)絡(luò)概述
深山種植金線蓮走出致富路
貝葉斯公式的應(yīng)用和推廣
云浮市| 庆元县| 西吉县| 丰原市| 中牟县| 巴楚县| 静安区| 三都| 大丰市| 名山县| 镇沅| 营口市| 汉川市| 资中县| 邻水| 马边| 关岭| 佛坪县| 昭觉县| 金乡县| 阳东县| 宝应县| 涿鹿县| 铜川市| 平湖市| 同德县| 那坡县| 胶南市| 英吉沙县| 邵阳市| 霸州市| 美姑县| 肃宁县| 喜德县| 九龙城区| 余干县| 瓮安县| 贵阳市| 古蔺县| 博白县| 柘荣县|