国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

采用改進稠密連接網絡的防風藥材的道地性識別

2022-04-16 03:20李東明張麗娟劉雙利
農業(yè)工程學報 2022年3期
關鍵詞:殘差防風卷積

李東明,湯 鵬,張麗娟,雷 雨,劉雙利

(1. 吉林農業(yè)大學信息技術學院,長春 130118;2. 長春工業(yè)大學計算機科學與工程學院,長春 130012;3. 吉林農業(yè)大學中藥材學院,長春 130118)

0 引 言

中醫(yī)藥經長期臨床實踐觀察比較,逐漸形成了道地藥材這一概念。這些道地藥材由于地域、溫度、水分、光照、土壤等優(yōu)勢,其藥效品質突出。防風藥材為傘形科植物防風的干燥根,主治外感表證、風疹瘙癢、風濕痹痛等癥。防風為東北地區(qū)的道地藥材,是大宗藥材之一。目前,對防風藥材的產地及質量的識別方法多為基于物理或化學特征的中藥材識別,《中華人民共和國藥典》以升麻素苷(CHO)及5-O-甲基維斯阿米醇苷(CHO)的含量測定為評價指標,但是無法對防風藥材的道地性及其質量優(yōu)劣進行準確衡量。

隨著人工智能技術的快速發(fā)展,圖像的智能分類與識別成為該領域中最重要的應用目標之一。其中,基于圖像分析的植物識別分類技術已成為國內外植物信息學領域研究的熱點。目前,深度神經網絡技術在識別防風藥材產地或質量仍處于空白階段,但深度卷積神經網絡(Convolutional Neural Networks,CNN)在圖像分類上的研究已經展開。Krizhevsky等搭建的AlexNet網絡在對大型公開集(ImageNet)進行圖像分類識別訓練中獲得了不容忽視的好成績。在此基礎上學者們相繼提出VggNet、GoogLeNet、ResNet和DenseNet等經典的深度卷積神經網絡,并廣泛應用在植物圖像分類任務中。Reyes等利用180余萬張圖像對卷積神經網絡進行預訓練,并使用微調思想將學習到的識別能力從其他領域轉移到植物識別任務中來。Grinblat等利用卷積神經網絡對植物葉片紋理模式進行識別,實現對3種不同豆科植物,即白豆、紅豆和大豆的識別和分類。

Dyrmann等通過CNN對22種生長初期的雜草和作物等1萬余張在光照、分辨率和土壤類型方面存在差異的植物彩色圖像進行種類識別,其準確率為86.2%。Lee等嘗試使用卷積神經網絡直接從輸入數據的原始表示中學習有價值的葉片特征信息,并基于反卷積網絡方法對所獲取到的特征信息進行直觀性分析,結果表明葉片的紋理特征在對葉片進行識別分類方面更具決定性。由于各領域對數據集采集及創(chuàng)建的局限性會嚴重影響深度網絡模型的性能,所以為解決訓練樣本不足的問題,Nguyen、Ghazi、鄭一力等利用遷移學習思想,先將AlexNet、GoogLeNet、Inception V3等經典模型在大規(guī)模圖像數據集(ImageNet)中進行預訓練,然后將得到的預訓練模型應用于目標數據集上并進行微調來達到更好的識別分類效果。

大量科學試驗證明卷積神經網絡引進注意力機制對提高網絡性能有著極大的促進作用,所以近年來注意力機制得到快速的發(fā)展與壯大。Hu等提出了SE(Squeeze Excitation)機制,它學習特征圖中各個通道間的關聯得到通道注意力,使網絡對信息豐富的通道格外關注;CBAM(Convolutional Block Attention Module)機制則在SE機制基礎上進行了進一步地擴展,該機制將特征圖按通道進行全局池化,獲得空間注意力;BAM(Bottleneck Attention Module)則采用并聯的方式將空間、通道兩種注意力進行整合;Wang等提出的Non-Local模型通過全局像素點對局部像素點的計算響應,即實現對特征圖的全局進行更有效關注,并與三維神經網絡有效集成,該模型在視頻分類任務中有較好效果;Fu等提出的DANet則探索了特征圖中各空間和各通道間的關聯關系,分別生成全局通道注意力和空間注意力,該模型在語義分割任務中取得了較好的效果;Li等提出的SK(Selective Kernel)結構采用SE模型和殘差網絡相結合的思想,能夠根據特征圖的不同尺度讓網絡動態(tài)地選擇不同的感受野,提高了注意力機制的靈活度;Hou等提出的CA(Coordinate Attention)協(xié)調注意力機制是將位置信息嵌入到通道注意力模型中,對輸入的特征圖進行自適應特征細化,可進一步提高網絡的性能。

結合相關研究分析,本文嘗試將深度學習技術引入中藥材產地識別領域,應用于防風藥材產地識別。防風藥材的表型作為區(qū)分防風藥材產地的首選器官,受生長年限和人為因素影響,同一產地的防風藥材外觀形態(tài)也極易發(fā)生改變。防風藥材的顏色紋理特征在同一地區(qū)受外界特殊情況影響較小,外部性狀較為穩(wěn)定。但是同物種空間形態(tài)和顏色紋理特征較為復雜,區(qū)分度較低,對防風產地識別屬于精細分類范疇。本文在上述研究成果的基礎上,通過分析已有的ResNet和DenseNet卷積神經網絡模型的圖像特征提取能力,提出了一種改進稠密連接網絡用于防風藥材產地識別的方法,以期為構建可靠、精準、快速的防風產地識別系統(tǒng)提供理論基礎。

1 材料與方法

1.1 防風藥材圖像數據集采集及預處理

防風樣品來自吉林農業(yè)大學中藥材學院中心實驗室。該實驗室提供了正品防風(根據地域不同,包括關防風、口防風和西北防風)的主要產區(qū)的防風樣本,包括黑龍江、吉林、河北、甘肅、內蒙古東北部5個產地1 500余個防風樣品。將樣本展平至白色背景上,在室內自然光下手機拍攝獲得每種產地防風圖像約3 500張,共拍攝防風藥材圖像18 543張,充分考慮到各類防風地域分布差異。通過對本數據集圖像進行隨機裁剪、隨機旋轉、隨機翻轉等增廣處理,擴充至55 628張防風圖像,來增強數據樣本,數據集圖像信息如圖1所示。

圖1 防風藥材數據集Fig.1 Saposhnikovia divaricata data set

1.2 訓練集及驗證集的劃分

為排除試驗存在的偶然性,確保其穩(wěn)定性,各網絡模型訓練均采用5折交叉驗證的方法,將整個數據集的80%作為測試集,另外20%作為驗證集。采用Python腳本程序將整個數據集隨機近似均等化分為5部分,每部分逐一作為驗證集,另外4部分的圖像樣本進行對各網絡模型的訓練,使網絡模型在訓練過程中訓練集與驗證集的數量比始終為4:1,本文最終試驗結果為5次試驗的平均值。數據集劃分示例如表1所示。

表1 數據集劃分Table 1 Data set partition

2 改進稠密連接網絡模型

2.1 稠密連接網絡

稠密連接網絡(DenseNet)的組成單元即為稠密模塊(Dense Block),稠密模塊結構如圖2所示。每一個稠密模塊由五層網絡結構組成,每層網絡均含卷積層(Convolution Layer, Conv)、激活函數層(Rectified Linear Units Layer, ReLU)和批量標準化層(Batch Normalization Layer, BN)。

圖2 稠密模塊Fig.2 Dense block

稠密模塊使用了一種更加密集的連接模式,它以一種層與層之間直接連接的方式迭代連接所有的輸出。因此,第層的輸出x為:

式中[...]表示連接操作,它通過對輸出的連接進行特征重用,H的操作定義為:一個批量標準化層(BN)后接激活函數(ReLU)再加一個卷積層(Conv)、隨機失活層與池化層。BN層擁有正向及反向傳播結構,主要解決梯度消失與爆炸問題。隨機失活層通過隨機關閉神經元,有效緩解了網絡訓練過程中信息冗余問題。

由于各產地防風藥材的表型在直觀上差別不大,需要對其外部紋理及相關色澤等方面進行細粒度分類。因為稠密連接網絡可以擁有更深的網絡層次,且網絡模型參數數量相比較小,具有深層新特征信息挖掘能力強及特征的重復利用率高等優(yōu)點。因此,成為完成類似于對防風藥材產地識別這樣細粒度分類任務的首選。但是,這也會增加稠密連接網絡的計算量,網絡對內存或顯存消耗過多,這對處理設備提出了更高的要求。

2.2 深度殘差模塊

殘差網絡是He等提出的一種優(yōu)異的深度學習算法,這種算法擁有較稠密連接網絡更輕型的結構,同時由于殘差網絡易于優(yōu)化的特點,也使得大量的學者對其進行了深入的研究。

殘差塊(Residual Block)的輸入與線性輸出進行特征信息融合,作為該殘差塊的整體輸出,并通過BN層(Batch Normalized)進行歸一化操作。因此,殘差模塊可有效減少在網絡訓練過程中出現的梯度彌散、過擬合等現象。

殘差模塊如圖3所示,輸入特征信息分別經過圖中主干的3個卷積層的運算輸出為(,,,),其中第一個1×1的卷積層和第三個1×1的卷積層分別起到降維和升維的作用,以達到節(jié)約參數的目的。、、表示在殘差模塊各層所學習的權重參數,W表示經過殘差模塊輸出的維度方陣,并與(,,,)融合,成為下個殘差模塊的輸入。

根據W的模是否為1來判斷殘差模塊的輸入和輸出維度相同與否,如果W的模不為1即為不相同,則可利用W將殘差模塊的輸入和輸出調整到相同維度。當與相等時表示恒等映射;當與不相等時,則表示殘差模塊需學習兩者之間不同的信息。

圖3 殘差模塊Fig.3 Residual block

2.3 注意力機制

注意力機制已經被廣泛應用到深度學習領域之中,并對提升網絡模型在分類、檢測和預測等任務方面的準確率有著突出貢獻。廣泛應用在卷積神經網絡中的注意力機制主要分為:通道注意力機制和空間注意力機制。

雖然通道注意力機制對于提升網絡模型性能具有顯著效果,但它們通常會忽略位置信息,空間注意力機制在對通道信息進行學習時也存在一定局限性。因此本網絡模型引入協(xié)調注意力(,CA)模型。CA模型是將位置信息嵌入到信道注意中,對輸入的特征圖進行自適應特征細化,CA模型的結構如圖4所示。

圖4 協(xié)調注意力機制模型Fig.4 Coordination attention mechanism model

經上述變換網絡可學習到優(yōu)良的全局感受野,編碼精確的位置信息。為更好的利用以上學習到的特征信息,通過上述的變換進行連接融合。再利用一個卷積核尺寸為1×1的變換函數,對其進行再一次變換操作,即:

式中表示sigmoid激活函數,然后對gg進行拓展,作為注意力權重,CA模型的最終輸出為:

使殘差模塊結構可以在增加網絡深度的基礎上,進一步提高對特征信息利用的準確性與高效性。

根據防風藥材數據集圖像背景復雜且不單一的特點,對其進行分類訓練時,加深了網絡對其空間位置特征信息和通道特征信息的依賴。本文按照協(xié)調注意力機制原理,將CA模型嵌入到含有跳躍連接的殘差模塊中,歸因于在特征集合相加操作前對分支上殘差的特征進行了特征重標定,以實現對網絡模型的優(yōu)化,若對特征集合相加操作后主支上的特征進行重標定,由于在主干上存在0~1的加權操作,在網絡較深情況下,進行反向傳播優(yōu)化時在靠近輸入層容易出現梯度消散的情況,導致網絡模型性能難以獲得提升。因此,CA模型分別以水平、垂直兩個空間方向對各通道特征進行編碼,并將獲得的空間位置信息嵌入到通道注意力機制中,對輸入的特征圖進行自適應特征細化,來適應數據集各類別之間其表型差別性小的細粒度圖像分類任務。將CA模型引入殘差模塊中應用在防風藥材產地識別上,使新網絡在訓練過程中既能學習到目標圖像的通道信息又能獲取到目標圖像的精確位置信息,有效提高網絡模型的性能。改進殘差塊模型結構如圖5所示。

圖5 改進殘差塊模型Fig.5 Improved residual block model

在圖5中,Conv和BN為一個卷積處理層,具體過程為:一個卷積核尺寸為1×1的卷積處理層,對傳入的特征信息進行降維,減少運算量,后接一個卷積核尺寸為3×3的卷積運算層,來進行常規(guī)訓練;然后,將輸出的特征圖合并,輸入到CA模型,原因在于CA模型內具有大量的非線性優(yōu)化操作,可以更好地擬合空間、通道間復雜的相關性,并極大地減少了參數量和計算量;接著,通過一個Sigmoid層獲得0~1之間歸一化的權重,通過一個加權操作將歸一化后的權重加權到每個特殊的通道上,使其可以有效增加特征圖的通道信息以及空間位置信息;再將輸出的注意力特征與原始的輸入特征通過短連接相加,使網絡性能獲得進一步的提升;最后,在接入一個卷積核尺寸為1×1的卷積處理層,來還原輸入特征信息的維度,這樣可保持網絡識別目標的精度和減少計算量。

2.4 改進稠密連接網絡的結構

研究發(fā)現,深度殘差模塊采用殘差旁支通路方式善于對特征信息重復利用,但殘差神經網絡只使用淺層卷積提取特征,缺少深層語義信息表達。稠密模塊采用密集連接通路方式,使其可以探索深層新特征,但存在冗余。

經借鑒DCNet網絡的重要思想,本文將改進的殘差模塊引進到稠密網絡。本文結合殘差塊的特征重用特點和稠密塊對新特征探索的特點,來提高網絡的高效性,有效地解決隨著殘差塊疊加,網絡存在梯度彌散的一系列問題,并減少網絡參數的運算量。同時,還結合遷移學習思想,對全連接層進行重構,以提高模型非線性表達能力,提高網絡的整體性能。

本文提出的改進稠密連接網絡結構如圖6所示。在圖6中,該網絡模型包含卷積層、改進殘差層、稠密連接層、池化層和重構層5個部分。

圖6 改進稠密連接網絡模型Fig.6 Improved densely connected network model

1)卷積層:該部分由一個具有64個卷積核大小尺寸為7×7的卷積層構成,卷積的步長為2,填充像素為3,對RGB圖像進行卷積處理,提取圖像的淺層特征信息。

2)改進殘差層:在提取特征之后,所獲得的特征信息需要先后經過7個改進的殘差模塊進行處理,經過該層首先經過兩個擁有64個卷積核大小為1×1和3×3的卷積層,起到對特征信息進行降維的作用;然后,將卷積后生成的特征圖輸入到CA模型,即將傳入的特征信息,采用大小為(,1),(1,)的兩種池化核分別以水平、垂直兩個空間方向對各通道聚合特征。并將上面的特征進行連接操作,使用1×1卷積變換函數對其進行變換操作,并沿著空間維度將水平和垂直方向進行編碼的中間特征映射,分解為兩個單獨的張量;接著,應用另外兩個1×1的卷積變換分別將兩個單獨的張量變換成具有相同通道數的張量并進行連接操作,再經過Sigmoid激活函數將融合之后的通道特征進行自適應加權,再將CA模型輸出的深層特征信息與特征提取部分輸出的淺層特征信息結合;最后,使用具有64個卷積核大小為1×1的卷積層進行特征融合并恢復到原本維度。

3)稠密連接層:為提升網絡對特征信息學習和描述的性能,在網絡的深層保留兩組稠密模塊,每組稠密塊由6組1×1和3×3卷積構成。兩組稠密塊之間由過渡層(Transition layer)鏈接,過渡層由歸一化、卷積核大小為1×1的卷積層和池化層構成。第1組稠密塊的輸入是CA模型所獲得的特征信息經過歸一化、ReLU激活函數和卷積核大小為3×3的卷積層等一系列操作,所獲取的局部特征信息的串聯。這樣可以有效緩解在特征提取過程中所造成的空間維度信息丟失的問題,且由于稠密模塊設計較為狹窄,大大地降低了網絡的參數冗余度。

4)池化層:經過稠密層所獲得的特征信息,輸入到池化層進行歸一化和ReLU激活函數層后進行自適應平局池化,使池化后的每個通道的大小為1×1。

5)重構層:為了提高對防風藥材產地識別精度和網絡模型的泛化能力,本文引入遷移思想,在ImageNet數據集上進行預訓練得到初始化深度模型,并在防風數據集上進行遷移訓練。在遷移中,對最后全連接層進行重構,提高網絡模型非線性表達能力。具體做法:首先,將原全連接層輸入的特征信息傳送到具有256個輸出的線性層,隨后分別經過ReLU函數和Dropout層,后進入256×5線性層,輸出為5通道的softmax層,來適應網絡模型對各種防風藥材產地的精確識別;最后,通過分類器Logsoftmax來對輸入的特征信息進行識別判斷。本文通過“凍結”網絡中初始層的權重,使網絡具有抽取圖像特征的能力,防止過擬合情況的發(fā)生,實現不同產地防風圖像自動識別。

3 試驗及結果分析

3.1 試驗和環(huán)境參數設置

試驗配置環(huán)境為GPU并行計算工作站,處理器為Xeon(R)CPU E5-2680v4、顯卡為GeForce GTX 1080Ti、采用Ubuntu 16.04LTS操作系統(tǒng)、軟件配置安裝Anaconda3-5.2.0-Linux版本,并基于Python 3.6.5編程語言搭建Pytorch的深度學習框架。

3.2 試驗結果與分析

本文提出的新網絡模型訓練時采用的具體試驗參數信息如表2所示。為驗證新網絡模型的有效性,本文以網絡模型參數、模型損失以及識別出藥材產地準確率作為評價指標。分別選擇Vgg16、GoogLeNet、ResNet101和DenseNet121四種經典的卷積神經網絡并按照對應原論文中原型框架和參數設置方式對防風藥材數據集進行對比試驗,結果如表3所示。

經對比試驗結果表明,新網絡模型在本數據集上識別平均準確率達到97.23%,平均損失僅為0.15,收斂速度也遠快于其他網絡模型。因此,本研究提出的新網絡的性能與其他網絡模型對比有較大幅度的提升。各網絡模型識別分類準確率及損失曲線如圖7所示。

表2 新模型訓練參數Table 2 New model training parameters

表3 不同卷積神經網絡模型試驗結果對比Table 3 Comparison of experimental results of different CNN models

圖7 各模型對數據集的識別結果Fig.7 Recognition results of each model on the data set

3.2.1 殘差層對模型性能的影響

試驗過程中對比網絡模型均參照論文中原型框架和參數設置方式,單次訓練樣本數量為32,輸入圖片尺度采用256×256像素。根據試驗對比發(fā)現,DenseNet比ResNet的模型參數少4×10,但是DenseNet對GPU的占用率高達89.2%,且收斂速度慢。

其原因在于在相同深度的這兩個網絡DenseNet擁有比ResNet更輕的結構,稠密塊(Dense Block)中每兩層網絡之間都為直接連接,能夠對特征信息進行直接輸入與輸出,因此對于一個擁有層網絡結構的模塊,則該模塊的直接連接數僅有(+1)/2個。故每次卷積輸入與輸出的通道個數要比ResNet少很多,使 BN層和全連接層的運算參數量也相應地減少;但DenseNet比ResNet的特征圖信息更加復雜,導致卷積過程的計算量增大,內存的訪問次數也隨之增加,且內存的訪問相對費時,使得GPU占用率過高,訓練速度緩慢。

因此,結合DenseNet和ResNet的運算特點,本文通過引進殘差模塊與稠密模塊相結合的新網絡相比于其他傳統(tǒng)神經網絡,既減少網絡對內存的訪問次數及運算量,弱化網絡對資源的依賴程度。又加強了特征傳播,鼓勵特征重用,并大大減少了參數的數量,改進了整個網絡的信息流和梯度,這使得它們易于訓練,很大程度上能夠克服訓練的過擬合。新模型的參數規(guī)模僅為8.3×10,GPU的占用率大幅度下降,收斂速度也遠快于其他對比網絡。

3.2.2 注意力機制對網絡模型性能的影響

將本研究提出的新網絡中的CA模型替換為不同注意力模型進行防風產地識別試驗并進行對比:1)現有經典的通道注意力SE(Squeeze-Excitation)模型,新網絡中的注意力模型換成SE模型(簡稱為Model(SE));2)CBAM(Convolutional Block Attention Module)模型則是在通道注意力機制基礎上進一步串聯空間注意力機制而擴展所得到的,將新網絡中的注意力模型換成CBAM模型(簡稱為Model(CBAM));3)BAM(Bottleneck Attention Module)模型則是采用并聯的方式將空間注意力和通道注意力整合得到的,將新網絡中的注意力模型換成BAM模型(簡稱為Model(BAM));4)CA(Coord Attention)模型則是將位置信息嵌入到了通道注意力中所得到的輕量級網絡,新網絡原模型(簡稱為Model(CA));5)將新網絡中的注意力模型去掉(簡稱為Model(NO)),各網絡模型對防風藥材的產地識別結果如表4所示。

表4 不同注意力機制模型識別結果對比Table 4 Recognition results comparison of different attention mechanism models

為了證明本文提出的加入CA模型的有效性,進行了一系列的關于注意力機制的試驗,與廣泛應用的注意力模型SE、CBAM和BAM進行對比,其結果列于表4中。由試驗結果可以看出,Model(NO)網絡對防風藥材產地識別的平均準確率達到 93.84%。而 Model(SE) 、Model(CBAM)、 Model(BAM)和Model(CA) 網絡對防風藥材產地識別的平均準確率分別達到94.71%、95.94%、95.07%和97.23%。由此表明加入以上注意力機制的新網絡對防風藥材產地識別的準確率都有不同程度的提高,分別提高了0.87個百分點、2.1個百分點、1.23個百分點和3.39個百分點。這證明了注意力機制的引入對提高網絡模型準確率的有效性,其中,CA模型對網絡模型準確率的提升效果最佳。由于只有SE模型是基于通道注意力機制,而文中其他注意力模型都是通道注意力機制與位置特征信息的有機結合。由SE與CBAM、BAM、CA注意力對比試驗結果可知,空間特征信息似乎對網絡有較大貢獻。

原因在于,CA機制與傳統(tǒng)通道注意力機制的工作方式大相徑庭,CA模型是通過將全局池化變換為兩個一維特征編碼的操作,并采用大小不同的兩種池化核分別以水平、垂直兩個空間方向對各通道聚合特征。通過這種方式,網絡可以從不同方向學習到遠程信息的交互性信息并獲取樣本目標空間特征信息。

將得到的特征圖分別編碼為具有全局感受野和精確位置信息的注意力圖,可以將其應用于輸入的特征圖作為輸入的完善信息,以增強對待識別目標的表示。所以當使用原網絡中的CA模型時,網絡獲得的識別效果最佳。

針對與CA模型同為空間和通道特征信息結合且試驗效果較好的CBAM模型進行結構對比分析,發(fā)現CA模型相對于CBAM模型所提出的位置信息編碼方式的優(yōu)點是雙重的,首先CBAM模型中的空間注意機制將通道維壓縮為1,從而導致信息丟失。但是CA模型使用適當的縮小比率來減小瓶頸中的通道尺寸,從而避免過多的信息丟失。其次,CBAM模型利用內核大小的卷積層7×7編碼局部空間信息,而CA模型集中于通過使用兩個互補的一維全局池化操作對全局信息進行編碼。這使網絡能夠集中精力捕捉視覺任務必不可少的空間位置之間的長期依賴關系。

如圖8所示,在最后一個構建塊中對嵌入CA模型方法前后的新網絡所生成的熱力特征圖進行可視化。使用Grad-CAM作為可視化工具。很明顯,CA模型可以更準確地定位到感興趣且有價值的區(qū)域

圖8 嵌入CA模型前后新網絡熱力特征圖的可視化結果Fig.8 Visualization results of the thermal feature maps of the new network before and after the CA model is embedded

3.2.3 數據擴充對網絡模型性能的影響

為更好提高新網絡模型的識別性能,本文分別通過以下3種方式對數據集進行數據擴充:1)隨機裁剪尺寸為256×256像素;2)隨機翻轉;3)通過多種角度進行隨機旋轉。以新網絡為試驗模型,在其他參數相同的條件下,分別對擴充前數據集(18 543張)和擴充后數據集(55 628張)進行對比試驗。準確率曲線如圖9所示。

圖9 數據擴增前后準確度曲線Fig.9 Accuracy curve before and after data amplification

通過對數據進行預處理操作提高了數據樣本圖像的多樣性,并可以抑制網絡訓練過程中過擬合現象的發(fā)生。新網絡模型對擴充前后數據集進行對比訓練試驗,但試驗結果顯示其對模型準確度提升效果并不明顯,其試驗結果分別是96.34%、97.23%,兩者識別準確率相差不到1個百分點。說明在應用遷移學習模式背景下,進行防風藥材數據集的擴充對于提升網絡模型識別分類性能的影響較小,原因是預訓練模型在大型圖像數據集上已經獲得了較多的知識信息儲備,進而弱化了數據擴充的作用。

試驗初期準確率波動性大的主要原因在于:為了減少數據預處理所占用存儲空間,所以試驗將部分數據預處理操作采用了在線動態(tài)的方式來進行。在試驗過程中,從數據集中隨機獲取部分樣本圖像進行歸一化、中心裁剪等相關預處理,并重新排列初始數據集的默認圖像順序,也伴隨偶然性。但伴隨訓練的深入,網絡模型逐漸健碩,數據集回歸原始樣本圖像分布,所以準確率波動幅度逐漸減小,網絡模型的泛化性隨之提升。

4 結 論

1)本文構建了一個防風藥材產地圖像識別數據集,該數據集可以作為基準數據集對當前主流機器學習方法進行驗證。通過分析已有的ResNet和DenseNet卷積神經網絡模型,本文提出一種改進稠密連接網絡模型。

2)新網絡模型構建過程為:首先對殘差模塊進行改進,即在殘差模塊中引入了協(xié)調注意力機制(Coordinate Attention),來適應各產地防風之間表型差別性小的細粒度圖像分類任務,并提高分類識別的準確率。再將改進的殘差模塊與稠密模塊進行具有針對性的結合,這樣可提高網絡探索新特征的靈活性和利用特征的高效性,減少網絡參數的運算量,增強網絡模型的泛化性。

3)通過對比試驗,各網絡模型在新防風藥材數據集上的結果表明:經典的傳統(tǒng)的神經網絡Vgg16、GoogLeNet、ResNet101和DenseNet121對防風藥材產地識別的準確率分別為:86.74%、88.56%、91.28%和93.46%。而改進后的新網絡對防風藥材產地識別的平均準確率可達97.23%,本文提出的新網絡對比以上經典的傳統(tǒng)神經網絡對防風藥材產地識別的平均準確率有較大程度的提高。并且本文提出的新網絡在訓練過程中僅需要約48輪便可達到收斂的狀態(tài);但以上其他神經網絡再對比試驗中需要上百輪才可以達到收斂狀態(tài)。綜上本文提出的新網絡模型參數僅為8.3×10,識別準確率遠高于其他對比網絡;也極大地提高了收斂速度;證明新模型對防風藥材產地精確高效識別的有效性。

將深度學習應用于中藥材領域后,可以使中醫(yī)藥在臨床醫(yī)療上取得更快、更健康的發(fā)展,為中藥材的道地性識別問題在理論與實踐中得到更好的解決。

猜你喜歡
殘差防風卷積
基于全卷積神經網絡的豬背膘厚快速準確測定
多級計分測驗中基于殘差統(tǒng)計量的被試擬合研究*
基于圖像處理與卷積神經網絡的零件識別
用于處理不努力作答的標準化殘差系列方法和混合多層模型法的比較*
人性化溝通應用于種植牙手術護理過程的效果觀察
感冒來碗防風粥
基于深度卷積網絡與空洞卷積融合的人群計數
卷積神經網絡概述
防風衣
測量數據的殘差分析法
临清市| 保靖县| 贡山| 夏河县| 融水| 托里县| 通辽市| 区。| 哈密市| 麻城市| 盖州市| 开江县| 卓资县| 海丰县| 汪清县| 简阳市| 轮台县| 东辽县| 电白县| 山丹县| 丹东市| 宜黄县| 广南县| 永宁县| 江川县| 海丰县| 潍坊市| 龙南县| 方正县| 云林县| 伊金霍洛旗| 朝阳县| 昌都县| 彰武县| 马尔康县| 凤冈县| 竹北市| 旌德县| 全州县| 纳雍县| 嵩明县|