王 雪,王曉援,劉 洋,郭鑫鑫
(吉林農(nóng)業(yè)科技學(xué)院 網(wǎng)絡(luò)信息中心,吉林 吉林132101)
病害是影響玉米產(chǎn)量的重要因素之一。典型的玉米葉部病害如大斑病、小斑病和灰斑病等等影響了玉米的健康生長。利用計算機視覺技術(shù)觀察玉米葉部的病害區(qū)域,可直觀有效地判斷病害部位的類型及程度,對早期病害的診斷能夠起到輔助作用并及時采取病害防治措施。圖像分割是圖像分析與處理領(lǐng)域復(fù)雜而關(guān)鍵的步驟,基于葉部病害區(qū)域的精準(zhǔn)分割,直接影響病害識別的精度。
近年來,隨著計算機視覺技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用,基于農(nóng)作物及病害部位圖像分割問題的研究已有大量成果。傳統(tǒng)的圖像分割方法主要有閾值分割[1-2]、邊緣分割[3]、聚類分割[4-5]等。傳統(tǒng)方法的特點是需要手動提取圖像特征,方法較單一,圖像分割魯棒性較差。而隨著卷積神經(jīng)網(wǎng)絡(luò)在圖像分析和處理領(lǐng)域的應(yīng)用,基于深度學(xué)習(xí)的分割方法因其自動學(xué)習(xí)圖像特征,圖像分割性能優(yōu)于傳統(tǒng)方法,其已成為目前研究的熱點。劉立波等[6]“基于FCN和CRF網(wǎng)絡(luò)模型”實現(xiàn)了棉田冠層圖像分割。段凌鳳等[7]“基于深度全卷積神經(jīng)網(wǎng)絡(luò)”實現(xiàn)了大田稻穗分割。王振等[8]提出了“改進(jìn)的全卷積神經(jīng)網(wǎng)絡(luò)”用于玉米葉片病斑分割。
研究針對深度網(wǎng)絡(luò)模型在向下編碼提取高層語義特征過程中丟失了部分空間上下文信息而影響后續(xù)分割精度的問題,提出一種基于深度學(xué)習(xí)的CornDisNet網(wǎng)絡(luò)分割模型,在編碼網(wǎng)絡(luò)底層,從多個尺度提取圖像語義特征,為后續(xù)解碼捕獲更多空間上下文信息,實現(xiàn)了玉米葉部大斑病和小斑病等病害區(qū)域的精準(zhǔn)分割。
在自然環(huán)境下,隨機采集了不同玉米葉部病害圖像作為研究對象,為便于模型訓(xùn)練,提升模型分割精度。本研究采集的圖像只包含帶有病害區(qū)域的單張葉片,圖像大小裁剪為256×256,圖像格式為.jpg。通過人工標(biāo)注,將掩碼圖像中葉片病害區(qū)域的像素值標(biāo)記為255,其他部位作為背景區(qū)域,像素值標(biāo)記為0。為避免小數(shù)據(jù)集在模型訓(xùn)練中出現(xiàn)過擬合現(xiàn)象,采用數(shù)據(jù)增強策略,包括對圖片進(jìn)行水平或垂直翻轉(zhuǎn)、隨機位置截取以及對圖片進(jìn)行亮度、對比度和顏色的隨機變化。數(shù)據(jù)集中部分玉米病害圖像及其掩碼標(biāo)注,如圖1所示。
圖1 玉米葉部病害圖像及其人工標(biāo)注圖Fig.1 Image of corn leaf disease and its artificial annotation
本研究基于深度學(xué)習(xí)技術(shù)分割玉米葉部病害區(qū)域,具體分割流程如圖2所示,主要包括數(shù)據(jù)預(yù)處理、網(wǎng)絡(luò)模型訓(xùn)練和分割測試三部分。
圖2 基于深度學(xué)習(xí)的玉米葉部病害分割框架流程圖Fig.2 Flow chart of corn leaf disease segmentation framework based on deep learning
CornDisNet網(wǎng)絡(luò)結(jié)構(gòu)受U-Net網(wǎng)絡(luò)結(jié)構(gòu)啟發(fā),U-Net[9]網(wǎng)絡(luò)是一個基于FCN[10]的全卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)最初用于醫(yī)學(xué)圖像分割,其網(wǎng)絡(luò)結(jié)構(gòu)簡單,能夠適應(yīng)很小的訓(xùn)練集,在圖像分割領(lǐng)域具有很好的分割性能。針對U-Net網(wǎng)絡(luò)在編碼階段提取高層次語義特征時,連續(xù)卷積和池化操作造成圖像中部分空間上下文信息丟失。提出一種基于U-Net多尺度分割方法,在編碼底層從多個尺度提取語義特征,以捕獲更多空間上下文信息,實現(xiàn)了玉米葉部病害區(qū)域的精準(zhǔn)分割。CornDisNet網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,主要包括編碼模塊、多尺度特征提取模塊(MSC)和解碼模塊,其中編碼和解碼模塊同U-Net網(wǎng)絡(luò)部分。
圖3 CornDisNet網(wǎng)絡(luò)模型Fig.3 Network model of CornDisNet
CornDisNet網(wǎng)絡(luò)在編碼底層引入了MSC 塊,即多尺度特征提取塊。這里引入Atrous卷積[11]。Atrous卷積的優(yōu)點是通過向卷積層引入擴張率參數(shù),在不增加參數(shù)量的同時擴大了圖像感受野。Atrous卷積計算公式為:
(1)
其中,x[i]為輸入信號,w[k]表示長度為k的濾波器,r為對輸入信號進(jìn)行采樣的步幅,y[i]為輸出。標(biāo)準(zhǔn)的卷積是r=1的特例,隨著r值的改變,空洞卷積可以調(diào)節(jié)卷積窗口的視野。
受Inception[12]網(wǎng)絡(luò)和Resnet[13]網(wǎng)絡(luò)結(jié)構(gòu)思想啟發(fā),MSC塊結(jié)構(gòu)如圖4所示。首先使用卷積核大小為3×3,擴張率rate分別為1、3、5和卷積核大小為1×1的卷積操作提取不同尺度的語義特征,然后將提取的不同尺度特征進(jìn)行拼接,再通過卷積核大小為1×1的卷積操作進(jìn)行降維,最終與輸入層特征進(jìn)行融合,從多個尺度提取更多語義特征并保留更多的空間上下文信息,提升分割精度。
圖4 多尺度特征提取模塊Fig.4 Multi-scale feature extraction block
本研究實驗基于PyTorch深度學(xué)習(xí)框架。軟件操作系統(tǒng)為Ubuntu 16.04 LTS 64位,硬件環(huán)境為服務(wù)器Intel Xeon CPU E5-2620 v4、內(nèi)存64GB DDR4 MHz、NVIDIA GeForce GTX 1080 Ti獨立顯卡3張。
模型訓(xùn)練過程中,采用隨機梯度下降SGD優(yōu)化器,momentum= 0.9,batch_size=2,epoch為200,初始學(xué)習(xí)率lr設(shè)置為0.000 2。
為了評價網(wǎng)絡(luò)模型分割效果,采用準(zhǔn)確率Acc、召回率Rec和精確率Prec三個評價指標(biāo),計算公式如下:
(2)
(3)
(4)
其中,TP表示真陽率,TN表示真陰率,F(xiàn)P表示假陽率,F(xiàn)N表示假陰率。
在78幅玉米葉部病害圖像數(shù)據(jù)集上進(jìn)行實驗,通過數(shù)據(jù)增強操作,將原有數(shù)據(jù)擴充8倍得到624幅圖像,并對數(shù)據(jù)集進(jìn)行了劃分,其中訓(xùn)練集436幅,驗證集62幅,測試集126幅。本研究方法與U-Net網(wǎng)絡(luò)模型下分割結(jié)果進(jìn)行了對比,表1列出了不同網(wǎng)絡(luò)模型下的各評價指標(biāo)值。通過觀察實驗結(jié)果,該方法在Acc、Rec和Prec三個評價指標(biāo)上取得的結(jié)果均優(yōu)于U-Net網(wǎng)絡(luò)。
表1 玉米葉部病害分割結(jié)果對比Tab.1 Comparison of segmentation result on corn leaf diseases
圖5為測試數(shù)據(jù)集上部分玉米葉部病害圖像分割結(jié)果。從圖中觀察到,在不同玉米葉部病害區(qū)域的分割中,本研究方法能準(zhǔn)確分割出病害區(qū)域,尤其在強光照條件下,該方法的分割效果要優(yōu)于U-Net網(wǎng)絡(luò)。
圖5 U-Net與改進(jìn)方法圖像分割結(jié)果Fig.5 U-Net and improved image segmentation results
針對深度網(wǎng)絡(luò)模型在向下編碼提取高層語義特征過程中丟失了部分空間上下文信息而影響后續(xù)分割精度的問題,提出了一種基于深度學(xué)習(xí)的CornDisNet網(wǎng)絡(luò)分割模型,用于玉米葉部病害區(qū)域的精準(zhǔn)分割。該網(wǎng)絡(luò)結(jié)構(gòu)在傳統(tǒng)U-Net上進(jìn)行了改進(jìn),主要包括編碼模塊、多尺度特征提取模塊和解碼模塊。通過在網(wǎng)絡(luò)編碼底層提取不同尺度的特征信息,有效解決了深度網(wǎng)絡(luò)特征編碼模塊的空間上下文信息丟失問題,在玉米葉部病害分割中取得了很好的分割效果。