張晴晴,張?jiān)讫垼R國(guó)紅,李 瑤
(鄭州大學(xué)西亞斯國(guó)際學(xué)院,河南鄭州 451150)
中國(guó)作為農(nóng)業(yè)大國(guó),農(nóng)作物是人民賴以生存的物質(zhì)源泉,農(nóng)作物的產(chǎn)量和質(zhì)量直接影響農(nóng)民的經(jīng)濟(jì)收入和我國(guó)農(nóng)產(chǎn)品的輸出[1]。近年來,工業(yè)技術(shù)的飛速發(fā)展導(dǎo)致嚴(yán)重的空氣污染,造成自然災(zāi)害嚴(yán)重化,進(jìn)而導(dǎo)致農(nóng)作物病害種類和程度大大加重。農(nóng)作物病害直接威脅著作物的健康,過量的農(nóng)藥噴灑又會(huì)造成作物的品質(zhì)無法保證。及早發(fā)現(xiàn)病害并做好防治是提高作物產(chǎn)量和質(zhì)量的關(guān)鍵[2]。利用機(jī)器視覺對(duì)農(nóng)作物病害進(jìn)行自動(dòng)檢測(cè)和識(shí)別已成為農(nóng)業(yè)信息化和智能化的必然趨勢(shì)。而高精度的病害圖像分割是準(zhǔn)確識(shí)別的關(guān)鍵步驟,因此對(duì)一種效果好且實(shí)時(shí)性高的分割算法進(jìn)行研究具有重要意義。
隨著科學(xué)技術(shù)的不斷發(fā)展,分割算法不斷涌現(xiàn),許多其他學(xué)科理論被應(yīng)用到圖像分割領(lǐng)域,形成了一些基于特定理論的圖像分割算法[3]。早在2008年,毛罕平等[4]將模糊C均值聚類用于作物病害圖像的分割,并取得了一定的分割效果。Hu等[5]、Deshpande等[6]應(yīng)用K均值聚類算法分別對(duì)香蕉和石榴病害圖像進(jìn)行分割,并實(shí)現(xiàn)了其自動(dòng)分級(jí)的功能。賴玉霞等[7]提出了一種基于遺傳算法的K均值聚類,在自適應(yīng)交叉和變異概率的遺傳算法中引入K均值,克服了K均值算法對(duì)初始中心的敏感性。關(guān)海鷗等[8]利用模糊集和遺傳算法相結(jié)合建立植物病斑區(qū)域分割模型,并根據(jù)不同植物病斑區(qū)域的特點(diǎn)實(shí)現(xiàn)植物快速分類。Zhang S等[9]采用全局局部奇異值分解算法實(shí)現(xiàn)了黃瓜病害葉片圖像的分割。張武等[10]、Sigh等[11]利用支持向量機(jī)(SVM)算法以及改進(jìn)的SVM實(shí)現(xiàn)復(fù)雜背景下小麥和豆類不同病害類型的分割。張星龍等[12]利用光源不變圖特性采用聚類算法實(shí)現(xiàn)陰影下的葉片病斑圖像分割,達(dá)到很高的準(zhǔn)確率。王海青等[13]在傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上提出了參數(shù)自適應(yīng)脈沖耦合神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了黃瓜目標(biāo)分割。Chuang等[14]提出了一種基于空間領(lǐng)域的模糊C均值聚類算法實(shí)現(xiàn)了圖像分割。由于自然環(huán)境的差異性,葉片結(jié)構(gòu)和形狀復(fù)雜多樣,病斑形狀的不確定性以及差異性導(dǎo)致一些經(jīng)典的圖像分割方法不具有通用性,至今未找到一種分割算法能夠適用于各類圖像,并且沒有一個(gè)較完善的統(tǒng)一的評(píng)價(jià)準(zhǔn)則來判定分割結(jié)果的好壞,所以仍需要不斷探究新的分割方法和評(píng)價(jià)準(zhǔn)則[15-17]。由于FCM算法實(shí)現(xiàn)過程中目標(biāo)函數(shù)的迭代容易進(jìn)入局部極小值化,并且函數(shù)的收斂速度較慢,對(duì)噪聲的敏感度較低[18]?;趥鹘y(tǒng)的模糊C均值聚類算法的研究基礎(chǔ)上,筆者提出了模糊熵的概念,將隸屬度、非隸屬度和猶豫度(不確定度)3方面信息綜合起來表示模糊集,形成了直覺模糊C均值聚類算法[19]。
1.1傳統(tǒng)的FCM算法原理早在1973年,Bezdek等[20]就提出了模糊C均值聚類算法,它引入了隸屬度的概念來優(yōu)化目標(biāo)函數(shù),把樣本間的關(guān)系定量表示,從而準(zhǔn)確客觀地聚類,使得類內(nèi)差別盡可能小,類間差別盡可能大,實(shí)現(xiàn)自動(dòng)對(duì)樣本數(shù)據(jù)進(jìn)行分類的目的。
首先定義FCM算法中聚類的類別是C,其中包含N個(gè)L維向量數(shù)據(jù)xk,元素的隸屬度為uij,它代表的含義是數(shù)據(jù)元素xj屬于第i類的概率,可以通過式(1)的最小值求取[21]。
(1)
其中,根據(jù)經(jīng)驗(yàn)一般令m=2,uij需要滿足:
(2)
(3)
由上式的約束條件通過對(duì)各變量求偏導(dǎo)可得式1目標(biāo)函數(shù)取最小值式對(duì)應(yīng)的隸屬度變量uij和聚類中心vi。
(4)
(5)
根據(jù)算法原理,F(xiàn)CM算法實(shí)現(xiàn)步驟如下:
①設(shè)置目標(biāo)函數(shù)的3個(gè)參數(shù):精度e,模糊指數(shù)m(通常取2)和最大迭代次數(shù);
②將隸屬度變量uij進(jìn)行初始化設(shè)置;
③更新隸屬度變量uij和聚類中心ui;
④判斷目標(biāo)函數(shù)J(t)-j(t+1) ⑤把隸屬度變量取最大值多對(duì)應(yīng)的類作為最終的樣本聚類結(jié)果。 1.2直覺模糊C均值聚類原理盡管FCM算法優(yōu)于傳統(tǒng)的C均值聚類算法,定義了隸屬度在[0,1]范圍內(nèi)連續(xù)取值,能夠?qū)㈩愰g樣本數(shù)據(jù)進(jìn)行良好地分類,但是FCM算法實(shí)現(xiàn)過程中目標(biāo)函數(shù)的迭代容易進(jìn)入局部極小值化,并且函數(shù)的收斂速度較慢,對(duì)噪聲的敏感度較低。因此提出了基于直覺模糊集聚類(IFCM)算法,同時(shí)引入隸屬度、非隸屬度和猶豫度(不確定度)三方面信息的來表示模糊集,從而引入了直覺模糊熵(IFE)的概念,IFE用來表示模糊集的模糊度[22]。 定義,若一個(gè)實(shí)函數(shù)fIFE(x)為x的直覺模糊熵,則需要滿足以下幾個(gè)條件: ①若是普通模糊集,則fIFE(A)=0; ②若uA(xi)=γA(xi)=0,?xi,則fIFE(A)=n; ③若每個(gè)元素的隸屬度和非隸屬度都減少,則不確定度增加,即: 如果A≤B,uA(xi)≤uB(xi),γA(xi)≤γB(xi),?x∈X, 則uA(xi)+γA(xi)≤uB(xi)+γB(xi), 所以πA(xi)≥πB(xi),fIFE(A)≥fIFE(B) 其中,uA(xi)、γA(xi)、πA(xi)分別代表集合X={x1,x1,…,xn}的隸屬度、非隸屬度和不確定度,則: uA(xi)+γA(xi)+πA(xi)=1 (6) 若πA(xi)不確定度為0時(shí),直覺模糊集就變成普通的模糊集。 我們定義表示模糊集的直覺度的直覺模糊熵fIFE(A)為: (7) 很據(jù)Yager直覺模糊集互補(bǔ)公式(參考文獻(xiàn)),非隸屬度可以表示為: γA(xi)=[1-uA(xi)α]1/α,x∈X (8) 不確定度公式可表示為: πA(xi)=1-uA(xi)α-[1-uA(xi)a]1/a,x∈X (9) 模糊集A可表示為: =[uA(xi),(1-uA(xi)a)1/a,1-uA(xi)a-[1-uA(xi)a]1/a|x∈X] (10) 式中,a的取值范圍為0≤a≤1。 同F(xiàn)CM算法的實(shí)現(xiàn)相類似,IFCM的算法可以按如下步驟實(shí)現(xiàn): ①先定義評(píng)價(jià)準(zhǔn)則函數(shù),對(duì)相關(guān)參數(shù)和隸屬度變量進(jìn)行初始化,并確定好初始聚類中心的個(gè)數(shù)C; ②依據(jù)式(4)定義不確定度參數(shù)πA(xi)、隸屬度參數(shù)uA(xi)、非隸屬度參數(shù)rA(xi),并建立模糊隸屬度矩陣; ③利用模糊隸屬度矩陣計(jì)算各樣本點(diǎn)到聚類中心的距離,對(duì)樣本進(jìn)行分類; ④重復(fù)計(jì)算每個(gè)類的聚類中心到樣本的距離,每次都用直覺模糊隸屬度矩陣代替原來的隸屬度矩陣,并將樣本重新劃分到各個(gè)類中; ⑤重復(fù)第2、3、4步驟,直到評(píng)價(jià)準(zhǔn)則函數(shù)達(dá)到最小值,計(jì)算停止; ⑥將多次迭代后的聚類中心值映射到原圖像對(duì)應(yīng)的灰度圖像中,從而將原圖像中各像素點(diǎn)的灰度值進(jìn)行分類。 圖像分割就是按照一定的算法和準(zhǔn)則把1幅圖像劃分成2個(gè)或多個(gè)具有相似性的區(qū)域,并能夠用輪廓線區(qū)分各個(gè)區(qū)域,各個(gè)區(qū)域界定的實(shí)質(zhì)是根據(jù)圖像的像素值大小來劃分的。分割的最終目的就是把對(duì)研究者有用的目標(biāo)信息從復(fù)雜的背景中分離出來,為更好的做進(jìn)一步的分析和處理。 應(yīng)用于圖像分割,模糊隸屬度的函數(shù)式衡量1幅灰度圖像中某一像素點(diǎn)xj屬于一個(gè)灰度值中心grayi的程度。因此,需要計(jì)算出圖像中像素點(diǎn)對(duì)某灰度值中心的最大隸屬度,便可將該像素點(diǎn)劃分到該灰度級(jí)的區(qū)域中。對(duì)于灰度圖像模糊隸屬度的公式可表示為式(11): (11) 圖像分割的好壞主要取決于圖像像素各中心灰度值的選取,結(jié)合公式(2)和(8)可推得: (12) 式中,xj代表灰度圖像中某一像素點(diǎn)的灰度值。 使用IFCM進(jìn)行圖像分割的流程圖如圖1所示。 圖1 IFCM圖像分割流程圖Fig.1 Flow chart of IFCM image segmentation 為驗(yàn)證直覺模糊C均值聚類算法用于病害圖像分割的有效性,實(shí)驗(yàn)選取了黃瓜病害葉片圖片作為研究對(duì)象,圖片存儲(chǔ)格式統(tǒng)一設(shè)定為.png,分辨率大小為160×160。計(jì)算機(jī)性能采用主頻為2.2 GHz的CPU,內(nèi)存大小為4 G,仿真運(yùn)行環(huán)境使用MATLAB 7.10。 3.1IFCM算法分割結(jié)果 實(shí)驗(yàn)選取三種不同種類的黃瓜病害葉片(紅粉病、灰霉病和褐斑病)圖像各50張,利用文中改進(jìn)的FCM算法進(jìn)行病斑分割。由于直覺模糊C均值聚類算法中不確定度πA(xi)直接受參數(shù)α取值的影響較大參數(shù),經(jīng)多次試驗(yàn)發(fā)現(xiàn)當(dāng)α取值為0.85時(shí)分割效果最好,因此圖1是設(shè)置α=0.85得到的試驗(yàn)結(jié)果。 圖1a~c是經(jīng)過預(yù)處理的3種不同病種的黃瓜病害葉片,利用改進(jìn)的IFCM分割算法通過設(shè)置不同的參數(shù)得到最好的病斑二值分割圖像如圖1d~f所示,最后經(jīng)過與原彩色圖像取與運(yùn)算得到彩色病斑分割圖像結(jié)果如圖1g~i所示,試驗(yàn)過程中參數(shù)的設(shè)置直接影響到分割效果的好壞。 3.2IFCM算法和其他算法的結(jié)果對(duì)比為更好地說明該文算法的有效性,采用最大類間方差(Otsu)分割算法、K均值聚類分割算法、傳統(tǒng)FCM分割算法和該文改進(jìn)的IFCM分割算法的結(jié)果進(jìn)行了對(duì)比。通過4種分割算法分別對(duì)3種病害類別(紅粉病、灰霉病和褐斑病)各50張進(jìn)行試驗(yàn)測(cè)試,算法的執(zhí)行時(shí)間和分割的準(zhǔn)確度都采用平均值,具體對(duì)比結(jié)果見表1和2。 注:a.紅粉病彩色圖像;b.灰霉病彩色圖像;c.褐斑病彩色圖像;d.紅粉病二值病斑圖像;e.灰霉病二值病斑圖像;f.褐斑病二值病斑圖像;g.紅粉病彩色分割結(jié)果;h.灰霉病彩色分割結(jié)果;i.褐斑病彩色分割結(jié)果Note:a.Color image of Cephalothecium roseum;b.Color image of Botrytis cinerea;c. Color image of tan disease;d.Binary disease spot image of Cephalothecium roseum;e.Binary disease spot image of Botrytis cinerea;f.Binary disease spot image of tan disease;g.Color segmentation result of Cephalothecium roseum;h.Color segmentation result of Botrytis cinerea;i.Color segmentation result of tan disease圖2 不同種類黃瓜病害葉片圖像的分割結(jié)果Fig.2 Segmentation results of different diseased leaf images of cucumbers 從表1和2可以看出,利用該文算法對(duì)作物進(jìn)行病斑分割準(zhǔn)確率較其他算法都高一些,平均分割準(zhǔn)確率高達(dá)94.5%,算法執(zhí)行時(shí)間也較短,有很好的時(shí)效性。 表14種不同算法平均時(shí)間比較 Table1Comparisonoftheaveragetimeoffourdifferentalgorithmmethods ms 表24種不同算法的分割準(zhǔn)確率比較 Table2Comparisonofsegmentationaccuracyoffourdifferentalgorithmmethods % 該研究在模糊C均值聚類(FCM)算法的基礎(chǔ)上,引入了直覺模糊熵對(duì)FCM算法進(jìn)行了改進(jìn),即IFCM算法,該算法既體現(xiàn)出原FCM算法運(yùn)行時(shí)間短、實(shí)現(xiàn)簡(jiǎn)單等優(yōu)點(diǎn),又克服了FCM算法分割時(shí)計(jì)算目標(biāo)函數(shù)容易陷入局部極小值,而且聚類數(shù)目需要提前設(shè)定初值的缺點(diǎn)。IFCM算法通過引入不確定度這一參數(shù),確保在分割過程中既濾除了噪聲的干擾又保留了圖像的細(xì)節(jié)特征,達(dá)到了很好的分割效果使得圖像分割。因此,IFCM算法可以改善圖像的噪聲影響,對(duì)于噪聲干擾較為嚴(yán)重的圖像選用IFCM算法分割效果較傳統(tǒng)的FCM算法效果好。但是,對(duì)于IFCM算法,引入的不確定度參數(shù)依靠經(jīng)驗(yàn)值的判斷,參數(shù)的自動(dòng)最有選取是下一步研究的重點(diǎn)。2 基于直覺模糊聚類的圖像分割
3 結(jié)果與分析
4 結(jié)論