陳勇翔 高遵海
(武漢輕工大學(xué)數(shù)學(xué)與計算機學(xué)院,湖北 武漢 430023)
大米是人類最重要的食物之一,然而水稻病害會造成不同程度的減產(chǎn),不同的水稻病害主要有葉黑粉病、褐斑病和葉枯病。目前在水稻葉部病害的圖像識別方法上一般進行預(yù)處理后就直接分割圖像,造成了一定程度上的圖像失真。本文以水稻葉黑粉病、褐斑病和葉枯病為研究對象,依據(jù)水稻葉部病害和健康部分在Lab模型中a*b上的差異表現(xiàn),設(shè)計此模式下12種不同顏色分量組合特征,便于水稻葉部病害的圖像特征提取和k均值聚類,以此提高水稻葉部病害識別準(zhǔn)確率。
國際水稻研究所(IRRI,International Rice Research Institute)提供了專門用于水稻疾病圖片的圖像數(shù)據(jù)庫[1]。數(shù)據(jù)集來源UCI機器學(xué)習(xí)庫中的水稻葉片疾病數(shù)據(jù)集[2-3],該數(shù)據(jù)集圖片采用尼康D80和佳能450D數(shù)碼相機進行拍攝采集,拍攝保證在自然條件下足夠的亮度和清晰度便于對圖片的處理,并且拍攝得3類病害圖片均設(shè)定和裁剪成740×290的尺寸。對采集的圖片用中值濾波[4]方式進行去噪預(yù)處理,其原因是能夠比較完整保留圖像邊緣信息。
根據(jù)圖像分割后病害顏色的差異,對L、a、b顏色分量進行組合,構(gòu)造如表1所示的12個備選顏色參數(shù)。
表1 12個備選顏色參數(shù)
病斑分割圖像為Lab顏色空間,直接提取L,a,b的一階,二階以及三階矩陣共12個顏色矩陣參數(shù)。
在水稻葉部病害分割時將預(yù)處理的RGB圖片通過XYZ作為中間層進行Lab圖片轉(zhuǎn)換,選用Lab色彩模型[5]可以盡量保留寬闊的色域,使得色彩過渡均勻,避免由于直接分割對病害區(qū)域造成不同程度的失真。Lab中L表示亮度,a和b為2個顏色通道,水稻葉部病害和健康部分主要通過Lab模型中a×b上的差異表現(xiàn),并以此為依據(jù)進行k均值聚類方法[6]對病害斑點區(qū)域進行合理分割。
針對3類水稻病害進行聚類,聚類中心點個數(shù)分別設(shè)置為變量i(i=2,3,…,9)。其目標(biāo)收斂函數(shù)為平方誤差,具體的公式如下:
假設(shè)有M個數(shù)據(jù)源,C個聚類中心,x(i)由n個數(shù)據(jù)點組成的數(shù)據(jù)集,每個數(shù)據(jù)點x(i)是由d=12個表征數(shù)據(jù)組成的向量,μc為聚類中心。將每個類中的數(shù)據(jù)x(i)與每個聚類中心做差的平方和,J最小,意味著分割的效果最好。
水稻葉部病害圖像共計120張,葉黑粉病樣本和褐斑病樣本以及葉枯病樣本數(shù)量均為40張。經(jīng)計算和驗證,采用基于Lab空間的k均值聚類方法,葉黑粉病和褐斑病以及葉枯病聚類中心點個數(shù)均為3。樣本中k=3黑粉病和褐斑病以及葉枯病葉部分割的效果如圖1~圖3所示。
圖1 葉黑粉病及k均值圖像分割效果
圖2 褐斑病及k均值圖像分割效果
圖3 葉枯病原圖和k均值圖像分割效果
從圖1~圖3中可以直觀看出,采用基于色彩模型Lab空間的k均值聚類方法能夠?qū)⒉『Π唿c進行清晰和有效的分割,便于后續(xù)對不同類別病斑區(qū)域準(zhǔn)確識別。