張建敏,于冬雪
(貴州大學 a.機械工程學院;b.大數(shù)據(jù)與信息工程學院,貴陽 550025)
柑橘病害必然引起葉面、莖稈等顏色的改變?,F(xiàn)有的圖像檢索技術(shù)大多是以圖像的顏色、形狀、紋理為特征,獲取精確度較高的目標圖像,這給圖像檢索帶來巨大的壓力,直接影響信息的有效獲取。因此,對于柑橘葉面病害的圖像檢索的研究是非常有價值的[1]。
國內(nèi)外在柑橘葉面病害圖像檢索中以顏色為特征進行描述主要分為兩類:以全局顏色為特征和以局部顏色為特征,這兩種方法在病害圖像中有效性非常高,但對于不同的應用場景和檢索需求,采用不同的方法產(chǎn)生的檢索效果不同[2]。
常見的RGB彩色空間采用紅、綠、藍3種人眼感知的基色來表示。其優(yōu)點是可以很好地運用到顯示器設(shè)備中,缺點是不能夠充分說明人眼識別顏色的實際過程[3]。
孟賽爾(Munsell)在1939年提出HSV顏色空間的概念;A.R.Smith在1978年建立了HSV顏色空間,也稱六角錐體模型(HexconeModel)。此后,HSV顏色空間開始了蓬勃發(fā)展。HSV顏色空間的顏色直觀特性要素為色調(diào)H(Hue)、飽和度S(Saturation)和亮度V(Value),3個分量相互獨立,更接近人眼對色彩的主觀感受,可以更加容易、方便地處理圖像的信息。從20世紀70年代開始,有人就開始研究基于文本的圖像檢索技術(shù)(Text-based Image Retrieval,TBIR),利用文本描述的方式描述圖像的特征。到20世紀90年代以后,出現(xiàn)了基于內(nèi)容的圖像檢索(Content-based Image Retrieval,CBIR),以圖像的顏色、紋理、形狀等分析的檢索圖像技術(shù)。張凱兵利用HSV顏色直方圖SUV分類器實現(xiàn)不同缺素油菜葉片圖像的分類識別[4];王長斌提出了一種基于云計算農(nóng)作物病蟲害多源遙感數(shù)據(jù)挖掘框架[5];濮永仙研究了煙草病斑的顏色、形狀及紋理特征病害圖像檢索[6]。
本文主要研究以全局顏色為特征利用HSV顏色直方圖非均勻量化空間改進算法對其進行檢測,并且在柑橘葉面病害監(jiān)測的應用方面進行了實現(xiàn)。傳統(tǒng)方案是將HSV顏色空間非均勻量化成(8:3:3)72 bin的顏色矢量的算法。與傳統(tǒng)方案相比,本實驗的全局顏色特征HSV顏色直方圖算法(以下稱改進算法)在保證算法運行的速度較快的情況下,提高了算法的精確度,有利于準確監(jiān)測柑橘葉面病蟲害及實現(xiàn)現(xiàn)代農(nóng)業(yè)的科技化管理[7]。
本文的改進算法是基于內(nèi)容的圖像檢索系統(tǒng)(CBIR)的一種。經(jīng)過統(tǒng)計柑橘病害圖像的每一種顏色分量,統(tǒng)計葉面病害圖像中的各像素點所占比例,再經(jīng)過歸一量化,可獲得顏色在圖像中出現(xiàn)的概率,最終獲得對應的HSV顏色直方圖。這種方法可以簡單直觀地對柑橘病害進行檢索,即使圖像分割困難或者不知道圖像的空間位置信息,用顏色直方圖這一方法都可以將病害圖像的顏色特征非常便捷、有效地表示出來。
傳統(tǒng)的柑橘病害顏色空間非均勻(8:3:3)量化方案是將H(色調(diào))、S(飽和度)、V(亮度)對應分成8、3、3份的比例[8],而這3個顏色分量可用一維矢量來表示,從而可得到8×3×3=72bin的顏色矢量如下公式所示。
本文對(8:3:3)矢量量化方案進行改進,形成(16:4:4)的矢量量化方案,(16:4:4)量化方案和(8:3:3)量化方案相比較,顏色的辨別能力較強,對圖像的顏色區(qū)域范圍劃分的更細致,更符合人的視覺特征。由于在項目的多媒體素材庫中儲存著很多精度很高、顏色豐富的圖片和視頻片斷,為了滿足項目中對高檢索精度的需求,本文對柑橘病害顏色特征檢索采用的是(16:4:4)顏色矢量量化方案,如下公式所示。
1)假設(shè)1幅柑橘葉面圖像I[M,N],顏色直方圖可由以下公式計算得出,即
式中M—圖像的長;
N—圖像的寬;
a(m,n)—(m,n)像素點上的顏色統(tǒng)計值;
p(i)—第i個顏色分量的值(0~255)。
假設(shè)一幅柑橘病害圖像G,L表示它的顏色級數(shù)范圍,則每一種顏色qK(K=1,2,...,L)在圖像中出現(xiàn)的頻數(shù)可以記為
h(qK)=nK/n
式中qK—柑橘病害圖像G中某一顏色的值;
L—病害圖像的顏色級數(shù)范圍;
nK—病害圖像中具有顏色值為qK的像素數(shù);
n—病害圖像中圖像像素的總數(shù)。
則統(tǒng)計柑橘病害圖像G中的所有像素得到圖像G的HSV顏色直方圖,從而獲得各顏色出現(xiàn)的頻數(shù)h(q1)、h(q2)、...h(qK)、...、h(qL),可以用以下公式表示,即
H={〈h(q1),h(q2),...h(qK),...,h(qL)〉|
2)本文選擇HSV顏色空間模型,經(jīng)過(16:4:4)顏色量化方案量化后可獲得256 bin顏色分量。假設(shè)給出一幅圖像,可以由3個獨立的H、S、V一維直方圖統(tǒng)計而出[9]。為了計算簡便,本文將柑橘病害的顏色特征量化后的各H、S、V分量加權(quán)合成為一維矢量直方圖,由如下公式表示,即
Z=DHQSQV+DSQV+DV
式中DH—病害圖像中H分量量化后的數(shù)值;
DS—病害圖像中S分量量化后的數(shù)值;
DV—病害圖像中V分量量化后的數(shù)值;
QS—病害圖像中S分量量化級數(shù)范圍;
QV—病害圖像中V分量量化級數(shù)范圍。
此公式實際上是將柑橘病害圖像色調(diào)H的權(quán)重為QS×QV=4×4,柑橘病害圖像飽和度的權(quán)重為QV,圖像亮度的權(quán)重為1。以上公式可以化簡為
Z=16H+4S+V
由上式可以看出:為了減少檢索結(jié)果中柑橘病害圖像的亮度V和飽和度S的影響,尤其突出色調(diào)H對病害圖像的影響,需對色調(diào)不同的柑橘病害圖像進行有效的區(qū)分,進而通過充分利用圖像的顏色信息滿足對其病害檢索的要求。
3)計算柑橘病害圖像的相似度[10]。假如查詢病害圖像的直方圖特征矢量為(q0,q1,...qL),自制數(shù)據(jù)庫中病害圖像的直方圖特征矢量為(s0,s1,...sL),則本文通過利用歐氏距離來計算病害圖像相似性度量公式為
式中qt、st—特征矢量歸一化的值;
L—一維直方圖顏色特征矢量維數(shù)范圍。
經(jīng)過將其歸一化處理后,柑橘病害圖像直方圖的相似度為
4)通過比較原算法和改進算法在柑橘病害圖像的檢索中查全率和查準率的高低,來表明算法的有效性。其中,對柑橘病害圖像查準率和查全率越高的算法,其檢索算法越好,則
本研究選取100幅各種病害的柑橘葉面病斑圖像作為測試庫來進行實驗,主要以jpg和png格式為主[11]。隨機抽取12幅不同病害的圖像作為查詢圖像(測試圖像包含12幅查詢圖像)來進行實驗,其算法流程通過MatLab R2013a軟件平臺來實現(xiàn)(以圖庫中1.png為例),如圖1所示。
圖1 1.png原始圖像及其HSV分量圖Fig.1 The Original Image of 1.png and its Hue、Saturation and Value Component Image
圖1為1.png原始圖像及其HSV分量圖。圖1(a)為原始圖像,圖1(b)為圖像的色調(diào)圖(H分量圖),圖1(c)為圖像的飽和度(S分量圖),圖1(d)為圖像的亮度(V分量)。
圖2為(8:3:3)傳統(tǒng)方案和(16:4:4)改進方案圖像的HSV顏色直方圖對比。圖2(a)為(8:3:3)傳統(tǒng)方案圖像的HSV顏色直方圖,圖2(b)為(16:4:4)改進方案圖像的HSV顏色直方圖[12]。HSV直方圖的橫坐標為圖像的顏色分量,縱坐標為顏色分量值。由圖2可知:(16:4:4)方案的HSV顏色直方圖更細化,顏色分量更豐富。因此,本文采用的HSV非均勻量化(16:4:4)256 bin這一改進方法的改進量化方案更為有效。
圖2 (8:3:3)傳統(tǒng)量化方案和(16:4:4)改進量化方案的HSV顏色直方圖對比Fig. 2 The comparison of (8:3:3)Traditional quantitative plan drawing and (16:4:4) Improved quantitative plan drawing of HSV Color Histogram Distribution
圖3為(8:3:3)傳統(tǒng)方案應用在柑橘病蟲害檢索的結(jié)果圖。選取1張柑橘病害檢索圖像(圖庫中9.jpg),應用傳統(tǒng)檢索算法,檢索框里將按相似度從近到遠的順序排列出8幅病害圖像。由檢索結(jié)果可看出:圖中出現(xiàn)擾亂圖像西瓜和柑橘,檢索結(jié)果不理想。
圖3 (8:3:3)圖像檢索結(jié)果Fig.3 (8:3:3)Image retrieval results
圖4為本實驗的全局顏色特征改進算法所做的柑橘病害檢索出的8幅病害圖像。由檢索結(jié)果可看出:圖中按照檢索圖像的原圖像相似性從高到低排列出來,檢索結(jié)果較精確。
圖4 (16:4:4)圖像檢索結(jié)果Fig.4 (16:4:4)Image retrieval results
對比以上兩種非均勻量化方案檢索得出的結(jié)果可知:本研究改進算法(16:4:4)比傳統(tǒng)算法(8:3:3)的量化方案檢索結(jié)果精確度要高,且圖像的排列相似程度更高。所以,用本文的(16:4:4)的量化方案足夠證明柑橘葉面病害檢測檢索精度的精確性。
圖5 原始方案與改進方案查準率和查全率的對比Fig.5 The original algorithm’s recall rate and precision rate compared with the improved algorithm
實驗采用10次實驗的平均值作為最終結(jié)果,將柑橘病害圖像中的10幅查詢圖像進行檢索,并將所獲得的平均值用來計算實驗的查準率和查全率[13]。圖5為原始方案與改進方案查準率和查全率的對比。圖5(a)為原始方案與改進方案在柑橘病害監(jiān)測方面查準率的對比,圖5(b)為原始方案與改進方案在柑橘病害監(jiān)測方面查全率的對比。圖形中的12對柱形圖為12種柑橘病害,實心柱形圖為原始方案檢索,空心柱形圖為改進方案檢索,縱坐標為各柑橘病害的查準率和查全率。由結(jié)果可以看出:與HSV非均勻量化(8:3:3)方案相比較,本文的HSV非均勻量化(16:4:4)方案顏色直方圖改進算法在保證檢索效率的同時,在柑橘病害特征檢索中效果突出,對葉面病蟲害的監(jiān)測更準確。
本文采用的改進算法能夠在一定程度上更細致的體現(xiàn)顏色變化過程及程度,因此更能體現(xiàn)圖片間的區(qū)別,提高了檢索性能。
1)以柑橘葉面常見病害(如瘡痂病、粉虱類病、黑刺粉虱病、黃龍病、介類病、潰瘍病、木虱病、潛葉蛾病、全爪螨病、炭疽類病、銹壁虱病、蚜蟲病等)病斑圖像為研究對象,重點研究了基于HSV顏色非均勻量化空間的柑橘病害圖像檢索改進算法技術(shù)[14]。將傳統(tǒng)的HSV顏色空間非均勻量化(8:3:3)方案與實驗最終采用的HSV非均勻量化(16:4:4)方案對比,發(fā)現(xiàn)(16:4:4)方案更準確、直觀和高效,更能細致地體現(xiàn)柑橘病害顏色特征,更能明顯地反映病害圖像全局特征。該方案將H、S、V三維向量歸一化成一維向量直方圖,可簡便計算圖像間的相似度距離及按相似性從近到遠檢索出循環(huán)結(jié)果。通過使用這種方案,提取柑橘葉面圖像的病斑顏色信息來反映病害,能夠判斷出病害屬于哪種并采取有效防治。
2)實驗表明:本方法可以對柑橘葉子常見的病害(如瘡痂病、粉虱類病、黑刺粉虱病、黃龍病、介類病、潰瘍病、木虱病、潛葉蛾病、全爪螨病、炭疽類病、銹壁虱病、蚜蟲病等)通過圖像檢索的方式來診斷;但在對于實際應用中,由于柑橘的外界環(huán)境的變化,各種病害也不盡相同。所以,仍需要逐漸加強研究柑橘葉面病害及種類,擴充病害圖像的采樣庫[15]。