鄭志超
(深圳市鼎為科技有限公司,深圳 518000)
圖像分割是一個(gè)經(jīng)典的機(jī)器視覺(jué)處理問(wèn)題,其目的是將圖像分割為若干個(gè)相關(guān)的區(qū)域,從而提取出感興趣的區(qū)域或者輪廓特征。圖像分割的準(zhǔn)確性直接作用于目標(biāo)物測(cè)量的準(zhǔn)確性,其效率直接影響生產(chǎn)的效率,因而,一個(gè)快速準(zhǔn)確圖像分割算法是目標(biāo)識(shí)別,分級(jí)分類任務(wù)面臨的首要問(wèn)題。
在農(nóng)業(yè)產(chǎn)品分級(jí)分類任務(wù)中,圖像分割的目的是將工業(yè)相機(jī)采集到的圖片中的農(nóng)產(chǎn)品準(zhǔn)確的提取出來(lái),為進(jìn)一步的尺寸測(cè)量,分類任務(wù)做好準(zhǔn)備。對(duì)于農(nóng)產(chǎn)品圖像分割算法來(lái)說(shuō),由于受到生產(chǎn)設(shè)備成像質(zhì)量,灰塵污漬,光照條件,陰影等外部因素影響,造成分割的不準(zhǔn)確。本文通過(guò)對(duì)比不同圖像分割算法,闡述各類算法的優(yōu)缺點(diǎn),以及各自合適的應(yīng)用場(chǎng)景。
闕值提取法是圖像分割中使用較為廣泛的方法,通過(guò)闕值的設(shè)置,將處于闕值區(qū)間內(nèi)的像素區(qū)域歸納為同一區(qū)域,從而分割圖像。此類算法的缺陷在于只考慮了目標(biāo)的灰度信息,從而缺少魯棒性。在這類算法中,如何獲取一個(gè)合理的闕值是算法成功的關(guān)鍵,手動(dòng)選取闕值無(wú)法具備通用性,易受環(huán)境變化的影響,主流的選取闕值的方法有最大類間方差法和最大熵闕值分割法。
最大類間方差法根據(jù)圖像的灰度特性尋找闕值,使分割出的圖像區(qū)域之間的差別最大,用于判斷分割圖像區(qū)域之間的差別是其各區(qū)域間的內(nèi)部方差。最大類間方差法極易受到噪音的影響,如陰影,但在單純背景條件下,適用于初步的獲取目標(biāo)物的位置。
最大熵闕值法與最大類間方差原理類似,將圖像通過(guò)信息熵分為不同區(qū)域。信息熵在混亂無(wú)序的系統(tǒng)中較大,在確定有序的系統(tǒng)中較小,根據(jù)信息熵的特性,可將圖像分割為不同的區(qū)域。徐海,秦立峰等人在黃瓜葉部角斑病提取任務(wù)中,使用最大類間方差法初分割,繼而使用最大熵發(fā)二次分割提取病蟲(chóng)害區(qū)域。
另外,彩色圖片中,使用色彩信息分割圖像也是常用的手段,常見(jiàn)的色彩信息表示方式有BGR 和HSV,通過(guò)設(shè)置色值區(qū)間可提取農(nóng)作物病變區(qū)域。其中,HSV(或者HSI)更為可靠,其更精確的表示同一視覺(jué)感受顏色在不同光照條件下的區(qū)間。但對(duì)于有些農(nóng)產(chǎn)品,如紅蘋果,紅棗等缺陷識(shí)別時(shí),病變區(qū)域R 色值區(qū)間會(huì)明顯異于正常區(qū)域,此時(shí)采用BGR 中的R 值作為闕值區(qū)別缺陷區(qū)域就是合適的。
邊緣檢測(cè)算法是一種經(jīng)典圖像分割算法,主要是利用連通區(qū)域邊緣對(duì)比度的階躍變化,通過(guò)其梯度變化找出邊緣,從而達(dá)到分割圖像的目的,相較于闕值法對(duì)環(huán)境光變化的容忍性更好。對(duì)于以矩陣形式存儲(chǔ)的圖像來(lái)說(shuō),采用模板矩陣(算子)對(duì)源圖像進(jìn)行卷積運(yùn)算是其提取梯度特征的通用方法。
Sobel 算子計(jì)算量較少,抗噪性較好且能保留邊緣的強(qiáng)弱,由一個(gè)用于提取水平方向特征和一個(gè)用于提取垂直方向的特征的算子組成。Sobel 算子十分適合用于提取農(nóng)產(chǎn)品方向性的特征,例如檳榔的紋路就能很好的被垂直方向的Sobel 算子提取出來(lái),通過(guò)紋路分布密度,進(jìn)行檳榔的分級(jí)任務(wù)。
Canny 算子相較于Sobel 算子更加復(fù)雜,能獲取更加精準(zhǔn)的邊緣且獲取到的邊緣不會(huì)虛化,抗噪性更好,但無(wú)法體現(xiàn)邊緣的強(qiáng)弱。Canny 算法適用于描述農(nóng)產(chǎn)品的褶皺程度,如紅棗中皮皮棗的篩選。文獻(xiàn)[4]采用了一種改進(jìn)的Canny 算子用于蘋果輪廓的提取。
綜上所述,相較于闕值法,邊緣檢測(cè)方法不僅限于提取粗略的輪廓信息,還可以用來(lái)提取更加細(xì)致的特征,常用于二次分割或配合闕值法使用。
基于深度學(xué)習(xí)的圖像分割方法,主要研究領(lǐng)域在于語(yǔ)義分割,即根據(jù)圖片內(nèi)容,將圖像分為多個(gè)有含義的部分,對(duì)于農(nóng)產(chǎn)品分類而言有著革命性的意義。
全卷積網(wǎng)絡(luò)FCN 是深度學(xué)習(xí)用于進(jìn)行圖像分割的先驅(qū),以分類模型AlexNet 為基礎(chǔ),將其最后3層全連接層轉(zhuǎn)化為反卷積層進(jìn)行上采樣,從而將輸出有特征分類轉(zhuǎn)化為區(qū)域特征熱力圖。
基于編碼解碼器結(jié)構(gòu)的圖像分割網(wǎng)絡(luò)雖然能在復(fù)雜背景及環(huán)境中基于特征分割出圖像區(qū)域,不過(guò)其提取的輪廓特征依然較為粗糙,不足為真實(shí)尺寸測(cè)量提供依據(jù),直到Mask RCNN 才做到了像素級(jí)圖像分割,為尺寸測(cè)量提供了依據(jù)。除此之外,Mask RCNN 將目標(biāo)檢測(cè)和語(yǔ)義分割結(jié)合,對(duì)農(nóng)產(chǎn)品尺寸測(cè)量及分類提供了指導(dǎo)性算法,也是目前研究?jī)?yōu)化的主要方向。
綜上所述,圖像分割算法是用于農(nóng)產(chǎn)品光電檢測(cè)分級(jí)分類的基礎(chǔ)任務(wù),傳統(tǒng)算法的優(yōu)勢(shì)在于結(jié)構(gòu)簡(jiǎn)單,效率高,但對(duì)復(fù)雜環(huán)境的適應(yīng)性較弱。深度學(xué)習(xí)方法受到環(huán)境影響較少,但需大量樣本支持,如何正確的獲取樣本,以及提高算法的整體效率是當(dāng)前需要解決的主要問(wèn)題。在實(shí)際使用中,深度學(xué)習(xí)由于性能問(wèn)題尚無(wú)法完全取代傳統(tǒng)算法,使用者可以根據(jù)具體的需求選擇合適的算法。