侯維巖 侯兆陽
(鄭州大學信息工程學院,河南 鄭州 450001)
扎捆棒材的圖像識別計數(shù)算法
侯維巖侯兆陽
(鄭州大學信息工程學院,河南 鄭州450001)
摘要:為了快速獲得扎捆棒材的數(shù)量,在大量觀測和實驗的基礎(chǔ)上,提出一種動態(tài)獲取棒材形態(tài)學直徑的方法;根據(jù)扎捆棒材的形態(tài)學分布,提出“米”字形搜索算法(RSS算法)和一種覆蓋原則。先對棒材截面圖像進行灰度化處理,然后根據(jù)灰度圖片的灰度直方圖兩峰一谷的特點得到圖片的全局閾值,將灰度棒材圖片二值化;再對二值圖片進行膨脹、腐蝕操作削弱粘連;最后基于二值圖片,利用RSS算法進行計數(shù)?,F(xiàn)場采集扎捆棒材的計數(shù)實驗驗證了該算法的有效性、可靠性和準確性。在加入人工矯正環(huán)節(jié)后,棒材計數(shù)準確度達到100%。試驗結(jié)果表明,在計數(shù)對象滿足兩個分布特征的情況下,該算法都可以實現(xiàn)高準確度的計數(shù)。
關(guān)鍵詞:扎捆棒材形態(tài)學“米”字形搜索(RSS)智能分割人工矯正圖像處理圖像識別
0引言
在扎捆棒材的流通過程中,傳統(tǒng)稱重方法人力消耗大,且不容易操作,人工計數(shù)往往效率低下。目前,還沒有一種方法能實現(xiàn)對棒材數(shù)量的快速準確計量,這給物流和用戶帶來許多不便。因此,對扎捆棒材的精確計數(shù)成為一個亟待解決的問題。
隨著數(shù)字圖像處理技術(shù)和CCD技術(shù)的發(fā)展,從扎捆棒材截面的圖像中計算獲取棒材的數(shù)量成為目前常見的方法,但這些方法都有不同的缺點。極限腐蝕法[1]雖然解決了棒材的粘連問題,但是腐蝕導致了棒材的形變,更嚴重的是過腐蝕可能腐蝕一部分棒材,從而導致漏計數(shù)。模板匹配法[2]和十字模板搜索法[3]的搜索間隔大小的選取嚴重影響算法的性能。較大的間隔可能導致漏計數(shù);較小的間隔可能導致搜索太慢,并降低算法的有效性,而且匹配模板的大小無法確定。文獻[3]提出的手動指定的模板大小往往也不精確。常見的棒材類圓識別、圓形度檢測[4]、凹度檢測[5],由于計算量過大、算法復雜度高,將導致整個識別計數(shù)過程緩慢。
本文在大量觀測和實驗的基礎(chǔ)上,提出一種動態(tài)獲取棒材形態(tài)直徑的方法和一種基于扎捆棒材形態(tài)學分布的快速計數(shù)米字形搜索(rice shape searching,RSS)算法。
1算法的概述
根據(jù)觀察,扎捆棒材具有以下兩個形態(tài)分布特征。
(1)每根棒材的形態(tài)學參數(shù)相似,例如形態(tài)學直徑φ相近,截面近似圓形。
(2)每根棒材和周圍棒材緊密堆疊,每根棒材周圍有4~8根棒材,且中心棒材和周圍棒材的距離都為棒材的形態(tài)直徑。如果以直徑搜索將大大節(jié)省搜索時間。
由以上兩個分布特征,可獲取棒材的形態(tài)學直徑φ;再以φ為半徑,用RSS算法搜索棒材并用正八邊形模板覆蓋和計數(shù)。算法核心步驟如下。
①動態(tài)獲得棒材的形態(tài)直徑φ,給正八邊形模板覆蓋提供參考。
②隨機找到一個出現(xiàn)棒材的位置(最好在圖片的中心位置),棒材數(shù)量加1,用正八邊形模板覆蓋此棒材出現(xiàn)的區(qū)域(此處的覆蓋只是防止重復檢測),標記棒材位置。
③在上一步找到的棒材的周圍,以半徑φ“米”字形搜索周圍出現(xiàn)棒材的位置。如果找到出現(xiàn)棒材的位置,棒材數(shù)量加1,覆蓋出現(xiàn)棒材的位置,標記新出現(xiàn)的棒材位置,供下一步使用。
④不斷重復步聚③,直到搜索不到新的棒材。
⑤算法退出。
找到棒材的精確幾何中心位置,實現(xiàn)對已找到棒材的準確、完全覆蓋。這樣可以提高結(jié)果的正確性,且對其他棒材的準確搜索和找到形態(tài)學尺寸具有重要意義。尤其是對于棒材有粘連的情況,如果把其中一個棒材準確覆蓋,那么對另一根棒材來說已經(jīng)不存在粘連了,因此,完整、準確地覆蓋其中一根棒材,就可以把粘連的棒材分離。
在實驗中使用了“米”字形搜索的方式,原因如下。
①根據(jù)大量觀測知道,每根棒材周圍有4~8根棒材。
②提高算法的冗余,防止漏檢,提升算法的魯棒性。
③“米”字形搜索的鄰域相對于中心位置特殊,計算簡單。
圖1為棒材的形態(tài)學參數(shù)示意圖。
圖1 棒材的形態(tài)學參數(shù)示意圖
圖1中,MN、HG為分割線。
理想情況下,形態(tài)學參數(shù)為:棒材中心O1的坐標位置(xcenter,ycenter),棒材的橫向最大尺寸xLength=LAB,棒材的縱向最大尺寸yLength=LCD。對于有粘連的棒材,LEF、LPQ也包含了一定的信息量,可以據(jù)此判斷出是縱向粘連還是橫向粘連,從而加以智能分割,然后再對分割后的類圓棒材進行判斷。
2算法流程
圖2為算法整體流程圖。先讀取圖片,選擇感興趣的區(qū)域,進行灰度化和二值化處理,腐蝕膨脹操作可以消除一部分粘連;然后獲取棒材的形態(tài)學直徑φ,用RSS算法搜索并覆蓋已經(jīng)找到的棒材;最后加入人工矯正并顯示結(jié)果。
圖2 計數(shù)算法整體流程圖
圖3 為“米”字形搜索示意圖,0位置處是隨機找到的,或者由上一步提供的位置信息。
圖3 “米”字形搜索示意圖
“米”字形搜索就是以棒材的形態(tài)學直徑為半徑,在0位置的周圍8個位置搜索新的棒材位置。假設(shè)0處的位置為(xcenter,ycenter),構(gòu)造矩陣:
(1)
圖3中,1~8處中心位置g(i)為:
g(i)=[xcenter+RM(i,1),ycenter+RM(i,2)]
(2)
式中:i=1~8;g(i)為第i個點的坐標。
“米”字形搜索實驗示意圖如圖4所示。
圖4 “米”字形搜索實驗示意圖
圖4中,中心位置O是第一層隨機找到的或者上一層提供的棒材位置,然后以φ為半徑,在它的8個臨域內(nèi)搜索。如果找到新的棒材,則棒材數(shù)目加1,覆蓋此處棒材,記錄棒材位置供下一層使用。圖4中,在O周圍搜索到了5根棒材并加1覆蓋,防止重復計數(shù)。A處判斷沒有棒材,原因是A和左邊的棒材存在橫向粘連,需要分割后再判斷。
3算法的具體實現(xiàn)
3.1獲取灰度圖片
從照相機或者攝像頭得到的是一張RGB圖片,用R、G、B分別表示圖片中一個像素的紅色分量、綠色分量、藍色分量,則該像素處的灰度值可由下式得到:
f(i,j)=0.3R(i,j)+0.59G(i,j)+0.11B(i,j)
(3)
3.2灰度圖片二值化
閾值法[6]是一種簡單而且有效的二值化方法。根據(jù)圖片中前景和背景的區(qū)別,選擇適當?shù)拈撝?,可以濾除背景,保留前景。通過灰度圖像的直方統(tǒng)計圖[3],可以很直觀地得到圖片的二值化閾值。
灰度圖像的直方圖如圖5所示。
圖5 灰度圖像的直方圖
如圖5所示,灰度圖片的直方統(tǒng)計圖呈現(xiàn)兩峰一谷,從而可以很直觀地獲知此圖片的二值化閾值在60左右。根據(jù)全局閾值,將圖片二值化。
3.3動態(tài)獲取棒材形態(tài)學參數(shù)φ
此處φ是動態(tài)的、全局的、具有統(tǒng)計意義的棒材形態(tài)學直徑φ(單位為像素)。作用是為“米”字形搜索提供參考半徑、智能判斷和正八邊形模板參考。獲得φ的方法是多次測量求平均值。獲得棒材形態(tài)學參數(shù)如圖6所示。
圖6 獲得棒材形態(tài)學參數(shù)示意圖
①如圖6所示,在二值圖像上面隨機找到一個點M,然后上下延伸到棒材的邊緣,記錄AB的長度,找到AB的中點。
②在AB的中點處左右延伸到棒材的邊緣,記錄CD的長度為xLength和中點xcenter。
③在CD的中點處上下延伸到棒材的邊緣,記錄EF的長度為yLength和中點ycenter。
④對xLength、yLength求平均,得到此處棒材的形態(tài)學直徑φ,保存φ。
⑤重復以上步驟,待找到一定數(shù)量的φ后,去掉最大的和最小的,對剩下的φ求平均,得到全局的具有統(tǒng)計意義的φ。
“米”字形搜索算法實現(xiàn)如圖7所示。第一層隨機找到一個棒材位置A,進行“米”字形搜索,搜索到4個棒材;然后在這4個棒材的位置進行“米”字形搜索。依次類推,直到第N-1層不能再找到新的棒材位置,即第N層不能再搜索,算法退出。
圖7 “米”字形搜索算法實現(xiàn)
3.4RSS算法的具體實現(xiàn)
在具體實現(xiàn)上,定義兩個矩陣:數(shù)量矩陣NM[N]、位置矩陣LM[N][K][2]。其中,數(shù)量矩陣是1維的,存儲每1層的棒材數(shù)量信息;位置矩陣是3維的,存儲每1層找到的每一個棒材的位置信息,供下一層使用。例如LM[2][2][1]表示第2層第2個棒材的橫坐標,NM[2]表示第2層的所有棒材數(shù)量。其中N是算法搜索的層數(shù),K是每一層搜索到的棒材數(shù)量。通過數(shù)量矩陣,可以知道一共找到的棒材數(shù)量。這里的N、K都是無法預(yù)知的,算法運行的層數(shù)N無法預(yù)測,并且每一層的值是不同的。具體操作流程如下。
①初始化第1層,隨機找到一個棒材位置,設(shè)置第1層的數(shù)量矩陣(第一層的棒材數(shù)量為1)和位置矩陣。
②判斷上一層提供的棒材數(shù)量是否為0,如果是0,搜索結(jié)束,進入第⑤步;如果不是0,進入第③步。
③進入m層,利用m-1層提供的位置信息和數(shù)量信息,遍歷所有m-1層找到的棒材;“米”字形搜索,每找到一個棒材位置,更新本層棒材數(shù)量,設(shè)置新找到棒材的位置信息,并且覆蓋找到的棒材位置,防止重復搜索。
④返回第②步。
⑤計算棒材數(shù)量,顯示棒材數(shù)量和計數(shù)用時,退出算法。
3.5智能判斷
由于棒材的裁剪工藝、棒材之間的互相遮擋、拍照時的傾斜對圖片中棒材的拉伸變形以及棒材的腐蝕等原因,造成二值圖像中的棒材不是理想的圓形,可能是壓扁的橢圓棒材或幾個棒材粘連在一起。那么怎么知道是否找到了一個棒材,下面提出了一個理想棒材的判斷準則和粘連棒材的判斷準則。
準則1:如果0.5φ 準則2:如果xLength≥1.4φ,則判斷此處存在橫向粘連棒材;如果yLength>1.4φ,則判斷此處存在縱向粘連棒材。 如果在搜索的過程中發(fā)現(xiàn)粘連棒材,則先根據(jù)是縱向粘連或者是橫向粘連進行分割,然后在此處搜索判斷。此方法也在仿真中得到了很好的驗證。 4實驗結(jié)果 為驗證算法的正確性,現(xiàn)場獲取了棒材圖片,實驗結(jié)果如圖8所示。由圖8可以看出,在存在干擾的情況下,RSS算法實現(xiàn)了準確的覆蓋和計數(shù),體現(xiàn)了“米”字形搜索算法的高效性、準確性。 圖8 棒材計數(shù)結(jié)果 從圖8可以直觀地發(fā)現(xiàn):RSS算法檢測到了所有的棒材,如果有漏檢,可以很容易地發(fā)現(xiàn)并通過人工矯正。此次仿真檢測到68根棒材,用時0.98 s,沒有對干擾進行誤判。一些水平或豎直的分割線反映了RSS算法的智能分割功能。RSS算法實現(xiàn)了100%的棒材計數(shù)。 對其他尺寸棒材的實驗結(jié)果及性能評價見表1。實驗發(fā)現(xiàn),直徑小的對象,識別時間和識別率指標有所下降。這是所有圖像識別算法的共同問題[7-16]。針對此問題,可以加入人工矯正環(huán)節(jié)。 表1 實驗結(jié)果及性能評價 在棒材圖片的采集過程中,采集者與棒材的角度和距離因人而異,所以棒材的真實尺寸已經(jīng)失去了原有的意義。因此,為了對比算法的性能,實驗控制棒材的形態(tài)學直徑φ近似相等。通過改變實驗對象中棒材的數(shù)量,探討實驗的檢測率和實驗用時,從而得出結(jié)論。如表1所示,實驗控制棒材的形態(tài)直徑φ在50像素左右,此值是算法每次動態(tài)獲取的,和真實值有一定的浮動。表1中記錄了棒材直徑φ、檢測數(shù)量、計數(shù)用時,計算了檢測率,驗證了算法的有效性、可靠性。 5結(jié)束語 本文根據(jù)扎捆棒材的兩個分布特征,提出了RSS搜索算法和動態(tài)獲取棒材形態(tài)學直徑φ的方法,給出了本文中用到的形態(tài)學參數(shù),設(shè)計實驗驗證了算法的準確性、可靠性和有效性,并在嵌入式設(shè)備上得到實現(xiàn)。只要計數(shù)對象滿足本文中提到的兩個分布特征,均可以用此方法實現(xiàn)其他對象的快速準確計數(shù),如醫(yī)學病理檢測中的細胞計數(shù)。 參考文獻 [1] 安軍鋒,任吉堂.在線棒材計數(shù)系統(tǒng)現(xiàn)狀與研究[J].中國冶金,2007,17(11):1-5. [2] 周群,胡光銳.基于模板覆蓋法的鋼筋在線計數(shù)方法[J].上海交通大學學報,1999,4(5):559-564. [3] 侯維巖,張利偉,黨蟒,等.一種基于圖像處理的棒材計數(shù)測量系統(tǒng)的設(shè)計與實現(xiàn)[J].儀器儀表學報,2013,34(5):1100-1106. [4] 羅三定,肖飛.不規(guī)則類圓形團塊目標圖像識別的新方法[J].中南大學學報,2004,35(4):632-637. [5] 趙欣欣.生物組織纖維圖像中的細胞計數(shù)方法[D].武漢:華中科技大學,2012. [6] 梁華為.直接從雙峰直方圖確定二值化閾值[J].模式識別與人工智能,2002,15(2):253-255. [7] 張達,謝植,艾江山.棒材在線計數(shù)中斷面定位方法研究[J].儀器儀表學報,2010,31(5):1173-1178. [8] Wang Tingmei ,Chen Ge,Guan Hui.An improved filling algorithm for image with complicated closed edges[C]//International Conference on Information Technology for Manufacturing Systems,2010:894-897.[9] 左敏,曾廣平,涂序彥,等.基于等價對的圖像連通域標記算法[J].計算機仿真,2011,28(1):14-16. [10] 張久權(quán),金友仲.一種新興棒材計數(shù)裝置設(shè)計[J].制造業(yè)自動化,2011,33(1):127-128. [11] 段政偉.面向扎捆棒材計數(shù)系統(tǒng)的圖像預(yù)處理算法研究[D].鄭州:鄭州大學,2012. [12] Wang T N,Wan Q L,Philip O.An improved template matching method for object detection[C]//Lecture Notes in Computer Science,Asian Conference on Computer Vision,2010:193-202. [13] 黃玲,齊保謙,胡波.基于圖像連通區(qū)域面積的成捆棒材自動計數(shù)方法[J].工礦自動化,2012,38(5):77-79. [14] 陶兆勝,屠大維.基于圖像幾何靜矩陣的機器視覺基礎(chǔ)矩陣估計[J].儀器儀表學報,2011,32(8):1776-1780. [15] 陳浩,王景中,姚光明.基于類圓分割的棒材計數(shù)圖像識別[J].工程圖學學報,2004,25(4):98-103. [16] 薛彥冰.基于機器視覺的棒材計數(shù)系統(tǒng)的研究和實現(xiàn)[D].濟南:山東大學,2014. Counting Algorithm Based on Image Recognition for Bundled Bar Abstract:In order to quickly obtain the number of the lash bar,the method of dynamically obtaining the morphology diameter of the lash bar is put forward on the basis of a large number of observations and experiments.According to the morphological distribution of the lash bar,the rice shape searching(RSS) algorithm and coverage principle is proposed.Firstly,gradation processing is conducted for section image of rod,then,according to the global threshold of the image is obtained in accordance with the two peaks one valley characteristics of the gray histogram of the gray scale image to get the binarization image,and then the adhesions is weakened by operations of expansion and corrosion,finally based on binarized image the RSS algorithm is used for counting.The experiments on site prove the validity,reliability and accuracy of this algorithm.The accuracy of bar counting is up to 100% when manual correction is added.The result of test shows that the conclusion is highly accurate counting can be implemented if the objects satisfy the two distribution features mentioned. Keywords:Lash barMorphologyRice shape searching(RSS)Intelligent segmentationManual correctionImage processingImage recognition 中圖分類號:TH74;TP29;TP313 文獻標志碼:A DOI:10.16086/j.cnki.issn1000-0380.201605008 修改稿收到時間:2015-08-16。 第一作者侯維巖(1964-),男,2004年畢業(yè)于上海大學控制理論與控制工程專業(yè),獲博士學位,教授;主要從事分布式智能控制、無線通信和數(shù)字圖像處理方向的研究。