郭軍軍 鄭思林
(西安工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 西安 710021)
目前,施工現(xiàn)場(chǎng)的鋼筋等棒材在盤點(diǎn)時(shí)主要采用人工計(jì)數(shù)方法,這種方法效率低下,工作枯燥繁重,棒材計(jì)數(shù)員有時(shí)也會(huì)出現(xiàn)錯(cuò)誤計(jì)數(shù)現(xiàn)象。因此,棒材識(shí)別與自動(dòng)計(jì)數(shù)已成為一個(gè)亟需解決的重要問題。早在十幾年前就有許多計(jì)算機(jī)圖像處理等方面的學(xué)者提出了對(duì)捆扎棒材進(jìn)行拍照,并將所拍的數(shù)字圖像輸入計(jì)算機(jī)中,通過對(duì)數(shù)字圖像的處理來統(tǒng)計(jì)棒材數(shù)目。但是,這些方法實(shí)現(xiàn)起來十分復(fù)雜,計(jì)數(shù)精度和靈活度受限[1]?,F(xiàn)有的方法可概括為以下幾種:1)簡(jiǎn)單的形態(tài)學(xué)處理法[2~10]。形態(tài)學(xué)處理方法在對(duì)象和背景差異較大,并且處理對(duì)象表面光滑時(shí)能夠得到很好的計(jì)數(shù)結(jié)果。在實(shí)際應(yīng)用中(如不進(jìn)行刷漆、涂色等方式處理),棒材的端面形狀不一、表面粗糙,圖像的背景較為復(fù)雜。因此,僅僅使用形態(tài)學(xué)處理方法進(jìn)行計(jì)數(shù)時(shí)具有很大的局限性。2)圖像距離法[11~14]。該方法是利用幾何學(xué)圖形中心的概念,以圖形內(nèi)部到邊緣距離最大的點(diǎn)作為中心點(diǎn),但中心點(diǎn)需逐步確定,計(jì)算量大、速度慢,而且不適用于粘連比較嚴(yán)重的情況。因此,圖像距離法實(shí)用性較差。3)類霍夫圈計(jì)數(shù)法[15~16]。這種方法在圓形或類圓物體檢測(cè)統(tǒng)計(jì)上效果較為理想,但同時(shí)也存在一些不足,比如霍夫圈在類圓物體統(tǒng)計(jì)時(shí),需要一個(gè)條件提供物體半徑,然而感興趣區(qū)域中物體半徑通過數(shù)字圖像處理的方法極難獲得。同時(shí)為了滿足對(duì)更多類圓物體的統(tǒng)計(jì),需要調(diào)節(jié)部分參數(shù),這種調(diào)節(jié)無疑放寬了約束條件,使得不是目標(biāo)的物體也被統(tǒng)計(jì),從而造成計(jì)數(shù)結(jié)果偏差變大。
鋼筋等捆扎棒材在出廠時(shí)端面光潔、整齊,涂色均勻,色彩一致,很少出現(xiàn)凸出或凹入情況,棒材端面的圖像處理和識(shí)別計(jì)數(shù)較為容易。但經(jīng)多次搬運(yùn),長(zhǎng)時(shí)間露天堆放,棒材端面出現(xiàn)變色和參差不齊現(xiàn)象,棒材識(shí)別與自動(dòng)計(jì)數(shù)工作變得非常困難,現(xiàn)有的方法不能滿足棒材現(xiàn)場(chǎng)計(jì)數(shù)的要求。因此,本文提出了一種基于交互式圖像處理的施工現(xiàn)場(chǎng)棒材識(shí)別與計(jì)數(shù)方法。仿真結(jié)果表明,所提出的方法識(shí)別精度高、速度快,具有較強(qiáng)的適應(yīng)性和靈活性,能夠滿足施工現(xiàn)場(chǎng)對(duì)棒材的數(shù)目快速統(tǒng)計(jì)要求。
基于交互式圖像處理的棒材識(shí)別與計(jì)數(shù)處理流程圖見圖1所示。
圖1 棒材識(shí)別與計(jì)數(shù)處理流程圖
首先,利用內(nèi)置了高質(zhì)量攝像頭的智能手機(jī)等移動(dòng)電子設(shè)備在棒材堆放現(xiàn)場(chǎng)拍攝棒材端面圖像;在拍攝過程中或事后對(duì)圖像中典型的棒材進(jìn)行“圈點(diǎn)”操作,確定單根棒材端面的大致輪廓等圖像特征;由于棒材端面圖像中存在背景干擾信息和噪聲,因此,在識(shí)別與計(jì)數(shù)之前對(duì)原始圖像進(jìn)行數(shù)字圖像處理。經(jīng)過圖像二值化、濾波去噪、圖像分割和形態(tài)學(xué)處理之后,采用多閾值連通區(qū)域面積法對(duì)棒材端面分類計(jì)數(shù);最后在手機(jī)等移動(dòng)設(shè)備的顯示界面中輸出棒材計(jì)數(shù)結(jié)果。
在原始的棒材端面數(shù)字圖像中,由于背景復(fù)雜,噪聲干擾較大,移動(dòng)設(shè)備計(jì)算能力有限,對(duì)棒材的端面色彩、形狀和大小等特征進(jìn)行自動(dòng)化分析和提取較為困難。為了加快棒材現(xiàn)場(chǎng)計(jì)數(shù)的速度,借助人機(jī)交互方式提取棒材端面圖像特征。在拍攝圖像上,對(duì)典型的單根棒材圖像邊緣進(jìn)行簡(jiǎn)單的“圈點(diǎn)”操作,確定棒材端面色彩特征、單根棒材的面積和近似形狀,為后續(xù)圖像處理提供重要的輸入?yún)?shù)。值得注意的是,圈點(diǎn)的個(gè)數(shù)和位置由單根棒材的形狀特征和復(fù)雜性決定的,一般不少于2個(gè)圈點(diǎn)(如單根棒材為端面圓形或近似圓形)。在現(xiàn)場(chǎng)棒材拍攝界面上“圈點(diǎn)”操作見圖2所示,圖中箭頭所指向A和B點(diǎn)即為圈點(diǎn)位置。
圖2 棒材端面“圈點(diǎn)”操作圖
從移動(dòng)設(shè)備的攝像頭獲取的數(shù)字圖像受到光照、拍攝角度等外界因素影響,圖像中存在噪聲、變形、過度曝光和欠曝光現(xiàn)象,導(dǎo)致圖像質(zhì)量下降。因此,有必要對(duì)原始圖像進(jìn)行去噪處理,從而有效地抑制圖像中的噪聲,提高圖像質(zhì)量,并且最大限度保留原圖的棒材特征信息。經(jīng)去噪處理后的圖像需要進(jìn)一步執(zhí)行圖像分割操作。圖像分割的目的是從原始圖像中抽取感興趣區(qū)域(ROI)。二值化(Binarization)是圖像分割中常用的方法之一,二值化操作的本質(zhì)是選擇合適的門限規(guī)則將ROI和背景分離。本文中,將ROI即棒材端面像素值標(biāo)識(shí)為255,背景像素值記為0,從而實(shí)現(xiàn)圖像的二值化分割。棒材端面圖像的二值化公式見式(1)。
式(1)中,s(x,y)是二值化圖像的像素結(jié)果,原始圖像中紅(R)綠(G)藍(lán)(B)三通道對(duì)應(yīng)的像素值分量是 fR(x,y)、fG(x,y)和 fB(x,y),閾值的上下限 α·和β·是由圈點(diǎn)范圍內(nèi)棒材端面像素RGB分量?jī)?yōu)化結(jié)果確定的。
利用式(1)對(duì)圖2進(jìn)行二值化處理后得到的結(jié)果見圖3。
圖3 經(jīng)二值化處理后的圖像
從圖3中可以看到,二值化后的棒材端面圖像可能會(huì)出現(xiàn)空隙、蟲洞和小面積孤立區(qū)域,仍然難以直接進(jìn)行識(shí)別和計(jì)數(shù),因此需要進(jìn)行相關(guān)形態(tài)學(xué)處理,使其變得更加規(guī)整。膨脹運(yùn)算子可以使物體形狀變大,填補(bǔ)其中的細(xì)小的蟲洞和縫隙等;腐蝕運(yùn)算子可以將物體分離成若干個(gè)更小的獨(dú)立物體。通常,膨脹和腐蝕運(yùn)算結(jié)合使用,如先腐蝕再膨脹為開運(yùn)算,而先膨脹再腐蝕為閉運(yùn)算。由于實(shí)際圖像像素較為復(fù)雜,經(jīng)常會(huì)在目標(biāo)區(qū)域中出現(xiàn)一些不滿足特征的小區(qū)域,雖然這些小區(qū)域未被提取,由于其周圍均為目標(biāo)區(qū)域,所以可以認(rèn)為這些小區(qū)域也是目標(biāo)區(qū)域的一部分,通過閉操作將其融合為一個(gè)整體,因此,本文采用閉運(yùn)算進(jìn)行棒材端面的初步形態(tài)學(xué)處理。閉運(yùn)算處理只能消除目標(biāo)區(qū)域內(nèi)部的蟲洞,對(duì)于非目標(biāo)區(qū)域的小斑點(diǎn)還是無法消除,此時(shí)還需要對(duì)圖像在進(jìn)行二次腐蝕操作,消除周圍的斑點(diǎn),這樣使得圖像中各個(gè)目標(biāo)區(qū)域盡可能地獨(dú)立起來,形成數(shù)個(gè)連通區(qū)域,以方便棒材的識(shí)別和計(jì)數(shù)。
在數(shù)字圖像的形態(tài)學(xué)處理中,確定膨脹和腐蝕因子的大小是一個(gè)關(guān)鍵問題。由于現(xiàn)場(chǎng)拍攝時(shí)方位、角度和成像時(shí)鏡頭焦距未知,僅通過圖像處理的方法極難獲取單個(gè)棒材的幾何特征信息。因此,通過用戶“圈點(diǎn)”中獲得單根棒材的外觀輪廓和尺寸。以圖2為例,假定用戶圈點(diǎn)位置為 A(x1,y1)和B(x2,y2),圖像中單根棒材的近似半徑r由以下式(2)求得。根據(jù)人機(jī)交互得到的圖像特征,可以進(jìn)一步優(yōu)化選擇圖像膨脹和腐蝕的大小,圖4是圖2經(jīng)閉運(yùn)算和二次腐蝕得到的數(shù)字圖像。
圖4 形態(tài)學(xué)處理(左圖為閉操作,右圖為二次腐蝕操作)
為了提高計(jì)數(shù)精度,本文采用多閾值連通區(qū)域面積法對(duì)棒材進(jìn)行計(jì)數(shù)。經(jīng)交互式圖像處理后,棒材端面已經(jīng)形成連通區(qū)域。由于多次離散化操作導(dǎo)致這些像素點(diǎn)不能真實(shí)地反應(yīng)出棒材端面的面積,因此不能簡(jiǎn)單地將ROI的像素直接相加來確定棒材端面面積,為了減少誤差,提高計(jì)數(shù)精度,在求ROI區(qū)域面積或單根棒材面積時(shí)采用如下加權(quán)公式(3):
假定棒材連通區(qū)域面積為T,T1為單根棒材最小面積閾值,T2作為單根標(biāo)準(zhǔn)棒材斷面面積閾值,T3最大連通子域面積閾值,參數(shù) ρ(0≤ρ≤1)為填充因子,用于抑制空隙面積,棒材總數(shù)n可由式(4)完成計(jì)數(shù)。
在Android平臺(tái)上,采用JAVA語(yǔ)言實(shí)現(xiàn)了一個(gè)基于交互式圖像處理的棒材計(jì)數(shù)APP。該APP可以實(shí)現(xiàn)在線攝像頭抓拍和離線圖像的棒材識(shí)別與計(jì)數(shù),支持用戶動(dòng)態(tài)交互功能,實(shí)現(xiàn)快速計(jì)數(shù)目的。棒材計(jì)數(shù)APP部分操作界面如圖5所示。
圖5 獲取棒材端面圖像界面(左圖為從本地相冊(cè)選圖,右圖為調(diào)用攝像頭拍照)
為了驗(yàn)證本文提出方法的正確性和有效性,本文選取了10組典型的施工現(xiàn)場(chǎng)鋼筋圖像,其中有7組為剪切工藝,另外3組為鋸切工藝,鋼筋直徑范圍1.2cm~9.0cm,圖像大小限制到800*800像素,棒材計(jì)數(shù)APP安裝在華為Mate 8手機(jī)上,其操作系統(tǒng)為Android OS6.0,實(shí)驗(yàn)結(jié)果見表1所示。表中識(shí)別誤差ε= | (m-n)/m|×100%,m表示棒材實(shí)際數(shù)目,n為計(jì)數(shù)APP得到的結(jié)果。
表1 實(shí)驗(yàn)結(jié)果
從表1可以看出,鋼筋計(jì)數(shù)精度極高,最低識(shí)別精度84.0%,最高可達(dá)100%;APP計(jì)數(shù)速度快,平均識(shí)別速度約0.5s,基本滿足施工現(xiàn)場(chǎng)對(duì)棒材的計(jì)數(shù)要求。
本文提出的基于交互式圖像處理的棒材計(jì)數(shù)系統(tǒng)具有較強(qiáng)的適應(yīng)性、穩(wěn)定性和準(zhǔn)確性。實(shí)驗(yàn)表明該計(jì)數(shù)方法具有一定的抗干擾能力,計(jì)數(shù)APP操作簡(jiǎn)單,用戶只需要在處理之前進(jìn)行簡(jiǎn)單的“圈點(diǎn)”操作即可完成交互任務(wù),不僅可以準(zhǔn)確得出棒材數(shù)目而且能夠極大地減輕計(jì)數(shù)人員的工作量。今后將對(duì)該計(jì)數(shù)系統(tǒng)進(jìn)一步優(yōu)化,并應(yīng)用到木材、鋼材等棒材生產(chǎn)、加工、流通等領(lǐng)域。