余善好
(安徽三聯(lián)學(xué)院,安徽 合肥 230601)
中國是個(gè)以重工業(yè)發(fā)展為主的大國,為加大生產(chǎn)量,保證國家GDP,將工業(yè)推向自動(dòng)化是必要手段,在大力發(fā)展工業(yè)的同時(shí),井下作業(yè)往往具有事故風(fēng)險(xiǎn),無法保障人員安全,為此井下人員和設(shè)備定位技術(shù)在保障煤礦安全生產(chǎn)方面起著至關(guān)重要的作用。煤礦行業(yè)越來越重視礦井人員的定位技術(shù)[1]。為了確保圖像的清晰度,井下行人目標(biāo)的準(zhǔn)確定位尤為重要。定位精度直接關(guān)系到煤礦的生產(chǎn)效果[2],且煤礦發(fā)展在要求精度的同時(shí)也需要加快生產(chǎn)效率,因此如何快速且準(zhǔn)確的將井下行人目標(biāo)進(jìn)行定位是目前需要研究的問題[3]。
李清泉[4]提出單目視覺的室內(nèi)多行人目標(biāo)連續(xù)定位方法,構(gòu)建像素坐標(biāo)系到世界坐標(biāo)系的坐標(biāo)轉(zhuǎn)換模型,并結(jié)合卡爾曼濾波和匈牙利算法實(shí)現(xiàn)對多行人目標(biāo)的連續(xù)定位與跟蹤,實(shí)現(xiàn)井下行人目標(biāo)快速定位。韓江洪[5]等人提出基于深度學(xué)習(xí)的井下巷道行人視覺定位算法,基于深度學(xué)習(xí)網(wǎng)絡(luò)的系統(tǒng)整體結(jié)構(gòu);其次,搭建目標(biāo)檢測多層卷積神經(jīng)網(wǎng)絡(luò)(CNN),生成自主駕駛機(jī)車前方視野范圍內(nèi)行人的二維坐標(biāo)及邊界框的尺寸;再次,通過多項(xiàng)式擬合計(jì)算出圖像中行人到機(jī)車之間的第三維距離;最后,通過真實(shí)樣本集實(shí)施模型訓(xùn)練,實(shí)現(xiàn)井下行人目標(biāo)快速定位。田強(qiáng)[6]等人直接將非線性定位問題轉(zhuǎn)換成井下行人目標(biāo)位置的加權(quán)最小二乘估計(jì)問題,并將最小二乘估計(jì)分成兩步進(jìn)行求解,首先基于最小二乘準(zhǔn)則將元件未發(fā)射的信號(hào)轉(zhuǎn)化為目標(biāo)位置函數(shù),同時(shí)將代價(jià)函數(shù)中未發(fā)射信號(hào)進(jìn)行消除,其次在凸松弛技術(shù)的基礎(chǔ)上直接利用半正定規(guī)劃問題代替代價(jià)函數(shù),最終計(jì)算出目標(biāo)圖像的位置,實(shí)現(xiàn)井下行人目標(biāo)快速定位。以上三種算法在進(jìn)行井下行人目標(biāo)定位過程中沒有對井下行人目標(biāo)進(jìn)行粗定位,同樣未對目標(biāo)圖像進(jìn)行邊緣分割處理,導(dǎo)致圖像邊緣不清晰,誤差過大,存在圖像匹配能力差、邊緣分割性能差以及定位偏差大的問題。
為了解決上述方法中存在的問題,提出基于改進(jìn)Otsu算法的井下行人目標(biāo)快速定位算法。
在利用激光儀器獲取圖像時(shí),為保證圖像清晰需將井下行人目標(biāo)進(jìn)行準(zhǔn)確定位,因此需要提前對目標(biāo)進(jìn)行粗定位以及邊緣分割[7-8]。
對于圖像來說,都需要利用最有效的方法大致定位出該區(qū)域位置,并將其視為目標(biāo)區(qū)域,粗定位的意義就是獲取該目標(biāo)區(qū)域,現(xiàn)今粗定位的最優(yōu)辦法就是模板匹配算法,該算法的原理就是將兩組在不同環(huán)境下的圖像進(jìn)行比較,留下兩組圖像中最相似的部分。
模型匹配的效率高低最主要的影響因素就是兩組圖像的平移個(gè)數(shù),因此為提高運(yùn)算效率,可利用隔點(diǎn)取樣方法將準(zhǔn)備進(jìn)行對比的圖像尺寸減小,其原理如圖1所示。
圖1 隔點(diǎn)取樣
隔點(diǎn)取樣雖可提高運(yùn)算效率,但同時(shí)因?yàn)閳D像梯度值的增大導(dǎo)致圖像重要信息丟失,因此需要通過平滑濾波處理獲取更多尺度圖像,選取高斯濾波方法保證處理后的圖像不會(huì)出現(xiàn)局部極值點(diǎn),高斯函數(shù)表達(dá)式如式(1)所示。
G(xi,yj)=(1/2πσ2)e
(1)
式(1)中,G(xi,yj)代表卷積模板內(nèi)(xi,yj)相對應(yīng)的權(quán)重值大小,σ代表高斯濾波器的方差。
通過隔點(diǎn)采樣處理后的圖像可將其中的鋸齒現(xiàn)象完全消除,將圖像進(jìn)行高斯平滑以及采樣處理后即可利用NCC算法進(jìn)行圖像匹配[9-10]。
NCC算法是通過兩圖像之間的相關(guān)性得出圖像相似度從而進(jìn)行匹配的一種方法,令該算法中相關(guān)性為R(i,j),其波動(dòng)范圍為[0,1],則相關(guān)性R(i,j)的計(jì)算方程式如式(2)所示。
(2)
式(2)中,E(T)代表模板圖像的均值,T代表模板圖像,Si,j代表準(zhǔn)備匹配的圖像,E(Si,j)代表Si,j的平均數(shù)值,s代表原始圖像的灰度分割閾值,t代表相鄰圖像的灰度分割閾值。
利用式(2)計(jì)算出兩圖像中相似度最大的匹配點(diǎn)進(jìn)而完成匹配,即提取出在范圍[0,1]中相關(guān)性最大的點(diǎn)完成匹配。
圖像的邊緣分割也叫邊緣檢測,這是一種處理圖像清晰度的手段,其目的是將圖像邊緣清晰化,提取圖像邊緣點(diǎn),為保證處理圖像過程中無其他噪聲進(jìn)入圖像,選用Otsu算法進(jìn)行圖像分割,它是通過原始圖像以及相鄰圖像生成二維直方圖[11]。
假設(shè)原始圖像為f(x,y),相鄰平滑圖像為g(x,y),令原始圖像的大小為M×N,原始圖像以及相鄰圖像的灰度值大小均為L,進(jìn)而生成二維直方圖,則二維連接概率密度表達(dá)式如式(3)所示。
(3)
式(3)中,fij代表原始圖像f(x,y)內(nèi)像素點(diǎn)灰度值i和相鄰圖像像素點(diǎn)平均灰度j可匹配到相同位置的像素點(diǎn)數(shù)量,L代表兩圖像的灰度值,其中i≥0,j≤L-1。
相鄰平滑圖像g的灰度等級(jí)的計(jì)算公式如式(4)所示。
(4)
式(4)中,g(m,n)代表灰度等級(jí),k代表相鄰圖像像素點(diǎn)中為正方形區(qū)域的寬度值。
若利用閾值s和t對圖像進(jìn)行分割,劃分成背景和目標(biāo)圖像兩部分,則在整幅圖像中目標(biāo)圖像和背景各占圖像大小的表達(dá)式如式(5)所示。
(5)
式(5)中,ωb代表背景所占整幅圖像比例,ωo代表目標(biāo)圖像所占整幅圖像比例,且ωo+ωb=1。
因此得出背景與目標(biāo)圖像相對應(yīng)的均值矢量表達(dá)式如式(6)所示。
(6)
式(6)中,μ0代表背景相對應(yīng)的均值矢量,μb代表目標(biāo)圖像相對應(yīng)的均值矢量,Pij代表二維連接概率密度值。則整幅圖像的均值公式如式(7)所示。
(7)
此時(shí)可根據(jù)離散度矩陣對圖像進(jìn)行處理,在背景與目標(biāo)圖像的均值和所占圖像比例得出離散度矩陣的公式如式(8)所示。
σB={ωo[(μo-μ)(μo-μ)]+
ωb[(μb-μ)(μb-μ)]}
(8)
式(8)中,σB代表圖像的離散度。
利用σB的跡計(jì)算目標(biāo)圖像以及背景與目標(biāo)之間距離,其表達(dá)式如式(9)所示。
tr(σB)=[ωb[(μb2-μ1)2+(μb1-μ1)2]+
ωo[(μo2-μ2)2+(μo1-μ2)2]]
(9)
式(9)中,tr(σB)代表圖像與目標(biāo)之間的距離。
為保證井下行人目標(biāo)的精確定位,需保證閾值(s,t)為最優(yōu),則需要取tr(σB)的最大值即可,并通過最優(yōu)閾值將圖像進(jìn)行分割,保證最終獲取高精度的邊緣圖像。
進(jìn)行邊緣分割后所獲取的圖像就是二值圖像,為進(jìn)一步縮小目標(biāo)圖像,可對目標(biāo)圖像進(jìn)行識(shí)別,通過連通區(qū)域標(biāo)記法將同一區(qū)域的像素點(diǎn)進(jìn)行連接[12],連接后求解出該區(qū)域的相應(yīng)參數(shù),最終根據(jù)目標(biāo)圖像屬性提取目標(biāo)圖像。將識(shí)別出的目標(biāo)圖像進(jìn)行精確定位,首先將圖像的大致輪廓進(jìn)行擬合,最后提取出其圓心坐標(biāo)即可實(shí)現(xiàn)井下行人目標(biāo)的定位[13]。
目前最優(yōu)的圖像擬合方法就是最小二乘法圓擬合,假設(shè)目標(biāo)圖像為(xi,yi),擬合的圓心為(xc,yc),由于最小二乘法圓擬合的原理就是計(jì)算出擬合圓心到圖像點(diǎn)之間距離平方差[14],并使得距離平方差f為最小,其表達(dá)式如式(10)所示。
(10)
式(10)中,N代表目標(biāo)圖像中點(diǎn)的個(gè)數(shù),r代表擬合圓的半徑。
對半徑進(jìn)行偏導(dǎo)數(shù)計(jì)算[15],得出其表達(dá)式如式(11)所示。
r2=(y-y0)2+(x-xc)2
=y2-2ycy+yc2+x2-2xcx+xc2
(11)
假設(shè)擬合圓中參數(shù)a、b和c的表達(dá)式如式(12)所示。
(12)
進(jìn)而得出擬合圓的曲線方程式[16]如式(13)所示。
x2+y2+ax+by+c=0
(13)
則目標(biāo)圖像中點(diǎn)(xi,yi)到圓心的平方表達(dá)式如式(14)所示。
(14)
式(14)中,di代表點(diǎn)(xi,yi)和擬合圓心的距離。
=xi2+yi2+axi+byi+c
(15)
令Q(a,b,c)是δi的平方和,其表達(dá)式如式(16)所示。
(16)
根據(jù)上述求解出的偏導(dǎo)數(shù)得出其極值條件如式(17)所示。
(17)
式(17)中,C、D、E、G和H代表偏導(dǎo)數(shù)的極限點(diǎn),?代表坐標(biāo)以及半徑的約束條件。根據(jù)極值條件得出圓的坐標(biāo)以及半徑,其表達(dá)式如式(18)所示。
(18)
式(18)就是需要定位的井下行人目標(biāo)的坐標(biāo)以及半徑。
為了驗(yàn)證基于改進(jìn)Otsu算法的井下行人目標(biāo)快速定位算法的整體有效性,分別采用本文所提算法、李清泉[4]提出的單目視覺的室內(nèi)多行人目標(biāo)連續(xù)定位方法(以下統(tǒng)稱為算法一)和韓江洪等人[5]提出的基于深度學(xué)習(xí)的井下巷道行人視覺定位算法(以下統(tǒng)稱為算法二)進(jìn)行圖像匹配能力、邊緣分割性能以及定位偏差的測試,測試結(jié)果如下。
隨機(jī)選取3幅需要匹配的圖像與模板進(jìn)行匹配,其中模板圖像的像素是120*120,準(zhǔn)備進(jìn)行匹配的像素分別為380*302,360*260,280*210,利用三種算法對圖像進(jìn)行定位,其實(shí)驗(yàn)結(jié)果如圖2所示。
圖2 三種算法的定位對比
所提算法在三種不同像素下均精準(zhǔn)定位圖像中的井下行人目標(biāo),且基本沒有誤差。算法一只能定位出像素較高的兩張圖,且誤差較大,算法二的定位能力極差,三張實(shí)驗(yàn)圖沒有定位出任何一張圖中的井下行人目標(biāo)。本文所提方法定位能力強(qiáng)的原因是在進(jìn)行定位過程中先對于井下行人目標(biāo)進(jìn)行粗定位,利用隔點(diǎn)取樣方法將待匹配圖像尺寸減小,進(jìn)而提高運(yùn)算效率,減少圖像點(diǎn)的平移個(gè)數(shù),降低運(yùn)算誤差,從而提高了定位準(zhǔn)確性。
邊緣分割性能包含邊緣分割精度以及邊緣檢測所需時(shí)間。首先對三種算法的邊緣分割精度進(jìn)行測試,隨機(jī)選取一幅圖,為保證算法準(zhǔn)確性對三種算法均測試兩遍后觀察其結(jié)果,如圖3所示。
圖3 三種方法邊緣分割結(jié)果
由圖3可知,算法二對邊緣進(jìn)行分割后目標(biāo)圖像邊緣十分不清晰,同時(shí)伴有虛化現(xiàn)象,算法一雖強(qiáng)于算法二,但該算法的邊緣分割結(jié)果仍不理想,且第二遍分割結(jié)果過于失真,這種現(xiàn)象極可能導(dǎo)致最終結(jié)果出現(xiàn)較大偏差,而本文所提算法分割后的目標(biāo)圖像邊緣十分清晰,因?yàn)楸疚乃崴惴ㄌ崆皩D像進(jìn)行高斯平滑處理,降低圖像中噪聲的影響,保證圖像的質(zhì)量,進(jìn)而提高邊緣分割精度。
邊緣分割時(shí)間也是驗(yàn)證邊緣分割性能的重要指標(biāo),隨機(jī)選取6組樣本圖像進(jìn)行,在保證其分割精度的情況下,對比三種算法所需時(shí)間,其結(jié)果如圖4所示。
圖4 三種算法邊緣分割時(shí)間
由圖4可知,經(jīng)比較后發(fā)現(xiàn),在相同精度下所提算法是三種算法中用時(shí)最短,效率最高的算法,算法一雖強(qiáng)于算法二,但其用時(shí)也遠(yuǎn)遠(yuǎn)高于所提算法。綜上所述,證明本文所提算法的邊緣分割性能是三種算法中最優(yōu)的。
圖5 三種算法的定位偏差
比較井下行人目標(biāo)定位優(yōu)劣最直觀的指標(biāo)就是對比算法偏差的大小,隨機(jī)選取五組完全不相同的樣本圖像,通過三種算法對井下行人目標(biāo)進(jìn)行定位,并與目標(biāo)實(shí)際位置對比,得出三種算法的定位偏差,根據(jù)圖5可知,所提算法的定位誤差最高僅為0.4mm,算法一和算法二的最高定位誤差分別為1.25mm和1.4mm,這兩種算法的定位誤差遠(yuǎn)遠(yuǎn)高于本文所提算法,其中最低誤差也高于所提算法的最高誤差,本文所提算法的偏差之所以可以控制這么小是因?yàn)樵撍惴▽δ繕?biāo)圖像邊緣進(jìn)行分割,保證目前圖像的完整,進(jìn)而提高定位準(zhǔn)確性,從而降低定位偏差。
井下行人目標(biāo)的定位對于煤礦行業(yè)尤其重要,且必須保證定位的準(zhǔn)確程度,因此提出基于改進(jìn)Otsu算法的井下行人目標(biāo)快速定位算法,該算法首先對井下行人目標(biāo)進(jìn)行粗定位,在此基礎(chǔ)上利用Otsu算法將目標(biāo)圖像進(jìn)行邊緣分割,其次對目標(biāo)進(jìn)行識(shí)別以及精準(zhǔn)定位,實(shí)現(xiàn)井下行人目標(biāo)快速定位,解決圖像匹配能力差、邊緣分割性能差以及定位偏差大的問題,保證工業(yè)效率的同時(shí)加強(qiáng)工作人員的安全。