陶宏江,金龍旭
(中國科學(xué)院 長春光學(xué)精密機(jī)械與物理研究所,吉林 長春 130033)
折反射全景成像設(shè)備采用攝像機(jī)正上方放置折反射全景鏡頭達(dá)到擴(kuò)大視野的目的,具有大視場、結(jié)構(gòu)簡單、光能損失低、系統(tǒng)設(shè)計(jì)柔性好、無需運(yùn)動(dòng)部件掃描和搜索就可以實(shí)現(xiàn)實(shí)時(shí)360°成像等優(yōu)點(diǎn)[1]。全景成像系統(tǒng)以及接近一個(gè)球面的全景視場信息觀察能力,在軍事和民用領(lǐng)域的應(yīng)用前景都十分廣闊,目前已經(jīng)在機(jī)器人導(dǎo)航、視頻會(huì)議、視頻監(jiān)控、虛擬現(xiàn)實(shí)等眾多領(lǐng)域得到廣泛應(yīng)用[2]。
然而,全景成像系統(tǒng)通過攝像機(jī)獲取的是圓形全景圖像,不符合人的視覺習(xí)慣,所以還需要對(duì)全景圖像進(jìn)行展開,變成適合觀察分析的柱面全景圖像。
現(xiàn)在常用的展開算法依據(jù)場景中的物點(diǎn)坐標(biāo)與成像平面內(nèi)像點(diǎn)坐標(biāo)映射關(guān)系實(shí)現(xiàn)圖像在展開[3],但是由于展開的柱面圖像與全景圖像的像素點(diǎn)并不是一一對(duì)應(yīng)關(guān)系,存在欠采樣現(xiàn)象,所以會(huì)產(chǎn)生圖像塊效應(yīng),降低展開圖像的圖像質(zhì)量。本文分析了坐標(biāo)映射展開法影響柱面圖像質(zhì)量的原因,提出了結(jié)合各向異性插值的全景圖像徑向展開方法,該算法能夠有效的抑制塊效應(yīng)、提高展開圖像質(zhì)量。
基于坐標(biāo)映射的柱面展開算法[4]的思想是,利用柱面展開圖中直角坐標(biāo)和圓環(huán)狀全景圖極坐標(biāo)之間的坐標(biāo)變換,構(gòu)建柱面圖中像素到圓環(huán)狀全景圖中像素的映射,再通過像素的填充完成柱面展開圖[5-6],如圖1所示。
圖1 全景圖像展開示意圖Fig.1 Schematic forunwrapping panoramic images
圖1中,r表示圓環(huán)全景圖的內(nèi)徑,R表示外徑,在外徑和內(nèi)徑之間的區(qū)域?yàn)橛行袼貐^(qū)。在圖像展開時(shí),對(duì)于展開后柱狀圖中的任意一點(diǎn)A′(x′,y′),對(duì)應(yīng)圓環(huán)全景圖中的點(diǎn)A(x,y),兩點(diǎn)間坐標(biāo)關(guān)系可表示為
通過對(duì)柱面圖中每一點(diǎn)進(jìn)行像素替換即可得到展開圖像。
由于計(jì)算機(jī)系統(tǒng)是一個(gè)離散的數(shù)字系統(tǒng),這就導(dǎo)致了式(1)中的映射不是一個(gè)一對(duì)一的映射關(guān)系,即存在全景圖像中的一點(diǎn)對(duì)應(yīng)柱面圖中多個(gè)點(diǎn)的情況。
不失一般性,假定圖像傳感器是正方式像素的陣列,全景相機(jī)成像時(shí)的示意圖如圖2所示。
圖2 全景相機(jī)成像示意圖Fig.2 Panoramic camera imaging
圖2中a表示傳感器一個(gè)像素單元的長度,Rm表示以o為原點(diǎn)的全景鏡頭光斑的半徑,可知沿A方向的傳感器感光像素?cái)?shù)為個(gè),而在B方向的傳感器感光像素?cái)?shù)約為個(gè),以為半徑的柱面展開圖有效像素近似分布如圖3所示[4]。
圖3 柱面展開圖有效像素近似分布Fig.3 Approximate distribution of the effective pixels of cylinder figure
通過分析可得出結(jié)論,在全景圖像的水平和垂直方向,柱面展開圖和全景圖像有一對(duì)一的映射關(guān)系,而在全景圖像的其他方向,展開圖像都有像素重復(fù)映射的情況,當(dāng)方向角為π/2的整數(shù)倍時(shí),像素重復(fù)映射最為嚴(yán)重,像素重復(fù)映射數(shù)近似為柱面展開圖中一列像素?cái)?shù)的30%。
過多的像素重復(fù)映射是導(dǎo)致柱面展開圖像產(chǎn)生塊效應(yīng)從而導(dǎo)致圖像質(zhì)量下降的主要原因,而坐標(biāo)映射柱面展開算法很難解決這一問題,因?yàn)樗y以定位哪些像素是進(jìn)行了多次映射的,針對(duì)這一問題,本文提出了全景圖像徑向展開算法。
全景圖像的徑向展開算法是基于數(shù)字圖像傳感器圖像采集原理和計(jì)算機(jī)圖形學(xué)算法的全景圖像展開方法,它的展開過程如圖4所示。
圖4 徑向展開過程Fig.4 Process of radial expanding
R是全景圖像外環(huán)半徑,r是全景圖像內(nèi)環(huán)半徑,點(diǎn)A為全景圖像外環(huán)上的展開起點(diǎn),B為全景圖像內(nèi)環(huán)上的展開終點(diǎn),A′為柱面展開圖中點(diǎn)A的對(duì)應(yīng)點(diǎn),B′為柱面展開圖中點(diǎn)B的對(duì)應(yīng)點(diǎn),線段A-B全景圖像自A 點(diǎn)起到B點(diǎn)結(jié)束的一條像素線段,線段A′-B′表示柱面展開圖中以A′點(diǎn)為基準(zhǔn)的一列像素,徑向展開算法過程如下:
(1)首先使用Bresenham畫圓算法確定全景圖像外環(huán)在圖像中的像素位置,因?yàn)槿扮R頭和傳感器之間不會(huì)移動(dòng)位置,所以這一過程只需要執(zhí)行一遍;
(2)選擇展開的起點(diǎn),本文選擇圓心位置正上方圓環(huán)外徑上的點(diǎn),從起點(diǎn)開始,按順序以圓環(huán)外徑上的點(diǎn)執(zhí)行步驟3中的直線掃描;
(3)從圓環(huán)外徑上的點(diǎn)開始,使用Bresenham直線算法沿半徑向圓心方向畫直線直到圓環(huán)內(nèi)徑為止,把全景圖像中這條徑向上的點(diǎn)按順序?qū)?yīng)到柱面如圖4中全景圖中的線段A-B對(duì)應(yīng)到柱面展開圖中的A′-B′。
在僅使用Bresenham直線算法在全景圖像選擇線段復(fù)制到柱面展開圖中時(shí),同樣會(huì)產(chǎn)生如圖3的像素缺失現(xiàn)象,本文使用基于Bresenham直線算法的線段拉伸算法以保證柱面展開圖中每一列具有同樣的像素?cái)?shù)。
Bresenham直線算法是計(jì)算機(jī)圖形學(xué)領(lǐng)域中使用最廣泛的直線掃描轉(zhuǎn)換算法,其具有只使用整數(shù)運(yùn)算、只做加減法和乘2運(yùn)算,實(shí)現(xiàn)方便,執(zhí)行效率高的特點(diǎn)。
以第一象限為例,Bresenham直線算法以判斷誤差項(xiàng)d2-d1的符號(hào)來決定下一像素的取向,如圖5所示,當(dāng)d2-d1>0時(shí),選擇右上方的點(diǎn),否則選擇右側(cè)的點(diǎn)。
圖5 Bresenham直線算法簡述Fig.5 Bresenham straight-line algorithm outlined
結(jié)合圖2和圖3,可以得出結(jié)論:圖4中線段A-B拉伸所需要插入的像素個(gè)數(shù)與Bresenham直線算法向右上方選擇的次數(shù)有關(guān),當(dāng)直線每向右上方移動(dòng)一點(diǎn),就累積了槡2-1個(gè)像素的差異。
全景圖像的線段拉伸實(shí)現(xiàn)就是基于這一原理,以第一象限為例,算法過程如下:
(1)以Bresenham直線算法從全景圖像外環(huán)上的點(diǎn)向圓心畫直線,直到內(nèi)環(huán)結(jié)束,計(jì)算直線上點(diǎn)的個(gè)數(shù)與全景圖像水平方向上R-r的差,即為圖像展開時(shí)需要插入的點(diǎn)的個(gè)數(shù);
(2)重新執(zhí)行Bresenham直線算法,在掃描過程中,當(dāng)直線向右上方選擇時(shí),對(duì)像素累積差異det加上槡2-1,如果直線向右選擇保持det不變;
(3)當(dāng)累積像素差異det大于等于1時(shí),如果已插入像素?cái)?shù)大于等于第一步中計(jì)算出的總需要插入像素?cái)?shù),則不插入插值重構(gòu)像素,否則即在柱面展開圖中對(duì)應(yīng)位置增加一插值重構(gòu)像素,同時(shí)det減1。
全景圖像展開需要插入大量的插值像素,插入像素比例見圖3,像素插值的質(zhì)量對(duì)柱面展開圖的視覺效果具有很大的影響,獲得高質(zhì)量像素結(jié)果的主要手段就是濾除因圖像展開所帶來的圖像噪聲[6-8],本文通過對(duì)全景圖像成像過程的分析,給出了基于各向異性插值[9-10]的全景圖像展開插值算法[11],全景圖像成像過程如圖6所示。
圖6 全景圖像成像過程Fig.6 Panorama image imaging process
上圖中圓柱為全景鏡頭的成像面,全景圖像的柱面展開也就是對(duì)全景鏡頭柱狀成像面數(shù)字化重構(gòu)[6],在柱狀成像面上有一待成像矩形區(qū)域AB-C-D,光線經(jīng)過全景鏡頭雙曲面折射后再經(jīng)過兩次反射在焦面上成像,成像面上的矩形A-B-CD 在焦面上成像為一段圓環(huán)A′-B′-C′-D′,成像面到焦面的平面映射示意圖如圖7所示。
圖7 成像面到焦面的平面映射示意圖Fig.7 Mapping schematic diagram of the image plane to the focal plane
通過上述分析可知,要在全景圖像的柱面展開圖中插值等效于在成像面中插值,也就是說成像面到焦面的映射等效于全景圖像的柱面展開到全景圖像的映射。
以焦面上全景圖像外圓環(huán)正上方點(diǎn)對(duì)應(yīng)成像面的原點(diǎn),成像面到焦面的映射關(guān)系為,成像面的x軸相當(dāng)于焦面上全景圖像的外圓環(huán)方向,成像面的y軸相當(dāng)于焦面上全景圖像的指向圓心的半徑。以第一象限為例,成像面上任一點(diǎn)M(mx,my),其在焦面極坐標(biāo)上的位置為:
轉(zhuǎn)換為焦面直角坐標(biāo)系中為:
得出像素對(duì)應(yīng)關(guān)系后,選擇高斯濾波器作為成像面上的插值濾波器[7],濾波系數(shù)為:
其中:M 為待插值點(diǎn),坐標(biāo)位置(mx,my),將以點(diǎn)M為中心的坐標(biāo)系數(shù)矩陣通過成像面到焦面的映射關(guān)系映射到焦面上,這一映射過程是一個(gè)多對(duì)一的映射,焦面上映射后一個(gè)點(diǎn)上的濾波系數(shù)值是映射到這一點(diǎn)的所有成像面點(diǎn)的濾波系數(shù)值的和,構(gòu)成由像面中極坐標(biāo)位置決定的各方向系數(shù)不同的濾波數(shù)組[12],最后通過映射后的各向異性濾波數(shù)組對(duì)待插值點(diǎn)進(jìn)行求解得到插值結(jié)果。
實(shí)驗(yàn)系統(tǒng)使用2 048pixel×1 536pixel的CMOS傳感器作為圖像輸入源,使用本文算法對(duì)輸入圖像進(jìn)行展開,輸入圖像和展開結(jié)果如圖8所示,展開圖像以輸入圖像正上方位置為起點(diǎn),沿逆時(shí)針方向展開。由圖中可以看到在π/2的整數(shù)倍角度位置,圖像塊效應(yīng)得到了改善,圖像質(zhì)量得到了提高。本文算法和坐標(biāo)映射展開算法的局部細(xì)節(jié)圖如圖9,相對(duì)坐標(biāo)映射展開算法,本文算法結(jié)果在反光處集中度變高了,圖像質(zhì)量獲得了改善。
圖8 實(shí)驗(yàn)測試圖像和結(jié)果Fig.8 Image and result of experimental test
圖9 展開圖像細(xì)節(jié)Fig.9 Comparison of expanded image
對(duì)圖像的數(shù)值比較方法有很多種[13-16],本文采用信息熵和平均梯度的方法比較圖像質(zhì)量,如表1所示,結(jié)果表明本文算法除運(yùn)行時(shí)間略低于坐標(biāo)映射展開算法,在展開圖像包含的信息量和展開圖像邊緣輪廓清晰度方面都優(yōu)于坐標(biāo)映射展開算法。
表1 實(shí)驗(yàn)數(shù)據(jù)對(duì)比結(jié)果Tab.1 Comparison of experimental data
針對(duì)現(xiàn)有全景圖像展開算法適應(yīng)性差,改進(jìn)困難的矛盾,根據(jù)全景圖像成像原理結(jié)合計(jì)算機(jī)圖形學(xué)方法,提出了基于各向異性插值的全景圖形徑向展開算法。該算法具有靈活性強(qiáng)、實(shí)現(xiàn)簡單和執(zhí)行效率較高等特點(diǎn),實(shí)驗(yàn)表明,該算法能夠改善全景圖像展開導(dǎo)致的塊效應(yīng),提高圖像質(zhì)量。
[1] 曾吉勇,蘇顯渝.折反射全景成像系統(tǒng)[J].激光雜志,2004,25(6):62-64.Zeng J Y,Su X Y.Catadioptric omnidirectional imaging system [J].Laser Journal,2004,25(6):62-64.(in Chinese)
[2] 原新,王亮,朱齊丹.基于全向視覺傳感器的圖像解算方法研究[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2006,38(12):2158-2161.Yuan X,Wang L,Zhu Q D.Image calculation research based on omni-directional camera[J].Journal of Harbin Institute of technology,2006,38(12):2158-2161.(in Chinese)
[3] 陳旺,徐瑋,熊志輝,等.折反射全向圖像柱面展開校正算法研究[J].中國圖像圖形學(xué)報(bào),2009,14(12):2559-2565.Chen W,Xu W,Xiong Z H,et al.Rectification of catadioptric omnidirectional images via cylindrical unwarping[J].Journal of Image and Graphics,2009,14(12):2559-2565.(in Chinese)
[4] 田曉東.折反射全景成像系統(tǒng)分析與設(shè)計(jì)[J].儀表技術(shù)與傳感器,2006(4):48-50.Tian X D.Analysis and design of catadioptric panorama image system [J].Instrument Technique and Sensor,2006(4):48-50.(in Chinese)
[5] 何四華,邵曉方,楊紹清,等.雙曲面折反射全景成像柱面展開圖像質(zhì)量分析[J].激光與紅外,2012,42(2):187-191.He S H,Shao X F,Yang S Q,et al.Analysis for the cylinder image quality of hyperbolic-catadioptric panorama image system [J].Laser &Infrared,2012,42(2):187-191.(in Chinese)
[6] 任文琦,王元全.基于梯度矢量卷積場的四階各向異性擴(kuò)散及圖像去噪[J].光學(xué)精密工程,2013,21(10):2713-2719.Ren W Q,Wang Y Q.GVC-based fourth-order anisotropic diffusion for image denoising[J].Optics and Precision Engineering,2013,21(10):2713-2719.(in Chinese)
[7] Aubert G,Kornprobst P.Mathematical Problems in Image Processing:Partial Differential Equations and the Calculus of Variations [M].New York:Springer,2006.
[8] 陳仁喜,李鑫慧.基于各向異性插值模型的快速圖像修復(fù)方法[J].計(jì)算機(jī)應(yīng)用研究,2009,26(4):1554-1556.Chen R X,Li X H.Fast image inpainting algorithm based on anisotropic interpolation model[J].Application Research of Computers,2009,26(4):1554-1556.(in Chinese)
[9] 苗慧,宋光磊,張春紅,等.一種自適應(yīng)各向異性的SAR圖像去噪算法[J].遙測遙控,2011,32(1):28-32.Miao H,Song G L,Zhang C H,et al.An adaptive anisotropic algorithm on SAR image denoising [J].Journal of Telemetry,Tracking and Command,2011,32(1):28-32.(in Chinese)
[10] 趙建.分?jǐn)?shù)階微分在圖像紋理增強(qiáng)中的應(yīng)用[J].液晶與顯示,2012,27(1):121-124.Zhao J.Fractional differential and its application in image texture enhancement[J].Chinese Journal of Liquid Crystals and Displays,2012,27(1):121-124.(in Chinese)
[11] Groenewald A M,Arbard E,Otha E C.Related approaches to gradient-based thresholding[J].Pattern Recognition Lett.,1993,14(7):567-572.
[12] Miller K S,Ross B.An Introduction to the Fractional Calculus and Fractional Differential Equations [M].USA:John Wiley & Sons,1993.
[13] 李艷,蘇萍,馬建設(shè).立體投影質(zhì)量的評(píng)價(jià)方法及系統(tǒng)[J].液晶與顯示,2012,27(1):31-37.Li Y,SU P,Ma J S.Evaluation method and system of stereoscopic projection quality [J].Chinese Journal of Liquid Crystals and Displays,2012,27(1):31-37.(in Chinese)
[14] 范媛媛,沈湘衡,桑英軍.基于對(duì)比度敏感度的無參考圖像清晰度評(píng)價(jià)[J].光學(xué)精密工程,2011,19(10):2485-2493.Fan Y Y,Shen X H,Sang Y J.No reference image sharpness assessment based on contrast sensitivity[J].Optics and Precision Engineering,2011,19(10):2485-2493.(in Chinese)
[15] 劉希佳,陳宇,王文生,等.小目標(biāo)識(shí)別的小波閾值去噪方法[J].中國光學(xué),2012,5(3):248-256.Liu X J,Chen Y,Wang W S,et al.De-noising algorithm of wavelet threshold for small target detection[J].Chinese Optics,2012,5(3):248-256.(in Chinese)
[16] 閻雪飛,許廷發(fā),白廷柱.改進(jìn)的固定點(diǎn)圖像復(fù)原算法[J].中國光學(xué),2013,6(3):318-324.Yan X F,Xu T F,Bai T Z.Improved fixed point method for image restoration[J].Chinese Optics,2013,6(3):318-324.(in Chinese)