張文翔 董宏林
(南京理工大學計算機科學與工程學院 南京 210094)
隨著社會的不斷進步與發(fā)展,計算機視覺系統(tǒng)的應(yīng)用越來越多。尤其在安防監(jiān)控和工業(yè)自動化領(lǐng)域,為了滿足不同的需求,需要對獲得的圖像進行畸變矯正和縮放。
目前,因攝像機鏡頭加工誤差導致的圖像畸變的矯正方法主要有兩大類,即基于控制對象的方法和基于模式的方法[1],這兩種方法都是先求得攝像機鏡頭的畸變系數(shù),然后進行圖像插值[2~6];在圖像縮放過程中,圖像插值算法會直接影響獲得圖像的質(zhì)量。因此圖像插值算法的選擇是至關(guān)重要的。為了使插值后的圖像不產(chǎn)生邊緣模糊和鋸齒效應(yīng),且在保證圖像質(zhì)量的同時滿足實時性的需求,研究學者們一直致力于圖像插值算法的研究?,F(xiàn)在提出的各種圖像插值算法主要分為線性圖像插值方法和非線性圖像插值方法[7],一般都要根據(jù)應(yīng)用場合的不同來選擇合適的插值算法。
本文提出一種基于OTSU 的圖像插值方法。該方法通過判斷待插值點周圍四鄰域像素點的方差值來確定該點的歸屬,對不同部分采用不同的插值算法進行像素點插值,針對圖像劃分中閾值的選擇,采用OTSU 算法尋找全局最佳閾值。實驗結(jié)果顯示,該算法很好地保留了圖像紋理細節(jié)部分,得到的圖像質(zhì)量較高,且算法時間復雜度較低。
最鄰近插值、雙線性插值和雙三次插值是最常用的傳統(tǒng)線性插值算法[7,8]。最鄰近插值算法得到的圖像會產(chǎn)生塊效應(yīng),因而此方法并不常用。下面介紹雙線性插值和雙三次插值。
雙線性插值算法原理是待插值點像素值取原圖像中與其相鄰的4 個點像素值的水平、垂直兩個方向上的線性內(nèi)插,插值權(quán)重為待插點到四鄰域像素點的距離。其插值公式如式(1)。
式中f為像素點的像素值,u,v是像素點間距離。
該算法沒有考慮相鄰像素點間灰度值變化率的影響,會造成圖像模糊。
雙三次插值算法[9]是對雙線性插值算法的改進,其原理是利用待插值點周圍4×4鄰域內(nèi)共16個像素點的像素值估計該點像素值。其插值公式如式(2)。
式(2)中W(x)是插值核函數(shù),其表達式如式(3)。
式(3)中a=-0.5。
該算法保留了更多的圖像紋理細節(jié)部分,但是算法運算量巨大,降低了算法效率。
針對傳統(tǒng)插值算法存在的問題,本文采用分區(qū)域的圖像插值算法[10~11],此類算法把圖像紋理細節(jié)區(qū)域和平坦區(qū)域區(qū)分開,分別利用不同的插值算法進行圖像插值。這一類算法中,主要的研究點在于分割閾值的選擇,當前研究學者提出的閾值確定方法有等值線法[12]、NSCT法[13]、方差法[14]等。在這些方法中,方差法的運算量較小,但是閾值是手動選取,導致圖像劃分的效果好壞存在偶然性。文中利用OTSU 算法確定閾值。OTSU 算法是一種自適應(yīng)的閾值確定方法,該方法能夠高效且快速的確定閾值。其原理為假設(shè)一幅圖像的大小為M×N,灰度i的像素個數(shù)為ni,灰度范圍為[0,L-1],于是各灰度值出現(xiàn)的概率為
將圖像中的像素按灰度級用閾值T 為兩類,即背景C0 和目標C1。背景C0 的灰度級為0~T-1,目標C1 的灰度級為T~L-1。背景C0 和目標C1 出現(xiàn)的概率分別為
背景C0和目標C1的平均灰度分別為
整幅圖像的平均灰度為
背景與目標的類間方差為
令T從0~L-1依次取值,計算不同T值下的類間方差,使得類間方差最大的那個T 值就是所求的最佳閾值。
本文提出的算法主要思想是通過OTSU 算法尋找圖像待插值點周圍四鄰域像素點像素值方差的最佳劃分閾值T,如果某點周圍四鄰域像素點的像素值方差小于T,則為平坦區(qū)域,采用雙線性插值,否則采用雙三次插值。該算法流程圖如圖1 所示。
圖1 算法流程圖
選取多幅標準測試圖進行實驗,分別對多幅圖像進行兩倍降采樣處理,得到低分辨率圖像。利用本文提出的算法對低分辨率圖像插值還原,并用雙線性插值算法與雙三次插值算法進行對比實驗。在分析了OTSU 算法原理及根據(jù)實驗數(shù)據(jù)得出,讓方差S 乘上一個倍數(shù)M 可以使算法對各類型的圖像均有很好的復原效果,M 取值在[20,30]之間。本文實驗過程中M=24。實驗使用的計算機處理器為Intel Core i5-3317U 1.70GHz,內(nèi)存4GB,算法均使用Matlab R2015b軟件編寫并測試。
圖2 為Lena 測試圖的實驗結(jié)果。從中可以看出,雙線性插值算法得到的圖像存在邊緣模糊和鋸齒現(xiàn)象;雙三次插值算法得到的圖像質(zhì)量明顯提高,沒有產(chǎn)生明顯的模糊和鋸齒現(xiàn)象;本文算法得到的圖像很好地保留了紋理細節(jié)部分,圖像質(zhì)量較高,主觀視覺效果較好。
圖2 三種算法對降采樣圖放大效果
為了客觀評價算法的優(yōu)越性[15],使用均方誤差(MSE)和特征相似性(FSIM)[16]作為評價指標,同時計算出各算法的運行時間。MSE值越小,表示圖像復原度越高;而FSIM 值越大,說明圖像復原度越高。表1、表2 和表3 給出了不同算法的MSE 值、FSIM值和運算時間。
表1 三種算法的MSE值
表2 三種算法的FSIM值
表3 三種算法的運算時間
從表1中可以看出,本文算法的MSE 值低于雙線性插值算法和雙三次插值算法;從表2 中可以看出,本文插值算法的FSIM 值高于雙線性插值算法和雙三次插值算法;從表3 中可以看出,本文插值算法的的運算時間低于雙三次插值算法。實驗結(jié)果表明,本文提出的插值算法能夠很好地保留圖像的紋理細節(jié)部分,總體性能上優(yōu)于雙線性插值算法與雙三次插值算法,既滿足了實時性需求,又提高了圖像質(zhì)量。
本文提出了一種基于OTSU 的圖像插值算法,該算法通過計算圖像待插值點四鄰域像素點像素值的方差判斷該點是否是圖像邊緣位置,利用OTSU 算法快速計算出方差的分割閾值,對不同區(qū)域分別采用雙線性插值算法與雙三次插值算法進行插值處理。該算法的時間復雜度較低,滿足實時性的需要,得到的圖像質(zhì)量高,有效地保證了圖像質(zhì)量。本文插值算法提高了圖像處理的效率,有一定的實用價值。