賈 茜 肖進(jìn)勝 易本順 甘良才
(武漢大學(xué)電子信息學(xué)院 武漢 430072)
盡管目前視頻傳輸中的編解碼技術(shù)已經(jīng)可以獲得很高的壓縮比,然而為了適應(yīng)一些網(wǎng)絡(luò)帶寬的限制,通常將視頻信號(hào)的時(shí)空分辨率降低使數(shù)據(jù)量更少,在時(shí)域中可以通過(guò)編碼端跳幀來(lái)實(shí)現(xiàn)。這樣,在解碼端的低幀率視頻必然會(huì)引起運(yùn)動(dòng)不連續(xù)、圖像質(zhì)量的退化,尤其是在快速運(yùn)動(dòng)和復(fù)雜場(chǎng)景中更為明顯。為此,可以在解碼端采用視頻插幀,即幀率上轉(zhuǎn)換技術(shù)來(lái)恢復(fù)原始幀率以提高視頻圖像的主觀視覺(jué)效果,該技術(shù)也可用于不同幀率視頻格式之間的轉(zhuǎn)換。由于簡(jiǎn)單的幀重復(fù)、幀平均會(huì)產(chǎn)生運(yùn)動(dòng)抖動(dòng)和模糊,因此在實(shí)際中幀率上轉(zhuǎn)換通常采用的方法是基于塊匹配的運(yùn)動(dòng)補(bǔ)償內(nèi)插(Motion-Compensated Interpolation, MCI),該方法所獲得的內(nèi)插幀質(zhì)量取決于運(yùn)動(dòng)矢量估計(jì)的精度。已存在的 MCI算法按照運(yùn)動(dòng)矢量的來(lái)源不同可以分為兩類(lèi):第1類(lèi)方法基于壓縮域,直接對(duì)解碼端得到的碼流中的運(yùn)動(dòng)矢量和殘差信號(hào)進(jìn)行分析和處理[1,2]。由于省去了重新運(yùn)動(dòng)估計(jì)的步驟,計(jì)算量顯著降低,然而該類(lèi)算法對(duì)壓縮標(biāo)準(zhǔn)有依賴。第2類(lèi)方法基于像素域,對(duì)解碼后的圖像序列相鄰幀重新進(jìn)行運(yùn)動(dòng)矢量估計(jì),得到面向插幀應(yīng)用的運(yùn)動(dòng)矢量[3-11],再進(jìn)行分析和處理。本文主要討論第2類(lèi)算法。
在MCI中需要解決以下3個(gè)問(wèn)題:(1)估計(jì)的運(yùn)動(dòng)矢量必須正確地反映真實(shí)的運(yùn)動(dòng)才能準(zhǔn)確地重構(gòu)插值幀。大多數(shù)的MCI算法利用塊匹配算法做運(yùn)動(dòng)估計(jì),基于塊匹配的各種模板搜索快速算法大幅度地減小了計(jì)算量。然而,與視頻壓縮不同的是,MCI中的運(yùn)動(dòng)估計(jì)不是為了最小化殘差信號(hào)的能量,而是為了找到代表真實(shí)運(yùn)動(dòng)的矢量場(chǎng),使重構(gòu)的內(nèi)插幀獲得符合主觀視覺(jué)的圖像信息。目前,已存在眾多運(yùn)動(dòng)估計(jì)的快速搜索算法,利用運(yùn)動(dòng)矢量場(chǎng)的相關(guān)性預(yù)測(cè)當(dāng)前塊的運(yùn)動(dòng),自適應(yīng)地選擇不同搜索模板和搜索策略,可以在一定程度上進(jìn)一步提高搜索速度和精確度,典型算法如:預(yù)測(cè)運(yùn)動(dòng)矢量自適應(yīng)搜索技術(shù)[3](Predictive Motion Vector Field Adaptive Search Technique, PMVFAST)。由于傳統(tǒng)的塊匹配搜索算法得到的運(yùn)動(dòng)矢量最優(yōu)解常與真實(shí)的運(yùn)動(dòng)不符,為了提高運(yùn)動(dòng)矢量場(chǎng)的時(shí)空一致性,獲得代表真實(shí)運(yùn)動(dòng)的運(yùn)動(dòng)矢量,文獻(xiàn)[4]提出了3維遞歸搜索(3-D Recursive Search, 3-D RS)算法,該算法追求的是平滑的運(yùn)動(dòng)矢量場(chǎng),而且其收斂快速,復(fù)雜度低,所以在面向幀率上轉(zhuǎn)換應(yīng)用的運(yùn)動(dòng)估計(jì)中受到重視。(2)傳統(tǒng)的塊匹配算法是前后兩幀“單向”搜索,使得中間內(nèi)插幀的一個(gè)像素可能有多個(gè)運(yùn)動(dòng)軌跡通過(guò),或者沒(méi)有運(yùn)動(dòng)軌跡通過(guò),而分別產(chǎn)生“重疊”和“空洞”問(wèn)題。而雙向運(yùn)動(dòng)估計(jì)[5,6]是以內(nèi)插幀中的塊作為定位基準(zhǔn),在前后幀中對(duì)稱(chēng)地搜索匹配塊,這樣在插值補(bǔ)償中間幀時(shí)就不會(huì)存在單向運(yùn)動(dòng)估計(jì)方法所帶來(lái)的像素“重疊”和“空洞”。(3)塊匹配方法是基于塊內(nèi)所有的像素點(diǎn)具有一致運(yùn)動(dòng)狀態(tài)的假設(shè),當(dāng)一個(gè)塊包含多個(gè)不同運(yùn)動(dòng)時(shí),會(huì)使內(nèi)插幀出現(xiàn)“塊效應(yīng)”。國(guó)內(nèi)外研究者提出了許多方法來(lái)提高運(yùn)動(dòng)估計(jì)精度,或者改進(jìn)運(yùn)動(dòng)補(bǔ)償策略,以減小塊效應(yīng),例如:文獻(xiàn)[2]將中值濾波作為矢量后處理步驟,在運(yùn)動(dòng)補(bǔ)償時(shí)采用類(lèi)似于 H.264和 MPEG4中所用到的重疊塊運(yùn)動(dòng)補(bǔ)償技術(shù)(Overlapped Block Motion Compensation, OBMC)來(lái)減小塊效應(yīng);由于傳統(tǒng)的中值濾波算法計(jì)算量較大,文獻(xiàn)[3]提出了一種簡(jiǎn)化的中值濾波方法;文獻(xiàn)[6]通過(guò)K-均值聚類(lèi)對(duì)運(yùn)動(dòng)對(duì)象進(jìn)行分割,再采用可變尺寸塊運(yùn)動(dòng)補(bǔ)償(Variable-Size Block Motion Compensation, VS-BMC)和自適應(yīng)的OBMC以克服傳統(tǒng)OBMC帶來(lái)的圖像過(guò)平滑,獲得了較好的內(nèi)插效果,但是該算法在運(yùn)動(dòng)估計(jì)和對(duì)象分割時(shí)需要反復(fù)迭代,計(jì)算較為復(fù)雜。
本文力求用低復(fù)雜度的算法獲得好的內(nèi)插圖像質(zhì)量,提出了一種基于 3-D RS的多級(jí)運(yùn)動(dòng)估計(jì)幀率上轉(zhuǎn)換算法。該算法將3-D RS與雙向運(yùn)動(dòng)估計(jì)算法相結(jié)合,在相鄰的前后兩幀中計(jì)算初始運(yùn)動(dòng)矢量;然后按照塊的尺寸對(duì)初始運(yùn)動(dòng)矢量“由粗到細(xì)”逐級(jí)精確修正,并利用簡(jiǎn)化的中值濾波器對(duì)矢量場(chǎng)進(jìn)一步平滑;再通過(guò)時(shí)域線性插值補(bǔ)償產(chǎn)生中間幀。該算法在不產(chǎn)生“重疊”與“空洞”的同時(shí),提高了雙向運(yùn)動(dòng)估計(jì)準(zhǔn)確性和運(yùn)動(dòng)矢量一致性,有效減小了塊效應(yīng),并且復(fù)雜度低、易于實(shí)現(xiàn),可應(yīng)用于高清視頻的實(shí)時(shí)處理。
在視頻編解碼領(lǐng)域已有很多成熟的塊匹配算法。但是,如前所述,在視頻插幀應(yīng)用中要求運(yùn)動(dòng)信息能夠反映物體的真實(shí)運(yùn)動(dòng),僅靠匹配誤差確定的運(yùn)動(dòng)矢量有可能與真實(shí)的運(yùn)動(dòng)截然不同,使運(yùn)動(dòng)補(bǔ)償?shù)膬?nèi)插幀產(chǎn)生與主觀視覺(jué)不符的圖像信息。由于視頻對(duì)象的運(yùn)動(dòng)具有連續(xù)性,因此運(yùn)動(dòng)矢量間也存在時(shí)空相關(guān)性。由此,出現(xiàn)了遞歸搜索的方法,它是利用運(yùn)動(dòng)場(chǎng)時(shí)空相關(guān)性預(yù)測(cè)的搜索算法,不僅能獲得更為平滑的運(yùn)動(dòng)矢量場(chǎng),同時(shí)也減少了計(jì)算開(kāi)銷(xiāo)。
3維遞歸搜索包括空間遞歸和時(shí)間遞歸,即認(rèn)為當(dāng)前塊與當(dāng)前幀中的空間相鄰塊以及前一幀中時(shí)間相鄰塊在運(yùn)動(dòng)上具有相關(guān)性,當(dāng)前塊的運(yùn)動(dòng)矢量可由時(shí)空相關(guān)矢量“傳播”得來(lái)。應(yīng)當(dāng)注意的是,當(dāng)前塊的運(yùn)動(dòng)矢量與其時(shí)間、空間相鄰塊運(yùn)動(dòng)矢量相近,但并非完全相同,如果所有的候選矢量都來(lái)自相鄰塊運(yùn)動(dòng)矢量的原始值,則不符合實(shí)際情況。因此,給原始運(yùn)動(dòng)矢量加上一個(gè)更新矢量,得到的候選運(yùn)動(dòng)矢量將更接近實(shí)際、更準(zhǔn)確。傳統(tǒng)的 3-D RS算法中運(yùn)動(dòng)估計(jì)誤差準(zhǔn)則[4]由式(1)計(jì)算:
其中F(x,t)是t幀中像素點(diǎn)x的亮度,T是幀數(shù)間隔,B(X)代表參考幀中的塊,X為塊的位置,C為候選矢量,U(X,t)為更新矢量,α為常數(shù)。式(1)即首先計(jì)算相鄰兩幀中塊內(nèi)像素的絕對(duì)差和(Sum of Absolute Differences, SAD),再加上一個(gè)依賴更新矢量大小的懲罰值,誤差最小的運(yùn)動(dòng)矢量即為估計(jì)值。
在搜索匹配塊時(shí),如果按照單向運(yùn)動(dòng)估計(jì)獲得的運(yùn)動(dòng)矢量線性補(bǔ)償插值可能會(huì)有像素“重疊”和“空洞”問(wèn)題,如圖 1(a)所示。而雙向運(yùn)動(dòng)估計(jì)是以內(nèi)插幀中待插塊的坐標(biāo)為基準(zhǔn),在相鄰的前后兩幀中對(duì)稱(chēng)地搜索匹配塊,如圖1(b)所示,從而巧妙地解決了該問(wèn)題。
由于原始的3-D RS利用SAD作為匹配準(zhǔn)則,這與其他單向運(yùn)動(dòng)估計(jì)的經(jīng)典搜索算法一致,為了同時(shí)利用 3-D RS和雙向運(yùn)動(dòng)估計(jì)各自的優(yōu)點(diǎn),將它們進(jìn)行結(jié)合時(shí)需要對(duì)匹配準(zhǔn)則進(jìn)行修改,故本文用雙向運(yùn)動(dòng)估計(jì)中的匹配準(zhǔn)則“雙向絕對(duì)差和”SBAD(Sum of Bilateral Absolute Differences)來(lái)代替原來(lái)的SAD。
圖1 單向運(yùn)動(dòng)估計(jì)與雙向運(yùn)動(dòng)估計(jì)示意圖
其中Bi,j代表內(nèi)插幀中的塊,s為內(nèi)插幀中的像素點(diǎn),v為運(yùn)動(dòng)矢量,fn-1和fn+1是與內(nèi)插幀相鄰的前后兩幀。為了減小搜索時(shí)的計(jì)算量,可以減少候選矢量的個(gè)數(shù)[7],在本文運(yùn)動(dòng)估計(jì)算法中,對(duì)于第n幀中位置為X=[X,Y]T的塊,其時(shí)空相關(guān)預(yù)測(cè)中候選運(yùn)動(dòng)矢量d(·,·)的集合CS表示如下:
其中Vx,Vy是水平和垂直方向的單位向量;d(·,n)表示空間相關(guān)預(yù)測(cè)矢量;d( ·,n-1)表示時(shí)間相關(guān)預(yù)測(cè)矢量;k交替地取-1和1;US為更新矢量,從以下集合中依次選?。?/p>
由于實(shí)際中水平方向上的大運(yùn)動(dòng)比垂直方向的大運(yùn)動(dòng)發(fā)生概率更高,所以更新矢量中水平分量變化要比垂直分量大[5]。這樣,候選的預(yù)測(cè)矢量共有6個(gè),如圖 2所示,包括:內(nèi)插幀中Bi,j的左邊、上邊塊和左上塊(或右上塊);前一個(gè)內(nèi)插幀中的Bi,j塊,以及其右邊和下邊塊。
圖2 3-D RS時(shí)空預(yù)測(cè)候選矢量
式(1)中加上的懲罰值主要是用以區(qū)分不同類(lèi)型候選矢量的優(yōu)先權(quán)。為簡(jiǎn)化計(jì)算,本文在算法中對(duì)空間預(yù)測(cè)、時(shí)間預(yù)測(cè)、更新矢量預(yù)測(cè)的匹配誤差加上的懲罰值分別由小到大設(shè)置為 3個(gè)不同的常數(shù),也可以區(qū)分不同類(lèi)型候選矢量的優(yōu)先權(quán),即:若在搜索的過(guò)程中出現(xiàn)了相等SBAD的候選矢量,則優(yōu)先次序?yàn)榭臻g預(yù)測(cè)、時(shí)間預(yù)測(cè)、更新矢量預(yù)測(cè)。這樣,運(yùn)動(dòng)矢量最優(yōu)估計(jì)值為
其中Penalty對(duì)于空間預(yù)測(cè)、時(shí)間預(yù)測(cè)、更新矢量預(yù)測(cè)分別取常數(shù)0,2,4。為了提高好的運(yùn)動(dòng)估計(jì)結(jié)果的傳播,改變掃描順序可能會(huì)有所幫助。有兩種可行的機(jī)制:第1種是在“先左后下”掃描一遍之后,再反向掃描一遍;第 2種是“曲徑”(meandering)掃描,即“從左至右”的掃描完一行之后,下一行“從右至左”的掃描;也可以同時(shí)采用這兩種機(jī)制[8]。本文算法中用的是第1種方法,即第1次“先左后下”掃描,第2次再“先右后上”的反向掃描,如果搜索到更好的匹配則更新矢量估計(jì)值。需要指出的是,式(3)列舉的只是“先左后下”的掃描順序所代表的預(yù)測(cè)矢量,第2遍“先右后上”的掃描時(shí),由于循序掃描并不是所有的空間預(yù)測(cè)矢量都能立即獲得,空間預(yù)測(cè)矢量要選取那些已估計(jì)的塊,可以通過(guò)將空間預(yù)測(cè)與時(shí)間預(yù)測(cè)塊位置互換來(lái)獲得。
當(dāng)一個(gè)塊包含多個(gè)不同運(yùn)動(dòng)對(duì)象時(shí),無(wú)法得到正確描述運(yùn)動(dòng)的估計(jì)矢量。這時(shí)可以采用多級(jí)塊匹配和多分辨率塊匹配[8],它們都是基于“由粗到細(xì)”的搜索思想,上一層的運(yùn)動(dòng)矢量可以傳播到下一層,而下一層的估計(jì)值是對(duì)上一層估計(jì)結(jié)果的進(jìn)一步細(xì)化。如圖 3(a)所示,多級(jí)法在每一級(jí)上圖像大小相同,而塊的尺寸不同。當(dāng)某些塊不能得到好的匹配時(shí)將其塊拆分成小塊進(jìn)行搜索,每一級(jí)可以使用不同的塊匹配搜索算法,如3-D RS、鉆石搜索(DS)、六邊形搜索(HS)等。而多分辨率法如圖3(b)所示,是在多尺度圖像上進(jìn)行搜索,塊的大小保持不變,但每個(gè)層次上的圖像分辨率不同。低分辨率層可以對(duì)高分辨率層下采樣得到,或者構(gòu)建圖像金字塔。
圖3 多級(jí)塊匹配與多分辨率塊匹配
(1)多級(jí)塊匹配運(yùn)動(dòng)估計(jì) 本文運(yùn)動(dòng)估計(jì)算法采用多級(jí)法,以16×16塊作為初始搜索,通過(guò)三級(jí)運(yùn)動(dòng)估計(jì)逐步得到4×4塊的運(yùn)動(dòng)矢量。設(shè)塊匹配預(yù)測(cè)誤差門(mén)限閾值為threshold_SAD,處理步驟如下:
(a)首先用 16×16塊匹配搜索,對(duì)大于threshold_SAD塊進(jìn)行標(biāo)記;
(b)將16×16塊拆分為8×8塊繼承上一級(jí)運(yùn)動(dòng)估計(jì)的結(jié)果,對(duì)上一步中標(biāo)記的塊重新搜索,更新估計(jì)值;對(duì)大于threshold_SAD/4的塊再次標(biāo)記;
(c)將8×8塊拆分4×4塊繼承上一級(jí)運(yùn)動(dòng)估計(jì)的結(jié)果;對(duì)上一步中標(biāo)記的塊再次重新搜索,更新估計(jì)值;對(duì)大于threshold_SAD/16的塊運(yùn)動(dòng)矢量由其周?chē)膲K運(yùn)動(dòng)矢量中值濾波的結(jié)果直接分配。
在本文設(shè)計(jì)的三級(jí)運(yùn)動(dòng)估計(jì)中,前兩級(jí)是用上一節(jié)介紹的基于3-D RS的雙向運(yùn)動(dòng)估計(jì)算法,第3級(jí)是HS算法。
由于傳統(tǒng)的矢量中值濾波計(jì)算量較大,本文采用一種簡(jiǎn)化的中值濾波器[3]對(duì)運(yùn)動(dòng)估計(jì)得到的矢量進(jìn)行處理。該算法是通過(guò)對(duì)鄰域內(nèi)初始的運(yùn)動(dòng)矢量的水平、垂直分量分別進(jìn)行排序,并按大小賦予權(quán)值,找出總權(quán)值最小的一對(duì)矢量作為窗口內(nèi)矢量的中值。該算法實(shí)際上是簡(jiǎn)化了矢量中值的甄選過(guò)程。在實(shí)驗(yàn)中,我們發(fā)現(xiàn)執(zhí)行該算法過(guò)程中當(dāng)總權(quán)值最小的矢量對(duì)不唯一時(shí),可能甄選出的中值矢量并不是最佳的,最終使最后插值幀出現(xiàn)了“塊效應(yīng)”,如圖 4(a)所示。因此,本文算法中在甄選中值矢量時(shí)對(duì)水平、垂直賦予 2組不同大小的權(quán)值:{4,3,2,1,0,1,2,3,4}和{20,15,10,5,0,5,10,15,20},保證選出的最佳矢量對(duì)的唯一性。賦值的依據(jù)是先判斷運(yùn)動(dòng)矢量水平分量和垂直分量的大小,較大者賦予第2組權(quán)值。甄選出的中值矢量'mv是否要替換原始窗口中心的mv,是通過(guò)兩者之間的差異以及窗口的尺寸來(lái)決定的:
圖4 Bowing序列第64幀內(nèi)插結(jié)果
本文在三級(jí)運(yùn)動(dòng)估計(jì)的每一級(jí)完成之后進(jìn)行上述的運(yùn)動(dòng)矢量中值濾波處理,“由粗到精”地逐步修正運(yùn)動(dòng)矢量,最終得到4×4的塊運(yùn)動(dòng)矢量。最后利用式(7)的線性插值運(yùn)動(dòng)補(bǔ)償重構(gòu)中間幀。
實(shí)驗(yàn)數(shù)據(jù)選取了8個(gè)4:2:0的YUV格式的標(biāo)準(zhǔn)測(cè)試序列來(lái)驗(yàn)證本文算法的有效性,包括7個(gè)CIF序列:Football, Bowing, Susan, Carphone, News,Silent和Forman,以及1個(gè)HD序列Sunflower。其中,F(xiàn)ootball有大量快速運(yùn)動(dòng),Bowing 和Silent背景靜止,前景人物有復(fù)雜運(yùn)動(dòng);Susan前景有大面積運(yùn)動(dòng);Carphone與Forman類(lèi)似,前景運(yùn)動(dòng)比較復(fù)雜,背景有微小晃動(dòng),而 Forman序列后半部分還存在背景的全局運(yùn)動(dòng);News圖像中間部分有復(fù)雜運(yùn)動(dòng);Sunflower存在局部和全局同時(shí)運(yùn)動(dòng)。
實(shí)驗(yàn)中對(duì)每個(gè)序列時(shí)域下采樣,跳過(guò)偶數(shù)幀后,采用本文提出的幀率上轉(zhuǎn)換算法對(duì)相鄰幀進(jìn)行內(nèi)插,重構(gòu)出跳過(guò)的幀,恢復(fù)原始幀率。插幀客觀質(zhì)量通過(guò)內(nèi)插幀與原始幀的PSNR值來(lái)衡量。為了評(píng)價(jià)本文算法的性能,對(duì)比了其他3種算法:方法 1是全搜索(Full Search, FS)雙向運(yùn)動(dòng)估計(jì)結(jié)合傳統(tǒng)的中值濾波方法;方法2是PMVFAST自適應(yīng)雙向運(yùn)動(dòng)估計(jì)算法[3];方法3是拋物線運(yùn)動(dòng)模型自適應(yīng)運(yùn)動(dòng)矢量選擇算法[12]。在方法1中,雙向運(yùn)動(dòng)估計(jì)的塊大小為16×16,全搜索半徑設(shè)置為8,對(duì)應(yīng)到單向運(yùn)動(dòng)估計(jì)的搜索范圍為±16。以上算法對(duì)不同測(cè)試序列的內(nèi)插幀平均PSNR值如表1所示。
表1 各算法對(duì)測(cè)試序列內(nèi)插幀平均PSNR(dB)
由表1可見(jiàn),本文提出的算法對(duì)于大部分序列內(nèi)插幀PSNR值,超過(guò)或者接近參考算法中的最優(yōu)者。對(duì)于Carphone和Forman序列,本文算法PSNR值略低于全搜索而高于其他算法;對(duì)于 News序列方法3的PSNR值最高,本文算法次之;對(duì)于HD序列Sunflower, PMVFAST算法略優(yōu)于本文算法與全搜索。
圖5是內(nèi)插幀主觀質(zhì)量的對(duì)比。由圖5可以看出,本文算法得到的Carphone序列第72個(gè)內(nèi)插幀,人的嘴巴、鼻子、頭發(fā)部分更為清晰。
在計(jì)算復(fù)雜度方面,由于本文采取 3-D RS為核心的搜索算法,根據(jù)式(3)和式(4),對(duì)于一個(gè)塊的運(yùn)動(dòng)估計(jì)正向、反向兩次掃描需搜索28個(gè)位置。據(jù)實(shí)驗(yàn)統(tǒng)計(jì),第1級(jí)16×16塊對(duì)于圖像大部分區(qū)域已經(jīng)能夠取得比較好的匹配結(jié)果,拆分小塊進(jìn)行后面兩級(jí)搜索只是少數(shù)塊,所以即使算法中進(jìn)行了三級(jí)運(yùn)動(dòng)估計(jì),其計(jì)算開(kāi)銷(xiāo)也并無(wú)大幅增加。方法2的PMVFAST算法是以當(dāng)前塊空間相關(guān)的3個(gè)塊的矢量作為預(yù)測(cè)矢量,根據(jù)預(yù)置的SAD閾值和計(jì)算出的矢量距離選擇合適的模板再進(jìn)行搜索。PMVFAST在搜索中為了減小計(jì)算量加入了提前終止策略,預(yù)先不能確定計(jì)算量。方法3的拋物線運(yùn)動(dòng)模型和自適應(yīng)運(yùn)動(dòng)矢量選擇使在已知初始運(yùn)動(dòng)矢量,利用拋物線對(duì)運(yùn)動(dòng)軌跡建模,修正時(shí)間不連續(xù)的運(yùn)動(dòng)矢量,得到正確的“雙向運(yùn)動(dòng)矢量對(duì)”。由于該方法討論的是已知初始的運(yùn)動(dòng)矢量之后的進(jìn)一步處理,并未討論初始運(yùn)動(dòng)矢量如何得到,所以在本文算法處理速度對(duì)比實(shí)驗(yàn)中方法3沒(méi)有參與比較。
圖5 Carphone序列第72幀內(nèi)插幀主觀質(zhì)量對(duì)比
為了評(píng)估本文算法的效率,在 Intel Core i5-2500K (CPU@3.30 GHz), 3 GB內(nèi)存的PC平臺(tái)上分別運(yùn)行方法 1、方法 2和本文算法,對(duì)于不同測(cè)試序列的平均處理時(shí)間如表2所示。在處理HD序列時(shí),為了減小計(jì)算量,在實(shí)驗(yàn)中先對(duì)HD序列每一幀進(jìn)行空間圖像下采樣。由表2可見(jiàn),相對(duì)于CIF序列,HD序列由于其數(shù)據(jù)量更大,本文算法在處理速度方面的優(yōu)勢(shì)更加明顯,計(jì)算時(shí)間明顯少于其他兩種算法,對(duì)于HD序列有足夠的處理能力。
表2 各算法對(duì)測(cè)試序列插幀的平均處理時(shí)間(ms)
本文提出了一種基于3-D RS多級(jí)運(yùn)動(dòng)估計(jì)的幀率上轉(zhuǎn)換算法,采用了多級(jí)時(shí)空相關(guān)預(yù)測(cè)的雙向運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)矢量校正。由于3-D RS搜索點(diǎn)少,且矢量校正部分采用了簡(jiǎn)化的中值濾波器,所以該方法計(jì)算量小,易于實(shí)現(xiàn)。文中先介紹了該方法原理和處理流程,然后通過(guò)實(shí)驗(yàn)對(duì)比了其他3種方法來(lái)評(píng)價(jià)本文算法的性能,驗(yàn)證了算法的有效性。實(shí)驗(yàn)結(jié)果表明,本文算法獲得的內(nèi)插幀客觀指標(biāo)和主觀效果均令人滿意,在保證內(nèi)插幀質(zhì)量的同時(shí),算法復(fù)雜度低,大幅度提高了處理速度,對(duì)于高清序列插幀速度可以達(dá)到15 fps以上,適用于高清甚至更高分辨率的視頻幀率上轉(zhuǎn)換的實(shí)時(shí)處理。
[1]Huang A M and Nguyen T Q. A multistage motion vector processing method for motion-compensated frame interpolation[J].IEEE Transactions on Image Processing,2008, 17(5): 694-707.
[2]Zhai J, Yu K, Li J,et al.. A low complexity motion compensated frame interpolation method[C]. International Symposium on Circuits and Systems, Kobe, Japan, 2005, (5):4927-4930.
[3]李莉, 侯正信. 一種自適應(yīng)幀頻提升算法研究[J]. 計(jì)算機(jī)應(yīng)用研究, 2009, 26(4): 1575-1577.
Li Li and Hou Zheng-xin. Research on adaptive algorithm for frame rate up conversion[J].Application Research of Computers, 2009, 26(4): 1575-1577.
[4]Haan G D, Biezen P W, Huijgen H,et al.. True-motion estimation with 3-D recursive search block matching [J].IEEE Transactions on Circuits and Systems for Video Technology, 1993, 3(5): 368-379.
[5]Choi B T, Lee S H, and Ko S J. New frame rate up-conversion using bi-directional motion estimation[J].IEEE Transactions on Consumer Electronics, 2000, 46(3): 603-609.
[6]Chio B D, Han J W,et al.. Motion-compensated frame interpolation using bilateral motion estimation and adaptive overlapped block motion compensation[J].IEEE Transactions on Circuits and Systems for Video Technology,2007, 17(4): 407-415.
[7]侯正信, 李娜, 張麗曉, 等. 幀率提升中的三維遞歸搜索塊匹配改進(jìn)算法[J]. 計(jì)算機(jī)工程與應(yīng)用, 2011, 17(33): 169-171.
Hou Zheng-xin, Li Na, Zhang Li-xiao,et al.. Improved 3-D recursive search block matching algorithm in frame rate up conversion[J].Computer Engineering and Applications, 2011,17(33): 169-171.
[8]Heinrich A, Bartel C,et al.. Optimization of hierarchical 3DRS motion estimators for picture rate conversion[J].IEEE Journal of Selected Topics in Signal Processing, 2011, 5(2):263-264.
[9]Wang D, Zhang L, and Vincent A. Motion-compensated frame rate up-conversion part I: fast multi-frame motion estimation[J].IEEE Transactions on Broadcasting, 2010,56(2): 133-141.
[10]李淼, 李迅波, 魏海龍. 基于運(yùn)動(dòng)矢量場(chǎng)預(yù)測(cè)的自適應(yīng)多模板塊運(yùn)動(dòng)估計(jì)算法[J]. 電子測(cè)量技術(shù), 2010, 33(10): 36-39.
Li Miao, Li Xun-bo, and Wei Hai-long. Multi-pattern block motion estimation search algorithm based on predictive motion vector field[J].Electronic Measurement Technology,2010, 33(10): 36-39.
[11]張少嫻, 俞瓊. 基于時(shí)空相關(guān)性預(yù)測(cè)的運(yùn)動(dòng)估計(jì)的優(yōu)化[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2010, 20(1): 104-107.
Zhang Shao-xian and Yu Qiong. An optimization method for spatiotemporal predictive motion estimation[J].Computer Technology and Development, 2010, 20(1): 104-107.
[12]Choi K S and Hwang M C. Motion-compensated frame interpolation using a parabolic motion model and adaptive motion vector selection[J].ETRI Journal, 2011, 33(2):295-298.