王洪源 陳慕羿
摘 要:提出一種低功耗的運(yùn)動(dòng)估計(jì)硬件結(jié)構(gòu)。該結(jié)構(gòu)在并行GEA結(jié)構(gòu)的基礎(chǔ)上,對關(guān)鍵的絕對差和模塊應(yīng)用了差錯(cuò)復(fù)原機(jī)制,以對抗在工藝參數(shù)波動(dòng)和(或)工作電壓超比例縮小(VOS)時(shí)可能產(chǎn)生的邏輯級(jí)時(shí)序錯(cuò)誤。這里采用一個(gè)亞采樣電路ISR[CD*2]SSAD,將VOS技術(shù)和算法級(jí)容噪設(shè)計(jì)集成到絕對差和模塊中,實(shí)現(xiàn)了該模塊的差錯(cuò)檢測和糾正,與原并行GEA結(jié)構(gòu)相比,具有更低的功耗。計(jì)算結(jié)果表明,整個(gè)運(yùn)動(dòng)估計(jì)模塊的功率可節(jié)省16%。
關(guān)鍵詞:運(yùn)動(dòng)估計(jì);并行GEA;算法級(jí)容噪技術(shù);電壓超比例縮小;低功耗
中圖分類號(hào):TN919.81
0 引 言
在視頻編解碼系統(tǒng)的硬件實(shí)現(xiàn)中,運(yùn)動(dòng)估計(jì)核約占編碼器總計(jì)算復(fù)雜度的66%~94%。因此低功耗運(yùn)動(dòng)估計(jì)的實(shí)現(xiàn)具有非常重要的意義。在此,針對工藝參數(shù)波動(dòng)和(或)工作電壓超比例縮小(VOS)時(shí)可能產(chǎn)生的邏輯級(jí)時(shí)序錯(cuò)誤,將VOS技術(shù)與差錯(cuò)復(fù)原機(jī)制相結(jié)合,并將算法級(jí)容噪(ANT)設(shè)計(jì)集成到并行GEA結(jié)構(gòu)中,實(shí)現(xiàn)了絕對差和模塊中的差錯(cuò)檢測和糾正,降低了芯片的功耗。
1 ANT[CD*2]GEA結(jié)構(gòu)
在GEA算法中,一個(gè)大小為N×N的塊被劃分為2琇×2琇個(gè)大小為(N/2琇)×(N/2琇)У淖涌欏5鼻翱楹退閹骺槭據(jù)分別記為C和S。CS是當(dāng)前塊中一個(gè)子塊中所有像素的和,SS是一個(gè)候選塊中一個(gè)子塊內(nèi)所有像素的和。亞采樣SAD(SSAD)是CS和SS之間的絕對差之和。在計(jì)算完所有的SSAD(玬,n)值之后,可以找到具有最小的玀個(gè)SSAD值的運(yùn)動(dòng)向量([WTHX]m[WTBX]璱,[WTHX]n[WTBX]璱),將第M個(gè)小的SSAD值記為SSAD玀。最后,計(jì)算這┆玀個(gè)搜索位置對應(yīng)的SAD,以找出最終的運(yùn)動(dòng)向量。這里取獿=2,M=7。
為了并行計(jì)算候選塊的SSAD,將它們分為玃個(gè)組。將玬%玃
值相等的選塊劃分為一組,對于每組分別找出具有最小SSAD值的獽個(gè)最可能的運(yùn)動(dòng)向量,當(dāng)估計(jì)完所有SSAD值之后,進(jìn)一步計(jì)算獽×P個(gè)搜索位置的SAD值,以得到最終的運(yùn)動(dòng)向量。下面將以㎞=16,L=2,P=8,K=3為例,介紹本文所提出的〢NT[CD*2]狦EA 結(jié)構(gòu)。
集成脈動(dòng)模塊由24個(gè)脈動(dòng)列PE和額外的加法器組成,脈動(dòng)列PE中每個(gè)周期的輸入為一個(gè)4×1像素之和,同時(shí)產(chǎn)生4個(gè)4×4塊和。圖1所示的SSAD樹用于計(jì)算SSAD/SAD值。其中,每個(gè)A/D單元計(jì)算兩個(gè)8 b樣本的絕對差。當(dāng)SSAD樹用于生成SSAD值時(shí),其輸入為當(dāng)前塊的16個(gè)子塊和與一個(gè)候選塊的16個(gè)子塊和。當(dāng)SSAD樹用于計(jì)算SAD值時(shí),輸入為當(dāng)前塊數(shù)據(jù)與候選塊數(shù)據(jù)行,其輸出送至一個(gè)16 b的累加器,對于每個(gè)候選塊,計(jì)算SAD需要16個(gè)周期。將該SSAD樹的輸出記為SSAD璦(SAD璦)。オ
在實(shí)際應(yīng)用中,這兩個(gè)假設(shè)都是容易滿足的。首先,由于MSSAD計(jì)算過程中的LSB特性,時(shí)序違反引起的差錯(cuò)將發(fā)生在高位比特MSBs。因此,當(dāng)MSSAD塊產(chǎn)生錯(cuò)誤時(shí),錯(cuò)誤幅度較大,它滿足上述第一個(gè)條件。其次,與MSSAD塊相比,ISR[CD*2]SSAD塊的輸入數(shù)目減少為其1/玬,時(shí)鐘頻率更低,計(jì)算量更小,功耗更低。因此,采用最壞情況設(shè)計(jì),該塊可以實(shí)現(xiàn)無差錯(cuò)計(jì)算,它滿足第二個(gè)條件。
圖3是ANT[CD*2]GEA系統(tǒng)的PE陣列中一個(gè)PE單元的結(jié)構(gòu)。其中,ANT[CD*2]SSAD模塊與比較器樹串行連接,比較器(CMP)樹的功能是在一組候選塊中找到最小的獽個(gè)SSAD值,或在獽×P個(gè)塊中找出最小SAD值。
2 功耗分析
下面分別計(jì)算原MSSAD模塊與所提出的ANT[CD*2]SSAD模塊的功耗,并將結(jié)果進(jìn)行對比。假設(shè)MSSAD的常規(guī)設(shè)計(jì)中所采用的工作電壓為玍ヾd[CD*2]crit,當(dāng)電壓低于該值時(shí),將引起時(shí)序違反。此時(shí),總功率消耗為:
得到的計(jì)算結(jié)果表明,該模塊的功率節(jié)省可以達(dá)到45%。在實(shí)際中,SSAD/SAD模塊的功耗約占并行GEA系統(tǒng)功耗的35%,因此與原并行GEA結(jié)構(gòu)相比,這里所提出的ANT[CD*2]GEA結(jié)構(gòu)的總功耗可節(jié)省達(dá)16%。
3 結(jié) 語
隨著集成電路工藝尺寸的不斷縮小,工藝變化和電學(xué)效應(yīng)等非理想因素對芯片的影響越來越嚴(yán)重。這里將VOS技術(shù)與差錯(cuò)復(fù)原機(jī)制相結(jié)合,以并行GEA結(jié)構(gòu)為基礎(chǔ),在關(guān)鍵的SSAD/SAD模塊中集成了算法級(jí)容錯(cuò)電路,從而給出了一種低功耗的運(yùn)動(dòng)估計(jì)容錯(cuò)硬件[LL]結(jié)構(gòu) ANT[CD*2]GEA。 計(jì)算結(jié)果表明,在典型情況下,總功耗可節(jié)省16%。
參 考 文 獻(xiàn)
[1]Shanbhag N R.Reliable and Energy[CD*2]efficient Digital Signal Processing[A].DAC 2002[C].New Orleans,2002:830[CD*2]835.
[2]Varatkar G V,Shanbhag N R.Error[CD*2]Resilient Motion Estimation Architecture[J].IEEE Trans.on VLSI Systems,2008,16(10):1 399[CD*2]1 412.
[3]賴曉玲,桑紅石,鄭兆青,等.H.264分像素插值濾波方法及其VLSI實(shí)現(xiàn)[J].微電子學(xué)與計(jì)算機(jī),2007,24(7):187[CD*2]189.
[4]Huang Y W,Chien S Y,Hsieh B Y,玡t al.Global Elimination Algorithm and Architecture Design for Fast Block Matching Motion Estimation[J].IEEE Trans.on Circuits and Syst.Video Technol.,2004,14(6):898[CD*2]907.
[5]Huang Y W,Chen C Y,Tsai C H,玡t al.Survey on Block Matching Motion Estimation Algorithms and Architectures with New Results[J].Journal of VLSI Signal Processing Systems for Signal,Image and Video Technology,2006,42(3):297[CD*2]320.
[6]Jong[CD*2]Nam Kim,Sung[CD*2]Cheal Byun,Yong[CD*2]Hoon Kim,┆玡t al.狥ast Full Search Motion Estimation Algorithm Using Early Detection of Impossible Candidate Vectors[J].IEEE Trans.on Signal Processing,2002,9(50):2 355 [CD*2] 2 365.
[7]Chou[CD*2]Chen Wang,Chia[CD*2]Jung Lo,Cheng[CD*2]Wei Yu.Efficient Motion Estimation using Sorting[CD*2]Based Partial Distortion Search[A].2006 IEEE International Conference on Multimedia and Expo.[C].2006,7:153 [CD*2] 156.
[8]Wing Cheong Chan,Oscar C A,Ming Fai Fu.Improved Global Motion Estimation using Prediction and Early Termination[A].International Conference on Image Processing[C].2002(2):285 [CD*2] 288.
[JP2][9]Namuduri K R.Motion Estimation using Spatio[CD*2]temporal Contextual Information[J].IEEE Trans.on Circuits and Systems for Video Technology,2004,8(14):1 111[CD*2] 1 115.[JP]
[10]Hsia S C.VLSI Implementation for Low[CD*2]complexity Full Search Motion Estimation[J].IEEE Trans.on Circuits Syst.Video Technol.,2002,7(12):613[CD*2]619.
[11]陳紅,齊華,張健.基于遺傳塊匹配算法的高效運(yùn)動(dòng)估計(jì)技術(shù)研究[J].現(xiàn)代電子技術(shù),2008,31(10):121[CD*2]123.
[12]盧佩,張正炳,劉效勇.運(yùn)動(dòng)估計(jì)中對不規(guī)則塊匹配算法的理論研究[J].現(xiàn)代電子技術(shù),2004,27(21):1[CD*2]3.