岳宇辰
【摘要】? ? 隨著視頻監(jiān)控設備的更新?lián)Q代,監(jiān)控視頻數據量日趨龐大,極大增加了傳統(tǒng)視頻壓縮算法計算復雜度的同時,對視頻傳輸和存儲資源的需求也極大增加。針對此問題,本文提出一種面向視頻監(jiān)控的分布式視頻壓縮感知方案,該方案在預測-殘差分塊重建框架下進一步引入多維參考幀,通過獲取更多維度上的相似塊提高相似塊組的稀疏程度,得到更高的重建質量。實驗證明,該方案對攝像頭位置固定(角度可變)的監(jiān)控視頻的重建質量具有明顯的提升效果。
【關鍵詞】? ? 視頻壓縮感知? ? 多維度參考幀? ? 多假設
引言:
視頻監(jiān)控在交通管理、安全防護、工業(yè)制造、家庭住宅以及國防工業(yè)等領域均有廣泛的運用。視頻監(jiān)控系統(tǒng)一般由用戶端和服務器端兩部分組成,攝像頭將拍攝的視頻傳輸至服務端進行進一步處理,小型的視頻監(jiān)控系統(tǒng)中,多采用專業(yè)人員通過顯示器進行專項監(jiān)管的方式[1],但隨著視頻監(jiān)控系統(tǒng)規(guī)模的不斷擴大,單純靠人力不僅效率較低而且容易出現疏漏,因此,大規(guī)模視頻監(jiān)控系統(tǒng)通常將攝像頭采集的視頻數據保存,然后再使用人力或智能分析手段在服務端進行存儲錄像的分析,值得注意的是,存儲未經處理的視頻成本很大,例如一個24Hz 的VGA攝像頭,每錄制1s視頻所需的存儲空間為10MB,錄制24h的視頻所需存儲空間超過1TB,盡管存儲器價格下降較快,但這種投入仍不可接受,并且如此大數據量的視頻在無線/有線網絡中可靠地實時傳輸也是一個巨大的考驗。
壓縮感知理論由Candes,Donoho,T.Tao等在2006年在文獻[2]中正式發(fā)表,通過完備字典將輸入信號稀疏表示后可以采用低于Nyquist-Shannon定理規(guī)定的兩倍信號帶寬采樣頻率同時完成采樣與壓縮,使用重建算法恢復輸入信號。壓縮感知理論在視頻采樣端同時完成采樣與壓縮過程,大大節(jié)省了采樣資源,并且視頻采樣后的數據量大幅降低,后續(xù)處理所需帶寬和存儲空間均明顯降低,也極大緩解了“大數據”的壓力。
位置固定(角度可變)的攝像頭采集的視頻序列的背景部分通常是固定不變或緩慢移動的,因此運動物體的重建質量是重點關注問題,運動物體多會發(fā)生半像素位移及縮放形變,并且并非周期性產生,在一些情況下僅使用時序參考幀并不能搜索到待重建視頻塊的優(yōu)質相似塊,因此,本文提出一種基于多維度參考幀的分布式視頻壓縮感知重建方案。
一、基于多維度參考幀的分布式視頻壓縮感知
目前,綜合性能最優(yōu)秀的基于多參考幀的多假設預測類算法是文獻[3]提出的2sMHR,該算法不僅對緩速運慢序列的重建具有較優(yōu)的重建質量,還保持極低的時間復雜度,得益于該算法進行多假設重建時采用固定假設塊數量以及直接求解線性權值的方法。位置固定(角度可變)的攝像頭采集的視頻序列中的物體常產生半像素位移,并且運動中的物體還會產生程度隨機且不具有周期性的縮放變化,因此僅使用時域多參考幀進行多假設預測的包括2sMHR在內的多種多假設預測算法均較難取得此類物體的優(yōu)質相似塊,并且由于2sMHR采用固定假設塊數量的方法,面對此類物體時很有可能引入質量不高的假設塊導致重建質量降低。因此,針對緩慢運動視頻塊,額外引入半像素維參考幀和縮放維參考幀[4]以提供質量更優(yōu)的假設塊,提出一種基于多維度參考幀的分布式視頻壓縮感知重建算法。
半像素參考幀通過對時域參考幀進行半像素插值后得到,為保證插值參考幀不帶來額外諸如邊緣鋸齒、輪廓模糊、過度平滑等失真現象影響半像素參考幀質量,同時保持較高的插值效率,此處采用文獻[5]提出的6階插值濾波實現時域參考幀的插值,將插值參考幀尺寸拓展為原始尺寸的4倍,然后提取、分離相同位置的半像素點,重組后得到3個與原視頻幀尺寸相同的半像素參考幀以提供更多運功估計假設。
縮放維參考幀通過立方卷積插值對時域參考幀進行縮小或放大后生成,縮放率設為15%,即每個參考幀生成2個縮放維參考幀。使用0元素補齊縮小后的參考幀邊緣,剔除放大后的參考幀邊緣,保持縮放后的參考幀尺寸與原參考幀一致。
記Rf,1、Rf,2和Rf,3為3個半像素參考幀,Zf,1和Zf,2為2個縮放參考幀,以GOP = 8為例,GOP中的視頻幀按時間順序編號為1-8號,其中1號幀是Key幀,其余幀是CS幀,9號幀是下一GOP 的Key幀。
第2幀和第8幀僅使用時域參考幀,中間幀第5幀使用相鄰兩個方向的多維度參考幀,其他幀使用重建方向上的多維度參考幀。
增加參考幀數量后,采用全搜索方式搜索匹配塊的效率太低,由于監(jiān)控視頻中運動視頻塊的匹配塊會位于參考幀中幾乎相同的位置,或者在相同位置的附近,因此,采用四步快速搜索算法在多個參考幀中實現待重建視頻塊的最優(yōu)匹配塊的大范圍快速搜索,匹配準則采用MSE。運動塊與對應匹配塊的相似程度較高,故只需少量匹配塊即可完成重建,另外,重建質量還受采樣率的影響,隨著CS幀采樣率的提高,所需最優(yōu)匹配塊數量增加。
因此可以采用文獻[3]的固定匹配塊數的方式,通過大量的實驗驗證并且折中重建時間與重建質量使兩者均達到較優(yōu),得出在采樣率分別為0.1、0.2、0.3時,對應匹配塊數量分別是244塊、300塊、362塊。
二、仿真實驗
將標準視頻序列Hall、Mother-daughter、Tempete和Foreman的前96幀作為實驗對象,上述序列中Hall是監(jiān)控視頻序列,其他三個序列中物體運動程度接近監(jiān)控序列的運動情況,設定GOP = 16,采用提出算法和文獻[3]算法分別在0.1、0.2、0.3的采樣率下對上述序列的所有CS幀進行重建,重建結果如表1所示。
提出算法在0.1、0.2、0.3的采樣率下對實驗序列的重建質量均高于文獻[3]算法,原因在于提出算法在重建時引入了多個多維度參考幀,可以為視頻序列中發(fā)生縮放變化的視頻塊,例如Tempete和Hall序列,提供優(yōu)質的匹配塊,因而提高了重建質量。
三、結束語
本文提出的基于多維度參考幀的視頻壓縮感知重建算法在預測-殘差分塊重建框架下進一步引入多維參考幀,通過多維度參考幀獲取更多當前待重建塊的相似塊的方式,提高了相似塊組的整體稀疏程度,從而獲得得到更良好的重建質量。
實驗結果表明,該方案對攝像頭位置固定(角度可變)的監(jiān)控視頻的重建質量相較于多假設類重建算法具有明顯的提升效果。
參? 考? 文? 獻
[1] 王謹毓. 智能校園安防監(jiān)控物聯(lián)網系統(tǒng)設計[J]. 現代電子技術, 2019,42(06): 51-54.
[2] Donoho D L. Compressed sensing[J]. IEEE Transactions on Information Theory, 2006, 52(4): 1289-1306.
[3] 歐偉楓. 視頻壓縮感知多假設預測重構算法研究[D]. 華南理工大學, 2016.6.
[4] 楊春玲, 鄭學煒. CVS中基于多維度參考幀的雙稀疏重構算法[J]. 華南理工大學學報, 2018.46(8): 1-10.
[5] Wiegand T. Draft ITU-T recommendation and final draft international standard of joint video specification (ITU-T Rec. H. 264| ISO/IEC 14496-10 AVC) [J]. JVT-G050, 2003.