王鳳領
摘要: 基于壓縮域視頻片段檢測可以省略解壓步驟,直接從原始視頻數(shù)據(jù)流提取特征,可以加快檢測率。本文首先分析了視頻數(shù)據(jù)的特性,視頻的分割和關鍵幀的選取,闡述現(xiàn)有的典型方法,通過分析視頻檢索技術的關鍵技術,采用基于視頻分割和關鍵幀的壓縮視頻流提取方法,提出了一種基于DC系數(shù)和運動矢量從MPEG壓縮視頻中提取關鍵幀的方法。實驗表明,所提出的方法可以減少計算負擔,并可以更好地表示視頻內(nèi)容。
關鍵詞:壓縮視頻流; DC系數(shù); 運動矢量; 關鍵幀提取
中圖分類號:TP391
文獻標志碼: A
文章編號: 2095-2163(2017)05-0079-04
0引言
視頻數(shù)據(jù)是一種非結構化數(shù)據(jù)。數(shù)據(jù)的復雜性和數(shù)量巨大以及表達方法的匱乏均使得視頻存儲和檢索成為研究難題。為了便捷管理并充分利用視頻信息,視頻分析則尤顯必要。同時還需發(fā)掘科學合理的視頻組織結構以提取視頻的特征并將其合成,以便有效地存儲和檢索視頻數(shù)據(jù)。
1視頻數(shù)據(jù)特征
不同于傳統(tǒng)的字符數(shù)字數(shù)據(jù),視頻數(shù)據(jù)作為一種多媒體信息,實質(zhì)上則屬于非字符數(shù)字數(shù)據(jù)。與傳統(tǒng)的字符數(shù)值數(shù)據(jù)相比,視頻數(shù)據(jù)具有更加豐富的內(nèi)容。對其可做如下解析:
1)視頻數(shù)據(jù)具有較高的信息分辨率。信息分辨率是指媒體提供細節(jié)的數(shù)目。視頻數(shù)據(jù)若輔以深入的觀察,可以逐漸得到一些新的細節(jié)。
2)視頻數(shù)據(jù)內(nèi)容的多樣性。視頻數(shù)據(jù)作為表示信息的媒介,整體上可以分為2種類型的內(nèi)容:稱為信息內(nèi)容的一類視頻內(nèi)容,具體指代了視頻包含語義內(nèi)容;另一種類型的視頻內(nèi)容,稱為音頻和視頻內(nèi)容,其中攜帶了包含在外部視覺表示中的視頻和音頻。
3)視頻數(shù)據(jù)解釋的多樣性和模糊性。視頻數(shù)據(jù)是連續(xù)重放的圖像信息,并且包含在圖像幀中的信息非常豐富。因而對圖片或視頻就可能生成不同的解釋,如此即與字符數(shù)值數(shù)據(jù)對視頻數(shù)據(jù)有完全準確和客觀的解釋而有所不同的是,其中往往夾雜有個人主觀因素。在視頻數(shù)據(jù)庫中,經(jīng)常只是立足于查詢的相似性,即只是近似匹配的視頻數(shù)據(jù)查詢[1]。
[BT4]2視頻分段
視頻分割標準具有多樣性和復雜性的特點。對于不同的視頻對象及其應用,視頻分段也是不同的。這就使得視頻數(shù)據(jù)在組織上將建立為多級樹結構。例如,對于故事片的組織,從低到高級可以是鏡頭、場景和情節(jié)。一般來說,樹結構的底部是透鏡。任何視頻流由許多場景組成。因此,視頻數(shù)據(jù)庫,新的視頻數(shù)據(jù)流進入數(shù)據(jù)庫,數(shù)據(jù)模型應該基于多級數(shù)據(jù)流分割,底層一般是透鏡分割。研究可知,在視頻分割結構中,鏡頭是視頻剪輯的最重要形式,鏡頭技術的檢測相對來說已較為成熟[2]。
5.1MPEG視頻壓縮技術
對于MPEG壓縮標準,當視頻流被壓縮時,幀被組壓縮(GOP-圖片組)。如圖1所示,I和P幀稱為參考幀。在每組圖像中,第1幀總是B幀,并且?guī)瑑?nèi)編碼用于基于塊(8×8)的離散余弦變換(DCT)來量化圖像。I幀中主要可用信息是DCT的DC系數(shù)。P幀使用前向預測幀間編碼,并且在前I幀或P幀中可定義參考幀和宏塊作為單位執(zhí)行運動預測和運動補償。主要可用信息是用于運動預測的前向運動矢量和用于運動補償?shù)念A測殘差的DCT系數(shù)。在B幀中則呈現(xiàn)了被雙向預測的3種類型的運動矢量,分別是:前向運動矢量、后向運動矢量和雙向運動矢量[11]。
[6結束語
根據(jù)視頻數(shù)據(jù)及其信息的特點,探討研究了視頻的分割和關鍵幀的選取,綜述了現(xiàn)有的典型方法,通過分析視頻檢索技術的關鍵技術,采用基于視頻分割和關鍵幀的壓縮視頻流提取方法,設計提出了一種基于DC系數(shù)和運動矢量從MPEG壓縮視頻中提取關鍵幀的方法。實驗表明,本次研發(fā)提出的方法可以減少計算負擔,并可以更好地表示視頻內(nèi)容。
參考文獻:
胡圣武, 李鯤鵬. 三維GIS 關鍵技術的研究[J]. 地理空間信息,2008,6(3):9-12.
[2] 朱映映, 周洞汝. 一種從壓縮視頻流中提取關鍵幀的方法[J]. 計算機工程與應用,2003(18):13-14,48.
[3] 王娣, 黃春毅. 基于內(nèi)容的視頻檢索[J]. 現(xiàn)代圖書情報技術,2000(86):71-72,78.
[4] 陸燕, 陳福生. 基于內(nèi)容的視頻檢索技術[J]. 計算機應用研究,2003(11):1-4.
[5] 張若英, 申銥京. 基于內(nèi)容的視頻檢索方法的研究[J]. 計算機工程與應用,2004(6):196-199.
[6] 朱愛紅, 李連. 基于內(nèi)容的視頻檢索關鍵技術研究[J]. 情報檢索,2004(1):45-47.
[7] 彭宇新, CHONG_WAH N, 郭宗明,等. 基于內(nèi)容的視頻檢索關鍵技術[J]. 計算機工程,2004,30(1):14-16.
[8] 孟倩. 基于內(nèi)容檢索的視頻數(shù)據(jù)庫數(shù)據(jù)模型的研究[J]. 徐州師范大學學報(自然科學版), 2003,21(4):59-62. [ZK)]
[9] NAKAJIMA Y. A video browsing using fast scene cut detection for an efficient networked video database access[J]. IE ICE Transactions on Information & System, 1994, E77-D (12): 1335-1364.
[10]YEO B L, LIU B. A unified approach to temporal segmentation of motion JPEG and MPEG compressed video[C]//Proc IEEE Intconf on multimedia computing and systems. Washington,DC:IEEE, 1995: 81-89.
[11]KOPRINSKA I,CARRATO S. Temporal video segmentation:A survey[J]. Signal Processing Image Communication, 2001,16(5): 477-500.endprint