孫曉雪++隋文秀++侯一民
摘要:近年來,隨著信息技術(shù)的迅猛發(fā)展,各種各樣的視頻信息和人們的生活戚戚相關(guān),視頻技術(shù)的研究儼然成為一個(gè)熱門的研究領(lǐng)域。本文重點(diǎn)對(duì)視頻的底層特征中的彩色特征、運(yùn)動(dòng)特征和鏡頭特征進(jìn)行了提取技術(shù)的研究。在計(jì)算彩色特征和運(yùn)動(dòng)特征時(shí)首先把預(yù)告片視頻分離成單幀圖像,再計(jì)算每個(gè)預(yù)告片中的每幀圖像的這兩類特征,最后取整個(gè)預(yù)告片視頻的所有幀的均值作為最終需要的特征結(jié)果。而鏡頭特征是根據(jù)每個(gè)預(yù)告片視頻的關(guān)鍵幀的位置獲得的。
關(guān)鍵詞:視頻底層特征 彩色特征 運(yùn)動(dòng)特征 鏡頭特征
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2014)12-0091-01
1 引言
近些年來,隨著人類社會(huì)進(jìn)入信息時(shí)代,視頻圖像有關(guān)硬件(攝像頭、視頻采集卡、視頻處理芯片、計(jì)算機(jī))的普及及其價(jià)格的大幅度降低,視頻產(chǎn)品以及多媒體產(chǎn)品正以飛快的速度滲透到人們生活的各個(gè)方面。其巨大的商業(yè)價(jià)值和應(yīng)用前景受到了越來越多的公司、科研機(jī)構(gòu)以及大中專學(xué)校的重視,并紛紛投入到視頻圖像的研究和開發(fā)工作中,目前,視頻技術(shù)的研究儼然成為一個(gè)熱門的研究領(lǐng)域。
為了識(shí)別、理解或建模視覺媒體,需要提取相關(guān)的底層特征來進(jìn)行分析。本文重點(diǎn)對(duì)彩色特征、運(yùn)動(dòng)特征和鏡頭特征這三類底層特征進(jìn)行了提取。特征的提取過程如圖1所示。
2 彩色特征
色彩是視覺的一個(gè)重要屬性,彩色直方圖是重要的彩色特征,常用來表示圖像內(nèi)容顏色信息的相似性,它為識(shí)別多顏色對(duì)象的魯棒性、有效性提供了一個(gè)強(qiáng)大而有效的線索[1]。但是正如本文前面所敘述的,亮度值、對(duì)比度值和其他一些參數(shù)也應(yīng)該作為本課題的研究內(nèi)容被提及到。在彩色特征部分涉及預(yù)告片視頻中的亮度、對(duì)比度、飽和度、色彩度和幀簡單程度的均值和方差這10個(gè)評(píng)價(jià)特征。亮度特征是在HSV空間中計(jì)算的,它是視頻的每一幀中每個(gè)像素的亮度均值。相似的,飽和度也是視頻中每一幀中每個(gè)像素在HSV空間計(jì)算的均值。一個(gè)幀的對(duì)比度計(jì)算如下:
式中,r,g和b是取決于視頻幀中所有像素紅色、綠色和藍(lán)色的分量。
色彩度是反映圖像色彩混合復(fù)雜性的參數(shù)。幀中色彩度特征定義如下:
在一幀中,var是計(jì)算數(shù)據(jù)方差的函數(shù),mean是計(jì)算數(shù)據(jù)均值的函數(shù)。
當(dāng)拍攝電影時(shí)為了減少背景中對(duì)象帶來的注意力分散,攝影師經(jīng)常使背景相對(duì)一致或簡單。我們用背景中的顏色分布來衡量這個(gè)簡單度,幀簡單度特征用文獻(xiàn)[2]中的方法定義,提取視頻中每一幀的所有特征,視頻中幀簡單度的最終特征值就是計(jì)算每一幀特征的均值。
3 運(yùn)動(dòng)特征
運(yùn)動(dòng)特征是反映視頻中圖像的場(chǎng)景或?qū)ο蟮淖兓省.?dāng)拍攝視頻時(shí),如果是平移、跟蹤或縮放它也可被視為相機(jī)的移動(dòng)速度。
可通過以下的方法計(jì)算運(yùn)動(dòng)特征。首先,把預(yù)告片視頻中的圖像分割成16×16塊。計(jì)算每一塊的中心并比較第n幀和第n+1圖像。根據(jù)塊中心的變化率,把塊中心變化的均值作為幀的運(yùn)動(dòng)特征。在整個(gè)視頻中,所有幀運(yùn)動(dòng)的均值作為運(yùn)動(dòng)特征。所有幀運(yùn)動(dòng)的方差作為視頻的運(yùn)動(dòng)方差。
4 鏡頭特征
鏡頭的長度和方差對(duì)于預(yù)告片視頻也是很重要的特征。為了計(jì)算鏡頭長度和鏡頭長度方差,必須首先選擇關(guān)鍵幀。本文中采用相對(duì)簡單的方法獲得預(yù)告片視頻的關(guān)鍵幀,即選擇視頻中位于鏡頭邊緣的幀,這意味著,當(dāng)鏡頭變化時(shí),第一和最后一幅圖像可被視為關(guān)鍵幀。提取視頻中的每一幀,然后結(jié)合第n幀和第n+1幀的彩色直方圖和邊緣直方圖,用相應(yīng)于這兩幀的矩陣的相關(guān)值比較相鄰幀。特征的提取和組合方法用文獻(xiàn)[3]中提到的基本方法實(shí)現(xiàn)。選擇關(guān)鍵幀后,應(yīng)關(guān)注預(yù)告片視頻中的四個(gè)值,它們是“視頻長度”、“鏡頭數(shù)目”、“鏡頭長度均值”和“鏡頭方差均值”?!耙曨l長度”是整個(gè)預(yù)告片的持續(xù)時(shí)間。“鏡頭數(shù)目”是預(yù)告片中鏡頭的數(shù)目。“鏡頭長度均值”是預(yù)告片所有鏡頭持續(xù)時(shí)間的均值。“鏡頭長度方差”是預(yù)告片中所有鏡頭的長度方差。
經(jīng)過以上步驟后,將獲得包括“亮度均值”、“對(duì)比度均值”、“飽和度均值”、等16個(gè)特征。
5 結(jié)語
本文著重對(duì)視頻彩色、運(yùn)動(dòng)及鏡頭三大類特征的提取技術(shù)進(jìn)行了研究,然而在視頻研究方面還有很多需要解決的問題,下一步要做的是進(jìn)一步對(duì)所提取的特征進(jìn)行分析選擇,并結(jié)合更多的主、客觀因素進(jìn)行綜合研究。