公衍超,吳 晗,楊楷芳,劉 穎,林慶帆,5,王富平,劉伯陽(yáng)
(1.西安郵電大學(xué) 通信與信息工程學(xué)院,陜西 西安 710121;2.西安郵電大學(xué) 陜西省法庭科學(xué)電子信息實(shí)驗(yàn)研究中心,陜西 西安 710121; 3.西安郵電大學(xué) 陜西省無(wú)線(xiàn)通信與信息處理技術(shù)國(guó)際聯(lián)合研究中心,陜西 西安 710121;4.陜西師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,陜西 西安 710119;5.新加坡XsecPro公司,新加坡 787820)
視頻安全是信息安全、網(wǎng)絡(luò)安全的重要體現(xiàn)[1],以檢測(cè)視頻內(nèi)容篡改信息為目的的視頻取證技術(shù)是視頻安全的重要保障[2]。近年來(lái),隨著視頻編輯軟件功能的日益強(qiáng)大和深度篡改技術(shù)的飛速發(fā)展[2],篡改者很容易對(duì)視頻進(jìn)行“視覺(jué)不可察覺(jué)”的篡改,這對(duì)視頻取證技術(shù)提出了新的要求。在當(dāng)前大部分視頻應(yīng)用中,視頻信號(hào)依次要經(jīng)過(guò)采集、編碼/壓縮、傳輸、存儲(chǔ)、解碼及顯示等操作,并且在編碼/壓縮、傳輸、存儲(chǔ)和解碼操作中是以視頻碼流的形式表達(dá)視頻內(nèi)容[3-4]。篡改者通常在傳輸與存儲(chǔ)的過(guò)程中對(duì)視頻內(nèi)容進(jìn)行篡改,并且篡改后視頻內(nèi)容必須要經(jīng)過(guò)再次編碼壓縮后才能生成包含篡改信息的視頻碼流,完成整個(gè)篡改操作。因此,編碼壓縮次數(shù)成為判定原始視頻是否被篡改的一個(gè)必要條件。以檢測(cè)視頻編碼壓縮次數(shù)為目的技術(shù)被稱(chēng)為視頻重壓縮取證技術(shù),其在刑事偵查、法庭科學(xué)領(lǐng)域有著重要應(yīng)用。
當(dāng)前一些高效的視頻重壓縮取證技術(shù)已經(jīng)被提出。由于不同視頻編碼標(biāo)準(zhǔn)采用不同的編碼技術(shù),直接影響了壓縮碼流的語(yǔ)法語(yǔ)義及篡改遺留痕跡,因此視頻重壓縮取證技術(shù)都有其具體的適用標(biāo)準(zhǔn)。面向MPEG-2、MPEG-4及H.264/AVC標(biāo)準(zhǔn),分別提出了有效的視頻重壓縮取證方法[5-11]。He等[5]基于局部運(yùn)動(dòng)矢量場(chǎng)計(jì)算預(yù)測(cè)殘差,可以得到重壓縮的痕跡。文獻(xiàn)[6]將塊效應(yīng)強(qiáng)度和宏塊量化信息相結(jié)合,可以有效地防止有損壓縮引起的誤差。Vazque等[7]采用幀內(nèi)模式宏塊和跳過(guò)模式宏塊的數(shù)量變化信息構(gòu)造重壓縮特征。Li等[8]將解壓縮的視頻幀視為靜止圖像,提取像素鄰接矩陣差,采用半監(jiān)督學(xué)習(xí)框架基于高斯密度的單分類(lèi)器可以提高分類(lèi)器的魯棒性。文獻(xiàn)[9]提取離散余弦變換系數(shù)特征基于卷積神經(jīng)網(wǎng)絡(luò)在幀內(nèi)定位雙壓縮區(qū)域,但這種方法計(jì)算復(fù)雜度較高。文獻(xiàn)[10]將宏塊類(lèi)型和運(yùn)動(dòng)矢量信息構(gòu)造為宏塊統(tǒng)計(jì)特征,然后計(jì)算兩次連續(xù)壓縮之間不同宏塊特征的數(shù)量,隨著壓縮次數(shù)的增加,不同宏塊特征的數(shù)量減少的趨勢(shì)趨于平緩。文獻(xiàn)[11]在文獻(xiàn)[10]的基礎(chǔ)上又考慮I幀的宏塊統(tǒng)計(jì)特征。文獻(xiàn)[5-9]是面向不同編碼參數(shù)重壓縮的情況,而文獻(xiàn)[10-11]則是面向相同編碼參數(shù)重壓縮的情況。相比于不同編碼參數(shù),使用相同編碼參數(shù)重壓縮的視頻,其壓縮痕跡通常更小,重壓縮取證難度更大[11-12]。
MPEG-2、MPEG-4及H.264/AVC都是2003年之前發(fā)布的標(biāo)準(zhǔn)。2003年之后視頻快速向高清化發(fā)展,高清視頻及設(shè)備被大量普及。相應(yīng)地,國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門(mén)(International Telecommunication Union-Telecommunication Standardization Sector,ITU-T)和國(guó)際標(biāo)準(zhǔn)化組織(International Organization for Standardization,ISO)/國(guó)際電工委員會(huì)(International Electrotechnical Commission,IEC)于2013年共同發(fā)布了首個(gè)面向高清視頻的國(guó)際視頻編碼標(biāo)準(zhǔn)—高效視頻編碼(High Efficiency Video Coding,HEVC)標(biāo)準(zhǔn)。面向HEVC標(biāo)準(zhǔn),大量有效視頻重壓縮取證方法被提出[12-20]。文獻(xiàn)[13-17]針對(duì)不同編碼參數(shù)情況提出了重壓縮取證方法。具體地,文獻(xiàn)[13-14]是考慮使用不同量化參數(shù)(Quantization Parameter,QP)重壓縮的情況,文獻(xiàn)[15-17]則是考慮不同圖像組(Group of Picture,GOP)結(jié)構(gòu)的重壓縮情況。文獻(xiàn)[12,18-20]針對(duì)相同編碼參數(shù)的情況提出了重壓縮取證方法。
近年來(lái),視頻除了繼續(xù)向高清/超高清化發(fā)展之外,也在朝著高幀率、高色彩分量采樣深度、高動(dòng)態(tài)范圍及360度全景等方向發(fā)展,包括HEVC在內(nèi)的早期視頻編碼標(biāo)準(zhǔn)的編碼效率已經(jīng)很難滿(mǎn)足現(xiàn)實(shí)需求。相應(yīng)地,由ITU-T和ISO/IEC聯(lián)合制定的通用視頻編碼[21](Versatile Video Coding,VVC)標(biāo)準(zhǔn)應(yīng)運(yùn)而生。VVC是于2020年發(fā)布的最新一代國(guó)際視頻編碼標(biāo)準(zhǔn),其壓縮效率大約是HEVC的2倍,是H.264/AVC的4倍[21],并且同時(shí)滿(mǎn)足超高清、屏幕內(nèi)容、高動(dòng)態(tài)/寬色域及360度全景等視頻內(nèi)容的編碼需求。憑借著優(yōu)異的壓縮效率及顯著的通用性,VVC具有廣闊的市場(chǎng)應(yīng)用前景。
VVC采用了大量先進(jìn)的編碼技術(shù),不僅顯著提高了視頻編碼效率,同時(shí)也改變了壓縮碼流的語(yǔ)法語(yǔ)義與壓縮痕跡[21],使得當(dāng)前提出的視頻重壓縮取證技術(shù)[5-20]不能有效地適用于VVC標(biāo)準(zhǔn)。因此,為了提升面向VVC標(biāo)準(zhǔn)重壓縮取證效率,擬提出面向VVC標(biāo)準(zhǔn)相同編碼參數(shù)的視頻重壓縮取證方法。將VVC壓縮視頻中與壓縮次數(shù)有密切關(guān)系的基礎(chǔ)碼流特征,通過(guò)建模得到高級(jí)碼流特征,將其與QP級(jí)聯(lián)作為支持向量機(jī)的輸入,從而得到取證結(jié)果。為了驗(yàn)證所提方法的性能,在算法準(zhǔn)確度、幀刪除視頻的重壓縮檢取證、算法復(fù)雜度方面進(jìn)行驗(yàn)證。
VVC仍然采用基于塊的混合編碼框架,視頻圖像被分割為編碼樹(shù)狀單元(Coding Tree Unit,CTU)。VVC標(biāo)準(zhǔn)摒棄了HEVC標(biāo)準(zhǔn)采用的預(yù)測(cè)單元、變換單元概念,而是統(tǒng)一使用編碼單元(Coding Unit,CU),CU是VVC中進(jìn)行幀內(nèi)預(yù)測(cè)的基本單元。幀內(nèi)預(yù)測(cè)利用相鄰CU的重建像素值為當(dāng)前編碼CU中的原始像素值尋找最優(yōu)預(yù)測(cè)值,并將原始像素值與預(yù)測(cè)值相減得到殘差,殘差是后續(xù)變換模塊的輸入。幀內(nèi)預(yù)測(cè)技術(shù)可以有效消除原始像素間的空余冗余,顯著提高視頻編碼效率。
在幀內(nèi)預(yù)測(cè)中CU劃分類(lèi)型和最優(yōu)預(yù)測(cè)值獲取是兩個(gè)關(guān)鍵步驟。前者決定了CU的大小與形狀,影響幀內(nèi)預(yù)測(cè)的輸入,后者決定了最終預(yù)測(cè)殘差的特性,影響幀內(nèi)預(yù)測(cè)的輸出。VVC中與上述兩個(gè)關(guān)鍵步驟密切相關(guān)的技術(shù)是CU劃分技術(shù)、幀內(nèi)預(yù)測(cè)模式選擇和多參考行(Multiple Reference Line,MRL)技術(shù)。下面逐一介紹這些技術(shù),并分析獲得上述技術(shù)中與視頻壓縮次數(shù)密切相關(guān)的基礎(chǔ)碼流特征。
為了適應(yīng)更加豐富的視頻內(nèi)容及更多的視頻類(lèi)型,VVC采用了更靈活的CU劃分技術(shù)以支持更多的CU形狀及更大的塊大小。VVC不再使用單一的四叉樹(shù)CU劃分方式,而是使用在四叉樹(shù)的基礎(chǔ)上嵌套了二叉樹(shù)和三叉樹(shù)的多類(lèi)型樹(shù)(Multi-Type Tree,MTT)劃分方式。具體地,VVC中的CTU首先按照四叉樹(shù)方式劃分成不同的CU,然后四叉樹(shù)的葉子節(jié)點(diǎn)CU再按照MTT方式進(jìn)行劃分。
VVC中幀內(nèi)預(yù)測(cè)(Intra-prediction,I)幀亮度分量支持的CU類(lèi)型,如表1所示。VVC采用拉格朗日率失真優(yōu)化方法[3,21-22]為每一個(gè)CTU選擇一組最優(yōu)的CU劃分類(lèi)型,即在滿(mǎn)足CTU總碼率受限的情況下,選擇一組CU劃分類(lèi)型,使得CTU的總失真最小。
表1 VVC中I幀亮度分量支持的CU劃分類(lèi)型
最優(yōu)CU劃分類(lèi)型信息經(jīng)熵編碼后會(huì)被寫(xiě)入到視頻碼流的頭信息中,因此,CU劃分類(lèi)型屬于基礎(chǔ)碼流特征。下面進(jìn)一步分析CU劃分類(lèi)型與視頻壓縮次數(shù)的關(guān)系。理論上,首先,基于量化多對(duì)一的映射原理,使用VVC有損編碼模式編碼同一個(gè)視頻內(nèi)容時(shí),隨著壓縮次數(shù)的增加解碼視頻內(nèi)容會(huì)越來(lái)越模糊,即視頻內(nèi)容越來(lái)越簡(jiǎn)單。其次,基于幀內(nèi)預(yù)測(cè)去相關(guān)原理,CU劃分類(lèi)型與輸入編碼視頻的內(nèi)容復(fù)雜度具有密切關(guān)系,即視頻內(nèi)容越簡(jiǎn)單則對(duì)應(yīng)選擇大尺寸CU劃分類(lèi)型的概率越高?;谝陨蟽煞矫嬖?理論上,CU劃分類(lèi)型與視頻壓縮次數(shù)具有密切關(guān)系,即隨著壓縮次數(shù)增加,視頻碼流中大尺寸CU類(lèi)型的比例會(huì)升高。下面通過(guò)實(shí)驗(yàn)進(jìn)一步驗(yàn)證上述分析。
采用VVC測(cè)試模型VTM11.0[23]編碼標(biāo)準(zhǔn)測(cè)試視頻 Night,視頻的顏色空間及空間分辨率分別為YCbCr4∶2∶0及720P。檔次為main_10,編碼結(jié)構(gòu)為L(zhǎng)DP,QP為37,其他編碼參數(shù)參照配置文件encoder_lowdelay_P_vtm.cfg中的默認(rèn)設(shè)置。按照包含的像素?cái)?shù),將表1所示的CU類(lèi)型分為小尺寸CU和大尺寸CU兩類(lèi),小尺寸CU包括編號(hào)為1-7、9、10、13的CU,其他編號(hào)CU屬于大尺寸CU。Night序列所有I幀大尺寸和小尺寸CU占比隨著壓縮次數(shù)的變化如圖1所示。
圖1 Night中I幀CU劃分類(lèi)型占比隨壓縮次數(shù)的變化
由圖1可以看出,隨著壓縮次數(shù)的增加,大尺寸CU的占比逐漸升高,小尺寸CU的占比逐漸降低。Night序列第1幀圖像第1次和第2次壓縮視頻碼流中對(duì)應(yīng)的CU 劃分類(lèi)型如圖2所示。圖2中不同大小的矩形塊表示不同劃分類(lèi)型的CU,為了清楚地觀察CU劃分類(lèi)型隨壓縮次數(shù)的變化,將左圖中方框區(qū)域放大如右圖。
圖2 Night序列第1幀圖像對(duì)應(yīng)的CU劃分類(lèi)型
由圖2可以驗(yàn)證圖1得出的結(jié)論,即隨著壓縮次數(shù)的增加,視頻碼流中大尺寸CU劃分類(lèi)型的占比會(huì)升高。
為了適應(yīng)更加豐富的視頻內(nèi)容,VVC采用了更多的幀內(nèi)預(yù)測(cè)模式,包括傳統(tǒng)的DC模式和Planar模式,以及多達(dá)65種的角度預(yù)測(cè)模式[21],具體如圖3所示。圖3中實(shí)線(xiàn)箭頭表示VVC和HEVC都采用的33種角度預(yù)測(cè)模式,虛線(xiàn)箭頭表示VVC新增加的32種角度預(yù)測(cè)模式,角度方向從45°至-135°。另外,VVC支持矩形的CU,為了給矩形CU找到最優(yōu)的參考像素,VVC新增加了寬角度幀內(nèi)預(yù)測(cè)技術(shù),使得矩形塊對(duì)應(yīng)的角度模式被擴(kuò)展為93種,擴(kuò)展模式如圖3點(diǎn)線(xiàn)箭頭所示。
圖3 VVC采用的幀內(nèi)預(yù)測(cè)模式
VVC也是采用拉格朗日率失真優(yōu)化方法[3,21-22]為每一個(gè)CU選擇最優(yōu)的幀內(nèi)預(yù)測(cè)模式。最優(yōu)幀內(nèi)預(yù)測(cè)模式選擇思路與最優(yōu)CU劃分選擇思路類(lèi)似。并且CU的最優(yōu)幀內(nèi)預(yù)測(cè)模式信息也會(huì)經(jīng)熵編碼后寫(xiě)入視頻碼流的頭信息中,因此CU預(yù)測(cè)模式也屬于基礎(chǔ)碼流特征。下面進(jìn)一步分析CU預(yù)測(cè)模式與視頻壓縮次數(shù)的關(guān)系。
如圖3所示,當(dāng)使用角度預(yù)測(cè)模式時(shí),CU像素的預(yù)測(cè)值由其對(duì)應(yīng)角度方向的參考像素值得到,理論上各種角度模式適用于對(duì)應(yīng)紋理方向的區(qū)域。當(dāng)使用DC模式時(shí),CU像素的預(yù)測(cè)值是其左側(cè)和上方所有參考像素的平均值,因此理論上DC模式適用于大面積的平坦區(qū)域。當(dāng)使用Planar模式時(shí),CU像素的預(yù)測(cè)值可以看成是水平和垂直兩個(gè)角度方向預(yù)測(cè)值的平均值,理論上Planar模式適用于像素值漸變的區(qū)域。基于量化多對(duì)一的映射原理,使用VVC有損編碼模式編碼同一個(gè)視頻內(nèi)容時(shí),隨著壓縮次數(shù)的增加,解碼視頻內(nèi)容會(huì)變的越來(lái)越簡(jiǎn)單,視頻內(nèi)容方向性信息會(huì)逐漸模糊,平坦與漸變區(qū)域逐漸增多。最終導(dǎo)致角度預(yù)測(cè)模式的比例會(huì)逐漸降低,而DC與Planar模式的比例會(huì)逐漸升高。下面通過(guò)實(shí)驗(yàn)進(jìn)一步驗(yàn)證上述分析。
使用VTM11.0編碼Night序列,其他編碼設(shè)置與上述描述的設(shè)置一致。Night序列所有I幀CU預(yù)測(cè)模式占比隨壓縮次數(shù)的變化情況具體如圖4所示。由圖4中數(shù)據(jù)可以看出,隨著壓縮次數(shù)的增加,視頻碼流中DC與Planar模式CU的占比逐漸增加,而其他角度預(yù)測(cè)模式CU的占比逐漸降低。通過(guò)Night序列第1幀第1次和第2次壓縮視頻碼流中CU 預(yù)測(cè)模式的變化情況,分析視頻壓縮次數(shù)影響CU預(yù)測(cè)模式的選擇,具體情況如圖5所示,圖中不同灰度表示不同的預(yù)測(cè)模式。為了清楚地觀察CU預(yù)測(cè)模式隨壓縮次數(shù)的變化,將左圖中方框區(qū)域放大如右圖所示。
圖4 Night中I幀CU預(yù)測(cè)模式占比隨壓縮次數(shù)的變化
圖5 Night序列第1幀圖像對(duì)應(yīng)的CU預(yù)測(cè)模式
VVC新采用的MRL技術(shù)顯著影響CU預(yù)測(cè)值的獲得。參考行的選擇不再只是相鄰行,具體如圖6所示。圖6中A~F段表示當(dāng)前編碼CU可選的參考像素位置,在為當(dāng)前編碼CU選擇參考像素時(shí),包括HEVC在內(nèi)的之前標(biāo)準(zhǔn)只支持從已編碼CU最臨近參考行中選擇,即圖6中所示的參考行0。為了適應(yīng)更廣泛的視頻內(nèi)容,為當(dāng)前CU選擇最優(yōu)的預(yù)測(cè)值,VVC標(biāo)準(zhǔn)支持從已編碼CU臨近3行中為當(dāng)前編碼CU選擇參考像素,即圖6所示的參考行0、1、3。使用參考行0、1是因?yàn)槠渑c當(dāng)前編碼CU最近,具有更強(qiáng)的相關(guān)性。參考行3距離當(dāng)前編碼CU比較遠(yuǎn),相比于參考行0、1,其可以補(bǔ)充提供其他有效參考信息。而參考行2很難提供額外的有效參考信息,同時(shí)權(quán)衡編碼復(fù)雜度,VVC不支持參考行2的使用[24]。
圖6 多參考行示例
參考行與幀內(nèi)預(yù)測(cè)模式共同決定了參考像素的來(lái)源,決定了最終預(yù)測(cè)值。因此,在VVC中最優(yōu)參考行的選擇是被整合到最優(yōu)預(yù)測(cè)模式選擇過(guò)程中。CU的最優(yōu)參考行信息經(jīng)熵編碼后會(huì)被寫(xiě)入視頻碼流的頭信息中,CU參考行信息也屬于基礎(chǔ)碼流特征。如前所述,隨著壓縮次數(shù)的增加,解碼視頻內(nèi)容會(huì)越來(lái)越模糊、越來(lái)越簡(jiǎn)單。此時(shí),臨近行對(duì)應(yīng)的相關(guān)性會(huì)增強(qiáng),遠(yuǎn)離行提供有效額外補(bǔ)充信息的幾率會(huì)降低。最終導(dǎo)致選擇參考行0的CU占比會(huì)增加,而選擇其他參考行CU的占比會(huì)降低。下面通過(guò)實(shí)驗(yàn)進(jìn)一步驗(yàn)證上述分析。
使用VTM11.0編碼Night序列,其他編碼設(shè)置與上述描述的設(shè)置一致。具體的Night序列所有I幀CU參考行占比隨壓縮次數(shù)的變化情況如圖7所示。由圖7可以看出,隨著壓縮次數(shù)的增加,視頻碼流中參考行0的CU的占比逐漸增加,其他參考行CU的占比逐漸降低。通過(guò)圖8更加直觀地分析Night序列第1幀第1次和第2次壓縮視頻碼流中CU 參考行信息的變化情況。圖8中,不同灰度表示不同參考行信息。為了清楚地觀察CU參考行隨壓縮次數(shù)的變化,將左圖中方框區(qū)域放大如右圖。由圖8可以看出,視頻壓縮次數(shù)影響CU參考行的選擇。
圖7 Night中I幀CU參考行占比隨壓縮次數(shù)的變化
圖8 Night序列第Ⅰ幀圖像對(duì)應(yīng)的CU參考行
前一部分已經(jīng)分析確定了與視頻壓縮次數(shù)相關(guān)的基礎(chǔ)碼流特征,即CU劃分類(lèi)型、幀內(nèi)預(yù)測(cè)模式及參考行。此部分將基于這些特征構(gòu)建高級(jí)碼流特征。高級(jí)碼流特征是后續(xù)支持向量機(jī)(Support Vector Machines,SVM)檢測(cè)視頻壓縮次數(shù)的輸入。
根據(jù)CU劃分類(lèi)型、幀內(nèi)預(yù)測(cè)模式及參考行計(jì)算不同屬性CU占比。定義第n次壓縮視頻第i個(gè)I幀第x列第y行CU的屬性矩陣為
Cn,i,x,y=[tn,i,x,y,mn,i,x,y,rn,i,x,y]
(1)
其中,
tn,i,x,y∈{1,2,3,…,Nt}mn,i,x,y∈{1,2,3,…,Nm}rn,i,x,y∈{1,2,3,…,Nr}
式中:n為壓縮視頻次數(shù)序號(hào),n∈{1,2,3,…,Nd},Nd為視頻壓縮總次數(shù);i為I幀序號(hào),i∈{1,2,3,…,Nn,I},Nn,I為第n次壓縮視頻包含的I幀數(shù)量;x、y分別為第i個(gè)I幀在水平及垂直方向上包含的CU的序號(hào),其中,x∈{1,2,3,…,w}、y∈{1,2,3,…,h},w、h分別為包含的CU最大數(shù)量;tn,i,x,y、mn,i,x,y、rn,i,x,y分別為第n次壓縮視頻第i個(gè)I幀第x列第y行CU選擇的劃分類(lèi)型、預(yù)測(cè)模式及參考行編號(hào);Nt、Nm、Nr分別為VVC標(biāo)準(zhǔn)支持的可選CU劃分類(lèi)型、預(yù)測(cè)模式及參考行總數(shù)量。
當(dāng)同一個(gè)I幀中相同空間位置CU相鄰兩次壓縮選擇的劃分類(lèi)型、預(yù)測(cè)模式及參考行信息相同時(shí),即定義其為相同屬性CU,反之則為不同屬性CU。相同屬性CU判別式為
Cn,i,x,y=Cn+1,i,x,y
(2)
式中,Cn+1,i,x,y為第n+1次壓縮視頻第i個(gè)I幀第x列第y行CU的屬性矩陣。Cn+1,i,x,y與Cn,i,x,y的定義類(lèi)似,只是將式(1)中的n換成n+1,這里不再贅述。
第n次壓縮視頻第i個(gè)I幀第x列第y行CU的屬性標(biāo)記為
(3)
式中,z為CU劃分類(lèi)型編號(hào),z∈{1,2,3,…,Nt}。最終第n次壓縮視頻所有I幀中選擇第z種CU劃分類(lèi)型的不同屬性CU占比Pn,z,u[12]為
(4)
式中,Nn,i,z為第n次壓縮視頻第i個(gè)I幀選擇第z種CU劃分類(lèi)型的CU數(shù)量。
定義CU劃分類(lèi)型占比作為第二個(gè)高級(jí)碼流特征。第n次壓縮視頻所有I幀中選擇第z種CU劃分類(lèi)型的CU占比Pn,z為
(5)
式中,Nn,i,c表示第n次壓縮視頻第i個(gè)I幀包含的CU總數(shù)量。
選擇QP作為第三個(gè)特征。QP是VVC量化模塊中包含的重要編碼參數(shù),其取值經(jīng)熵編碼后會(huì)被記錄到視頻碼流中。另外,使用VVC壓縮視頻時(shí)選擇的QP越大則視頻會(huì)越模糊,會(huì)顯著影響CU劃分類(lèi)型、預(yù)測(cè)模式及參考行的選擇。使用VTM11.0編碼Night序列,QP分別為27和47,其他編碼設(shè)置與上述描述的設(shè)置一致。Night序列第1幀圖像在不同QP下編碼對(duì)應(yīng)的CU信息情況如圖9所示??梢钥闯?隨著QP取值的變化,CU劃分類(lèi)型、預(yù)測(cè)模式與參考行信息都發(fā)生了明顯變化。
圖9 不同QP下Night序列第1幀對(duì)應(yīng)的CU信息
基于構(gòu)建的高級(jí)碼流特征,使用SVM提出面向VVC標(biāo)準(zhǔn)相同編碼參數(shù)的視頻重壓縮取證方法(Video Recompression Forensics for VVC,VVC-VRF)。視頻重壓縮取證問(wèn)題是一個(gè)典型的二分類(lèi)問(wèn)題,包括1次壓縮視頻和多次壓縮視頻兩類(lèi)。SVM適合于二分類(lèi)問(wèn)題[25- 26],且SVM對(duì)硬件的需求也比較低[26]。SVM原理是將線(xiàn)性不可分特征向量映射到高維空間以尋找用于分類(lèi)的超平面, VVC-VRF中的特征向量具體指的是由Pn,z,u、Pn,z、QP級(jí)聯(lián)得到的多維高級(jí)碼流特征向量。VVC-VRF采用的是支持向量機(jī)庫(kù)[25](Library for Support Vector Machines,LIBSVM),評(píng)估函數(shù)H(·)為
H(Fset)=sgn(ωTG(Fset)+b)
(6)
式中:ω和b分別為SVM的系數(shù);sgn(·)為符號(hào)函數(shù);Fset為多維的特征向量;G(·)為將Fset映射到高維空間的函數(shù),采用徑向基核函數(shù)。提出的VVC-VRF方法框架如圖10所示。
圖10 VVC-VRF方法框架
VVC-VRF方法的具體實(shí)施步驟如下。
步驟1在視頻通信系統(tǒng)中,編碼后的視頻都以視頻碼流的形式存儲(chǔ)。因此,視頻重壓縮取證的輸入是經(jīng)過(guò)n次壓縮后的視頻碼流bn。首先從bn中提取QP、CU的劃分類(lèi)型、預(yù)測(cè)模式及參考行信息。
步驟2根據(jù)式(1)確定bn對(duì)應(yīng)的CU屬性矩陣Cn,i,x,y,根據(jù)式(5)計(jì)算bn對(duì)應(yīng)的Pn,z。
步驟3使用VVC解碼器解碼bn為YCbCr格式視頻Yn,然后使用VVC編碼器在相同參數(shù)下再次壓縮Yn1次并獲得對(duì)應(yīng)的視頻碼流bn+1。
步驟4進(jìn)一步從bn+1中提取CU的劃分類(lèi)型、預(yù)測(cè)模式及參考行信息,確定bn+1對(duì)應(yīng)的CU屬性矩陣Cn+1,i,x,y,并結(jié)合步驟2獲得的Cn,i,x,y,根據(jù)式(2)—式(4)計(jì)算得到Pn,z,u。
步驟5將QP、Pn,z、Pn,z,u級(jí)聯(lián)并構(gòu)造高級(jí)碼流特征Fset=[Q,Pn,1,u,…,Pn,Nt,u,Pn,1,…,Pn,Nt],其中Q為量化參數(shù)。
步驟6將Fset輸入SVM得到分類(lèi)結(jié)果,判定bn是1次壓縮視頻碼流還是多次壓縮視頻碼流。特別地,SVM模型在使用前還需要經(jīng)過(guò)訓(xùn)練。
選擇29個(gè)標(biāo)準(zhǔn)的包含不同內(nèi)容特征的視頻序列構(gòu)建原始視頻數(shù)據(jù)集。視頻的顏色空間和分辨率分別為YCbCr4∶2∶0和720P。為了進(jìn)一步增加原始視頻序列的樣本數(shù)量,將每個(gè)原始視頻序列裁剪成視頻片段,每個(gè)視頻片段包含100幀,最終獲得117個(gè)原始視頻片段用于編碼壓縮。采用VTM-11.0編碼原始視頻片段和解碼對(duì)應(yīng)的視頻碼流。編碼檔次為main_10,編碼結(jié)構(gòu)為低時(shí)延編碼結(jié)構(gòu)中的LDP和LDB。QP選擇標(biāo)準(zhǔn)[27]規(guī)定的4組取值,即22、27、32、37,并在此基礎(chǔ)上再增加42和47兩組取值代表中低碼率下的應(yīng)用場(chǎng)景。其他編碼參數(shù)分別參照配置文件encoder_lowdelay_P_vtm.cfg和encoder_lowdelay_vtm.cfg中的默認(rèn)設(shè)置。
將經(jīng)過(guò)1次編碼生成的視頻碼流標(biāo)記為正樣本,經(jīng)過(guò)2次編碼生成的視頻碼流標(biāo)記為負(fù)樣本。然后分別從正樣本和負(fù)樣本中隨機(jī)提取60%的樣本組成訓(xùn)練集,其他40%的樣本組成測(cè)試集。訓(xùn)練集用于VVC-VRF方法中SVM模型的訓(xùn)練,測(cè)試集用于最終的性能測(cè)試。視頻重壓縮取證準(zhǔn)確度As[12]定義為
(7)
式中,Ak、Aj分別為測(cè)試集正樣本和負(fù)樣本對(duì)應(yīng)的重壓縮取證準(zhǔn)確度。
文獻(xiàn)[12]提到的幀內(nèi)預(yù)測(cè)單元預(yù)測(cè)模式(Intra Prediction Unit Prediction Mode,IPUPM)代表了當(dāng)前視頻重壓縮取證領(lǐng)域先進(jìn)水平。因此,將VVC-VRF方法與IPUPM方法進(jìn)行對(duì)比,兩種方法對(duì)應(yīng)的重壓縮取證準(zhǔn)確度如表2所示。
表2 視頻重壓縮取證準(zhǔn)確度As
針對(duì)LDP結(jié)構(gòu),VVC-VRF方法與IPUPM方法的重壓縮取證準(zhǔn)確度分別為96.4%和91.1%,針對(duì)LDB結(jié)構(gòu),VVC-VRF與IPUPM方法的重壓縮取證準(zhǔn)確率分別為96.0%和93.1%。相比于IPUPM方法,VVC-VRF方法取證準(zhǔn)確度更高。VVC-VRF具有更高取證準(zhǔn)確度的主要原因是其考慮了VVC支持的更多更豐富的CU劃分類(lèi)型、預(yù)測(cè)模式及參考行信息,而IPUPM 方法只使用了部分CU劃分類(lèi)型及預(yù)測(cè)模式信息。
幀刪除是一種常見(jiàn)的視頻篡改手段,篡改者刪除原始視頻中包含敏感信息的一些幀達(dá)到掩蓋或混淆真相的目的。由于VVC編碼框架中幀間預(yù)測(cè)等技術(shù)的使用,使得相鄰幀的編解碼信息具有很強(qiáng)的參考依賴(lài)。因此,將原始視頻做幀刪除處理后,必須將剩余的幀重新壓縮才能形成完整的視頻碼流供后續(xù)傳輸或存儲(chǔ)。視頻重壓縮取證也適用于幀刪除篡改視頻的取證場(chǎng)景。
選擇LDP結(jié)構(gòu)下編碼的視頻進(jìn)行幀刪除操作以驗(yàn)證VVC-VRF方法與IPUPM方法的取證準(zhǔn)確度。具體地,對(duì)LDP編碼結(jié)構(gòu)下第1次壓縮后的解碼視頻隨機(jī)刪除5幀,然后再將刪幀后的視頻重新編碼。其他編碼設(shè)置及過(guò)程與前面設(shè)置描述的一致,實(shí)驗(yàn)結(jié)果如表3所示。
表3 幀刪除視頻的重壓縮取證準(zhǔn)確度As
VVC-VRF方法與IPUPM方法面向幀刪除視頻的重壓縮取證準(zhǔn)確度平均分別為94.4%和87.2%,VVC-VRF方法提高了幀刪除視頻的重壓縮取證準(zhǔn)確度。對(duì)比表2和表3可以看出,VVC-VRF方法與IPUPM方法在面對(duì)幀刪除視頻時(shí),其重壓縮取證準(zhǔn)確度都有所下降,這主要是因?yàn)閹瑒h除操作會(huì)顯著改變后續(xù)重壓縮面向視頻的內(nèi)容特性,例如幀數(shù)量減少及幀序號(hào)對(duì)應(yīng)關(guān)系被打亂等,會(huì)影響基礎(chǔ)碼流特征與壓縮次數(shù)的關(guān)系,最終導(dǎo)致重壓縮取證準(zhǔn)確度下降。
實(shí)用的重壓縮取證方法除了具有更高取證準(zhǔn)確度外,更低的取證復(fù)雜度也是必要的。從算法復(fù)雜度角度可以將VVC-VRF方法和IPUPM方法分為編碼和其他步驟兩部分。相比于其他步驟,編碼操作非常耗時(shí),占了取證的大部分時(shí)間。另外,編碼是計(jì)算機(jī)獨(dú)立運(yùn)行的操作,沒(méi)有人為干預(yù)。因此,選擇對(duì)比VVC-VRF方法與IPUPM方法中包括的編碼時(shí)間以消除人為操作步驟對(duì)取證運(yùn)行時(shí)間的干擾,從而盡量客觀公正地對(duì)比方法復(fù)雜度。
在同一臺(tái)服務(wù)器上完成VVC-VRF方法與IPUPM方法中的編碼操作。服務(wù)器主要配置為Win10操作系統(tǒng),CPU為AMD Ryzen Threadripper 3960X 24-Core Processor,主頻基準(zhǔn)速度為3.80 GHz,內(nèi)存256 G,具體實(shí)驗(yàn)結(jié)果如表4所示。
表4 視頻重壓縮取證中的編碼時(shí)間
對(duì)于所有測(cè)試視頻,VVC-VRF方法與IPUPM方法對(duì)應(yīng)的平均編碼時(shí)間分別為5 239 s和10 114 s,VVC-VRF方法可以節(jié)省48.20%的編碼時(shí)間,顯著降低了重壓縮取證復(fù)雜度。這是因?yàn)閂VC-VRF方法取證步驟中只包含1次編碼操作,而IPUPM方法取證步驟中則包含了2次編碼操作。
面向VVC標(biāo)準(zhǔn)相同編碼參數(shù)情況,提出了一種有效的視頻重壓縮取證方法。提取與視頻編碼次數(shù)密切相關(guān)的CU劃分類(lèi)型、幀內(nèi)預(yù)測(cè)模式及參考行信息作為基礎(chǔ)碼流特征,基于基礎(chǔ)碼流特征得到不同屬性CU占比、CU劃分類(lèi)型占比和QP,完成高級(jí)碼流特征的選取。然后將高級(jí)碼流特征輸入SVM,得到重壓縮取證結(jié)果。實(shí)驗(yàn)結(jié)果表明,與IPUPM方法相比,VVC-VRF方法可以有效提高相同編碼參數(shù)下視頻重壓縮取證的準(zhǔn)確度,并且在幀刪除的情況下VVC-VRF方法的取證準(zhǔn)確度仍然較高。另外,與IPUPM方法相比,由于VVC-VRF方法的取證過(guò)程包含更少的編碼次數(shù),因此VVC-VRF方法可以明顯降低視頻重壓縮取證的時(shí)間。通過(guò)以上分析可以看出,VVC-VRF方法在重壓縮取證準(zhǔn)確度及復(fù)雜度上都具有優(yōu)異的性能。后續(xù)將在探索更有效的基礎(chǔ)碼流特征,構(gòu)建更有效的高級(jí)碼流特征及重壓縮取證技術(shù)實(shí)際工程應(yīng)用轉(zhuǎn)化及方法結(jié)構(gòu)適配等方面展開(kāi)研究。