趙小虎, 沈雪茹, 李婉梅, 王 寬
(中國礦業(yè)大學(xué)a. 信息與控制工程學(xué)院; b. 物聯(lián)網(wǎng)(感知礦山)研究中心;c. 礦山互聯(lián)網(wǎng)應(yīng)用技術(shù)國家地方聯(lián)合工程實(shí)驗(yàn)室, 江蘇 徐州 221008)
礦井的智能監(jiān)控、煤層識別和礦物探測等對視頻圖像的質(zhì)量和傳輸實(shí)時(shí)性要求較高, 尤其是在井下無人值守的工作區(qū)域,視頻圖像的數(shù)據(jù)量大,圖像的傳輸和存儲較困難, 故如何減少信息的傳輸量和提高傳輸效率備受關(guān)注.分布式視頻編碼(distributed video coding,DVC)在編碼端對信源進(jìn)行獨(dú)立編碼,在解碼端利用視頻序列的相關(guān)性進(jìn)行聯(lián)合解碼, 降低了編碼端的復(fù)雜度.傳統(tǒng)的DVC系統(tǒng)是基于信道編碼的,對單幅圖像的編碼仍須進(jìn)行大量計(jì)算.壓縮感知(compressed sensing, CS)[1-2]技術(shù)因其較低的采樣率以及編碼端的低復(fù)雜度,在多信號傳輸處理中發(fā)揮著良好的作用.Liu等[3]將CS理論引入分布式視頻編碼中, 形成分布式壓縮視頻感知(distributed compressed video sensing, DCVS)理論.典型的DCVS框架主要有分布式壓縮視頻感知框架[4]以及基于塊的DCVS框架[5].近年來,關(guān)于改進(jìn)DCVS框架的研究甚多.Brendt[6]通過改進(jìn)稀疏表示算法,提出一種有效的卷積稀疏表示方法,取得良好的稀疏表示效果.趙睿思等[7]在邊信息生成方面進(jìn)行改進(jìn),利用邊信息生成字典來輔助非關(guān)鍵幀的重構(gòu),一定程度地提高了非關(guān)鍵幀的重構(gòu)質(zhì)量.邊信息的加入可以提高解碼端CS幀的重構(gòu)質(zhì)量,邊信息獲取的準(zhǔn)確性直接影響CS幀的重構(gòu)性能.獲取邊信息的過程可以采用K-SVD訓(xùn)練字典[8]的方法生成或?qū)σ呀獯a的關(guān)鍵幀做運(yùn)動估計(jì), 在時(shí)域中內(nèi)插生成.但是上述對DCVS框架改進(jìn)的方案中,均未充分利用視頻序列中相鄰關(guān)鍵幀在不同區(qū)域中幀間相關(guān)性的差異; 因此, 本文提出一種基于塊分類的分布式視頻編解碼方案,根據(jù)不同的幀間相關(guān)性對視頻幀進(jìn)行塊分類, 在編碼端, 不同類型的塊采用不同的稀疏基策略; 在解碼端,根據(jù)塊分類的結(jié)果采用不同的權(quán)值以獲取邊信息輔助非關(guān)鍵幀的重構(gòu).
在傳統(tǒng)的視頻編解碼中, 塊預(yù)測與離散余弦變換(discrete cosine transform, DCT)相結(jié)合的混合編碼方案可以快速降低視頻圖像的時(shí)空相關(guān)性.為了獲得更好的稀疏表示, 筆者參考該稀疏模型, 針對非關(guān)鍵幀提出一種新的混合稀疏基模型, 對關(guān)鍵幀仍采用原始的DCT稀疏基.混合稀疏基Ψi=[ΨDCT;Ψinter], 其中ΨDCT為原始DCT基, 可由DCT域中的線性變換獲取;Ψinter為塊預(yù)測基, 可通過相鄰解碼關(guān)鍵幀生成的邊信息預(yù)測獲?。?/p>
圖1 塊分類結(jié)果及對應(yīng)的稀疏基策略Fig.1 Block classification results and corresponding sparse basis strategies
在分布式視頻編碼框架中, 將視頻序列分幀并分成若干個(gè)圖像組(group of pictures, GOP), 每一個(gè)GOP組中包含一個(gè)關(guān)鍵幀(Key幀)和若干非關(guān)鍵幀(CS幀).根據(jù)視頻幀間不同的相關(guān)性,構(gòu)建如圖2所示的基于塊的分類加權(quán)邊信息DCVS框架.
圖2 基于塊的分類加權(quán)邊信息DCVS框架Fig.2 Block-based classification weighted side information DCVS framework
在編碼端, Key幀采用傳統(tǒng)的DCT采樣, CS幀采用本文混合稀疏基策略采樣, 測量矩陣均采用隨機(jī)高斯矩陣.在解碼端,對關(guān)鍵幀采用稀疏度自適應(yīng)匹配追蹤(sparsity adaptive matching pursuit, SAMP)算法進(jìn)行重構(gòu), 而非關(guān)鍵幀的重構(gòu)結(jié)果是前后兩個(gè)關(guān)鍵幀的重構(gòu)值分別進(jìn)行前向和后向運(yùn)動估計(jì)生成的邊信息與非關(guān)鍵幀的殘差重構(gòu)相結(jié)合的產(chǎn)物.
傳統(tǒng)的通過已解碼關(guān)鍵幀做運(yùn)動估計(jì)求取邊信息的方法大多是對當(dāng)前幀的前后兩個(gè)關(guān)鍵幀的重構(gòu)值做前向和后向運(yùn)動估計(jì), 然后按照某一固定的權(quán)值(通常為1/2)相加獲得邊信息輔助CS幀的重構(gòu)[9].然而,視頻序列中的不同區(qū)域幀間相關(guān)性不同,視頻的變化場景和運(yùn)動程度不一,當(dāng)前后向運(yùn)動估計(jì)幀間相關(guān)性較弱時(shí),仍采用固定的權(quán)值并不能很好地預(yù)測當(dāng)前幀,以此生成的邊信息的準(zhǔn)確度偏低,進(jìn)而影響非關(guān)鍵幀的重構(gòu).故筆者將充分考慮幀間相關(guān)性,提出一種基于塊的加權(quán)邊信息生成方案.
在非關(guān)鍵幀的重構(gòu)中, 非關(guān)鍵幀的重構(gòu)結(jié)果xrec=Is+rrec, 其中rrec為非關(guān)鍵幀的測量值和邊信息對非關(guān)鍵幀的殘差重構(gòu).假設(shè)某視頻的非關(guān)鍵幀為x, 其測量值y=Φx, 其中Φ為測量矩陣,邊信息在測量域的值用E(Is,Φ)表示, 計(jì)算測量域的殘差為r=y-E(Is,Φ), 對殘差r進(jìn)行重構(gòu)可得rrec.非關(guān)鍵幀的重構(gòu)結(jié)果為xrec=Is+rrec.
選取煤礦井下采集的2組不同視頻序列, 驗(yàn)證本文混合稀疏基下采用分類加權(quán)邊信息(classification weighted side information, CWSI)生成方法時(shí)的重構(gòu)性能,并將其與固定加權(quán)邊信息(fixed weighted side information, FWSI)[10]和傳統(tǒng)的DCVS方案[11]進(jìn)行對比分析.視頻序列中GOP組內(nèi)關(guān)鍵幀和非關(guān)鍵幀的測量與重構(gòu)都是基于塊的,現(xiàn)將GOP的第一幀定義為關(guān)鍵幀, 其余幀為CS幀,考慮關(guān)鍵幀在整個(gè)重構(gòu)過程中的重要地位,選擇關(guān)鍵幀的采樣率為0.9.為了驗(yàn)證CS幀中分類加權(quán)邊信息在不同采樣率下的重構(gòu)時(shí)間復(fù)雜度和重構(gòu)質(zhì)量,選取視頻序列中某一GOP組中的CS幀進(jìn)行2組對比實(shí)驗(yàn),結(jié)果如圖3~4所示.
圖3 不同采樣率下非關(guān)鍵幀的重構(gòu)時(shí)間復(fù)雜度Fig.3 Reconstruction time complexity of non-key frames at different sampling rates
圖4 不同采樣率下非關(guān)鍵幀的重構(gòu)質(zhì)量Fig.4 PSNR value of reconstruction quality of non-key frames at different sampling rates
由圖3~4可見: 1) 不同采樣率下, CWSI算法與其他2種算法的重構(gòu)時(shí)間相近,算法的復(fù)雜度較低; 2) CWSI算法的重構(gòu)質(zhì)量優(yōu)于傳統(tǒng)的DCVS算法和FWSI算法.當(dāng)采樣率大于0.3時(shí), 采樣率的增大并不能明顯提高峰值信噪比,故基于能耗和重構(gòu)質(zhì)量的考慮,本文選擇非關(guān)鍵幀的最佳采樣率為0.3.
選取2組視頻序列中的30個(gè)GOP圖像組, 每個(gè)GOP中包含3個(gè)圖像幀,其中第一幀為關(guān)鍵幀,其余幀為CS幀.選取GOP組中30個(gè)CS幀進(jìn)行仿真實(shí)驗(yàn),采樣率為0.3, 對CWSI算法和FWSI算法的重構(gòu)質(zhì)量進(jìn)行對比,驗(yàn)證CWSI算法的有效性.2個(gè)視頻序列中的非關(guān)鍵幀重構(gòu)質(zhì)量如圖5所示.由圖5可知,基于塊的分類加權(quán)邊信息生成方法比固定加權(quán)邊信息算法重構(gòu)的峰值信噪比值平均提高了0.2~0.6 dB, 這是由于本文提出的邊信息生成算法充分利用了幀間相關(guān)性的不同, 能夠選擇合適的權(quán)值生成邊信息輔助非關(guān)鍵幀的重構(gòu),從而提高非關(guān)鍵幀的重構(gòu)質(zhì)量.
圖5 采樣率為0.3時(shí)非關(guān)鍵幀的重構(gòu)質(zhì)量Fig.5 PSNR value of non-key frame reconstruction at a sampling rate of 0.3
為了解決將壓縮感知方法應(yīng)用到視頻解碼端獲取邊信息輔助非關(guān)鍵幀的重構(gòu)過程中不同的視頻序列圖像塊之間的相關(guān)性差異的問題,本文提出了一種基于塊的分類加權(quán)方法進(jìn)行非關(guān)鍵幀的重構(gòu).在編碼端的稀疏表示方面,根據(jù)幀間相關(guān)性的不同,將視頻序列分為不同的塊,針對不同的塊選擇相應(yīng)的稀疏基策略.非關(guān)鍵幀的解碼端,在利用運(yùn)動估計(jì)生成邊信息的算法中,邊信息的生成根據(jù)幀間相關(guān)性的不同選擇不同的權(quán)值.仿真實(shí)驗(yàn)結(jié)果表明,本文方案基于不同的視頻應(yīng)用場景自適應(yīng)選擇不同的稀疏基和邊信息生成方案,充分利用幀間相關(guān)性,在提高非關(guān)鍵幀重構(gòu)質(zhì)量的同時(shí)能更好地重構(gòu)原始視頻序列.
揚(yáng)州大學(xué)學(xué)報(bào)(自然科學(xué)版)2019年2期