基于張量核范數(shù)與3D全變分的背景減除

2020-09-29 06:56陳利霞王學(xué)文

計算機(jī)應(yīng)用 2020年9期

陳利霞，班穎，王學(xué)文

（1.桂林電子科技大學(xué)數(shù)學(xué)與計算科學(xué)學(xué)院，廣西桂林 541004；2.廣西高校數(shù)據(jù)分析與計算重點實驗室（桂林電子科技大學(xué)），廣西桂林 541004；3.桂林電子科技大學(xué)計算機(jī)與信息安全學(xué)院，廣西桂林 541004）

0 引言

伴隨網(wǎng)絡(luò)技術(shù)和數(shù)字視頻技術(shù)的飛速發(fā)展，監(jiān)控技術(shù)日益面向智能化、網(wǎng)絡(luò)化方向發(fā)展，這使得對視頻背景減除技術(shù)的要求越來越高。背景減除，即從視頻中準(zhǔn)確檢測出運動目標(biāo)而將不關(guān)心的背景完全或部分除去［1］，是很多計算機(jī)視覺問題中的關(guān)鍵技術(shù)。

近年來，低秩稀疏分解在背景減除領(lǐng)域應(yīng)用廣泛，典型的算法是魯棒主成分分析（Robust Principal Component Analysis，RPCA）［2-3］。該模型將視頻矩陣化并分解為背景和前景，其中低秩背景用核范數(shù)約束，稀疏前景用L1范數(shù)約束。進(jìn)一步，為解決動態(tài)背景和噪聲干擾等問題，陳利霞等［4］分別用Schatten-p 范數(shù)和3D 全變分（3D Total Variation，3D-TV）代替核范數(shù)和L1范數(shù)來約束背景和前景，具體模型如下［4］：

其中：E是噪聲項，λ為平衡前景與背景的權(quán)衡參數(shù)。

上述矩陣形式的RPCA 存在一個缺點：只能處理二維數(shù)據(jù)。而實際數(shù)據(jù)在本質(zhì)上通常是高維的，所以要使用RPCA必須先將高維數(shù)據(jù)矩陣化，但矩陣化會破壞其固有的空間結(jié)構(gòu)，導(dǎo)致一些信息丟失，性能下降；另外，視頻矩陣化后得到的結(jié)果由于幀數(shù)多而變得龐大，故占用較大的內(nèi)存空間，計算復(fù)雜度變大。因此，上述的RPCA 模型進(jìn)一步擴(kuò)展到高維空間。Goldfarb 等［5］為減少高維信息的丟失，提出了高階魯棒主成分分析模型（High-order RPCA，HoRPCA）。Xie 等［6］提出了用張量稀疏檢測代替核范數(shù)建模背景——KBR-RPCA（Kronecker-Basis-Representation based RPCA），將每個維度的秩分配合適的權(quán)值，考慮了張量低秩的實際物理意義。Liu 等［7］基于核心張量的低秩分量提出了一種新的張量核范數(shù)對背景約束，提高了前景背景分離的準(zhǔn)確性。為了更加精確地逼近低秩背景，Lu 等［8］提出了一種改進(jìn)的張量核范數(shù)對背景建?！猅RPCA-TNN（Tensor RPCA with Tensor Nuclear Norm），旨在加強(qiáng)背景的低秩性。上述方法對于前景大多采用L1范數(shù)約束，而L1范數(shù)獨立地對待每個像素點，沒有考慮前景目標(biāo)在空間中的連續(xù)性以及時間上的持續(xù)性。

而對于前景約束，Yuan 等［9］用L2，1范數(shù)代替L1范數(shù)作為前景的稀疏性約束，實現(xiàn)了變量組水平的稀疏性。Xu等［10］進(jìn)一步用L1，1，2范數(shù)代替L2，1范數(shù)，加強(qiáng)了前景的管稀疏性和時空連續(xù)性。Cao 等［11］提出使用全變分對前景建模，提高了視頻前景的時空連續(xù)性，抑制了動態(tài)背景造成的干擾。上述方法在一定程度上提高了對前景的約束，但對于背景的約束大部分采用張量核范數(shù)，其近似程度有待進(jìn)一步提高。

文獻(xiàn)［4］等以矩陣為基礎(chǔ)的RPCA 模型導(dǎo)致了高維數(shù)據(jù)的結(jié)構(gòu)破壞和信息丟失，因此本文以張量為工具提出了一種改進(jìn)的基于張量魯棒主成分分析（Tensor RPCA，TRPCA）的背景減除模型。該模型把視頻當(dāng)作三維張量來整體處理，保留了不同視頻幀之間的空間結(jié)構(gòu)和信息，且以張量的形式進(jìn)行存儲節(jié)約了內(nèi)存空間，降低了計算復(fù)雜度，有效解決了文獻(xiàn)［4］耗時長的問題。矩陣Schatten-p 范數(shù)［4］約束的背景同樣由于信息的丟失而導(dǎo)致對實際視頻背景的近似程度不夠，因此本文利用改進(jìn)的張量形式的核范數(shù)對背景成分進(jìn)行低秩約束，考慮了視頻背景的時空連續(xù)性，且更加接近實際高維數(shù)據(jù)的秩函數(shù)（加強(qiáng)了視頻背景的低秩性），從而提高了前景背景分離的效果。同時，為解決L1范數(shù)約束前景不夠充分的問題，利用3D-TV正則化對前景成分進(jìn)行稀疏性約束，加強(qiáng)了視頻前景的時空連續(xù)性，且對視頻中的不連續(xù)變化有較強(qiáng)的抑制作用，因此有效地抑制了動態(tài)背景對前景提取的干擾作用，使得前景背景分離更加準(zhǔn)確。

1 基于張量核范數(shù)與3D-TV的背景減除

現(xiàn)有的模型在平穩(wěn)背景下能實現(xiàn)較好的背景減除效果，但大多沒有考慮前景目標(biāo)的時空連續(xù)性和局部結(jié)構(gòu)，且在動態(tài)背景中提取目標(biāo)的效果較差，基于此，提出了一種結(jié)合改進(jìn)的張量核范數(shù)與3D-TV的TRPCA模型，下面詳細(xì)介紹。

1.1 前景建模

視頻前景的運動軌跡在第三維（時間）上通常是光滑的，故前景目標(biāo)在時空域上具有光滑性和連續(xù)性的特征，而動態(tài)背景中微小物體的顯著變化呈現(xiàn)不連續(xù)的特性［4］。在數(shù)學(xué)上，全變分具有平滑信號的作用，對信號中的不連續(xù)變化具有較強(qiáng)的抑制作用［11］。因此，3D-TV 能有效地抑制由動態(tài)背景造成的噪聲干擾，其定義［4］如下：

從上述定義可以看出，沿水平和垂直方向的差分算子表明3D-TV 考慮了前景目標(biāo)在空間上的連續(xù)性；同時沿時間方向的差分算子表明其考慮了前景目標(biāo)在時間上的持續(xù)性。

為計算方便［11］，引入沿水平、垂直和時間方向的向量差分算子：

1.2 背景建模

在TRPCA 模型中，通常采用張量核范數(shù)代替秩函數(shù)來約束背景。但是一般的張量核范數(shù)是對張量進(jìn)行矩陣化，然后用矩陣的奇異值來定義張量核范數(shù)，破壞了視頻的空間結(jié)構(gòu)，對秩函數(shù)的近似程度不夠。基于t-product，Lu 等［8］提出了一種改進(jìn)的張量核范數(shù)，定義如下：

1.3 新模型的建立

基于以上討論，本文提出一種新的基于張量核范數(shù)和3D-TV的背景減除模型：

其中λ為平衡前景成分與背景成分的權(quán)衡參數(shù)。上述模型以TRPCA 為基礎(chǔ)，用改進(jìn)的張量核范數(shù)加強(qiáng)背景的低秩性，以達(dá)到更加接近實際視頻背景的目的；用3D-TV來平滑信號，有效抑制動態(tài)背景的干擾作用。

2 模型的求解

為求解式（5），先引入輔助變量g，則上述模型變?yōu)椋?/p>

3 實驗結(jié)果及分析

3.1 實驗數(shù)據(jù)和指標(biāo)選取

為了驗證所提算法的效果，本文從CD.net數(shù)據(jù)庫［15］選取8 組大小為128×128×128 的視頻序列SnowFall 和Skating（復(fù)雜天氣）、Traffic 和Boulevard（相機(jī)抖動）、CopyMachine 和Backdoor（陰影）、PETS2006和Highway（基礎(chǔ)集），如圖1所示，并在相同的實驗環(huán)境下與HoRPCA［5］、IALM-RPCA（RPCA via Inexact Augmented Lagrange Multipliers）［3］、TRPCA-TNN［8］、KBR-RPCA［6］和文獻(xiàn)［4］算法從主觀和客觀兩方面進(jìn)行比較。本文實驗的運行環(huán)境為Matlab 2014a，Inter Core i5-6500 處理器，8 GB的內(nèi)存，Windows 10 64位操作系統(tǒng)。

圖1 實驗視頻集Fig.1 Experimental video set

為了在客觀上準(zhǔn)確地評估本文算法的性能，采用查全率（recall）、查準(zhǔn)率（precision）和綜合評判指標(biāo)F-measure值（F值）來評價前景背景分離的效果，其定義［16］分別為：

其中：tp表示檢測出正確的前景像素點；fp表示誤檢為前景的背景像素點；fn表示誤檢為背景的前景像素點。其中recall、precision和F值均在0～1，且其值越大，得到的結(jié)果就越精確。

3.2 主觀分析

圖2前4行給出了復(fù)雜天氣和相機(jī)抖動的視覺效果，從中看出，對于復(fù)雜天氣和相機(jī)抖動，HoRPCA 和TRPCA-TNN 提取前景的效果較差；IALM-RPCA 對Skating 和Boulevard 的提取效果較好，但對SnowFall 和Traffic 目標(biāo)的移動對前景提取產(chǎn)生較大的干擾，對前景的誤判較大；KBR-RPCA 由于飄落的雪花和白雪的覆蓋容易將把白色背景部分誤判為前景，且出現(xiàn)較大的空洞現(xiàn)象；對SnowFall 和Traffic 文獻(xiàn)［4］算法同樣由于目標(biāo)的移動和復(fù)雜天氣而對前景提取產(chǎn)生較大的誤判，出現(xiàn)較大的運動軌跡；本文算法對前景目標(biāo)提取的效果較好，對前景的誤判較小，有效抑制動態(tài)背景的干擾作用，雖然對Skating的前景提取效果較差，且出現(xiàn)少量的背景部分，但從表1知本文的F值要遠(yuǎn)高于其他算法。

圖2 不同算法下的視頻集視覺效果對比Fig.2 Visual effect comparison of experimental video set by different algorithms

圖2 后4 行給出了陰影和基礎(chǔ)集的視覺效果。從圖2 看出，對于陰影和基礎(chǔ)集，HoRPCA 和KBR-RPCA 提取前景的效果較差，且易將背景誤判為前景；TRPCA-TNN 提取的目標(biāo)存在著較大的空洞現(xiàn)象；IALM-RPCA、文獻(xiàn)［4］算法和本文算法提取前景的效果較好，且空洞現(xiàn)象和對前景的誤判較少，其中Backdoor和Highway，文獻(xiàn)［4］算法提取前景的效果優(yōu)于其他2種算法，但在客觀評判指標(biāo)上本文算法有較高的F值。

綜上所述，本文算法在前景背景分離中提取前景的效果較好，對前景的誤判和目標(biāo)中的空洞現(xiàn)象較少，且有效抑制了動態(tài)背景和目標(biāo)移動對前景提取的干擾。

3.3 客觀分析

將本文算法與其他5 種算法進(jìn)行對比，其評判指標(biāo)recall、precision和F值見表1。從表1 可以看出，本文算法的recall值基本上高于其他5 種算法，基本上處于最優(yōu)的情況。因此，本文算法在前景背景分離中有較高的查準(zhǔn)率，對運動目標(biāo)有較為準(zhǔn)確的提取效果。表1中文獻(xiàn)［4］算法的precision值在一些視頻上比本文算法占有一定的優(yōu)勢，雖然HoRPCA、IALM-RPCA、TRPCA-TNN 和KBR-RPCA 算法的precision值有比本文算法高的情況，但由于recall只能反映丟失運動目標(biāo)內(nèi)部信息的相關(guān)性，precision只能反映丟失目標(biāo)外部信息的相關(guān)性，且兩者指標(biāo)值有時會出現(xiàn)矛盾的情況，因此采用它們的調(diào)和平均值F值來綜合判斷提取效果更準(zhǔn)確。本文算法的F值均處于最優(yōu)或次優(yōu)的情況，因此本文算法在提取前景上有較高的準(zhǔn)確率，且對前景的誤判較小。另外，表1 給出了5 種對比算法與本文算法的運行耗時，看出本文算法在運行耗時方面占有一定的優(yōu)勢，雖然運行耗時高于IALM-RPCA 和TRPCA-TNN，但在客觀評判指標(biāo)F值上均優(yōu)于上述兩種算法（表1）。并且不同于文獻(xiàn)［4］，本文算法把視頻當(dāng)作張量來整體處理，故節(jié)約了內(nèi)存，運行耗時上優(yōu)于文獻(xiàn)［4］。

表1 不同算法下的客觀評判指標(biāo)對比Tab.1 Comparison of objective evaluation indicators of different algorithms

4 結(jié)語

以TRPCA 模型為基礎(chǔ)，本文首先利用改進(jìn)的張量核范數(shù)代替秩函數(shù)約束背景的低秩性，加強(qiáng)了視頻背景在時空上的連續(xù)性；再利用3D-TV 代替L1范數(shù)，有效抑制了動態(tài)背景的噪聲干擾。實驗結(jié)果表明，與經(jīng)典算法以及目前最新算法相比，本文算法提取的前景目標(biāo)空洞現(xiàn)象較小，有效抑制了動態(tài)背景和目標(biāo)移動對前景提取造成的干擾作用，減少了對前景的誤判。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡