国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

視頻背景分離中一種新的非凸秩近似的RPCA模型

2019-07-16 11:11:34
關(guān)鍵詞:范數(shù)前景背景

(山東科技大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院 ,山東 青島 266590)

1 引言

隨著監(jiān)控設(shè)備的普及,監(jiān)控視頻在社會管理和安全中發(fā)揮著重要的作用。這些視頻信號往往是大規(guī)模帶有噪聲的數(shù)據(jù),給數(shù)據(jù)分析帶來了困難。監(jiān)控視頻信號的自動識別已成為目標(biāo)追蹤、交通檢測以及場景分析等領(lǐng)域的關(guān)鍵環(huán)節(jié)。其中,如何有效地從視頻幀序列中分離出背景和移動前景受到學(xué)者的廣泛關(guān)注。

2006年,Donoho等[1]提出了壓縮傳感(compressed sensing)理論,認(rèn)為高維信號在某個變換域上具有稀疏性,可以以很大的概率從較少的線性測量信號中高維信號恢復(fù)出來。之后基于壓縮傳感理論的秩極小化技術(shù)被廣泛應(yīng)用于高維數(shù)據(jù)分析及圖像處理領(lǐng)域。

為了對視頻序列的前景與背景進(jìn)行有效分離,學(xué)者們把矩陣秩的極小化技術(shù)引入主成分分析(principal component analysis,PCA)模型[2]。大量數(shù)值實驗結(jié)果表明,當(dāng)觀測矩陣只含較小的高斯隨機(jī)噪聲時,PCA模型可以準(zhǔn)確地分離出視頻序列的前景與背景。考慮到PCA模型對于含有異常值或者尖銳噪聲的觀測數(shù)據(jù)非常敏感,且不適用于帶有稀疏噪聲的矩陣,Candes等[3]提出了魯棒主成分分析(robust principod component analysis,RPCA)模型,在原有的模型中加入矩陣稀疏表示,并利用交替方向法對模型進(jìn)行求解。實驗結(jié)果表明,RPCA模型對數(shù)據(jù)矩陣的噪聲更加穩(wěn)健。目前,RPCA模型已被廣泛應(yīng)用于視頻前景提取[4]、人臉識別[5]和圖像對齊[6]等領(lǐng)域。

傳統(tǒng)的RPCA模型可描述為如下優(yōu)化問題:

(1)

(2)

對于模型(2),為了降低求解模型的計算時間,提高處理效果,Lin等[7]提出了IALM(Inexact augmented Lagrange multipliers)模型,在RPCA模型中加入了低秩稀疏矩陣的正則項,并利用非精確拉格朗日乘子法求解提出的模型,大幅度降低了運(yùn)算時間。Zhou等[8]采用雙邊隨機(jī)投影模型,利用投影算子代替奇異值分解(singular value decomposition,SVD),提出了Go分解(go decomposition,GoDec)模型,提高了圖像的處理效果。上述方法均基于核范數(shù)近似的RPCA改進(jìn)模型,但由于核范數(shù)是對秩函數(shù)的有偏估計,當(dāng)矩陣出現(xiàn)過大奇異值時,會出現(xiàn)核范數(shù)的秩估計過大問題,導(dǎo)致圖像處理效果不理想,且模型求解的每一步都要對矩陣進(jìn)行奇異值分解,隨著問題規(guī)模增加,計算時間也會大幅度增加。因此,很多學(xué)者開始嘗試?yán)梅峭购瘮?shù)近似秩函數(shù)[9-11],數(shù)值實驗結(jié)果表明,用非凸函數(shù)近似秩函數(shù)的效果更優(yōu)。

另一方面,傳統(tǒng)的RPCA模型通常采用矩陣的L1范數(shù)來描述圖像整體的稀疏性。但由于L1范數(shù)未考慮前景像素之間的相關(guān)性以及空間上的連續(xù)性,使分離效果受到很大的影響。許多學(xué)者進(jìn)而考慮用矩陣的L2,1范數(shù)來代替L1范數(shù),與L1范數(shù)的稀疏性要求不同,L2,1范數(shù)在要求整體稀疏的同時還要求列稀疏,以充分考慮稀疏項元素之間的相關(guān)性,更好地分離運(yùn)動前景[12]。

針對核范數(shù)的缺陷以及非凸秩近似函數(shù)所展現(xiàn)出的良好特性,提出一種新的非凸函數(shù)來近似秩函數(shù),同時利用矩陣的L2,1范數(shù)來近似L0范數(shù),得到一個改進(jìn)的RPCA模型,采用增廣拉格朗日交替方向法求解該模型,并將該模型應(yīng)用于視頻背景分離。數(shù)值實驗結(jié)果表明,與核范數(shù)及現(xiàn)有的非凸近似模型相比,提出的非凸函數(shù)及非凸秩似模型具有更好的數(shù)值效果及魯棒性。

2 改進(jìn)的RPCA模型

文獻(xiàn)[13]對目前的主流非凸秩近似函數(shù)特征進(jìn)行了分析,要求非凸秩近似函數(shù)要滿足矩陣范數(shù)的一般性質(zhì),且具有良好的秩近似效果。為更好地近似秩函數(shù),提高RPC模型的數(shù)值計算效率,本研究提出一個新的非凸函數(shù)來近似秩函數(shù),進(jìn)而得到一個改進(jìn)的RPCA模型NC-ALM(non-convex Augmented Lagrange method)模型。

考慮如下非凸函數(shù)

(3)

其中,g(x)為[0,∞)上的增函數(shù),t為模型參數(shù)。

定義非凸秩近似函數(shù)

(4)

其中,σi(L)為L的第i個奇異值。

由文獻(xiàn)[13],可得如下結(jié)論:

2) 當(dāng)σi(L)=0時,g(σi(L))=0;

圖1 秩近似函數(shù)與核范數(shù)對比圖Fig.1 Comparison of rank approximation function and nuclear norm

為了更加直觀展示提出的非凸函數(shù)的性質(zhì),圖1給出了近似函數(shù)對秩的近似效果,可以看出,當(dāng)矩陣奇異值為0時,提出的非凸函數(shù)值為0;當(dāng)矩陣的奇異值大于0時,該函數(shù)會快速的逼近于1;而當(dāng)矩陣奇異值增大時,該函數(shù)值會穩(wěn)定的逼近于1。而隨著參數(shù)t取值增大,該函數(shù)會更加迅速地逼近真實秩。因此,該非凸秩近似函數(shù)的近似效果要優(yōu)于核范數(shù)。

3 增廣拉格朗日乘子法

(5)

本節(jié)利用增廣拉格朗日交替方向乘子法,來求解模型(5)。

模型(5)的增廣拉格朗日函數(shù)為:

(6)

其中,〈A,B〉=Trace(ATB)表示兩個矩陣的內(nèi)積,Y是拉格朗日乘子,μ是正則參數(shù)。

給定初始的L0以及Y0,增廣拉格朗日交替方向乘子法的求解框架如下:

(7)

(8)

Yk+1=Yk+μk(Lk+1+Sk+1-X),

(9)

μk+1=ρμk。

(10)

3.1 求解問題(7)

對于子問題(7)的求解,有如下結(jié)論:

(11)

問題(11)是一個凹函數(shù)與凸函數(shù)的組合,利用文獻(xiàn)[15]的算法進(jìn)行求解可得

(12)

式(12)的封閉解

(13)

Lk+1=Udiag(σ*)VT。

(14)

3.2 求解問題(8)

S的更新可以通過文獻(xiàn)[16]的引理3.3進(jìn)行計算。

引理3[16]對于給定的矩陣M∈Rm×n以及τ>0,則優(yōu)化問題:

存在唯一的封閉解S*。那么 :

(15)

其中Mj表示矩陣M的第j列。

由上述結(jié)論可得求解問題(5)的算法框架如下:

算法1: 非凸增廣拉格朗日乘子法(NC-ALM)輸入: 觀測矩陣X,參數(shù)λ,μ>0,最大迭代kmax; 初始化: S=0,Y=0,迭代次數(shù)k=0; 步驟1:利用式(14)更新Lk+1; 步驟2:利用式(15)更新Sk+1; 步驟3:計算 Yk+1=Yk+μk(Lk+1+Sk+1-X); 步驟4:計算 μk+1=ρμk; 直到k>kmax或{Lk,Sk,Yk}收斂;輸出:L=Lk+1,S=Sk+1。

4 實驗結(jié)果與比較

本節(jié)將提出的NC-ALM模型應(yīng)用到不同的場景中,包括靜態(tài)/動態(tài)背景下的背景前景分離,并與APG[17],IALM和GoDec 3種模型進(jìn)行比較。4種模型用到的數(shù)據(jù)集以及運(yùn)行環(huán)境相同,數(shù)值實驗均基于PC Intel Core i3-3240T 2.90GHz CPU,4GB RAM環(huán)境,使用MATLAB R2014a實現(xiàn)。

4.1 參數(shù)設(shè)置

NC-ALM模型中主要用到4個參數(shù):μ、λ、ρ以及t。參考文獻(xiàn)[18]中的λ取值規(guī)則,取λ=10-3。對于懲罰參數(shù)μ,采用逐步遞增的方式,并取初始值μ0=2.4×10-5。為了加快算法收斂速度,參數(shù)ρ=1.2。t為非凸函數(shù)的參數(shù),實驗中取t=300。

算法迭代停止標(biāo)準(zhǔn)為:

Err≤εor Iter≥Imax,

(16)

其中

(17)

ε為預(yù)先輸入的終止誤差,ε=10-6,Iter為當(dāng)前的迭代次數(shù),Imax為預(yù)先輸入的最大迭代次數(shù),Imax=300。

4.2 實驗比較

實驗采用了12R數(shù)據(jù)集,其中包括Hall、Escalator、Lobby、Fountain、Campus和Restaurant視頻集。對于用到的每個視頻序列,截取了連續(xù)的幾百幀作為觀測數(shù)據(jù)集。

表1 實驗中的數(shù)據(jù)集統(tǒng)計信息
Table 1 Statistical information of data sets in the experiment

數(shù)據(jù)集圖像維數(shù)數(shù)據(jù)集幀數(shù)截取數(shù)據(jù)集幀數(shù)Hall144?1763 584100Escalator130?1603 000100Lobby128?1602 000100Fountain128?1602 750170Campus 128?1601 439210Restaurant120?1603 055500

為了使不同的算法具有可比性,實驗統(tǒng)一采用APG算法的停機(jī)準(zhǔn)則。GoDec模型需要預(yù)先設(shè)置矩陣的秩,根據(jù)文獻(xiàn)[8],秩設(shè)置為5。表2給出了4種模型處理不同數(shù)據(jù)集的迭代次數(shù)以及運(yùn)行時間對比。無論在動態(tài)背景還是靜態(tài)背景的數(shù)據(jù)集中,由于GoDec模型采用隨機(jī)投影的方式,難以保證計算精度,故迭代次數(shù)固定為101。而APG模型需要迭代100次以上,IALM模型需要迭代32次,本模型需要迭代3到5次。由于迭代次數(shù)遠(yuǎn)低于其他三種模型,NC-ALM模型的運(yùn)行時間最短。因此在處理大規(guī)模的數(shù)據(jù)信息時,NC-ALM模型優(yōu)勢更大。

表 2 模型迭代次數(shù)與運(yùn)行時間比對Tab.2 Comparison of model iteration number and running time

表 3 算法恢復(fù)背景矩陣秩與計算誤差對比Tab.3 Comparison of model recovery background matrix rank and calculation error

表3給出了4種模型恢復(fù)出低秩矩陣的秩以及計算精度比較。由于監(jiān)控設(shè)備是固定的,視頻背景相對固定,因此每一幀的背景像素大致相同,真實低秩矩陣的秩為1。通過表3可以看出,APG模型的秩大大偏離了真實低秩矩陣的秩,GoDec模型由于添加了秩約束,恢復(fù)的低秩矩陣秩固定為5,而本文的NC-ALM模型恢復(fù)的低秩矩陣最接近真實的背景矩陣秩。特別在Restaurant數(shù)據(jù)集中,視頻中移動目標(biāo)移動緩慢,APG模型以及IALM模型將部分本屬于前景中的像素歸類于背景中,導(dǎo)致背景矩陣的秩遠(yuǎn)遠(yuǎn)高于真實秩,而NC-ALM模型可以很好地恢復(fù)出矩陣的真實秩。此外,NC-ALM算法的計算精度高于GoDec以及APG模型。

圖2為視覺效果比較,第一行至第六行分別為Hall、Escalator、Lobby、Fountain、Campus和Restaurant視頻集。第1列是六個數(shù)據(jù)集中選取的某一幀原始圖片;2~3列是APG模型恢復(fù)的背景前景圖片;4~5列為IALM模型恢復(fù)的背景前景圖片; 6~7列為GoDec模型恢復(fù)的背景前景圖片;8~9列為本文模型恢復(fù)的背景前景圖片。由圖2對比可以看出,在Escalator和Restaurant數(shù)據(jù)集中,APG、IALM、GoDec模型都存在將前景像素歸類于背景的情況,導(dǎo)致恢復(fù)的背景不清晰(背景圖像中殘留了移動目標(biāo)的陰影)。 特別是Restaurant視頻集,APG、IALM模型將大量前景像素歸類于背景,GoDec模型存在少量陰影,而NC-ALM模型分離出了更為干凈的背景。

在圖3中以Escalator數(shù)據(jù)集為例給出了4個模型的像素值對比,用縱坐標(biāo)表示Escalator數(shù)據(jù)集每一幀中的坐標(biāo)(36,55)的像素值,橫坐標(biāo)表示幀數(shù)。Escalator數(shù)據(jù)集的橫坐標(biāo)分為4個區(qū)間,分別是[0,13],[14,29],[30,40],[41,100]。第1個區(qū)間中,人即將出現(xiàn),影子先到達(dá)了標(biāo)記的坐標(biāo);第2個區(qū)間中,人出現(xiàn)在標(biāo)記的坐標(biāo)上;第3個區(qū)間,人剛離開,影子出現(xiàn)在了該坐標(biāo)上;第4個區(qū)間中的坐標(biāo)為背景,沒有移動物體。從圖3可以看出,在人即將經(jīng)過的第1個區(qū)段[0,13]幀以及人剛經(jīng)過、但留有影子的第2個區(qū)間[30-40]幀,APG,IALM,GoDec背景像素值接近原始幀的像素,說明并未檢測出影子。而本文算法在這2個階段更接近于真實的背景像素;在人經(jīng)過標(biāo)記點的第二個區(qū)間[14-29]幀,GoDec跟IALM比較接近真實背景像素值,但本模型恢復(fù)效果更好。

圖2 不同模型視頻背景分離效果比較Fig.2 Comparison of background separation effect for different models

圖3 Escalator數(shù)據(jù)集像素值對比

從圖3中有人經(jīng)過的3個區(qū)間中各選取了一幀,即視頻序列的第1幀、第20幀和第30幀進(jìn)行比對,得到圖4。可見,GoDec、IALM和APG模型提取的背景含有前景像素的干擾(框內(nèi)部分),而本算法恢復(fù)了干凈的背景。

5 結(jié)論

為了改進(jìn)傳統(tǒng)RPCA模型中核范數(shù)近似秩函數(shù)存在的秩估計過大且計算效率低下缺陷,設(shè)計了一種新的非凸函數(shù)近似秩函數(shù),并且采用了結(jié)構(gòu)性稀疏的模型,以在保證稀疏約束的前提下,考慮運(yùn)動目標(biāo)在空間上的相關(guān)性,得到了一種新的非凸秩函數(shù)PCA模型NC-ALM。從實驗定量分析來看,NC-ALM模型在保證精度的前提下,減少了運(yùn)算時間,提高了圖像處理的效果。且隨著數(shù)據(jù)規(guī)模的擴(kuò)大,NC-ALM模型具有更好的應(yīng)用前景。

猜你喜歡
范數(shù)前景背景
“新四化”背景下汽車NVH的發(fā)展趨勢
我國旅游房地產(chǎn)開發(fā)前景的探討
《論持久戰(zhàn)》的寫作背景
四種作物 北方種植有前景
離岸央票:需求與前景
中國外匯(2019年11期)2019-08-27 02:06:32
基于加權(quán)核范數(shù)與范數(shù)的魯棒主成分分析
矩陣酉不變范數(shù)H?lder不等式及其應(yīng)用
晚清外語翻譯人才培養(yǎng)的背景
量子糾纏的來歷及應(yīng)用前景
太空探索(2016年10期)2016-07-10 12:07:01
一類具有準(zhǔn)齊次核的Hilbert型奇異重積分算子的范數(shù)及應(yīng)用
台北县| 正蓝旗| 衡南县| 张家港市| 屏东市| 修武县| 旅游| 新建县| 桑日县| 抚松县| 宜兴市| 柘荣县| 益阳市| 梧州市| 绿春县| 巧家县| 会东县| 天等县| 平江县| 社旗县| 含山县| 伊春市| 天水市| 玉山县| 英超| 建始县| 滨海县| 两当县| 龙门县| 吉林省| 衡阳市| 潞西市| 曲阳县| 安乡县| 馆陶县| 武义县| 都江堰市| 霍城县| 荃湾区| 威信县| 涡阳县|