蔣紅旭,王慶國
(武漢科技大學(xué) 汽車與交通工程學(xué)院,湖北 武漢 430081)
通過檢測設(shè)備采集的車輛軌跡數(shù)據(jù)被廣泛用于模型標(biāo)定、車輛行為決策等研究[1-3],但檢測設(shè)備在數(shù)據(jù)采集、處理和傳輸?shù)倪^程中會受到噪聲的干擾,使原始數(shù)據(jù)包含不同程度的噪聲,這些噪聲將會直接影響后續(xù)研究的科學(xué)性[4],因此有必要研究如何去除車輛軌跡數(shù)據(jù)的噪聲,提高數(shù)據(jù)質(zhì)量。小波去噪因其效率高、穩(wěn)定性好等特點(diǎn),在各領(lǐng)域的數(shù)據(jù)處理工作中被廣泛使用。但小波去噪方案的優(yōu)劣受小波基函數(shù)、閾值函數(shù)、分解層數(shù)等因素的影響,以分解層數(shù)的選取為例:如果分解層數(shù)過小,則信號中仍存在較多的噪聲數(shù)據(jù),無法獲得理想的去噪結(jié)果,如果分解層數(shù)過大,則會將信號中的部分細(xì)節(jié)信息當(dāng)做噪聲刪除,造成信號失真,同時增加計算復(fù)雜度[5],因此需要構(gòu)建科學(xué)合理的評價方法來指導(dǎo)小波去噪過程。
李晉斐等[6]選取均方根誤差和平滑度構(gòu)建了小波去噪復(fù)合評價指標(biāo),其權(quán)值通過熵權(quán)法和變異系數(shù)法進(jìn)行確定,在應(yīng)用于實(shí)測慣性數(shù)據(jù)的處理時,有著較好的評價效果。邵旋等[7]提出了一種采用變異系數(shù)法定權(quán)的綜合評價指標(biāo),選取均方根誤差變化量、信噪比變化量、平滑度、相關(guān)系數(shù)四個指標(biāo),采用該指標(biāo)指導(dǎo)變速箱動力傳動試驗(yàn)時的振動加速度信號的小波去噪?yún)?shù)選擇,處理后的特征頻率與原始頻率平均誤差僅為0.47%。王旭等[8]選取了均方根誤差變化量和平滑度變化量兩個指標(biāo)進(jìn)行復(fù)合評價指標(biāo)的構(gòu)建,定權(quán)方法采用熵權(quán)法,用該指標(biāo)能較好地指導(dǎo)沉降觀測數(shù)據(jù)處理中小波去噪分解層數(shù)的選擇?,F(xiàn)階段針對小波去噪評價的研究雖已取得一定的成果,但是在某些特定領(lǐng)域,因其數(shù)據(jù)的特異性,評價指標(biāo)并不通用,導(dǎo)致在該領(lǐng)域中,對分解層數(shù)的選擇大多基于經(jīng)驗(yàn)或直接給定得到,缺乏理論支撐[9]。
本文旨在提出一種適用于車輛軌跡數(shù)據(jù)處理的小波去噪評價方法,選取均方根誤差變化量和平滑度變化量兩個指標(biāo),使用熵權(quán)法和變異系數(shù)法完成兩指標(biāo)的定權(quán),將歸一化后的兩個指標(biāo)線性組合構(gòu)成復(fù)合評價指標(biāo)。
小波去噪的基本思想是將原始信號進(jìn)行小波分解,生成細(xì)節(jié)系數(shù)和近似系數(shù),其中真實(shí)信號表現(xiàn)為近似系數(shù),噪聲信號則主要集中在細(xì)節(jié)系數(shù)中,針對其中的細(xì)節(jié)系數(shù),設(shè)定閾值規(guī)則進(jìn)行處理,使用處理后的各分量進(jìn)行小波重構(gòu),得到去噪后的信號,其中小波分解與重構(gòu)大多使用Mallat 算法,分解和重構(gòu)算法互逆,其中Mallat 分解算法示意如圖1 所示。
圖1 Mallat 分解算法示意圖
其中:ci表示信號的近似系數(shù),di表示信號的細(xì)節(jié)系數(shù)。
現(xiàn)有評價小波去噪效果的原始評價指標(biāo)主要有均方根誤差(RMSE)、平滑度(r)、信噪比(SNR)、相關(guān)系數(shù)(R)[10],其中RMSE、SNR、R 描述了去噪信號細(xì)節(jié)上的信息,r 則更關(guān)注信號整體的變化趨勢。通常情況下,信號真值未知,參與運(yùn)算的信號含有噪聲,以本文使用的車輛軌跡數(shù)據(jù)為例,四個指標(biāo)和分解層數(shù)的關(guān)系如圖2 所示。
圖2 原始評價指標(biāo)和分解層數(shù)關(guān)系示意圖
由圖2 可見,RMSE 和分解層數(shù)正相關(guān),另外三個指標(biāo)均與分解層數(shù)負(fù)相關(guān),顯然,通過單一指標(biāo)無法獲得小波分解的最優(yōu)層數(shù),因此,現(xiàn)有針對小波去噪效果評價的研究,大都結(jié)合了多個原始評價指標(biāo)[11-12]。
為綜合考慮信號的細(xì)節(jié)信息和整體趨勢,本文選取均方根誤差變化量和平滑度變化量構(gòu)建復(fù)合評價指標(biāo),均方根誤差變化量和平滑度變化量計算如式(1)至式(4)所示。
式中:diff_RMSE(k)表示第k 層分解重構(gòu)方案的均方根誤差變化量,RMSE(k)表示數(shù)據(jù)經(jīng)k 層分解重構(gòu)后計算所得的均方根誤差,表示經(jīng)k 層分解重構(gòu)后的去噪數(shù)據(jù),f(i)表示原始數(shù)據(jù),m 表示數(shù)據(jù)長度。
式中:diff_r(k)表示第k 層分解方案的平滑度變化量,r(k)表示數(shù)據(jù)經(jīng)k 層分解后計算所得的平滑度。
以db3 小波函數(shù)為例,隨著分解層數(shù)的增加,均方根誤差變化量和平滑度變化量變化趨勢如圖3 所示。
由圖3 可見,隨分解層數(shù)的增加,均方根誤差變化量大體呈現(xiàn)先減小再變大的趨勢,平滑度變化量則一直減小,顯然,必存在某一層數(shù)使得去噪信號的細(xì)節(jié)信息和整體趨勢達(dá)到最優(yōu)的組合,該層數(shù)即為最優(yōu)分解層數(shù)。
圖3 指標(biāo)和分解層數(shù)關(guān)系示意圖
本文提出的復(fù)合評價指標(biāo)計算過程如下:
(1)因兩指標(biāo)單位等存在差異,不能直接進(jìn)行相關(guān)運(yùn)算,首先需進(jìn)行歸一化計算。
指標(biāo)歸一化計算公式如下:
式中:nor-index(k)表示第k 層分解方案的指標(biāo)歸一化值,index(k)表示第k 層分解方案的原始指標(biāo)值,max(index)和min(index)分別表示指標(biāo)的最大值和最小值。
(2)使用熵權(quán)法計算指標(biāo)權(quán)重,熵權(quán)法定權(quán)的基本思想是根據(jù)指標(biāo)變異性的大小來確定客觀權(quán)重,其變異性的大小通過信息熵體現(xiàn),一般而言,信息熵越小,其客觀權(quán)重越大。指標(biāo)信息熵計算公式如下:
(3)變異系數(shù)法定權(quán)是一種基于指標(biāo)差異性的定權(quán)方式,當(dāng)指標(biāo)差異性較大時,給予該指標(biāo)較大的權(quán)重。變異系數(shù)計算公式如下:
式中:Cindex表示指標(biāo)的變異系數(shù),σindex表示指標(biāo)的標(biāo)準(zhǔn)差,μindex表示指標(biāo)的均值。以均方根誤差變化量指標(biāo)為例,其定權(quán)計算公式如下:
(4)為發(fā)揮兩種定權(quán)方法各自的優(yōu)點(diǎn),將熵權(quán)法定權(quán)結(jié)果和變異系數(shù)法定權(quán)結(jié)果進(jìn)行結(jié)合,設(shè)定兩種定權(quán)方法所得權(quán)重結(jié)果均權(quán),則指標(biāo)復(fù)合權(quán)值為:
式中:Windex為指標(biāo)復(fù)合權(quán)值。
將上述步驟得到的歸一化后的指標(biāo)和指標(biāo)復(fù)合權(quán)值組合,即可得到本文的復(fù)合評價指標(biāo)X。公式如下:
由于數(shù)據(jù)采集、數(shù)據(jù)處理等因素的制約,純凈無噪聲的車輛軌跡數(shù)據(jù)f(o)難以獲得,本文使用51-SimOne 自動駕駛仿真測試平臺導(dǎo)出的車輛軌跡數(shù)據(jù)作為f(o),在此基礎(chǔ)上添加不同程度的白噪聲形成原始含噪聲數(shù)據(jù)f1(n)和f2(n),噪聲均值為0,其中f1(n)噪聲方差為0.1,f2(n)噪聲方差為0.3,對原始含噪聲數(shù)據(jù)進(jìn)行小波去噪后得到去噪后數(shù)據(jù)f(d)。f(o)、f1(n)和f2(n)如圖4 所示。
圖4 原始數(shù)據(jù)添加噪聲示意圖
進(jìn)行小波去噪時,使用db3~db8、sym3~sym8、coif3~coif5共計15 類小波基函數(shù),使用啟發(fā)式閾值確定閾值,啟發(fā)式閾值結(jié)合了無偏風(fēng)險估計閾值和固定閾值。無偏風(fēng)險估計閾值計算如下:
(1)將原始信號中每一個元素取絕對值,再由小到大排序,然后每個元素取平方,見式(13):
(2)計算各元素的風(fēng)險向量:
(3)求出最小風(fēng)險向量對應(yīng)的下標(biāo)i,得到無偏風(fēng)險估計閾值為:
固定閾值的計算如下:
啟發(fā)式閾值首先計算兩個變量Eta 和Crit 的大小,變量計算如下:
若Eta<Crit,則啟發(fā)式閾值選取固定閾值,反之選取無偏風(fēng)險估計閾值和固定閾值中的較小者。
常用小波閾值函數(shù)有軟閾值、硬閾值、模極大值、空域相關(guān)法,其中空域相關(guān)法計算量大且不適用于低信噪比信號,模極大值法在確定小波分解層數(shù)時存在較大難度[13],使用硬閾值進(jìn)行處理時信號會產(chǎn)生附加震蕩,產(chǎn)生跳躍點(diǎn),影響原始信號的平滑性,考慮到車輛軌跡數(shù)據(jù)的特性,本文的閾值函數(shù)采用使用軟閾值函數(shù),軟閾值函數(shù)見式(18)。
式中:wλ表示處理后的小波系數(shù),w 表示分解得到的小波系數(shù),λ 表示閾值。
計算f(o)和不同分解層數(shù)下f(d)之間的均方根誤差,均方根誤差越小則去噪效果越好[14],據(jù)此獲取每一小波基函數(shù)下的最優(yōu)分解層數(shù),使用f1(n)、f2(n)和不同分解層數(shù)下的f(d)計算本文提出的復(fù)合評價指標(biāo)X,X 存在極小值,其極小值對應(yīng)最優(yōu)分解層數(shù)。當(dāng)原始含噪聲數(shù)據(jù)為f1(n)時,以db4 小波基函數(shù)為例,本文復(fù)合評價指標(biāo)X、文獻(xiàn)[6]指標(biāo)H、文獻(xiàn)[15]指標(biāo)T,f(o)和不同分解層數(shù)下f(d)之間的均方根誤差RMSE*,計算結(jié)果如表1 所示。
表1 復(fù)合評價指標(biāo)計算
由表1 可見,使用本文復(fù)合指標(biāo)得到的最優(yōu)分解層數(shù)為5 層,指標(biāo)H(越小越好)和指標(biāo)T(越大越好)得到的最優(yōu)分解層數(shù)為4 層,由RMSE*得到的實(shí)際最優(yōu)分解層數(shù)為5 層。顯然,在該小波基函數(shù)情況下,本文提出的復(fù)合評價指標(biāo)效果更好。將原始含噪聲數(shù)據(jù)擴(kuò)展為f1(n)和f2(n),小波基函數(shù)擴(kuò)展為15 類小波基函數(shù),各指標(biāo)獲得的最優(yōu)分解層數(shù)及實(shí)際最優(yōu)分解層數(shù)Layer*如表2 所示。
表2 復(fù)合評價指標(biāo)對比評價
由表2 可見,在不同噪聲情況下,本文提出的復(fù)合評價指標(biāo)的正確率均較好,在噪聲方差為0.1 時,本文指標(biāo)的正確率達(dá)到了80%,而指標(biāo)H 和指標(biāo)T 的正確率較低,只有26.67%;在噪聲方差為0.3 時,不管使用哪一個小波基函數(shù),指標(biāo)H 和指標(biāo)T 均不能正確指導(dǎo)小波去噪最佳分解層數(shù)的選取,本文指標(biāo)的正確率相較于噪聲方差為0.1 的情況雖有所下降,但仍能達(dá)到66.67%。在原始含噪聲數(shù)據(jù)選取為f1(n)時,指標(biāo)H 和指標(biāo)T 在同一小波基函數(shù)的情況下,最優(yōu)層數(shù)判定結(jié)果完全相同,且同一指標(biāo)在任意小波基函數(shù)下的最優(yōu)層數(shù)的判定結(jié)果一致,可能是由于兩個指標(biāo)對車輛軌跡數(shù)據(jù)不夠敏感所致,在原始含噪聲數(shù)據(jù)選取為f2(n)時,結(jié)果表明兩指標(biāo)并不適用于指導(dǎo)噪聲較大的車輛軌跡數(shù)據(jù)的小波去噪分解層數(shù)選取。
針對車輛軌跡數(shù)據(jù)處理中小波去噪分解層數(shù)的選取缺乏理論支撐這一問題,本文選取均方根誤差變化量和平滑度變化量兩個指標(biāo),分別使用熵權(quán)法和變異系數(shù)法進(jìn)行權(quán)重計算,對兩種方法計算所得權(quán)重進(jìn)行組合,而后與歸一化后指標(biāo)進(jìn)行相關(guān)計算,構(gòu)建本文復(fù)合評價指標(biāo)X。結(jié)果表明,在車輛軌跡處理領(lǐng)域,本文提出的復(fù)合評價指標(biāo)在不同的小波基函數(shù)和不同強(qiáng)度的噪聲情況下,對小波去噪最佳層數(shù)的判定都有著較高的正確率,相較于其他指標(biāo),能更好地指導(dǎo)小波去噪分解層數(shù)的選取。