孫哲華,孟慶浩,靳荔成
(天津大學(xué)機(jī)器人與自主系統(tǒng)研究所,天津市過程檢測與控制重點實驗室,天津大學(xué)電氣自動化與信息工程學(xué)院,天津 300072)
近年來,電子鼻技術(shù)的研究和應(yīng)用逐步成為國內(nèi)外的研究熱點,在汽車[1]、農(nóng)業(yè)[2]、食品[3]、醫(yī)藥[4]、環(huán)境保護(hù)[5]等領(lǐng)域都有較為廣泛的應(yīng)用,但是國內(nèi)的電子鼻技術(shù)大部分仍處于實驗室階段,阻礙電子鼻技術(shù)發(fā)展的一個很重要的因素是電子鼻采用的金屬氧化物型氣敏傳感器精度較低,會受到許多形式的噪聲干擾,噪聲的來源主要有傳感器長期使用產(chǎn)生的漂移噪聲以及環(huán)境對傳感器產(chǎn)生的噪聲[6],較大的噪聲會嚴(yán)重影響電子鼻的分類精度,因此,對于如何去除或降低電子鼻信號中的噪聲顯得十分重要。
為消除電子鼻中噪聲的影響,屈劍鋒[7]等提出了一種能夠自適應(yīng)調(diào)整測量方差以及去除非高斯噪聲的自適應(yīng)卡爾曼濾波算法,去除了電子鼻采樣過程中的傳感器噪聲信號,提高了識別精度。袁桂玲[8]等人利用獨立分量分析的方法,對傳感器陣列信號進(jìn)行分解,去除了外界干擾噪聲,對氣體成分的識別達(dá)到了較好的效果。馬澤亮[9]等使用傳感器陣列獲得白酒“指紋數(shù)據(jù)”后,通過離散小波變換對數(shù)據(jù)進(jìn)行預(yù)處理,采用波形相似系數(shù)作為指標(biāo),選擇出了最優(yōu)的小波系數(shù)和分解層數(shù),結(jié)合主成分分析實現(xiàn)對白酒真假的快速鑒別。J. Feng等人[10]以小鼠為實驗對象研究基于電子鼻的傷口感染檢測,采用小波分析對傳感器陣列的每個信號進(jìn)行分解,將受傷和健康小鼠的反應(yīng)信號在相應(yīng)尺度上的小波變換系數(shù)直接相乘,有效地消除了小鼠自身氣味的影響。S. Osowski等[11]分析了電子鼻識別汽油生物基添加劑時的畸變數(shù)據(jù),采用基于Haar小波的軟閾值函數(shù)離散小波去噪方法對畸變數(shù)據(jù)進(jìn)行了降噪處理,降低了識別的錯誤率。
目前的研究中,小波變換常用于電子鼻數(shù)據(jù)的降噪,但小波降噪方法中常用的軟閾值函數(shù)和硬閾值函數(shù)存在著一定的缺點:硬閾值函數(shù)降噪之后仍保留有尖刺和振蕩,降噪效果較差,而軟閾值降噪后雖然曲線較為平滑,但同時也對有效信號造成了一定的損傷,且閾值函數(shù)無法根據(jù)噪聲的不同進(jìn)行調(diào)整,為了解決這一問題,本文基于小波降噪中的軟、硬閾值函數(shù)提出了一種改進(jìn)的閾值函數(shù),通過仿真和實驗驗證了基于改進(jìn)的閾值函數(shù)的小波降噪方法的有效性,最后將其應(yīng)用于電子鼻采集的白酒數(shù)據(jù)中,通過主成分分析法[12]比較了4種不同的降噪算法的降噪效果,驗證了基于改進(jìn)的閾值函數(shù)的小波降噪方法對白酒電子鼻數(shù)據(jù)降噪的可行性。
本文使用的由實驗室自行研制的白酒檢測手持式電子鼻系統(tǒng)主要包括ARM(advanced RISC machines)系統(tǒng)板、氣室、氣路系統(tǒng)、LCD(liquid crystal display)觸摸屏等部件,該系統(tǒng)采用動態(tài)頂空采樣方法,設(shè)計了泵吹式的氣路系統(tǒng)。系統(tǒng)所使用的傳感器陣列是由6種MOS(metal oxide semiconductor)型氣體傳感器構(gòu)成,分別是CCS801和CCS803,TGS8100,MiCS-5914、MiCS-5524和MiCS-4514,各型號傳感器對應(yīng)的典型敏感氣體如表1所示。另外還配有溫濕度傳感器SHT21用于測量環(huán)境溫濕度,在做實驗時盡量保持環(huán)境溫濕度的一致,以防溫濕度變化對傳感器的響應(yīng)造成影響。
表1 氣體傳感器與典型敏感氣體
實驗中使用了6種不同的白酒,所屬香型、酒精度數(shù)以及產(chǎn)地都各有不同,包括汾酒、國窖1573,劍南春,飛天茅臺,五糧液和西鳳酒。實驗時室內(nèi)溫度為28 ℃,相對濕度為30%RH,電子鼻采樣頻率為400 Hz,采樣時間為40 s。其中采集基線的時間為4 s,吸氣時間(向氣室中吹入待測氣體的時間)為1 s,吸氣等待時間為3 s,呼氣時間(從氣室中吹入潔凈空氣的時間)為32 s。測試結(jié)束后持續(xù)向氣室中通入潔凈的空氣30 s,使各傳感器回復(fù)到基值狀態(tài),以便于下一個樣本的測量。
離散小波變換(discrete wavelet transform,DWT)是一種基于多分辨率分析和多采樣率濾波器理論的算法。常用于非平穩(wěn)信號分析和局部特征提取[13],其原理如圖1所示。圖中,P[n]為帶有噪聲的原始信號,g[n]為低通濾波器,h[n]為高通濾波器,帶有噪聲的原始信號通過2種濾波器進(jìn)行分解后,會得到2組分量,低頻分量部分Ai稱為近似分量,而高頻部分Di稱為細(xì)節(jié)分量,由于噪聲的頻率一般是高于有效信號的頻率,所以有效信號一般是位于近似分量中,再對近似分量進(jìn)行分解,可以進(jìn)一步地提取出有效信息。而由于信號在空間上(或者時間域)具有一定的連續(xù)性,因此在小波域,有效信號所產(chǎn)生的小波系數(shù)的模值一般較大;而高斯白噪聲在空間上(或者時間域)沒有連續(xù)性,因此噪聲經(jīng)過小波變換后對應(yīng)的系數(shù)很小[14]。需要通過一定的閾值選擇方法,比如無偏風(fēng)險估計閾值、固定閾值、啟發(fā)式閾值等,將閾值以內(nèi)的系數(shù)看做是噪聲對應(yīng)的系數(shù),進(jìn)行置0處理,其他系數(shù)通過一定的閾值函數(shù)進(jìn)行處理,將經(jīng)過閾值處理后的小波系數(shù)進(jìn)行重構(gòu),就可以得到去噪后的信號,這樣可以最大程度地抑制噪聲,同時只損失一部分有效信號。
圖1 DWT原理圖
較為常用的閾值處理辦法有硬閾值函數(shù)和軟閾值函數(shù)[15],硬閾值函數(shù)的基本思想是將閾值以內(nèi)系數(shù)置0,閾值范圍以外的系數(shù)不變,如式(1)所示:
(1)
該種閾值算法由于會在小波域產(chǎn)生突變,從而導(dǎo)致去噪后信號產(chǎn)生局部的振蕩,使得信號的光滑性變差,影響后續(xù)分析。而常用的軟閾值函數(shù)則是將大于λ的系數(shù)統(tǒng)一減去λ,而小于-λ的系數(shù)統(tǒng)一加λ,如式(2)所示:
(2)
式中:sgn()為符號函數(shù)。
經(jīng)過這種變換之后,去除了小波域中的突變,使得去噪之后的信號更為平滑,但缺點是需對小波系數(shù)進(jìn)行較大的改變,從而丟失更多的有效信號,造成不可避免的誤差,有著較大的信號失真。
為了改善軟、硬閾值函數(shù)的缺點,本文結(jié)合軟、硬閾值函數(shù)的思想,提出了一種改進(jìn)的閾值函數(shù),改進(jìn)的閾值函數(shù)如式(3)所示:
(3)
式中:a為調(diào)節(jié)因子,a>1。
將改進(jìn)的閾值函數(shù)和軟、硬閾值函數(shù)在同一坐標(biāo)系下表示(設(shè)閾值為2),其對比如圖2所示。從圖中可以看出,當(dāng)a值越大,改進(jìn)的閾值越接近硬閾值函數(shù),而當(dāng)a值減少時,閾值函數(shù)的曲線變得更為平滑,更接近軟閾值函數(shù)。改進(jìn)的閾值函數(shù)融合了軟、硬閾值函數(shù)的優(yōu)點,在去除閾值附近的突變、保證函數(shù)連續(xù)性的同時,將不在[-λ,λ]之內(nèi)的小波系數(shù)變化盡可能地減小,并且可以通過調(diào)整a值取得最佳的平衡點。這樣就使得信號在經(jīng)過重構(gòu)之后既不會丟失太多的有效信息,同時也能減少振蕩,達(dá)到更好的降噪效果。
圖2 改進(jìn)閾值算法和軟、硬閾值算法的對比圖
為了對改進(jìn)閾值函數(shù)的有效性進(jìn)行驗證,向1個原始信號中加入信噪比為10的高斯白噪聲,原始信號和加入高斯白噪聲的信號分別如圖3(a)和圖3(b)所示,原始信號中包含頻率較低且較為平滑的正弦曲線部分,也包括2個跳變,對應(yīng)白酒電子鼻檢測信號中頻率較低的有效信號曲線以及白酒電子鼻檢測到敏感氣體之后產(chǎn)生的響應(yīng)值上升過程。其跳變部分以及正弦曲線頂點部分都是較為重要的信息點。
(a)原始信號
(b)加入噪聲后的信號圖3 原始信號和含噪信號
首先對含噪信號進(jìn)行離散小波變換,采用較為常用的sym4小波基函數(shù)[9],分解層數(shù)選擇4,然后需要獲取每層小波系數(shù)的閾值,閾值的獲取方法為固定閾值法[16],其表達(dá)式如式(4)所示:
(4)
式中:λ為該層的閾值;N為該層小波系數(shù)的個數(shù);σ為該層小波系數(shù)的方差。
分別使用硬閾值函數(shù)、軟閾值函數(shù)和改進(jìn)閾值函數(shù)對系數(shù)進(jìn)行處理,并通過計算實驗的方式選出最佳的a值:a=1.2,最后通過逆變換實現(xiàn)降噪后信號的重構(gòu)。3種不同閾值函數(shù)的降噪效果如圖4所示。
(a)改進(jìn)閾值函數(shù)降噪效果
(b)硬閾值函數(shù)降噪效果
(c)軟閾值函數(shù)降噪效果圖4 不同閾值函數(shù)的降噪效果對比圖
從圖4可以看出,硬閾值函數(shù)降噪雖然在原信號突變處的效果還原較好,但是在降噪后的部分信號中仍保留著較大的振蕩和尖刺,降噪后的信號平滑度較差,高斯白噪聲加入的尖刺和振蕩并沒有完全去除;軟閾值函數(shù)降噪后的信號平滑度得到了很大的提升,正弦信號的2個頂點的還原程度較高,但是2個突變處的信號還原程度較差,第1個突變部分已經(jīng)很難看出,且第2個突變部分的幅值差也大大減?。桓倪M(jìn)的閾值函數(shù)降噪后的信號則較為完整的保留了2個突變處的信息以及正弦曲線較為平滑的部分,基本保留了原始數(shù)據(jù)的曲線,只存在小部分的小幅振蕩,并且在兩處突變的信息盡可能保留的前提下,去除了大部分由于高斯白噪聲產(chǎn)生的尖刺和振蕩。
信號的降噪效果也可以通過信噪比(signal-noise ratio,SNR)和均方根誤差(root mean square error,RMSE)定量地評價[17],信噪比和均方根誤差的表達(dá)分別如式(5)和式(6)所示:
(5)
(6)
信噪比反映的是有效信息的“能量”和噪聲的“能量”之間的比例,信噪比越大,則表示有效信息占的比例越多,即降噪的效果越好;而均方根誤差則表示噪聲的平均“能量”,均方根誤差越小,噪聲越少,降噪效果越好?;谲?、硬閾值函數(shù)和a=1.2的改進(jìn)閾值函數(shù)的小波降噪方法降噪后的信噪比和均方根誤差如表2所示。
表2 3種不同閾值函數(shù)的降噪效果對比表
由表2可以看出,改進(jìn)閾值函數(shù)降噪后的信噪比最高,均方根誤差最小,說明不僅有效信號占比最高,并且噪聲的“能量”最小。軟閾值函數(shù)因為對信號的平滑處理過于嚴(yán)重,導(dǎo)致有效信號的大量減少,信噪比最低。硬閾值函數(shù)處理過后的信號由于尖刺較多,導(dǎo)致噪聲的含量較高,信噪比也較低,并且均方根誤差較大,降噪效果較差。
針對白酒檢測電子鼻采集的六類白酒樣本,分別使用改進(jìn)的小波閾值函數(shù)降噪方法、軟閾值函數(shù)小波降噪方法、硬閾值函數(shù)小波降噪方法以及中值濾波加SG (savitzky-golay)濾波(先中值濾波再SG濾波)的方法[18]對其進(jìn)行降噪處理,以驗證改進(jìn)的閾值函數(shù)降噪方法的有效性。其中小波降噪方法均以“sym11”作為小波基函數(shù),分解層數(shù)為7層,閾值的獲取方法仍為固定閾值法,改進(jìn)的閾值函數(shù)的a取5.2(以上各參數(shù)均由計算試驗的方法獲得)。中值濾波函數(shù)的窗口長度為51,SG濾波的窗口長度為71,多項式階數(shù)為3[18]。數(shù)據(jù)處理軟件平臺采用MATLAB2017a。以CCS803的一次測量曲線為例,4種降噪方法的降噪效果如圖5所示,信號在5 s左右和8.75 s左右的峰值已標(biāo)出。
(a) 軟閾值函數(shù)降噪
(b) 硬閾值函數(shù)降噪
(c) 改進(jìn)的閾值函數(shù)降噪
(d) 中值加SG濾波降噪圖5 4種降噪方法的降噪效果圖
從圖5可以看出,硬閾值降噪后的信號中在15 s左右仍存在一些尖刺噪聲,降噪的效果較差;軟閾值函數(shù)降噪之后的信號較為平滑,但是在5 s左右的峰值要比其他的閾值函數(shù)降噪后的峰值要小,并且小于8 s左右的峰值,由于電子鼻系統(tǒng)采用先吸氣1 s后保持3 s的采集流程,所以傳感器響應(yīng)的最高值應(yīng)該出現(xiàn)在第一次峰值出現(xiàn)的時刻,對于CCS803即為5 s左右,8 s左右出現(xiàn)的尖峰可能是由于氣體流速增大導(dǎo)致的信號值上升[19],如果算作最大值,則會導(dǎo)致提取的特征不準(zhǔn)確;從6.25 s至8 s處的信號平滑程度來看,中值濾波加SG濾波降噪后的信號最為平滑,但是同樣出現(xiàn)了5 s左右的峰值小于8 s左右的峰值的問題;改進(jìn)的閾值函數(shù)降噪后的信號較為平滑,并且5 s左右的信號值大于8 s左右的信號值,不會造成提取特征不準(zhǔn)確的問題。
總體來看,硬閾值降噪的效果最差,其他3種降噪方式對于噪聲的去除效果較好,但是由于無法得知傳感器真實的響應(yīng),所以對于真實信號是否有損耗則無法看出,所以采用對降噪后的數(shù)據(jù)提取特征后進(jìn)行主成分分析(principal component analysis,PCA)的方法[12]對降噪效果進(jìn)行判別,具體操作步驟如下。
首先對降噪后的數(shù)據(jù)進(jìn)行特征提取,依據(jù)手持式電子鼻的采樣方式和數(shù)據(jù)曲線的形狀特點,選取響應(yīng)差值Rr和一階微分最大值Maxder為特征,其提取方法如下式所示:
(7)
Rr=max(St)-St0
(8)
式中:t為采樣時間;St為傳感器輸出電壓信號對應(yīng)的數(shù)字量;St0為響應(yīng)起始點對應(yīng)的傳感器輸出電壓信號的數(shù)字量。
然后使用PCA對特征矩陣進(jìn)行分析,繪制PCA得到的前2個主成分PC1、PC2組成PCA得分圖,幾種不同降噪方法得到的PCA得分圖如圖6所示??梢钥闯?,幾種降噪方法對于茅臺、國窖以及西鳳酒的區(qū)分效果比較好,體現(xiàn)在圖中即為這3種酒樣本和其他酒的區(qū)分度比較高;軟、硬閾值函數(shù)降噪對于汾酒、五糧液、劍南春這3種白酒的區(qū)分程度較差,3類樣本群在圖中較為混亂,沒有明顯的邊界;而改進(jìn)的閾值函數(shù)降噪和中值濾波加SG濾波降噪對于這3種白酒的區(qū)分程度稍好,3類樣本群在圖中雖有重疊部分,但是重疊部分的面積相對較小??梢钥闯觯?、硬閾值降噪的方法有一定的缺陷,不利于不同種類白酒的分類。
(a)軟閾值函數(shù)
(b)硬閾值函數(shù)
(c)改進(jìn)的閾值函數(shù)
(d)中值濾波加SG濾波圖6 不同濾波方法的PCA得分圖
為了定量地描述不同降維方法的分類性能,本文引入了樣本特征的類間離散度Sb和類內(nèi)離散度Sw[20],其中Sb可以表示不同類別樣本之間的分離程度,Sw代表同一類別的樣本的分離程度,其定義如下:
(9)
(10)
式中:c為樣本類別數(shù);ni為第i類樣本的樣本數(shù);Mi為第i類樣本的均值;M為所有樣本的均值;Xij是第i類的第j個樣本的特征。
不同的降噪方法對應(yīng)的類間、類內(nèi)離散度以及二者比值如表3所示,從分類的角度來看,類間離散度應(yīng)該越大越好,而類內(nèi)離散度應(yīng)該越小越好,這樣有利于后續(xù)的模式識別,故比值越大的降噪方法對分類更為有利,從表3可以看出,改進(jìn)的閾值函數(shù)降噪方法降噪后的類間離散度最大,說明其對不同類別的樣本區(qū)分程度較好,其類內(nèi)離散度和軟閾值函數(shù)相近,且小于硬閾值函數(shù),說明軟閾值函數(shù)和改進(jìn)的閾值函數(shù)降噪對相同類別的樣本聚類的效果好。中值濾波加SG濾波降噪的類內(nèi)離散度最低,但是類間離散度較低,說明該降噪方法對于同類別的樣本的聚類效果較好,但是不同類別樣本之間的區(qū)分程度較差。從Sb與Sw的比值來看,改進(jìn)的閾值函數(shù)降噪的效果最好,中值濾波加SG濾波降噪方法次之。
表3 不同降噪方法對應(yīng)的類間、類內(nèi)離散度及其比值
為了去除白酒電子鼻檢測信號中存在的噪聲,本文在軟、硬閾值函數(shù)小波降噪方法的基礎(chǔ)上提出了一種改進(jìn)的小波閾值函數(shù),使之同時具備了軟、硬閾值函數(shù)的優(yōu)點,并且其降噪的效果可以通過調(diào)整尺度因子進(jìn)行微調(diào)。通過仿真驗證可知,改進(jìn)的閾值函數(shù)小波降噪算法可以在不損失有效信號的同時對噪聲進(jìn)行有效地過濾,相比軟、硬閾值函數(shù)小波降噪方法,改進(jìn)的閾值函數(shù)小波降噪方法降噪后得到的SNR更高,RMSE更低,降噪效果更好。將改進(jìn)的閾值函數(shù)降噪方法應(yīng)用到白酒電子鼻的實驗數(shù)據(jù)中,結(jié)果表明,相比軟、硬閾值函數(shù)小波降噪方法以及中值濾波加SG濾波降噪方法,改進(jìn)的閾值函數(shù)小波降噪方法對于數(shù)據(jù)有較好的降噪效果,且降噪之后的數(shù)據(jù)集有著較大的類間離散度和較小的類內(nèi)離散度,利于不同類別的白酒之間的分類。以上仿真和實驗結(jié)果可以說明,改進(jìn)的閾值函數(shù)有效地克服了軟、硬閾值函數(shù)的缺點,且可以有效減少電子鼻中的噪聲,為電子鼻數(shù)據(jù)的降噪處理提供了一種可行的思路和方法。