代 芬 李 巖 馮 棟
(華南農(nóng)業(yè)大學 工程學院,廣州 510642)
小波去噪在基于近紅外光譜的砂糖橘水分檢測的應用
代 芬 李 巖 馮 棟
(華南農(nóng)業(yè)大學 工程學院,廣州 510642)
水分含量是衡量砂糖橘營養(yǎng)品質(zhì)的重要指標之一,其快速無損檢測顯得越來越重要。本文基于小波變換的方法,對砂糖橘的500-2500nm區(qū)間的漫反射光譜,利用正交小波函數(shù)DBn(n=2,3,…10)分別進行2-6五個水平分解和消噪,并比較了不同小波函數(shù)和不同分解水平的消噪效果。結(jié)果表明,小波消噪有利于消除導數(shù)光譜中的噪聲,提高建模精度,基于小波函數(shù)DB3(分解尺度為3)消噪后的導數(shù)光譜建立的PLS模型的預測相關(guān)系數(shù)為0.8725,預測均方根誤差為0.6767。
砂糖橘;紅外光譜;含水量;小波消噪
砂糖橘(Citrus reticulate Blanco,Shatangju)又名十月橘,原產(chǎn)廣東省四會市。其果肉爽脆、口味清甜、色澤鮮艷、皮薄易剝,是柑橘類的名優(yōu)品種。砂糖桔果皮薄,在貯藏或者加工過程中易發(fā)生變質(zhì)。在評定砂糖桔品質(zhì),選擇貯藏條件和加工方式時,含水率是重要的指標之一?,F(xiàn)有砂糖橘水分檢測主要采用傳統(tǒng)的烘干法,這種方法需破壞樣品,且檢測時間較長。研究一種快速無損檢測砂糖橘含水率的技術(shù),實現(xiàn)大批量、規(guī)?;a(chǎn)的在線檢測,對于減少砂糖橘采后損失,提高產(chǎn)業(yè)經(jīng)濟效益具有重要的意義。
隨著計算機技術(shù)的迅速發(fā)展以及化學計量學方法研究的日益深入, 近紅外光譜技術(shù)在農(nóng)畜產(chǎn)品品質(zhì)檢測領(lǐng)域得到較快發(fā)展。近紅外光NIR( Near Infrared) 是介于可見光譜區(qū)和中紅外光譜區(qū)之間的電磁波, 其波長范圍約為 780 nm-2526nm, 波數(shù)范圍約為12820-3959cm-1。近紅外光譜檢測屬于非破壞性檢測,可保留農(nóng)產(chǎn)品完整外表而得其內(nèi)在品質(zhì),測試簡單,無繁瑣的前處理和化學反應過程,測試速度快,測試周期短。近紅外吸收光譜包含了待測農(nóng)產(chǎn)品的所有成分吸收信息,可同時檢測多種內(nèi)部成分,對測試人員無專業(yè)化要求,測試過程無污染,檢測成本低。而且隨著研究的深入,隨著模型中優(yōu)秀數(shù)據(jù)的積累,模型不斷優(yōu)化,測試精度不斷提高,應用范圍可以不斷拓展(雷松澤,2009)。
本文采用Field Spec 3光譜儀采集的200個砂糖橘樣本近紅外光譜為基礎(chǔ),通過學生化殘差圖剔除異常樣本,然后利用小波對原始光譜數(shù)據(jù)和一階導數(shù)光譜數(shù)據(jù)進行除噪,比較在不同分解尺度下的小波消噪效果。
1.1 砂糖橘樣本
從市場上分批購買產(chǎn)自廣東省四會市的砂糖橘共 193個樣本,將樣本貼上標簽備用。
1.2 樣本光譜采集
實驗使用美國 ASD(analytical spectral device)公司的FieldSpec 3光譜儀,如圖1所示。測量光譜范圍350-2500nm,采樣間隔為1.4nm@350-1000nm和2nm@1000-2500nm,光譜分辨率為3nm@350-1000nm和10nm@1000-2500nm,掃描次數(shù)10次,數(shù)據(jù)間隔1nm,并配有自帶光源的接觸式反射探頭。光源是與光譜儀配套的14.5 V鹵素燈。分析軟件為unscrambler9.8和Matlab7.8.0。
圖1 FieldSpec3 便攜式地物波譜儀
經(jīng)分析研究表明,相對于較遠的距離,近距離的測量而得到的定量分析模型效果較好[7]。因此本研究采用接觸式測量方式,在每個砂糖橘樣本的赤道部位取3點進行測量,每個點相隔120,使用反射探頭采集樣本的漫反射光譜。每個點掃描30次,將30個光譜數(shù)據(jù)進行平均作為這一點的光譜。然后將 3個點的光譜平均作為整個砂糖橘樣本的漫反射光譜。在采集光譜之前,實現(xiàn)要進行光譜儀預熱,優(yōu)化和白板校正。在采集過程中,每隔15-20分鐘要重新進行白板校正。200個砂糖桔的光譜數(shù)據(jù)如圖2所示。
圖2 200個砂糖橘樣品的原始光譜圖
1.3 砂糖橘水分含量測定
根據(jù)國家標準(GB/T 8858-1988)[8],采用烘干法測量砂糖橘水分含量。具體操作步驟:首先用精密天平測量鋁盒重量m1,然后采用四分法將砂糖橘樣品分成4份,每份約9-10g,將其裝入鋁盒,用精密天平測量鋁盒和樣品重量m2。將果肉用剪刀搗碎,將裝有樣品的鋁盒放入恒溫風干箱中風干,溫度設(shè)置為70℃。經(jīng)過9小時后,測量鋁盒和烘干后砂糖橘果肉的重量m3。烘干標準以前后半小時重量差小于0.001g為準。砂糖橘水分含量則可按下式計算:
每個樣本取2份進行含水量測量,最后取平均作為該樣本的含水量。
1.4 小波去噪的原理
小波(wavelet),即小區(qū)域的波,是一種特殊的長度有限、平均值為0 的波形。它有兩個特點:一是“小”,即在時域都具有緊支集或近似緊支集;二是正負交替的“波動性”,也即直流分量為零(飛思科技產(chǎn)品研發(fā)中心,2003)。小波變換的定義是把某一被稱為基本小波(也叫母小波mother wavelet)的函數(shù) 做位移 后,再在不同尺度a下與待分析的信號X(t)做內(nèi)積:頻率之比)恒定的特點,a越大相當于頻率越低。適當?shù)倪x擇基小波,使 在時域上為有限支撐, 在頻域也比較集中,就可以使WT在時、頻域都具有表征信號局部特征的能力,因此有利于檢測信號的瞬態(tài)或奇異點。
在近紅外無損檢測技術(shù)中,從光譜的測定和預處理、異常樣本點的剔除、校正集和預測集樣本的選擇到模型的優(yōu)化整個過程中,每一個環(huán)節(jié)都可能影響模型的預測性能[9,10]。因此,在建立光譜校正模型前,需對光譜樣本進行異常樣本剔除、對光譜數(shù)據(jù)進行必要的預處理和樣品集的有效劃分,以便增強光譜的有效信息和消除各種不確定因素的影響,獲得預測性能高的數(shù)學模型。
2.1 光譜數(shù)據(jù)預處理
導數(shù)光譜可以消除基線漂移和平緩背景干擾的影響,也可以提供比原光譜更高的分辨率和更清晰的光譜輪廓變化,但原始光譜經(jīng)導數(shù)處理后,會放大噪聲,降低原光譜的信噪比(嚴衍祿,2005)。對于導數(shù)光譜,嘗試用dbN小波消噪方法消除噪聲,提高信號的信噪比。將砂糖橘光譜首先轉(zhuǎn)化成一階導數(shù)光譜,然后分別選擇小波函數(shù)db2-db10,進行2,3,4,5,6共 5層分解,不同小波函數(shù)不同層次分解消噪后的建模效果如表1所示。
表1 基于db小波消噪的導數(shù)光譜建模效果比較
小波變換有以下特點:有多分辨率(multi-resolution),也叫多尺度(multi-scale)的特點,可以由粗及細地逐步觀察信號??梢钥闯捎没绢l率特性為 的帶通濾波器在不同尺度a下對信號做濾波。由傅立葉變換的尺度特性可以知這組濾波器具有品質(zhì)因數(shù)恒定,即相對寬度(帶寬與中心
小波類型 分解層數(shù) Rc RMSEC Rv RMSECV 2 0.9265 0.5436 0.8586 0.7433 3 0.9202 0.5655 0.8709 0.7113 Db 64 0.9336 0.5176 0.8919 0.6541 5 0.9310 0.5273 0.8812 0.6855 6 0.9060 0.6116 0.8462 0.7752 2 0.9255 0.5473 0.8565 0.7483 3 0.9316 0.5252 0.8708 0.7135 Db 74 0.9332 0.5191 0.8886 0.6635 5 0.9370 0.5048 0.8799 0.6900 6 0.8969 0.6388 0.8404 0.7876 2 0.9248 0.5497 0.8538 0.7552 3 0.9356 0.5100 0.8734 0.7068 Db 84 0.9354 0.5107 0.8877 0.6663 5 0.9298 0.5318 0.8778 0.6944 6 0.9128 0.5900 0.8593 0.7443 2 0.9254 0.5475 0.8564 0.7489 3 0.9368 0.5056 0.8806 0.6874 Db 94 0.9348 0.5130 0.8944 0.6472 5 0.9279 0.5385 0.8764 0.6984 6 0.9096 0.6001 0.8456 0.7777 2 0.9240 0.5526 0.8543 0.7538 3 0.9335 0.5180 0.8735 0.7062 Db 104 0.9304 0.5296 0.8838 0.6775 5 0.9183 0.5719 0.8707 0.7128 6 0.9024 0.6226 0.8495 0.7665
由表1可知,原始光譜求一階導數(shù)過程中放大了噪聲,光譜出現(xiàn)尖峰干擾,如圖 3(a)所示,因此模型的穩(wěn)定性下降所致。因此有必要對其進行小波消噪。通過小波消噪后,Rv有不同程度上升,RMSECV有不同水平下降,證明不同小波以及不同分解層次均有不同程度的消噪效果。
不同的小波函數(shù),消噪效果不同。以4層分解水平為例,以相關(guān)系數(shù)越大越好,均方根誤差越小越好,校正集數(shù)據(jù)與驗證相應集數(shù)據(jù)越接近越好這三條原則為判斷依據(jù),其消噪效果由好到差依次是db6-> db3-> db9-> db7-> db8-> db5->db2-> db4。
同一種小波,分解層次不同消噪的效果也不同。以db3小波為例,以第一個樣本為例,對其導數(shù)光譜進行2,3,4,5,6層分解消噪,比較不同層次的消噪效果,如圖3所示??梢姺纸獾膶哟卧蕉啵脊庾V與消噪光譜之間的差值越大。分解層次不夠,光譜中的噪聲消除不充分,會影響建模效果;反之,分解層次過多,在消除噪聲的同時,將有用信息也進行了消除,反而會降低建模精度。結(jié)合表1可見,以db3小波消噪時,分解層次從適合到不適合依次是 4-> 3->5-> 2-> 6。
綜合比較發(fā)現(xiàn),經(jīng)過db6小波4層分解消噪后,Rc從原來的0.9305提高到0.9336,Rv從原來的0.8451提高到0.8944;經(jīng)過Db3小波3層分解消噪后,Rc從原來的0.9305提高到0.9386,Rv從原來的0.8451提高到0.8926,RMSEC和RMSECV相應減小且更加接近,模型的精確度和穩(wěn)定性得到提高??梢娨浑A導數(shù)光譜經(jīng)過db6小波3層分解和db3小波3層分解消噪后的建模效果最好。
圖3 db 3小波不同層次分解時的消噪效果比較
2.3 預處理效果驗證
利用隨機劃分法將193個樣本劃分為145個校正集和48個預測集,校正集用于建立PLS模型,預測集用于預測所建模型的準確性和可靠性。劃分校正集和預測集后的統(tǒng)計結(jié)果如表2所示。
表2 校正集和預測集的統(tǒng)計結(jié)果
校正集的最大值大于預測集的最大值,校正集的最小值小于預測集的最小值,校正集的標準偏差大于預測集的標準偏差,預測集水分含量范圍小于校正集水分含量范圍。用校正集中145樣本建模,并對預測集中的48個樣本進行預測,驗證結(jié)果如表3所示,其中預測效果最好的模型D的預測回歸圖如圖4所示。
表3 經(jīng)最佳預處理后的PLS模型預測效果
說明基于導數(shù)光譜可以消除基線漂移和平緩背景干擾的影響,對提高建模精度有幫助。如果通過恰當?shù)男〔ǚ纸鈩t可以在很大程度上消除引入的噪聲,其效果往往比基于原始光譜和導數(shù)光譜建立的模型效果要好。
圖4 模型D的預測回歸圖
探討了基于導數(shù)光譜的 dbN小波消噪,求一階導數(shù)過程中放大了噪聲,光譜出現(xiàn)尖峰干擾,因此基于導光譜的模型的穩(wěn)定性會下降。通過dbN小波消噪后,Rv有不同程度上升,RMSECV有不同水平下降,證明所有dbN小波在恰當?shù)姆纸鈱哟紊暇胁煌潭鹊南胄Ч?。綜合比較發(fā)現(xiàn),基于小波函數(shù)DB3(分解尺度為3)消噪后的導數(shù)光譜最優(yōu),預測相關(guān)系數(shù)為0.8725,預測均方根誤差為0.6767。
[1]嚴衍祿,趙龍蓮,韓東海.近紅外光譜分析基礎(chǔ)與應用[M].京:中國輕工業(yè)出版社,2005.
[2]何東健,前川孝昭,森島博.水果內(nèi)部品質(zhì)在線近紅外分光檢測裝置及試驗[J].農(nóng)業(yè)工程學報, 2001, 17 (1):146-148.[3]袁雷,劉輝軍,余桂英,等.柑橘品質(zhì)的近紅外光譜無損檢測[J].光譜實驗室,2006,23(4):820-822.
[4]陸輝山,傅霞萍,謝麗娟,等.可見/近紅外光估測完整柑橘水果可溶性固形物含量的研究[J].光譜學與光譜分析,2007,27(9):1727-1730.
[5]夏俊芳,李小昱,李培武,等.基于小波變換的柑橘維生素 C含量近紅外光譜無損檢測方法[J].農(nóng)業(yè)工程學報,2007,23(6):170-174.
[6]劉燕德,陳興苗,孫旭東.可見/近紅外漫反射光譜無損檢測南豐蜜橘維生素 C[J].光譜學與光譜分析,2008,28(10):2318-2320.
[7]Slaughter D C,Thompson J F,Tan E S.Nondestructive determination of total and soluble solids in fresh prune using near infrared spectroscopy[J].Postharvest Biology and Technology. 2003, (28): 437-444.
[8]GB/T8858-1988,水果、蔬菜產(chǎn)品中干物質(zhì)和水分含量的測定方法[s].1988.
[9]Seasholtz M B,Kowalski B R. The parsimony principle applied to multivariate calibration[J].Analytica Chimica Acta,1993,277(2):165-177.
[10]史波林,趙鐳,劉文,等.蘋果內(nèi)部品質(zhì)近紅外光譜檢測的異常樣本分析[J].農(nóng)業(yè)機械學報,2010,41(2):132-137.
[11]林萍,陳永明,何勇.基于可見近紅外光譜的糖類別快速鑒別研究[J].光譜與光譜學分析,2009,29(2):382-385.
Analysis of the Near Infrared Spectroscopy Based on Wavelet De-noising
DAI Fen, LI Yan, FENG Dong
(College of Engineering, South China Agricultural University, Guangzhou, 510642, China)
water content is one of the most important nutrition material in shatangju oranges. The fast and nondestructive examination of water content in sugar oranges is more and more important. Firstly, the spectra of Shatangju samples within 500-2500nm were decomposed in level 2-6 using the orthogonal wavelet functions DBn(n=2,3,…10). And then the de-noise results of different wavelet functions and different decomposing levels were compared. Wavelet de-noise (WD) was examined to be the optimal spectrum preprocessing method. The PLS model based on derivative spectra with DB3 wavelet de-noise (in decomposition level 3)produced best result (RMSEP=0.6767, Rp=0.8725 ).
Shatangju; Near infrared (NIR) spectrometry; Water content; Wavelet de-noising
A
1673-2219(2011)08-0036-04
2011-04-18
國家現(xiàn)代農(nóng)業(yè)(柑橘)產(chǎn)業(yè)技術(shù)體系建設(shè)專項資金資助項目(農(nóng)科教發(fā)【2007】14號,【2011】3號);華南農(nóng)業(yè)大學校長基金資助項目(4500-K09173)。
代芬(1978-),女,湖北天門人,博士,講師,研究方向為農(nóng)產(chǎn)品品質(zhì)無損檢測。
(責任編校:劉志壯)