尹世逵,李春旭,孟永斌,王 晨,趙婧含,李耀翔
(東北林業(yè)大學(xué) 工程技術(shù)學(xué)院,黑龍江 哈爾濱 150040)
中國森林資源稀缺,而東北重點國有林區(qū)作為國家的重要生態(tài)屏障,過去由于人類對木材的索取,森林資源總量在不斷下降。同時,隨著經(jīng)濟的發(fā)展,人們對木材的需求量也在與日俱增,因此最大限度地合理利用現(xiàn)有森林資源顯得尤為重要。為了更加合理地利用木材,人們根據(jù)木材性質(zhì)來評定木材的質(zhì)量等級,從而確定木材的最佳用途,獲取最大的經(jīng)濟效益。木材的基本密度作為木材質(zhì)量等級評定的一項重要參數(shù),在木材材性研究、森林培育、林木育種等方面具有重要應(yīng)用價值。因此,如何快速準(zhǔn)確地獲得木材的基本密度至關(guān)重要。椴樹Tilia tuan是東北林區(qū)大量分布的一種高大喬木,作為具有高經(jīng)濟價值的優(yōu)良樹種而被廣泛應(yīng)用于日常生產(chǎn)生活中,因其材質(zhì)輕而軟、紋理纖細,細密輕軟、脹縮力小不變形等特點在膠合板生產(chǎn)制造和建筑等領(lǐng)域發(fā)揮重要作用。
用于確定木材基本密度的常規(guī)方法包括水銀測量容器法、排水法等,然而這些方法耗時、繁瑣并且低效,更多用于實驗室密度的測定,不適宜在生產(chǎn)實踐中廣泛應(yīng)用,因而必須要尋找一種高效、便捷的估測方法達到批量快速測定的目的。近紅外光譜作為一種新型的無損檢測技術(shù),已廣泛應(yīng)用于木材的密度、含水率和抗彎強度等木材性質(zhì)的檢測中[1-6]。
Valentina 等人[7]利用近紅外光譜分析技術(shù),通過選取不同光譜波段對葡萄樹葉片水分的水勢數(shù)值進行快速測定,利用偏最小二乘法建模,得到驗證相關(guān)系數(shù)為0.67 ~0.77,校正相關(guān)系數(shù)為0.77 ~0.85,模型預(yù)測效果較好。Mauricio 等人[8]基于近紅外光譜技術(shù),結(jié)合偏最小二乘法對花旗松削片樣品密度進行快速預(yù)測,盡管模型相關(guān)系數(shù)不高,預(yù)測效果并不是十分理想,但為進一步準(zhǔn)確評估花旗松實時密度研究提供了理論依據(jù)。
江澤慧等[9-11]利用近紅外光譜分析技術(shù)對杉木、毛竹、落葉松等樹種的密度、纖維素結(jié)晶度、木質(zhì)素、強度等木材性質(zhì)進行研究分析,建立了木材強度、密度近紅外光譜預(yù)測模型,表明利用近紅外光譜技術(shù)可用于快速測定木材的性質(zhì)。王學(xué)順等人[12]采用小波變換和導(dǎo)數(shù)預(yù)處理結(jié)合的方法,對杉木木材近紅外光譜進行去噪預(yù)處理,有效降低光譜的噪聲和干擾,使得杉木近紅外光譜的信噪比提高,達到21.35,均方根誤差(RMSE)最小為0.000 282。張慧娟等人[13]在建立近紅外光譜模型時,對光譜數(shù)據(jù)采用導(dǎo)數(shù)的預(yù)處理方式,提升了模型的精度,最終得到模型校正和驗證相關(guān)系數(shù),分別為0.964 和0.918,使得建模結(jié)果更加精確。徐浩凱等[14]基于榆樹圓盤基本密度數(shù)據(jù)建立近紅外光譜預(yù)測模型,采用卷積平滑預(yù)處理,校正模型和驗證模型決定系數(shù)均有所提升,分別為0.899 和0.866,均方根誤差和標(biāo)準(zhǔn)差的值均達到最小,模型精度明顯提升。
近紅外光譜可以有效預(yù)測木材相關(guān)性質(zhì),適當(dāng)?shù)墓庾V預(yù)處理方法可以有效地提高模型性能[15]。然而對于相同研究對象的近紅外光譜數(shù)據(jù),究竟哪種預(yù)處理方法會對密度估測模型的精度產(chǎn)生最好影響,在國內(nèi)卻鮮有研究。因此,在選擇相同研究對象的情況下,比較和分析不同預(yù)處理方法對模型精度的影響,進而確定了最優(yōu)預(yù)處理方法,對構(gòu)建模型和提高預(yù)測精度具有重要意義。
本研究選取東北林區(qū)優(yōu)良的椴樹樹種作為研究對象樣本,采用樹木生長錐進行野外取樣,利用近紅外光譜分析技術(shù),研究了不同預(yù)處理方法對椴樹木材基本密度模型的影響,建立了椴樹木材基本密度的最佳近紅外光譜估測模型,為生產(chǎn)加工中椴樹木材基本密度的批量測定及后續(xù)的木材分流提供理論依據(jù)與技術(shù)支持。同時,利用近紅外光譜技術(shù),實時監(jiān)測木材性質(zhì),掌握木材性質(zhì)的變化,為進一步制定或改善林木培育方法提供理論依據(jù),進而實現(xiàn)椴樹林木種植的高效培育。
本研究所用椴樹樣品采集于黑龍江哈爾濱市方正縣星火林場,地理坐標(biāo)為128°13′41″~ 129°33′20″E、45°32′46″~46°09′00″N。方正縣屬丘陵低山地區(qū),海拔一般在300 ~700 m 之間。星火林場的氣候?qū)儆诤疁貛Т箨懶约撅L(fēng)氣候,冬季嚴寒多雪,夏季溫暖多雨。林場雨量充沛,年平均降水量579.7 mm,屬于中緯度地區(qū)???cè)照諘r數(shù)為1 178 h,日照百分比為54%,平均日照時間為8 h,土壤為暗棕壤森林土。林場植物種類繁多,植被覆蓋率良好,主要樹種有落葉松Larix gmelinii、 紅松Pinus koraiensis、椴樹、榆樹Ulmus pumila、白樺Betula platyphylla等樹種。
2.1.1 樣品采集與制備
椴樹生長錐樣品采自星火林場15 塊立地條件相似的樣地(20 m×20 m)。在每塊樣地從背陰面和向陽面各選取3 株椴樹平均木為標(biāo)準(zhǔn)木,在胸徑處由南向北用生長錐穿過樹心鉆孔取樣,取樣深度大約為木材胸徑的2/3,樣品直徑約為5.15 mm, 樣品長度100 ~350 mm 不等,本研究共獲取椴樹樣品45 個。在取樣完成后,采用活性黏土填堵取樣留下的孔洞,幫助樹木自我治愈,并能防止昆蟲對敏感樹種的侵害,以免對樹木后期成長發(fā)育造成影響。
2.1.2 樣品基本密度的測定
由于椴樹樣品形狀不規(guī)則,因此采用排水法獲取基本密度,根據(jù)木材基本密度的定義,木材樣品的基本密度等于木材絕干質(zhì)量與飽和水體積的比值。在實驗前,將椴樹樣品置于烘干箱中,在105 ℃下進行烘干處理,直到樣品完全干燥后,在電子天平上測定每個木材樣品的質(zhì)量(即絕干質(zhì)量)并記錄,樣品浸水處理48 h,每隔一段時間測定木材樣品質(zhì)量,直至木材樣品的質(zhì)量不發(fā)生改變,以確保木材樣品含水量達到飽和狀態(tài)。由于水在標(biāo)準(zhǔn)狀況下的密度為1 g/cm3,經(jīng)過換算可以確定樣品浸入水后排出水的體積(即水的質(zhì)量數(shù)值)等同于樣品的體積。測定時,將燒杯盛水至適當(dāng)深度放置于電子天平上,記錄此時電子天平的示數(shù),將樣品固定于鐵針上,而后將試樣浸入水下1 ~2 cm,待其穩(wěn)定后,記錄此時的天平示數(shù),前后2 次示數(shù)之差的數(shù)值即為樣品體積。依據(jù)實驗測定木材樣品的絕干質(zhì)量和飽和水的體積,通過計算即可得到樣品的基本密度,其中具體測定流程根據(jù)《木材密度測定方法》(GB/T 1933—2009)的標(biāo)準(zhǔn)進行。
2.1.3 光譜數(shù)據(jù)的采集
使 用 美 國ASD 公 司 的LabSpec? Pro FR/A114260 便攜式快速掃描光譜儀獲取椴樹樣品的近紅外光譜信息,儀器測定的光譜波長區(qū)域為350 ~ 2 500 nm,光譜分辨率為3 nm@700 nm、10 nm@ 1 400 nm 和2 100 nm。實驗在室溫20 ℃、空氣濕度為50%的條件下進行。為了確保數(shù)據(jù)的準(zhǔn)確性并避免樣品中含氫基團的水分子對近紅外光譜吸收的影響,將椴樹樣品置于烘干箱中,在105 ℃下進行烘干處理,直到樣品完全干燥并冷卻至室溫20 ℃。
從木材樣品的中間位置截斷樣品以采集光譜,為了得到較穩(wěn)定的模型,每個木材樣品均在橫斷面處采用80 目的砂紙打磨5 次,使其表面粗糙度參數(shù)Ra 基本接近12.5 μm。采用二分光纖探頭采集木材樣品的近紅外光譜。將近紅外光譜儀光纖探頭對準(zhǔn)白板進行空白校準(zhǔn)(校準(zhǔn)白板由聚四氟乙烯材質(zhì)制成)。根據(jù)江澤慧等人[11]的研究,木材樣品的3 種切面的近紅外光譜包含的信息均能表征木材樣品,且信息含量較為豐富。依據(jù)實驗材料特性,本研究選擇椴樹樣品橫斷面采集近紅外光譜(圖1a),用此方法采集的光譜實際為樹木胸徑處木材弦切面的光譜(圖1b)。在樣品相對的兩個端面各采集3 次近紅外光譜。在采集椴樹樣品表面近紅外光譜數(shù)據(jù)時,近紅外光譜儀會在1.5 s 內(nèi)對樣品連續(xù)掃描30 次,將平均近紅外光譜作為最終輸出光譜,采集間隔為1 nm,并且記錄近紅外光譜范圍為350 ~2 500 nm。接著將椴樹木材近紅外光譜數(shù)據(jù)導(dǎo)入ViewSpec Pro軟件中,進行光譜初步篩選,選擇椴樹樣品近紅外光譜數(shù)據(jù)的平均值作為該樣品的最終近紅外光譜數(shù)據(jù)。
圖1 生長錐樣品光譜采集示意Fig.1 Schematic diagram of spectral collection of growth cone sample
2.2.1 光譜預(yù)處理
在近紅外光譜中,通常由于儀器響應(yīng)、雜散光、光散射、樣品狀態(tài)等因素會對近紅外光譜原始圖像數(shù)據(jù)測定產(chǎn)生影響[16]。近紅外光譜數(shù)據(jù)不可避免地包含諸如隨機噪聲、基線漂移和儀器的環(huán)境背景之類的噪聲,這些噪聲影響會近紅外光譜數(shù)據(jù)的分析。因此,提取有用的近紅外光譜信號并增強可分析的信息以減少噪聲的影響尤為重要。近紅外光譜數(shù)據(jù)處理的一個重要目的是通過降低噪聲的影響來獲得具有高信噪比和低背景干擾的分析信號[17]。而常用的光譜預(yù)處理方法有許多,包括基線校正、卷積平滑、導(dǎo)數(shù)處理、多元散射校正、中心化處理等等。本研究主要探討卷積平滑、一階導(dǎo)數(shù)、二階導(dǎo)數(shù)等3 種應(yīng)用最廣泛的光譜預(yù)處理方法對椴樹木材基本密度預(yù)測模型精度的影響,并基于不同波段進行模型優(yōu)選。
2.2.2 建模方法
在使用不同的預(yù)處理方法處理近紅外光譜數(shù)據(jù)之后,通過對椴樹樣品的基本密度進行建模,依據(jù)椴樹木材基本密度模型的結(jié)果,來分析不同預(yù)處理方式對模型精度的影響。在進行定性或者定量分析時需要化學(xué)計量學(xué)方法,建模方法有多種,例如偏最小二乘法(PLS)、主成分分析法(PCA)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等。在近紅外光譜分析建模方法中,偏最小二乘法可以有效解決近紅外光譜信息量多的問題,采用逐步增加新信息的方法,在一定的程度上可以消除由外界噪聲所帶來的影響,提高數(shù)據(jù)精度,并且將自變量與因變量矩陣相關(guān)聯(lián),以獲得最佳的模型。而偏最小二乘回歸方法是多元線性回歸和主成分回歸的有效組合,因此基于以上特性,本研究采用偏最小二乘法對椴樹樣品進行建模分析。
本研究將椴樹木材基本密度和對應(yīng)的近紅外光譜數(shù)據(jù)輸入到化學(xué)計量學(xué)軟件Unscrambler 9.7中。收集的45 個椴樹樣品的近紅外光譜數(shù)據(jù)和基本密度數(shù)據(jù)以2:1 的比率隨機分成校正集和驗證集,以構(gòu)建椴樹木材的基本密度模型。在350 ~ 2 500 nm 波段范圍內(nèi),分別對原始近紅外光譜采用11 點卷積平滑處理、一階導(dǎo)數(shù)處理、二階導(dǎo)數(shù)處理的3 種預(yù)處理方式,結(jié)合偏最小二乘法進行椴樹木材基本密度模型的構(gòu)建,同時增加一組原始近紅外光譜對照組,不進行任何預(yù)處理方法直接進行數(shù)據(jù)建模,對比探究椴樹木材基本密度最優(yōu)模型。
2.2.3 模型評價
對于建模和預(yù)測集,校正集和交互驗證等模型質(zhì)量的評估,主要使用相關(guān)系數(shù)R,校正和預(yù)測均方根誤差(RMSE)的參數(shù)。其中公式如下:
式中:n是建模所用樣本數(shù);si是實測值;是實測值的平均值;是預(yù)測值。
相關(guān)系數(shù)的數(shù)值越大則說明模型的擬合效果越好,校正均方根誤差越小則表明模型的擬合性越好,預(yù)測均方根誤差越小,模型擬合預(yù)測效果越好,通過完全交互驗證(Full cross validation)進行模型質(zhì)量檢驗,評價模型效果。
如圖2 所示,橫坐標(biāo)為椴樹樣品近紅外光譜的波長,縱坐標(biāo)為椴樹樣品近紅外光譜的吸收度,A、B、C 分別代表3 個椴樹樣品基本密度對應(yīng)為0.329、0.339、0.351 g/cm3的近紅外光譜曲線。由此可以看出,椴樹樣品對近紅外光譜的吸收隨椴樹樣品基本密度增加而變強。雖然3 個椴樹木材樣品密度不同,但是它們每個近紅外光譜曲線形狀相似度很高,這點與張鴻富[18]針對落葉松木材密度的研究基本一致。且3 個椴樹木材樣品在近紅外光譜波長為1 412、1 877、2 050 nm 處均出現(xiàn)較強的吸收峰,這是因為木材是一種復(fù)雜的天然聚合有機物,內(nèi)部含有大量高分子有機物,近紅外光譜體現(xiàn)出來的正是這些有機物中的含氫基團信息,這些成分中大量的羥基會在近紅外區(qū)有很強的吸收[17]。由此可以得出密度較高的椴樹樣品所含有機物質(zhì)較多,導(dǎo)致近紅外光譜的吸收度變強,同時由于不同椴樹樣品中含氫基團在組成、結(jié)構(gòu)和含量上有細微不同,近紅外光譜的特征會隨之發(fā)生變化,因而得到的近紅外光譜曲線存在一定差異。這也說明了椴樹木材基本密度和近紅外光譜曲線之間有密切的聯(lián)系,因而可以通過構(gòu)建椴樹基本密度模型的方法,利用近紅外光譜數(shù)據(jù)來預(yù)測椴樹木材的基本密度。
本次實驗共測定了45 個椴樹樣品的基本密度,其中密度最大值為0.351 g/cm3,最小值為 0.329 g/cm3,密度平均值為0.339 g/cm3,標(biāo)準(zhǔn)差為0.004 9(表1)。
在350 ~2 500 nm 近紅外光譜波段范圍內(nèi),以椴樹木材樣品的近紅外原始光譜作為對照,研究了不同光譜預(yù)處理方式對椴樹木材基本密度建模精度的影響。采用椴樹樣品的原始近紅外光譜及11點卷積平滑處理、一階導(dǎo)數(shù)處理、二階導(dǎo)數(shù)處理的3 種預(yù)處理方式得到椴樹木材近紅外光譜,分別構(gòu)建椴樹木材基本密度近紅外預(yù)測模型(表2)。
圖2 3 種基本密度下椴樹木材近紅外光譜Fig.2 Near-infrared spectrum of Tilia tuan under three basic densities
由表2 可知,將對照組原始近紅外光譜數(shù)據(jù)直接建模結(jié)果與經(jīng)過不同預(yù)處理后的近紅外光譜數(shù)據(jù)建模結(jié)果對比,近紅外光譜數(shù)據(jù)進行不同預(yù)處理后,去噪效果明顯,校正集和驗證集的相關(guān)系數(shù)均有不同程度的提高,模型精度有所提升。
在350 ~2 500 nm 近紅外光譜波段下,對原始近紅外光譜分別采用11 點卷積平滑處理、一階導(dǎo)數(shù)處理、二階導(dǎo)數(shù)處理的3 種預(yù)處理方式后,得到近紅外光譜信號效果圖和主成分貢獻率(圖3 ~5)。通過主成分貢獻率和預(yù)處理后的近紅外光譜效果,可以清楚地看到在不同預(yù)處理狀況下,各個模型的主成分貢獻率變化情況。在隨著主成分數(shù)增加的同時,校正集模型的貢獻率呈現(xiàn)不斷上升的趨勢,當(dāng)校正集貢獻率達到最大值時,此時對應(yīng)的主成分數(shù)即最佳主成分數(shù),在該主成分個數(shù)下構(gòu)建椴樹木材基本密度模型將使得模型的效果達到最佳。
表1 椴樹樣品基本密度統(tǒng)計Table 1 Basic density statistics of Tilia tuansamples
表2 基于不同預(yù)處理方式的椴樹木材基本密度近紅外預(yù)測模型Table 2 Near-infrared prediction model of basic density of Tilia tuan based on different pretreatment methods
由圖3 可知,卷積平滑處理后的模型主成分個數(shù)為2,校正集相關(guān)系數(shù)為0.906 9,校正均方根誤差為0.010 4,驗證集相關(guān)系數(shù)為0.885 0,驗證均方根誤差為0.012 0。卷積平滑處理后的近紅外光譜曲線較為平滑(圖3a),近紅外光譜數(shù)據(jù)在卷積平滑預(yù)處理后,可以有效平滑高頻噪聲,提高信噪比,因此處理后模型精度有所提升。近紅外光譜圖像的吸收峰不明顯,近紅外光譜的有效信息率不高,在近紅外光譜邊緣存在高頻背景噪聲,因而椴樹木材基本密度模型效果不是最優(yōu)。
一階導(dǎo)數(shù)處理后的模型校正集相關(guān)系數(shù)為0.964 8,校正均方根誤差為0.002 7,驗證集相關(guān)系數(shù)為0.943 2,驗證均方根誤差為0.003 3。由圖4a 可知,經(jīng)一階導(dǎo)數(shù)處理后近紅外光譜的吸收峰值等信息更加明顯,有效信息率提高。由圖4b 可以確定,經(jīng)一階導(dǎo)數(shù)處理后,椴樹木材基本密度近紅外預(yù)測模型的最佳主成分數(shù)為4,比運用平滑處理后所構(gòu)建的椴樹木材基本密度近紅外預(yù)測模型的主成分數(shù)高,主成分個數(shù)增多對模型的構(gòu)建效果有一定的促進作用。應(yīng)用一階導(dǎo)數(shù)進行近紅外光譜預(yù)處理可以消除基線漂移,減少背景干擾對近紅外光譜數(shù)據(jù)的影響。與原始近紅外光譜相比,它還提供更高的分辨率和更明顯的近紅外光譜分布變化,因而構(gòu)建的模型預(yù)測效果最好。
圖3 卷積平滑處理后的椴樹木材近紅外光譜Fig.3 Near-infrared spectrum of Tilia tuan after convolution smoothing
圖4 一階導(dǎo)數(shù)處理后的椴樹木材近紅外光譜Fig.4 Near-infrared spectroscopy of Tilia tuan treated by first derivative
圖5 二階導(dǎo)數(shù)處理后的椴樹木材近紅外光譜Fig.5 Near-infrared spectroscopy of Tilia tuan after second derivative tretment
二階導(dǎo)數(shù)處理后的模型校正集相關(guān)系數(shù)為0.814 3,校正均方根誤差為0.003 5,驗證集相關(guān)系數(shù)為0.719 3,驗證均方根誤差為0.004 2。由圖5b 可知,經(jīng)二階導(dǎo)數(shù)處理后,椴樹木材基本密度近紅外預(yù)測模型的最佳主成分個數(shù)為2,主成分個數(shù)略少,結(jié)合圖5a 可以看出,椴樹木材近紅外光譜經(jīng)二階導(dǎo)數(shù)處理后,相應(yīng)地擴大了背景噪聲,使得近紅外光譜的有效信息率降低,進而導(dǎo)致近紅外光譜的吸收峰值變低,因此二階導(dǎo)數(shù)處理椴樹木材基本密度模型效果不夠理想。
由圖4 和圖5 對比可知,一階導(dǎo)數(shù)預(yù)處理后的近紅外光譜信息較二階導(dǎo)數(shù)要豐富許多,一階導(dǎo)數(shù)的近紅外光譜吸收度數(shù)值明顯要高一些,而二階導(dǎo)數(shù)處理過的近紅外光譜數(shù)據(jù)吸收度數(shù)值只有一階導(dǎo)數(shù)處理的10%,吸收度數(shù)值較小,在構(gòu)建椴樹木材基本密度近紅外預(yù)測模型時擴大了背景噪聲等白噪聲,因而影響模型整體的精度,導(dǎo)致二階導(dǎo)數(shù)處理的模型精度較之一階導(dǎo)數(shù)處理的模型精度有所下降。
綜合分析可以得出,基于椴樹木材原始近紅外光譜及卷積平滑預(yù)處理、一階導(dǎo)數(shù)預(yù)處理、二階導(dǎo)數(shù)預(yù)處理后的近紅外光譜,分別構(gòu)建椴樹木材基本密度近紅外預(yù)測模型,在350 ~2 500 nm波段內(nèi),采用一階導(dǎo)數(shù)對椴樹木材原始近紅外光譜進行預(yù)處理后,所建立的椴樹木材基本密度模型最優(yōu),其次是采用卷積平滑處理及采用二階導(dǎo)數(shù)處理后所構(gòu)建的椴樹木材基本密度模型,而基于原始光譜所構(gòu)建的椴樹木材基本密度模型精度最低。研究表明,卷積平滑、一階導(dǎo)數(shù)、二階導(dǎo)數(shù)預(yù)處理在一定程度上都會對椴樹木材基本密度近紅外預(yù)測模型精度有所提升,但提升的幅度并不是很大。由近紅外光譜信號效果圖(圖3a、圖4a和圖5a)可知,近紅外光譜數(shù)據(jù)兩側(cè)的噪聲過大,也可能是導(dǎo)致模型精度提升幅度不大的原因之一,接下來為進一步提高模型的精度和估測效果,將嘗試對椴樹木材基本密度模型進行優(yōu)化。
近紅外光譜波長在350 nm和2 500 nm附近時,近紅外光譜探測器達到了邊緣狀態(tài),產(chǎn)生了較大的噪聲,近紅外光譜在全譜區(qū)內(nèi)信息強度較低[12]。 噪聲較高波段主要集中在0 ~500、2 300 ~ 2 500 nm 波段范圍內(nèi),故本研究嘗試在500 ~ 2 300 nm 波段范圍內(nèi)進行椴樹木材基本密度近紅外預(yù)測模型的研究。分別對原始近紅外光譜數(shù)據(jù)進行11 點卷積平滑處理、一階導(dǎo)數(shù)處理、二階導(dǎo)數(shù)處理后,構(gòu)建椴樹木材基本密度近紅外預(yù)測模型。
由圖6 和圖7 可知,在對近紅外光譜數(shù)據(jù)去掉噪聲波段并采用一階導(dǎo)數(shù)、二階導(dǎo)數(shù)預(yù)處理后,近紅外光譜數(shù)據(jù)的噪聲區(qū)域明顯減少,光譜輪廓清晰,有效信息率提高。
圖6 一階導(dǎo)數(shù)去噪聲近紅外光譜信號效果Fig.6 First-order derivative denoising near-infrared spectrum signal effect diagram
圖7 二階導(dǎo)數(shù)去噪聲近紅外光譜信號效果Fig.7 Second-order derivative denoising near-infrared spectrum signal effect diagram
選取500 ~2300 nm 波段,分別采用11 點卷積平滑、一階導(dǎo)數(shù)、二階導(dǎo)數(shù)對椴樹木材原始近紅外進行預(yù)處理,采用偏最小二乘法構(gòu)建椴樹木材基本密度近紅外預(yù)測模型(表3)。
通過表3 對比分析各個模型評價參數(shù)可以看出,在500 ~2 300 nm 波段范圍內(nèi),應(yīng)用11 點卷積平滑處理的椴樹木材基本密度模型相對于全波段光譜下平滑處理的模型精度有顯著的提升,校正集和驗證集相關(guān)系數(shù)分別提高了8.2%和3.3%。該模型的最佳主成分個數(shù)也同時增加到4,由于在去掉噪聲的影響之后,模型的有效信息率提高,建模的最佳主成分數(shù)變多,模型的整體效果變好。500 ~2 300 nm 波段下應(yīng)用二階導(dǎo)數(shù)處理的椴樹木材基本密度模型比全波段光譜下二階導(dǎo)數(shù)處理的模型精度有所提升,驗證集和校正集的相關(guān)系數(shù)分別提高了11.3%和5.5%,但模型的驗證相關(guān)系數(shù)并不高??赡苁窃谌コ肼暤耐瑫r也去掉了近紅外光譜大量的有效信息,使得模型建模效果不佳,因而二階導(dǎo)數(shù)處理后的椴樹木材基本密度模型不能作為最佳的密度估測模型。
表3 基于500 ~2 300 nm 近紅外光譜波段不同預(yù)處理椴樹木材基本密度模型Table 3 Basic density model of pretreated Tilia tuan based on 500-2 300 nm near-infrared spectral band
在500 ~2 300 nm 波段下應(yīng)用一階導(dǎo)數(shù)處理模型相比全波段光譜下一階導(dǎo)數(shù)處理模型的校正集和驗證集相關(guān)系數(shù)分別提高了2.3%和0.5%,校正集和驗證集均方根誤差分別降低了40%和36%。綜上可知,在波段優(yōu)化后的各個預(yù)處理模型相對于波段優(yōu)化前全波段對應(yīng)的預(yù)處理模型的模型效果明顯要好,而且在500 ~2 300 nm 波段范圍內(nèi),通過一階導(dǎo)數(shù)處理的椴樹木材基本密度模型效果最優(yōu),其主成分數(shù)量為4,校正集相關(guān)系數(shù)為0.987 1,校正后的均方根誤差為0.001 6,驗證集相關(guān)系數(shù)為0.948 6,預(yù)測均方根誤差為0.002 1。
圖8 為一階導(dǎo)數(shù)預(yù)處理近紅外光譜波段優(yōu)化后的模型預(yù)測結(jié)果,橫坐標(biāo)為椴樹木材基本密度實際測定值,縱坐標(biāo)為椴樹木材基本密度近紅外模型預(yù)測值。
圖8 去掉噪聲后的一階導(dǎo)數(shù)近紅外光譜預(yù)測Fig.8 First derivative near-infrared spectroscopy prediction after noise is removed
在500 ~2 300 nm 波段內(nèi),一階導(dǎo)數(shù)預(yù)處理的椴樹木材基本密度模型,實測值與預(yù)測值的回歸趨勢線基本與1:1 理想趨勢線重合,而模型模擬線偏離1:1 線越少,則模型預(yù)測的效果就會越好[19]。其校正集相關(guān)系數(shù)最大為0.987 1,校正均方根誤差最小為0.001 6,驗證集相關(guān)系數(shù)為0.948 6,預(yù)測均方根誤差最小為0.002 1。一階導(dǎo)數(shù)預(yù)處理的模型精度較高,滿足完全交互驗證的模型檢驗要求,結(jié)果表明利用該模型可以實現(xiàn)對椴樹基本密度的高精度預(yù)測。
木材基本密度作為椴樹木材的一項重要屬性,通過采用最佳預(yù)處理方法對椴樹木材基本密度模型實現(xiàn)優(yōu)化有重要意義。本研究基于近紅外光譜分析技術(shù),運用偏最小二乘法構(gòu)建模型,對比分析了卷積平滑處理、一階導(dǎo)數(shù)處理、二階導(dǎo)數(shù)處理的光譜預(yù)處理方法對椴樹木材基本密度模型精度的影響。通過選取高信噪比的近紅外光譜波段進行模型優(yōu)化研究,得到以下結(jié)論:
1)對比分析模型結(jié)果可知,相對于未做預(yù)處理的椴樹木材基本密度模型來說,3 種預(yù)處理方法建立的椴樹木材基本密度模型精度均有所提升。在350 ~2 500 nm 波段范圍內(nèi),經(jīng)過一階導(dǎo)數(shù)預(yù)處理的椴樹木材基本密度模型效果最優(yōu),校正集相關(guān)系數(shù)為0.964 8,校正均方根誤差為0.002 7,驗證集相關(guān)系數(shù)為0.943 2,預(yù)測均方根誤差為0.003 3。
2)選取高信噪比近紅外光譜波段后,卷積平滑處理、一階導(dǎo)數(shù)處理、二階導(dǎo)數(shù)處理的模型精度均有不同程度的提升。在500 ~2 300 nm 波段范圍內(nèi),經(jīng)過一階導(dǎo)數(shù)預(yù)處理的椴樹木材基本密度模型效果最佳,校正集相關(guān)系數(shù)為0.987 1,校正均方根誤差為0.001 6,驗證集相關(guān)系數(shù)為0.948 6, 預(yù)測均方根誤差為0.002 1。校正集和驗證集相關(guān)系數(shù)相比原來分別提高了2.3%和0.5%,校正集和驗證集均方根誤差分別降低了40%和36%。
3)在選取高信噪比波段優(yōu)化模型前后,一階導(dǎo)數(shù)處理的模型結(jié)果優(yōu)于原始對照組、卷積平滑處理、二階導(dǎo)數(shù)處理的椴樹木材基本密度模型效果。研究表明,采用一階導(dǎo)數(shù)預(yù)處理方法結(jié)合近紅外光譜波段優(yōu)化,可以有效提高模型精度,達到快速、便捷地測定椴樹木材基本密度的要求,也為后續(xù)的近紅外光譜技術(shù)分析椴樹木材其他性質(zhì)的研究提供理論依據(jù)。
利用一階導(dǎo)數(shù)預(yù)處理方法建立椴樹木材基本密度模型,結(jié)合近紅外無損檢測技術(shù)對椴樹木材基本密度快速預(yù)測,進而實現(xiàn)伐區(qū)椴樹木材的分流利用。依據(jù)椴樹木材的其他性質(zhì)評定木材的質(zhì)量等級,確定椴樹木材最佳用途,在有限的木材資源下獲得最大的經(jīng)濟效益價值,對林業(yè)生產(chǎn)加工研究具有重要意義。由于本研究利用木材樣品絕干狀態(tài)下的光譜數(shù)據(jù)構(gòu)建基本密度估測模型,考慮到在野外測量中會產(chǎn)生一定的差異影響精度,在后續(xù)研究中會進行多批次采樣,模擬最真實的應(yīng)用環(huán)境,依據(jù)不同狀態(tài)下的光譜數(shù)據(jù)進行密度估測模型參數(shù)的調(diào)優(yōu),以反映最真實的木材基本密度信息?;谟绊戦矘淠静幕久芏饶P偷木纫蛩睾芏啵瑢δP偷膬?yōu)化方法不一,本研究針對性的探究其中一種,在后續(xù)研究中可以采用對近紅外光譜數(shù)據(jù)降維分析處理等方式優(yōu)化模型,以進一步提高基本密度模型精度。