馮志恒, 呂欣欣, 李賽楠, 周曉煦, 蔣開彬, 黃少偉
(華南農(nóng)業(yè)大學(xué)林學(xué)與風(fēng)景園林學(xué)院/廣東省森林植物種質(zhì)資源創(chuàng)新與利用重點實驗室,廣東 廣州 510642)
火炬松(PinustaedaL.)原產(chǎn)于美國東南部,于20世紀(jì)30年代引入我國,并進(jìn)行了廣泛的引種栽培,具有速生、材脂兼用、經(jīng)濟(jì)效益高等優(yōu)點,是我國南方地區(qū)重要的造林和工業(yè)用材樹種之一[1].我國對木材資源需求大,火炬松作為我國重要的紙漿材樹種之一,對其優(yōu)良品種、家系進(jìn)行選育具有重要意義.建立5年生火炬松木材基本密度近紅外模型,有利于開展火炬松木材密度這一性狀的早期選擇,以達(dá)到縮短育種周期、提高選擇效率的目的.
近紅外光譜(near infrared spectroscopy, NIRS)技術(shù)已廣泛應(yīng)用于農(nóng)林業(yè)[2,3]、畜牧業(yè)[4]、食品[5]、醫(yī)藥[6,7]等領(lǐng)域的成分預(yù)測[8]、等級評定[9].利用傳統(tǒng)的測量方法測量木材基本密度往往要進(jìn)行大量繁瑣的工作,會對木材造成了一定的損傷[10].近紅外光譜技術(shù)具有便捷、無損的優(yōu)點,僅通過在近紅外光譜區(qū)掃描收集木材的有機(jī)分子中含氫基團(tuán)(O-H、N-H、C-H)的特征信息,并對光譜信息進(jìn)行計算,最終得到木芯密度差異的化學(xué)值[11].
本研究利用近紅外成分分析儀結(jié)合木材基本密度實測值,構(gòu)建5年生火炬松木材基本密度的近紅外預(yù)測模型;并探究最佳預(yù)處理方法,對該模型進(jìn)行優(yōu)化;最終建立5年生火炬松木材基本密度的近紅外快速預(yù)測模型.
試驗樣品的采集地廣東省英德市林業(yè)科學(xué)研究所,地理坐標(biāo)24°15′N,113°25′E.該地屬于亞熱帶季風(fēng)氣候,多年平均氣溫20.7 ℃,一年中1月是最冷月份(最低氣溫-3.6 ℃),7月是最熱月份(最高氣溫40.1 ℃),年平均日照時數(shù)1 631.7 h,降水量充沛,年降水量達(dá)到1 918 mm.土壤為中黏紅壤,呈酸性,pH值為5.2~6.7.
試驗材料來自廣東省英德市林業(yè)科學(xué)研究所的火炬松種子園第二代自由授粉子代林,于2012年春造林.造林采用隨機(jī)完全區(qū)組設(shè)計,8次重復(fù),5株行式小區(qū).全林地采樣,采用生長錐在每一株樹的向陽面,由東向西鉆取木芯,鉆取高度距地面1.3 m,鉆得的木芯直徑12 mm.由于受到植株死亡、林地疏伐以及木芯保存率的影響,最終獲取用于試驗的樣品共計219份.共采集試驗樣品219個,并將所有樣品隨機(jī)分為校正集和驗證集,其中校正集180個,驗證集39個.
參照文獻(xiàn)[12]測定火炬松木芯的木材基本密度.將木芯做好標(biāo)記浸水至飽和,利用排水法測定體積.將木芯在105 ℃的烘箱中烘至全干,測定木芯質(zhì)量.最終通過計算得到木芯的基本密度.
利用瑞典Perter公司生產(chǎn)的DA7200多功能近紅外成分分析儀,采集近紅外光譜數(shù)據(jù).掃描波長為950~1 650 nm,分辨率為5 nm,掃描方式為漫反射,光斑直徑為3.5 cm.
采集光譜前先將樣品在室內(nèi)放置24 h以適應(yīng)掃描環(huán)境,減少環(huán)境變化對試驗產(chǎn)生的影響;開機(jī)后預(yù)熱30 min,待光源穩(wěn)定后,開始采集光譜數(shù)據(jù),每個樣品掃描3次,重復(fù)裝樣3次;導(dǎo)出光譜數(shù)據(jù)平均值.
近紅外光譜數(shù)據(jù)預(yù)處理和建模在The Umscrambler 9.7軟件上進(jìn)行,將一階導(dǎo)數(shù)(first-order-derivative, 1st Der)、標(biāo)準(zhǔn)正態(tài)變量轉(zhuǎn)換法(standard normal variate transformation, SNV)、平滑算法(savitzky-golay smoothing, SG)、乘積分散校正法(multiple scatter correction, MSC)和歸一化處理法以及幾種預(yù)處理方法結(jié)合起來,進(jìn)行數(shù)據(jù)預(yù)處理,根據(jù)殘差圖和杠桿圖來剔除異常值.采用偏最小二乘法(partial least square regression, PLS)建立近紅外預(yù)測模型.
利用15年生火炬松木材基本密度近紅外預(yù)測模型[13]對5年生火炬松木材基本密度進(jìn)行預(yù)測,木材基本密度平均值為0.552 8 g·cm-3;利用排水法對5年生火炬松木材基本密度進(jìn)行測定,木材基本密度平均值為0.362 9 g·cm-3.可見通過15年生火炬松木材基本密度近紅外預(yù)測模型無法準(zhǔn)確預(yù)測5年生火炬松的基本密度.
用排水法測得的校正集火炬松木芯樣品基本密度為0.297 1~0.444 0 g·cm-3,平均值為0.362 9 g·cm-3,標(biāo)準(zhǔn)差為0.025 1 g·cm-3.利用SAS 9.4軟件對校正集火炬松木芯樣品進(jìn)行正態(tài)性檢驗分析[14](表1).校正集火炬松木芯樣品的基本密度數(shù)據(jù)來自正態(tài)總體,具有代表性,可以作為模型的校正集.
表1 火炬松木芯基本密度校正集的正態(tài)性檢驗統(tǒng)計表 Table 1 Normality test of basic density of loblolly pine cores
通過對比各種方法(表2)的校正集相關(guān)系數(shù)(RC)、 交互驗證集相關(guān)系數(shù)(RCV)、校正集均方根誤差[RC(MSE)]和交互驗證集均方根誤差[RCV(MSE)],得到建模效果最好的預(yù)處理方法.RC和RCV的值越大,RC(MSE)和RCV(MSE)的值越小,模型越好[13].最終篩選出1st Der+MSC處理、歸一化處理和1st Der+SG處理3種預(yù)處理方法(表2).
表2 采用不同光譜預(yù)處理方法得到的火炬松基本密度近紅外預(yù)測模型參數(shù)的比較 Table 2 Comparison on parameters of near-infrared spectroscopy models for basic density of loblolly pine pretreated by different function processing methods
將光譜數(shù)據(jù)導(dǎo)入The Umscrambler 9.7軟件,分別以1st Der+MSC、歸一化和1st Der+SG 3種預(yù)處理方法建模.通過比較模型參數(shù)可以看出1st Der+MSC預(yù)處理方法是最好的預(yù)處理方法.但后續(xù)驗證結(jié)果表明1st Der+SG預(yù)處理方法的表現(xiàn)更優(yōu)(圖1),最佳主成分為17,RC值為0.925 2,RC(MSE)值為0.005 7 g·cm-3,RCV值為0.796 2,RCV(MSE)值為0.009 5 g·cm-3.
為了進(jìn)一步驗證近紅外預(yù)測模型的準(zhǔn)確度,利用建立的火炬松木材基本密度近紅外預(yù)測模型對39個校正集樣品的木材基本密度進(jìn)行預(yù)測(圖2),并與實測值進(jìn)行比較.驗證結(jié)果表明,預(yù)測值與實測值的最大標(biāo)準(zhǔn)偏差為0.036 g·cm-3,最小標(biāo)準(zhǔn)偏差為0,模型的預(yù)測值與實測值的相關(guān)性達(dá)到0.805 7,預(yù)測均方根誤差為0.013 9 g·cm-3,說明該模型有較好的預(yù)測效果.
本研究基于近紅外光譜技術(shù),運用1st Der、SNV、SG、MSC、歸一化處理以及幾種預(yù)處理方法相結(jié)合的方式,對5年生火炬松木芯樣品校正集的近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理,經(jīng)過比較分析得出最優(yōu)的建模預(yù)處理方法,即1st Der+SG的預(yù)處理方法;并基于此構(gòu)建了5年生火炬松木材基本密度近紅外快速預(yù)測模型.該模型的預(yù)測值與實測值的相關(guān)性為0.805 7,均方根誤差為0.013 9 g·cm-3,能預(yù)測5年生火炬松的木材基本密度.