王柯人 舒清態(tài) 趙洪瑩 譚德宏 袁梓健
(西南林業(yè)大學(xué)林學(xué)院,云南 昆明 650233)
森林作為“地球之肺”,其生物量的估測、監(jiān)測和評價一直是學(xué)術(shù)界的關(guān)注熱點(diǎn),其中生物量估測的建模發(fā)揮著重要作用。國內(nèi)外關(guān)于森林地上生物量估算的方法眾多:基于單木水平生物量模型構(gòu)建[1-2]、基于林分生物量模型構(gòu)建[3-5]。在建立單木地上生物量模型時,為評價模型擬合優(yōu)度,國內(nèi)外學(xué)者采用確定系數(shù)(R2)、估計(jì)值的標(biāo)準(zhǔn)差(SEE)、平均系統(tǒng)誤差(MSE)及總相對誤差(TRE)等[6]。
關(guān)于單木地上生物量模型建立過程中的不確定性來源一般分為三方面:抽樣誤差、模型誤差和測量誤差[7]。Shettles等[8]認(rèn)為,模型誤差在3種誤差來源中所占比重最大。鑒于此,本研究重點(diǎn)為模型誤差的分析。模型誤差來源分為四方面:變量本身的誤差、殘差變異性、參數(shù)估計(jì)產(chǎn)生的誤差、所選擇模型的誤差[9-10]。當(dāng)前國內(nèi)外關(guān)于模型的誤差分析集中于多個模型精度評價和比較[1,11-12],變量本身的誤差分析,也就是測量過程中誤差分析[13-14],關(guān)于模型參數(shù)不確定性及殘差變異性分析常被忽略。王仲鋒等[15]認(rèn)為采用非線性最小二乘回歸法求解單木地上生物量冪函數(shù)的參數(shù)及參數(shù)協(xié)方差矩陣,可獲得較高精度,對模型參數(shù)不確定進(jìn)行分析。傅煜等[16-17]認(rèn)為對于非線性模型,運(yùn)用泰勒級數(shù)一階展開項(xiàng)度量非線性模型的參數(shù)誤差可以取得較好的效果。如何計(jì)算量化多種多樣的不確定性以提高森林地上生物量估算的精確度已成為當(dāng)前研究的重要挑戰(zhàn)。
本研究以云南省香格里拉市為研究區(qū),基于香格里拉市2016年森林資源二類調(diào)查數(shù)據(jù),通過建立一元、二元地上生物量模型來估算高山松(Pinus densata)單木地上生物量[18-19],并分析了2種模型的不確定性,以期為提高高山松森林地上生物量估測精度提供參考。
香格里拉市位于云南省西北部(99°23′06.08″~
100°18′29.15″E,26°52′11.44″~28°50′59.57″N),總面積114.2萬hm2,東、南、西三面被金沙江環(huán)繞,是滇、川、藏三省區(qū)交界地,也是世界自然遺產(chǎn)“三江并流”景區(qū)所在地。主要地貌類型為山地,地形總趨勢西北高、東南低,海拔為1 503~5 545 m。區(qū)域內(nèi)高山松作為我國西南部香格里拉地區(qū)及青藏高原地區(qū)的特有森林建群種,起源于油松(Pinus tabuliformis)與云南松(Pinus yunnanensis)的天然同倍體雜種,在高山地區(qū)形成大面積純林,對保持高原森林生態(tài)環(huán)境有十分重要的意義[19]。
研究所使用的113株高山松地上部分生物量數(shù)據(jù)通過收獲法獲取,并測量單木胸徑(DBH)、樹高(H)以及木材、樹皮、樹枝及樹葉鮮質(zhì)量,分別抽樣帶回實(shí)驗(yàn)室,在85 ℃下恒溫烘干至恒質(zhì)量,稱量樣本干質(zhì)量,換算得出樣木各組分干質(zhì)量,匯總得出立木地上生物量。高山松單木建模數(shù)據(jù)統(tǒng)計(jì)特征見表1。單木各部分生物量數(shù)據(jù)中,單木胸徑在每個徑階分布不均,單木地上生物量最大值為2 058.5 kg,最小值為4.03 kg。單木各個部分生物量平均值及標(biāo)準(zhǔn)差差異顯著,干材生物量平均值及標(biāo)準(zhǔn)差最高,樹葉生物量平均值及標(biāo)準(zhǔn)差最低。
表 1 高山松單木建模數(shù)據(jù)統(tǒng)計(jì)特征Table 1 Statistical characteristics of modelling data sets
已有研究表明,冪函數(shù)在針葉林生物量模型構(gòu)建中效果較好[1-3]。本研究基于冪函數(shù)進(jìn)行高山松單木地上生物量模型構(gòu)建,分別采用胸徑單變量和胸徑?樹高進(jìn)行擬合,并采用最小二乘法求解公式中的參數(shù)采用最小二乘法求解公式中的參數(shù),計(jì)算公式由式(1)、(2)表示。
回歸模型建立過程中,利用殘差值表示回歸分析中測量值與方程預(yù)測值的差值來反映生物量模型擬合的效果[18],如式(1)、(2),則模型誤差可表示為:
研究發(fā)現(xiàn),殘差的標(biāo)準(zhǔn)差隨單木地上生物量的增加而增加,呈線性關(guān)系[9]。即:
式中:μ為殘差值的標(biāo)準(zhǔn)差,β為擬合參數(shù)。
在計(jì)算μ時,本研究采用六步法計(jì)算[20],將單木地上生物量的實(shí)測值A(chǔ)GB進(jìn)行升序排列,計(jì)算預(yù)測值及殘差值ε,再以n個樣本為一組,若最后一組不足n,則計(jì)入上一組,n取5、8、10。最后計(jì)算每組數(shù)據(jù)生物量預(yù)測值的平均值及殘差的標(biāo)準(zhǔn)差με,此時,對于生物量預(yù)測值的平均值、殘差值的標(biāo)準(zhǔn)差和擬合參數(shù)可通過下式計(jì)算:
采用非線性最小二乘法的原理求解單木高山松地上生物量模型參數(shù)a、b、c。參數(shù)引起的不確定性,可以采用泰勒級數(shù)對式(1)、式(2)展開[9-10,16]。則有:
式中: AGBi(x,γ)中參數(shù)γ可反映最近似真實(shí)值的
模型誤差指在生物量模型估計(jì)中的誤差,其中最主要的是模型殘差變異不確定性和模型參數(shù)估測誤差。由已有研究可知,生物量模型估測中不確定性來源于抽樣誤差和單木生物量外推時傳播并累計(jì)下來的誤差,并具有傳遞性[17,21-22]。因此高山松單木地上生物量估測模型綜合不確定性(ξ)可通過模型殘差變異性和模型參數(shù)估測誤差來表示:
式中:β為模型殘差不確定值,δF為地上生物量模型參數(shù)引起的模型估測誤差。
本研究以高山松單木胸徑以及樹高和胸徑組合分別構(gòu)建一元和二元回歸模型,結(jié)果見表2。由表2可知,2個模型回歸系數(shù)以及調(diào)整后的回歸系數(shù)(Radj2)均大于0.9,說明模型擬合效果較好;二元地上生物量模型調(diào)整回歸系數(shù)、均方根誤差(RMSE)均優(yōu)于一元地上生物量模型。根據(jù)生物量建模數(shù)據(jù)繪制單木地上生物量、胸徑及樹高散點(diǎn)圖見圖1~2。由圖1可知,高山松單木建模數(shù)據(jù)集中于胸徑0~30 cm,高山松胸徑小于20 cm時,地上生物量增長緩慢,當(dāng)胸徑大于30 cm,地上生物量呈上升狀態(tài),且增長速率增大。由圖2可知,單木樹高、胸徑和地上生物量呈明顯的線性關(guān)系。
表 2 單木生物量模型的構(gòu)建Table 2 Construction of individual biomass model
圖 1 高山松一元地上生物量模型Fig.1 Univariate biomass model ofP. densata
圖 2 高山松二元地上生物量模型Fig.2 Binary biomass model ofP. densata
3.2.1 模型的殘差變異不確定性分析
根據(jù)模型殘差標(biāo)準(zhǔn)差與預(yù)測值的散點(diǎn)圖(圖3),一元單木地上生物量模型殘差變異引起的不確定性可表示為:0.615。對于一元地上生物量模型,由模型殘差變異引起的不確定性約為6.20%。
圖 3 殘差值的標(biāo)準(zhǔn)差與高山松生物量預(yù)測值的關(guān)系Fig.3 The relationship between the SD of the residuals and biomass prediction
3.2.2 模型參數(shù)對生物量模型估計(jì)不確定性分析
一元地上生物量模型參數(shù)對生物量模型估計(jì)的不確定性在MATLAB下將一元地上生物量回歸模型經(jīng)過泰勒級數(shù)展開后求得靈敏度系數(shù)矩陣,也就是參數(shù)的協(xié)方差矩陣,可求得參數(shù)不確定性。其中,一元模型參數(shù)的協(xié)方差矩陣為可求得一元模型中由于模型參數(shù)帶來的不確定性δ=30.20%。根據(jù)殘差變異不確定性及參數(shù)不確定性進(jìn)行不確定性合成,因此高山松單木一元地上生物量模型的綜合不確定性約為30.83%。
3.3.1 模型的殘差變異不確定性分析
根據(jù)二元模型殘差值的標(biāo)準(zhǔn)差與預(yù)測值的變化,由圖4可知,從圖中可看出殘差值的標(biāo)準(zhǔn)差隨著單木地上生物量預(yù)測的增加而增加,與一元地上生物量模型的殘差標(biāo)準(zhǔn)差與單木地上生物量變化的趨勢相同。其變化規(guī)律可表示為:因此對于二元地上生物量模型而言,由模型殘差變異引起的不確定性約為5.17%。
圖 4 殘差的標(biāo)準(zhǔn)差與高山松生物量預(yù)測值的關(guān)系Fig.4 The relationship between the SD of the residuals and biomass prediction
3.3.2 模型參數(shù)對生物量模型估計(jì)不確定性分析
將二元地上生物量回歸模型經(jīng)過泰勒級數(shù)展開后求得靈敏度系數(shù)矩陣得到二元模型參數(shù)的協(xié)方差矩陣可
求得二元地上生物量模型的參數(shù)不確定性δ=3.12%。根據(jù)參數(shù)不確定性進(jìn)行不確定性及殘差變異不確定性合成,因此高山松單木二元地上生物量模型的綜合不確定性約為6.04%。
由于建模樣本數(shù)量一定程度反映了模型的適應(yīng)性和可拓展性,本研究使用了113株樣木數(shù)據(jù)建模,為探究建模樣本數(shù)對模型構(gòu)建的影響,本研究總樣本數(shù)(N)為113,隨機(jī)抽取了N/3、2N/3的樣本量,計(jì)算不同樣本量條件下的模型參數(shù)不確定性。其次,對比相關(guān)研究來看,不同分組樣本數(shù)對模型殘差的不確定性也有一定影響,為探究不同分組數(shù)據(jù)對模型殘差變異的影響,本研究還探討了5株一組、8株一組、10株一組的分組方式進(jìn)行殘差不確定性變化分析,結(jié)果見表3。
表 3 不同建模樣木數(shù)量及分組方式對模型不確定性影響Table 3 Model uncertainty influence of different modeling sample quantity and grouping methods
由表3可知,當(dāng)分組樣本數(shù)為5時,二元地上生物量模型的殘差變異不確定性、參數(shù)不確定性及綜合不確定性均優(yōu)于一元模型,且模型參數(shù)引起的不確定性大于模型殘差變異不確定性。基于113株高山松單木生物量構(gòu)建一元地上生物量模型中由模型參數(shù)引起的不確定性為30.30%,模型殘差變異引起的不確定性約為5.17%,綜合不確定性約為30.83%;二元回歸模型中由模型參數(shù)不確定性為3.12%,殘差變異引起的不確定性約為6.18%,綜合不確定性約為6.94%;隨著樣本量的增加,模型的參數(shù)不確定性及殘差變異不確定性逐漸減小,當(dāng)建模樣本量從38增加至71時,模型的不確定性變化顯著,一元模型的參數(shù)不確定性和殘差變異不確定分別由49.89%和7.58%降低至35.39%和6.33%,綜合不確定性減少14.52%;二元模型參數(shù)不確定性和殘差變異不確定分別由41.47%和12.06%降低至5.82%和6.26%,綜合不確定性減少34.96%;當(dāng)樣本數(shù)量大于71以后,模型不確定變化逐漸減小。分析得出一元地上生物量模型由單一變量構(gòu)建,沒有考慮到樹高對于生物量估測的影響,因此一元地上生物量模型參數(shù)誤差引起的不確定性顯著高于二元地上生物量模型。
上述結(jié)果表明隨著樣本量的增加,模型的殘差變異不確定性逐漸減?。煌瑫r,隨著分組樣本數(shù)的增加,無論一元地上生物量模型和二元地上生物量模型,其模型的殘差變異不確定性也逐漸減小,雖呈現(xiàn)出一定的規(guī)律,但差異并不是很明顯,當(dāng)分組樣本數(shù)分別為5株一組、8株一組、10株一組,一元地上生物量模型殘差變異不確定性分別為6.20%、4.85%、4.10%,二元地上生物量模型殘差變異不確定性分別為6.18%、4.81%、4.09%。分析得出,樣本數(shù)量較少時,分組的數(shù)量對于模型殘差變異不確定性有所影響,但影響較小,在計(jì)算模型殘差變異不確定性進(jìn)行分組時應(yīng)考慮樣本總量。
本研究基于113株香格里拉高山松單木地上生物量實(shí)測數(shù)據(jù)建立一元、二元地上生物量模型,并通過六步法計(jì)算模型殘差變異不確定性,泰勒級數(shù)展開式對模型參數(shù)不確定性進(jìn)行計(jì)算,進(jìn)行模型的參數(shù)及殘差變異的不確定性量化。通過分析得出以下結(jié)論:
1)二元地上生物量模型的殘差變異不確定性、參數(shù)不確定性及綜合不確定性均優(yōu)于一元模型,且模型參數(shù)引起的不確定性大于模型殘差變異不確定性,隨著樣本量的增加,模型的參數(shù)不確定性及殘差變異不確定性逐漸減小,當(dāng)樣本數(shù)為113時,生物量模型的不確定性最小。
2)隨著分組樣本數(shù)的增加,無論一元地上生物量模型和二元地上生物量模型,其模型的殘差變異不確定性也逐漸減小。
3)模型殘差變異不確定性和參數(shù)不確定性是單木地上生物量模型構(gòu)建中不確定性的主要來源,增加模型參量能有效降低單木地上生物量模型中參數(shù)引起的不確定性。
本研究所使用的單木建模數(shù)據(jù)來源于香格里拉2個高山松天然林樣地,單木胸徑范圍為5.6~58.9 cm,胸徑均值為23.3 cm,標(biāo)準(zhǔn)差為13.03 cm,單木胸徑在每個徑階分布不均。在計(jì)算一元、二元模型殘差變異不確定時,當(dāng)單株預(yù)測生物量介于500~1 500 kg時,殘差的標(biāo)準(zhǔn)差值產(chǎn)生較大波動,對殘差變異不確定性計(jì)算產(chǎn)生較大影響。本研究結(jié)果中的參數(shù)誤差引起的不確定性高于傅煜等[16,22]、Chen等[23]的研究,其原因主要為傅煜等使用了150株杉木作為建模樣本,并在模型分析法中引入了Monte Carlo法對模型進(jìn)行了1 000次模擬,其有效降低了參數(shù)協(xié)方差矩陣的變異性,對參數(shù)殘差引起的不確定性度量更為準(zhǔn)確;Chen等[23]采用了4 004株樣木進(jìn)行建模,遠(yuǎn)高于本研究,說明當(dāng)樣本量足夠大時,參數(shù)誤差引起的不確定性趨近于零;其次,本研究基于113株高山松為樣本對高山松地上生物量估算不確定性分析,并在此基礎(chǔ)選取了總樣本量的1/3、2/3進(jìn)行對比分析,可看出當(dāng)建模樣本量從38增加至71時,模型的綜合不確定性變化顯著,而當(dāng)建模樣本數(shù)量大于71以后,模型的綜合不確定變化趨于平緩。說明樣本量的增加能顯著降低模型殘差變異不確定性,參數(shù)不確定性以及模型綜合不確定性,該結(jié)果與秦立厚等[9,21]的研究結(jié)果一致,但建模最優(yōu)樣本量還待今后進(jìn)一步分析。
模型誤差來源分為四個方面,其中變量本身的誤差和所選擇模型的誤差已有較多研究。趙平安等[13]基于臨安市森林資源清查樣地?cái)?shù)據(jù)和臨時樣地調(diào)查數(shù)據(jù)得出對于地上碳儲估算,誤差占比最大的為抽樣誤差和遙感影像坐標(biāo)校正定位誤差。曾偉生等[24]的研究基于150株落葉松和馬尾松的立木生物量實(shí)測數(shù)據(jù),對地下生物量模型的一元、二元回歸模型方案進(jìn)行對比分析,得到馬尾松地下生物量模型估測精度可達(dá)90%以上,落葉松可達(dá)85%以上。本研究僅對殘差變異性和參數(shù)估計(jì)產(chǎn)生的誤差進(jìn)行了計(jì)算,未對另外兩方面進(jìn)行分析,今后還需進(jìn)一步研究。