趙夢草 顧海燕
(東北林業(yè)大學(xué),哈爾濱,150040)
與分位數(shù)有關(guān)的回歸方法已經(jīng)有很長的統(tǒng)計學(xué)歷史,最早由Roger et al.[1]于1978年提出。分位數(shù)回歸能夠描述除中心位置外任意發(fā)散點處變量的變化趨勢,較經(jīng)典的最小二乘回歸具有獨特的優(yōu)勢。目前,分位數(shù)回歸在國內(nèi)外林業(yè)界得到了廣泛的應(yīng)用:高慧淋等[2]利用Reineke方程和線性分位數(shù)回歸技術(shù),建立了不同分位點的長白山落葉松人工林最大林分密度與林木平均胸徑的關(guān)系模型;Ramazan et al.[3]依據(jù)h-d模型評價了固定、校準(zhǔn)固定和校準(zhǔn)混合效應(yīng)模型、三分位數(shù)和五分位數(shù)回歸5種替代建模方法。Paula et al.[4]開發(fā)了桉樹人工林的h-d方程,研究了Harrison方程和配有迭代重加權(quán)最小二乘法。Som et al.[5]將分位數(shù)回歸系統(tǒng)運用到對樹木直徑增長函數(shù)的研究中,比較了混合效應(yīng)模型、九分位數(shù)、五分位數(shù)、三分位數(shù)四種回歸方法。本文利用分位數(shù)回歸,研究影響樹高的因素并對其影響程度的大小進行分析,為混合林的經(jīng)營策略提供參考。
研究地區(qū)位于黑龍江省大興安嶺地區(qū)新林區(qū)北部翠崗地區(qū),海拔1 000~1 400 m,地理坐標(biāo)北緯43°~53°30′,東經(jīng)117°20′~126°。大興安嶺為寒溫帶大陸性季風(fēng)氣候,被稱為中國的“寒極”,南北氣候差異明顯,由北向南年均溫為-5.7~4.0 ℃,年降水量北部為400~500 mm、南部及部分西坡小于400 mm。森林覆蓋率達86.6%,木材蓄積量占全省26.6%,占全國7.8%;樹種以興安落葉松和樟子松為主。
分位數(shù)回歸是回歸分析的方法之一。分位數(shù)是指將一個隨機變量的概率分布范圍分為幾個等份的數(shù)值點。分位數(shù)回歸是給定回歸變量、估計響應(yīng)變量條件分位數(shù)的一個基本方法,不僅可以度量回歸變量在分布中心的影響,而且還可以度量在分布上尾和下尾的影響,進一步推論因變量的條件概率分布。
線性分位數(shù)回歸的基本公式為:
(1)
式中:xi為第i個回歸變量;X=(1,x1,x2,…,xm)T是m+1維向量;b=(β0(τ),β1(τ),…,βm(τ))T;τ為分位數(shù);系數(shù)回歸常數(shù)和回歸系數(shù)為β0(τ)、β1(τ)、…、βm(τ)。
選擇翠崗地區(qū)的4塊落葉松白樺混交林樣地,實測樣地內(nèi)所有林木的樹高、胸徑、活枝高及樹冠東、南、西、北的冠幅,共獲得677組數(shù)據(jù),分析不同τ的胸徑、活枝高及樹冠東、南、西、北冠幅與樹高的關(guān)系。
由圖1、圖2可見:樹冠東、南、西、北的冠幅與樹高的關(guān)系,在不同τ沒有十分明顯的區(qū)別,因此重點采用分位數(shù)回歸研究胸徑、活枝高與樹高的關(guān)系。統(tǒng)計研究的3個變量的基本信息見表1;其中間伐組實行三年一次間隔的弱度間伐。
圖中縱坐標(biāo)表示不同分位數(shù)回歸系數(shù)的參數(shù)估計值圖中陰影部分表示的95%的置信域。
圖中縱坐標(biāo)表示不同分位數(shù)回歸系數(shù)的參數(shù)估計值圖中陰影部分表示的95%的置信域。
表1 樹木特征因子統(tǒng)計
由表2可見:胸徑、活枝高與樹高都有較強線性關(guān)系,因此用線性模型分析比較合適。
由于樹高與胸徑呈現(xiàn)線性趨勢,因此采用一元線性分位數(shù)回歸模型,利用公式QY(τ|x)=β0(τ)+xβ1(τ),τ∈(0,1),x為胸徑,所得參數(shù)估計值見表3。
表2 胸徑、活枝高與樹高的相關(guān)系數(shù)
表3 樹高與胸徑關(guān)系的分位數(shù)回歸參數(shù)估計值
由表3可見:落葉松對照組,在τ=0.10,樹高增加最多,胸徑每增加1 cm,樹高增加約67.3 cm;在τ=0.90,樹高增加最少,胸徑每增加1 cm,樹高增加約50.7 cm;由最小二乘法得到,胸徑每增加1 cm,樹高平均增加約64.2 cm。落葉松間伐組,在τ=0.50,樹高增加最多,胸徑每增加1 cm,樹高增加約56.8 cm;在τ=0.90,樹高增加最少,胸徑每增加1 cm,樹高增加約45.6 cm;由最小二乘法得到,胸徑每增加1 cm,樹高平均增加約50.4 cm。
由表3可見:白樺對照組,在τ=0.90,樹高增加最多,胸徑每增加1 cm,樹高增加約89.6 cm;在τ=0.10,樹高增加最少,胸徑每增加1 cm,樹高增加約51.0 cm;由最小二乘法得到胸徑每增加1 cm,樹高平均增加約64.6 cm。白樺間伐組,在τ=0.75,樹高增加最多,胸徑每增加1 cm,樹高增加約70.5 cm;在τ=0.25,樹高增加最少,胸徑每增加1 cm,樹高增加約51.4 cm;由最小二乘法得到,胸徑每增加1 cm,樹高平均增加約61.8 cm。
圖3表示樹高與胸徑關(guān)系的分位數(shù)回歸直線,直線的斜率代表不同分位數(shù)下樹高隨胸徑變化的平均變化率。發(fā)現(xiàn)不同分位數(shù)的樹高隨胸徑的變化是不同的,因此利用分位數(shù)回歸能更全面地看出樹高與胸徑的關(guān)系。
Ⅰ~Ⅴ分別是τ為0.10、0.25、0.50、0.75、0.90的分位數(shù)回歸直線,虛線為最小二乘回歸直線。
由于樹高與活枝高呈現(xiàn)線性趨勢,因此也采用一元線性分位數(shù)回歸模型,利用公式QY(τ|x)=β0(τ)+xβ1(τ),τ∈(0,1),x為活枝高,所得參數(shù)估計值見表4。
表4 樹高與活枝高關(guān)系的分位數(shù)回歸參數(shù)估計值
由表4可見:落葉松對照組,在τ=0.75,樹高增加最多,活枝高每增加1 m,樹高增加約1.8 m;在τ=0.10,樹高增加最少,活枝高每增加1 m,樹高增加約1.4 m;由最小二乘法得到,活枝高每增加1 m,樹高平均增加約1.5 m。落葉松間伐組,在τ=0.50,樹高增加最多,活枝高每增加1 m,樹高增加約1.3 m;在τ=0.10,樹高增加最少,活枝高每增加1 m,樹高增加約1.0 m;由最小二乘法得到,活枝高每增加1 m,樹高平均增加約1.1 m。
由表4可見:白樺對照組,在τ=0.90,樹高增加最多,活枝高每增加1 m,樹高增加約1.7 m;在τ=0.10,樹高增加最少,活枝高每增加1 m,樹高增加約1.3 m;由最小二乘法得到,活枝高每增加1 m,樹高平均增加約1.5 m。白樺間伐組,在τ=0.50,樹高增加最多,活枝高每增加1 m,樹高增加約1.4 m;在τ=0.25,樹高增加最少,活枝高每增加1 m,樹高增加約1.3 m;由最小二乘法得到,活枝高每增加1 m,樹高平均增加約1.4 m。
圖4表示樹高與活枝高關(guān)系的分位數(shù)回歸直線,直線的斜率代表不同分位數(shù)下樹高隨活枝高變化的平均變化率。發(fā)現(xiàn)不同分位數(shù)的樹高隨活枝高的變化是不同的,因此利用分位數(shù)回歸能更全面地看出樹高與活枝高的關(guān)系。
Ⅰ~Ⅴ分別是τ為0.10、0.25、0.50、0.75、0.90的分位數(shù)回歸直線,虛線為最小二乘回歸直線。
利用二元線性分位數(shù)回歸模型進行回歸,QY(τ|x)=β0(τ)+x1β1(τ)+x2β2(τ),τ∈(0,1)、x1為胸徑、x2為活枝高,所得參數(shù)估計值見表5。由表5可見,同一樣本數(shù)據(jù),不同τ得到的參數(shù)估計值不同,分位數(shù)回歸比最小二乘法能夠更多的反映數(shù)據(jù)的局部信息。
表5 落葉松樹高分位數(shù)回歸參數(shù)估計值
圖5為不同τ時落葉松樹高隨胸徑、活枝高變化趨勢,τ∈(0,1),間距為0.05,共有19個點。由圖5可見:樹高隨胸徑的線性增加變化,對照組總體呈上升趨勢,間伐組變化較為平緩;樹高隨活枝高的線性增加變化,對照組總體較為平緩,間伐組變化呈上升趨勢;在τ=0.95處,對照組和間伐組樹高隨胸徑和活枝高的線性增加變化都較小。圖5中兩圖的虛線表示由最小二乘法得到的參數(shù)估計,對照組,胸徑每增加1 cm,樹高約增加47.3 cm;活枝高每增加1 m,樹高約增加69 cm。間伐組,胸徑每增加1 cm,樹高約增加33.1 cm;活枝高每增加1 m,樹高約增加64 cm。
表6為白樺樹高線性分位數(shù)模型在不同τ時得到的參數(shù)估計值。
τ∈(0,1),間距為0.05,共有19個點;虛線表示由最小二乘法得到的參數(shù)估計。
表6 白樺樹高分位數(shù)回歸參數(shù)估計值
由圖6可見:樹高隨胸徑的線性增加變化,對照組和間伐組均呈上升趨勢;樹高隨活枝高的線性增加變化,對照組和間伐組變化均呈下降趨勢。圖6中兩圖的虛線表示由最小二乘法得到的參數(shù)估計,對照組,胸徑每增加1 cm,樹高約增加33.5 cm;活枝高每增加1 m,樹高約增加0.99 m;間伐組,胸徑每增加1 cm,樹高約增加37.1 cm;活枝高每增加1 m,樹高約增加0.91 m。
本文利用分位數(shù)回歸研究了樹高、胸徑和活枝高的相關(guān)關(guān)系。在一元線性分位數(shù)回歸模型中,落葉松胸徑對樹高的影響在低尾處較明顯,而白樺胸徑對樹高的影響在高尾處較明顯,兩樹種對照組胸徑每增加1cm,樹高增加的高度都明顯高于間伐組;落葉松和白樺活枝高對樹高的影響均在中高尾處較明顯,兩樹種對照組活枝高每增加1m,樹高增加的高度都明顯高于間伐組。在二元線性分位數(shù)回歸模型中,落葉松和白樺胸徑對樹高的影響均在高尾處較明顯,而落葉松和白樺活枝高對樹高的影響均在低尾處較明顯,兩樹種對照組胸徑對樹高的影響以及活枝高對樹高的影響均明顯強于間伐組。在樹高、胸徑和活枝高的相關(guān)關(guān)系中,單個因素的影響規(guī)律與多個因素相比具有一定的差異,追求更加精準(zhǔn)的分析應(yīng)適當(dāng)選取影響程度大的一些影響因素綜合進行分析。
τ∈(0,1),間距為0.05,共有19個點;虛線表示由最小二乘法得到的參數(shù)估計。
可以選取適當(dāng)?shù)姆蔷€性方程研究樹高與其他樹木生長變量的關(guān)系,以獲得更全面的解釋和更多的有關(guān)樹木生長的信息,并且可以把此方法應(yīng)用到其他地區(qū)或其他樹種的樹高的研究上,以便對人工混交林的種植起到指導(dǎo)作用。