郭澎濤,朱阿興,李茂芬,羅 微,楊紅竹,茶正早※
(1.中國(guó)熱帶農(nóng)業(yè)科學(xué)院橡膠研究所,???571101; 2. 農(nóng)業(yè)農(nóng)村部橡膠樹生物學(xué)與遺傳資源利用重點(diǎn)實(shí)驗(yàn)室,???71101; 3. 海南省熱帶作物栽培生理學(xué)重點(diǎn)實(shí)驗(yàn)室-省部共建國(guó)家重點(diǎn)實(shí)驗(yàn)室培育基地,???571101; 4. 中國(guó)熱帶農(nóng)業(yè)科學(xué)院土壤肥料研究中心,???571101; 5. 南京師范大學(xué)地理科學(xué)學(xué)院,南京 210023; 6. 江蘇省地理信息資源開發(fā)與利用協(xié)同創(chuàng)新中心,南京 210023; 7. 中國(guó)科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100101; 8. Department of Geography, University of Wisconsin-Madison,Madison WI 53706; 9. 中國(guó)熱帶農(nóng)業(yè)科學(xué)院科技信息研究所,???571101; 10. 海南省熱帶作物信息技術(shù)應(yīng)用研究重點(diǎn)實(shí)驗(yàn)室,海口 571101)
天然橡膠是重要的戰(zhàn)略物資和工業(yè)原料,其主要來源于橡膠樹。磷在橡膠樹合成天然橡膠過程中發(fā)揮著關(guān)鍵作用,影響天然橡膠的產(chǎn)量和質(zhì)量。葉片磷含量可以指示橡膠樹磷營(yíng)養(yǎng)狀況,因此,獲取準(zhǔn)確可靠的葉片磷含量是指導(dǎo)管理者合理施用磷肥保障橡膠樹健康生長(zhǎng)和保持天然橡膠穩(wěn)產(chǎn)、高產(chǎn)的前提。高光譜技術(shù)具有快速、準(zhǔn)確估測(cè)植物葉片磷含量的潛力。但目前的相關(guān)研究主要集中于較小區(qū)域,所構(gòu)建的高光譜估測(cè)模型應(yīng)用范圍有限。為增強(qiáng)模型的外推性,一些學(xué)者在區(qū)域甚至全球尺度上開展植物葉片磷含量高光譜估測(cè)研究。但這些研究所構(gòu)建的高光譜估測(cè)模型預(yù)測(cè)精度并不高,原因是其采集的葉片樣本來源于環(huán)境異質(zhì)性較強(qiáng)的區(qū)域(氣候、成土母質(zhì)、土壤類型和地形地貌差異明顯),受到這些差異很大的環(huán)境因素的影響,葉片光譜特征和磷含量發(fā)生較大變異,進(jìn)而導(dǎo)致葉片磷含量與光譜之間關(guān)系在區(qū)域上產(chǎn)生不穩(wěn)定性。而這正好與傳統(tǒng)全局建模方法所要求的葉片養(yǎng)分含量與光譜之間關(guān)系在區(qū)域上應(yīng)當(dāng)是穩(wěn)定的假設(shè)產(chǎn)生矛盾。為克服這一矛盾,一些學(xué)者提出了局部建模方法,該方法假設(shè)在變異性較強(qiáng)的大樣本集中存在一些局部樣本,它們的屬性與光譜與之間的關(guān)系在空間上是穩(wěn)定的。若待估測(cè)樣本與這些局部樣本存在相似的目標(biāo)屬性-光譜關(guān)系,就可以利用這些局部樣本構(gòu)建高光譜估測(cè)模型對(duì)待估測(cè)樣本進(jìn)行預(yù)測(cè)。因此,如何選擇與待估測(cè)樣本具有相近或相似目標(biāo)變量-光譜關(guān)系的局部樣本就成為利用局部建模方法構(gòu)建高光譜估測(cè)模型的關(guān)鍵。
目前,主要有兩類方法用于尋找與待估測(cè)樣本具有相近或相似目標(biāo)變量-光譜關(guān)系的局部樣本。第一類方法為基于樣本之間光譜相關(guān)性的局部樣本搜索方法(Local Sample Searching based on Spectral Correlation,LSS-SC)。該類方法認(rèn)為被選擇的樣本與待估測(cè)樣本之間的光譜相關(guān)系數(shù)越大,那么它與待估測(cè)樣本具有相近或相似目標(biāo)變量-光譜關(guān)系的可能性就越大。具體選擇過程為先計(jì)算待估測(cè)樣本與光譜數(shù)據(jù)庫(kù)中訓(xùn)練樣本之間的光譜相關(guān)系數(shù),然后設(shè)定閾值并選取相關(guān)系數(shù)高于閾值的訓(xùn)練樣本作為局部樣本。例如,Shenk等計(jì)算每個(gè)待估測(cè)玉米粒樣本與光譜數(shù)據(jù)庫(kù)中403個(gè)玉米粒訓(xùn)練樣本之間的光譜相關(guān)系數(shù),并選擇大于閾值的訓(xùn)練樣本用于構(gòu)建每一個(gè)待估測(cè)玉米粒樣本的干物質(zhì)、粗蛋白和酸性纖維含量高光譜估測(cè)模型,這些模型的預(yù)測(cè)精度比傳統(tǒng)全局模型提高了6%~13%。該類方法雖然克服了傳統(tǒng)全局建模方法存在的缺陷,但容易將與待估測(cè)樣本具有相似光譜特征但來源于其他環(huán)境條件下的樣品選中,造成樣本誤選。
第二類方法是基于樣本之間光譜距離的局部樣本搜索方法(Local Sample Searching based on Spectral Distance,LSS-SD)。該類方法認(rèn)為被選擇的樣本與待估測(cè)樣本之間的光譜距離越小,那么它與待估測(cè)樣本具有相近或相似目標(biāo)變量-光譜關(guān)系的可能性就越大。具體選擇過程為先計(jì)算待估測(cè)樣本與光譜數(shù)據(jù)庫(kù)中訓(xùn)練樣本之間的光譜距離,然后設(shè)定距離閾值并選擇光譜距離低于閾值的訓(xùn)練樣本作為局部樣本。例如,Ma等計(jì)算待估算土壤樣點(diǎn)與大光譜數(shù)據(jù)庫(kù)中土壤訓(xùn)練樣本之間的光譜距離(歐式距離),然后選取光譜距離小于閾值的訓(xùn)練樣本作為局部樣本構(gòu)建每一個(gè)待估測(cè)樣本的土壤有機(jī)質(zhì)含量高光譜預(yù)測(cè)模型,模型預(yù)測(cè)精度相比傳統(tǒng)全局模型有顯著提高。該類方法也可用于植物葉片磷含量估測(cè)。該方法與LSS-SC相比,雖然在計(jì)算光譜相似性時(shí)采用了不同指標(biāo)(光譜距離),但其本質(zhì)卻沒有改變,同樣僅依賴樣本光譜信息,使得該方法依然會(huì)從其他環(huán)境條件下誤選樣本。
從上面的分析可以看出,現(xiàn)有的局部樣本搜索方法(LSS-SC和LSS-SD)都是以樣本之間的光譜相似性為標(biāo)準(zhǔn)來選擇局部樣本的,只是使用的相似性指標(biāo)不同。因此,可以將它們稱之為基于光譜相似性的局部樣本搜索方法。這類方法雖然可以從大樣本數(shù)據(jù)庫(kù)中搜索到與待估測(cè)樣本具有相似光譜特征的局部樣本,但由于這類方法都是從全部樣本中進(jìn)行局部樣本搜索,因此,不可避免地會(huì)從其他環(huán)境條件下搜索到一些局部樣本,而這些樣本與待估測(cè)樣本是不具有相似或相近的目標(biāo)變量-光譜關(guān)系的。利用這些來源于其他環(huán)境條件下的局部樣本構(gòu)建待估測(cè)樣本的高光譜估測(cè)模型,毫無疑問會(huì)降低模型的預(yù)測(cè)性能。因此,在利用基于光譜相似性的局部樣本搜索方法時(shí)如何避免搜索到其他環(huán)境條件下的局部樣本是需要解決的關(guān)鍵問題。
本研究提出一種先利用環(huán)境因子對(duì)葉片樣本進(jìn)行類別劃分,然后在相同樣本類別內(nèi)部再利用光譜相似性進(jìn)行局部樣本搜索的方法,以解決現(xiàn)有局部樣本搜索方法存在的樣本誤選問題。本文的方法部分將對(duì)該方法進(jìn)行詳細(xì)陳述,然后在案例研究部分將該方法應(yīng)用到海南島北部植膠區(qū),以驗(yàn)證該方法在區(qū)域尺度上構(gòu)建橡膠樹葉片磷含量高光譜估測(cè)模型的有效性,并將其預(yù)測(cè)結(jié)果分別與利用LSS-SC和LSS-SD搜尋到的局部樣本構(gòu)建的估測(cè)模型進(jìn)行比較。
地理學(xué)第三定律指出,地理環(huán)境越相似,地理特征(或地理過程)越相近。基于該定律,本研究假設(shè)相似環(huán)境條件下的橡膠樹葉片樣本具有相近或相似的磷-光譜關(guān)系,且葉片光譜特征越相似,樣本之間的磷-光譜關(guān)系就越相近?;谶@一思想,本研究提出一種基于環(huán)境與光譜相似性相結(jié)合的局部樣本搜索方法(Local Sample Searching based on Environmental Similarity and Spectral Similarity,LSS-ESSS)構(gòu)建橡膠樹葉片磷含量高光譜估測(cè)模型。該方法主要包含以下3個(gè)關(guān)鍵步驟:1)利用影響橡膠樹葉片磷含量的主要環(huán)境因子對(duì)樣本進(jìn)行類別劃分;2)在同一樣本類別內(nèi)利用光譜相似性進(jìn)行局部樣本搜索;3)利用局部樣本構(gòu)建待估測(cè)樣本的高光譜估測(cè)模型。
橡膠樹葉片樣本類別劃分包含2個(gè)步驟:1)篩選影響橡膠樹葉片磷含量的主要環(huán)境因子,2)利用環(huán)境因子對(duì)葉片樣本進(jìn)行類別劃分。
1.2.1 篩選影響葉片磷含量的主要環(huán)境因子
影響橡膠樹葉片磷含量的環(huán)境因子有類別型變量(如成土母質(zhì))和連續(xù)型變量(如降雨量)。針對(duì)不同類型的環(huán)境因子采用不同的方式進(jìn)行變量篩選。類別型變量利用單因素方差分析比較不同類別之間磷含量的差異,若差異達(dá)到顯著性水平(<0.05),則認(rèn)為類別型變量對(duì)橡膠樹葉片磷含量具有顯著影響,可被選為影響因子。連續(xù)型變量先利用相關(guān)性分析選擇與葉片磷含量顯著相關(guān)(<0.05)的變量,然后再利用這些變量擬合與橡膠樹葉片磷含量之間的線性回歸方程,并依據(jù)方差膨脹因子(Variance Inflation Factor,VIF)進(jìn)行變量共線性診斷。當(dāng)VIF值大于10時(shí)變量之間即存在共線性,需將該變量剔除,并將剩余的變量作為影響橡膠樹葉片磷含量的主要環(huán)境因子。
1.2.2 利用環(huán)境因子對(duì)樣本進(jìn)行類別劃分
依據(jù)所利用的變量類型(類別型或連續(xù)型),相應(yīng)采用不同的樣本類別劃分方法。若利用的是類別型變量,可直接以不同類別作為劃分葉片樣本的單元,將位于同一類別內(nèi)部的葉片樣本劃分為一類。若利用的是連續(xù)性變量,則采用K均值聚類法對(duì)橡膠樹葉片樣本進(jìn)行類別劃分。K均值聚類算法在數(shù)據(jù)分析軟件Matlab 2016a中通過kmeans函數(shù)實(shí)現(xiàn)。
由于K均值聚類算法不能給出最優(yōu)的聚類數(shù),因此,本研究采用“手肘法”確定最優(yōu)聚類數(shù)?!笆种夥ā钡暮x為所有類別內(nèi)每個(gè)樣本與各自質(zhì)心距離(誤差)的平方和(Sum of Square Error,SSE)會(huì)隨著聚類數(shù)的增加而減小,SSE和聚類數(shù)之間的關(guān)系呈現(xiàn)手肘狀,而這個(gè)肘部對(duì)應(yīng)的聚類數(shù)就是樣本的最優(yōu)聚類數(shù)。SSE的計(jì)算公式為
式中是聚類數(shù);S代表第個(gè)類別;C為S的質(zhì)心;是屬于類別S的樣本。
局部樣本搜索需要2個(gè)步驟完成:1)確定待估測(cè)樣本所屬類別;2)在相同類別內(nèi)搜索與待估測(cè)樣本具有相似光譜特征的局部樣本。
1.3.1 確定待估測(cè)樣本所屬類別
為實(shí)現(xiàn)在相同類別內(nèi)部進(jìn)行局部樣本搜索,需先將待估測(cè)樣本分配到相應(yīng)的樣本類別中。若劃分類別時(shí)利用的是類別型變量,則可依據(jù)待估測(cè)樣本所處的地理位置將其直接劃分到相應(yīng)類別中。若劃分類別時(shí)利用的是連續(xù)型變量,還需要建立待估測(cè)樣本的類別判別模型。這里以訓(xùn)練集的環(huán)境變量聚類結(jié)果為基礎(chǔ),結(jié)合Matlab 2016a軟件中的classify函數(shù)建立待估測(cè)樣本的類別判別模型,并應(yīng)用該判別模型將待估測(cè)樣本劃分到與其具有相似環(huán)境條件的樣本類別中。
1.3.2 相同樣本類別內(nèi)部局部樣本的搜索
在同一樣本類別內(nèi)利用基于光譜相似性的局部樣本搜索方法進(jìn)行局部樣本搜索,即利用LSS-SC或LSS-SD進(jìn)行局部樣本搜索,這兩種方法的具體步驟可分別參考Shenk等。
以搜索到的局部樣本為建模集,利用偏最小二乘回歸(Partial Least Squares Regression,PLSR)以全波譜信息(350~2 500 nm)為輸入變量構(gòu)建待估測(cè)樣本的高光譜估測(cè)模型。PLSR模型中最優(yōu)潛變量個(gè)數(shù)通過交叉驗(yàn)證確定,PLSR模型的建立通過R軟件中的pls軟件包實(shí)現(xiàn)。
為驗(yàn)證本研究提出的LSS-ESSS在構(gòu)建橡膠樹葉片磷含量高光譜估測(cè)模型方面的有效性,將該方法應(yīng)用于海南島北部主要植膠區(qū)。在該區(qū)域內(nèi)選擇了9個(gè)樣地(圖1)用于橡膠樹葉片樣品采集。這9個(gè)樣地的海拔、年平均氣溫和年平均降雨量的變化范圍分別為64~226 m、23.7~24.1 ℃和925~1 773 mm。該區(qū)域的土壤類型雖然都為濕潤(rùn)鐵鋁土,但發(fā)育的成土母質(zhì)卻不相同,分別為花崗巖、玄武巖、變質(zhì)巖和砂頁(yè)巖,因此,土壤的性質(zhì)差異很明顯。
圖1 研究區(qū)地理位置及采樣點(diǎn)分布Fig.1 Geographical location of study area and distribution of sampling sites
2.2.1 葉片樣品
橡膠樹葉片磷含量在年內(nèi)呈現(xiàn)明顯的季節(jié)變化,4-6月長(zhǎng)新葉(抽葉期),葉片磷含量最高;7-9月葉片生長(zhǎng)穩(wěn)定(成熟期),葉片磷含量處于全年中等水平;10-12月葉片衰老(衰老期),葉片磷素逐漸轉(zhuǎn)移到樹干和其他組織部位,導(dǎo)致這一時(shí)期的葉片磷含量最低。對(duì)應(yīng)于橡膠樹葉片生長(zhǎng)發(fā)育的3個(gè)時(shí)期,每個(gè)時(shí)期采集葉片樣本1次,每次都在同一地塊進(jìn)行。葉片樣品采集時(shí),將每塊樣地劃分為20個(gè)區(qū)塊,每個(gè)區(qū)塊內(nèi)隨機(jī)選取5株橡膠樹采集葉片,每株橡膠樹每次采集樹冠下層主側(cè)枝上的沒有病斑的頂蓬葉2片。因此,每個(gè)區(qū)塊共采集10片葉子,將這10片葉子作為一個(gè)混合樣放入一個(gè)單獨(dú)的塑料袋,塑料袋外面記錄樣品編號(hào)、區(qū)塊地理坐標(biāo)、種植年限等信息。然后,再把裝有混合樣的塑料袋放入裝有冰塊的泡沫箱中。9個(gè)樣地3次共采集540個(gè)葉片混合樣。
每次樣品采集完畢后迅速送回室內(nèi)進(jìn)行光譜測(cè)定。光譜測(cè)定在暗室內(nèi)進(jìn)行,應(yīng)用的光譜儀為ASD公司的FieldSpec 3可見-近紅外光譜儀,波譜范圍為350~2 500 nm。在350~1 000 nm范圍內(nèi),采樣間隔和光譜分辨率分別為1.4和3 nm;而在1 000~2 500 nm范圍內(nèi),采樣間隔和光譜分辨率分別為2和10 nm。葉片樣品光譜采集時(shí)需要先將植被探頭通過光纖連接到主機(jī)上,植被探頭有一內(nèi)置鹵素?zé)簦?.825 V,4.05 W),為光譜測(cè)定提供光源。每次測(cè)量葉片光譜之前,需要利用葉片夾底部的白板對(duì)反射率光譜進(jìn)行校正,然后將葉片放入葉片夾中進(jìn)行光譜測(cè)定。葉片中部主脈左右兩側(cè)區(qū)域?yàn)闇y(cè)定部位,每個(gè)部位測(cè)定3次,每個(gè)葉片測(cè)定6次光譜,一個(gè)混合樣共采集60次光譜,將這60次光譜進(jìn)行平均得到混合樣品的光譜反射率。
葉片光譜測(cè)定完畢后,需要對(duì)光譜反射率進(jìn)行去噪處理。本研究利用Matlab 2016a軟件中的butter函數(shù)和filtfilt函數(shù)進(jìn)行,這2個(gè)函數(shù)的計(jì)算公式如下:
式中為濾波器的階數(shù);W為濾波器的截止頻率;low代表低通濾波器;和是butter函數(shù)返回的濾波系數(shù);spectrum和spectrum分別代表原始光譜和去噪后的光譜。這里構(gòu)造一個(gè)二階濾波器,即取值2。而W的取值(0<W<1)需要通過試錯(cuò)法確定,W的值越接近0,濾波后的光譜越平滑,反之越接近1,濾波后的光譜越接近原始光譜。本研究嘗試了不同的W值(0.9、0.7、0.5、0.3和0.1),發(fā)現(xiàn)W為0.9、0.7和0.5時(shí)平滑后的光譜依然保留了較多噪音,而W取值0.1時(shí),光譜被過度平滑,一些特征峰消失。W為0.3時(shí)葉片光譜的特征峰均能較好體現(xiàn),同時(shí)峰形光滑,說明去噪效果好,因此在這里W取值0.3,濾波后的光譜見圖2。構(gòu)建橡膠樹葉片磷含量高光譜估測(cè)模型時(shí),以全波譜(350~2 500 nm)作為模型輸入變量。
圖2 不同時(shí)期橡膠樹葉片光譜Fig.2 Rubber tree leaf spectrum for different periods
葉片光譜測(cè)定完成后,將橡膠樹葉片樣品放入105 ℃烘箱中殺青30 min,然后降溫至70 ℃恒溫烘干至恒量,再用研缽磨成粉末過1 mm篩。之后經(jīng)濃HSO和30%的HO消煮,用鉬銻抗比色法測(cè)定?;?yàn)分析獲取的橡膠樹葉片磷含量統(tǒng)計(jì)結(jié)果見圖3。
圖3 不同時(shí)期采集的橡膠樹葉片樣品磷含量統(tǒng)計(jì)結(jié)果Fig.3 Statistical results of rubber tree leaf phosphorus concentration for different periods
2.2.2 環(huán)境變量數(shù)據(jù)
有研究表明成土母質(zhì)和海拔可以顯著影響熱帶森林冠層葉片磷含量。本研究區(qū)域中有5種成土母質(zhì),分別為玄武巖、花崗巖、變質(zhì)巖、淺海沉積物和砂頁(yè)巖,這些成土母質(zhì)上發(fā)育的土壤肥力差異明顯??梢灶A(yù)期成土母質(zhì)可以對(duì)橡膠樹葉片磷含量產(chǎn)生顯著影響。方差分析(圖4)證實(shí)了這一預(yù)想。因此,選擇成土母質(zhì)為影響橡膠樹葉片磷含量的主要環(huán)境因子。
海拔對(duì)森林葉片磷含量的影響主要是通過對(duì)氣溫的影響實(shí)現(xiàn)的,即海拔越高氣溫越低。而在本研究中海拔變化不明顯(64~226 m),氣溫的差異也非常微?。?3.7~24.1 ℃)??梢灶A(yù)見在本研究區(qū)域中海拔對(duì)橡膠樹葉片磷含量的影響應(yīng)該是不顯著的,因此海拔未被選擇為影響橡膠樹葉片磷含量的主要環(huán)境因子。
為驗(yàn)證本研究提出的LSS-ESSS的有效性,利用其分別構(gòu)建每個(gè)時(shí)期橡膠樹葉片磷含量高光譜估測(cè)模型。模型構(gòu)建時(shí),先將每個(gè)時(shí)期采集的葉片樣品隨機(jī)分割5次,每分割1次就得到1組訓(xùn)練集和驗(yàn)證集,分割5次即得到5組訓(xùn)練集和驗(yàn)證集。樣本隨機(jī)分割時(shí),以每個(gè)成土母質(zhì)為單元以確保每個(gè)成土母質(zhì)中都有訓(xùn)練樣本和驗(yàn)證樣本。依據(jù)每個(gè)成土母質(zhì)中葉片樣品數(shù)目按比例確定驗(yàn)證集中的樣本數(shù)。其中,玄武巖有60個(gè)葉片樣品,從中選取8個(gè)樣品作為驗(yàn)證樣本;花崗巖和變質(zhì)巖都有40個(gè)樣品,從各自當(dāng)中選擇4個(gè)樣品作為驗(yàn)證樣本;淺海沉積物和砂頁(yè)巖都有20個(gè)葉片樣品,分別從中選取2個(gè)樣品作為驗(yàn)證樣本。這樣每個(gè)時(shí)期的每個(gè)驗(yàn)證集有20個(gè)樣本,每個(gè)訓(xùn)練集有160個(gè)樣本。將LSS-SD和LSS-SC也應(yīng)用于這些樣本中構(gòu)建橡膠樹葉片磷含量高光譜估測(cè)模型,并將模型預(yù)測(cè)精度與本研究提出的LSS-ESSS進(jìn)行比較。
圖4 不同成土母質(zhì)橡膠樹葉片磷含量比較Fig.4 Comparison of rubber tree leaf phosphorus concentration between different parent materials
模型的預(yù)測(cè)精度通過決定系數(shù)(Coefficient of Determination,)、均方根誤差(Root Mean Squared Error,RMSE)和測(cè)定值標(biāo)準(zhǔn)偏差與RMSE的比值(Ratio of Prediction Deviation,RPD)來衡量。其中,越接近1、RMSE越接近0,RPD的值越大,模型的預(yù)測(cè)精度越高。上述指標(biāo)的計(jì)算公式如下所示:
為檢驗(yàn)本研究提出的LSS-ESSS方法與現(xiàn)有的LSS-SC和LSS-SD構(gòu)建的橡膠樹葉片磷含量高光譜估測(cè)模型的預(yù)測(cè)精度是否有顯著差異,利用方差分析對(duì)不同模型之間的RMSE和RPD進(jìn)行比較。
表1列出了利用不同局部樣本搜索方法構(gòu)建的橡膠樹葉片磷含量高光譜估測(cè)模型在抽葉期的預(yù)測(cè)精度??梢钥闯?,利用LSS-ESSS構(gòu)建的模型在第1次、第2次和第3次樣本隨機(jī)分割中的預(yù)測(cè)精度要高于LSS-SC和LSS-SD,但在第4次和第5次低于LSS-SC和LSS-SD。整體上看,抽葉期利用LSS-ESSS構(gòu)建的模型預(yù)測(cè)精度(RMSE=(0.031±0.003)%,RPD=2.027±0.332,=0.697±0.086)要高于LSS-SC(RMSE=(0.034±0.002)%,RPD=1.719±0.158,=0.656±0.053),但差異不顯著(>0.05);同時(shí),抽葉期利用LSS-ESSS構(gòu)建的模型預(yù)測(cè)精度(RMSE=(0.030±0.004)%,RPD=2.102±0.354,=0.712±0.088)也要高于LSS-SD(RMSE=(0.034±0.002)%,RPD=1.702±0.119,=0.680±0.041),但差異同樣不顯著(>0.05)。
表1 抽葉期LSS-ESSS模型與其他模型預(yù)測(cè)精度比較Table 1 Comparison of prediction accuracies between LSS-ESSS and the other models for the period of leaf germination
表2列出了利用不同局部樣本搜索方法構(gòu)建的橡膠樹葉片磷含量高光譜估測(cè)模型在成熟期的預(yù)測(cè)精度??梢钥闯?,利用LSS-ESSS構(gòu)建的模型在5次樣本隨機(jī)分割中的預(yù)測(cè)精度都要高于LSS-SC和LSS-SD,且在整體上比較(LSS-ESSS的RMSE、RPD和分別為(0.030±0.002)%、2.052±0.196和0.751±0.038,LSS-SC的RMSE、RPD和分別為(0.042±0.002)%、1.491±0.112和0.548±0.052;LSS-ESSS的RMSE、RPD和分別為(0.029±0.003)%、2.202±0.264和0.778±0.043,LSS-SD的RMSE、RPD和分別為(0.042±0.003)%、1.496±0.132和0.559±0.063),差異都達(dá)到了<0.05的顯著性水平。
表2 成熟期LSS-ESSS模型與其他模型預(yù)測(cè)精度比較Table 2 Comparison of prediction accuracies between LSS-ESSS and the other models for the period of leaf maturity
表3列出了利用不同局部樣本搜索方法構(gòu)建的橡膠樹葉片磷含量高光譜估測(cè)模型在衰老期的預(yù)測(cè)精度。
表3 衰老期LSS-ESSS模型與其他模型預(yù)測(cè)精度比較Table 3 Comparison of prediction accuracies between LSS-ESSS and the other models for the period of leaf senescence
從表3可以看出,利用LSS-ESSS構(gòu)建的模型在5次樣本隨機(jī)分割中的預(yù)測(cè)精度都要高于LSS-SC和LSS-SD,且在整體上比較(LSS-ESSS的RMSE、RPD和分別為(0.026±0.002)%、1.995±0.086和0.760±0.021,LSS-SC的RMSE、RPD和分別為(0.034±0.003)%、1.536±0.120和0.569±0.075;LSS-ESSS的RMSE、RPD和分別為(0.024±0.003)%、2.229±0.143和0.815±0.021,LSS-SD的RMSE、RPD和分別為(0.035±0.003)%、1.492±0.083和0.538±0.053),差異都達(dá)到了<0.05的顯著性水平。
現(xiàn)有的基于光譜相似性的局部樣本搜索方法(LSS-SC和LSS-SD)是從全部樣本中搜索與待估測(cè)樣本具有相似光譜特征的局部樣本。這樣做的問題是會(huì)把其他環(huán)境條件下的(如不同母質(zhì))樣本選作局部樣本,這是因?yàn)榉植荚诓煌h(huán)境條件下的樣本也可能具有相似的光譜特征。如圖5所示,圖片左邊紅圈表示的區(qū)域中密集甚至是重疊分布著來自淺海沉積物、砂頁(yè)巖、變質(zhì)巖、玄武巖和花崗巖的樣本,它們雖然來自不同的成土母質(zhì),卻具有相似的光譜特征,可稱這些樣本為混合樣本。而來自不同環(huán)境條件下的葉片樣本往往具有不同的葉片磷-光譜關(guān)系,如Asner等在研究亞馬遜低地到安第斯山脈這一廣闊區(qū)域森林葉片光譜變異特征時(shí)發(fā)現(xiàn),海拔最高處森林葉片近紅外光譜反射率最高,而短波紅外反射率最低,此處的氮磷比值最低;但在海拔較低處,森林葉片光譜反射率和氮磷比值變化趨勢(shì)卻與海拔最高處相反。因此,這些混合樣本和真正的純凈樣本混雜在一起肯定會(huì)扭曲葉片磷與光譜之間的關(guān)系,導(dǎo)致模型預(yù)測(cè)性能降低。為避免這種情況的發(fā)生,本研究提出基于環(huán)境與光譜相似性相結(jié)合的局部樣本搜索方法,該方法先利用影響葉片磷含量的主要環(huán)境因子(本研究中為成土母質(zhì))對(duì)葉片樣本進(jìn)行類別劃分,把來源于不同成土母質(zhì)的樣本區(qū)別開來。這時(shí),再?gòu)呐c待估測(cè)樣本具有相同類別的樣本中搜索局部樣本,就可以保證搜索到的局部樣本與待估測(cè)樣本具有相同的類別,避免搜索到來自其他成土母質(zhì)的混合樣本。這樣就可以保證待估測(cè)樣本與局部樣本具有相近的葉片養(yǎng)分-光譜關(guān)系,進(jìn)而可增強(qiáng)高光譜估測(cè)模型的預(yù)測(cè)精度。
圖5 不同時(shí)期采集的葉片樣本光譜變量主成分分析Fig.5 Principal component analysis for spectral variables of leaf samples collected from different periods
LSS-ESSS適用于大尺度或者環(huán)境條件較為復(fù)雜的區(qū)域。在這些區(qū)域,由于環(huán)境因子具有較強(qiáng)的異質(zhì)性,而環(huán)境因子又不可避免地會(huì)影響到目標(biāo)變量和光譜特征的變化,最終會(huì)導(dǎo)致目標(biāo)變量和光譜特征在地理空間上也具有較強(qiáng)的變異性,這種變異性會(huì)引起目標(biāo)變量與光譜之間的關(guān)系在空間上出現(xiàn)不穩(wěn)定性。這種關(guān)系的不穩(wěn)定性與傳統(tǒng)的全局方法關(guān)于目標(biāo)變量與光譜之間關(guān)系在空間上是穩(wěn)定的假設(shè)產(chǎn)生了矛盾,導(dǎo)致傳統(tǒng)的全局方法在這種情況下失效。而LSS-ESSS正是針對(duì)這一情況發(fā)展而來的。
同時(shí),在運(yùn)用該方法的時(shí)候還需要有大量樣本的支持。因?yàn)樵摲椒ㄐ枰葘⑷繕颖緞澐譃槿舾蓚€(gè)具有相似環(huán)境條件的類別,然后再在與待估測(cè)樣本具有相同類別的內(nèi)部搜索局部樣本。因此,為了使得搜索出來的局部樣本能夠充分捕捉到目標(biāo)變量與光譜之間的關(guān)系,就必須要求每一類別內(nèi)有充足的樣本可供選擇。所以該方法也特別適合于具有較強(qiáng)數(shù)據(jù)變異性的大光譜數(shù)據(jù)庫(kù)。
針對(duì)現(xiàn)有基于光譜相似性的局部樣本搜索方法在局部樣本搜索時(shí)容易將與待估測(cè)樣本不屬于同一環(huán)境條件的樣本誤選的問題,本研究提出基于環(huán)境與光譜相似性相結(jié)合的局部樣本搜索方法,并將該方法應(yīng)用在案例研究中,得出以下主要結(jié)論:
1)來源于不同環(huán)境條件下的一些葉片樣本呈現(xiàn)出相似的光譜特征,但這些樣本不具有相似的葉片磷-光譜關(guān)系。
2)本研究提出的LSS-ESSS方法考慮到橡膠樹葉片樣本所處環(huán)境的差異,因此在局部樣本搜索時(shí)可避免選擇到與待估測(cè)樣本光譜特征相似但環(huán)境條件不一致的樣本,因而可顯著提高局部樣本的“純度”和增強(qiáng)橡膠樹葉片磷含量高光譜估測(cè)模型預(yù)測(cè)精度(抽葉期:LSS-ESSS和LSS-SC的 RMSE 分 別 為(0.031±0.003)%和(0.034±0.002)%,LSS-ESSS和LSS-SD的RMSE分別為(0.030±0.004)%和(0.034±0.002)%;成熟期:LSS-ESSS和LSS-SC的RMSE分別為(0.030±0.002)%和(0.042±0.002)%,LSS-ESSS和LSS-SD的RMSE分別為(0.029±0.003)%和(0.042±0.003)%;衰老期:LSS-ESSS和LSS-SC的RMSE分別為(0.026±0.002)%和(0.034±0.003)%,LSS-ESSS和LSS-SD的RMSE分別為(0.024±0.003)%和(0.035±0.003)%)。
3)LSS-ESSS適用于大尺度或環(huán)境條件較為復(fù)雜的區(qū)域,但該方法在應(yīng)用時(shí)需要有大量樣本的支撐。