岳云開,陳建福,趙亮,焦鑫偉,許明志,付虹雨,廖澳,崔國賢,佘瑋
(湖南農(nóng)業(yè)大學(xué)苧麻研究所,湖南 長沙 410128)
苧麻(Boehmeria niveaL.)為蕁麻科(Urticaceae)苧麻屬(Boehmeria) 的多年生草本纖維植物[1],在我國紡織業(yè)中占有重要地位[2]。 苧麻中含有豐富的營養(yǎng)成分,是優(yōu)質(zhì)的植物蛋白飼料來源[3];葉和根中富含綠原酸和多酚等活性成分,具有止血、安胎、抗病毒等藥用功效[4];葉中還含有豐富的葉綠素,是一種天然可食用色素,民間常將其用于食品調(diào)色[5]。 因此,苧麻不斷地被開發(fā)和利用。
葉綠素是植物葉片中的主要光合色素,其含量可以直接反映植物的光合作用強(qiáng)弱和健康狀況,是評價植物生長狀況的重要指標(biāo),與作物的產(chǎn)量及品質(zhì)密切相關(guān)[6,7]。 因此,及時準(zhǔn)確監(jiān)測葉綠素含量對于苧麻生產(chǎn)管理十分重要。 傳統(tǒng)的葉綠素監(jiān)測方法具有破壞性大、操作繁瑣、效率低、費(fèi)時費(fèi)力等缺陷,不能及時反饋?zhàn)魑锏纳L狀況。近年來,無人機(jī)遙感技術(shù)快速發(fā)展,并在作物生長監(jiān)測、營養(yǎng)狀況診斷等方面廣泛應(yīng)用[8],也為作物葉綠素監(jiān)測提供了新的方法。 如陳浩等[9]利用無人機(jī)多光譜遙感對不同施肥處理下的夏玉米冠層葉綠素進(jìn)行估測,然后基于線性回歸和逐步回歸,建立了夏玉米冠層葉綠素含量遙感監(jiān)測模型;周敏姑等[10]利用無人機(jī)多光譜遙感5 個波段光譜反射率反演冬小麥SPAD 值,經(jīng)對比分析發(fā)現(xiàn)基于逐步回歸法構(gòu)建的模型效果最優(yōu),決定系數(shù)為0.77;Narmilan 等[11]利用無人機(jī)多光譜,并基于MLR、RF、DT、SVR、XGB、KNN 和ANN 等機(jī)器學(xué)習(xí)算法,預(yù)測甘蔗冠層葉綠素含量,結(jié)果表明所有模型反演效果均較好,其中隨機(jī)森林(RF)回歸模型的決定系數(shù)高達(dá)0.99。 可見,利用無人機(jī)遙感反演作物葉綠素含量是可行的。
本研究以四個生長時期的苧麻為研究對象,利用無人機(jī)多光譜圖像構(gòu)建多種植被指數(shù),通過對葉綠素含量和植被指數(shù)的相關(guān)性分析,采用傳統(tǒng)回歸和隨機(jī)森林回歸方法建立了苧麻葉綠素含量的遙感估算模型,經(jīng)分析評價后確定最佳反演模型以實(shí)現(xiàn)苧麻葉片葉綠素含量的動態(tài)監(jiān)測。
試驗(yàn)區(qū)位于湖南省長沙市芙蓉區(qū)湖南農(nóng)業(yè)大學(xué)耘園教學(xué)基地(28°11′01.981″N,113°04′10.159″E)。該區(qū)域?qū)俚湫偷膩啛釒Ъ撅L(fēng)性濕潤氣候,降水充沛,光熱條件良好,是苧麻的主產(chǎn)區(qū)之一。 試驗(yàn)區(qū)地勢平坦,無遮擋物,為無人機(jī)作業(yè)提供了良好的條件。 試驗(yàn)區(qū)共種植27 個苧麻品種,每個品種一個小區(qū),重復(fù)3 次,共81 個小區(qū);小區(qū)面積2.0 m×1.8 m,2 行×4 蔸,蔸間距為0.4 m,行間距為0.6 m,排水溝寬0.5 m。 苧麻材料于2017 年12月育苗移栽,2018 年6 月破桿。 試驗(yàn)區(qū)土壤肥沃且成分均一,灌溉排水便捷,田間水肥管理一致。
1.2.1 無人機(jī)遙感影像獲取 利用大疆精靈Phantom 4 多光譜版無人機(jī)搭載多光譜遙感設(shè)備獲取苧麻冠層影像。 該無人機(jī)采用厘米級定位系統(tǒng),并將飛控、相機(jī)與RTK 的時鐘系統(tǒng)進(jìn)行微秒級同步;無人機(jī)搭載一臺多光譜傳感器,該傳感器集成了1 個可見光相機(jī)及5 個多光譜相機(jī)(藍(lán)光、綠光、紅光、紅邊和近紅外),所有相機(jī)均擁有200萬像素解析力,拍攝照片的最大分辨率為1 600×1 300。
于2022 年3—5 月苧麻每個生育期采集一次數(shù)據(jù)。 為保證無人機(jī)影像的穩(wěn)定性和可靠性,每次飛行選擇在晴朗無風(fēng)天氣的10—12 時進(jìn)行。 無人機(jī)遙感系統(tǒng)在距離地面20 m 的高度搭配-90°云臺俯仰角進(jìn)行拍攝,飛行速度為2 m/s,航向及旁向重疊度均為75%。 各時期飛行任務(wù)的拍攝參數(shù)、航線規(guī)劃一致,在飛行任務(wù)執(zhí)行前設(shè)置完成。 將采集的影像導(dǎo)入大疆智圖軟件進(jìn)行拼接,經(jīng)輻射校正后獲取試驗(yàn)區(qū)域的反射率影像,再通過無人機(jī)一體化圖像分析系統(tǒng)PhenoAI air 軟件進(jìn)行植被指數(shù)及反射率的提取。
1.2.2 葉綠素含量測定 參照張憲政[12]的方法進(jìn)行。 取苧麻植株頂部倒數(shù)第6 ~7 葉,去除葉脈后剪碎、混勻,稱取0.1 g 裝入10 mL 離心管中,重復(fù)3 次,分別加入提取液(95.5%丙酮+無水乙醇,體積比為1∶1)10 mL,充分搖勻后用黑色塑料袋遮蓋并避光保存48 h,直至葉片完全變白,然后用紫外分光光度計(jì)在663、652、645 nm 波長下測定吸光度,并按下列公式計(jì)算葉綠素a、葉綠素b 含量及葉綠素總含量。
葉綠素a 含量(mg/L)=(12.7D663-2.69D645)V/(1000W) ;
葉綠素b 含量(mg/L)=(22.9D645-4.68D663)V/(1000W) ;
葉綠素總含量(mg/L)=D652V/(34.5W) 。式中D663、D652、D645分別為相應(yīng)波長下的光密度值,V 為提取液體積,W 為葉片鮮重。 整個生育期苧麻葉片葉綠素含量的箱線圖如圖1 所示。
圖1 各生育時期苧麻葉片葉綠素總含量的箱線圖
依據(jù)已有的多光譜植被指數(shù),結(jié)合葉綠素吸收光譜的特性,并通過與實(shí)測葉綠素含量進(jìn)行相關(guān)性分析,選擇相關(guān)系數(shù)較高的7 種植被指數(shù)進(jìn)行建模,分別為歸一化植被指數(shù)(NDVI)、綠色歸一化植被指數(shù)(GNDVI)、歸一化差異紅色邊緣植被指數(shù)(NDRE)、改進(jìn)簡單比值植被指數(shù)(MSR)、比值植被指數(shù)(RVI)、寬范圍動態(tài)植被指數(shù)(WDRVI)、土壤調(diào)節(jié)植被指數(shù)(OSAVI),如表1所示。
表1 植被指數(shù)及計(jì)算公式
本研究基于7 種植被指數(shù)分別使用一元線性回歸、多元線性回歸和隨機(jī)森林回歸構(gòu)建不同生育時期苧麻葉綠素含量反演模型。 一元線性回歸模型的構(gòu)建使用SPSS 軟件,其方程為y =ax+b,式中,y 代表葉綠素含量,x 代表植被指數(shù)。 多元線性回歸模型的構(gòu)建也使用SPSS 軟件,其方程為y =a1x1+a2x2+...+anxn+b,式中x1、x2...xn代表不同植被指數(shù)。 隨機(jī)森林回歸模型的構(gòu)建使用Matlab軟件,首先從全部自變量集合里有放回地隨機(jī)抽取m 個樣本數(shù)據(jù)集,在所有特征變量中選擇K 個特征變量,然后選擇最佳分割特征變量作為節(jié)點(diǎn)構(gòu)建CART 樹,并重復(fù)T 次,即組建了T 棵決策樹,最終每個決策樹結(jié)果的平均作為隨機(jī)森林回歸模型的結(jié)果。
隨機(jī)選取70%樣本作為建模集,用于構(gòu)建葉綠素含量反演模型,30%樣本作為驗(yàn)證集,用于模型評價。 為評估不同模型的估算精度,本研究以決定系數(shù)(R2)、均方根誤差(RMSE)作為評價指標(biāo)。 通常R2越接近于1、RMSE 越小,說明模型估算能力越好。
式中:yi為葉綠素含量實(shí)測值,為葉綠素含量預(yù)測值,為葉綠素含量平均值,n 為樣本數(shù)。
對不同生育期獲取的植被指數(shù)與葉綠素含量進(jìn)行相關(guān)性分析,結(jié)果(表2)顯示,全生育期內(nèi),葉綠素與7 種植被指數(shù)之間的相關(guān)性均達(dá)到顯著或極顯著水平,苗期、封行期、旺長期、成熟期葉綠素與植被指數(shù)的相關(guān)性范圍分別為0.723~0.798、0.629 ~0.761、0.391 ~0.818、0.731 ~0.794。 其中,NDVI 在苗期、封行期、成熟期與葉綠素含量具有最高相關(guān)系數(shù),分別達(dá)到0.798、0.761、0.794;NDRE與葉綠素在旺長期最相關(guān)(相關(guān)系數(shù)為0.818)。因此,所選植被指數(shù)可用于葉綠素含量反演模型的構(gòu)建。
表2 植被指數(shù)與葉綠素含量的相關(guān)系數(shù)
根據(jù)葉綠素含量與植被指數(shù)相關(guān)性分析的結(jié)果,以上述7 種植被指數(shù)作為自變量、葉綠素含量作為因變量,分別建立不同生育時期的一元線性回歸模型和多元線性回歸模型,結(jié)果如表3 所示。所有線性回歸模型的顯著性均達(dá)到0.01 極顯著水平,說明各模型的擬合性均較好。 不同生育時期、不同建模方法的反演效果存在差異,總體上多元線性回歸模型的效果好于一元線性回歸模型,且以封行期的反演效果最佳,建模集和驗(yàn)證集的R2分別為0.667 和0.752。 各時期基于多元線性回歸模型的實(shí)測值與預(yù)測值間擬合關(guān)系如圖2所示。
表3 葉綠素含量與植被指數(shù)線性回歸模型
圖2 基于多元線性回歸的葉綠素估算模型預(yù)測值和實(shí)測值的關(guān)系
根據(jù)葉綠素含量與植被指數(shù)相關(guān)性分析的結(jié)果,選擇NDVI、GNDVI、RVI、OSAVI、NDRE、MSR、WDRVI 這7 種植被指數(shù),采用隨機(jī)森林算法,分別建立苗期、封行期、旺長期、成熟期的葉綠素含量反演模型,并利用驗(yàn)證集數(shù)據(jù)對模型精度進(jìn)行驗(yàn)證,由表4 可以看出,不同生育時期隨機(jī)森林模型反演效果也存在差異,苗期和封行期決定系數(shù)較小,反演效果較差;旺長期的建模效果最好,建模集R2為0.969,RMSE 為0.031;成熟期的反演效果最好,驗(yàn)證集R2為0.892,RMSE 為0.116,且建模效果也較好,建模集R2為0.949,RMSE 為0.045。 基于隨機(jī)森林模型的苧麻葉綠素含量預(yù)測值與實(shí)測值間的關(guān)系如圖3 所示。
表4 葉綠素含量與植被指數(shù)隨機(jī)森林模型的評價結(jié)果
圖3 基于隨機(jī)森林模型的葉綠素預(yù)測值與實(shí)測值的關(guān)系
綜上所述,與傳統(tǒng)的線性回歸模型相比,基于隨機(jī)森林算法構(gòu)建的模型預(yù)測效果在各生育時期均有大幅提升,總體以成熟期的反演效果最好,建模集和驗(yàn)證集的R2分別為0.949 和0.892,因此最終選用成熟期的隨機(jī)森林模型用于苧麻葉綠素含量反演。
本研究基于無人機(jī)獲取的苧麻苗期、封行期、旺長期和成熟期多光譜遙感影像,結(jié)合實(shí)測葉綠素含量,選取7 種植被指數(shù),分別利用一元線性回歸、多元線性回歸和隨機(jī)森林算法建立了苧麻葉片葉綠素含量反演模型,研究利用多光譜遙感估測苧麻葉綠素含量的可行性。 相關(guān)性分析結(jié)果表明7 種植被指數(shù)均與各時期葉綠素含量顯著或極顯著相關(guān),與陳鵬[14]、Cao[18]等的研究結(jié)果一致,可用于后續(xù)模型構(gòu)建。 經(jīng)對比分析,多元線性回歸模型的反演效果明顯好于一元線性回歸,而基于隨機(jī)森林機(jī)器學(xué)習(xí)構(gòu)建模型的葉綠素預(yù)測效果最好,以成熟期的反演效果最佳,建模集和驗(yàn)證集的R2分別為0.949 和0.892,RMSE 分別為0.045 和0.116。 這主要是因?yàn)殡S機(jī)森林模型有很好的抗噪聲能力且不容易過度擬合,使得模型精度較高[20-22]。
無人機(jī)多光譜遙感技術(shù)為監(jiān)測苧麻葉綠素含量提供了一種實(shí)用、高效、低成本、無損的方法,通過結(jié)合機(jī)器學(xué)習(xí)技術(shù),能夠較精準(zhǔn)反演苧麻葉綠素含量,可以作為苧麻生長過程中葉片葉綠素含量監(jiān)測的有效手段。
雖然本研究建立的隨機(jī)森林模型對苧麻葉綠素含量反演效果較好,但目前對葉綠素的跨期預(yù)測模型還沒有深入研究,且模型的普適性也需要進(jìn)一步驗(yàn)證,在下一步研究中將對模型進(jìn)行優(yōu)化,嘗試機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的對比研究,以探索出普適性強(qiáng)、預(yù)測精度更高的苧麻葉綠素含量反演模型。