楊紅云,羅建軍,孫愛珍,萬 穎,易文龍
(1.江西農(nóng)業(yè)大學(xué) 軟件學(xué)院/江西省高等學(xué)校農(nóng)業(yè)信息技術(shù)重點(diǎn)實(shí)驗室,江西 南昌330045; 2.江西農(nóng)業(yè)大學(xué) 計算機(jī)與信息工程學(xué)院,江西 南昌330045)
氮素是植物生長所需的必要元素之一,缺氮會造成植株葉片面積減小,降低光合作用、葉綠素含量和生物產(chǎn)量[1]。施氮過量則會在土壤中殘留大量的氮元素,不僅造成氮肥的浪費(fèi),而且會對環(huán)境造成一定的污染[2]。利用圖像處理技術(shù)進(jìn)行水稻氮素營養(yǎng)診斷,高效、便捷、無損。Lee等[3]指出綠光深度絕對值(G)與地上部生物量、氮素累積量和葉面積指數(shù)均可用指數(shù)方程進(jìn)行擬合,R2分別為0.830、0.830和0.860;李嵐?jié)萚4]研究表明,紅光標(biāo)準(zhǔn)化值(normalized redness intensity,NRI)與植株氮素營養(yǎng)指標(biāo)(葉片含氮量、植株全氮含量、生物量、氮素累積量和冠層歸一化差值植被指數(shù))的相關(guān)性最高,可建議作為水稻氮素營養(yǎng)診斷的最佳冠層圖像色彩參數(shù)指標(biāo);Yuan等[5]利用圖像處理技術(shù)所提取的水稻生長期的NRI、色度(hue,H)、深綠色指數(shù)(dark green color index,DGCI)等顏色特征與SPAD值具有良好的線性相關(guān)性。除提取圖像中的顏色特征進(jìn)行水稻氮素營養(yǎng)研究以外,顧清等[6]、周瓊等[7]還同時選用了水稻顏色和幾何形態(tài)等多類特征進(jìn)行水稻氮素營養(yǎng)識別分類研究。由上可知,水稻葉片顏色和幾何形態(tài)特征是能夠有效的進(jìn)行水稻氮素營養(yǎng)診斷研究的。支持向量機(jī)(support vector machine,SVM)具有非線性處理能力和高維處理能力,能在小樣本的情況下達(dá)到很好的效果,且已廣泛應(yīng)用于農(nóng)業(yè)生產(chǎn)[8]、病害識別[9]及作物氮素營養(yǎng)診斷研究[6,10];BP 神經(jīng)網(wǎng)絡(luò)(BP neural network,BPNN)是一種誤差反向傳播算法的學(xué)習(xí)過程,被廣泛運(yùn)用于模式識別、圖像處理、智能控制、故障檢測等領(lǐng)域[11-12]。同時潘圣剛等[13]研究表明,水稻進(jìn)行氮素高效吸收及快速累積的主要時期是幼穗分化期和齊穗期。周瓊等[7]以這兩個時期頂部3種葉位的水稻葉片作為研究對象,采用圖像處理技術(shù)和機(jī)器學(xué)習(xí)方法探尋水稻氮素營養(yǎng)診斷識別的最佳模型,但該研究未考慮建模時多種圖像特征的選取,所采用的機(jī)器學(xué)習(xí)建模方法未與傳統(tǒng)的建模方法進(jìn)行對比,且所建診斷識別模型僅能判定水稻氮素營養(yǎng)缺失。孫小香等[14]采用高光譜技術(shù)和BP神經(jīng)網(wǎng)絡(luò)建立了水稻葉片氮素濃度估算模型,較優(yōu)于傳統(tǒng)的多元線性回歸模型,BP神經(jīng)網(wǎng)絡(luò)對氮素雖然具有很好的預(yù)測能力,但高光譜技術(shù)的成本較高且操作較繁瑣。因此,本研究仍以幼穗分化期及齊穗期頂部3種葉位的水稻葉片圖像作為研究對象,并采用圖像處理技術(shù)提取出多項水稻特征??紤]到氮脅迫時水稻會表現(xiàn)出葉鞘褪綠、葉片均勻黃化的特異性癥狀,葉鞘首先失綠呈淡黃或橙黃色,中部葉片的葉尖也開始發(fā)黃[11],不僅選取了葉片的9項顏色特征,而且還選取了葉鞘的9項顏色特征;考慮到水稻在受到不同類型不同程度的氮營養(yǎng)脅迫時,葉片和葉鞘產(chǎn)生的反應(yīng)癥狀不僅僅體現(xiàn)在葉面積的大小、葉長或者葉寬,而且也會在葉片是否狹細(xì),葉尖角的大小,整個葉片的弧形度等方面體現(xiàn)出差異[11],不僅選取了長度、寬度、面積、周長等傳統(tǒng)幾何形態(tài)特征,還選取了長寬比、面積長度比以及面積周長比等相對值幾何形態(tài)特征。本研究將所提取的各項特征與葉片全氮含量進(jìn)行相關(guān)性分析,選擇出模型的輸入特征,采用傳統(tǒng)建模方法(多元線性回歸)以及機(jī)器學(xué)習(xí)方法(支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò))建立水稻葉片全氮含量估測模型,對比分析各模型精度,以期探尋能夠有效預(yù)測水稻葉片全氮含量的圖像特征、葉位,以及建模方法。
水稻試驗于2017—2018年在江西省南昌市成新農(nóng)場(116°15′E,28°92′N)進(jìn)行,稻田土壤pH值5.3,含有機(jī)質(zhì)24.4 g·kg-1、全氮1.4 g·kg-1、有效磷12.7 mg·kg-1、速效鉀123.0 mg·kg-1[15]。
以超級雜交稻兩優(yōu)培九作為供試品種,其最佳施氮量為純氮210~300 kg·hm-2[15],以其高施氮量(270 kg·hm-2以上)為基礎(chǔ),設(shè)置4個梯度,氮肥(純氮)施用量分別為0、210、300和390 kg·hm-2,3次重復(fù)試驗。小區(qū)隨機(jī)區(qū)組排列,小區(qū)面積30 m2,各小區(qū)間均作埂并用塑料薄膜包裹在上面, 以防各小區(qū)間互相影響。氮肥使用尿素(含N 46%),按基肥∶分蘗肥∶穗肥體積比4∶2∶4施用;磷肥使用鈣鎂磷肥(含P2O512%),按分蘗肥∶穗肥體積比7∶3施用;鉀肥使用氯化鉀(含K2O 60%),做基肥一次施用。各區(qū)間磷、鉀肥施用等量,分別為P2O5225 kg·hm-2、K2O 300 kg·hm-2。人工移栽前1d施用基肥,人工移栽后7 d施用分蘗肥,在葉齡余數(shù)1.5左右時施用穗肥[16]。2017年5月25日播種,6月14日人工移栽;2018年5月21日播種,6月10日人工移栽,栽插密度為13.3 cm×26.6 cm,其他管理按照一般的高產(chǎn)栽培處理。
分別于水稻幼穗分化期(2017年7月24日和2018年7月20日)和齊穗期(2017年8月23日和2018年8月20日)進(jìn)行水稻葉片取樣(田間各個位置都獲取)。水稻數(shù)字圖像獲取的設(shè)備選用MICROTEK平板掃描儀,型號MRS9600TFU2L,圖像傳感器為CCD,分辨率為600 ppi。水稻試驗葉片共計4 800片,2017年和2018年各2 400片,每年的各個時期均獲取1 200片,其中每個葉位下各400片,每個葉位下的四種施氮水平各100片。采樣后立即掃描,以防止葉片變形、變色,影響實(shí)驗效果[17]。葉片器官包括葉鞘和葉片,葉鞘包裹在主莖上(葉節(jié)到葉枕部分為葉鞘),葉片過長,從葉中位置剪斷為兩部分(葉中和葉尖)。將葉鞘、葉中和葉尖三個部位平鋪在同一大小的白色紙張上,放置一個已知大小的參照物,以便后續(xù)實(shí)驗的處理。參照物中包含8個黑色小方格,每個小方格的實(shí)際邊長為2.5 cm。
1.3.1 特征選擇
通過采用圖像處理技術(shù)從水稻葉片圖像中提取18項顏色特征和7項幾何形態(tài)特征,顏色特征包括葉片R、葉片G、葉片B、葉片紅光標(biāo)準(zhǔn)化值(NRI)、葉片綠光標(biāo)準(zhǔn)化值(NGI)、葉片藍(lán)光標(biāo)準(zhǔn)化值(NBI)、葉片H、葉片S、葉片I、葉鞘R、葉鞘G、葉鞘B、葉鞘NRI、葉鞘NGI、葉鞘NBI、葉鞘H、葉鞘S、葉鞘I,幾何形態(tài)特征包括葉片的長度、寬度、面積、周長、長寬比、面積長度比以及面積周長比。
1.3.2 水稻葉片顏色特征提取
葉片掃描圖像以白色紙張作為背景,且水稻葉片呈綠色或深綠色,目標(biāo)物體與背景顏色區(qū)分較為明顯。因此,省去圖像分割步驟。本研究采用Matlab工具將RGB圖像轉(zhuǎn)換成HSI圖像,獲取R、G、B、H、S、I共6種分量的圖像,如圖1所示。通過對6種分量的對比發(fā)現(xiàn),H分量下的水稻葉片和葉鞘與背景有較大差異,而G分量下的參照物與背景有較大差異,因此,對H分量圖像和G分量圖像進(jìn)行二值化,分別提取出水稻葉片和參照物,再采用cat函數(shù)去除圖像中的小面積干擾區(qū)域,如圖2所示。將去除雜質(zhì)后的圖像與原圖進(jìn)行點(diǎn)乘操作,獲取黑色背景的水稻圖像。同時使用regionprops函數(shù)對水稻葉片與葉鞘定位,分割出水稻葉片和水稻葉鞘,黑色背景下的水稻圖像如圖3所示。對黑色背景下的水稻圖像進(jìn)行葉片及葉鞘的R、G、B、H、S、I均值計算。并計算出水稻葉片和葉鞘的NRI、NGI和NBI,計算公式如式(1)所示。
圖1 六種通道分離的對比圖像Fig.1 Comparison image of six channel separation
(1)
式(1)中VNRI、VNGI、VNBI分別表示NRI、NGI、NBI的值。
1.3.3 水稻葉片幾何形態(tài)特征提取
圖2 水稻掃描圖像二值化及去除雜質(zhì)前后對比圖像Fig.2 Binary image of rice scanning image and image comparison before and after impurity removal
圖3 黑色背景下的水稻圖像Fig.3 Rice image in black background
圖4 水稻圖像最小外接矩形圖像Fig.4 Minimum circumscribed rectangle image of rice image
圖5 水稻葉片及參照物輪廓圖像Fig.5 Contour image of rice leaves and references
通過計算參照物實(shí)際周長與圖像中參照物輪廓像素點(diǎn)總個數(shù)的比值作為計算水稻幾何形態(tài)特征的系數(shù),該比例系數(shù)如公式(2)所示。葉片實(shí)際長寬、周長和面積的計算方法如公式(3)~(6)所示,并計算出長寬比、面積長度比以及面積周長比。
(2)
L=k·(ML+TL)。
(3)
W=k·max(MW,TW)。
(4)
C=k·(MC+TC-MW-TW)。
(5)
S=k·(MS+TS)。
(6)
式(2)~(6)中:k,比例系數(shù);Creal,8個參照物的實(shí)際周長;Cpixel,8個參照物輪廓總像素數(shù);L,葉片實(shí)際長度;ML,葉中最小外接矩形長度總像素數(shù);TL,葉尖最小外接矩形長度總像素數(shù);W,葉片實(shí)際寬度;MW,葉中最小外接矩形寬度總像素數(shù);TW,葉尖最小外接矩形寬度總像素數(shù);C,葉片實(shí)際周長;MC,葉中輪廓總像素數(shù);TC,葉尖輪廓總像素數(shù);S,葉片實(shí)際面積;MS,葉中輪廓內(nèi)總像素數(shù);TS,葉尖輪廓內(nèi)總像素數(shù)。
水稻葉片掃描后,將葉片樣品置于烘箱,設(shè)置105 ℃殺青1 h,在80 ℃下進(jìn)行48 h烘干至恒重。烘干后密封于干燥處保存,所有樣本處理完后,將干樣品粉碎、過篩、混勻,采用H2SO4-H2O2進(jìn)行消煮,凱氏定氮法測定葉片全氮含量[21-23]。
將25項圖像特征與葉片全氮含量進(jìn)行相關(guān)性分析,并采用多元線性回歸進(jìn)行水稻葉片全氮含量估測建模,篩選出水稻兩個時期的水稻葉片全氮含量估測敏感葉位。同時采用機(jī)器學(xué)習(xí)方法分別對兩個時期的敏感葉位進(jìn)行水稻葉片全氮含量估測建模,且與多元線性回歸建模進(jìn)行實(shí)驗對比。各模型試驗數(shù)據(jù)均為水稻葉片中所提取的圖像特征數(shù)據(jù)(各模型均為800組數(shù)據(jù)),隨機(jī)選取80%作為建模集數(shù)據(jù)(640組),20%作為驗證集數(shù)據(jù)(160組)。
1.5.1 主成分分析降維
主成分分析是將多個具有相關(guān)性的原始特征轉(zhuǎn)化為少數(shù)幾個不相關(guān)的綜合性特征[24]。本研究對圖像特征進(jìn)行相關(guān)性分析篩選后,特征數(shù)目仍然較多,為提高算法的運(yùn)行效率,達(dá)到理想試驗效果,對25項水稻圖像特征中與葉片全氮含量顯著和極顯著相關(guān)的特征進(jìn)行主成分分析降維。
1.5.2 歸一化處理
由于水稻每種特征量綱有所不同,為能夠提高模型運(yùn)行速率和模型準(zhǔn)確率[25],試驗采用mapminmax函數(shù)對主成分分析降維后的數(shù)據(jù)進(jìn)行歸一化處理,歸一化公式為
(7)
式(7)中:x,樣本數(shù)據(jù);xmax、xmin,原始特征數(shù)據(jù)中的最大值和最小值;y,歸一化后的數(shù)據(jù);ymax、ymin,歸一化處理后的最大值和最小值,ymax=1,ymin=0。
1.5.3 支持向量機(jī)
在實(shí)際應(yīng)用中,SVM能否建立理想的水稻氮素營養(yǎng)診斷模型,主要取決于懲罰參數(shù)C、核函數(shù)參數(shù)g以及核函數(shù)類型的選取[26]。采用支持向量機(jī)對敏感葉位進(jìn)行建模,核函數(shù)選用徑向基核函數(shù)[27],徑向基核(RBF)函數(shù)如公式(8)所示。采用網(wǎng)格搜索算法對誤差懲罰參數(shù)C和核函數(shù)參數(shù)g的優(yōu)選,網(wǎng)格搜索算法設(shè)定網(wǎng)格搜索的變量C和g的初始范圍為[2-8,28],搜索步距設(shè)為1,采用K-CV方法對訓(xùn)練集進(jìn)行測試,其中K=3[17]。模型輸入為主成分分析降維后的數(shù)據(jù),模型輸出為葉片全氮含量。
(8)
式(8)中δ>0,為高斯核的帶寬。
1.5.4 BP神經(jīng)網(wǎng)絡(luò)
采用BP神經(jīng)網(wǎng)絡(luò)對敏感葉位進(jìn)行建模,其隱含層傳遞函數(shù)、輸出層傳遞函數(shù)以及訓(xùn)練函數(shù)分別設(shè)置為tansig、purelin和trainlm[14]。經(jīng)過多次試驗調(diào)參,選取出最優(yōu)的參數(shù)值,其中學(xué)習(xí)速率、精度、動量因子分別設(shè)置為0.05、0.1和0.9,最大迭代次數(shù)為1 000次,選擇Levenberg-Mar-quardt優(yōu)化算法作為模型訓(xùn)練函數(shù)[28]。模型輸入層節(jié)點(diǎn)為主成分分析降維后的主成分個數(shù),輸出層節(jié)點(diǎn)為1(葉片全氮含量),隱含層節(jié)點(diǎn)數(shù)通過經(jīng)驗公式(9)[29]確定。本試驗BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)如圖6所示。
圖6 BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)圖Fig.6 Topological structure of BP neural network model
n2=2n1+n3。
(9)
式(9)中:n1,輸入節(jié)點(diǎn)數(shù);n2,隱含層節(jié)點(diǎn)數(shù);n3,輸出節(jié)點(diǎn)數(shù)。
為評判應(yīng)用圖像處理技術(shù)提取的幾何形態(tài)特征的準(zhǔn)確性及可行性,本研究從樣本數(shù)據(jù)中隨機(jī)選取500片葉片,進(jìn)行人工測量葉長和葉寬,并與圖像處理所提取的葉長和葉寬進(jìn)行對比分析。但由于數(shù)據(jù)量過大,僅列出20片葉片樣本測量的長寬值,兩種方法提取葉長和葉寬的誤差分析分別如圖7-a、b所示。人工測量的水稻葉片長度在42.000~60.500 cm,圖像處理提取的葉片長度誤差在0~0.300 cm,最大相對誤差為0.650%,平均相對誤差為0.328%;人工測量的水稻葉片寬度在1.700~1.900 cm,葉片寬度誤差在0~0.100 cm,最大相對誤差為5.850%,平均相對誤差為3.404%。由此說明,通過圖像處理進(jìn)行水稻幾何形態(tài)特征的提取是可行的,能夠替代人工測量水稻葉片幾何形態(tài)特征。
圖7 水稻葉長葉寬誤差分析圖Fig.7 Analysis table of rice leaf length and leaf width error
本研究將25項圖像特征與葉片全氮含量進(jìn)行相關(guān)性分析,如圖8所示。幼穗分化期頂1葉、頂2葉和齊穗期頂1葉的25項圖像特征的相關(guān)系數(shù)絕大多數(shù)都在-0.500~0.500,且均未達(dá)到0.010和0.050水平上相關(guān)。幼穗分化期頂3葉有19項特征達(dá)到0.010和0.05水平上相關(guān),齊穗期頂2葉和頂3葉的幾何形態(tài)特征相對葉片和葉鞘的顏色特征的相關(guān)系數(shù)較低,均未達(dá)到0.010和0.050水平上相關(guān),葉片和葉鞘的顏色特征中分別有16項和10項特征達(dá)到0.010和0.050水平上相關(guān)。由此表明,采用水稻顏色特征和幾何形態(tài)特征進(jìn)行水稻葉片全氮含量估測是可行的。
表1 多元線性回歸建模自變量選擇及模型檢驗結(jié)果
表2 水稻敏感葉位葉片全氮含量估測模型驗證結(jié)果對比
a,支持向量機(jī)模型;b,BP神經(jīng)網(wǎng)絡(luò)模型。圖10同。a, Support vector machine model; b, BP neural network model.Same as Figure 10.圖9 基于機(jī)器學(xué)習(xí)的幼穗分化期頂3葉模型實(shí)際值與預(yù)測值擬合結(jié)果Fig.9 Fitting results of actual value and predicted value of 3rd leaf at the young panicle stage based on machine learning
圖10 基于機(jī)器學(xué)習(xí)的齊穗期頂2葉模型實(shí)際值與預(yù)測值擬合結(jié)果Fig.10 Fitting results of actual value and predicted value of 2nd leaf at the full heading stage based on machine learning
本研究分別對水稻幼穗分化期、齊穗期兩個時期內(nèi)的頂1葉、頂2葉、頂3葉進(jìn)行水稻葉片全氮含量估測研究。通過水稻圖像特征相關(guān)性分析和多元線性回歸建模,發(fā)現(xiàn)幼穗分化期以頂3葉最易于估測水稻葉片全氮含量,這與周瓊等[7]研究的結(jié)果一致,且與水稻拔節(jié)期頂3 葉最能體現(xiàn)其氮素營養(yǎng)狀況相似。采用機(jī)器學(xué)習(xí)方法對幼穗分化期頂3葉、齊穗期頂2葉進(jìn)行水稻葉片全氮含量估測建模,其研究結(jié)果與孫小香等[14]的一致,機(jī)器學(xué)習(xí)方法優(yōu)于多元線性回歸,且以BP神經(jīng)網(wǎng)絡(luò)建模最佳。研究結(jié)果還表明,幼穗分化期頂3葉模型明顯強(qiáng)于齊穗期頂2葉,可能是由于超級雜交稻生育后期容易出現(xiàn)早衰現(xiàn)象,葉片氮含量衰減快速,不易于進(jìn)行水稻氮素營養(yǎng)診斷[30]?;跈C(jī)器學(xué)習(xí)的水稻葉片全氮含量估測模型建立的過程中,特征降維處理僅簡單地選用了前5個主成分。在后續(xù)研究中,將進(jìn)行深入研究,選取各模型建立的最佳主成分個數(shù),并引入更多的特征數(shù)據(jù)降維方法、建模方法以及模型優(yōu)化算法,以提高水稻葉片全氮含量估測模型的泛化能力。
本研究將圖像處理所提取的葉長葉寬與人工測量進(jìn)行對比分析,其葉片長寬平均相對誤差分別為0.328%、3.404%,能夠滿足本試驗的需求。在前期研究結(jié)果[18]中,由于其圖像掃描時選擇分蘗期葉片較多,可以整片平鋪掃描,且參考物方格數(shù)較多,因此與本次研究相比,誤差相對小一些。研究中所選用的水稻圖像特征大多為常用顏色和幾何形態(tài)特征。在后續(xù)試驗中,將繼續(xù)研究更為快捷的機(jī)器視覺獲取水稻圖像特征數(shù)據(jù)方法,以便高效準(zhǔn)確地獲取水稻器官特征數(shù)據(jù),并引入水稻植株的其他特征,如葉莖夾角、紋理特征等。
本研究僅以兩優(yōu)培九作為供試品種,所建立的水稻氮素營養(yǎng)診斷模型在其他水稻品種中的應(yīng)用性還需要進(jìn)一步研究。研究中所獲取的樣本數(shù)目相對較少,各葉位僅有800組。為使得水稻葉片全氮含量估測模型更具有通用性與實(shí)用性以及提高樣本的容錯率,在未來的研究中,將獲取更多水稻品種及生長時期的水稻圖像特征進(jìn)行研究,并提高模型建立的樣本總量。同時,本研究選用的數(shù)據(jù)是從水稻掃描葉中所獲取的,雖然基本排除了環(huán)境干擾等的影響,但掃描儀不便攜帶到大田實(shí)地測量,且需破壞性采用,不利水稻正常生長和連續(xù)觀測取樣。若在多樣性的大田環(huán)境下,環(huán)境干擾等因素是無法避免的。因此,在后續(xù)研究中將探尋無損、便捷的方式獲取水稻葉片圖像。