陶晡,齊永志,屈赟,曹志艷,趙緒生,甄文超
1河北農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院,河北保定 071001;2河北農(nóng)業(yè)大學(xué)現(xiàn)代教育技術(shù)中心,河北保定 071001;3河北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院/華北作物改良與調(diào)控國(guó)家重點(diǎn)實(shí)驗(yàn)室/河北省作物生長(zhǎng)調(diào)控重點(diǎn)實(shí)驗(yàn)室,河北保定 071001
【研究意義】小麥赤霉?。‵usarium head blight,F(xiàn)HB)是小麥生產(chǎn)上發(fā)生面積最廣、危害程度最大的麥類病害之一[1],該病是以禾谷鐮孢(Fusarium graminearum)為主要致病菌的真菌性病害[2]。據(jù)報(bào)道,自 1990年以來美國(guó)小麥種植面積因赤霉病流行不斷壓縮,2018年小麥種植面積減少1 200萬公頃[3],2016年小麥赤霉病造成加拿大薩斯克徹溫省經(jīng)濟(jì)損失約為10億美元[4]。同時(shí)病菌產(chǎn)生的脫氧雪腐鐮刀菌烯醇(DON毒素)和玉米赤霉烯酮(ZEN毒素)等危害人畜健康,對(duì)小麥品質(zhì)和產(chǎn)量造成嚴(yán)重影響[5-6]。近年來,因氣候條件變化、耕作制度改變,我國(guó)小麥赤霉病發(fā)生呈日趨嚴(yán)重的趨勢(shì),由長(zhǎng)江中下游麥區(qū)逐漸向北擴(kuò)展,淮河流域地區(qū)成為重發(fā)區(qū),在黃淮北片麥區(qū)和北部冬麥區(qū)也成為常發(fā)病害[7],2010年以來重發(fā)頻率在50%以上,2015、2016、2018年發(fā)生面積均超過550萬公頃[8]。自1995年以來,小麥赤霉病逐漸在海河平原(也稱河北平原)蔓延,已由零星出現(xiàn)逐漸演變成連片發(fā)生,并由次要病害上升為主要病害之一,年均發(fā)生面積達(dá)26.7萬公頃以上[7]。小麥赤霉病在流行年份具有短期內(nèi)暴發(fā)快、面積大、損失重的特性,因此,明確海河平原影響赤霉病發(fā)生的關(guān)鍵氣象因子,建立適宜該區(qū)域的病害預(yù)測(cè)模型,提供準(zhǔn)確的預(yù)測(cè)預(yù)報(bào)信息,對(duì)有效防控病害蔓延具有重要意義。【前人研究進(jìn)展】DE WOLF等[9-10]以小麥開花前7 d和開花后10 d的氣象因子作為預(yù)測(cè)變量,用邏輯回歸建立了小麥赤霉病測(cè)報(bào)模型;在此基礎(chǔ)上,SHAH等以品種抗性、玉米殘茬以及前期研究獲得的4個(gè)氣象因子作為變量,通過R語言,建立了基于Leaps and Bounds算法的Logistic回歸模型[11]和增強(qiáng)回歸樹(boosted regression tree,BRT)模型[12],結(jié)果表明,增強(qiáng)回歸樹模型誤判率低于Logistic回歸模型;HOOKER等[13]以抽穗前4—7 d降雨天數(shù)和溫度為預(yù)測(cè)變量,建立了含有指數(shù)項(xiàng)的模型,預(yù)測(cè)小麥 DON毒素含量;DEL PONTE等[14]以空中孢子捕捉量和感病組織為基礎(chǔ)建立測(cè)報(bào)模型;ROSSI等[15]以菌源量、小麥關(guān)鍵生育期為基礎(chǔ),綜合考慮日產(chǎn)孢率、孢子分散率、侵染機(jī)率和小麥生育期等因素,預(yù)測(cè)小麥赤霉病發(fā)生風(fēng)險(xiǎn);MUSA等[16]建立了基于web的瑞士小麥赤霉病預(yù)警系統(tǒng)FusaProg,預(yù)測(cè)小麥赤霉病發(fā)生、DON毒素含量并指導(dǎo)殺菌劑科學(xué)使用。國(guó)內(nèi)專家學(xué)者從氣候預(yù)測(cè)、菌量預(yù)測(cè)、氣候菌量相結(jié)合預(yù)測(cè)等方面展開了研究,建立了長(zhǎng)期預(yù)測(cè)、中期預(yù)測(cè)與短期預(yù)測(cè)模型,同時(shí),借助神經(jīng)網(wǎng)絡(luò)[17-18]、支持向量機(jī)[19]、無人機(jī)高光譜圖像[20]等技術(shù),不斷提高了預(yù)測(cè)預(yù)報(bào)的準(zhǔn)確度。一般情況下,預(yù)測(cè)模型存在可移植性差、跨地區(qū)應(yīng)用準(zhǔn)確度下降等問題?!颈狙芯壳腥朦c(diǎn)】增強(qiáng)回歸樹是以分類回歸樹(classification and regression tree,CART)算法為基礎(chǔ)的一種自學(xué)方法,通過自我學(xué)習(xí)和隨機(jī)選擇生成多重回歸樹,提高模型穩(wěn)定性和預(yù)測(cè)精度。YOU等利用該模型明確了環(huán)境變量與品種對(duì)牧草病害發(fā)生的影響,取得了較好的效果[21],為評(píng)估小麥赤霉病主要影響因子重要性提供了一種新的思路?!緮M解決的關(guān)鍵問題】根據(jù)影響小麥赤霉病流行的關(guān)鍵生育期,選擇溫度、濕度、降雨、日照、風(fēng)速等氣象因子為預(yù)測(cè)變量,篩選出重要預(yù)測(cè)變量,并分析其對(duì)病害發(fā)生的影響,以期提升模型預(yù)測(cè)準(zhǔn)確度,為小麥赤霉病發(fā)生預(yù)測(cè)預(yù)報(bào)提供參考,同時(shí)也可為建立該病害綜合、高效防控體系提供技術(shù)支撐。
試驗(yàn)數(shù)據(jù)采集于2014—2016年完成,數(shù)據(jù)處理、模型構(gòu)建及檢驗(yàn)于2017—2019年完成。
收集整理 2001—2013年海河平原小麥主產(chǎn)區(qū)安新、望都、定州、新樂、正定、無極、欒城、辛集、平山、行唐、靈壽、阜城、武邑、景縣、臨西、寧晉、磁縣、館陶、曲周、永年、大名共21個(gè)縣(市)定點(diǎn)監(jiān)測(cè)小麥赤霉病發(fā)病情況基本數(shù)據(jù),來源于河北省植保植檢總站。
2014—2016年在上述21縣(市)田間調(diào)查小麥赤霉病發(fā)生情況,每縣選擇10個(gè)調(diào)查點(diǎn),每個(gè)調(diào)查點(diǎn)隨機(jī)取樣500穗,并計(jì)算病穗率。依據(jù)國(guó)家《小麥赤霉病測(cè)報(bào)技術(shù)規(guī)范》GB/T15796—2011將小麥赤霉病劃分為不發(fā)生、輕度流行、中度流行、重度流行4個(gè)等級(jí):不發(fā)生(0級(jí),病穗率<0.1%,對(duì)小麥生產(chǎn)未造成減產(chǎn))、輕度流行(1級(jí),0.1%≤病穗率<5%,對(duì)小麥生產(chǎn)造成局部減產(chǎn))、中度流行(2級(jí),5%≤病穗率<10%,對(duì)小麥生產(chǎn)造成部分減產(chǎn))、重度流行(3級(jí),病穗率≥10%,對(duì)小麥生產(chǎn)造成明顯減產(chǎn))。
小麥生育期內(nèi)氣象資料:來源于河北省氣象局2001—2016年21個(gè)縣(市)逐日最高溫度、最低溫度、平均溫度、日照數(shù)據(jù)、平均風(fēng)速、平均相對(duì)濕度、總降雨量等。
河北省南部和北部冬小麥生育進(jìn)程存在一定的時(shí)間差[22],南部麥區(qū)比中部麥區(qū)的播種期、越冬期晚 3—5 d,其他生育期早3—7 d;北部麥區(qū)比中部麥區(qū)的播種期、越冬期早5—7 d,其他生育期晚5—7 d(表1)。按照河北中部麥區(qū)常年小麥生育進(jìn)程分別計(jì)算21個(gè)縣(市)小麥抽穗期初始日期,每5 d編為一組,分別以當(dāng)?shù)氐男←湷樗肫诔跏既諡槠瘘c(diǎn),小麥抽穗期初始日向前選擇6組,即抽穗期初始日向前26—30、21—25、16—20、11—15、6—10 和 1—5 d,抽穗期初始日向后選擇2組,即抽穗期初始日向后1—5、6—10 d。以中部麥區(qū)的正定、欒城等地最高溫度為例,選擇小麥抽穗期初始日(5月1日)為起點(diǎn),HT-65、HT-55、HT-45、HT-35、HT-25、HT-15分別代表小麥抽穗期初始日之前 26—30、21—25、16—20、11—15、6—10和1—5 d的最高溫度平均值,HT15、HT25分別代表小麥抽穗期初始日之后1—5、6—10 d的最高溫度平均值。主要包括9個(gè)氣象因子:最高溫度(HT)、最低溫度(LT)、平均溫度(MT)、平均風(fēng)速(MWS)、平均相對(duì)濕度(MRH)、相對(duì)濕度≥85%天數(shù)(RH85)、降雨天數(shù)(DRain)、總降雨量(Rain)、總?cè)照諘r(shí)數(shù)(SD)。
表1 河北省中部麥區(qū)常年小麥生育進(jìn)程Table 1 Growth process of wheat in middle wheat region in Hebei Province[22]
1.3.1 預(yù)測(cè)模型構(gòu)建 研究以不同氣象因子為預(yù)測(cè)變量、小麥赤霉病病穗率為響應(yīng)變量,采用增強(qiáng)回歸樹模型建模,模型擬合使用R語言(3.6.1版本,R核心開發(fā)組,2019)gbm包和 Elith的函數(shù)包[23]。增強(qiáng)回歸樹結(jié)合了提升(boosting)和分類回歸樹(CART)兩種技術(shù),通過組合大量相對(duì)簡(jiǎn)單的決策樹的方式以優(yōu)化模型的預(yù)測(cè)性能,模型可寫成M棵分類回歸樹相加的形式。
式中,Tm(X, γm)為第m棵分類回歸樹,X為氣象因子預(yù)測(cè)變量,γm為其參數(shù),是該決策樹分裂點(diǎn)和葉子結(jié)點(diǎn)的賦值,求解 γm的過程即為單棵決策樹的學(xué)習(xí)過程。
1.3.2 模型參數(shù)選擇 在模型運(yùn)行過程中,需要優(yōu)化迭代次數(shù)(the number of trees,nt)、樹的復(fù)雜度(tree complexity,tc)、學(xué)習(xí)效率(learning rate,lr)、抽樣比率(bag fraction,bf)、函數(shù)損失形式(distribution)、交叉驗(yàn)證折數(shù)(cv.folds)等參數(shù)[12]。樹的復(fù)雜度即為單棵決策樹的葉節(jié)點(diǎn)數(shù)量,它是模型擬合環(huán)境因子間交互作用的階數(shù)。增強(qiáng)回歸樹中所有決策樹的葉節(jié)點(diǎn)數(shù)量相同,訓(xùn)練過程中葉節(jié)點(diǎn)達(dá)到一定數(shù)量時(shí)則停止生長(zhǎng),不需要剪枝[23-24]。學(xué)習(xí)效率決定了模型達(dá)到最優(yōu)所需訓(xùn)練的時(shí)間,lr值過小,則收斂速度慢、訓(xùn)練時(shí)間越長(zhǎng);lr值過大,抽樣時(shí)容易產(chǎn)生噪音,導(dǎo)致函數(shù)平滑性降低、穩(wěn)定性差[25]。通常情況下,迭代次數(shù)(nt)要達(dá)到1 000以上模型才趨于穩(wěn)定,樹的復(fù)雜度(tc)1—16,學(xué)習(xí)效率(lr)0.001—0.1,抽樣比率(bf)為 0.75,函數(shù)損失形式為“gaussian”。由于 tc和 lr的取值影響模型的預(yù)測(cè)準(zhǔn)確度,隨機(jī)選擇70%訓(xùn)練集數(shù)據(jù)用于構(gòu)建模型,剩余30%的數(shù)據(jù)用于計(jì)算模型的預(yù)測(cè)偏差,根據(jù)模型預(yù)測(cè)偏差大小選擇最優(yōu)的tc值和lr值。
隨著決策樹數(shù)量的增加,增強(qiáng)回歸樹模型的擬合效果會(huì)越來越好,但決策樹數(shù)量過大會(huì)出現(xiàn)過擬合,導(dǎo)致預(yù)測(cè)精度降低。本研究以 10倍交叉驗(yàn)證法(10-fold cross-validation)確定最優(yōu)決策樹的數(shù)量。
1.3.3 預(yù)測(cè)因子相對(duì)重要性計(jì)算 在分類回歸樹模型中,F(xiàn)RIEDMAN[26]提出了用I2(T)j 作為第j個(gè)預(yù)測(cè)因子Xj的相關(guān)性的度量,該度量基于選擇Xj變量進(jìn)行決策樹的節(jié)點(diǎn)分裂時(shí)平方誤差加權(quán)改進(jìn),該度量比其對(duì)應(yīng)的單個(gè)分類樹更加可靠。
式中,預(yù)測(cè)因子Xj的相對(duì)重要性的平方即為平方誤差加權(quán)改進(jìn)在模型中M棵分類回歸樹上的平均[27]。通常情況下預(yù)測(cè)因子的相對(duì)重要性以百分?jǐn)?shù)形式表示,所有預(yù)測(cè)因子的相對(duì)重要性之和為100。
采用最大誤差參照法計(jì)算預(yù)測(cè)準(zhǔn)確度[28]:
其中,R為模型預(yù)測(cè)準(zhǔn)確度,F(xiàn)i為模型預(yù)測(cè)病害流行等級(jí),Ai為實(shí)際病害流行等級(jí),Mi為第i次預(yù)測(cè)的最大參照誤差。
通過對(duì)預(yù)測(cè)集正態(tài)性判斷、誤差獨(dú)立性判斷、線性判斷、同方差性判斷以及多元回歸模型綜合判斷,剔除離群值和強(qiáng)影響點(diǎn),篩選出影響海河平原小麥赤霉病發(fā)生的 8個(gè)關(guān)鍵氣象因子,即 LT-65、MWS-55、MRH-55、Rain-35、MT-25、SD15、MRH15、DRain15。同時(shí),構(gòu)建了小麥赤霉病多元線性回歸預(yù)測(cè)模型(multiple linear regression model,MLRⅠ):y=-13.2427+0.3145LT-65-0.9824MWS-55+0.1209MRH-55+0.1377Rain-35-0.4184MT-25+0.0814SD15+0.28024MRH15-0.8832DRain15,該模型R2=0.8158,矯正R2=0.8018,P<2.2×10-16。
其中,y為小麥赤霉病病穗率,LT-65為抽穗期初始日之前26—30 d最低溫度,MWS-55為抽穗期初始日之前21—25 d平均風(fēng)速,MRH-55為抽穗期初始日之前21—25 d相對(duì)平均濕度,Rain-35為抽穗期初始日之前11—15 d總降雨量,MT-25為抽穗期初始日之前6—10 d平均溫度,SD15為抽穗期初始日之后1—5 d總?cè)照諘r(shí)數(shù),MRH15為抽穗期初始日之后1—5 d相對(duì)平均濕度,DRain15為抽穗期初始日之后 1—5 d降雨天數(shù)。
根據(jù)增強(qiáng)回歸樹(BRT)模型擬合曲線(圖 1)可知,在不同學(xué)習(xí)效率(lr)和樹的復(fù)雜度(tc)下,當(dāng)lr為0.1和0.05時(shí),模型的最小預(yù)測(cè)偏差與其他學(xué)習(xí)效率相比偏差相對(duì)較大,在不同樹的復(fù)雜度下,模型會(huì)較早的發(fā)生過度擬合。當(dāng)lr為0.001時(shí),模型迭代次數(shù)一般在2 000左右達(dá)到最小預(yù)測(cè)偏差,當(dāng)lr為0.01時(shí),模型迭代次數(shù)一般在500—800范圍內(nèi)達(dá)到最小預(yù)測(cè)偏差。當(dāng)lr為0.005時(shí),模型迭代次數(shù)在900—1 800范圍內(nèi)達(dá)到最小預(yù)測(cè)偏差。
設(shè)置lr為0.01、0.005,由不同tc的殘差標(biāo)準(zhǔn)誤(residual standard error,圖2)可知,在lr為0.01和0.005的學(xué)習(xí)效率條件下,當(dāng)tc為6時(shí)增強(qiáng)回歸樹模型的殘差標(biāo)準(zhǔn)誤分別為0.01004和0.006311,隨著tc值的增加,增強(qiáng)回歸樹模型的預(yù)測(cè)偏差相對(duì)變化不大。綜合考慮不同lr和tc下模型預(yù)測(cè)偏差,選擇模型的lr為0.005,tc為6。
設(shè)置lr為0.005,在不同tc下預(yù)測(cè)了變量的重要性(圖3),隨著tc增大,各預(yù)測(cè)變量重要性排名未發(fā)生太大變化,MRH15、Rain-35是相對(duì)重要的兩個(gè)預(yù)測(cè)變量;其次是 MRH-55、SD15、LT-65、MT-25、MWS-55、DRain15。
當(dāng)tc=6時(shí),預(yù)測(cè)變量MRH15、Rain-35、MRH-55、SD15、LT-65、MWS-55、MT-25、DRain15的重要性由高到低依次為69.62%、14.08%、4.89%、4.34%、3.35%、2.02%、1.20%、0.50%。
設(shè)置lr為0.005、tc為6、抽樣比率(bf)為0.75、函數(shù)損失形式為“gaussian”,交叉驗(yàn)證折數(shù)為10次、n.trees為5 000,確定擬合最終的擬合模型,模型各預(yù)測(cè)變量的反應(yīng)曲線見圖4。
(1)平均相對(duì)濕度對(duì)小麥赤霉病發(fā)生風(fēng)險(xiǎn)的影響預(yù)測(cè)變量 MRH15對(duì)赤霉病發(fā)生風(fēng)險(xiǎn)的重要性最高,為69.62%。當(dāng)其小于46%時(shí),其變化對(duì)赤霉病發(fā)生的影響較?。划?dāng)其在46%—67%時(shí),隨其增加,赤霉病發(fā)生風(fēng)險(xiǎn)迅速上升;當(dāng)其高于67%時(shí),其對(duì)赤霉病發(fā)生的促進(jìn)作用趨于平穩(wěn)。預(yù)測(cè)變量MRH-55對(duì)赤霉病發(fā)生風(fēng)險(xiǎn)的重要性居第3位,為4.89%。其對(duì)赤霉病發(fā)生風(fēng)險(xiǎn)是非線性關(guān)系,當(dāng)其在35%—48%時(shí),其對(duì)赤霉病發(fā)生風(fēng)險(xiǎn)的作用效果為先升后降;當(dāng)其在48%—58%時(shí),隨其增加,赤霉病發(fā)生的風(fēng)險(xiǎn)迅速上升;當(dāng)其高于58%時(shí),其對(duì)赤霉病發(fā)生的促進(jìn)作用趨于平穩(wěn)。
(2)總降雨量對(duì)小麥赤霉病發(fā)生風(fēng)險(xiǎn)的影響 預(yù)測(cè)變量Rain-35對(duì)赤霉病發(fā)生風(fēng)險(xiǎn)的重要性居第2位,為14.08%。赤霉病的發(fā)生風(fēng)險(xiǎn)隨其增加而增加,當(dāng)其高于16 mm時(shí),其對(duì)赤霉病發(fā)生風(fēng)險(xiǎn)的促進(jìn)作用趨于平穩(wěn)。
(3)日照時(shí)數(shù)對(duì)小麥赤霉病發(fā)生風(fēng)險(xiǎn)的影響 預(yù)測(cè)變量SD15對(duì)赤霉病發(fā)生風(fēng)險(xiǎn)的重要性居第4位,為4.34%。模型顯示當(dāng)該時(shí)期日照時(shí)數(shù)在25—49 h時(shí),赤霉病發(fā)生風(fēng)險(xiǎn)迅速降低,當(dāng)其大于50 h時(shí),日照時(shí)數(shù)對(duì)赤霉病發(fā)生風(fēng)險(xiǎn)的抑制作用趨于平穩(wěn)。
根據(jù)增強(qiáng)回歸樹模型篩選的 4個(gè)重要的預(yù)測(cè)變量,即 MRH15、Rain-35、MRH-55、SD15,簡(jiǎn)化多元線性回歸模型(MLRⅡ):y=-19.45376+0.11689MRH15+0.17346Rain-35+0.04185SD15+0.26592MRH-55,該模型R2=0.7575,矯正 R2=0.7468,P<2.2×10-16。
以2008、2010、2012年“同年份多點(diǎn)”的部分地區(qū)歷史數(shù)據(jù)為測(cè)試集,對(duì)多元線性回歸模型、增強(qiáng)回歸樹模型預(yù)測(cè)結(jié)果進(jìn)行驗(yàn)證,觀測(cè)值與預(yù)測(cè)值對(duì)比發(fā)現(xiàn),預(yù)測(cè)結(jié)果與實(shí)際觀測(cè)值基本相符,但個(gè)別地區(qū)預(yù)測(cè)結(jié)果略有出入(圖5)。預(yù)測(cè)變量由8個(gè)簡(jiǎn)化為4個(gè)時(shí),多元線性回歸模型預(yù)測(cè)準(zhǔn)確度由 88.43%降至85.90%,增強(qiáng)回歸樹模型預(yù)測(cè)準(zhǔn)確度由 87.72%升至91.23%。
以2001—2016年“多年份定點(diǎn)”的正定、欒城兩地小麥赤霉病發(fā)生的歷史數(shù)據(jù)為測(cè)試集,對(duì)多元線性回歸模型、增強(qiáng)回歸樹模型的預(yù)測(cè)結(jié)果進(jìn)行驗(yàn)證,預(yù)測(cè)結(jié)果與實(shí)際觀測(cè)值曲線基本一致(圖6)。預(yù)測(cè)變量由8個(gè)簡(jiǎn)化為4個(gè)時(shí),兩個(gè)模型預(yù)測(cè)準(zhǔn)確度無顯著變化,多元線性回歸模型預(yù)測(cè)準(zhǔn)確度由87.53%變?yōu)?7.42%,增強(qiáng)回歸樹模型預(yù)測(cè)準(zhǔn)確度由89.20%變?yōu)?9.21%。
小麥赤霉病是典型的氣候性病害[1],其預(yù)測(cè)模型受品種抗性、氣象因素、田間菌源量等多因素影響,具有典型的地域特異性。GIROUX等評(píng)價(jià)了 9種不同模型在加拿大魁北克地區(qū)預(yù)測(cè)小麥赤霉病發(fā)生或DON毒素含量的效果,美國(guó)的兩個(gè)模型(DE WOLF等開發(fā)[9-10])和阿根廷的模型(MOSCHINI等開發(fā)[29-30])預(yù)測(cè)效果優(yōu)于其他模型[31],表明預(yù)測(cè)模型
應(yīng)用存在一定的地域特異性。SHAH等[12]利用增強(qiáng)回歸樹模型預(yù)測(cè)了嚴(yán)重度大于10%的小麥赤霉病發(fā)生概率,測(cè)試數(shù)據(jù)誤識(shí)率與 logistic回歸模型相比下降31%,但該模型未能準(zhǔn)確反映出病穗率和病害發(fā)生等級(jí);LANDSCHOOT等[32]基于比例優(yōu)勢(shì)模型,明確了比利時(shí)小麥赤霉病病情指數(shù)和 DON毒素含量的關(guān)鍵參數(shù)及參數(shù)值,并開發(fā)了web系統(tǒng),預(yù)測(cè)效果良好,但該系統(tǒng)無法在其他地區(qū)應(yīng)用;XU等[33]開發(fā)了基于logistic回歸的歐洲小麥赤霉病DON毒素含量預(yù)測(cè)模型,利用重采樣和全子集回歸分析表明,通過氣象因子預(yù)測(cè)DON毒素含量的“最佳”模型存在不唯一性;基于氣象因子的 DON毒素含量預(yù)測(cè)模型具有可移植性或可替代性,其通用性較差,預(yù)測(cè)結(jié)果易出現(xiàn)假陽性。本實(shí)驗(yàn)室前期研究[34]對(duì)安徽桐城小麥赤霉病預(yù)測(cè)模型中的氣象因子進(jìn)行了物候期數(shù)據(jù)的本地化修正,構(gòu)建了河北南部麥區(qū)小麥赤霉病預(yù)測(cè)模型,歷史數(shù)據(jù)
驗(yàn)證模型準(zhǔn)確度為70.00%,與安徽桐城市小麥赤霉病病穗率的預(yù)測(cè)結(jié)果相比,其準(zhǔn)確度相對(duì)較低。
本研究綜合借鑒本領(lǐng)域?qū)<业难芯拷?jīng)驗(yàn)[9,12,35-40],以小麥物候期的抽穗期初始日為起點(diǎn),每5 d編為一組,抽穗期初始日向前選擇編6組,向后選擇編2組,以各組內(nèi)最高溫度、最低溫度等9個(gè)氣象因子為自變量,赤霉病病穗率為因變量,通過逐步回歸分析,篩選出顯著的變量,得到最優(yōu)子集[41]。觀測(cè)樣本中異常值對(duì)預(yù)測(cè)結(jié)果產(chǎn)生影響,利用R語言car包中的outlierTest( )函數(shù)查找離群點(diǎn)、Cooke距離判斷強(qiáng)影響點(diǎn),通過消除預(yù)測(cè)數(shù)據(jù)集中的離群點(diǎn)和強(qiáng)影響點(diǎn),提升模型預(yù)測(cè)準(zhǔn)確度。同時(shí),通過對(duì)預(yù)測(cè)集正態(tài)性判斷、誤差獨(dú)立性判斷、線性判斷、同方差性判斷以及多元回歸模型綜合判斷,證實(shí)了氣象因子與病穗率的多元線性回歸假設(shè)。SHAH等[12]研究表明,增強(qiáng)回歸樹模型預(yù)測(cè)效果優(yōu)于logistic回歸模型;本研究以“同年份多點(diǎn)”和“多年份定點(diǎn)”歷史數(shù)據(jù)驗(yàn)證了多元線性回歸模型和增強(qiáng)回歸樹模型預(yù)測(cè)結(jié)果,當(dāng)預(yù)測(cè)變量由8個(gè)調(diào)減至4個(gè)時(shí),多元線性回歸模型預(yù)測(cè)準(zhǔn)確度呈下降趨勢(shì),而增強(qiáng)回歸樹模型預(yù)測(cè)準(zhǔn)確度呈上升趨勢(shì)。利用歷史數(shù)據(jù)驗(yàn)證模型預(yù)測(cè)效果時(shí),2008年阜城地區(qū)和 2010年曲周地區(qū)病穗率的預(yù)測(cè)值與實(shí)際觀測(cè)值偏差較大,其原因可能與本研究?jī)H選擇氣象因子有關(guān),赤霉病的發(fā)生與發(fā)展還與小麥品種抗性、田間管理措施等因素有關(guān)。在今后的研究中,還需進(jìn)一步考慮小麥品種抗性、田間菌源量等因素,以期進(jìn)一步提高預(yù)測(cè)準(zhǔn)確度。
研究構(gòu)建了基于增強(qiáng)回歸樹的海河平原小麥赤霉病病穗率預(yù)測(cè)模型,該模型含有4個(gè)預(yù)測(cè)變量。經(jīng)兩地16年歷史數(shù)據(jù)驗(yàn)證,模型預(yù)測(cè)準(zhǔn)確度為89.21%,病穗率預(yù)測(cè)值與實(shí)際觀測(cè)值的波動(dòng)趨勢(shì)基本一致。研究結(jié)果不僅為海河平原小麥赤霉病預(yù)測(cè)預(yù)報(bào)提供技術(shù)支撐,也為小麥赤霉病預(yù)測(cè)模型優(yōu)化和改進(jìn)提供了參考。