聶臣巍
摘要 [目的]在地理信息系統(tǒng)GIS的平臺(tái)上,將不確定性推理方法——貝葉斯網(wǎng)絡(luò)引入病害預(yù)測(cè),基于關(guān)鍵氣象因子(溫度、降水、濕度、日照)構(gòu)建一個(gè)用于預(yù)測(cè)小麥條銹病發(fā)生概率的貝葉斯網(wǎng)絡(luò)模型。[方法]采用預(yù)測(cè)日前7 d的氣象數(shù)據(jù)預(yù)測(cè)自預(yù)測(cè)日起7 d內(nèi)的條銹病發(fā)病概率,并對(duì)我國(guó)小麥條銹病重要流行區(qū)域——甘肅省東南部地區(qū)2010~2012年病害發(fā)生情況進(jìn)行預(yù)測(cè)。[結(jié)果]模型在返青期至乳熟期輸出的病害發(fā)生概率與實(shí)際調(diào)查結(jié)果吻合度分別為62.92%、63.18%、79.48%、94.75%,能夠較客觀地反映病害發(fā)生的時(shí)間規(guī)律和空間分布特點(diǎn)。[結(jié)論]該研究表明將貝葉斯網(wǎng)絡(luò)和GIS分析結(jié)合在較大的空間范圍內(nèi)利用關(guān)鍵氣象因子進(jìn)行小麥條銹病短期預(yù)測(cè)是一種可行的途徑。
關(guān)鍵詞 小麥條銹??;氣象因子;貝葉斯網(wǎng)絡(luò);預(yù)測(cè)模型
中圖分類號(hào) S126 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 0517-6611(2014)16-05027-04
小麥條銹病由Puccnia striiformis Westend f.sp.tritici Eriks引起,是小麥生產(chǎn)中一種重要的流行性病害。該病可在全球范圍內(nèi)造成小麥大幅減產(chǎn)[1-2]。在我國(guó),2002年小麥條銹病的全國(guó)性大流行造成超過(guò)670萬(wàn)hm2農(nóng)田感染,直接導(dǎo)致約10億kg的產(chǎn)量損失[3]。由于該病能夠在早期通過(guò)噴藥等措施控制,因此,如何在早期對(duì)小麥條銹病的發(fā)生進(jìn)行有效預(yù)測(cè),一直以來(lái)受到農(nóng)業(yè)植保部門的高度重視。目前,國(guó)內(nèi)外學(xué)者基于氣象、農(nóng)學(xué)數(shù)據(jù)開(kāi)展了一系列關(guān)于小麥條銹病預(yù)測(cè)方法的研究。陳剛等利用判別分析方法對(duì)四川馬爾康和甘肅天水兩地的小麥條銹病進(jìn)行預(yù)測(cè),回帶準(zhǔn)確率和交叉驗(yàn)證準(zhǔn)確率均在78%以上[2];胡小平等用BP神經(jīng)網(wǎng)絡(luò)對(duì)漢中地區(qū)小麥條銹病進(jìn)行預(yù)測(cè),結(jié)果與病害實(shí)際發(fā)生情況高度吻合[4];劉榮英等以甘肅天水地區(qū)小麥條銹病歷史數(shù)據(jù)為基礎(chǔ),進(jìn)行基于GM(1,1)組合模型的小麥條銹病預(yù)測(cè)方法研究,正確率達(dá)到94.5%[5];袁磊等琴提出了一種基于小波變換和神經(jīng)網(wǎng)絡(luò)相結(jié)合的小麥條銹病預(yù)測(cè)模型,并以漢中地區(qū)1974年到1994年小麥條銹病發(fā)生流行數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),預(yù)測(cè)1995~1997年小麥條銹病發(fā)生情況,結(jié)果與實(shí)際流行程度高度吻合[6];許彥平等采用統(tǒng)計(jì)原理,結(jié)合甘肅省天水地區(qū)的小麥條銹病相關(guān)數(shù)據(jù)和氣象數(shù)據(jù),進(jìn)行冬小麥條銹病發(fā)生發(fā)展規(guī)律的研究,建立冬小麥條銹病預(yù)測(cè)數(shù)學(xué)模型[7]等。上述研究構(gòu)建的小麥條銹病預(yù)測(cè)模型在局地條件下均可取得較高的精度,能夠?yàn)樘囟▍^(qū)域內(nèi)的病害預(yù)警提供重要信息。但注意到上述模型均是針對(duì)某一地區(qū)的整個(gè)小麥生長(zhǎng)季發(fā)病程度進(jìn)行預(yù)測(cè),且研究區(qū)域?yàn)闂l銹病菌源地,模型的標(biāo)定往往根據(jù)局地氣象和菌量數(shù)據(jù),具有較強(qiáng)的區(qū)域?qū)R恍?,缺乏?duì)較大時(shí)空范圍的病害預(yù)測(cè)能力??紤]到該病的發(fā)生和流行涉及地域范圍較廣,且為多循環(huán)病害[8-9],亟需構(gòu)建針對(duì)大區(qū)域、連續(xù)時(shí)相的病害預(yù)測(cè)模型,而目前關(guān)于這方面的研究罕有報(bào)道。
小麥條銹病的發(fā)生從環(huán)境條件上看,主要受溫度、濕度、降水、日照等一些氣象因素的影響和決定[2]。如何在具有一定空間廣度和時(shí)間幅度的區(qū)域中,建立上述因子與病害發(fā)生概率間的關(guān)系,是構(gòu)建小麥條銹病預(yù)測(cè)模型的關(guān)鍵性問(wèn)題。貝葉斯網(wǎng)絡(luò)是建立在概率統(tǒng)計(jì)理論基礎(chǔ)上的一種概率圖論模型,具有嚴(yán)密的推理過(guò)程、清晰的語(yǔ)義表達(dá)和數(shù)據(jù)學(xué)習(xí)能力等特點(diǎn),可以通過(guò)一些變量的信息來(lái)獲取其他變量的概率信息,是不確定性推理和數(shù)據(jù)分析的一種有效工具[10],自20世紀(jì)80年代以來(lái)已在專家系統(tǒng)、數(shù)據(jù)挖掘、模式識(shí)別、圖像處理、人工智能等眾多領(lǐng)域得到了廣泛的應(yīng)用[11]。為此,筆者嘗試將貝葉斯網(wǎng)絡(luò)方法引入到小麥條銹病的預(yù)測(cè)建模,選擇我國(guó)小麥條銹病的重要病源地——甘肅省東南部地區(qū)為研究區(qū),通過(guò)分析2010~2012年連續(xù)3年的小麥條銹病測(cè)報(bào)數(shù)據(jù)及同期氣象數(shù)據(jù),構(gòu)建基于氣象參數(shù)的條銹病發(fā)生概率預(yù)測(cè)模型,使用預(yù)測(cè)日前7 d的氣象參數(shù)預(yù)測(cè)自預(yù)測(cè)日起7 d內(nèi)條銹病發(fā)生概率。
1 數(shù)據(jù)獲取及處理
1.1 氣象數(shù)據(jù) 選用與小麥條銹病的發(fā)生關(guān)聯(lián)較強(qiáng),且較易獲得的平均溫度、平均相對(duì)濕度、降水量和日照時(shí)數(shù)等氣象因子作為病害預(yù)測(cè)建模的輸入變量。從中國(guó)氣象局獲取甘肅省研究區(qū)及其周邊的57個(gè)氣象站點(diǎn)(圖1)2010~2012年小麥返青期至乳熟期的逐日數(shù)據(jù),數(shù)據(jù)跨度從發(fā)病前2周至小麥成熟。數(shù)據(jù)處理包括異常值去除,周平均值計(jì)算和空間插值。對(duì)去除異常值的氣象數(shù)據(jù),以周為單位計(jì)算各參數(shù)平均值。將氣象站點(diǎn)數(shù)據(jù)以30 m×30 m分辨率進(jìn)行插值處理。考慮到某些氣象參數(shù)和海拔間存在較強(qiáng)關(guān)系,可通過(guò)對(duì)海拔擬合殘差插值的方法提高插值精度[12-13]。為此,該研究對(duì)于與海拔間決定系數(shù)(R2)高于0.6的氣象因子采用上述方法進(jìn)行修正。插值方法方面,采用Kolmogorov-Smirnov方法對(duì)氣象站點(diǎn)數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn),對(duì)于P-value>0.05即符合高斯分布的樣本采用kriging插值,對(duì)于不符合高斯分布的數(shù)據(jù)采用反距離權(quán)重(Inverse Distance Weighted)插值。
1.2 小麥條銹病測(cè)報(bào)數(shù)據(jù) 該研究中小麥條銹病測(cè)報(bào)數(shù)據(jù)由甘肅省植??傉咎峁?,數(shù)據(jù)年份從2010年至2012年共3年數(shù)據(jù),測(cè)報(bào)點(diǎn)數(shù)量分別為:45、18、47,空間分布如圖1所示(以2010年為例)。測(cè)報(bào)時(shí)間范圍為2010年3月1日~2010年7月4日,2011年3月7日~2011年7月3日,2012年3月19日~2012年7月1日。各點(diǎn)測(cè)報(bào)時(shí)間間隔為7 d,測(cè)報(bào)內(nèi)容包括測(cè)報(bào)點(diǎn)經(jīng)緯度、條銹病始見(jiàn)期等。該研究將各測(cè)報(bào)點(diǎn)病害發(fā)生數(shù)據(jù)按時(shí)序進(jìn)行整理,其中,將每年份各生育數(shù)據(jù)隨機(jī)分為訓(xùn)練數(shù)據(jù)(60%)和驗(yàn)證數(shù)據(jù)(40%)。
2 貝葉斯網(wǎng)絡(luò)方法
貝葉斯網(wǎng)絡(luò)是一個(gè)有向無(wú)環(huán)圖,是一種建立在概率統(tǒng)計(jì)理論基礎(chǔ)上的概率圖論模型,具有嚴(yán)密的推理過(guò)程、清晰的語(yǔ)義表達(dá)和數(shù)據(jù)學(xué)習(xí)能力等特點(diǎn),可以通過(guò)一些變量的信息來(lái)獲取其他變量的概率信息,是不確定性推理和數(shù)據(jù)分析的一種有效工具。
該研究構(gòu)建小麥條銹病預(yù)測(cè)貝葉斯網(wǎng)絡(luò)參考Cooke(2006)的研究結(jié)論[8],選擇與小麥條銹病發(fā)生和流行關(guān)系較大的溫度(Temperature,T)、濕度(Humidity, H)、降水(Precipitation,P)和日照時(shí)數(shù)(Sunshine Duration,S)等氣象因子作為節(jié)點(diǎn)變量。此外,考慮到小麥條銹病發(fā)展與生育進(jìn)程間存在較密切的關(guān)系,將小麥生育期(G)也作為一個(gè)變量。在網(wǎng)絡(luò)結(jié)構(gòu)上,貝葉斯網(wǎng)絡(luò)通過(guò)在不同節(jié)點(diǎn)(因子/預(yù)測(cè)概率)間連邊的方式描述不同因子間的相互聯(lián)系以及因子和預(yù)測(cè)概率間的關(guān)系[14]。該研究中,考慮到T、H、P、S、G因素對(duì)小麥條銹病發(fā)生存在直接聯(lián)系,因而在5個(gè)因素與小麥條銹病發(fā)生概率(W)間建立關(guān)聯(lián)(即在網(wǎng)絡(luò)中連邊)。此外,考慮到降水事件對(duì)濕度和日照時(shí)數(shù)的間接影響,在P和H、S因素間建立關(guān)聯(lián)。最終形成的用于預(yù)測(cè)小麥條銹病發(fā)生概率的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。其中,w表示小麥感染條銹病的狀況,分為感染(w1)與未感染(w0)2種情況,生育期(G)根據(jù)甘肅省研究區(qū)域內(nèi)的小麥物候分為返青(g1)、拔節(jié)(g2)、抽穗(g3)、乳熟(g4)4個(gè)時(shí)期。H、P、S、T的分級(jí)如表2所示。de Vallavieille-Pope等的研究表明,當(dāng)溫度在5~25 ℃范圍內(nèi)時(shí),小麥條銹病的感染效率等于或高于23%,當(dāng)溫度超過(guò)30 ℃時(shí)不發(fā)生感染[15],Newton等的研究表明溫度低于0 ℃時(shí)病菌不能產(chǎn)生孢子[16]。因此,筆者將0~25 ℃范圍內(nèi)的溫度等間隔分成5級(jí),小于0 ℃的為一級(jí)。降水、日照、相對(duì)濕度按照數(shù)據(jù)分布及病害作用規(guī)律分為6級(jí),具體各參量值域范圍如表1所示。
為獲得某因子對(duì)應(yīng)的先驗(yàn)概率值,首先根據(jù)2010~2012年訓(xùn)練數(shù)據(jù)建立各參數(shù)的概率表。參考測(cè)報(bào)數(shù)據(jù)以7 d為步長(zhǎng)進(jìn)行病害預(yù)測(cè),根據(jù)第i時(shí)相的氣象條件和生育期對(duì)應(yīng)的發(fā)病先驗(yàn)概率計(jì)算第i+1時(shí)相的小麥條銹病發(fā)生的后驗(yàn)概率。在計(jì)算中為避免零頻率出現(xiàn)時(shí)導(dǎo)致的極端值,采用Laplace估計(jì)計(jì)算各節(jié)點(diǎn)的概率分布[17],計(jì)算公式如下:
其中,n為訓(xùn)練實(shí)例個(gè)數(shù),nw為類的取值個(gè)數(shù),nj為第j個(gè)屬性的取值個(gè)數(shù),wi為第i個(gè)訓(xùn)練實(shí)例的類別標(biāo)記,aj為影響因子的第j個(gè)屬性值,aij為i訓(xùn)練實(shí)例的第j個(gè)屬性值δ(wi,w)是一個(gè)二值函數(shù),當(dāng)wi=w時(shí)為1,否則為0。
3 結(jié)果與分析
在空間上,通過(guò)觀察2010~2012年研究區(qū)小麥條銹病的擴(kuò)散過(guò)程,發(fā)現(xiàn)該地區(qū)病害的發(fā)生和傳播具有較強(qiáng)的規(guī)律性,每年返青期始見(jiàn)于甘肅南部地區(qū),隨后向北擴(kuò)散。此外,在甘肅省東北地區(qū)稍晚亦出現(xiàn)自發(fā)性的條銹病感染區(qū)域,并向西傳播。由于研究區(qū)菌源充足,通常經(jīng)過(guò)一段時(shí)間的擴(kuò)散,在6月初條銹病會(huì)侵染研究區(qū)的大部分地區(qū)。這種空間傳播過(guò)程由于強(qiáng)烈受到氣象條件的影響,因此能夠被該研究中提出的模型較好地預(yù)測(cè)(圖3,以2010年為例)。通過(guò)反復(fù)試驗(yàn)和經(jīng)驗(yàn)判斷確定0.4為概率閾值,判定概率低于0.4的樣本不發(fā)生條銹病,反之則判定發(fā)生病害。結(jié)果表明(表2),預(yù)測(cè)準(zhǔn)確率在返青期、拔節(jié)期、抽穗期、乳熟期分別為:62.92%、63.18%、79.48%、94.75%,隨生育期的推進(jìn)預(yù)測(cè)準(zhǔn)確率逐漸升高。