陳 偉,馬 蓉
(1.中船重工第七一八研究所,河北 邯鄲 056027;2.石河子大學(xué)機械電氣工程學(xué)院)
提高農(nóng)業(yè)生產(chǎn)效率的有效方法是根據(jù)農(nóng)田的空間差異性特征建立產(chǎn)量空間分布圖,進而對農(nóng)田實施變量作業(yè)管理[1]。作物產(chǎn)量信息是農(nóng)業(yè)生產(chǎn)效率高低最直接而又具體的反映,依據(jù)農(nóng)田作物產(chǎn)量數(shù)據(jù)來生成產(chǎn)量空間分布圖是實施精準(zhǔn)農(nóng)業(yè)的基礎(chǔ)[2],也是最終制定農(nóng)田管理和實施變量作業(yè),實現(xiàn)農(nóng)業(yè)生產(chǎn)節(jié)本增效、降低污染的基礎(chǔ)[3],所以在實施精準(zhǔn)農(nóng)業(yè)變量作業(yè)管理措施之前,采集農(nóng)田作物產(chǎn)量數(shù)據(jù),生成高精度的產(chǎn)量空間分布圖是非常重要的[4]。由于田間工作環(huán)境中的地塊不平整、灰塵多等多種復(fù)雜性因素的影響,以及操作者操作不規(guī)范等使得棉花產(chǎn)量數(shù)據(jù)中帶入誤差,而且在采棉機采收棉花的過程中,Insight棉花產(chǎn)量監(jiān)測系統(tǒng)只能進行標(biāo)定,而對其他設(shè)置不能更改,造成誤差帶入,從而使得Kriging插值成的棉花產(chǎn)量空間分布圖的精度降低,影響到精準(zhǔn)農(nóng)業(yè)變量作業(yè)管理實施的整體效果[5]。所以在Kriging插值生成棉花產(chǎn)量空間分布圖之前必須對產(chǎn)量數(shù)據(jù)誤差分析與處理。
2009年10月,基于采棉機在試驗區(qū)地塊內(nèi)進行棉花在線測產(chǎn)試驗。本試驗使用的Insight棉花產(chǎn)量監(jiān)測系統(tǒng)集成了DGPS、傳感器和微處理器等技術(shù)[6],它主要由Insight產(chǎn)量監(jiān)視器、行走速度傳感器、風(fēng)機轉(zhuǎn)速傳感器、采摘頭高度傳感器、棉花流量傳感器和DGPS等組成。Insight產(chǎn)量監(jiān)測系統(tǒng)每隔1 s記錄一個棉花產(chǎn)量數(shù)據(jù)點。本試驗中Insight棉花產(chǎn)量監(jiān)測系統(tǒng)安裝在美國John Deer 9970采棉機上,為獲取精度相對較高的原始產(chǎn)量數(shù)據(jù),必須對Insight棉花產(chǎn)量監(jiān)測系統(tǒng)進行GPS補償設(shè)置、各傳感器設(shè)置、采摘頭高度設(shè)置和標(biāo)定等,而標(biāo)定在整個棉花測產(chǎn)過程中是最為重要的[7]。標(biāo)定包括質(zhì)量標(biāo)定、行駛距離標(biāo)定、采摘頭停止高度標(biāo)定和面積標(biāo)定。各車次棉花產(chǎn)量的測量值與實際值間的相對誤差見表1。產(chǎn)量、距離和面積在標(biāo)定前后的相對誤差對比見表2。
表1 各車次棉花產(chǎn)量的測量值與實際值間的相對誤差
表2 產(chǎn)量、距離和面積在標(biāo)定前后的相對誤差(單位:%)
Insight棉花產(chǎn)量監(jiān)測系統(tǒng)采集到的棉花產(chǎn)量實時數(shù)據(jù)以.YLD格式存儲,須使用與Insight棉花產(chǎn)量監(jiān)測系統(tǒng)相配套的美國凱斯公司的專業(yè)軟件Advanced Farming Systems來讀取數(shù)據(jù),但AFS軟件并不能進行誤差處理。因此首先應(yīng)用AFS軟件將.YLD格式的棉花產(chǎn)量數(shù)據(jù)文件輸出轉(zhuǎn)換成shape格式的文件,進而運用統(tǒng)計學(xué)軟件ArcGIS對表達棉花產(chǎn)量數(shù)據(jù)空間位置的大地坐標(biāo)系轉(zhuǎn)換為二維的可直接進行距離和面積計算的UTM WGS84平面直角坐標(biāo)系,從而為棉花產(chǎn)量數(shù)據(jù)的誤差處理做好準(zhǔn)備。
在棉花產(chǎn)量實時自動測產(chǎn)過程中,會受到使用的儀器、設(shè)備情況、所處的自然環(huán)境條件以及人員操作的規(guī)范等多種因素的影響,使測產(chǎn)結(jié)果產(chǎn)生誤差[8]。根據(jù)誤差的性質(zhì)和特點,可將棉花產(chǎn)量數(shù)據(jù)誤差分為系統(tǒng)誤差、粗大誤差和隨機誤差[9~10]。
系統(tǒng)誤差由按一定周期規(guī)律變化的因素造成[11]。消除系統(tǒng)誤差最有效的方法是消除產(chǎn)生系統(tǒng)誤差的來源。在采棉機收獲棉花的過程中,Insight棉花產(chǎn)量監(jiān)測系統(tǒng)雖然完成了正確的安裝和調(diào)試,而且經(jīng)過了多次標(biāo)定來減少誤差的帶入,但由于田間地塊不平整等相關(guān)因素的影響,使得采棉機在作業(yè)過程中輪胎經(jīng)常打滑,從而造成行走速度傳感器測得的車速偏高,形成系統(tǒng)誤差。為減少系統(tǒng)誤差的帶入,可以剔除采棉機作業(yè)平均速度±2倍標(biāo)準(zhǔn)差范圍外的速度數(shù)據(jù)點。
產(chǎn)量數(shù)據(jù)中粗大誤差的帶入往往源自于人員操作不規(guī)范,造成數(shù)據(jù)出現(xiàn)異常值,而棉花產(chǎn)量數(shù)據(jù)的采集是實時在線的,無法進行再來一次的測量,所以可以根據(jù)棉田管理情況和種植經(jīng)驗等來剔除異常值。在采集的棉花產(chǎn)量數(shù)據(jù)中有小部分的產(chǎn)量值特別高,也有小部分的產(chǎn)量值特別低,而絕大部分?jǐn)?shù)據(jù)點的產(chǎn)量值都在5.2 t/hm2左右。由于整個試驗地塊區(qū)域內(nèi)采取的管理方式是一樣的,所以棉花產(chǎn)量值相差不大。依據(jù)種植情況、經(jīng)驗等將棉花產(chǎn)量數(shù)據(jù)處于1.5~7.4 t/hm2之間的歸為正常值,而剔除掉不在此范圍內(nèi)的異常值。
隨機誤差的產(chǎn)生因素十分復(fù)雜,如果棉花產(chǎn)量數(shù)據(jù)中沒有系統(tǒng)誤差和粗大誤差,則包含有隨機誤差的數(shù)據(jù)一般服從正態(tài)分布。下圖為5號地棉花產(chǎn)量數(shù)據(jù)的正態(tài)QQPlot圖,它接近一條直線,表明該數(shù)據(jù)服從正態(tài)分布,也進一步說明剔除掉異常值,有效減少了系統(tǒng)誤差和粗大誤差。由于隨機誤差是不能避免產(chǎn)生的,所以采棉機采收棉花的過程中,可適當(dāng)?shù)卦黾訕?biāo)定的次數(shù)、規(guī)范人員操作方法等手段來降低隨機誤差和系統(tǒng)誤差。
圖1 5號地數(shù)據(jù)的QQPlot圖
處理棉花產(chǎn)量數(shù)據(jù)點的異常值的方法有許多,一是可以直接剔除掉異常值,二是可以用總體數(shù)據(jù)的平均值來替代異常值,三是可以用正常值中的最大值來代替異常值等[12]。因為Insight棉花產(chǎn)量監(jiān)測系統(tǒng)每秒鐘采集一個數(shù)據(jù)點,所以數(shù)據(jù)點很龐大,而剔除掉一些點對整個試驗田塊內(nèi)的棉花產(chǎn)量空間分布情況影響不大,所以可以運用直接剔除異常值的方法。
運用閾值過濾直接剔除異常點的方法。依據(jù)種植情況、經(jīng)驗等將棉花產(chǎn)量數(shù)據(jù)處于1.5~7.4 t/hm2之間的歸為正常值,而剔除掉不在此范圍內(nèi)的異常值。針對采棉機作業(yè)過程中輪胎經(jīng)常打滑的現(xiàn)象,剔除掉不在采棉機作業(yè)平均速度±2倍標(biāo)準(zhǔn)差范圍內(nèi)的速度異常數(shù)據(jù)點。
表3為試驗地內(nèi)的棉花產(chǎn)量數(shù)據(jù)誤差處理前后的描述性統(tǒng)計結(jié)果對比。從表中可以看到,經(jīng)過誤差處理,剔除掉棉花產(chǎn)量數(shù)據(jù)點異常值后,偏度增大并靠近于零,棉花產(chǎn)量數(shù)據(jù)趨向于正態(tài)分布。經(jīng)誤差處理后,棉花產(chǎn)量數(shù)據(jù)變異系數(shù)CV(%)為19.61%,較處理前的25.18%僅減小了0.0557,這表明,經(jīng)過誤差處理剔除掉數(shù)據(jù)點異常值后,余下的棉花產(chǎn)量數(shù)據(jù)不僅保留了原有的產(chǎn)量變異,而且表明試驗區(qū)地塊內(nèi)的棉花產(chǎn)量數(shù)據(jù)在空間變異性特征處于中等水平,符合劃分精準(zhǔn)農(nóng)業(yè)管理分區(qū)的條件和指導(dǎo)變量作業(yè)的要求。
對試驗地內(nèi)的棉花產(chǎn)量數(shù)據(jù),在誤差處理前后,分別運用地統(tǒng)計學(xué)軟件ArcGIS,進行Kriging插值。通過對比兩棉花產(chǎn)量空間分布圖可以看到,經(jīng)過誤差處理后的空間分布圖中的異常值數(shù)據(jù)點大幅度地減少,而且空間分布圖的精度、聚類性和平滑性得到了比較明顯的提升。
表3 棉花產(chǎn)量的描述性統(tǒng)計分析
為了提高經(jīng)過Kriging插值成的棉花產(chǎn)量空間分布圖的精度,必須對棉花產(chǎn)量數(shù)據(jù)中的誤差進行細致而深入的分析,找出產(chǎn)生各種誤差的原因,從而采取有效的措施和方法來減少、甚至剔除誤差。本研究以采集的棉花產(chǎn)量實時數(shù)據(jù)為基礎(chǔ),分析了產(chǎn)量數(shù)據(jù)中包含的系統(tǒng)誤差,粗大誤差和隨機誤差,設(shè)計的閾值過濾器對棉花產(chǎn)量實時數(shù)據(jù)進行了誤差處理。依據(jù)種植情況、經(jīng)驗等將棉花產(chǎn)量數(shù)據(jù)點處于1.5~7.4 t/hm2之間的視為正常值,而剔除掉不在此范圍內(nèi)的異常值數(shù)據(jù)點;另一方面針對采棉機作業(yè)過程中輪胎經(jīng)常打滑的現(xiàn)象,剔除掉不在采棉機作業(yè)平均速度±2倍標(biāo)準(zhǔn)差范圍內(nèi)的速度異常數(shù)據(jù)點。結(jié)果表明,經(jīng)過誤差處理后的棉花產(chǎn)量數(shù)據(jù)趨于正態(tài)分布,不僅保留了原有實際產(chǎn)量數(shù)據(jù)的變異性,而且試驗區(qū)地塊內(nèi)的棉花產(chǎn)量數(shù)據(jù)的空間變異性特征處于中等水平,符合劃分精準(zhǔn)農(nóng)業(yè)管理分區(qū)的條件和指導(dǎo)變量作業(yè)的要求。本研究還比較了誤差處理前后建立的棉花產(chǎn)量空間分布圖,發(fā)現(xiàn)經(jīng)誤差處理后Kriging插值成的棉花產(chǎn)量空間分布圖中的異常點顯著減少,分布圖的精度、聚類性和平滑性得到了顯著提升。
[1]王長耀,牛錚,唐華俊等.對地觀測技術(shù)與精細農(nóng)業(yè)[M].北京:中國科學(xué)出版社,2001.
[2]薛正平,鄧 華,楊星衛(wèi)等.基于決策樹和圖層疊置的精準(zhǔn)農(nóng)業(yè)產(chǎn)量圖分析方法[J].農(nóng)業(yè)工程學(xué)報,2006,22(8):140~144.
[3]Panneton1B,Brouillard1M,PiekurowskiT.Integration of yield data from several years into1a1single1map[R].Montpellier,France:Proceedingof the 3rd European Conference on Precision Agriculture,2001.
[4]Missotten B,Strubble G,Baerdemaeker J.Accuracy of grain and straw yield mapping[R].Minnesota:Proceeding of the 3rd international conference on precision agriculture,1996.
[5]Lark R M,Stafford J V.Consistency and change in spatial variability of crop yield over successive seasons,methods of data analysis.In Robert P C,Rust R H,Larson WE(eds)3rd international conference on precision agriculture.ASA,CSS A,SSSA&ASAE,Madison,Wisconsin,USA.1996,141~150.
[6]陳偉,馬蓉,盧帥等.機采棉在線測產(chǎn)技術(shù)及其關(guān)鍵裝備[J].農(nóng)機化研究,2011,10:216~219.
[7]陳偉,馬蓉,盧帥等.Insight棉花產(chǎn)量監(jiān)測系統(tǒng)及應(yīng)用研究[J].安徽農(nóng)業(yè)科學(xué),2010,38(30):17208~17210.
[8]http://baike.baidu.com/view/40051.htm.
[9]梁晉文,陳林才,何貢.誤差理論與數(shù)據(jù)處理[M].中國計盈出版社,2006.
[10]賈沛璋.誤差分析與數(shù)據(jù)處理[M].北京:國防工業(yè)出版社,2002.
[11]費業(yè)泰.誤差理論與數(shù)據(jù)處理[M].北京:機械工業(yè)出版社,1995.
[12]施斌,王寶軍,周國云.環(huán)境地質(zhì)學(xué)中的GIS[M].北京:科學(xué)出版社,2006.