吐爾遜·買買提,丁為民,Muhammad Hassan
(1.南京農(nóng)業(yè)大學工學院,江蘇南京 210031.2.新疆農(nóng)業(yè)大學機械交通學院,烏魯木齊 830052)
農(nóng)業(yè)機械作為實現(xiàn)現(xiàn)代農(nóng)業(yè)的主要工具,其總動力已成為衡量區(qū)域農(nóng)業(yè)機械化發(fā)展水平的主要指標。農(nóng)機總動力發(fā)展過程中受到區(qū)域經(jīng)濟水平、自然地理環(huán)境、農(nóng)業(yè)生產(chǎn)結構、社會發(fā)展水平和人口等多個因素的影響,并呈現(xiàn)出非線性和非平穩(wěn)性特點。因此研究農(nóng)機總動力趨勢及影響因素有重要意義[1]。
劉玉梅等[2]利用計量經(jīng)濟模型,分析了收入水平對農(nóng)戶農(nóng)機裝備水平的影響。楊敏麗等[3]利用三元logistic 模型對農(nóng)業(yè)機械總動力進行預測,并影響因素進行分析。軒俊偉等[4]應用空間分析法和地理加權回歸模型對新疆縣域農(nóng)機總動力聚集和影響因素進行分析,獲得了農(nóng)機總動力空間維度上的異質(zhì)性特點,同時挖掘出新疆不同區(qū)域農(nóng)機總動力主要影響因素。許淑芹[5]基于飽和關聯(lián)維數(shù)法和灰色關聯(lián)分析對江蘇省農(nóng)機總動力14個影響因素的重要度進行測度,并獲得主要的8個影響因素,并依據(jù)此結果提出了相關農(nóng)機化發(fā)展建議。何政道等[6]應用自相關時間序列回歸分析法,揭示了對農(nóng)機總動力影響較大的農(nóng)村剩余勞動力轉(zhuǎn)移率等6個主要因素。吳科樑等[7]應用回歸分析法對廣東省農(nóng)機總動力進行預測,并對影響因素進行定量和定性分析。崔紅艷等[8]運用多元線性回歸模型對吉林省25年農(nóng)機總動力進行分析,應用每個因素分別降低1%、其余變量不變的情況下對農(nóng)機總動力變化的影響,將各影響因素對農(nóng)機總動力的影響進行量化。程準等[9]運用多元回歸分析法對農(nóng)業(yè)增加值和農(nóng)村居民家庭人均純收與農(nóng)機總動力之間的關系進行量化。此外,還有學者分析了播種面積頃均農(nóng)機動力對區(qū)域農(nóng)業(yè)機械化發(fā)展水平、糧食產(chǎn)量以及農(nóng)業(yè)經(jīng)濟的影響[10-11]。
分析以上文獻發(fā)現(xiàn),目前在農(nóng)機總動力方面的研究還有一定的改進余地:(1)研究內(nèi)容上主要聚集在農(nóng)機總動力發(fā)展趨勢預測和農(nóng)機總動力影響因素分析方面。而頃均農(nóng)機總動力的影響因素方面的研究尚未見報道;(2)研究方法方面,以往的研究中,主要應用主觀分析、統(tǒng)計分析和一些組合分析等方法。
文章應用神經(jīng)網(wǎng)絡在模式發(fā)現(xiàn)以及知識挖掘方面優(yōu)勢,首先基于嵌入式灰色神經(jīng)網(wǎng)絡和MIV方法實現(xiàn)了影響因素量化模型;然后應用該模型定量分析了頃均農(nóng)業(yè)機械總動力影響因素;最后結合實例,分析了模型性能,同時對新疆頃均總動力的影響因素進行定量分析。
該文結合文獻[1-11]提出的方法和專家咨詢建立了由頃均農(nóng)業(yè)機械總動力(W/hm2)[農(nóng)機總動力(W)/耕地面積](Y)、耕地均頃GDP(元/hm2)[地區(qū)生產(chǎn)總值(元)/地區(qū)耕地面積](F1)、農(nóng)民人均純收入(元/人)(F2)、機械化農(nóng)具定基價格指數(shù)(MIP)(%)(F3)、農(nóng)村勞動力轉(zhuǎn)移率(%)[(鄉(xiāng)村從業(yè)人員-農(nóng)業(yè)從業(yè)人員)/鄉(xiāng)村從業(yè)人員](F4)、農(nóng)業(yè)比較勞動生產(chǎn)率(%)[第一產(chǎn)業(yè)增加值/GDP)/(農(nóng)業(yè)勞動力/全部勞動力,即農(nóng)業(yè)增加值在地區(qū)GDP的比重與農(nóng)業(yè)勞動力在全部勞動力的比重的比率)](F5)、農(nóng)民人均受教育程度(年/人)[文盲半文盲比例×1+小學比例×6+初中比例×9+高中比例×12+中專比例×12+大專以上比例×15.5](F6)、勞均土地面積(hm2/人)[耕地面積/農(nóng)業(yè)勞動力](F7)、最大種植面積農(nóng)作物比重(%)[糧食種植面積/農(nóng)作物總播種面積](F8)等9個指標組成的頃均總動力及影響因素指標體系。
1.2.1 神經(jīng)網(wǎng)絡模型選擇
時間序列發(fā)展趨勢研究表明,組合預測方法和單一模型預測相比,在有效提取序列的變化趨勢、所含的信息量和預測精度方面有較好的優(yōu)勢[12]。理論上可以證明組合預測模型屬于非劣性模型,即任何由多個單一模型組成的組合預測模型的預測結果優(yōu)于其包含的單一模型。
灰色理論與神經(jīng)網(wǎng)絡構成灰色神經(jīng)網(wǎng)絡(Grey neural network,GNN),根據(jù)組合的方式和結構,目前可以將灰色神經(jīng)網(wǎng)絡分成串行灰色神經(jīng)網(wǎng)絡(Series grey neural network,SGNN),并行灰色神經(jīng)網(wǎng)絡(parallel grey neural network,PGNN)、嵌入性灰色神經(jīng)網(wǎng)絡(Embed grey neural network,EGNN)[13]等3種類型。
SGNN中,灰色模型的結果作為神經(jīng)網(wǎng)絡輸入,從而構成串行結構。PGNN中,除了單一模型精度外,權重也是影響模型精度的重要因素。在組合預測方法中有算數(shù)平均組合、幾何平均組合和調(diào)和平均組合等方法。具體見下面公式。
(1)
(2)
(3)
式(1)~(3)中,n為樣本容量大小,k為各預測模型權重。
每一種灰色神經(jīng)網(wǎng)絡有其特點及側重點,具體使用需要根據(jù)研究對象的特征、各子模型的特點、預測序列的趨勢靈活選擇。EGNN中,首先在神經(jīng)網(wǎng)絡的輸入層對輸入樣本進行灰化,實踐中根據(jù)樣本序列的隨機特性強度選擇1次或多次累加,從而弱化序列的隨機特征,使得神經(jīng)網(wǎng)絡激勵函數(shù)能夠更好的識別其非線性特征。經(jīng)神經(jīng)網(wǎng)絡處理后在輸出層對輸出數(shù)據(jù)白化,還原輸出結果。其結構見圖1。
圖1 嵌入性灰色神經(jīng)網(wǎng)絡
綜合比較以上3種方法可以發(fā)現(xiàn),SGNN因其結構簡單,單一模型之間的融合程度不高,適合預測變化趨勢比較單一、波動幅度不大的時間序列,但對復雜的隨機時間序列,預測性能較差。PGNN雖然一定程度上優(yōu)于SGNN,但因需要額外增加權重計算模塊,故很容易受到權重計算算法的影響,增加算法的復雜度。EGNN方法在輸入神經(jīng)元和輸出神經(jīng)元部分引入灰色模型方法,并有效地把灰色模型和BPNN相互嵌入,使得BPNN的擬合復雜曲線函數(shù)的特征和灰色模型的弱化序列的隨機特性得以有效應用,從而構成了嵌入式組合預測神經(jīng)網(wǎng)絡。該文依據(jù)上述分析選取EGNN模型。
1.2.2 基于神經(jīng)網(wǎng)絡的MIV計算過程
平均影響值(Mean impact value,MIV)是由Dombi等提出。在神經(jīng)網(wǎng)絡中用于定量分析輸入神經(jīng)元對輸出神經(jīng)元的影響,MIV絕對值大小代表影響的相對重要性,符號代表其影響方向[14]。基于神經(jīng)網(wǎng)絡的MIV計算過程如下。
(1)將樣本集D分為M×N的訓練集矩陣S和Mt×Nt測試集矩陣T,其中M和Mt分別為訓練樣本和測試樣本的個數(shù),N和Nt分別為訓練集和測試集列數(shù)。確定訓練集矩陣S的自變量個數(shù)(即輸入神經(jīng)元)和因變量個數(shù)(即輸出神經(jīng)元)。
(2)初始化網(wǎng)絡參數(shù),在訓練集S中訓練網(wǎng)絡,并結合網(wǎng)絡在測試集T中的預測精度不斷的優(yōu)化網(wǎng)絡參數(shù),從而確定最終神經(jīng)網(wǎng)絡NNET,將由樣本集D中所有自變量組成矩陣M。
(3)將自變量矩陣M的某一列值分別加減10%構成兩個新的矩陣M1和M2,再將M1、M2分別作為新的仿真輸入集,輸入到建好的神經(jīng)網(wǎng)絡NNET,并得出網(wǎng)絡輸出向量V1和V2。
(4)計算輸出向量V1和V2之差,獲得向量V,其值能反映每個樣本的當前自變量(輸入神經(jīng)元)對因變量(輸出神經(jīng)元)的影響程度,即Impact value。
(5)求向量V的均值,得出當前自變量對因變量即神經(jīng)網(wǎng)絡輸出的MIV。
(6)重復步驟(3)~(5),分別計算剩余自變量的MIV,最后排序所有自變量MIV,得出各個自變量(輸入神經(jīng)元)對因變量(輸出神經(jīng)元)影響程度以及相對重要性的位次表,從而判斷眾多輸入中對網(wǎng)絡影響最大的輸入以及影響程度,同時也可以進行變量篩選。
從MIV方法和步驟中可以看出,應用MIV測度輸入向量對輸出向量(該文中輸入向量為F1~F8,Y為輸出向量)的影響程度時,具體神經(jīng)網(wǎng)絡算法的選取和數(shù)據(jù)集的劃分(即訓練集和測試集的劃分規(guī)則)對MIV方法的最終結果影響較大??紤]到該文中數(shù)據(jù)樣本較少,在建立EGNN模型時應用前23個樣本為訓練集,后2個樣本為測試集。
該文中將EGNN嵌入式灰色神經(jīng)網(wǎng)絡作為基本模型,將在其輸入和輸出端增加輸入神經(jīng)元值變化(即輸入神經(jīng)元±10%)和輸出神經(jīng)元值的計算(測度輸入神經(jīng)元±10%后輸出變化情況)模塊,從而構成EGNN-MIV組合模型。
該文所涉及的農(nóng)業(yè)機械頃均總動力及其影響因素相關的原始數(shù)據(jù)來自于1990~2014年《新疆統(tǒng)計年鑒》《新疆調(diào)查年鑒》。依據(jù)1.1建立的指標體系,構建了新疆頃均總動力及影響因素關系數(shù)據(jù)模型。并根據(jù)統(tǒng)計數(shù)據(jù)源對新疆各年度相關指標值進行計算。1990~2014年各指標值如表1所示。
表1 1990~2014年新疆頃均農(nóng)業(yè)機械總動力影響因素值
年份耕地均頃GDP(元)農(nóng)民人均純收入(元)MIP(%)農(nóng)業(yè)勞動力轉(zhuǎn)移率(%)農(nóng)業(yè)比較勞動生產(chǎn)率(%)農(nóng)民人均受教育程度(年/人)勞均土地面積(hm2/人)最大種植面積農(nóng)作物比重(%)頃均農(nóng)業(yè)機械總動力(W/hm2) 1990121 65622 45100 007 3242 965 890 8063 481876 06 1991136 77651 69104 407 1837 696 340 7964 272005 54 1992151 29645 99107 858 0232 566 410 7961 632118 20 1993146 95604 50109 797 8432 996 510 7759 472190 26 1994185 04579 02129 779 6131 356 560 7952 422258 15 1995135 06574 18158 7112 0233 586 701 1455 451613 97 1996194 64589 30179 8113 7532 086 790 8058 952490 31 1997217 13661 46186 6517 7232 696 840 8158 192570 57 1998227 16697 96182 7320 0932 906 950 8354 772663 54 1999243 93663 82173 7722 9929 987 040 8551 842769 22 2000287 98747 04169 7829 8530 137 170 9549 482853 61 2001305 48760 77166 5529 1327 267 350 9147 362922 43 2002346 01821 35158 5629 7126 917 390 8849 783105 43 2003413 16926 59154 7529 6631 127 430 8544 143298 74 2004471 19945 09154 6030 0928 897 450 8444 883502 96 2005539 431032 57158 4628 4727 387 780 7851 703603 51 2006577 001116 38165 9128 7724 337 750 8243 993558 28 2007605 861210 96164 2529 3025 247 790 8438 623602 53 2008435 391217 05183 1429 4023 407 921 2541 972560 31 2009443 421322 70170 6930 5125 567 991 2248 203710 32 2010538 891494 74162 6631 3428 898 031 1849 873831 33 2011623 251640 57178 0329 6324 498 291 2645 384354 25 2012644 981739 93181 3829 5723 868 411 3245 454475 86 2013660 061840 98184 6529 7223 368 501 4044 564600 49 2014671 921944 49187 3329 8623 228 611 4844 644749 37
首先基于表1數(shù)據(jù)建立嵌入式灰色神經(jīng)網(wǎng)絡,并根據(jù)模型性能對參數(shù)進行優(yōu)化和調(diào)整,進而建立最終EGNN模型,然后將該EGNN模型與MIV方法相結合提出頃均總動力影響因素量化方法。最后將應用該方法定量分析F1~F8對新疆農(nóng)業(yè)機械頃均總動力的影響程度。
2.2.1 EGNN模型
以新疆1990~2012年頃均農(nóng)機總動力及其影響因素數(shù)據(jù)為訓練集,農(nóng)業(yè)機械頃均總動力(Y)為網(wǎng)絡輸出,影響因素F1~F8作為輸入,應用Matlab2014a實現(xiàn)了嵌入式灰色神經(jīng)網(wǎng)絡預測模型,并分別在迭代次數(shù)10~100,隱含層為單層(8~10節(jié)點)、雙層([6, 6]~[10, 10])、學習精度為0.001,學習速率為0.01以及在不同的節(jié)點傳遞函數(shù)狀態(tài)下,進行建模及預測實驗。根據(jù)擬合的平均絕對百分誤差(Mean Absolute Percent Error,MAPE)、均方誤差(Mean square error,MSE)、SSE(Sum of Squares for Error,SSE)等指標選取最佳網(wǎng)絡參數(shù),并生成最終的嵌入式灰色神經(jīng)網(wǎng)絡,其預測結果分布見圖2。
建立預測模型后,應用不同檢驗方法其對擬合性能進行檢驗,如表2所示。
表2 模型擬合性能
MAPE(%)MSESSE9 3771023982366163
圖2 EGNN預測結果注:其中最后兩組為測試集中的預測結果
用訓練集建立模型后,為了檢驗網(wǎng)絡的預測性能,以2013~2014年數(shù)據(jù)作為測試集,對網(wǎng)絡性能進行測試。以2013~2014年F1~F8值為網(wǎng)絡輸入對2013~2014年頃均總動力進行預測,根據(jù)其預測效率進一步確定網(wǎng)絡可用與否,以此為據(jù)選取最終的預測模型。因該文數(shù)據(jù)量較少,未考慮迭代次數(shù)對網(wǎng)絡訓練時間的影響。模型在測試集中最佳SSE和擬合優(yōu)度為813 437、0.876 1,表明預測精度較高。
2.2.2 EGNN-MIV模型
依據(jù)2.2提出的方法構建EGNN-MIV模型,測度各影響因素的MIV。因該文中要分析各影響因素對新疆頃均農(nóng)業(yè)機械總動力的影響程度,因此無需將數(shù)據(jù)集分為訓練集和測試集,即應用新疆1990~2014年頃均總動力為網(wǎng)絡輸出,相應年度F1~F8為網(wǎng)絡輸入。各影響因素MIV以及其分布情況圖3所示。
圖3 各影響因素MIV結果
為了便于進一步分析MIV值分布,應用最大最小化方法對F1~F8的MIV進行標準化。結果如表3所示。
表3 MIV標準化值
指標F1F2F3F4F5F6F7F8標準化MIV0 700 390 390 460 200 500 900 74
農(nóng)機總動力作為復雜的時間序列,其發(fā)展受到區(qū)域經(jīng)濟水平、農(nóng)業(yè)發(fā)展政策、人口結構、農(nóng)業(yè)種植結構、自然地理條件等多個因素的交叉影響。并且隨著時間推移,其發(fā)展呈現(xiàn)出更多不確定性特征,使得正確預測及分析其演變趨勢更加困難。
(1)從EGNN組合預測模型性能方面,模型的擬合MAPE、MSE、SSE分別為9.377、102 398和2 366 163,預測精度較高。同時可以發(fā)現(xiàn)當觀測值出現(xiàn)較大波動時,擬合值的誤差較大,表明EGNN組合預測模型的對時間序列的波動較敏感。同時圖2表明, 2010年后的頃均農(nóng)機總動力預測誤差與之前相比有擴大的趨勢,可能的原因有二,其一是EGNN組合預測算法中激勵函數(shù)選取、訓練參數(shù)選擇和訓練次數(shù)確定等對預測結果的影響較大,因此需要進一步的分析和研究。其二是農(nóng)機頃均總動力變化趨勢以及影響因素隨著區(qū)域經(jīng)濟、農(nóng)業(yè)生產(chǎn)結構和農(nóng)業(yè)政策的變化發(fā)生了較大的變化。從而導致隨著時域尺度的變化誤差擴大。
(2)表3表明,EGNN-MIV模型的各個輸入對模型輸出的影響程度不均勻,進一步說明該文提出的方法在定量分析研究對象的輸入和輸出之間的非線性關聯(lián)關系方面有較好的應用價值。同時結合農(nóng)業(yè)機械總動力及其發(fā)展趨勢的實踐發(fā)現(xiàn),表3得出的結果較客觀地反映了新疆頃均總動力及其影響因素的變化現(xiàn)狀。
(3)根據(jù)各指標MIV值,對各影響因素對頃均農(nóng)機總動力變化的影響程度進行定量分析。MIV結果表明:①1990~2014年,新疆頃均農(nóng)業(yè)機械總動力受到該文所確定的所有影響因素的交叉影響,并且影響程度分布不均勻,主要集中在區(qū)域自然資源、農(nóng)業(yè)種植結構和區(qū)域經(jīng)濟水平等因素有關的指標。②從局部影響因素分析來看,MIV值最大的3個指標分別為勞均土地面積、最大種植面積農(nóng)作物比重和耕地均頃GDP,同時在數(shù)值上顯著大于其余的影響因素。說明在研究時域內(nèi)新疆頃均農(nóng)機總動力主要受勞均土地面積、最大種植面積農(nóng)作物比重和耕地均頃GDP的影響。對頃均農(nóng)機總動力的影響最小的因素為農(nóng)業(yè)比較勞動生產(chǎn)率。
(4)農(nóng)業(yè)機械頃均總動力作為農(nóng)業(yè)生產(chǎn)的主要動力來源,對區(qū)域農(nóng)業(yè)機械化水平以及現(xiàn)代農(nóng)業(yè)的發(fā)展有較大影響。因此在農(nóng)業(yè)機械化生產(chǎn)、管理和服務當中根據(jù)區(qū)域農(nóng)機化發(fā)展現(xiàn)狀,結合經(jīng)濟發(fā)展水平和土地資源結構合理的調(diào)整和優(yōu)化農(nóng)機總動力的分布,在提高農(nóng)業(yè)機械利用效率和農(nóng)機化發(fā)展水平以及促進現(xiàn)代農(nóng)業(yè)方面具有重要意義。
(1)應用神經(jīng)網(wǎng)絡和灰色模型在擬合非線性函數(shù)方面的優(yōu)勢,建立了嵌入式灰色神經(jīng)網(wǎng)絡。并對新疆1990~2014年頃均農(nóng)機總動力進行預測分析。結果顯示,預測模型的SSE和擬合優(yōu)度為813 437、0.876 1,表明該文提出的方法在農(nóng)機總動力變化趨勢方面有較好的優(yōu)勢。
(2)構建了EGNN-MIV影響因素定量分析模型。并對新疆1990~2014年頃均農(nóng)機總動力影響因素MIV進行了測度。各影響因素重要度順序從小到大依次為:勞均土地面積、最大種植面積農(nóng)作物比重、耕地均頃GDP、農(nóng)民人均受教育程度、農(nóng)村勞動力轉(zhuǎn)移率、機械化農(nóng)具定基價格指數(shù)、農(nóng)民人均純收入、農(nóng)業(yè)比較勞動生產(chǎn)率。
(3)研究時段內(nèi)各影響因素MIV值揭示,勞均土地面積等因素對新疆農(nóng)業(yè)機械化水平,尤其是頃均農(nóng)業(yè)機械總動力的影響不容忽視。因此,優(yōu)化勞均土地面積水平、農(nóng)作物種植結構以及提高耕地頃均GDP水平是提高新疆頃均農(nóng)機總動力以及進一步促進新疆農(nóng)業(yè)機械化發(fā)展的關鍵。
(4)該文為農(nóng)業(yè)機械總動力以及類似時間序列影響因素的定量分析方面提供了有效和可行的方法和步驟。
[1] 鞠金艷, 趙林,王金峰.農(nóng)機總動力增長波動影響因素分析.農(nóng)業(yè)工程學報, 2016, 32(2): 84~91
[2] 劉玉梅, 田志宏.農(nóng)戶收入水平對農(nóng)機裝備需求的影響分析——以河北省和山東省為例.中國農(nóng)村經(jīng)濟, 2009,(12): 44~55
[3] 顏廷武, 李凌超,王瑞雪.現(xiàn)代化進程中農(nóng)業(yè)裝備水平影響因素分析.農(nóng)業(yè)技術經(jīng)濟, 2010,(12): 38~43
[4] 軒俊偉, 鄭江華.基于GWR的新疆農(nóng)機總動力空間異質(zhì)性分析.農(nóng)機化研究, 2016, 38(5):36~42
[5] 許淑芹, 周桂霞,于海明,等.農(nóng)機總動力影響因素的灰色關聯(lián)分析——基于G-P算法.農(nóng)機化研究, 2016,38(12):56~60,65
[6] 何政道, 何瑞銀.農(nóng)業(yè)機械總動力及其影響因素的時間序列分析——以江蘇省為例.中國農(nóng)機化學報, 2010,(1): 20~24
[7] 吳科樑. 關于廣東省農(nóng)機總動力需求發(fā)展預測的探討.預測, 1988,(3): 49~51
[8] 崔紅艷. 吉林省農(nóng)業(yè)機械總動力及其影響因素分析.農(nóng)機化研究, 2015,37(12): 43~48
[9] 程準. 農(nóng)用機械總動力影響因素分析.農(nóng)村經(jīng)濟與科技, 2013, 24(6): 186~186
[10]吐爾遜·買買提, 謝建華.新疆農(nóng)業(yè)機械化發(fā)展水平區(qū)劃時空格局.中國農(nóng)業(yè)資源與區(qū)劃, 2017,38(2): 81~88
[11]萬三敏. 河南糧食總產(chǎn)及農(nóng)業(yè)經(jīng)濟發(fā)展關鍵因素分析——基于面板數(shù)據(jù)分析.中國農(nóng)業(yè)資源與區(qū)劃, 2014,35(3): 78~84
[12]吐爾遜·買買提, 丁為民,謝建華.時間序列組合預測模型研究:以農(nóng)業(yè)機械總動力為例.南京農(nóng)業(yè)大學學報, 2016,39(4): 688~695
[13]陳淑燕, 王煒.交通量的灰色神經(jīng)網(wǎng)絡預測方法.東南大學學報:自然科學版, 2004, 34(4): 541~544
[14]Jiang J L,Su X,Zhang H,et al.A novel approach to active compounds identification based on support vector regression model and mean impact value.Chemical Biology & Drug Design, 2013, 81(5): 650~657