張文政 孫德山 王玥 張蕾
摘?要?隨著中國經(jīng)濟的不斷發(fā)展,城市化進程不斷推進,總?cè)丝谥鹉暝黾?農(nóng)村人口逐年減少,糧食的需求量逐年增加,某些貧困地區(qū)已經(jīng)出現(xiàn)糧食短缺的狀況.本文選取了1986年-2016年遼寧省年糧食總產(chǎn)量、有效灌溉面積、農(nóng)業(yè)化肥施用量、農(nóng)業(yè)機械總動力、播種面積以及受災面積等相關(guān)數(shù)據(jù).利用支持向量機回歸、線性回歸,隨機森林三種方法,對遼寧省糧食產(chǎn)量進行了預測,并比較了三種方法預測的精準度.
關(guān)鍵詞?支持向量機;線性回歸;隨機森林;核函數(shù)
中圖分類號 ?O212.4?文獻標識碼?A
Abstract?With the continuous development of China's economy, the process of urbanization is advancing, and ?the total population is increasing year by year, but the population of rural areas is decreasing year after year. As time goes on ,the demand for grain has increased , and some poor areas have already appeared in the condition of grain shortage. In this paper, the total annual grain output, the effective irrigation area, the amount of agricultural fertilizer application, the total power of agricultural machinery, the sown area and the affected area of ?Liaoning province from 1986 to 2016 were selected. By using three methods of support vector machine regression, linear regression and random forest, the grain yield of Liaoning province was predicted, and the accuracy of the three methods was compared.
Key words?support vector machine; linear regression; random forest; kernel function
1?引?言
糧食問題一直以來都是世界關(guān)注的焦點,糧食不僅關(guān)乎國計民生的問題,也關(guān)乎著社會安定以及經(jīng)濟能否持續(xù)發(fā)展.我國從古至今都非常重視糧食問題,一直將糧食的生產(chǎn)放在國民經(jīng)濟的首位[1].隨著城市化進程不斷推進,總?cè)丝诓粩嘣黾?,農(nóng)村人口不斷減少的背景下,對糧食的需求將進一步擴大.如果糧食的產(chǎn)量得不到提高,糧食的供給與需求的缺口便會越來越大.那么如何提高糧食產(chǎn)量,就必須分析影響糧食產(chǎn)量的因素以及糧食產(chǎn)量的變化趨勢.
影響糧食產(chǎn)量的因素千絲萬縷,這些因素對糧食產(chǎn)量作用機制又很難用數(shù)學語言來表示,這就使數(shù)學預測模型難以建立.傳統(tǒng)的預測方法有:線性回歸法、時間序列法、灰色理論法等,后來也發(fā)展出許多其他預測的方法,如神經(jīng)網(wǎng)絡(luò)法、混沌理論法等.國內(nèi)外專家學者對糧食產(chǎn)量的研究眾多,在國內(nèi)的研究中,由于我國地域遼闊,氣候多樣,糧食品種繁多,因此我國專家學者的研究主要分為全國糧食的研究和區(qū)域糧食研究兩大類[2].在全國糧食的研究中,劉杰[3]構(gòu)建了一種加權(quán)的馬爾科夫預測模型,與傳統(tǒng)的馬爾科夫鏈相比,加權(quán)的馬爾科夫鏈方法的誤差更小精度更高.陳錫康等人[4]探討了農(nóng)業(yè)復雜巨系統(tǒng)的特點,提出了預測全國糧食產(chǎn)量的系統(tǒng)綜合因素預測法.在區(qū)域糧食研究中:周永生等人[5]利用多元線性回歸方法對影響糧食產(chǎn)量的各種因素進行分析,構(gòu)建廣西糧食產(chǎn)量預測模型.龔波等人[6]運用灰色相對關(guān)聯(lián)分析,以糧食產(chǎn)量作為系統(tǒng)特征序列數(shù)據(jù),構(gòu)建糧食產(chǎn)量的灰色GM(1,N)模型,對湖南省2015年糧食產(chǎn)量進行擬合和預測.ZHOU等人[7]以單期植被指數(shù)(VIS)和多光譜遙感(MS)和數(shù)字圖像為基礎(chǔ),對水稻產(chǎn)量進行了預測,并確定了水稻產(chǎn)量預測的最佳時期和最優(yōu)VIS.國外對于糧食產(chǎn)量的研究主要依據(jù)氣候,然后基于氣候的影響對糧食產(chǎn)量作出短期預測[2].然而結(jié)合遼寧省氣候多變這一情況,只是基于氣候很難作出精準預測,而且短期預測也很難對政府提出有效建議. 本文運用了支持向量機的方法對遼寧糧食產(chǎn)量進行分析,建立了遼寧糧食產(chǎn)量預測模型,該模型的優(yōu)勢在于綜合考慮了遼寧省糧食產(chǎn)量的主要影響因素.支持向量機的擬合和泛化能力是最好的,這是因為糧食數(shù)據(jù)屬于小樣本數(shù)據(jù),支持向量機基于結(jié)構(gòu)風險最小,較好地解決了小樣本、非線性、過擬合,維數(shù)災難等問題.
遼寧省欲打造振興東北重要增長極,糧食問題在全省經(jīng)濟社會發(fā)展中始終處于重要位置.因此提前預測遼寧省糧食產(chǎn)量,對有關(guān)部門及時進行糧食的調(diào)入調(diào)出和安排庫存具有重要參考價值.
由表4可知,利用支持向量模型預測遼寧省玉米、稻谷、大豆的產(chǎn)量依然精準,故利用支持向量機分析遼寧省糧食產(chǎn)量問題具有一定的可行性.
4?結(jié)?論
本文在運用了支持向量機的方法對遼寧糧食產(chǎn)量進行分析的基礎(chǔ)上,綜合運用了線性回歸,隨機森林等方法,建立了遼寧糧食產(chǎn)量預測模型,該模型的優(yōu)勢在于綜合考慮了遼寧省糧食產(chǎn)量的主要影響因素. 由表2可知,支持向量回歸的相對誤差均小于10%,而線性回歸模型的預測精度不高,主要是不能捕捉到糧食數(shù)據(jù)的非線性特征.而相比于隨機森林,支持向量機的擬合和泛化能力是最好的,這是因為糧食數(shù)據(jù)屬于小樣本數(shù)據(jù),支持向量機基于結(jié)構(gòu)風險最小,較好地解決了小樣本、非線性、過擬合和維數(shù)災難等問題.表明SVR在糧食產(chǎn)量的預測中具有一定的可行性.
參考文獻
[1]?田秀芹. 基于多元線性回歸的糧食產(chǎn)量預測[J].科技創(chuàng)新與應用,2017(16):3-4.
[2]?鄒璀,劉秀麗.山東省糧食產(chǎn)量預測研究[J].系統(tǒng)科學與數(shù)學, 2013,33 (1) :97-109.
[3]?劉杰.基于加權(quán)馬氏鏈的全國糧食產(chǎn)量預測研究[J].廊坊師范學院學報:自然科學版,2015,15 (1) :56-59.
[4]?陳錫康,楊翠紅.農(nóng)業(yè)復雜巨系統(tǒng)的特點與全國糧食產(chǎn)量預測研究[J].系統(tǒng)工程理論與實踐 ,2002,22 (6) :108-112.
[5]?周永生,肖玉歡,黃潤生.基于多元線性回歸的廣西糧食產(chǎn)量預測[J].南方農(nóng)業(yè)學報,2011,42(9) :1165-1167.
[6]?龔波,肖國安,張四梅. 基于灰色系統(tǒng)理論的湖南糧食產(chǎn)量預測研究[J].湖南科技大學學報:社會科學版, 2012 , 15 (5) :62-65.
[7]?ZHOU X, ZHENG H B, XU X Q, et ?al.Predicting grain yield in rice using multi-temporal vegetation indices from UAV-based multispectral and digital imagery[J],ISPRS Journal of Photogrammetry& Remote Sensing, 2017 , 130 :246-255.
[8]?鄭建安. 主成分和BP神經(jīng)網(wǎng)絡(luò)在糧食產(chǎn)量預測中的組合應用[J].計算機系統(tǒng)與應用, 2016,25 (11) :274-278.
[9]CORTESC,VAPNIKV.Support-vector networks[J].Machine Learning.1995.20(3): 273-297.
[10]向昌盛,周子英,武力娜.糧食產(chǎn)量預測的支持向量機模型研究[J].湖南農(nóng)業(yè)大學學報:社會科學版, 2010 , 11 (1) :6-10.