王海青,呂曉安
(1.河北民族師范學(xué)院數(shù)學(xué)與計(jì)算機(jī)系,河北 承德 067000;2.河北民族師范學(xué)院化學(xué)系,河北 承德 067000)
基于分位數(shù)回歸方法的農(nóng)業(yè)產(chǎn)出影響因素分析
王海青1,呂曉安2
(1.河北民族師范學(xué)院數(shù)學(xué)與計(jì)算機(jī)系,河北 承德 067000;2.河北民族師范學(xué)院化學(xué)系,河北 承德 067000)
采用分位數(shù)回歸的方法,對(duì)農(nóng)業(yè)產(chǎn)出的影響因素進(jìn)行實(shí)證分析,揭示造成不同農(nóng)業(yè)產(chǎn)出水平的客觀影響因素。與最小二乘回歸結(jié)果進(jìn)行對(duì)比,從而得到更全面的信息,為提高國內(nèi)農(nóng)業(yè)產(chǎn)出水平提供實(shí)證依據(jù)。
分位數(shù)回歸;農(nóng)業(yè)產(chǎn)出;最小二乘回歸
農(nóng)業(yè)是國民經(jīng)濟(jì)的基礎(chǔ),在經(jīng)濟(jì)迅速發(fā)展的背景下,農(nóng)業(yè)發(fā)展面臨著新的挑戰(zhàn)。自2004年以來政府一直聚焦“三農(nóng)”問題,國家也于近日發(fā)布了《關(guān)于加大改革創(chuàng)新力度加快農(nóng)業(yè)現(xiàn)代化建設(shè)的若干意見》,農(nóng)業(yè)發(fā)展問題意義之重大不言而喻。
近年來很多學(xué)者對(duì)農(nóng)業(yè)產(chǎn)出問題進(jìn)行了研究。羅紅旗(2007)利用關(guān)聯(lián)度分析方法對(duì)1995-2004年的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析,探究農(nóng)業(yè)機(jī)械投入、勞動(dòng)力投入、物質(zhì)消耗、土地面積投入等要素對(duì)農(nóng)業(yè)產(chǎn)出的影響[1];呂開宇(2008)調(diào)查了環(huán)境變化對(duì)農(nóng)業(yè)產(chǎn)出的影響[2];劉涵(2008)基于1980-2006年數(shù)據(jù),利用多元協(xié)整方程對(duì)國內(nèi)財(cái)政支農(nóng)支出與農(nóng)業(yè)產(chǎn)出的關(guān)系進(jìn)行了分析[3];董梅生(2009)采用偏最小二乘回歸法,利用1985-2006年關(guān)于中國農(nóng)業(yè)投入與產(chǎn)出的相關(guān)數(shù)據(jù)對(duì)中國農(nóng)業(yè)投入和產(chǎn)出的關(guān)系進(jìn)行了研究[4];付洪良(2010)運(yùn)用固定效應(yīng)模型對(duì)浙江11個(gè)地市的數(shù)據(jù)進(jìn)行實(shí)證,討論浙江省固定資產(chǎn)投資對(duì)農(nóng)業(yè)產(chǎn)出的影響[5];張本飛(2010)認(rèn)為教育可以提高人力資本,根據(jù)1978-2008年的相關(guān)數(shù)據(jù)分析人力資本對(duì)農(nóng)業(yè)產(chǎn)出的影響,進(jìn)而研究教育投資與農(nóng)業(yè)增長之間的關(guān)系[6];王向楠(2011)利用2005-2009年中國307個(gè)地級(jí)單位的數(shù)據(jù)發(fā)現(xiàn)農(nóng)業(yè)貸款、農(nóng)業(yè)保險(xiǎn)的發(fā)展均顯著促進(jìn)了中國農(nóng)業(yè)產(chǎn)出的增加[7];陳錫文(2011)以農(nóng)業(yè)技術(shù)水平、農(nóng)業(yè)勞動(dòng)投入、農(nóng)業(yè)資本投入為影響因素,采用最小二乘擬合回歸方法對(duì)農(nóng)業(yè)產(chǎn)出進(jìn)行估計(jì),同時(shí)對(duì)農(nóng)業(yè)勞動(dòng)投入的影響因素進(jìn)行深入研究,發(fā)現(xiàn)農(nóng)村人口老齡化對(duì)農(nóng)業(yè)勞動(dòng)投入具有較大負(fù)作用,從而推斷出農(nóng)村人口老齡化對(duì)農(nóng)業(yè)產(chǎn)出的影響[8];朱鐵輝(2012)基于2000-2009年山東17個(gè)地市的面板數(shù)據(jù)建立模型,對(duì)影響山東省農(nóng)業(yè)產(chǎn)出的政策因素、氣候因素和投入要素等變量對(duì)農(nóng)業(yè)產(chǎn)出增長的貢獻(xiàn)率進(jìn)行實(shí)證分析[9]。本文參考陳錫文(2011)的研究成果,通過分位數(shù)回歸的方法對(duì)農(nóng)業(yè)產(chǎn)出的影響因素進(jìn)行分析。
在線性回歸模型中,最小二乘回歸估計(jì)量的計(jì)算是基于最小化殘差平方和,該方法操作簡便,在研究領(lǐng)域中都有大量的應(yīng)用。但是在實(shí)際應(yīng)用中也發(fā)現(xiàn)了一些問題[10],首先,由于實(shí)際數(shù)據(jù)一般很難滿足同方差的假設(shè),從而造成最小二乘估計(jì)不再具有最小方差的特點(diǎn);其次,在社會(huì)科學(xué)研究中數(shù)據(jù)隨機(jī)誤差項(xiàng)的正態(tài)性也很難保證,因此,造成基于正態(tài)假設(shè)的各種假設(shè)檢驗(yàn)失效;再次,由于最小二乘只是基于均值給出的一條線性回歸直線,當(dāng)實(shí)際數(shù)據(jù)中存在一些異常值或缺失值時(shí),可以發(fā)現(xiàn)最小二乘回歸并不能很好地同時(shí)體現(xiàn)其他數(shù)據(jù)和一些離群點(diǎn)數(shù)據(jù)的信息。
Koenker和Bassett(1978)提出了分位數(shù)回歸估計(jì)方法,該估計(jì)是基于一種非對(duì)稱形式的絕對(duì)值殘差最小化,其中,中位數(shù)回歸運(yùn)用的是最小絕對(duì)值離差估計(jì)。它和最小二乘估計(jì)的主要區(qū)別在于回歸系數(shù)的估計(jì)方法和其漸近分布的估計(jì)。分位數(shù)回歸更加全面地描述因變量分布不同位置對(duì)自變量分布造成的不同影響,提供更加豐富的信息。另外,分位數(shù)回歸估計(jì)與最小二乘估計(jì)相比,分位數(shù)回歸的系數(shù)對(duì)離群值表現(xiàn)的更加穩(wěn)健,而且,分位數(shù)回歸對(duì)誤差項(xiàng)沒有很強(qiáng)的假設(shè)要求,因此,對(duì)于非正態(tài)分布而言,該方法在實(shí)際中應(yīng)用更為廣泛。
下面介紹分位數(shù)回歸方法。設(shè)X為隨機(jī)變量,分布函數(shù)為F(x)=P(X≤x),則X的θ分位數(shù)表達(dá)式為F-1(θ)=inf{x∶F(x)≥θ},其中0<θ<1,當(dāng)θ=0.5時(shí)即為中位數(shù)。在分位數(shù)回歸模型中,定義損失函數(shù)為:
因此損失函數(shù)也可寫成如下形式:
若給定的樣本觀察值(xi1,xi2,…,xik,yi),i=1,2,…,n,記xi=(xi1,xi2,…,xik)T,Θ為參數(shù)空間,對(duì)于線性回歸模型yi=xiTβ+εi,最小二乘回歸的參數(shù)估計(jì)值為:
即最小二乘回歸的損失函數(shù)ρ(u)=u2;分位數(shù)回歸的參數(shù)估計(jì)值可表示為:
分位回歸方程的求解較為復(fù)雜,目前主要應(yīng)用的求解方法有單純形法、內(nèi)點(diǎn)法和平滑算法等。
由于農(nóng)業(yè)產(chǎn)出一般有總產(chǎn)值和增加值之分,為了更合理地反映農(nóng)業(yè)實(shí)際產(chǎn)出,文中以第一產(chǎn)業(yè)增加值來度量農(nóng)業(yè)產(chǎn)出,同時(shí)以1985年為基期生成的第一產(chǎn)業(yè)增加值指數(shù)來剔除價(jià)格變動(dòng)的影響,實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化。考慮到數(shù)據(jù)獲取的限制,認(rèn)為農(nóng)業(yè)產(chǎn)出值主要受3個(gè)變量因素的影響。
第一個(gè)變量是農(nóng)業(yè)技術(shù)水平。以農(nóng)業(yè)從業(yè)人員的人均產(chǎn)值表示農(nóng)業(yè)技術(shù)水平,而農(nóng)業(yè)從業(yè)人員人均產(chǎn)值可由農(nóng)林牧漁業(yè)總產(chǎn)值除以第一產(chǎn)業(yè)實(shí)際就業(yè)人數(shù)來進(jìn)行計(jì)算。
第二個(gè)變量是農(nóng)業(yè)勞動(dòng)投入。用農(nóng)業(yè)勞動(dòng)投入數(shù)量值度量農(nóng)業(yè)勞動(dòng)投入的大小,考慮到20世紀(jì)90年代以后農(nóng)業(yè)勞動(dòng)者跨地區(qū)就業(yè)的情況日趨普遍,因此使用第一產(chǎn)業(yè)年末從業(yè)人員數(shù)量代替“農(nóng)村勞動(dòng)力”來度量農(nóng)業(yè)勞動(dòng)力數(shù)量更為恰當(dāng)。
第三個(gè)變量是農(nóng)業(yè)資本投入。一般用農(nóng)業(yè)資本存量數(shù)據(jù)來表示農(nóng)業(yè)資本投入的多少。對(duì)于農(nóng)業(yè)資本存量的估算,采用農(nóng)村生產(chǎn)性固定資產(chǎn)原值與固定資產(chǎn)投資縮減指數(shù)相乘來計(jì)算。
以上數(shù)據(jù)可從《中國統(tǒng)計(jì)年鑒》、《中國固定資產(chǎn)投資統(tǒng)計(jì)年鑒》和《中國教育統(tǒng)計(jì)年鑒》中整理計(jì)算,本文采用陳錫文(2011)的方法測算了1985-2013年的數(shù)據(jù)。為避免計(jì)量單位不同造成的影響,對(duì)上述3個(gè)變量進(jìn)行標(biāo)準(zhǔn)化處理,即以1985年為基期生成各變量的指數(shù)。
本文使用R軟件,采用分位數(shù)回歸和最小二乘回歸兩種方法對(duì)影響農(nóng)業(yè)產(chǎn)出的因素進(jìn)行研究,通過估計(jì)結(jié)果顯著性的大小找出具有重要影響的變量。為了更好地說明結(jié)果,表1列出了5%、25%、50%、75%和95%處的分位數(shù)回歸方程中各變量的系數(shù),同時(shí)將最小二乘回歸的估計(jì)結(jié)果列出進(jìn)行對(duì)比。由于結(jié)果中的截距并不是農(nóng)業(yè)產(chǎn)出的影響因素,所以不在表1列出。
表1 農(nóng)業(yè)產(chǎn)出影響因素分位數(shù)回歸與最小二乘回歸結(jié)果
注:分位回歸結(jié)果(前5列)括號(hào)內(nèi)數(shù)字為采用bootstrap方法得到的估計(jì)標(biāo)準(zhǔn)誤,最小二乘回歸結(jié)果(第6列)括號(hào)內(nèi)數(shù)據(jù)為假定誤差項(xiàng)服從正態(tài)分布得到的標(biāo)準(zhǔn)誤,“***”、“**”和“*”分別表示對(duì)應(yīng)系數(shù)在0.001、0.01和0.05的水平上顯著。
表1可以看出不同水平下的變量對(duì)農(nóng)業(yè)產(chǎn)出的影響。通過對(duì)比分位數(shù)回歸和最小二乘回歸的結(jié)果,可以發(fā)現(xiàn)“農(nóng)業(yè)技術(shù)水平”是唯一在5處分位數(shù)回歸和最小二乘回歸中均顯著的變量,說明“農(nóng)業(yè)技術(shù)水平”對(duì)于所有不同水平的農(nóng)業(yè)產(chǎn)出都有重要的影響。
“農(nóng)業(yè)勞動(dòng)投入”和“農(nóng)業(yè)資本投入”均是最小二乘回歸中的顯著變量,但在5處分位數(shù)回歸結(jié)果中,“農(nóng)業(yè)勞動(dòng)投入”的顯著性逐漸降低,其中50%分位點(diǎn)代表了農(nóng)業(yè)產(chǎn)出的平均水平,由此看出“農(nóng)業(yè)勞動(dòng)投入”在農(nóng)業(yè)產(chǎn)出中等水平及以下時(shí)有重要影響,而在農(nóng)業(yè)產(chǎn)出水平越來越高時(shí),該變量對(duì)農(nóng)業(yè)產(chǎn)出的影響逐漸變小?!稗r(nóng)業(yè)資本投入”因素卻恰好相反,該變量在50%、75%和95%的分位點(diǎn)處變得顯著,雖然顯著性等級(jí)一樣,但是其系數(shù)值卻越來越大,說明其影響越來越高。綜合衡量,認(rèn)為這是因?yàn)樵?0世紀(jì)90年代國內(nèi)農(nóng)業(yè)生產(chǎn)主要是依賴農(nóng)民勞作,而隨著科技發(fā)展和農(nóng)民文化水平的提高,機(jī)械化生產(chǎn)逐步占據(jù)主導(dǎo)地位,成為農(nóng)業(yè)生產(chǎn)的主力軍。農(nóng)作物綜合機(jī)械化水平的逐步提高及農(nóng)業(yè)設(shè)施及農(nóng)產(chǎn)品加工機(jī)械化的協(xié)調(diào)推進(jìn),使得機(jī)械化對(duì)增加農(nóng)業(yè)產(chǎn)出的影響會(huì)越來越大,而人力勞動(dòng)投入的影響會(huì)越來越小。
對(duì)“農(nóng)業(yè)勞動(dòng)投入”的影響因素進(jìn)行分析,由表2可知,“農(nóng)村人口老齡化”及“農(nóng)村勞動(dòng)力轉(zhuǎn)移情況”對(duì)農(nóng)業(yè)勞動(dòng)投入均具有負(fù)作用。“鄉(xiāng)村總?cè)丝谒健?、“城?zhèn)化水平”和“農(nóng)村勞動(dòng)力轉(zhuǎn)移情況”在分位數(shù)回歸和最小二乘回歸中,3個(gè)變量都十分顯著。“農(nóng)村人口老齡化”在最小二乘回歸中是顯著變量,但分位數(shù)回歸中只在5%、25%處是顯著變量。由此看出,在農(nóng)業(yè)勞動(dòng)投入水平很低的情況下,即農(nóng)業(yè)投入的勞動(dòng)量很少時(shí)農(nóng)村人口老齡化會(huì)產(chǎn)生重要的影響,反之,當(dāng)農(nóng)業(yè)勞動(dòng)量很高時(shí),由于勞動(dòng)力充足,農(nóng)村人口老齡化不會(huì)對(duì)農(nóng)業(yè)勞動(dòng)投入產(chǎn)生太大影響。由此看出當(dāng)出現(xiàn)人口老齡化時(shí)對(duì)農(nóng)業(yè)產(chǎn)出會(huì)起到負(fù)作用。
本文使用分位數(shù)回歸方法對(duì)農(nóng)業(yè)產(chǎn)出的影響因素進(jìn)行分析,同時(shí)與最小二乘回歸估計(jì)方法進(jìn)行對(duì)比。在比較的過程中發(fā)現(xiàn)某些變量在最小二乘回歸結(jié)果中具有顯著影響,但在分位數(shù)回歸分析中并非在每個(gè)分位點(diǎn)處都具有顯著性,這是因?yàn)樽钚《嘶貧w度量的是平均意義上有影響的重要因素,說明最小二乘回歸方法考慮的是全局的作用,而忽略了對(duì)于局部相對(duì)重要的影響,這也是最小二乘回歸方法的局限之一。
表2 農(nóng)業(yè)勞動(dòng)投入影響因素分位數(shù)回歸與最小二乘回歸結(jié)果
注:分位回歸結(jié)果(前5列)括號(hào)內(nèi)數(shù)字為采用bootstrap方法得到的估計(jì)標(biāo)準(zhǔn)誤,最小二乘回歸結(jié)果(第6列)括號(hào)內(nèi)數(shù)據(jù)為假定誤差項(xiàng)服從正態(tài)分布得到的標(biāo)準(zhǔn)誤,“***”、“**”和“*”分別表示對(duì)應(yīng)系數(shù)在0.001、0.01和0.05的水平上顯著。
由分析結(jié)果可知,中國農(nóng)業(yè)發(fā)展迅速,而近幾年農(nóng)業(yè)人口老齡化水平和農(nóng)村勞動(dòng)力轉(zhuǎn)移率逐年增加,在此前提下若要保持農(nóng)業(yè)生產(chǎn)水平穩(wěn)定增長,就必須提高農(nóng)業(yè)科技水平、加大農(nóng)業(yè)資本和其他投入,減少勞動(dòng)投入對(duì)農(nóng)業(yè)產(chǎn)出產(chǎn)生負(fù)作用,從而實(shí)現(xiàn)提高農(nóng)業(yè)產(chǎn)出和增加農(nóng)民收入的目的。
[1]羅紅旗,黃其鴻.基于關(guān)聯(lián)度分析的農(nóng)業(yè)機(jī)械化對(duì)農(nóng)業(yè)產(chǎn)出的影響研究[J].北京工商大學(xué)學(xué)報(bào):自然科學(xué)版,2007,25(06):16-18.
[2]呂開宇,許健民,婁博杰.環(huán)境變化對(duì)農(nóng)業(yè)產(chǎn)出的影響[J].中國農(nóng)村經(jīng)濟(jì),2008,(04):63-72.
[3]劉涵.財(cái)政支農(nóng)支出對(duì)農(nóng)業(yè)經(jīng)濟(jì)增長影響的實(shí)證分析[J].農(nóng)業(yè)經(jīng)濟(jì)問題,2008,(10):30-35.
[4]董梅生.中國農(nóng)業(yè)投入和產(chǎn)出的關(guān)系——基于偏最小二乘回歸法的分析[J].技術(shù)經(jīng)濟(jì),2009,(01):37-41.
[5]付洪良.固定資產(chǎn)投資對(duì)浙江農(nóng)業(yè)產(chǎn)出影響的實(shí)證[J].技術(shù)經(jīng)濟(jì)與管理研究,2010,(04):123-126.
[6]張本飛.中國教育投入與農(nóng)業(yè)增長的格蘭杰因果關(guān)系分析[J].中國人口、資源與環(huán)境,2010,20(12):117-127.
[7]王向楠.農(nóng)業(yè)貸款、農(nóng)業(yè)保險(xiǎn)對(duì)農(nóng)業(yè)產(chǎn)出的影響——來自2004-2009年中國地級(jí)單位的證據(jù)[J].中國農(nóng)村經(jīng)濟(jì),2011,(10):44-51.
[8]陳錫文,陳昱陽,張建軍.中國農(nóng)村人口老齡化對(duì)農(nóng)業(yè)產(chǎn)出影響的量化研究[J].中國人口科學(xué),2011,(02):39-46.
[9]朱鐵輝,茹蕾,陳永福.氣候變化、財(cái)政支農(nóng)支出與農(nóng)業(yè)產(chǎn)出——基于山東省17地市面板數(shù)據(jù)的實(shí)證分析[J].山東社會(huì)科學(xué),2012,(02):140-144.
[10]李澤昱,蘇宇楠,田茂再.基于分位回歸的國家形象影響因素分析[J].統(tǒng)計(jì)研究,2014,31(08):59-65.
[責(zé)任編輯:王榮榮 英文編輯:劉彥哲]
Influencing Factors of Agricultural Production Based on Quantile Regression
WANG Hai-qing1,LV Xiao-an2
(1.Mathematics and Computer Department,Hebei Normal University for Nationalities,Chengde,Hebei 067000,China; 2.Chemistry Department,Hebei Normal University for Nationalities,Chengde,Hebei 067000,China)
This paper used quantile regression model to empirically detect the factors of agricultural production with different levels of outputs,Then it compared the result with OLS regression and got more comprehensive conclusion,which provides empirical basis to improve Chinese agricultural production.
quantile regression;agricultural production;OLS regression
王海青(1986-),女,河北承德人,河北民族師范學(xué)院教學(xué)與計(jì)算機(jī)系教師,碩士。
F 224∶F 323
A
10.3969/j.issn.1673-1492.2015.04.013
來稿日期:2015-03-26