王琪
摘要:農(nóng)村居民收入主要來源于農(nóng)林牧漁業(yè),包括現(xiàn)金收入和實物收入。由于作物收成易受天氣因素及其他外界不可抗力影響而難以預(yù)測,況且實物收入的具體數(shù)據(jù)也不易準(zhǔn)確測量,最終難以預(yù)測和統(tǒng)計真實的農(nóng)民農(nóng)業(yè)收入數(shù)據(jù)。本文以馬爾可夫齊次矩陣預(yù)測法作為理論依據(jù)試圖測量未來幾年農(nóng)村居民的農(nóng)業(yè)收入,可以為提前統(tǒng)計數(shù)據(jù)和制定政策作參考。
關(guān)鍵詞:馬爾可夫鏈 轉(zhuǎn)移概率矩陣 農(nóng)業(yè)收入預(yù)測
一、導(dǎo)言及文獻(xiàn)綜述
隨著我國經(jīng)濟的高速發(fā)展,我國的居民收入水平呈現(xiàn)出增長的趨勢,發(fā)展的不平衡使我國面臨“高儲蓄率、低消費率”的現(xiàn)狀,收入差距明顯。近年來,許多學(xué)者探討了關(guān)于擴大我國居民消費水平、尋找“消費之謎”的問題。收入是消費的一個重要因素,城鄉(xiāng)間收入差距也越來越得到重視,但由于城鎮(zhèn)居民的貨幣收入比較容易測量、數(shù)據(jù)易找,相反農(nóng)村居民因其收入的多來源、不穩(wěn)定、易受外界因素影響等原因難于準(zhǔn)確預(yù)測。
馬爾可夫模型是用來測量或者估計隨著時間的推移而發(fā)生的移動,它是高等數(shù)學(xué)中一項應(yīng)用廣泛的預(yù)測數(shù)據(jù)模型之一,其巧妙的利用矩陣?yán)碚摵透怕试?,用簡單的矩陣模型來處理?shù)量多且復(fù)雜的數(shù)據(jù),化繁為簡。許多學(xué)者根據(jù)馬爾可夫模型的原理,預(yù)測了許多不確定因素下的數(shù)據(jù),如焦中信、李小芳(2008)利用齊次馬爾科夫鏈,以單只股票在過去一段時間內(nèi)交易日的價格為對象來預(yù)測其在未來某天交易日的價格走勢,方法簡便卻未能給出預(yù)測結(jié)果的顯著性檢驗,只適用于預(yù)測個股走勢而無法判別整個股市的大走勢;陳敏,魏金明(2006)利用人民幣兌美元的周匯率數(shù)據(jù)基于馬爾可夫鏈模型預(yù)測了2006年下半年后中長期人民幣匯率走勢,得出人民幣會定在1美元兌換8.01元以下、具有較大的升值空間的結(jié)論,就目前來看,人民幣匯率狀況已經(jīng)得到了證實。以上是根據(jù)馬爾可夫鏈模型做出的簡單預(yù)測實例,最終結(jié)果都只是作為一個簡單的參考,誤差的存在使其并不能用作真實數(shù)據(jù)來分析。查秀芳(2003)先通過假設(shè)幾個前提條件,再合理運用馬爾可夫鏈模型預(yù)測市場占有率,最后得出的預(yù)測數(shù)據(jù)與真實數(shù)據(jù)有一定的誤差,分析認(rèn)為由于激烈的市場競爭和促銷策略的改變導(dǎo)致轉(zhuǎn)移概率矩陣發(fā)生變化,因此并不能完全符合假設(shè)條件,從而進(jìn)一步提出有關(guān)于企業(yè)預(yù)測市場的建議。
綜上所述,本文也試圖借鑒馬爾可夫鏈的原理來探尋和預(yù)測農(nóng)村居民的收入數(shù)據(jù),以便進(jìn)一步探索消費—收入模型。按收入來源分,農(nóng)村居民的純收入核算包括四個方面:工資性純收入、家庭經(jīng)營純收入、轉(zhuǎn)移性收入以及財產(chǎn)性收入。其中工資性收入主要來源于農(nóng)村居民的勞務(wù)所得,這部分?jǐn)?shù)據(jù)以現(xiàn)金實數(shù)來表現(xiàn);轉(zhuǎn)移性收入和財產(chǎn)性收入主要受制于政府的財政支農(nóng)政策以及其他的投資、財產(chǎn)租賃等因素。鑒于我國的歷史狀況,我國屬于以農(nóng)業(yè)為基礎(chǔ)的農(nóng)業(yè)大國,故以“農(nóng)林牧漁”為主要來源的家庭經(jīng)營性純收入構(gòu)成了農(nóng)村居民收入的基本部分。為了簡便探究,我們只考慮簡單的農(nóng)產(chǎn)品買賣收入即農(nóng)業(yè)收入。
二、馬爾可夫預(yù)測法的基本原理及適用性檢驗
概括來說,在事件的發(fā)展過程中,每次狀態(tài)(記為Et)的轉(zhuǎn)移都僅與前一時刻(Et-1)的狀態(tài)有關(guān),而與過去的任一狀態(tài)無關(guān),具備這個性質(zhì)(無后效性)的離散型隨機模型稱為馬爾可夫鏈。我們可以基于馬爾可夫鏈,根據(jù)事件的目前狀況預(yù)測其將來各個時刻(或時期)的變動狀況,這樣的一種預(yù)測方法就是馬爾可夫預(yù)測法。用馬爾可夫預(yù)測模型來推知預(yù)測對象的未來發(fā)展,要求預(yù)測對象在預(yù)測期間滿足過程隨機性、無后效性、有限的或可列的且相互獨立的狀態(tài)、轉(zhuǎn)移概率矩陣保持穩(wěn)定不變這幾個條件。為了簡便,我們把一個馬爾可夫過程用[E、P、Q]表示,其中:
(1)E是系統(tǒng)所有可能的狀態(tài)所組成的非空的狀態(tài)集,有時也稱之為系統(tǒng)的狀態(tài)空間,它是有限的、可列的集合或任意非空集。用E2、E1......來表示。
R2=0.96766,Et-2的t值在給定置信水平下小于2.145,則拒絕原假設(shè),說明滯后兩期的數(shù)據(jù)對本期沒有顯著影響。
通過比較可以發(fā)現(xiàn),模型①優(yōu)于模型②,由此說明本期農(nóng)業(yè)收入水平與前一期農(nóng)業(yè)收入水平顯著相關(guān),而與其他滯后期顯著不相關(guān),滿足無后效性。其經(jīng)濟意義解釋是,該年收入數(shù)據(jù)具有這樣的性質(zhì):以糧食收入為例,受群體效應(yīng)影響,一種糧食品種當(dāng)年的收成容易受到去年的市場行情影響,即去年供不應(yīng)求,今年農(nóng)民會選擇多多供應(yīng);而一旦去年市場行情不容樂觀,許多農(nóng)民則選擇改種行情好的農(nóng)產(chǎn)品品種,因此由該產(chǎn)品的成交價格和產(chǎn)量最終得到的農(nóng)業(yè)收入會取決于上一期的狀況,這就符合了無后效性。
此外,該農(nóng)業(yè)收入數(shù)據(jù)是一族依賴于時間的隨機變量,其變化過程是一個隨機過程,每年的收入都不相同,任何有關(guān)的因素都會影響當(dāng)年的數(shù)據(jù)。顯然,每一年農(nóng)產(chǎn)業(yè)的收入狀況都是獨立的狀態(tài),數(shù)據(jù)可列、有限,只在這些可列個時刻發(fā)生狀態(tài)轉(zhuǎn)移,故它們符合馬爾可夫鏈。
最后,我們分別考慮了農(nóng)業(yè)收入和收入?yún)^(qū)間作為預(yù)測對象,假設(shè)無論從什么時刻開始,農(nóng)產(chǎn)品價格、價格區(qū)間以及成交量的狀態(tài)變化過程的一步轉(zhuǎn)移概率只與時間差有關(guān),故狀態(tài)轉(zhuǎn)移概率矩陣是保持穩(wěn)定不變的。所以農(nóng)業(yè)收入、收入?yún)^(qū)間變化過程符合馬爾可夫預(yù)測法的條件,其變化過程構(gòu)成馬爾可夫過程。下面我們就用馬爾可夫預(yù)測模型來預(yù)測農(nóng)業(yè)收入的未來走勢。
三、用馬爾可夫預(yù)測法預(yù)測農(nóng)業(yè)收入模型
理論上農(nóng)業(yè)收入數(shù)據(jù)是符合馬爾可夫預(yù)測模型的,但由于外生變量的不確定性,極易產(chǎn)生誤差。為了便于分析,我們假設(shè)不考慮極端天氣的影響,也不考慮優(yōu)惠政策和財政補貼,因為極端天氣容易使得某一年的農(nóng)產(chǎn)品產(chǎn)量異常,而政策影響會使得產(chǎn)品價格和產(chǎn)量脫離市場,對總收入有一定影響。此外,假設(shè)不考慮外出務(wù)工和農(nóng)業(yè)信貸量的突然增加等相關(guān)因素的影響;最后假定,農(nóng)業(yè)收入的無后效性滿足齊次性。
1.以農(nóng)業(yè)收入為預(yù)測對象
選取表1中的每一年作為離散的時間單位,分為三種狀態(tài):E1表示收入上升,E2表示收入下降,以1996年為基年,以后各年狀態(tài)收集情況下:
表1 1996年-2011年狀態(tài)轉(zhuǎn)移情況
從表1中我們可以看出,16個年份中,上升的數(shù)據(jù)有12個,下降的有3個,第15個數(shù)據(jù)(2010年)后無轉(zhuǎn)移狀態(tài),我們選取前15年數(shù)據(jù),把2011年數(shù)據(jù)作為分析預(yù)測,這樣上升的記11個。其中,由上升到上升狀態(tài)轉(zhuǎn)移的有10次,由上升到下降狀態(tài)轉(zhuǎn)移有1次,由下降到上升狀態(tài)轉(zhuǎn)移有1次,由下降到下降狀態(tài)轉(zhuǎn)移有2次。下面建立狀態(tài)轉(zhuǎn)移概率矩陣,矩陣的每一行表示由一個狀態(tài)轉(zhuǎn)移到其他每一個狀態(tài)的概率:
表2狀態(tài)轉(zhuǎn)移概率表
根據(jù)預(yù)測結(jié)果,2011年農(nóng)業(yè)收入上升的概率為90.91%。事實證明,2011年農(nóng)業(yè)收入確實增加了。
2.以狀態(tài)區(qū)間為預(yù)測對象:
用本年(t)數(shù)據(jù)減去上一年(t-1)數(shù)據(jù),根據(jù)差額的范圍劃分為6個區(qū)間狀態(tài),列表如表4:
由此推斷2011年與2010年農(nóng)業(yè)收入數(shù)據(jù)差額處于狀態(tài)E5的概率為1,經(jīng)表1演算可知確實如此。預(yù)測2012、2013年的農(nóng)業(yè)收入數(shù)據(jù)狀態(tài)區(qū)間:
E(2)=E(1)·P(*)= E(0)·=(0,1,0,0,0,0)
E(3)=E(2)·P(*)= E(0)·=(0.2,0.4,0.2,0,0.2,0)
根據(jù)結(jié)果計算,2012年與2011年農(nóng)業(yè)收入數(shù)據(jù)差額位于狀態(tài)E2的概率為1,推測具體數(shù)據(jù)為1497.93-1547.939(元)之間;而2013年與2012年農(nóng)業(yè)收入數(shù)據(jù)差額位于狀態(tài)E2的概率最大為40%,小于50%,不能做出準(zhǔn)確的推測,為了進(jìn)一步準(zhǔn)確預(yù)測,我們?nèi)?009年與2008年數(shù)據(jù)數(shù)值差額作為初始狀態(tài),重復(fù)上述過程,可知E(0)=(0,0,1,0,0,0),故
E(1)=E(0)·P(*)=(0,0,0,0.5,0,0.5),說明2010年與2009年數(shù)值差額處于狀態(tài)E4或狀態(tài)E6的概率分別為50%,實際數(shù)據(jù)處于狀態(tài)E6;
E(2)=E(1)·P(*)= E(0)·=(0,0,0.25,0.25,0.5,0),說明2011年與2010年數(shù)值差額處于狀態(tài)E5的概率最大,為50%,我們推測為狀態(tài)E5,這與初始狀態(tài)取為E(0)=(0,0,0,0,0,1)的演算方法得到的數(shù)據(jù)一致。
用matlab數(shù)據(jù)軟件計算,當(dāng)n=10000時, P(*)是趨于穩(wěn)定收斂的:
中,要根據(jù)實際情況作出相應(yīng)的調(diào)整,以符合變化規(guī)律從而提高本模型的擬合度。
四、馬爾可夫模型的不足及調(diào)整
由《中國統(tǒng)計年鑒》數(shù)據(jù)我們可以直觀觀察到,近年來由于我國經(jīng)濟的發(fā)展和政府宏觀調(diào)控政策的實施,農(nóng)民總收入和農(nóng)業(yè)收入都逐年增長,但增長率不同,我們期望通過發(fā)達(dá)的科學(xué)技術(shù)和預(yù)測風(fēng)險能力預(yù)測農(nóng)業(yè)收入以便政府調(diào)控政策的制定。然而馬爾科夫預(yù)測模型的無后效性使得只能在單純的市場機制下的分析預(yù)測最有效,故我們的假設(shè)前提拋棄了外在的影響變量,這在實際中并不可行。
此外,我們僅僅得到的是未來的預(yù)測概率和預(yù)測值,與真實值之間的誤差的存在不可置否,因為在真實進(jìn)行數(shù)據(jù)統(tǒng)計時也會有相應(yīng)的誤差,況且目前樣本數(shù)據(jù)容量太小,我們只能將此結(jié)果作為概率參考,仍要與其它因素綜合起來考慮,例如政府在不同時期的調(diào)控政策,這樣也就限制了此模型只能求得未來幾年的數(shù)據(jù)。本模型的不足還在于無法預(yù)測極端天氣以及務(wù)農(nóng)人員等相關(guān)因素對農(nóng)業(yè)收入數(shù)據(jù)的影響,這樣我們在應(yīng)用此模型時應(yīng)當(dāng)注意季節(jié)變動的因素,還要盡量縮小數(shù)據(jù)間隔周期。
參考文獻(xiàn)
[1]焦中信,李小芳,利用齊次馬爾科夫鏈預(yù)測股票價格走勢,中國商界,2008(11)
[2]陳敏,魏金明,基于馬爾可夫鏈模型的人民幣匯率預(yù)測,理論探討2006(10)
[3]查秀芳,馬爾科夫鏈在市場預(yù)測中的作用,江蘇大學(xué)學(xué)報,2003(1)
[4]韋丁源,股市大盤指數(shù)的馬爾科夫鏈預(yù)測法,廣播電視大學(xué)學(xué)報,2008(09)