周文浩
摘? ?要:以洛侖茲曲線和中等收入問(wèn)題為研究對(duì)象,對(duì)收入分配的分組數(shù)據(jù)進(jìn)行擬合,得到參數(shù)估計(jì)值和均方誤差,發(fā)現(xiàn)其與現(xiàn)有的10種洛侖茲曲線相比具有更好的模擬效果。然后利用收入空間法、人口空間法定義中等收入人口。最后利用基尼系數(shù)和極化曲線的思想,給定兩種定義的中等收入人口的測(cè)算方法和數(shù)學(xué)模型。
關(guān)鍵詞:洛侖茲曲線;收入空間法;基尼系數(shù);中等收入
中圖分類號(hào):F01? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號(hào):1673-291X(2023)17-0004-03
一、洛侖茲曲線模型
通過(guò)數(shù)學(xué)和統(tǒng)計(jì)學(xué)的相關(guān)概念,這里假設(shè)收入分配的密度函數(shù)為f(x),其對(duì)應(yīng)的分布函數(shù)為F(x),且假設(shè)F(x)的反函數(shù)存在,記為F-1(p)。記收入低于或等于x的人口群體占有的收入占總收入的比例為L(zhǎng)(p),則應(yīng)有
L(P)稱之為收入分配的洛倫茲曲線。目前學(xué)界相關(guān)的擬合模型有以下幾種,包括幾何計(jì)算法、分布函數(shù)法與曲線擬合法,幾何計(jì)算法由于其根據(jù)幾何圖形分塊來(lái)計(jì)算基尼系數(shù),因此相對(duì)比較粗糙,分布函數(shù)法分析較為復(fù)雜,在實(shí)際研究中的應(yīng)用較少,故本文擬采用曲線擬合法,應(yīng)用非線性最小二乘法對(duì)模型的參數(shù)進(jìn)行估計(jì)。
非線性最小二乘法是一種比較實(shí)用的參數(shù)估計(jì)方法。其原理如(2)式所示。
確定其中參數(shù)向量τ的估計(jì)值τ,然后用L(p,τ)=L(p)作為近似的洛倫茲曲線來(lái)進(jìn)行收入分配分析,其中L(p,τ)是定義在[0,1]區(qū)間上、取值于[0,1]區(qū)間的函數(shù),滿足
即L(p,τ)在[0,1]上是凸增函數(shù)。本文將在后面的研究中略去參數(shù)τ以求表述簡(jiǎn)練。
接下來(lái)本文將設(shè)置合適的模型使L(p,τ)滿足條件(3),近年來(lái),不少學(xué)者提出了各式各樣的參數(shù)洛侖茲曲線模型。Sarabia構(gòu)造了形如S(p)=PaL(p)η的模型,其中L(p,τ)是參數(shù)洛侖茲曲線模型,Sarabia的模型成立的條件比較苛刻,見定理1:
定理1 當(dāng)α≥0且η≥1,L(p,τ)的三階導(dǎo)數(shù)L'''(p,τ)≥0,此時(shí)S(p)=PaL(p)η滿足洛侖茲定理的條件。
因?yàn)镾arabia的定理要求非常嚴(yán)格,而且η≥1的條件大大限制了模型的擬合效果。王祖祥在Sarabia研究的基礎(chǔ)上改進(jìn)了定理1,提出了定理2:
定理2 設(shè)L(p,τ)滿足洛倫茲曲線的條件且對(duì)于任何p∈[0,1],有L'''(p,τ)≥0,則當(dāng)α≥0,η≥1/2,α+η≥1時(shí),PaL(p)η滿足洛侖茲曲線的條件。
接下來(lái)進(jìn)行參數(shù)變換轉(zhuǎn)化成可以應(yīng)用無(wú)約束最小二乘法進(jìn)行參數(shù)的估計(jì)。
令α=(1+α2)sin2b,η=(1+α2)cos2b,β1=sin2c,β2=sin2d(5)
使用Levenberg-Marquardt算法求解非線性最小二乘問(wèn)題,以估計(jì)其中參數(shù)。運(yùn)用matlab軟件可以得到a,b,c,d的估計(jì)值分別為0.7849,1.1682,0.8131,0.8058。將參數(shù)帶入(5)(4)式進(jìn)行擬合可以得到下圖:
上述擬合精度的好壞可以采用以下三種標(biāo)準(zhǔn)進(jìn)行比較。
均方誤差(MSE,mean squared error):
平均絕對(duì)誤差(MAE,mean absolute error):
最大絕對(duì)誤差(MAS,maximum absolute error)
在這里我們采用第一種標(biāo)準(zhǔn)均方誤差,求得MSE=
5.7891e-005,表明模型擬合精度高。
二、收入空間法和人口空間法
對(duì)于中等收入者的界定是目前學(xué)界研究的一個(gè)焦點(diǎn)問(wèn)題,一般有兩種界定方法,一種是根據(jù)給定的收入來(lái)界定,比如國(guó)家統(tǒng)計(jì)局城調(diào)總隊(duì)課題組提出家庭年收入6萬(wàn)—50萬(wàn)元為我國(guó)的中等收入上下限以及國(guó)外的一些定性觀點(diǎn);另一種是根據(jù)人口比例來(lái)界定,主要有固定比例界定方法和食品收入占比的恩格爾系數(shù)界定方法。
中等收入是指在收入方面相對(duì)高收入和低收入處于中等水平的一種狀態(tài)。中等收入受空間條件制約,指它在不同地域受當(dāng)?shù)貤l件限制而有所差別。我國(guó)各地區(qū)的發(fā)達(dá)程度有明顯的地域差別,目前東部地區(qū)中等收入水平高于中西部中等收入水平,城市中等收入水平高于農(nóng)村的中等收入水平。收入是可量化指標(biāo),中等收入當(dāng)然也可量化,由此需要數(shù)值化的指標(biāo)來(lái)度量中等收入。中等收入者是指全部有收入的人群中,相對(duì)于高收入者和低收入者而言,處于中等水平的一個(gè)群體。因此,中等收入水平必定是個(gè)區(qū)間,有上接近高收入人群的上限和下接近低收入人群的下限,而不是一個(gè)指標(biāo)值。
收入空間法方面本文提出按照中位收入的一個(gè)比例來(lái)確定我國(guó)中等收入者的收入?yún)^(qū)間,其依據(jù)如下:在存在經(jīng)濟(jì)進(jìn)步或通貨膨脹的情形下,收入?yún)^(qū)間的右移也會(huì)導(dǎo)致收入中位數(shù)的右移,這也克服了收入取值的任意性。
相關(guān)數(shù)據(jù)來(lái)自2013年全國(guó)研究生數(shù)學(xué)建模競(jìng)賽E題:假設(shè)收入屬于(xl,xh)中的人口為中等收入人口,其中xl=0.6m,xh=1.6m,此時(shí)可以求出中等收入范圍和中等收入人口的數(shù)量或范圍。
在人口空間法方面本文將采用基尼系數(shù)的方法來(lái)確定中等收入人口比例,假設(shè)基準(zhǔn)中等收入人口比例為60%,基準(zhǔn)基尼系數(shù)為0.3。當(dāng)基尼系數(shù)提高時(shí),收入?yún)^(qū)間變得更加稀疏,兩級(jí)分化程度加劇,從而中等收入比例降低,假設(shè)實(shí)際基尼系數(shù)為G,中等收入比例MF為:
很顯然,當(dāng)基尼系數(shù)低,即兩級(jí)分化程度也較低時(shí),中等收入水平提高,比如基尼系數(shù)為0.1時(shí),中等收入比例為70%;當(dāng)基尼系數(shù)較高時(shí),中等收入水平較低,比如基尼系數(shù)為0.9時(shí),中等收入比例僅為30%。另外在確定人口區(qū)間時(shí),假設(shè)比例在50%的兩端(即中位數(shù)兩端)均勻分布,比如當(dāng)中等收入比例為60%時(shí),中等收入人口區(qū)間為20%—80%。根據(jù)相關(guān)數(shù)據(jù)可得表2。
地區(qū)A相對(duì)年份1來(lái)說(shuō),年份2的中等收入人口的比例有所降低,地區(qū)B則是第二年的中等收入人口比例有所增加,從表中可以發(fā)現(xiàn)中等收入人口比例與基尼系數(shù)的對(duì)應(yīng)關(guān)系。
三、基尼系數(shù)與極化曲線
根據(jù)已經(jīng)得到的收入分配的洛侖茲曲線,我們可以得到描述收入不平等的基尼系數(shù)。
收入分配的兩極分化反映出貧富差距越拉越大,不利于社會(huì)資源的正常流動(dòng),財(cái)富的過(guò)于集中和分化會(huì)導(dǎo)致“中產(chǎn)階級(jí)”的空洞化。Wolfson提出了一種兩極分化指數(shù),先定義所謂的第一類極化曲線:
其中F-1是收入分配分布函數(shù)的反函數(shù),再定義第二類極化曲線:
其中μ是平均收入,L(p)是洛侖茲曲線,最后可以定義兩級(jí)分化指數(shù)為:
W越大,兩級(jí)分化越嚴(yán)重,中等收入人口比例也隨之下降,又因?yàn)閃∈(0,1),因此可以設(shè)計(jì)中等收入比例指數(shù)如下所示:M=1-W,很顯然M∈(0,1),且M越大,中等收入比例越大,反之亦然。
四、模型分析
地區(qū)差異和時(shí)間差異是我們研究的兩個(gè)維度,具體的數(shù)據(jù)來(lái)自2013年研究生數(shù)學(xué)建模競(jìng)賽,數(shù)據(jù)說(shuō)明了兩個(gè)地區(qū)不同年份居民收入的動(dòng)態(tài)變化。下面分別從基尼系數(shù)和中等收入指數(shù)的角度進(jìn)行分析并畫出洛侖茲曲線。根據(jù)模型(4)進(jìn)行非線性最小二乘法估計(jì)參數(shù)并擬合。
由表3可以發(fā)現(xiàn)A地區(qū)從第一年到第二年基尼系數(shù)升高,而中等收入比例增大;B地區(qū)從第一年到第二年基尼系數(shù)降低,而中等收入比例降低。富裕的地區(qū)基尼系數(shù)較小而且第二年得到了改進(jìn),而較不富裕的地區(qū)隨著年份的增長(zhǎng),基尼系數(shù)反而上升。因此提高全民的收入,讓收入?yún)^(qū)間右移間接降低了基尼系數(shù),改善了收入分配。
中等收入指數(shù)的變化趨勢(shì)與基尼系數(shù)是一致的,即收入不平等的加劇會(huì)降低中等收入人口,同時(shí)兩極的人口數(shù)得到了增長(zhǎng)。
通過(guò)模型(4)求出洛侖茲曲線并采用Matlab分別對(duì)兩個(gè)地區(qū)不同年份的曲線進(jìn)行繪制,如圖2所示:
圖中從上至下分別為B2、B1、A1、A2,研究發(fā)現(xiàn)B地區(qū)第二年收入分配的不平等程度最低,同時(shí)A地區(qū)的不平等程度顯著高于B地區(qū);A地區(qū)第二年收入分配的不平等程度上升而B地區(qū)第二年收入分配的不平等程度下降。收入分配的不平等程度與基尼系數(shù)的變化是一致的。
五、模型評(píng)價(jià)
一是對(duì)洛侖茲曲線模型的構(gòu)建參考了Sarabia的定理進(jìn)行了建模,模型參數(shù)較多可以很好地滿足題設(shè)條件,文中應(yīng)用非線性最小二乘法擬合洛倫茲曲線模型是比較理想的方法。但是模型的擬合精度仍然不夠高,后續(xù)的研究可以考慮在模型中加入5個(gè)或5個(gè)以上的參數(shù)。二是對(duì)收入空間法和人口空間法分別運(yùn)用了中位收入基準(zhǔn)法和基尼系數(shù)基準(zhǔn)法,模型簡(jiǎn)明扼要,結(jié)果比較直觀,缺點(diǎn)是模型的復(fù)雜度有待提高。三是參考Wolfson的兩極分化指數(shù)來(lái)構(gòu)建中等收入指數(shù),模型比較合理,較好地解決了中等收入指數(shù)的測(cè)算問(wèn)題。
參考文獻(xiàn):
[1]? ?王祖祥,范傳強(qiáng),何耀,等.農(nóng)村貧困與極化問(wèn)題研究:以湖北省為例[J].中國(guó)社會(huì)科學(xué),2009(11):73-88.
[2]? ?Sarabia J M,Castillo E,Pascual M,Sarabia M.Mixture Lorenz curves[J].Economics Letters,2005(89):89-94.
[3]? ?李培林.?dāng)U大中等收入者比重的對(duì)策思路[J].中國(guó)人口科學(xué),2007(5):46-52.
[4]? ?Duangkamon Chotikapanich and William E. Griffiths.Estimating Lorenz curves using a Dirichlet distribution[J].Business and Economic
Statistics,2002(20):290-295.
[5]? ?王紅霞.基于一族新洛倫茲曲線的收入不平等測(cè)度:以湖北省城鎮(zhèn)及農(nóng)村的收入數(shù)據(jù)為例[J].經(jīng)濟(jì)評(píng)論,2009(3):22-28.
[6]? ?Duangkamon Chotikapanich,D.S.Prasada Rao,Kam Ki Tang.Estimating income inequality in China using grouped data and the generalized Beta distribution[J].The Review of Income and Wealth,2007(53).
[責(zé)任編輯? ?文? ?欣]