曾先峰,章 潔
(西安外國語大學a.經濟金融學院;b.資源環(huán)境與產業(yè)經濟學研究中心,西安 710128)
居民消費價格指數(CPI)反映居民購買生活用品和服務價格水平的變動情況,既是度量一個國家或地區(qū)通貨膨脹率的核心指標,同時也是考察居民生活成本以及真實收入水平變動的關鍵,更關系到國家宏觀政策的制定與實行,因此科學準確地估算CPI偏差對政府和政策決策者有重要的意義。但是在政府部門統(tǒng)計CPI的過程中存在四類偏差,即“替代偏差”、“質量改進偏差”、“新產品偏差”以及“購買途徑偏差”[1]。
關于CPI偏差的測量,Hamilton-Costa[2]最早提出了利用恩格爾曲線估算CPI偏差。該方法從居民生活成本的角度出發(fā),通過檢驗恩格爾曲線的穩(wěn)定性來測定CPI偏差。由于該方法的簡便性及其結果的直觀性,被廣泛用于不同國家不同時期的CPI偏差的估算。例如Beatty和Larsen(2005)[3]使用恩格爾曲線估計加拿大的CPI偏差;Gibson等(2004)[4]對俄羅斯的CPI偏差進行了估計;還有一些學者在這一方法上進行了延伸,例如Papalia(2006)估計了不同地區(qū)CPI偏差;Almas(2007)估計了購買了平價偏差。
中國估算CPI偏差的研究相對較少。與本文相關的文獻,如許永洪和曾五一(2009)[5]利用1997—2006年城市收支統(tǒng)計數據研究了食品的恩格爾曲線和CPI偏差,結果表明除了1997年,中國官方CPI在其他年份不存在偏差。Nakmura等(2014)[6]則在該方法上有一些延伸,通過不同商品的恩格爾曲線解釋了引起CPI偏差真正的原因。與上述文獻不同,一是本文將研究的時間維度拓展到1995—2014年以捕捉金融危機之后CPI偏差的動態(tài)變化,二是使用了工具變量回歸法,該方法能很好地避免普通最小二乘法帶來的內生性問題,估算結果也更加準確。
此外,對中國統(tǒng)計數據的可靠性,在學術界歷來就存在較大的爭議。最新的一份研究報告(2016)[7]指出,中國GDP數據的可靠性排名為世界的第63位。因此,本文研究的另一層含義,即為驗證中國官方統(tǒng)計數據的可靠性提供了依據。
本文是基于 Nakamura(1996),Hamilton(2001)[1]和Costa(2001)[8]研究CPI偏差所采用的方法。Hamilton-Costa(2001)[1]是根據 Angus S.Deaton 和 Muellbauser(1980)[9]的理想需求系統(tǒng)(Almost Ideal Demand System,AIDS)提出了估算CPI偏差的核心方程:
其中,ω表示食品支出在家庭總消費支出中所占的比重;PF、PN、P分別表示不可觀測的食品、非食品和所有商品的價格指數;Y表示名義家庭消費總支出水平;X表示家庭特征的一組變量;μ表示殘差;下標t表示年份,j表示區(qū)域(城市),i表示家庭。且實際生活成本Pj,t是食品價格和非食品價格的加權平均:
一般情況下,食品價格指數PF、非食品價格指數PN和總價格指數的統(tǒng)計值與真實值之間有測量偏差,那么其形式可變?yōu)椋?/p>
P0表示基期的真實價格,Π表示0到t期的價格累計變動百分比,E表示0到t期累計的價格觀測偏差。食品和非食品的價格偏差與之類似。
假設CPI偏差不隨地區(qū)變化而變化,將式(2)和式(3)帶入理想需求系統(tǒng)——方程(1),并以小寫字母p和y代替支出Y和價格P的對數形式,π和ε代替(1+Π)和(1+E)的對數形式,得到新的理想需求系統(tǒng)形式為:
假設不同的區(qū)域具有相同的價格偏差,則方程(4)可化為:
Dt和Dj分別是時間和地域的虛擬變量,在第t年的虛擬變量Dt等于1,其他年份等于0,在第j個地區(qū)Dj等于1,其他地區(qū)為0。δt和δj分別為Dt和Dj的系數。時間虛擬變量的系數對CPI偏差的估計十分重要。
時間虛擬變量Dt的系數為:
假設對于所有年份,食品偏差εF,t和非食品偏差εN,t之間的關系為固定比例(r),即:εF,t=rεN,t,則CPI偏差可以表示為:
r是 εF,t和 εN,t的比例,即食品和非食品中CPI偏差的比例。α是生活成本指數中食品價格的份額。如果方程(7)中的γ或(1-r)趨近于0,那么該方程的最終表示極有可能是正確的。通常假設r=1,即食品和非食品的偏差具有相同的偏差程度。如果γ<1,就會低估CPI偏差,反之則會出現高估,而這兩種情況本文都不予考慮。
當γ或1-r趨近于0時:
因此,在時期t,累計的CPI偏差為:
本文使用1995—2014年30個(西藏除外)①西藏數據在1995—1997年數據缺失,且恩格爾系數與其他省份有很大差距,所以本文剔除了西藏的數據。省市的城鎮(zhèn)住戶的面板數據對我國的CPI偏差進行估算。數據主要來源于《中國統(tǒng)計年鑒》(1995—2015歷年卷)、《中國城市(鎮(zhèn))生活與價格年鑒》(1995—2012歷年卷)、《中國住戶調查年鑒》(2013年、2014年)。
主要涉及的變量有:人均現金消費支出、人均食品消費支出、各種價格指數、人均可支配收入以及家庭人口數、有收入者人數、老年人撫養(yǎng)比、兒童撫養(yǎng)比等家庭特征變量。由于2014年消費支出的統(tǒng)計口徑發(fā)生變化,為維持口徑的一致性,2014年的消費支出是按照2013年新舊口徑下的統(tǒng)計數據同比轉換得到的。為分析近二十年來CPI的變動,本文選擇將歷年價格指數均轉換為以1995年為基期的定基價格指數。非食品價格指數是由食品價格指數和CPI匡算得到。家庭人口數和有收入者人數缺失2013年和2014兩個年度的數據,估算方法是根據2012年與2011年數據按照同比增長進行相應的推算所得。
方程(5)中的被解釋變量為恩格爾系數(食品支出占總現金消費支出的比重),主要的解釋變量包括真實的總消費支出、相對價格變化、家庭特征變量以及時間、地區(qū)虛擬變量。真實的總消費支出是由名義的人均現金消費支出和居民消費價格指數各自取對數后相減所得。食品和非食品的相關價格變化是由食品定基價格指數與非食品定基價格指數各自取對數后相減得到的,因為該變化會引起商品之間的替代效應從而會產生替代效應偏差,所以可以將該變量作為獨立的解釋變量。家庭人口數量的變化影響的是家庭人口規(guī)模的轉變。Trevon D.Logan(2009)[10]說明了家庭規(guī)模變化會帶來家庭規(guī)模經濟效應,從而降低人均食品支出,因此若忽略家庭人口數量的影響,則會高估CPI偏差和生活成本。所以,本文將家庭人口數等特征變量均作為獨立的解釋變量以研究其對食品支出份額的影響。此外,本文還有一個控制變量——人均可支配收入,因為消費支出受收入的影響較大,故將人均可支配收入作為真實的總消費支出的控制變量進行工具變量回歸分析。因為方程(5)是一個線性模型,所以可以使用最小二乘法(OLS)對模型進行回歸估計。然而該方法不能消除解釋變量可能存在內生性的問題,故應該同時使用工具變量法對方程進行回歸估計,并將兩種方法的回歸結果進行對比分析。
本文依照經驗分析判定真實的總消費支出為內生解釋變量,并將人均可支配收入作為其工具變量。然而單純的判斷有可能產生錯誤致使得到的結果并非最有效的。Hausman檢驗提供了內生性檢驗的方法,通過比較普通最小二乘法(OLS)與工具變量回歸(IV)估計量的統(tǒng)計值,從而進行判定是否存在內生性。檢驗結果顯示,卡方值為83.68,接受原假設的概率p為0,說明在5%的顯著水平下,可以拒絕外生性的原假設,即接受備擇假設,認為真實的總消費支出為內生解釋變量,且人均可支配收入為其工具變量。此外,Hausman檢驗結果也表明應當使用固定效應的工具變量回歸得到估計量的統(tǒng)計值。為了更好地觀察OLS與IV回歸結果之間的不同,本文將同時進行兩種回歸分析,并將結果進行比較。
表1是使用stata12.0對方程(5)進行OLS和IV估計的結果,由于時間和地區(qū)虛擬變量過于冗長,在回歸結果中沒有逐一顯示。從整個方程的回歸效果來看,兩種方法的擬合優(yōu)度分別為0.9258和0.9174,說明樣本中絕大多數能被回歸方程解釋,從R2的角度看,城市統(tǒng)計數據的擬合效果不亞于Hamilton原文獻(調整后的R2系數為0.538)。
表1 方程(5)OLS和IV回歸結果
由表1中回歸結果對比可知,無論使用哪一種回歸方法,真實家庭總支出的系數均為負的,說明食品支出份額隨著人均總消費支出的上升而逐漸下降,這與恩格爾定理是一致的。食品相對于非食品的相關價格系數為正,意味著食品相對價格的變化會引起食品支出份額的同方向變化。家庭人口數的系數為負,即食品支出份額隨著家庭人口的增加而下降,這與其他學者所得出的結論是相同的。
由Hausman檢驗可知,真實的消費支出存在內生性,因此將人均可支配收入作為其工具變量帶入回歸方程,對比兩種回歸結果,使用IV估計出來的真實的消費支出水平前的系數(-0.229)的絕對值要比OLS估計值(-0.1240)大且更顯著,說明使用IV估計出來的消費支出水平對食品支出份額的影響更大。類似的,從IV和OLS的其他變量的估計值比較來看,使用工具變量估計值所表現出的對食品支出份額的影響更大。
方程(5)中加入時間和地區(qū)虛擬變量的回歸結果顯示,OLS估計結果中的時間虛擬變量均顯著,地區(qū)虛擬變量除了北京、天津、江蘇、浙江、江西、湖北、四川、貴州、青海這9個省市的系數不顯著,其他21個省市的系數均高度顯著。這一方面說明相似家庭結構(省市)、相同價格和消費支出水平家庭在不同年份都有一定程度的偏差,另一方面也說明不同地區(qū)的恩格爾系數不同,地域的差異性較為明顯。而IV估計結果顯示,1995—2002年的時間虛擬變量高度顯著,2003—2014年均不顯著,這說明2003—2014年我國的CPI不存在偏差。對于地區(qū)虛擬變量,只有北京、天津、江蘇、安徽、江西、四川、貴州這7個省市的系數不顯著。兩種回歸結果均說明了中國的CPI存在偏差。圖1顯示的是恩格爾曲線變動趨勢圖。
圖1 恩格爾系數變動趨勢圖
首先,從兩種模型的回歸結果來看,就單個曲線的變化趨勢而言是不符合恩格爾定理的,即食品支出份額隨著時間的推移表現出逐漸減小的趨勢。其中2004年、2008年、2011年與上年相比均有所上升,尤其是2008年上升幅度最大。這可能是由于物價和收入等其他因素變動使得居民為了維持相同效用水平生活及時調整了生活支出的構成。其次,根據OLS估計調整的恩格爾系數比原始的恩格爾系數變化幅度更大,而IV估計下調整的恩格爾系數要明顯平緩一些,且在2004年后和原始數據保持一致。兩種方法估計出來的恩格爾系數與原始的有差異,正說明了我國的CPI是存在偏差的。
此外,大部分城市虛擬變量也顯著,說明中國城市恩格爾系數的地域差異也是很明顯的。如上海、廣東、福建等8個城市的恩格爾系數與全國相比有向上的偏差,河南、山東、陜西等13個城市的恩格爾系數則有向下的偏差。由于各個城市采用的統(tǒng)計口徑是一致的,城市之間恩格爾系數的差異可能是由于不同地區(qū)居民的消費習慣的差異所引起的。
依據公式(9)計算得出以1995年為基期的消費者價格指數偏差和真實生活成本指數如表2所示。
表2 1995—2014年CPI和調整偏差后的CPI
OLS回歸結果表明我國1995—2014年間的定基CPI指數與生活成本指數之間存在一定的正向偏差,即所公布的CPI指數高于居民實際生活費用指數。通過式(9)計算得出各個年份的累積CPI偏差,每年CPI偏差變動范圍為0.09和0.51,平均每年變動0.398個百分點,與官方CPI平均每年2.599個百分點的變動相比,大概六分之一的CPI變動是由CPI偏差引起的。IV回歸結果則表明,在2003年之前,每年都存在正的偏差,且每年偏差均小于OLS估算的偏差大小,但在2003年后,由于時間虛擬變量均不顯著,因此可認為官方CPI并不存在偏差。
雷懷英(2016)[11]估算的以2000年為基年的定基CPI偏差結果表明,只有2004年、2005年、2007年、2008年、2009年、2011年、2012年存在負的CPI偏差,其他年份均存在正的CPI偏差,年平均CPI偏差約0.06個百分點。本文計算得出的CPI偏差與國內學者相比,差異較大。但與國外學者的研究相比,如Hamilton(2001)[2]估算的美國1982—1991年CPI偏差國際上測算的年平均CPI偏差約為 0.67 個百分點,John Gibson(2007)[4]估算的俄羅斯1994—2001年的CPI偏差范圍是0.64~0.87個百分點,本文對中國CPI偏差的估算結果在合理的范圍內變動,這也可以間接的論證了中國的官方數據大體上是可靠的。
真實的收入水平與消費支出是衡量一國福利水平的重要指標。如果CPI存在偏差,必然影響由名義量經CPI平減后的真實量的準確性與可靠性,從而可能對收入和消費指標產生誤判。本文的研究發(fā)現,官方公布的CPI數據存在向上的偏差,對偏差進行調整后的CPI數據高于官方公布的數據。從而,根據官方數據核算的真實收入和消費支出可能存在高估。圖2是根據官方數據對CPI偏差進行調整后CPI數據核算的真實城鎮(zhèn)居民人均可支配收入與消費支出數據。
圖2 實際人均可支配收入與消費支出趨勢圖
圖2表明,根據調整后的CPI估算的真實收入和消費支出要低于根據官方數據所估算的相應量,而且在變化趨勢表現出高度的一致性。與調整后相比,官方的真實收入和消費支出在1995—2014年高估約23.76個百分點。
本文通過將Hamilton—Costa方法引入中國CPI偏差估計,利用現有城市價格和收支統(tǒng)計數據,在假定恩格爾定理存在的情況下,得到兩點主要的結論:
第一,實證表明,以1995年作為基年,1996—2014年中國城市的定基CPI與生活成本指數之間都存在向上偏差,偏差幅度為0.09~0.51個百分點之間,年均CPI偏差約0.398個百分點。CPI偏差會誤導政府、企業(yè)及個人的決策,同時還會引起公眾對CPI可靠性的質疑。調整后的CPI數據對名義變量進行調整,表明我國實際的人均收入和消費支出被高估了,平均每年高估約23.76個百分點。
第二,中國恩格爾系數波動較大,且沒有表現出隨時間的推移而逐漸減少的趨勢,平均每年大約有0.07個百分點的向下偏差,這可能是由于物價等其他因素變動所引起的居民為維持相同效用水平的生活經常需要調整生活支出構成。此外,對不同地區(qū)的恩格爾系數進行對比發(fā)現,上海、廣東、福建等8個城市的恩格爾系數與全國相比有向上的偏差,河南、山東、陜西等13個城市的恩格爾系數則有向下的偏差,這種恩格爾曲線的差異主要是由于消費的地域特征引起的,不能以恩格爾系數簡單的對比來評價不同城市的發(fā)展水平。
由于編制理論和方法的差異,導致以固定籃子編制的CPI和生活成本指數之間會存在明顯的差異,這種差異會讓人們從生活成本的角度明顯地感知到CPI是存在偏差的。因此,我國應該及時對CPI中存在的偏差進行估算和分析,以便對其編制方法進行針對性的改進,從而提高CPI等官方數據的可靠性。
[1]Hausman J.Sources of Bias and Solutions to Bias in the CPI[J].Jour?nal of Political Economy,2003,(17).
[2]Hamilton B W.Using Engle’s Law to Estimate CPI Bias[J].The Amer?ican Economic Review,2001,91(3).
[3]Betty T K M,Larsen E R.Using Engle Curves to Estimate Bias in the Canadian CPI as a Cost of Living Index[J].Canadian Journal of Eco?nomic,2005,38(2).
[4]GibsonJ,StillmanS,et al.CPI Bias and Real Living Standards in Rus?sia During the Transition[J].Journal of Development Economics,2007.
[5]許永洪,曾五一.基于中國城市統(tǒng)計數據的CPI偏差估計[J].統(tǒng)計研究,2009,(4).
[6]Nakamura E,Steinsson J,Liu M.Are Chinese Growth and Inflation Too Smooth?Evidence From Engle Curves[J].National Bureau of Eco?nomic Research,2014.
[7]全球GDP數據可靠程度排名:瑞士居首海地墊底[R].數獨,2016,(1).
[8]Costa D L.Estimating Real Income in the United States From 1888 to 1994:Correcting CPI Bias Using Engle Curves[J].Journal of Political Economy,2001,109(6).
[9]Deaton A,Muellbauer J.An Almost Ideal System[J].The American Economic Review,1980,70(3).
[10]Logan T D.Are Engle Curve Estimates of CPI Bias Biased[J].Histor?ical Methods:A Journal of Quantitative and Interdiscriplinary Histo?ry,2009,42(3).
[11]雷懷英,王童,趙文婭.基于Hamilton-Costa模型的CPI偏差測定研究[J].經濟問題,2016,(4).