国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

對地區(qū)基尼系數(shù)與幸福感關(guān)系的“現(xiàn)象核實”
——基于對數(shù)據(jù)生成過程的考察

2023-03-05 08:44:52
社會科學(xué)研究 2023年1期
關(guān)鍵詞:大都市基尼系數(shù)區(qū)縣

高 勇

默頓①Robert K.Merton,“Three Fragments from a Sociologist’s Notebooks:Establishing the Phenomenon,Specified Ignorance,and Strategic Research Materials,”Annual Review of Sociology,vol.13,1987,pp.1-28.曾經(jīng)觀察到,雖然在核實現(xiàn)象存在之后再去進行解釋是看似不言自明的道理,但是在科學(xué)研究中,與這個道理相反的事情并不少見。究其原因,或者是因為這樣一種核對事實的工作很容易被貶斥為“純粹經(jīng)驗性的事實收集”,或者是因為研究者在意識形態(tài)或理論期待的指引下會直接跳過這樣一個“簡單環(huán)節(jié)”。然而,“現(xiàn)象核實”(Establishing the Phenomenon)往往并不是一件輕而易舉的事情,尤其研究對象是紛繁復(fù)雜的社會現(xiàn)象時。

本文就是對于地區(qū)基尼系數(shù)與幸福感之間關(guān)系的現(xiàn)象核實。研究地區(qū)基尼系數(shù)與幸福感的關(guān)系,其理論意義在于探討行動者的主觀觀念或主觀感受與所處社會情境的客觀特征之間的關(guān)聯(lián)機制?;诓煌恼{(diào)查數(shù)據(jù),以往的研究對此得出了彼此沖突的結(jié)論。這種情況與研究者單純以系數(shù)的統(tǒng)計顯著性為指標的研究方式有關(guān),它往往導(dǎo)致對數(shù)據(jù)生成過程的思考不足。本文試圖一方面通過對數(shù)據(jù)生成過程的認真考察,揭示出地區(qū)基尼系數(shù)與幸福感之間的關(guān)聯(lián)并沒有足夠堅實的統(tǒng)計證據(jù),以完成這一基本的“現(xiàn)象核實”工作;另一方面,借此例證表明單純以系數(shù)的統(tǒng)計顯著性為指引和目標的工作方式是存在缺陷的,定量研究并不一定是線性的假設(shè)驗證過程,而完全可以也應(yīng)當是在經(jīng)驗數(shù)據(jù)與解釋邏輯之間循環(huán)往復(fù)從而不斷逼近事實真相的過程。

我們首先回顧和梳理有關(guān)地區(qū)基尼系數(shù)與幸福感之間關(guān)系的相關(guān)研究文獻,明確這個經(jīng)驗問題的理論意義;然后進行常規(guī)的統(tǒng)計模型操作,看單純依據(jù)系數(shù)的統(tǒng)計顯著性為指標會得出何種結(jié)論;在此基礎(chǔ)上再考察數(shù)據(jù)生成過程,以便挖掘出重要的控制變量來澄清背后隱藏的真正邏輯,說明兩者之間的關(guān)系至少不像表面那樣穩(wěn)健,甚至可能只是一種統(tǒng)計假象;最后,我們再回到對經(jīng)驗問題的理論討論中來,對社會感受的形成機制進行一些探索性的思考,并對其中涉及的研究方法取向進行一些反思。

一、問題的意義:主觀感受與客觀結(jié)構(gòu)

行動者所處社會環(huán)境中的收入不平等程度與行動者的主觀觀念或感受之間有何關(guān)聯(lián),這是一個重要的研究問題。利用全國綜合抽樣調(diào)查數(shù)據(jù)(如CGSS)計算得出區(qū)縣(甚至更小單位的)基尼系數(shù)(或泰爾指數(shù)等相似指標),然后引入回歸模型進行分析,這是一種討論收入不平等效應(yīng)的常見做法。利用這種方法,研究者們考察了地區(qū)基尼系數(shù)對個體幸福感或生活滿意度的效應(yīng)、對于居民信任和政府信任的效應(yīng)、對于收入差距容忍度的效應(yīng)等等。

對相關(guān)研究的結(jié)論進行梳理后,就會發(fā)現(xiàn)一種令人不解的現(xiàn)象:在這些研究當中,區(qū)縣基尼系數(shù)的效應(yīng)多數(shù)都是顯著的,但是在因變量相同的情況下,效應(yīng)方向卻時而為正,時而為負,并不確定。另外,有研究者發(fā)現(xiàn)了“倒U型曲線關(guān)系”,也有研究者發(fā)現(xiàn)這種曲線關(guān)系并不存在。基于不同的經(jīng)驗發(fā)現(xiàn),研究者又各自提出了不同的解釋邏輯。以地區(qū)基尼系數(shù)與幸福感的關(guān)系研究為例,在現(xiàn)在文獻中大致有如下兩類截然不同的結(jié)論:

(一)負向關(guān)系與“相對比較”邏輯

許多研究的結(jié)果顯示,地區(qū)基尼系數(shù)與幸福感的效應(yīng)估計值為負且統(tǒng)計顯著,收入不平等程度顯著地損害了各個階層的幸福感。①王鵬:《收入差距對中國居民主觀幸福感的影響分析——基于中國綜合社會調(diào)查數(shù)據(jù)的實證研究》,《中國人口科學(xué)》2011年第3期;何立新、潘春陽:《破解中國的“Easterlin悖論”:收入差距、機會不均與居民幸福感》,《管理世界》2011年第8期;巫錫煒、肖珊珊:《地區(qū)差異與我國居民主觀幸福感》,《青年研究》2013年第1期;黃嘉文:《收入不平等對中國居民幸福感的影響及其機制研究》,《社會》2016年第2期;王健、張煥明、李超:《收入差距對居民幸福指數(shù)的影響研究——基于2013年CGSS數(shù)據(jù)的實證分析》,《寧夏大學(xué)學(xué)報》(人文社會科學(xué)版)2017年第6期;Wu,Xiaogang and Jun Li,“Income Inequality,Economic Growth,and Subjective Well-Being:Evidence from China,”Research in Social Stratification and Mobility,vol.52,2017,pp.49-58.這些研究多數(shù)都是利用CGSS2005和CGSS2006年數(shù)據(jù)進行的。某些早期研究采用一般線性回歸模型進行估計,這種研究方式忽略了數(shù)據(jù)本身存在的層級結(jié)構(gòu),可能高估參數(shù)的效應(yīng)。區(qū)縣基尼系數(shù)本身是一個宏觀背景變量,因此數(shù)據(jù)本身具有層級結(jié)構(gòu),只有利用層級模型才有可能對此進行精準估計。后來的研究采用多水平模型(也被稱為層級線性模型),使得估計值更為精準。對于地區(qū)基尼系數(shù)的估計方式有兩類:一種是直接利用CGSS調(diào)查數(shù)據(jù)進行估算,另一種是利用樣本量更大的2005年1%人口抽樣調(diào)查數(shù)據(jù)進行估算②巫錫煒、肖珊珊:《地區(qū)差異與我國居民主觀幸福感》;Wu,Xiaogang and Jun Li,“Income Inequality,Economic Growth,and Subjective Well-Being:Evidence from China.”,后一種估算方式應(yīng)當更為精準。還有研究者在利用多水平模型進行系數(shù)估計后,還構(gòu)建了面板數(shù)據(jù)來看地區(qū)基尼系數(shù)的變動引發(fā)的幸福感變動。③Wu,Xiaogang and Jun Li,“Income Inequality,Economic Growth,and Subjective Well-Being:Evidence from China.”對這些結(jié)果的解釋主要是從“相對比較”的角度進行的:個體非常關(guān)注自身與他人相比的相對位置,這種比較和評估是在一個局部背景中相對于某一個參照群體進行的。擁有同樣收入的個體,如果處在不平等程度更大的局部環(huán)境中,他就更有可能產(chǎn)生挫敗感,進而降低其幸福感。

(二)正向關(guān)系與“隧道效應(yīng)”邏輯

另有一部分研究的結(jié)果顯示,區(qū)縣基尼系數(shù)與幸福感之間呈現(xiàn)出顯著的正向關(guān)聯(lián):收入不平等程度越高,幸福感反而越高。④Knight J.,Song L,and Gunatilaka R.,“Subjective Well-being and Its Determinants in Rural China,”China Economic Review,vol.20,no.4,2009,pp.635-649;馬萬超、王湘紅、李輝:《收入差距對幸福感的影響機制研究》,《經(jīng)濟學(xué)動態(tài)》2018年第11期;劉自敏、楊丹、張巍?。骸妒杖氩黄降取⑸鐣c認知幸福感》,《山西財經(jīng)大學(xué)學(xué)報》2018年第5期。這部分研究利用的數(shù)據(jù)包括2002年中國家庭收入調(diào)查(CHIP)數(shù)據(jù)、2010—2015年的CGSS五期面板數(shù)據(jù)、2014年社會發(fā)展與社會態(tài)度調(diào)查(NISD)數(shù)據(jù)等。研究者使用的統(tǒng)計模型既有一般線性回歸,也包括層級線性模型。對于地區(qū)基尼系數(shù)與幸福感之間的正向關(guān)聯(lián),多數(shù)研究者是從所謂“隧道效應(yīng)”的角度進行解釋的。赫希曼等人提出,人們對于不平等的容忍程度是隨著發(fā)展的不同階段而變化的。①Hirschman A.O.and Rothschild M.,“The Changing Tolerance for Income Inequality in the Course of Economic Development,”Quarterly Journal of Economics,vol.87,no.4,1973,pp.544-566.在發(fā)展的早期階段,盡管收入差距逐漸拉開,但是人們對于不平等具有相當?shù)娜萑坛潭?,這是因為高收入者為他們提供了生活改善的希望與前景,如同處在交通堵塞的隧道中的司機在看到旁邊車道開始移動時,即使自己還沒有移動也會充滿希望一樣。這樣一種看到他人狀況提升而帶來的希望就是“隧道效應(yīng)”。赫希曼提出的隧道效應(yīng)假說,針對的是隨時間發(fā)展的動態(tài)過程中呈現(xiàn)的模式。但是上述研究將隧道效應(yīng)的邏輯引來解釋同一個時點對不同地區(qū)進行比較呈現(xiàn)出來的模式。②此外,赫希曼的“隧道效應(yīng)”針對的主要研究單位是國別而非同一國家內(nèi)部的不同地區(qū)。因此利用赫希曼的“隧道效應(yīng)”對地區(qū)基尼系數(shù)的效應(yīng)進行解釋時,研究單位其實也發(fā)生了變動。由此看來,區(qū)域內(nèi)收入不平等的適度增大,增強了人們對于未來生活福祉提升的預(yù)期,從而提升其幸福感。

(三)曲線關(guān)系與“隧道效應(yīng)”邏輯的拓展

也有研究發(fā)現(xiàn)區(qū)縣基尼系數(shù)與幸福感存在著倒U型關(guān)系:隨著收入不平等程度的擴大,個體的幸福感呈現(xiàn)出先增加后減少的態(tài)勢。③王鵬:《收入差距對中國居民主觀幸福感的影響分析——基于中國綜合社會調(diào)查數(shù)據(jù)的實證研究》;郝身永:《究竟是患寡、患不均還是患不公?——基于CGSS(2006)對居民幸福感決定的經(jīng)驗研究》,《云南財經(jīng)大學(xué)學(xué)報》2015年第5期;孫計領(lǐng):《收入不平等、分配公平感與幸?!罚督?jīng)濟學(xué)家》2016年第1期。這一發(fā)現(xiàn)的證據(jù),是基尼系數(shù)的平方項在回歸方程中的系數(shù)是顯著的(且符號為負)。還有研究者甚至發(fā)現(xiàn),這種倒U型關(guān)系在各個層面都普遍存在:不僅區(qū)縣基尼系數(shù)有這種關(guān)系,甚至鄉(xiāng)鎮(zhèn)/街道和社區(qū)基尼系數(shù)與幸福感均存在顯著的倒U型關(guān)系。對上述曲線關(guān)系同樣可以從“隧道效應(yīng)”的角度來進行解釋。赫希曼指出,如果過了發(fā)展的早期階段,收入不平等仍然持續(xù)擴大,那么人們對不平等就不再容忍了,就如同旁邊車道一直移動而自己的車道卻遲遲不動的司機,他必然會沮喪而且憤怒。由此推論,地區(qū)基尼系數(shù)與幸福感之間的關(guān)系是存在某個臨界值或門檻的:在此之前收入差距拉大使人們對未來經(jīng)濟福利有更高的信心,因此促進幸福感;在此之后收入差距拉大引發(fā)更多負面影響。不過需要存疑的一點是,這種曲線關(guān)系大多是在一般線性回歸模型中發(fā)現(xiàn)的,而利用層級線性模型進行的研究很少發(fā)現(xiàn)有“倒U型關(guān)系”存在。

如何看待上述彼此沖突的研究結(jié)論呢?本文試圖回到數(shù)據(jù)中,探測地區(qū)基尼系數(shù)與幸福感之間發(fā)生統(tǒng)計關(guān)聯(lián)的機制,完成這一基本的“現(xiàn)象核實”工作。

二、常規(guī)的統(tǒng)計模型操作:以系數(shù)顯著性為指標

在本節(jié),我們用CGSS2013數(shù)據(jù)來對地區(qū)基尼系數(shù)與幸福感之間關(guān)系進行常規(guī)的統(tǒng)計模型操作,以了解兩者之間是否存在經(jīng)驗關(guān)聯(lián)以及關(guān)聯(lián)的方向與強度。

(一)相關(guān)分析與一般線性回歸

CGSS2013年數(shù)據(jù)中包括來自126個區(qū)縣的被訪者,多數(shù)區(qū)縣都有100名左右的被訪者。我們可以用這些被訪者的家庭收入數(shù)據(jù)來估算他們所在區(qū)縣的基尼系數(shù)。④這種估算當然并不精確,包括了一定程度的測量誤差。我們在后面會討論測量誤差對分析可能帶來的影響。數(shù)據(jù)中對于幸福感的測量是定序尺度的:“總的來說,您覺得您的生活是否幸福?”選項是從“非常不幸?!钡健胺浅P腋!钡奈宥葏^(qū)分。初步的計算表明,區(qū)縣基尼系數(shù)與區(qū)縣被訪者的幸福感均值的相關(guān)系數(shù)為0.20(P<0.05)。區(qū)縣基尼系數(shù)與幸福感確實是相關(guān)的,而且在統(tǒng)計上非常顯著。兩者是正相關(guān)關(guān)系:區(qū)縣基尼系數(shù)越大,幸福感的評價值越高。

我們繼續(xù)進行多元回歸分析,這樣就可以在控制其他相關(guān)因素的條件下,更為準確地了解它們之間的關(guān)系。我們納入如下控制變量,包括性別、年齡、受教育年限、家庭總收入的對數(shù)、居住地類型(城市/農(nóng)村)、身體健康狀況、當前是否有配偶,然后運行多元回歸(模型1)。模型1的結(jié)果顯示在表1中第一欄中。我們看到區(qū)縣基尼系數(shù)的回歸系數(shù)為0.61,仍然是正的;這一系數(shù)值的t值為6.21,在統(tǒng)計上極其顯著??磥恚八淼佬?yīng)”的解釋是更有道理的。

當然,如果“隧道效應(yīng)”的解釋是正確的,那么區(qū)縣基尼系數(shù)與幸福感之間的關(guān)系就應(yīng)該有一個先升后降的過程。我們在回歸方程中加入基尼系數(shù)的平方項,以此檢驗這種曲線關(guān)系是否存在(模型2)。模型2的結(jié)果非常理想,平方項的系數(shù)為負且非常顯著,這表明基尼系數(shù)與幸福感的關(guān)系確實存在這樣一種先升后降的過程。倒U型曲線意味著某個臨界值或門檻的存在:在此之前收入差距拉大使人們對未來經(jīng)濟福利有更高的信心,因此促進幸福感;在此之后收入差距拉大引發(fā)更多負面影響。根據(jù)系數(shù)估計值,這一U型關(guān)系的拐點大約發(fā)生在基尼系數(shù)為0.5左右,而多數(shù)樣本區(qū)縣的基尼系數(shù)在0.5以下,因此我們用線性關(guān)系來估計時它就表現(xiàn)為正向關(guān)系。

(二)統(tǒng)計模型的精細化

一般線性回歸的諸多前提在此并不能夠完全滿足,因此我們應(yīng)該在統(tǒng)計模型上進一步精細化,采用更“高級”的統(tǒng)計方式來提升統(tǒng)計估計的精度。

首先,因變量“幸福感”并不是一個定距變量,而是一個五類別的定序變量。因此,線性回歸的模型設(shè)定并不完全正確,我們應(yīng)當采用定序logistic的統(tǒng)計模型來進行估計才是更準確的選擇。我們由此估計了模型3(見表1):多數(shù)變量的統(tǒng)計顯著性幾乎沒有任何變化,而我們最關(guān)心的變量“基尼系數(shù)”的統(tǒng)計顯著性甚至有了大幅度增加。統(tǒng)計模型的精細化并沒有否決我們的前述結(jié)論,反而讓我們對結(jié)論更有信心。

此外,CGSS數(shù)據(jù)是嵌入于某種層級結(jié)構(gòu)(個體-居委會-區(qū)縣)當中的,我們原先并沒有在模型設(shè)定中注意這一點。樣本中的案例并不是統(tǒng)計獨立的,同一區(qū)縣中的個案擁有相同的基尼系數(shù)值?;诖朔N考慮,我們可以采用層級線性模型(HLM模型),在模型設(shè)置中加入隨機截距項。估計結(jié)果如表1中的模型4所示:區(qū)縣基尼系數(shù)的效應(yīng)仍然在統(tǒng)計上非常顯著,雖然標準差有所增大,t值有所減小。看來,我們的結(jié)果是非常穩(wěn)健的。

表1 對區(qū)縣基尼系數(shù)與幸福感關(guān)系的初始模型擬合

在上面的層級線性模型中,我們是把因變量“幸福感”作為定距變量處理的。如果既考慮數(shù)據(jù)的層級結(jié)構(gòu),同時又考慮到因變量的定序特性,我們就應(yīng)當采用廣義層級線性模型(HGLM模型)。對于定序因變量來說,這種模型也被稱為累積性連接混合模型(Cumulative Link Mixed Models),采用這樣的模型才能得到最為精確的系數(shù)估計和標準誤估計。在計算機軟件的幫助下,我們再次運行了HGLM模型(模型5)。區(qū)縣基尼系數(shù)的系數(shù)估計仍然非常顯著??磥?,更為復(fù)雜前沿的統(tǒng)計技術(shù)對于系數(shù)數(shù)值及其統(tǒng)計顯著性有所改變,但是并不能推翻我們的前述基本看法。

最后,還有一個麻煩需要認真考慮,即測量誤差問題。我們使用的核心自變量“區(qū)縣基尼系數(shù)”是僅僅基于每個區(qū)縣100個左右的樣本而得出的,這里面應(yīng)該包括了比較大的測量誤差。我們還要考慮到,在CGSS數(shù)據(jù)中,抽樣方式并非簡單隨機抽樣,而是多階段分層抽樣。樣本并不是隨機分散于區(qū)縣中的,而是匯集在區(qū)縣中的少數(shù)村居委會。如果不同階級在居住空間上有較大的集中性,那么這樣一種抽樣方式得到的樣本的代表性就可能比較差,從而導(dǎo)致測量誤差比簡單隨機抽樣設(shè)計下要大很多。更何況,作為一種結(jié)構(gòu)性測量指標的基尼系數(shù)比通常的矩統(tǒng)計量更容易產(chǎn)生較大的抽樣誤差。因此,這一核心自變量的測量精度是值得懷疑的。自變量存在測量誤差確實會引發(fā)估計量不再是無偏和一致的,但是這種影響會使得估計值比真實估計值更接近于0,從而降低其統(tǒng)計顯著性程度。①杰弗里·M.伍德里奇:《計量經(jīng)濟學(xué)導(dǎo)論:現(xiàn)代觀點》,張成思譯,北京:中國人民大學(xué)出版社,2018年,第249—252頁。因此,即便區(qū)縣基尼系數(shù)的測量確實存在較大的隨機性測量誤差,這也只能說明真實的效應(yīng)值應(yīng)該比我們估計出來的效應(yīng)值更大,在統(tǒng)計上更為顯著。測量誤差的存在只能說明我們的估計值可能更偏向于保守,而不可能動搖我們的核心結(jié)論。

如果單純以系數(shù)的統(tǒng)計顯著性為評判指標,那么區(qū)縣基尼系數(shù)與幸福感的正向關(guān)聯(lián)是非常穩(wěn)健的,得到了各種復(fù)雜統(tǒng)計模型的背書。疑問似乎已經(jīng)得到解答,探索似乎已經(jīng)可以結(jié)束。②以往的多數(shù)研究是到此為止的。但是,也有部分研究者(如Wu,Xiaogang and Jun Li,“Income Inequality,Economic Growth,and Subjective Well-Being:Evidence from China.”)意識到“可能存在著未觀察到的地區(qū)特征會同時影響收入不平等與人們的主觀福祉”,因此構(gòu)建了省級層面的面板數(shù)據(jù)來解決這種遺漏變量偏差。然而這種策略能夠有效的前提是面板數(shù)據(jù)分析中引入的時變變量沒有遺漏;遺漏變量問題并沒有因此消失,而只是轉(zhuǎn)化了存在的形式。如下文所述,如果不對數(shù)據(jù)生成過程進行深入考察,面板數(shù)據(jù)分析這一統(tǒng)計技術(shù)也不能確保結(jié)論的可靠性。

三、對數(shù)據(jù)生成過程的考察:“地區(qū)類型”的引入

(一)對情境與主體的追問:是哪些縣市推動變量關(guān)系得以呈現(xiàn)?

統(tǒng)計結(jié)果是對于變量關(guān)系的表述,這些變量本身又是對處于一定情境的社會主體特征的描述。因此,我們面對變量關(guān)系的上述表述時,也會希望再回到對社會情境與社會主體的理解上來:這種統(tǒng)計結(jié)果背后描述的是誰?是誰推動了這樣一種統(tǒng)計結(jié)果得以呈現(xiàn)?這是因為有一些城市收入不平等程度特別高,同時人們的幸福感也特別高嗎?這是哪些類型的城市?是不是通常所設(shè)想的那些大都市地區(qū)?或者,這是因為有一些城市收入不平等程度特別低,同時人們的幸福感也特別低?這又是哪些類型的城市?是那些經(jīng)濟發(fā)展更為滯后的地區(qū)嗎?上述諸多信息并不包括在模型系數(shù)的顯著性水平中,而必須再回到對數(shù)據(jù)的深入描述中才能掌握。

CGSS2013數(shù)據(jù)不提供調(diào)查案例所在區(qū)縣的具體名稱,但是提供了這些區(qū)縣所在的省份信息。我們繪制出了每個區(qū)縣基尼系數(shù)與幸福感均值的散點圖,并加入了擬合曲線(如圖1所示)。然后,我們對散點圖中那些區(qū)縣基尼系數(shù)小于0.3或者大于0.55的區(qū)縣標注出所在省份。從這一散點圖中,我們看出了重要的信息。

圖1 區(qū)縣基尼系數(shù)與幸福感均值的散點圖

第一,那些基尼系數(shù)估算值低于0.3的區(qū)縣大多處于北京、天津、廣東省等大都市地區(qū),基尼系數(shù)估算值高于0.55的區(qū)縣則大多處于云南、湖南、安徽等相對而言并不太發(fā)達的地區(qū)。然而,如果我們要用“隧道效應(yīng)”來進行解釋,那么基尼系數(shù)應(yīng)該是隨著經(jīng)濟發(fā)展狀況而提升的,那些相對不太發(fā)達的地區(qū)應(yīng)是基尼系數(shù)較低的,發(fā)達的地區(qū)應(yīng)是基尼系數(shù)較高的。經(jīng)驗數(shù)據(jù)的細節(jié)與理論解釋并不相符。

第二,在基尼系數(shù)估算值的大部分取值范圍中(大于0.3的部分),它與幸福感均值幾乎不存在線性關(guān)系,擬合線近似于一條水平線。只有在散點圖的左端,即當基尼系數(shù)小于0.3時,擬合線向上傾斜。左下方的一系列散點是形成這樣一種擬合曲線的原因。由此看來,變量之間存在統(tǒng)計關(guān)聯(lián),是因為有一部分基尼系數(shù)估算值較低同時幸福感也較低的城市,而不是因為有一部分基尼系數(shù)估算值較高同時幸福感也較高的城市。

第三,大都市樣本與非大都市樣本在散點圖中似乎分布在非常不同的區(qū)域,有著較為明顯的模式差異。這種模式差異有可能會影響我們對于基尼系數(shù)估算值與幸福感之間統(tǒng)計關(guān)聯(lián)的考察。

因此,盡管“隧道效應(yīng)”可以通過對于模型系數(shù)的統(tǒng)計顯著性檢驗,但是它與數(shù)據(jù)描述的上述細節(jié)無法吻合。這些探究源自對社會情境與社會主體的理解,它引導(dǎo)我們看到了更多的問題:為什么大都市樣本中測算出來的區(qū)縣基尼系數(shù)會比較低?為什么大都市樣本與非大都市樣本有不同的模式?這些模式會對我們原先的結(jié)果有何影響?為了回答這些問題,我們就需要認真查看數(shù)據(jù)的生成過程。

(二)為什么大都市樣本的基尼系數(shù)測算值相對較低?

在CGSS的抽樣方案中,存在著必選層與抽選層的設(shè)計①更多細節(jié)請參閱《中國綜合社會調(diào)查(CGSS)第二期(2010—2019)抽樣方案》,http://cgss.ruc.edu.cn/xmwd/cysj.htm。:

1.必選層是指那些發(fā)展處于國內(nèi)領(lǐng)先水平的大城市。CGSS第二期調(diào)查是從直轄市、省會城市和副省級城市共36座城市中,最終選取了經(jīng)濟水平、教育水平及城市開放性程度綜合指標最高的五個城市進行調(diào)查,分別是北京、上海、天津、廣州、深圳。對于必選層中,總樣本量為2000戶,樣本均為城市家庭戶。在必選層中,街道是初級抽樣單元,首先抽取40個街道,每個街道中抽取2個居委會,每個居委會抽取25個家庭戶。

2.抽選層是指除去必選層市轄區(qū)以外全國所有家庭戶。在抽選層中,總樣本量為10000戶,樣本既包括城市家庭戶也包括農(nóng)村家庭戶;區(qū)縣作為初級抽樣單位,首先抽取100個區(qū)縣,每個區(qū)縣中抽取4個居委會或村委會,每個居委會或村委會抽取25個家庭戶。

3.抽選層中的區(qū)縣需要進行居委會與村委會的配比。配比是根據(jù)區(qū)縣城市化水平(非農(nóng)人口比重)來決定的:非農(nóng)人口比例在95%以上的區(qū)縣,4個二級抽樣單元全部是居委會;這一指標在50%—95%之間的區(qū)縣,抽取3個居委會和1個村委會;指標在15%—50%之間的區(qū)縣,抽取2個居委會和2個村委會;指標在15%以下的區(qū)縣,抽取1個居委會和3個村委會。

在這樣的抽樣設(shè)計方案下,我們可以有如下推斷:

第一,不同類型地區(qū)的樣本的城鄉(xiāng)異質(zhì)性有很大差異,而城鄉(xiāng)異質(zhì)性直接影響測算出來的基尼系數(shù)大小。必選層中的大城市樣本全部來自居委會,基尼系數(shù)因此會較??;抽選層中的區(qū)縣樣本中既有居委會也有村委會,基尼系數(shù)因此會較大。區(qū)縣樣本中居委會/村委會的配比與測算出來的基尼系數(shù)之間的關(guān)系如表2所示。

表2 CGSS2013樣本區(qū)縣中居委會/村委會的不同配比與基尼系數(shù)的關(guān)系

第二,不同類型地區(qū)的樣本數(shù)量及代表性有所不同,這同樣影響測算出來的基尼系數(shù)大小。大都市地區(qū)樣本的初級抽樣單元為街道而不是區(qū)縣,多數(shù)區(qū)縣中最終僅被抽到了2個居委會(50個家庭戶樣本),且在同一街道;非大城市地區(qū)樣本中的初級抽樣單元為區(qū)縣,所有區(qū)縣都被抽中了4個村委會或居委會(100個家庭戶樣本),且在不同街道。利用地域集中程度更高、樣本量更小的數(shù)據(jù),測算出來的基尼系數(shù)當然會更低。此外,如果從嚴格的抽樣理論上來看,大都市地區(qū)樣本對區(qū)縣并無代表性。

第三,不同類型地區(qū)的居住隔離程度有所不同。由于城市房產(chǎn)價格的原因,大都市地區(qū)居住于同一居委會中的居民家庭收入往往較為接近。在農(nóng)村地區(qū),隸屬于同一村委會的村民因收入提升而搬離本村莊的可能性固然存在,但相對城市而言較小。如果大城市地區(qū)存在更嚴重的居住隔離的情況,利用上述多階抽樣方式測算出來的基尼系數(shù)也會相對偏小。

(三)在大都市樣本與非大都市樣本中,變量關(guān)系可能存在什么樣的不同模式?

由于不同地區(qū)類型內(nèi)部的城鄉(xiāng)異質(zhì)性有非常大的差異,也由于不同地區(qū)類型在抽樣中居委會與村委會的配比并不相同,因此測算出來的區(qū)縣基尼系數(shù)取值范圍有很大差異?;谏鲜隹紤],我們認為有必要區(qū)分樣本中的必選層(大都市地區(qū))與抽選層(其他地區(qū))來進行分析。我們先來直觀地看一下雙變量之間的散點圖(圖2)。圖2中的兩個圖其實是由圖1拆分而成:左邊顯示的是數(shù)據(jù)中必選層(大都市地區(qū))的情況,右邊顯示的是抽選層(非大都市地區(qū))的情況。

圖2 區(qū)分大城市樣本與非大城市樣本分析

從圖2中我們可以直觀地看出如下幾點:

第一,不同地區(qū)類型的基尼系數(shù)取值范圍完全不同:非大都市地區(qū)測算出的區(qū)縣基尼系數(shù)沒有低于0.3以下的情況;大都市地區(qū)測算出的區(qū)縣基尼系數(shù)除了上海市外,沒有高于0.4的情況。

第二,在非大都市地區(qū)中,區(qū)縣基尼系數(shù)與幸福感均值并無明顯的線性相關(guān)關(guān)系。在大都市地區(qū)中,粗略看起來兩個變量存在著正向相關(guān),但是圖中右上角的幾個散點非常特殊,它們都來自于上海樣本(圖中用十字形來代表),這些地區(qū)基尼系數(shù)估計值與幸福感均值都遠高于其他都市地區(qū)??磥砩虾J袠颖驹诖蠖际械貐^(qū)也有特殊性,我們有必要將其作為單獨對象來進行分析。①其原因值得探討,但是這并非本文的主旨。在去除上海樣本后,大都市地區(qū)的區(qū)縣基尼系數(shù)與幸福感均值之間并不存在任何明顯的相關(guān)關(guān)系。

第三,盡管分組分析時兩個變量并不存在任何線性關(guān)系,但是當兩者合并起來時,由于代表大都市的散點位于左下角,代表非大都市的散點位于右上角,結(jié)果使得兩個變量之間看似存在正向相關(guān)關(guān)系。這是一個類似于經(jīng)典的“辛普森悖論”的結(jié)果。

我們進一步把非大都市區(qū)的樣本按照區(qū)縣中居委會與村委會的配比進行細分,然后進行分組分析,結(jié)果如圖3所示。圖3中共有四個小圖,分別代表4個二級抽樣單元中有1個居委會到4個居委會的情況;根據(jù)CGSS的抽樣方案,這實際上代表不同的城市化水平。從圖3中可以看出:第一,二級抽樣單元中居委會比重越高的區(qū)縣,測算出來的基尼系數(shù)也越小,因此散點越靠近左端;第二,基尼系數(shù)與幸福感的關(guān)系方向在第一組中是正向的,在其他三組中是負向的,總體而言并不存在穩(wěn)定的模式;第三,如果說基尼系數(shù)與幸福感之間存在關(guān)系,那么這種關(guān)系的強度也很微弱。①在第三組中存在一個明顯的離群點,我們用三角形表示。為了更好地描繪變量間的關(guān)系趨勢,第三組中的擬合線是排除此離群點之后擬合的。

圖3 非大都市區(qū)中區(qū)分城市化水平分析

四、再回到統(tǒng)計模型與系數(shù)顯著性中

(一)對原先模型的修正

通過對數(shù)據(jù)生成過程的了解,我們意識到前面的模型是需要修正的。第一,模型遺漏了一項最為重要的變量——所屬區(qū)縣的類型(大都市/非大都市)。這一遺漏變量與基尼系數(shù)的取值有非常強的相關(guān)關(guān)系,與幸福感之間也有較強的相關(guān)關(guān)系。我們必須把這一變量補充到模型當中,再來進行檢驗。第二,在大都市樣本中“上?!钡貐^(qū)具有較為特殊的性質(zhì),它進入樣本與否會使大城市地區(qū)的分析結(jié)果發(fā)生極大改變,因此我們有必要把“是否上海”作為單獨變量納入模型中,以增強模型分析的穩(wěn)健性。第三,大都市樣本中在區(qū)縣層面是沒有代表性的,因此相對于非大都市樣本而言,我們必須更為保守地對待其分析結(jié)果。

據(jù)此,我們分別對大都市和非大都市區(qū)縣進行最為簡單的OLS回歸(表3模型6)。結(jié)果表明,無論在大都市區(qū)還是非大都市區(qū),區(qū)縣基尼系數(shù)與幸福感之間的關(guān)系在統(tǒng)計上都是不顯著的。在區(qū)分了區(qū)縣類型之后,原先的結(jié)論被否決了。當然,OLS回歸在統(tǒng)計估計上并不是最佳的選擇,考慮到因變量的定序?qū)哟我约皵?shù)據(jù)的層級特性,我們需要選用HGLM模型來進行更精準的估計(表3模型7)。在采用了HGLM模型之后,部分系數(shù)的估計及其顯著性水平確實發(fā)生了改變,但是整體而言改變并不大。尤其是,區(qū)縣基尼系數(shù)的效應(yīng)無論在大都市區(qū)還是在非大都市區(qū)都是不顯著的。

表3 納入?yún)^(qū)縣類型之后的模型估計

對于前述“曲線關(guān)系”的說法,我們也進行了驗證。在區(qū)分了大城市樣本與非大城市樣本之后進行的HGLM模型中,基尼系數(shù)與基尼系數(shù)的平方項均不顯著(模型估計在此略去)。由于遺漏了地區(qū)類型這樣一個關(guān)鍵變量,原先的模型分析存在誤導(dǎo)性。事實上,一旦引入這一變量進行分組分析,區(qū)縣基尼系數(shù)的效應(yīng)就可能會消失或者大幅降低;區(qū)縣基尼系數(shù)與幸福感之間的關(guān)系并不是穩(wěn)健存在的。①我們根據(jù)樣本中居委會與村委會的配比(這又是由其城市化水平?jīng)Q定的)將非大城市樣本分為四組,然后分組進行了回歸模型擬合。結(jié)果同樣顯示,在每一組中區(qū)縣基尼系數(shù)對于幸福感的效應(yīng)在統(tǒng)計上均不顯著。

上述結(jié)論是與CGSS數(shù)據(jù)的抽樣方式相關(guān)的。許多研究者意識到從CGSS數(shù)據(jù)中計算區(qū)縣基尼系數(shù)可能存在較大誤差,因此從更大規(guī)模的數(shù)據(jù)(如全國1%人口抽樣調(diào)查)中去取得相對準確的地市基尼系數(shù)估計值,然后與CGSS數(shù)據(jù)進行匹配關(guān)聯(lián)。②巫錫煒、肖珊珊:《地區(qū)差異與我國居民主觀幸福感》;Wu,Xiaogang and Jun Li,“Income Inequality,Economic Growth,and Subjective Well-Being:Evidence from China.”這樣計算出來的基尼系數(shù)誤差會相對較小。但是在這樣的數(shù)據(jù)生成過程中,基尼系數(shù)測算值與地區(qū)類型之間的關(guān)聯(lián)是否存在,這仍然是值得探索的問題。我們需要去追問是哪些縣市在推動變量關(guān)系得以呈現(xiàn),然后去進行分組分析或引入新的控制變量,才能真正澄清變量關(guān)系的真實模式。③如前所述,構(gòu)建面板數(shù)據(jù)也并不能夠真正解決遺漏變量可能帶來的偏差。在進行面板數(shù)據(jù)分析之后,我們?nèi)匀恍枰プ穯柺悄男┛h市在推動變量關(guān)系得以呈現(xiàn):哪些縣市的收入不平等程度出現(xiàn)了上升,哪些縣市出現(xiàn)了下降。我們利用CGSS2010—2015年數(shù)據(jù)構(gòu)建了省級層面的面板數(shù)據(jù),盡管對面板數(shù)據(jù)的初始分析會呈現(xiàn)出統(tǒng)計顯著的變量關(guān)系,但一旦引入地區(qū)類型變量后,就會發(fā)現(xiàn)變量關(guān)系至少在非大都市區(qū)中并不穩(wěn)健,在大都市中的顯著關(guān)系也主要起因于少數(shù)城市的特殊變化。限于篇幅,對面板數(shù)據(jù)的分析在此無法呈現(xiàn),有待未來深入討論。

(二)對于以往研究中效應(yīng)方向變動不居的一種可能解釋

如前所述在對區(qū)縣基尼系數(shù)與幸福感(及其他主觀指標)的研究中,存在一種令人困惑的現(xiàn)象:區(qū)縣基尼系數(shù)的效應(yīng)方向時而為正時而為負,并不確定。對此的解釋之一是區(qū)縣基尼系數(shù)的測算中存在較大的測量誤差,但前面的分析揭示出了另一種可能的解釋。在圖4中,我們利用假想數(shù)據(jù)對此進行直觀演示。

圖4 利用假想數(shù)據(jù)演示的兩種可能性

在圖4中,方形散點代表來自大城市地區(qū)的區(qū)縣;圓形散點代表來自非大城市的區(qū)縣。大城市的多數(shù)區(qū)縣的基尼系數(shù)測算值都低于來自非大城市的區(qū)縣。如果對大城市和非大城市進行分組分析,區(qū)縣基尼系數(shù)與幸福感之間并不存在關(guān)聯(lián)(圖中的虛線代表分組的回歸線)。但是一旦把兩組數(shù)據(jù)合并而不加區(qū)分,那么區(qū)縣基尼系數(shù)與幸福感就會呈現(xiàn)出一種有關(guān)聯(lián)的假象(圖中的實線代表不分組的回歸線)。更重要的是,此時如果樣本中的大城市地區(qū)幸福感低于其他地區(qū)時,不分組估計出來的基尼系數(shù)效應(yīng)值就是正的(如圖4中左圖所示);當樣本中的大城市地區(qū)幸福感高于其他地區(qū)時,不分組估計出來的基尼系數(shù)效應(yīng)值就是負的(如圖4中右圖所示)。當然無論正負,這種效應(yīng)其實都只是一種“統(tǒng)計假象”。①以往文獻中發(fā)現(xiàn)區(qū)縣基尼系數(shù)與幸福感呈負向關(guān)系的研究多數(shù)采用的是CGSS2003—CGSS2006年數(shù)據(jù),而發(fā)現(xiàn)區(qū)縣基尼系數(shù)與幸福感呈正向關(guān)系的研究多數(shù)采用的是CGSS2010—CGSS2013年數(shù)據(jù)。CGSS2003—CGSS2006數(shù)據(jù)不再公開案例所在區(qū)縣編碼,我們無法就上述推斷進行直接驗證。不過,從CGSS2010—CGSS2013年數(shù)據(jù)看,這幾年中大都市居民的幸福感確實有所下降。

五、再回到對機制解釋的追究中

上述一系列考察達到的最終結(jié)論是:地區(qū)基尼系數(shù)與幸福感的統(tǒng)計關(guān)聯(lián)并不穩(wěn)健,至少當前我們并沒有足夠堅實的統(tǒng)計證據(jù)能夠判定兩者的關(guān)聯(lián)機制和方式。這樣一個結(jié)論似乎是完全否定性的,其實不然。在本文開頭提及的默頓的那篇文章中,他還提到了科學(xué)研究中的另一個常見現(xiàn)象:“明確的無知”(specified ignorance)往往是通向知識的道路的第一步。所謂“明確的無知”,就是明確我們在哪些方面需要了解而還沒有足夠的了解。它不是對知識無限性的泛泛而談,而是需要經(jīng)過努力才能夠明確的內(nèi)容。因此,我們的結(jié)論并不完全是否定性的,其中包括了未來應(yīng)該努力澄清的機制解釋方向。

如前所述,研究地區(qū)基尼系數(shù)與幸福感的關(guān)系,其理論意義在于探討行動者的主觀觀念或主觀感受與所處社會情境的客觀特征之間的關(guān)聯(lián)機制。我們意識到,在這里需要澄清的幾個重要問題如下:

1.在行動者的日常生活世界中,他們對于社會平等程度的感知何種程度上取決于微觀生活情境中的具體關(guān)系性體驗,何種程度上取決于宏觀世界中的抽象性測量(如“地區(qū)基尼系數(shù)”)?或者,抽象性測量是如何能夠通過日常生活世界的中介而能夠被行動者感知到的?

2.如果說行動者對社會平等程度的感知是有時間和空間的限定的,那么他能夠感知的平等程度的參照系在空間上有多大范圍?是否不同的行動者有著不同的空間參照系范圍?

3.都市與非都市區(qū)構(gòu)成了完全不同的社會情境。在不同的生活情境中,人們對于社會平等程度的感知機制是否一樣?他們對社會平等程度的重視程度是否一樣?

只要上述三個問題還沒有澄清,我們就不太可能確信自己掌握了地區(qū)基尼系數(shù)與幸福感之間的因果關(guān)聯(lián)。例如,如果行動者對社會平等的感知完全取決于具體關(guān)系性體驗,而與抽象性測量只有微弱的間接關(guān)系;如果行動者對社會平等的感知的空間參照范圍根本不是自己所在的區(qū)縣;如果在特定情境中,行動者對社會平等根本并不在意,那么上述兩個變量之間就不可能存在穩(wěn)健的關(guān)聯(lián)。行動者的主觀感覺過程是復(fù)雜而微妙的,它不會從根本上脫離客觀結(jié)構(gòu)的限定,但也不會是抽象的客觀結(jié)構(gòu)的直接對應(yīng)物。未來的研究應(yīng)當針對上述分解之后的每個具體機制環(huán)節(jié)進行探索與驗證。

六、方法上的討論:獨角戲,還是二重奏?

最后我們進行一點方法上的反思。阿博特曾說,“好多人把社會科學(xué)當成了獨角戲,而非二重奏。他們眼里,社會科學(xué)就是自己的一番長篇大論之后,再拋出一個刻板的問題,現(xiàn)實則像舊小說里的矯情淑女,只是點頭或搖頭。真正的研究者不一樣。他們知道,現(xiàn)實才不那么老實,它有層出不窮的花招來戲弄和挑逗研究者,直覺和方法之間在不斷進行交鋒。社會科學(xué)實踐并不是舊小說,而是現(xiàn)代言情劇。”①Abbott,A.,Methodsof Discovery:Heuristicsfor the Social Sciences,New York:Norton,2004,p.3.那種單純以系數(shù)的統(tǒng)計顯著性為指引和目標的定量研究方式,看起來確實很像阿博特所戲謔的“舊小說”,尤其是它似乎不太明白,有時候現(xiàn)實世界這位淑女點頭與搖頭回應(yīng)的可能根本不是自己所提出的那個問題。要真正理解點頭搖頭的意思,辦法只能是坐下來與她進行多輪交流。

因此,我們得到統(tǒng)計參數(shù)顯著的結(jié)果而驗證了自己的預(yù)設(shè)時,研究并沒有結(jié)束,甚至這只是研究的開始。統(tǒng)計學(xué)家費舍爾(Ronald Fisher)在被問及如何在觀察研究中從相關(guān)中推出因果時,曾經(jīng)回應(yīng)說:“把你的理論充分展開”(Make your theories elaborate),也就是說“在構(gòu)建因果假設(shè)時,研究者要盡可能充分地展現(xiàn)這個道理的各種不同后果,然后再用觀察研究來發(fā)現(xiàn)每個后果是否都能立得住”。②Cochran,W.G.and Chambers,S.P.,“The Planning of Observational Studies of Human Populations,”Journal of the Royal Statistical Society,Series A(General),vol.128,no.2,1965,pp.234-266.在社會學(xué)的研究中,這意味著我們需要從變量關(guān)系的表述再回到對社會情境與社會主體的理解上:是誰推動了這樣一種統(tǒng)計結(jié)果得以呈現(xiàn)?如何推動?它又出現(xiàn)在何種社會情境中?數(shù)據(jù)的細節(jié)與上述理解相符嗎?我們需要從單一的經(jīng)驗假設(shè)中推衍出豐富的經(jīng)驗細節(jié),然后去數(shù)據(jù)中再進行驗證。當然,不可能所有的細節(jié)都能被完美地驗證,但是這個過程中蘊含了對社會世界產(chǎn)生新洞見的可能性。研究就不再是線性的假設(shè)驗證過程,而成為在經(jīng)驗數(shù)據(jù)與解釋邏輯之間循環(huán)往復(fù)從而不斷逼近事實真相的過程。③Lieberson,S.and Horwich,J.,“Implication Analysis:A Pragmatic Proposal for Linking Theory and Data in the Social Sciences,”Sociological Methodology,vol.38,no.1,2008,pp.1-50.

在這個過程中,對數(shù)據(jù)生成過程的認真推敲是非常重要的。任何數(shù)據(jù)都是通過人為手段經(jīng)過一定程序在某一“社會”空間和“社會”時間中得來的,因此有必要對數(shù)據(jù)收集方式帶來的可能后果進行思考。如果不能夠深入數(shù)據(jù)本身,不對數(shù)據(jù)生成過程進行推敲,忽視細節(jié)核對與分組分析,即便使用再“高級”的統(tǒng)計模型與技巧,定量研究也仍然會衍生出大量缺失穩(wěn)健性的結(jié)論。在社會學(xué)研究的“可復(fù)制性”④Freese,Jeremy and David Peterson,“Replication in Social Science,”Annual Review of Sociology,vol.43,no.1,2017,pp.147-165.已經(jīng)引起諸多研究者重視的當下,這一點尤其需要強調(diào)。

猜你喜歡
大都市基尼系數(shù)區(qū)縣
Battle for Bohemia
BATTLE FOR BOHEMIA
漢語世界(2021年4期)2021-08-27 05:48:16
2020國際大都市數(shù)學(xué)奧林匹克
大都市
基尼系數(shù)
新視角下理論基尼系數(shù)的推導(dǎo)及內(nèi)涵
區(qū)縣電視臺如何做好重大賽事報道
新聞傳播(2016年20期)2016-07-10 09:33:31
全國總體基尼系數(shù)的地區(qū)特征研究
北京:上游水質(zhì)不合格 下游區(qū)縣將收補償金
中國水利(2015年13期)2015-02-28 15:14:04
天津市2013上半年各區(qū)縣節(jié)能目標完成情況
雷波县| 紫金县| 肃南| 建平县| 阿尔山市| 桓仁| 始兴县| 建昌县| 老河口市| 镇赉县| 潍坊市| 临夏县| 满城县| 松溪县| 安丘市| 平原县| 黎川县| 炉霍县| 龙里县| 泾阳县| 称多县| 博乐市| 北碚区| 永兴县| 锡林浩特市| 松原市| 娱乐| 元谋县| 高州市| 苏尼特左旗| 龙泉市| 武川县| 奉节县| 平泉县| 宁化县| 远安县| 田林县| 皋兰县| 云林县| 河北区| 贡嘎县|