国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

教育對健康的分布處理效應(yīng)
——基于斷點(diǎn)回歸設(shè)計(jì)

2022-07-12 01:58李青原
教育與經(jīng)濟(jì) 2022年3期
關(guān)鍵詞:人群個(gè)體變量

李青原

(中國社會科學(xué)院大學(xué) 人口與勞動經(jīng)濟(jì)系, 北京 102488)

一、引言

教育與健康之間是否存在因果關(guān)系,一直以來受到國內(nèi)外學(xué)者的廣泛討論。[1]究其原因:一是教育與健康作為人力資本的重要組成部分,是各國經(jīng)濟(jì)和社會發(fā)展的政策著力點(diǎn),而教育與健康的交互影響,將使得教育投資具有雙重效應(yīng),這為人力資本投資戰(zhàn)略的調(diào)整和發(fā)展提供方向;[2]二是教育對健康可能存在的積極作用,有助于應(yīng)對人口老齡化帶來的挑戰(zhàn)。[3]另外,營養(yǎng)和健康本身也是重要課題,[4][5]黨的“十九大”報(bào)告提出的“健康中國戰(zhàn)略”意味著人民健康已成為中國國家戰(zhàn)略問題,探究影響健康的因素是應(yīng)有之義,因而,教育對健康的因果推斷具有重要的現(xiàn)實(shí)意義。

關(guān)于教育與健康的因果分析,學(xué)界已經(jīng)進(jìn)行了一些有益的探索,但是研究結(jié)論存在差異。[6]部分研究認(rèn)為,教育對健康有顯著的正向影響,[7]然而,還有一些學(xué)者卻發(fā)現(xiàn),教育對健康基本沒有影響或兩者不存在因果關(guān)系。[8][9]國內(nèi)的相關(guān)研究基本上認(rèn)為教育在一定程度上有助于改善健康水平,但在受益群體和作用大小上存在不同的看法和結(jié)論。比如,程令國等(2014)與葉曉梅和梁文艷(2017)利用中國老年健康影響因素跟蹤調(diào)查數(shù)據(jù)(CLHLS)研究發(fā)現(xiàn),教育對中國老年人的身體健康和認(rèn)知健康產(chǎn)生了積極影響;[2][10]而劉生龍(2017)基于2005年全國1%人口抽樣調(diào)查數(shù)據(jù)分析發(fā)現(xiàn),教育只對中國老年男性的健康有顯著影響。[3]李春青和王駿(2017)基于中國家庭追蹤調(diào)查數(shù)據(jù)(CFPS),得到教育對女性和農(nóng)村人口的健康影響較大,對高學(xué)歷和出生較晚人口的影響較?。籟11]而李軍和劉生龍(2019)利用CFPS數(shù)據(jù),得到教育與男性的自評健康之間存在因果關(guān)系,與女性保持正常體型也存在因果關(guān)系。[12]可以發(fā)現(xiàn),多數(shù)學(xué)者主要通過分組研究驗(yàn)證了教育對部分人群的健康存在因果效應(yīng),但未得到一致結(jié)論。這在一定程度上也表明教育對健康的影響可能“因人而異”,而現(xiàn)有的研究仍未對此進(jìn)行充分討論。

從研究方法來看,由于存在教育變量內(nèi)生的問題,[13]多數(shù)研究以義務(wù)教育法這類政策變量作為工具變量,使用2SLS估計(jì)了教育對健康的因果效應(yīng);[14][15]一些研究則利用雙胞胎數(shù)據(jù),使用固定效應(yīng)模型對教育與健康的因果關(guān)系進(jìn)行分析。[16]隨著實(shí)驗(yàn)方法在社會科學(xué)研究中的應(yīng)用,準(zhǔn)實(shí)驗(yàn)(quasi-experiment)為探究教育對健康的因果效應(yīng)提供了新思路,而斷點(diǎn)回歸設(shè)計(jì)(RDD)作為一種接近自然實(shí)驗(yàn)的方法受到了學(xué)者們的青睞。一些研究利用義務(wù)教育法、自然事件等對教育的外生沖擊,基于RDD框架估計(jì)了教育對健康的影響。[12]

研究結(jié)論之所以存在上述矛盾或差異,一個(gè)關(guān)鍵因素在于,無論使用何種因果推斷方法,或是按照何種方式將樣本分組,現(xiàn)有研究主要分析的是教育對健康的平均處理效應(yīng)(ATE),鮮有探究教育對健康的分布處理效應(yīng)(DTE),即教育對健康不同分布位置的影響。Galama等(2018)認(rèn)為,由于異質(zhì)性的存在,平均影響可能掩蓋了教育對健康分布特定位置的顯著影響,從而得到看似矛盾或不顯著的結(jié)論。[17]因此,僅以平均效應(yīng)為依據(jù),可能會忽略教育對健康的真實(shí)影響,從而遺漏一些重要的發(fā)現(xiàn)和結(jié)論。那么,教育對健康是否存在顯著的因果效應(yīng),其對健康有何異質(zhì)性影響?

本文的目的在于回答以上問題。如果教育對健康分布不同位置的影響不同,則教育對健康的影響必然因人而異。因此,本文將基于RDD框架,以義務(wù)教育法為工具變量,使用分布檢驗(yàn)方法探究教育對健康分布的影響,并與教育對健康的平均影響作比較。本文的貢獻(xiàn)主要有兩點(diǎn):一是通過將RDD與分布檢驗(yàn)方法相結(jié)合,估計(jì)教育對健康的分布處理效應(yīng),對教育與健康之間的因果關(guān)系進(jìn)行更加準(zhǔn)確地推斷;二是充分研究教育對健康的異質(zhì)性影響,探索健康分布不同位置的人如何受益于教育,以得到更多有益的結(jié)論,對現(xiàn)有的相關(guān)研究進(jìn)行補(bǔ)充。

二、制度背景與數(shù)據(jù)

(一)義務(wù)教育法的實(shí)施和影響

義務(wù)教育法的實(shí)施對教育可得性產(chǎn)生了外生沖擊,為本研究提供了一個(gè)良好的政策工具。為了提高國民整體的教育水平,1986年4月12日,《中華人民共和國義務(wù)教育法》(簡稱《義務(wù)教育法》)通過,并于1986年7月1日開始執(zhí)行。諸多研究對該法案進(jìn)行了較為詳盡的闡釋,[12]本研究僅對其在實(shí)施中的主要特點(diǎn)進(jìn)行以下說明。

首先,由于中小學(xué)一般每年9月1日開學(xué),因而義務(wù)教育法實(shí)際上于1986年9月1日正式生效。其次,由于地區(qū)經(jīng)濟(jì)、教育等發(fā)展水平的差異,中國各省份實(shí)施義務(wù)教育法的具體時(shí)間并不一致,貧困地區(qū)尤其缺乏實(shí)施義務(wù)教育的資源和能力。[18]根據(jù)Huang(2015)的研究,義務(wù)教育法的實(shí)施年份主要集中在1986和1987年,少數(shù)省份的實(shí)施時(shí)間為1988、1989或1991年。[19]再次,義務(wù)教育法對6~15歲人群均有按規(guī)定接受義務(wù)教育的要求,在義務(wù)教育法正式實(shí)施時(shí),未滿15歲的人群均會受到該法案的影響。為了便于研究,本文將剛好受到該法案影響的人的出生日期作為臨界點(diǎn)。最后,并非所有的適齡人群都完成了義務(wù)教育,在2006年修訂義務(wù)教育法之前,仍存在許多因經(jīng)濟(jì)負(fù)擔(dān)而輟學(xué)的兒童。[20]

可以發(fā)現(xiàn),義務(wù)教育法的實(shí)施提高了人們的受教育水平。如圖1所示,在義務(wù)教育法的影響下,受教育水平在臨界點(diǎn)處出現(xiàn)了明顯的斷點(diǎn)(1)圖1利用中國家庭追蹤調(diào)查數(shù)據(jù),對樣本點(diǎn)進(jìn)行了多項(xiàng)式擬合,其中,出生日期使用樣本出生年月相對于臨界點(diǎn)的月數(shù)衡量,該圖旨在直觀地呈現(xiàn)義務(wù)教育法實(shí)施前后的教育斷點(diǎn),后文將對處理效應(yīng)進(jìn)行估計(jì)和檢驗(yàn)。,與未受到義務(wù)教育法影響的群體相比,受到該法案影響的群體其接受義務(wù)教育的概率和平均受教育年限均明顯提高。然而在臨界點(diǎn)處,接受義務(wù)教育的概率未達(dá)到1,平均受教育年限也并未提高至9年,表明確實(shí)存在大量未按規(guī)定接受義務(wù)教育的群體。

圖1 義務(wù)教育法實(shí)施前后的教育斷點(diǎn)

同樣地,在義務(wù)教育法的影響下,健康水平在出生日期臨界點(diǎn)處也出現(xiàn)了斷點(diǎn),換言之,人們的受教育水平可能影響了其健康水平(2)本文同樣對樣本的健康水平隨出生日期的變化進(jìn)行了多項(xiàng)式擬合,限于篇幅,此處不再展示相關(guān)結(jié)果。。實(shí)際上,在受教育水平整體提升的同時(shí),人們的健康水平也明顯上升,具體反映為中國人均預(yù)期壽命不斷上升。根據(jù)國家統(tǒng)計(jì)局?jǐn)?shù)據(jù),1981年中國人均預(yù)期壽命為67.8歲,2018年中國人均預(yù)期壽命已提高至77.0歲。作為廣義的人力資本,教育和健康是發(fā)展的基本目標(biāo),而兩者的同步增長也表明,教育與健康之間可能存在因果關(guān)系,教育水平的提高可能會導(dǎo)致健康水平的提高。

(二)數(shù)據(jù)來源與樣本選擇

研究數(shù)據(jù)來源于中國家庭追蹤調(diào)查(CFPS)中2010、2014和2018年的調(diào)查數(shù)據(jù)。該調(diào)查由北京大學(xué)中國社會科學(xué)調(diào)查中心(ISSS)實(shí)施,CFPS樣本覆蓋全國25個(gè)省、直轄市和自治區(qū),代表了中國94.5%的人口,樣本的代表性為研究的外部有效性提供了數(shù)據(jù)基礎(chǔ)。CFPS采用了內(nèi)隱分層、多階段、多層次、與人口規(guī)模成比例的概率抽樣方式,以及計(jì)算機(jī)輔助面訪調(diào)查(CAPI)和計(jì)算機(jī)輔助電訪調(diào)查(CATI)技術(shù),在一定程度上保證了數(shù)據(jù)質(zhì)量。

本研究將在斷點(diǎn)回歸設(shè)計(jì)(RDD)的框架下展開,需要對樣本范圍進(jìn)行設(shè)定。由前文可知,對于1986年開始實(shí)施的義務(wù)教育法,出生于1971年9月及之后的人群會受其影響??紤]到不同地區(qū)義務(wù)教育法的生效時(shí)間存在差別,因此,本研究以法案生效時(shí)年齡為15歲設(shè)定臨界點(diǎn)。由于中國在1959~1961年經(jīng)歷了嚴(yán)重的饑荒,該自然災(zāi)害對教育和健康產(chǎn)生了較大的不利影響,因此,本研究所用樣本為出生于臨界點(diǎn)前后各9年的群體。在對連續(xù)變量的異常值進(jìn)行處理后,得到的樣本量為14338人,其中,男性7145人,占比49.8%,女性7193人,占比50.2%。

(三)變量設(shè)置

1.被解釋變量

許多研究使用自評健康來衡量身體健康水平,[3]也有研究使用多種指標(biāo)從身體功能健康、認(rèn)知功能健康等多個(gè)維度衡量健康水平,[10]但有研究認(rèn)為主觀評價(jià)與客觀評價(jià)之間的差異會隨著社會經(jīng)濟(jì)地位的不同而變化,[21]并且,由于本文重點(diǎn)探討教育對健康分布的影響,因此,本文使用連續(xù)的、客觀的指標(biāo)衡量健康水平(health),包括身體質(zhì)量指數(shù)BMI、醫(yī)療費(fèi)用和認(rèn)知功能。

BMI反映了個(gè)體的體型和營養(yǎng)狀況(3)BMI=體重(kg)/身高(m)2。一般認(rèn)為,中國成年人的BMI小于18.5為偏瘦,處于18.5~23.9為正常,大于等于24為超重,大于等于28為肥胖。結(jié)合樣本BMI的中位數(shù)(22.5)、均值(22.8)和分布情況,BMI從低分位點(diǎn)到高分位點(diǎn)的變化,即代表了樣本從偏瘦到正常、再到肥胖的變化。,在一定程度上代表了個(gè)體的身體健康水平。由于個(gè)體是否患病以及疾病嚴(yán)重程度難以從BMI中完全反映出來,因此,以醫(yī)療費(fèi)用(medical)指標(biāo)反映個(gè)體的患病情況(一般為身體疾病),使用個(gè)體上一年的住院總費(fèi)用(包含醫(yī)保報(bào)銷)作為醫(yī)療費(fèi)用的代理變量,與BMI共同衡量個(gè)體的身體健康狀況。認(rèn)知功能使用識字水平(word)和數(shù)學(xué)水平(math)衡量,CFPS2010、CFPS2014和CFPS2018主要使用識字題和數(shù)學(xué)題測試個(gè)體的認(rèn)知水平,兩項(xiàng)測試得分區(qū)間分別為[0,34]和[0,24],得分越高代表認(rèn)知功能越強(qiáng)。為了便于分析和比較,本研究按照性別對所有健康指標(biāo)進(jìn)行了標(biāo)準(zhǔn)化處理。

2.解釋變量

核心解釋變量為教育水平(educ),用是否完成義務(wù)教育(educ9)衡量。同時(shí),設(shè)置是否完成高中教育(high)、是否完成大學(xué)教育(college)以進(jìn)行比較分析。驅(qū)動變量為出生日期(date),使用樣本出生年月相對于臨界點(diǎn)的月數(shù)衡量,臨界點(diǎn)處的date取值為0。

在RDD的相關(guān)研究中,對于是否應(yīng)加入控制變量并未得到一致結(jié)論。本研究設(shè)定了控制變量,以與基準(zhǔn)回歸做比較??刂谱兞縓主要為性別(male)、民族(ethnicity)、婚姻(marriage)和戶籍(urban)這些反映個(gè)體特征的虛擬變量,分別設(shè)定如下:男性取值為1,女性取值為0;漢族取值為1,其他民族取值為0;已婚取值為1,其他婚姻狀況取值為0;城鎮(zhèn)取值為1;農(nóng)村取值為0。另外,為了控制地區(qū)層面的影響,按照義務(wù)教育法實(shí)施年份設(shè)置地區(qū)虛擬變量(dumregion)。

3.工具變量

以義務(wù)教育法(CSL)為工具變量,若個(gè)體受到義務(wù)教育法的影響,則CSL取值為1,否則取值為0。如前所述,義務(wù)教育法的實(shí)施可視為一種隨機(jī)實(shí)驗(yàn),按照“是否受到義務(wù)教育法影響”對樣本隨機(jī)分組,樣本是否受到政策干預(yù)取決于其出生日期,與可觀測到的個(gè)人其他特征以及無法觀測到的因素?zé)o關(guān)。然而,這其中仍存在自選擇問題,受到義務(wù)教育法影響的個(gè)體仍可能未完成義務(wù)教育(如圖1所示),后文實(shí)證研究將對此進(jìn)行處理。主要變量的描述性統(tǒng)計(jì)結(jié)果見表1。

三、教育對健康的平均處理效應(yīng)

(一)義務(wù)教育法對教育的影響

由于并非所有適齡人群都完成了義務(wù)教育,因此,本研究采用模糊斷點(diǎn)回歸(FRDD)。參考FRDD相關(guān)研究,[22]本研究以義務(wù)教育法為工具變量,使用兩階段最小二乘法(2SLS)進(jìn)行估計(jì),第一階段估計(jì)義務(wù)教育法對接受教育的影響,第二階段估計(jì)教育對健康的平均處理效應(yīng)。第一階段使用的模型如下:

表1主要變量的描述性統(tǒng)計(jì)分析

educi=α0+α1CSLi+f(datei)+X′iα2+εi

(1)

式(1)中,educi為個(gè)體i的受教育水平;CSLi為個(gè)體i是否受到義務(wù)教育法的影響;datei為個(gè)體i的出生日期變量;f(·)為低階多項(xiàng)式,刻畫了受教育水平隨出生日期的變化趨勢;Xi為控制變量向量,包括所有前定變量以及地區(qū)虛擬變量;εi為隨機(jī)擾動項(xiàng)。

為了得到更加準(zhǔn)確的估計(jì)結(jié)果,第一,根據(jù)Gelman和Imbens(2014)的研究,將驅(qū)動變量多項(xiàng)式f(·)設(shè)定為二階多項(xiàng)式;[23]第二,根據(jù)Calonico等(2014)提出的數(shù)據(jù)驅(qū)動(data-driven)方法得到最優(yōu)帶寬,以提高估計(jì)的精準(zhǔn)度;[24]第三,回歸分析中使用穩(wěn)健標(biāo)準(zhǔn)誤,以避免異方差對估計(jì)結(jié)果的影響。

第一階段的估計(jì)結(jié)果如表2所示。與現(xiàn)有的相關(guān)研究和經(jīng)驗(yàn)認(rèn)識一致,義務(wù)教育法的實(shí)施使個(gè)體接受義務(wù)教育的概率顯著提高了5.3%,在加入控制變量后,這一影響下降至4%,但仍在1%的水平上統(tǒng)計(jì)顯著??紤]到樣本中完成義務(wù)教育的比例為54.6%,4%~5.3%的影響仍不容忽視。另外,義務(wù)教育法主要對個(gè)體完成義務(wù)教育產(chǎn)生積極作用,對完成高中和大學(xué)教育則沒有顯著影響。實(shí)際上,僅有約22%的樣本完成了高中教育,仍有約45%的樣本未能完成義務(wù)教育,因此,義務(wù)教育法對于提升整體受教育水平意義重大。

表2義務(wù)教育法對受教育水平的影響

(二)教育對健康的平均影響

第二階段研究教育對健康的影響,構(gòu)建如下結(jié)構(gòu)式模型:

(2)

將式(1)代入式(2),得到如下簡化式模型:

(3)

上述模型中,healthi為個(gè)體i的健康水平;educ9i為個(gè)體i是否完成了義務(wù)教育;g(·)與j(·)均為二階多項(xiàng)式;其他變量設(shè)置均與式(1)一致;μi與vi為隨機(jī)擾動項(xiàng)。

表3是第二階段的回歸結(jié)果,估計(jì)了教育對健康的平均影響。從結(jié)構(gòu)式模型的估計(jì)結(jié)果來看,教育能夠在較大程度上顯著改善個(gè)體的認(rèn)知功能,教育對識字方面和數(shù)學(xué)方面認(rèn)知功能的影響分別為1.464和1.478,且均在1%的水平上顯著,在加入控制變量后,教育對這兩者的影響分別為1.381和1.244,且均在5%的水平上顯著。然而,教育對代表身體健康的BMI和醫(yī)療費(fèi)用這兩個(gè)指標(biāo)的影響并不顯著。

為了更好地理解教育對健康影響的效應(yīng)大小,進(jìn)一步地,從分位數(shù)的角度解釋以標(biāo)準(zhǔn)差衡量的平均處理效應(yīng)。假定正態(tài)分布,從標(biāo)準(zhǔn)化的無條件分布的中位數(shù)開始(Φ(0)=50%)(4)以正態(tài)分布作為參考,對以標(biāo)準(zhǔn)差衡量的系數(shù)估計(jì)值進(jìn)行解釋。,在其他條件不變的情況下,如果教育使個(gè)體的認(rèn)知功能提高1.478個(gè)標(biāo)準(zhǔn)差,則該個(gè)體將處于認(rèn)知功能分布的93.1%分位點(diǎn)處(Φ(0+1.48)≈93.1%);如果提高1.244個(gè)標(biāo)準(zhǔn)差,則該個(gè)體將處于認(rèn)知功能分布的89.3%分位點(diǎn)處(Φ(0+1.24)≈89.3%)。

由此來看,教育對認(rèn)知功能健康的影響比較大。

簡化式模型的估計(jì)結(jié)果與結(jié)構(gòu)式模型相似,義務(wù)教育法的實(shí)施對認(rèn)知功能健康的影響較大,但對身體健康的影響較小,尤其是醫(yī)療費(fèi)用指標(biāo)的系數(shù)估計(jì)值不顯著。所有模型在加入控制變量后,除了醫(yī)療費(fèi)用指標(biāo)的系數(shù)估計(jì)值略微上升外,其他健康指標(biāo)的系數(shù)估計(jì)值均有所下降,且BMI的系數(shù)估計(jì)值不再顯著。

表3教育對健康的平均處理效應(yīng)

除了參數(shù)估計(jì),本文還進(jìn)行了非參數(shù)估計(jì)以檢驗(yàn)以上估計(jì)結(jié)果的穩(wěn)健性。常用的非參數(shù)估計(jì)方法包括核回歸和局部線性回歸。在FRDD中,與核回歸相比,局部線性回歸的偏差更小、更有效率。[23]因此,本研究使用了局部線性回歸方法,并為結(jié)果變量與處理變量設(shè)定相同的核函數(shù)和帶寬?;貧w結(jié)果與2SLS的估計(jì)結(jié)果基本一致,教育對認(rèn)知能力的影響顯著,但對身體健康指標(biāo)沒有顯著影響。

總而言之,教育對健康的平均影響的估計(jì)結(jié)果不甚理想。雖然以上研究表明,教育有助于改善認(rèn)知功能健康,與程令國等(2014)[2]的研究結(jié)論一致,但無法得到教育顯著改善身體健康水平的證據(jù),且對醫(yī)療費(fèi)用指標(biāo)的估計(jì)結(jié)果與經(jīng)驗(yàn)認(rèn)識不符。原因可能在于,利用RDD研究教育對健康的平均影響,而忽視教育對不同分布位置的人群的異質(zhì)性影響,可能會導(dǎo)致研究結(jié)論出現(xiàn)偏差。本研究將繼續(xù)基于RDD框架,進(jìn)一步研究教育對健康的分布處理效應(yīng),以獲得更多關(guān)于教育對健康因果效應(yīng)的信息。

(三)RDD有效性檢驗(yàn)

RDD的有效性依賴于兩個(gè)假設(shè):局部平滑假設(shè)和分布函數(shù)條件連續(xù)假設(shè),即如果不存在政策干預(yù),潛在結(jié)果變量的期望在臨界點(diǎn)處是驅(qū)動變量的連續(xù)函數(shù)。對應(yīng)于本文研究,在滿足以上假設(shè)的情況下,健康變量的期望值在出生日期臨界點(diǎn)處的“跳躍”是由教育變量唯一引起的,衡量了教育對健康的平均處理效應(yīng)。研究中往往無法直接檢驗(yàn)這兩個(gè)假設(shè),本文從以下兩個(gè)方面進(jìn)行檢驗(yàn):一是驅(qū)動變量本身是連續(xù)的,不存在明顯斷點(diǎn);二是影響結(jié)果變量的其他變量在臨界點(diǎn)處是連續(xù)的,不存在明顯斷點(diǎn)。檢驗(yàn)結(jié)果表明,本文研究設(shè)計(jì)和估計(jì)結(jié)果是有效的(5)限于篇幅,此處不再展示RDD有效性檢驗(yàn)的結(jié)果。。

四、教育對健康的分布處理效應(yīng)

(一)估計(jì)方法與模型

僅研究平均處理效應(yīng)可能會掩蓋教育對健康分布特定位置的不同影響,如果教育對健康的影響集中在健康分布的特定部分,那么,分布檢驗(yàn)優(yōu)于均值檢驗(yàn)。因此,本文重點(diǎn)探究教育對健康的分布處理效應(yīng)(DTE)。

基于RDD框架研究DTE,能夠有效解決內(nèi)生性問題,并分析異質(zhì)性影響。[25]與傳統(tǒng)RDD方法類似,DTE借助健康的累積分布函數(shù)(CDF)在臨界點(diǎn)處的不連續(xù),估計(jì)教育對健康分布的影響,其假設(shè)條件為:若不存在政策干預(yù),潛在結(jié)果變量的分布在驅(qū)動變量上連續(xù)。本文通過檢驗(yàn)驅(qū)動變量分布的連續(xù)性、其他變量的分布在臨界點(diǎn)處連續(xù),驗(yàn)證了分布檢驗(yàn)的假設(shè)條件成立。

對政策干預(yù)前和干預(yù)后的累積分布函數(shù)進(jìn)行設(shè)定。分別定義pre-CDF與post-CDF為從出生日期左側(cè)(date<0)與右側(cè)(date>0)逼近臨界點(diǎn)的遵從者(compliers)的CDF:

(4)

(5)

那么,通過CDF在臨界點(diǎn)處(date=0)的斷點(diǎn)可估計(jì)得到DTE,即給定k的值,F(xiàn)post(k)與Fpre(k)之差,用μ(k)表示:

μ(k)=Fpost(k)-Fpre(k)

(6)

對健康分布的支撐域進(jìn)行離散化處理,針對每個(gè)柵格內(nèi)的k點(diǎn),基于式(7)估計(jì)μ(k):

(7)

其中,1(healthi≤k)表明,如果healthi≤k,那么1(·)取值為1,否則取值為0;l(datei;k)是隨k變化的關(guān)于date的二階多項(xiàng)式;其他變量設(shè)置與前文一致。仍以CSLi為工具變量,使用2SLS估計(jì)式(7),θ1(k)表示Pr(health≤k)在date=0處的差值,即μ(k)。

利用上述模型進(jìn)行統(tǒng)計(jì)推斷時(shí),Shen和Zhang(2016)使用了基于Kolmogorov-Smirnov檢驗(yàn)的分布檢驗(yàn)方法,檢驗(yàn)pre-CDF與post-CDF的差異,[25]根據(jù)其假定,基于以下簡化式模型研究教育是否影響了健康分布:

1(healthi≤k)=λ0(k)+λ1(k)CSLi+l(datei;k)+X′iλ2(k)+ηi(k)

(8)

本文將使用Goldman和Kaplan(2018)提出的更加有效的多重檢驗(yàn)方法進(jìn)行分布檢驗(yàn)。[26]第一階段是針對整體的擬合優(yōu)度檢驗(yàn),類似于一個(gè)兩樣本Kolmogorov-Smirnov檢驗(yàn),原假設(shè)為兩個(gè)累積分布函數(shù)相同,即H0:Fpost=Fpre;第二階段是對每一個(gè)點(diǎn)k進(jìn)行檢驗(yàn),每一個(gè)原假設(shè)都為H0:Fpost(k)=Fpre(k)。檢驗(yàn)結(jié)果能夠準(zhǔn)確給出在特定顯著性水平上拒絕原假設(shè)的k的取值范圍,即教育對健康存在顯著影響的分布區(qū)域。

(二)估計(jì)結(jié)果及分析

與RDD的估計(jì)結(jié)果有所不同,分布檢驗(yàn)的結(jié)果顯示,教育能夠顯著改善身體健康和認(rèn)知功能健康水平,尤其對健康分布特定位置的群體的影響非常顯著。

表4為分布檢驗(yàn)第一階段的結(jié)果,即對累積分布函數(shù)Fpost(·)與Fpre(·)的差異進(jìn)行整體檢驗(yàn)。結(jié)果顯示,BMI、醫(yī)療費(fèi)用和認(rèn)知功能(包括識字和數(shù)學(xué))指標(biāo)的Fpost(·)與Fpre(·)均存在差異,且均在1%的水平上統(tǒng)計(jì)顯著,這表明教育對身體健康和認(rèn)知功能健康的累積分布函數(shù)均存在顯著影響。

表4分布檢驗(yàn)第一階段的結(jié)果

圖2至圖5為分布檢驗(yàn)第二階段在10%顯著性水平上的結(jié)果(6)為避免贅述,同時(shí)限于篇幅,本文主要對10%顯著性水平上的結(jié)果進(jìn)行分析,1%顯著性水平上的結(jié)果可向作者索要。,即教育對BMI、醫(yī)療費(fèi)用(medical)、識字水平(word)和數(shù)學(xué)水平(math)的分布處理效應(yīng)??梢钥吹?,對于分布在特定位置的人群而言,教育對其BMI和認(rèn)知功能均有顯著的正向影響,對其醫(yī)療費(fèi)用存在顯著的負(fù)向影響。

從反映營養(yǎng)狀況的身體健康指標(biāo)BMI來看(圖2),F(xiàn)post(k)相對于Fpre(k)向右移動,且兩者的差異隨著BMI取值不同而變化,表明教育能夠使BMI增加,并且對不同分布位置人群的作用大小不同。具體地,在BMI取值區(qū)間上,除了[-1.06,-0.82](分布在15%~21%分位點(diǎn)(7)將BMI的取值從小到大排序,如果個(gè)體位于15%分位點(diǎn),則表示該個(gè)體的BMI值高于15%的人,結(jié)合樣本分布和BMI取值大小,該個(gè)體的營養(yǎng)狀況較差。的人群)外,F(xiàn)post(k)與Fpre(k)基本在[-2.13,0.36]上(分布在1.3%~72%分位點(diǎn)的人群)均存在顯著差異,整個(gè)拒絕域涵蓋了約34%的分布區(qū)間,以及65%左右的樣本。換言之,當(dāng)偏離BMI均值-2.13~0.36個(gè)標(biāo)準(zhǔn)差時(shí),即當(dāng)個(gè)體的體型和營養(yǎng)狀況處于較差或正常水平時(shí),接受教育會顯著改善其身體健康水平,而樣本中共有約65%的營養(yǎng)狀況較差或正常的人,會受到教育的顯著影響。進(jìn)一步地,從分布處理效應(yīng)的大小來看,對于分布在拒絕域內(nèi)的群體,當(dāng)BMI分別取極小值-2.13、0和極大值0.36時(shí),教育能夠使其BMI分別提高約0.43、0.2和0.16個(gè)標(biāo)準(zhǔn)差,相對于其自身分布位置,教育對這些群體的影響比較大(8)從分位數(shù)的角度解釋,以正態(tài)分布為例,假定從標(biāo)準(zhǔn)化的無條件分布的中位數(shù)開始〔Φ(0)=0.5〕,接受教育將使得該個(gè)體從BMI分布的50%分位點(diǎn)處提高至58%分位點(diǎn)處〔Φ(0+0.2)≈0.579〕。。

因此,教育非常有助于改善體重較輕、輕度營養(yǎng)不良人群的身體健康水平,這一改善主要體現(xiàn)在體型變化上。與平均處理效應(yīng)(ATE)不顯著相比,分布處理效應(yīng)(DTE)揭示了教育對特定群體的BMI的顯著影響。

從反映疾病狀況的身體健康指標(biāo)medical來看(圖3),盡管兩個(gè)累積分布函數(shù)整體逼近,但仍可以觀察到Fpost(k)相對于Fpre(k)向左移動,且教育能夠使特定分布位置群體的醫(yī)療費(fèi)用減小。具體地,F(xiàn)post(k)與Fpre(k)的差異在[-0.13,0.45]上統(tǒng)計(jì)顯著,該區(qū)域涵蓋了5%的分布區(qū)間,以及10%左右的樣本。換言之,當(dāng)偏離均值-0.13~0.45個(gè)標(biāo)準(zhǔn)差時(shí),即當(dāng)個(gè)體的身體健康狀況處于正常(醫(yī)療費(fèi)用在均值附近)或較差水平(醫(yī)療費(fèi)用明顯高于均值)時(shí),接受教育會顯著改善其身體健康水平,這一群體在樣本中占10%左右。未標(biāo)準(zhǔn)化的醫(yī)療費(fèi)用均值在1075.94元左右,表明受到教育影響的多為輕癥患者(如慢性病)。還可以發(fā)現(xiàn),只有10%的樣本分布在medical的高分位,出現(xiàn)這種現(xiàn)象的原因主要是,只有少數(shù)群體因重大疾病產(chǎn)生了遠(yuǎn)高于正常水平的醫(yī)療費(fèi)用。進(jìn)一步地,當(dāng)medical分別取-0.13、0與0.45時(shí),教育使得medical分別降低約0.02、0.06與0.2個(gè)標(biāo)準(zhǔn)差,相對于其自身分布位置,該影響仍不容忽視。

圖2 教育對BMI的分布處理效應(yīng)

因此,教育能夠顯著改善身體狀況良好或有一般疾病人群的身體健康水平,這一改善主要體現(xiàn)在輕癥預(yù)防上??赡艿脑蛟谟冢芙逃礁叩娜烁⒅厍矣心芰?比如獲得更多有效信息)預(yù)防疾病和保持身體健康。與ATE不顯著相比,DTE揭示了教育對醫(yī)療費(fèi)用指標(biāo)的因果效應(yīng)。

圖3 教育對medical的分布處理效應(yīng)

從認(rèn)知功能健康指標(biāo)word來看(圖4),F(xiàn)post(k)相對于Fpre(k)向右移動范圍較大,兩者的差異非常明顯且隨著word取值不同而變化,表明教育能夠使相當(dāng)一部分群體的word大幅提升,并且對不同分布位置人群的作用大小不同。具體地,F(xiàn)post(k)與Fpre(k)的差異在[-2.2,1.53]上統(tǒng)計(jì)顯著,該區(qū)域涵蓋了約96%的分布區(qū)間,以及95%左右的樣本。換言之,當(dāng)偏離word均值-2.2~1.53個(gè)標(biāo)準(zhǔn)差時(shí),即當(dāng)個(gè)體的識字水平較差、一般甚至較好時(shí),教育均能顯著改善其識字水平,整個(gè)樣本中有95%左右的群體會受到教育的影響。進(jìn)一步地,隨著識字水平的逐步提高,教育對分布在拒絕域內(nèi)群體的影響逐漸減小。當(dāng)word分別取-2.2、0與1.53時(shí),教育使得word分別增加約1.54、0.9與0.06個(gè)標(biāo)準(zhǔn)差,相對于其自身分布位置,教育對拒絕域內(nèi)群體的影響均非常大(9)從分位數(shù)的角度解釋,假定在正態(tài)分布的情況下,對于word取值分別為-2.2、0與1.53的人群,接受教育將使其分別從word分布的1.4%分位點(diǎn)處〔Φ(-2.2)≈0.014〕提高至25.5%分位點(diǎn)處〔Φ(-2.2+1.54)≈0.255〕、從50%分位點(diǎn)處〔Φ(0)=0.5〕提高至81.6%分位點(diǎn)處〔Φ(0+0.9)≈0.816〕、從93.7%分位點(diǎn)處〔Φ(1.53)=0.937〕提高至94.4%分位點(diǎn)處〔Φ(1.53+0.06)≈0.944〕。。

因此,除了樣本中5%的識字水平極差或極強(qiáng)的人群,對于識字水平一般、較差或較好的人群而言,教育均能顯著提高其識字水平,并且教育對識字水平的影響隨識字水平的提高而逐漸減小。

圖4 教育對word的分布處理效應(yīng)

最后,從認(rèn)知功能指標(biāo)math來看(圖5),與識字水平的估計(jì)結(jié)果相似,教育能夠使相當(dāng)一部分人群的數(shù)學(xué)水平大幅提升,且對不同分布位置人群的作用大小不同。具體地,F(xiàn)post(k)與Fpre(k)的差異在[-1.95,2.13]上統(tǒng)計(jì)顯著,涵蓋了約92%的分布區(qū)間共95%左右的樣本。換言之,當(dāng)個(gè)體的數(shù)學(xué)水平較差、一般和較好時(shí),教育均能顯著改善其數(shù)學(xué)水平。進(jìn)一步地,仍可以發(fā)現(xiàn),教育對分布在拒絕域內(nèi)群體的影響隨著數(shù)學(xué)水平的提高,整體上呈遞減趨勢。當(dāng)math的取值分別為-1.95、0與2.13時(shí),教育使得math分別增加約1.99、1.32與0.06個(gè)標(biāo)準(zhǔn)差,相對于其自身分布位置,教育對拒絕域內(nèi)群體的影響均非常大。

因此,除了樣本中5%的數(shù)學(xué)水平極差或極強(qiáng)的人群,對于數(shù)學(xué)水平一般、較差或較好的人群,教育均能顯著提高其數(shù)學(xué)水平,并且教育對數(shù)學(xué)水平的影響隨數(shù)學(xué)水平的提高而逐漸減小。與ATE相比,DTE揭示了教育對認(rèn)知功能的異質(zhì)性作用以及作用規(guī)律。

圖5 教育對math的分布處理效應(yīng)

總體而言,與ATE相比,DTE揭示了教育對身體健康和認(rèn)知功能健康的異質(zhì)性影響和影響對象。從BMI和醫(yī)療費(fèi)用的角度,教育能夠顯著改善部分(約65%)身體健康狀況較差或良好的人群的身體健康;從識字水平和數(shù)學(xué)水平的角度,教育能夠顯著改善絕大部分(約95%)認(rèn)知功能較差、一般或較好的人群的認(rèn)知功能健康,并且隨著健康狀況的改善,教育的作用逐漸減小。

五、穩(wěn)健性檢驗(yàn)

(一)精煉樣本

在一個(gè)較長時(shí)間的年齡分布中,對照組人群的健康水平可能由于時(shí)間趨勢而差于處理組人群,為了控制這種影響,本文將樣本精煉至義務(wù)教育法生效時(shí)年齡為13~16歲的人群,包含兩年的處理組(13歲和14歲)和兩年的控制組(15歲和16歲)樣本,利用分布檢驗(yàn)方法研究教育與精煉之后樣本的健康的因果關(guān)系。分布檢驗(yàn)第一階段的結(jié)果表明教育對健康各指標(biāo)的影響均在1%的水平上統(tǒng)計(jì)顯著。第二階段的結(jié)果與全樣本估計(jì)的結(jié)果相一致,對于健康狀況較差的人群而言,教育能顯著改善其健康水平,包括改善體型與營養(yǎng)狀況、降低醫(yī)療費(fèi)用以及提高認(rèn)知功能,一定程度上表明本文研究結(jié)果是穩(wěn)健的(10)限于篇幅,精煉樣本的穩(wěn)健性檢驗(yàn)結(jié)果不再贅述。。

(二)安慰劑檢驗(yàn)

進(jìn)一步地,基于兩個(gè)反事實(shí)假定,分別進(jìn)行兩組安慰劑檢驗(yàn)(placebo)。首先,假定義務(wù)教育法生效時(shí)間在實(shí)際生效時(shí)間之后的兩年,比如1986年生效的義務(wù)教育法,在該假定中為1988年生效。為了更好地控制其他影響因素,將樣本精煉為“假定的臨界點(diǎn)”前、后各兩年內(nèi)。此時(shí),處理組為義務(wù)教育法實(shí)際生效時(shí)15~16歲的群體,對照組為義務(wù)教育法實(shí)際生效時(shí)17~18歲的群體。其次,假定義務(wù)教育法生效時(shí)間在實(shí)際生效時(shí)間之前的兩年,比如1986年生效的義務(wù)教育法,在該假定中為1984年生效。同樣地,將樣本精煉為“假定的臨界點(diǎn)”前、后各兩年內(nèi)。此時(shí),處理組為義務(wù)教育法實(shí)際生效時(shí)11~12歲的群體,對照組為義務(wù)教育法實(shí)際生效時(shí)13~14歲的群體。

對以上兩組樣本的分布檢驗(yàn)的結(jié)果均顯示,教育對BMI、醫(yī)療費(fèi)用和認(rèn)知功能均沒有顯著影響。圖6以第二組樣本為例展示了安慰劑檢驗(yàn)的結(jié)果(10%的顯著性水平),可以看到,所有健康指標(biāo)的兩個(gè)累積分布函數(shù)Fpost(k)和Fpre(k)都基本重合,在任何分位點(diǎn)上都不存在顯著差異。因此,假定的兩組樣本均無法得到與前文一致的結(jié)論。安慰劑檢驗(yàn)的結(jié)果表明,本文研究結(jié)果是穩(wěn)健的,教育能夠顯著提高特定人群的健康水平,且對處于健康分布不同位置的人群的影響大小不同。

圖6 安慰劑檢驗(yàn)

六、結(jié)論與討論

本文首先基于RDD框架估計(jì)了教育對健康的平均處理效應(yīng)(ATE),發(fā)現(xiàn)教育能夠在較大程度上顯著改善個(gè)體的認(rèn)知功能,但對代表身體健康的BMI和醫(yī)療費(fèi)用這兩個(gè)指標(biāo)并無顯著影響。

考慮到教育可能對不同分布位置人群存在異質(zhì)性影響,本文仍基于RDD框架,進(jìn)一步使用分布檢驗(yàn)方法估計(jì)了教育對健康的分布處理效應(yīng)(DTE)。研究主要發(fā)現(xiàn):第一,不管是身體健康還是認(rèn)知功能健康,教育均能顯著改善健康狀況良好或較差的人群的健康水平,還能在一定程度上改善認(rèn)知水平較好的人群的認(rèn)知功能健康,且教育對認(rèn)知功能健康的影響大于身體健康;第二,整體來看,隨著健康狀況的改善,教育對健康的影響呈遞減趨勢,健康狀況較差的人受到的影響較大。

具體到衡量健康水平的各個(gè)指標(biāo):對于樣本中約65%的體型與營養(yǎng)狀況良好或較差的人而言,教育使其BMI顯著提高0.16~0.43個(gè)標(biāo)準(zhǔn)差左右;對于樣本中約8%的身體狀況良好或患有一般疾病的人而言,教育使其醫(yī)療費(fèi)用顯著降低0.02~0.2個(gè)標(biāo)準(zhǔn)差左右;對于樣本中約95%的識字水平較好、正?;蜉^差的人而言,教育使其識字水平顯著提高0.06~1.54個(gè)標(biāo)準(zhǔn)差左右;對于樣本中約95%的數(shù)學(xué)水平較好、正常或較差的人而言,教育使其數(shù)學(xué)水平顯著提高0.06~1.99個(gè)標(biāo)準(zhǔn)差左右??梢钥吹?,教育對認(rèn)知功能健康的作用和影響范圍均大于身體健康。另外,從分位數(shù)的角度理解標(biāo)準(zhǔn)差,教育對這些健康指標(biāo)的影響均比較大。

本研究的政策啟示主要在于:一是充分利用教育來提高人口的身體健康和認(rèn)知功能健康水平,以教育強(qiáng)化健康人力資本,應(yīng)對老齡化挑戰(zhàn);二是教育對亞健康狀況的人群具有更大的影響,因此,在改善農(nóng)村貧困地區(qū)人口的教育與健康方面,合理地增加教育投入可能會達(dá)到事半功倍的效果,從而為農(nóng)村減貧做出一定貢獻(xiàn)。

猜你喜歡
人群個(gè)體變量
抓住不變量解題
糖尿病早預(yù)防、早控制
也談分離變量
關(guān)注個(gè)體防護(hù)裝備
我走進(jìn)人群
財(cái)富焦慮人群
個(gè)體反思機(jī)制的缺失與救贖
How Cats See the World
分離變量法:常見的通性通法
秘書緣何成為『高危人群』