馮璐,楊仁琨,王瑞民
(1 北京大學 經濟學院,北京 100871; 2 [美]俄亥俄州立大學 經濟系;3 國務院發(fā)展研究中心市場經濟研究所,北京 100010)
在勞動經濟學文獻中,社會資本與社會網絡(1)社會網絡與社會資本是一對相關但又不完全相同的概念。經濟學文獻中沿用最多的社會資本定義來自Putnam(2000),他將社會資本定義為社會網絡、互惠性社會規(guī)范以及由其產生的社會信任,因而,社會網絡通常被認為是社會資本的一個重要的子集。具體而言,社會網絡在個體層面的表現(xiàn)為一個人所擁有的社會聯(lián)系,包括親戚、朋友、老鄉(xiāng)等。在勞動力市場上的重要性一直倍受重視。根據Ioannides & Loury(2004)和Topa(2011)的綜述,過去三四十年針對世界各國的相關研究表明,至少30% 到50% 的求職者是通過親戚、朋友找到工作的。譬如,Rees(1966)的早期調查顯示,在芝加哥的勞動市場上有超過80%的藍領和超過50%的白領通過關系獲得工作。在Addison & Portugal(2002)對葡萄牙、Wahba & Zenou(2005)對埃及的研究中,這一比例分別是25%、52% 。針對中國的研究也發(fā)現(xiàn)了類似模式,這一比例在章元等(2008)、王春超和周先波(2013)等研究中達到50% 或更高。而本文使用的樣本顯示,通過社會網絡獲取工作信息和通過介紹得到工作的比例同樣高達 55% 和31%。與此同時,越來越多的研究也表明,社會網絡不僅是獲取工作的一個重要渠道,也能顯著提高求職者的受雇概率并有助于其獲得更高的工資與更好的工作條件(Beaman,2012;Brown et al.,2016)。
有一個群體受到了勞動和發(fā)展經濟學者的格外關注,即遷移勞動人口。這是因為,作為所在地勞動力市場的“新來者”移民群體與當?shù)鼐用裣啾韧狈蜆I(yè)信息,因而更傾向于通過已經進入當?shù)貏趧邮袌龅挠H戚、朋友、老鄉(xiāng)的幫助找工作,對社會資源有著更強的依賴(Borjas,1992;Munshi,2003,2015)。這一現(xiàn)象不僅在國際移民中十分普遍,同樣廣泛存在于我國龐大的農民工群體之中。在快速的城市化進程中,我國每年從農村向城市遷移的人口超過1500萬,這一群體在城市勞動力市場如何利用其社會網絡在近十年得到了學術界的廣泛關注(Lin,2001;章元,陸銘,2009;葉靜怡,周曄馨,2010;葉靜怡,武玲蔚,2014)。
然而,社會網絡這一概念的復雜性和模糊性給這個話題實證研究帶來了相當?shù)奶魬?zhàn)(Portes,1998;Manski,2000;Mouw,2006)。首先,社會網絡的強度受結構維度(家人關系、熟人關系、陌生人關系的劃分)、關系維度(互動性與親密性)以及認知維度(互惠性行為與共同價值觀)等多個因素的共同影響(Nahapiet & Ghoshal,1998),我們很難對這些不同維度的指標進行一概而論的分析。其次,已有的數(shù)據集往往只能涵蓋社會網絡部分維度指標,而不同的數(shù)據集對這些細分維度也有著不同的測度方式(2)對社會網絡及社會資本概念與測量的綜述性討論可以參考Mouw(2003),Durlauf & Fafchamps(2005),陳云松和范曉光(2011),周曄馨和葉靜怡(2013)以及郭云南等(2015)。,這讓我們在橫向比較不同實證研究結果時很容易遇到概念的混淆或結論的不可比(Durlauf & Fafchamps,2005)。再次,社會網絡的不同維度對勞動力市場效應又有著不同的作用機制(Zhang and Li,2003),譬如,“是否使用社會網絡獲得工作”對工資的影響往往是通過工作搜尋和崗位匹配發(fā)揮作用的,而“擁有多少親戚、朋友”這一數(shù)量指標以及“社會聯(lián)系的職業(yè)聲望”這一質量指標的作用機制則更加間接并復雜。為了避免不同度量方式及不同影響機制帶來的概念混淆,本文將集中討論社會網絡數(shù)量對農民工工資的影響,而將社會網絡使用、社會網絡質量的影響隔離開,留待后續(xù)研究討論。
另一個嚴重的問題是,社會網絡通常被認為具有較強的內生性,其數(shù)量維度也不例外。一方面,社會網絡大小與工資收入可能互為因果,擁有更多人脈者可能獲得更高的收入,但反過來收入較高者更有意愿和能力去投資并拓展自己的社會交際。另一方面,社會網絡大小通常與一些不可觀測的個人或家庭異質性相關,而這會導致實證估計中的遺漏變量偏差問題。比如,社會網絡資源較多的人往往是那些個人能力更強、性格更為積極向上或者來自擁有更多社會資源的家庭的人。因此,如果不能使用正確的因果識別策略,那么通過簡單回歸得到的相關關系就無法令人信服。
本文的貢獻在于,通過引入群體層面的地緣移民網絡作為個體社會網絡的工具變量,較好地處理個體社會網絡大小的內生性問題,并區(qū)分了強關系(親戚數(shù)量)和弱關系(朋友數(shù)量)對工資水平的影響。進一步地,為了避免群體網絡變量可能存在的選擇性偏誤帶來的工具變量合法性問題,本文在地緣移民網絡變量的基礎上仔細構造了修正的工具變量,這一修正有效克服了遷移成本可能帶來的遷移自選擇問題,提供了更為可靠的因果識別。研究發(fā)現(xiàn):朋友數(shù)量與工資水平有顯著的相關性,而在控制朋友數(shù)量后,親戚數(shù)量與工資水平的影響并不顯著;利用移民網絡作為工具變量處理社會網絡內生性之后,我們進一步發(fā)現(xiàn),即使是朋友數(shù)量對工資水平也沒有顯著的因果效應。
本文后續(xù)部分安排如下:第二部分對現(xiàn)有相關文獻進行評述,第三部分介紹本文使用的數(shù)據來源、結構并對相關變量作出說明與描述性統(tǒng)計,第四部分報告實證分析結果,第五部分總結全文并提出未來進一步研究的方向。
社會網絡對工作獲取與工資水平的影響通常是通過促進求職信息傳遞、克服雇員能力或努力程度的信息不對稱,以及提供同儕效應來發(fā)揮作用的。Granovetter(1973)對弱關系的分析最早從理論上揭示了社會網絡結構對信息流通的促進作用。他指出,強關系形成的社會群體內部信息重復率高,而弱關系是不同群體間的橋梁,有助于個體獲取自己“圈子”中所不具有的職業(yè)信息。其后,經濟學家將社會網絡的信息傳遞效應納入規(guī)范的數(shù)理模型中,給出了更加堅實的理論基礎。在社會網絡在求職過程中的使用方面,Wahba & Zenou(2005)的模型發(fā)現(xiàn),在某一閾值之下一個求職者通過關系找工作的概率隨社會網絡的擴大而提高,來自埃及的微觀數(shù)據也證實了上述判斷。在對社會網絡的投資和求職行為的互動過程方面,Zenou(2015)建立了一個動態(tài)勞動力市場模型將Granovetter的弱關系思想內生化。這一模型的穩(wěn)態(tài)均衡(steady-state equilibrium)指出,當職位毀滅率(job-destruction rate)提高(即勞動力市場處于下行期)或職位信息流通(job-information rate)提高,求職者傾向于投入更多時間在弱關系的拓展上(3)這是因為強關系的數(shù)量有限且對象固定,當一個無業(yè)求職者的強關系在某一期全部或大部分處于失業(yè)狀態(tài)時,新的職位信息無法流動到這樣的圈子,這就導致這些求職者長期受困于失業(yè)狀態(tài)。這時這類求職者會轉向弱關系的拓展,而策略互補型的社會互動因素則推動這一策略擴散到整個勞動力市場。。在社會網絡信息效應對工資的影響方面,Mortensen 和 Vishwanath(1994)的搜尋模型指出,即使所有求職者能力同質,當企業(yè)隨機提供工資異質的職位時,由于通過在職者獲得的工資信息高于通過雇傭方獲得的工資信息,通過社會關系獲取信息的求職者會得到工資更高的職位(4)這一邏輯基于工作搜尋模型經典的閾值決策法則,也即求職者只有在企業(yè)所提供職位的工資高于保留工資時才接受工作。這里雇傭方提供的工資信息服從原分布,而在職者都是接受了高于保留工資職位的前求職者,因而其工資信息分布相對原分布右偏,這也導致更多依賴社會關系獲取信息的求職者所獲工資在一階隨機占優(yōu)的意義上高于更依賴正式渠道的求職者。。
Montgomery(1991,1992)則是最早將社會網絡引入勞動力市場模型來研究其在克服隱藏信息帶來的效率損失方面作用的學者。他的模型指出,在求職者的異質生產率是私人信息時,推薦者出于自身信譽和發(fā)展的考量會充當一個篩選機制,向企業(yè)推薦有更高生產率或與相應崗位更加匹配的雇員,因而企業(yè)也更愿意向通過員工推薦的求職者提供待遇更為優(yōu)厚的職位。
葉靜怡等(2012)則研究了社會網絡通過同儕壓力產生的生產率效應。他們應用Akerlof&Kranton(2000)的身份定位博弈模型指出,高質量的社會網絡可能對勞動者存在負反饋威脅,從而使其提高工作的努力程度,進而獲得更高的收入。Lindquist et al.(2015)的模型更細致地分析了同儕壓力帶來的“局部平均效應”和技術外溢帶來的“局部加總效應”,為實證上估計同事社會網絡對生產率的影響提供了有效的識別手段。此外,Delattre和 Sabatier(2004)綜合了信息優(yōu)勢帶來的更多機會和同儕壓力帶來的生產率提高這兩方面因素,指出這兩個因素都會推動勞動力需求曲線的右移,從而使社會網絡使用者獲得的均衡工資提高。
需要指出的是,也有學者研究了社會網絡可能帶來的負面效應。Bentolila et al.(2010)就指出,依賴于社會關系的不充分搜尋和職位選擇可能使求職者的能力或技術類型與特定工作崗位的匹配程度較差,特別是當求職者出于社會交往的壓力不得不接受相應的崗位時,他們就會面臨更多的工資損失。
第二大類研究則是對社會網絡工資回報的實證估計。值得注意的是,現(xiàn)有文獻對社會網絡是否有助于提高勞動者,特別是遷移勞動人口的研究視角和結論存在不小的分歧,一部分研究認為社會網絡對勞動者工資沒有顯著影響(Mouw,2003;劉林平,張春泥,2007;章元等,2008;章元,陸銘,2009),而另一部分文獻則發(fā)現(xiàn)了顯著的正向作用(Munshi,2003;Lin,2001;Knight & Yueh,2008;陳釗等,2009;王春超,周先波,2013;葉靜怡等,2012;Hensvik & Nordstrom,2013;葉靜怡,武玲蔚,2014;Burks et al.,2015;Schmutte,2015;Brown et al.,2016)。造成這種結論差異的,除了這一作用本身的爭議性和不同國別、種族和群體的差異性之外,一個重要因素是度量指標的繁雜:同樣是社會網絡與社會資本,在不同的數(shù)據集中有著各種各樣的代理變量,而不同研究的著眼點也有很大差異。一些文獻選取了相對單一的維度,如Munshi(2003)和陳云松(2012)研究社會網絡大小的作用,葉靜怡等(2012)研究社會網絡層次和質量的作用,Hensvik & Nordstrom(2013)、Burks et al.(2015)以及Brown et al.(2016)等一批最近涌現(xiàn)的文獻通過企業(yè)雇員匹配數(shù)據研究工作推薦的作用;一些文獻傾向于將社會網絡不同維度的指標進行對比區(qū)分,如王春超和周先波(2013)對基于同一社群的“整合型”社會資本和基于不同社群間溝通與跨越的“跨越型”社會資本的區(qū)分;一些文獻則傾向于應用主成分分析法對多層次、多維度的社會網絡變量進行降維處理,進而生成單一的、綜合性的社會網絡代理變量,如周曄馨等(2013)、葉靜怡和武玲蔚(2014)。
這些文獻中只有一部分考察了本文所研究社會網絡大小的作用,為網絡大小尋求的代理變量也各有側重,但絕大部分都發(fā)現(xiàn)此變量對求職和工資有正向作用。譬如Munshi(2003)的社會網絡變量是來源地社群層面上的外出移民網絡,發(fā)現(xiàn)同群移民網絡的擴大能夠幫助墨西哥移民提高在美國的非農工作獲取概率并得到更高工資;陳釗等(2009)使用的是找工作時能夠提供幫助的(潛在)人數(shù),發(fā)現(xiàn)這一指標有助于求職者進入高收入行業(yè);Knight and Yueh(2008)對中國的研究和Amuedo-Dorantes & Mundra(2007)對墨西哥—美國移民的研究使用的則是家庭擁有的親友數(shù)量,并且都發(fā)現(xiàn)了親友數(shù)量對求職與工資的顯著幫助;章元和陸銘(2009)使用的則是贈送過禮品的親友數(shù)量,這一指標不僅反應了個人或家庭社會網絡的大小,同時還反應了對社會網絡投資的意愿,而這一研究發(fā)現(xiàn)該指標對農民工工資只有極微小的作用。相比之下,本文使用的社會網絡大小的代理變量是“在打工所在城市擁有的親友數(shù)量”,這一變量有兩個層面上的意義:一方面,這一變量將社會網絡限定在打工所在城市,更可能對個體找工作、獲得高收入產生影響;另一方面,這一變量針對的是調查時點的情形,因而包含了在該城市打工期間新結交的朋友,同時包含原始型社會資本和新型社會資本的雙重信息。
社會網絡的內生性是實證文獻的另一個關注重點。一部分較早的研究對這一問題缺乏細致處理(Lin,2001;劉林平,張春泥,2007;王春超,周先波,2013)。而隨著這一領域的不斷深入拓展,內生性問題逐漸受到越來越多的重視(相關綜述見陳云松和范曉光,2011)。在已有文獻中,工具變量法是最常見的識別手段,而傾向值匹配、赫克曼兩階段法、內生轉換模型、一階差分以及自然實驗等方法雖然也有不少應用,但前三者一般用于“是否使用社會網絡”這一二值解釋變量的因果識別,后二者則對數(shù)據結構有較強的要求,在社會網絡大小的研究中使用較少。目前文獻中常見的工具變量構造主要包括三類:自然條件(Munshi,2003;陳云松,2012;Zhang & Zhao,2015),家庭政治背景(章元,陸銘,2009)和社會文化背景(Narayan & Pritchett,1999;葉靜怡,周曄馨,2010;葉靜怡,武玲蔚,2014)。其中,Munshi(2003)使用來源地的滯后期降雨量作為墨西哥到美國社群遷移網絡的工具變量,是這一議題在工具變量選取方面的經典之作,而陳云松(2012)沿用其思路,使用村莊遭受自然災害強度作為同村打工網的工具變量。這兩個工具變量可以被視為外生沖擊,都有效地滿足了排除性條件和相關性條件,但也存在推廣范圍的限制。這是因為,來源地的滯后期自然沖擊通常是通過影響務農收入從而影響社群中個體的遷移決策,進而影響作為一個整體的社群移民網(同村打工網)的大小。而在常見的農民工調查研究中,受訪者個體或家庭報告的社會關系數(shù)量、層次等信息是更為常用的個體社會網絡代理變量,自然沖擊作為工具變量很難應用于這類內生變量。Zhang & Zhao(2015)使用來源省省會與所在城市的交通距離作為工具變量研究親友網絡大小對農民工自雇傭選擇的影響,但這一工具的選取很難應用于關系對工資影響的研究,因為距離作為工具很難避免能力和進取精神相關的遺漏變量帶來的遷移自選擇偏誤(5)Zhang & Zhao(2015)指出這一問題在自雇傭選擇的研究中同樣可能存在。。
在家庭政治背景和社會文化背景方面,章元和陸銘(2009)使用配偶家庭在文革時期的政治成分做送禮親友數(shù)目的工具變量。但家庭政治成分往往與經濟背景、遺傳能力、家庭教育等不可觀測變量存在較強的正相關關系,即使是配偶的家庭背景變量,考慮到擇偶匹配(assortative mating,即門當戶對現(xiàn)象)的影響,也很難避免這一相關性的影響。葉靜怡和周曄馨(2010)使用婚姻狀況作為社會資本的工具變量,但即使考慮到中國農村“男大當婚女大當嫁”的傳統(tǒng),這一變量與個人與家庭收入水平依然有著難以否認的雙向因果關系。葉靜怡和武玲蔚(2014)則使用春節(jié)是否拜年以及拜年頻次作為工具,并指出這一行為更多受到文化習俗影響,可以作為外生變異的來源。但我們仍然很難排除這兩個變量與收入水平的直接互為因果以及與遺漏變量如社交能力的相關性,同時,特別是考慮到親疏程度介于可拜訪可不拜訪的一類親友,我們通常會看到高收入者、高能力者更可能選擇去拜年,而收入較低、社交意愿與能力不足者則可能選擇不去拜年。Narayan & Pritchett(1999)使用信任水平作社會資本的工具變量,同樣存在遺漏變量引起的正向偏誤??傊?,由于很多工具或與收入具有直接正相關,或與殘差項具有正相關關系,通過上述工具變量進行的估計往往可能高估社會網絡的工資回報(6)需要指出的是,這種估計偏誤并不必然導致研究結果不可信。在社會網絡對工資具有正向影響或沒有顯著影響的前提下,如果使用這一類工具變量得到的二階段系數(shù)仍然顯著為正,那么社會網絡的實際作用并沒有被可信地識別出來,這種顯著的正系數(shù)仍可能是由工具變量的正偏誤導致的;但如果二階段系數(shù)不是顯著為正,那么這一結果反而更為可信,因為被高估的系數(shù)仍然不顯著為正恰恰說明真實系數(shù)更不可能顯著為正。。
本文使用的工具變量是群體層面的網絡變量——由數(shù)據集構建的“來自同省份在同城市打工的樣本個數(shù)”,即打工城市的老鄉(xiāng)數(shù)量。不同于以往文獻中常使用的地域特征或家庭特征,這一工具變量的構建與個體或家庭層面上的遺漏能力特征不具有相關性,因而可以避免工具變量不夠外生的問題。
本文數(shù)據來自中國人民大學“城市化過程中的農地制度與相關社會保障研究”課題組在2009 年進行的6省12城市流動人口調查。在長三角、珠三角、環(huán)渤海和成渝地區(qū)這四個主要的城市化地區(qū),每個地區(qū)抽取三個城市(包括特大城市、大中城市、中小城鎮(zhèn)),利用各市外來流動人口登記計算機系統(tǒng),每個城市選取200個流動人口進行等距隨機抽樣。由于特大城市流動人口規(guī)模往往很大,在全市范圍內進行抽樣難度過大,因此,在人口超過100萬的特大城市,只選取一個下轄區(qū)進行調查。對于四個特大城市,最后確定的調查區(qū)域是廣東廣州市白云區(qū)、重慶九龍坡區(qū)、浙江寧波市江北區(qū)、山東濟南市歷城區(qū);對大中城市和中小城鎮(zhèn),則選取城市(或城鎮(zhèn))所在地下轄所有城區(qū)進行調查,抽樣地點包括珠三角的廣東中山市、東莞市茶山鎮(zhèn),長三角的江蘇江陰市、浙江樂清市,環(huán)渤海的山東濰坊市和河北三河市燕郊鎮(zhèn),成渝地區(qū)的四川南充市和成都市溫江區(qū)。由于流動人口流動性較大,通過計算機系統(tǒng)抽樣抽到的流動人口很可能已流動到他地。在這種情況下,課題組將根據等距原則繼續(xù)抽樣,直到抽取到預定樣本數(shù)。最終獲得 2299 個有效樣本。調查的內容包含被訪者個人與家庭情況,包括被訪者本人與配偶的就業(yè)與收入情況、家庭背景、社會網絡與社會資本擁有量等。
表1 主要變量及其描述統(tǒng)計
本研究分析的變量主要包括:被解釋變量工資水平、社會網絡變量、人力資本變量以及其他個人特征。表 1 報告了主要變量及其基本描述統(tǒng)計。本文使用的被解釋變量是受訪農民工 2008 所從事工作的對數(shù)小時工資,樣本平均小時工資為 7.39 元。個人基本特征方面,樣本 56.6% 為男性,平均年齡為 32 歲,62% 已婚。社會網絡變量方面,包括在同一城市的朋友、親戚數(shù)量及其加總數(shù)量,統(tǒng)計結果顯示樣本農民工在其打工所在城市平均擁有 8 個朋友和 4 個親戚。人力資本方面,平均受教育年限為 9 年(大致相當于初中學歷),在打工城市的平均工作年限為7年。此外,黨員的比例只有 6%,這也與我們的經驗認識和其他文獻的發(fā)現(xiàn)一致。表 2 報告了四大城市圈各自的農民工工資與社會網絡大小統(tǒng)計,可以看到,總體而言環(huán)渤海地區(qū)三個城市(鎮(zhèn))的外來打工者的平均工資和擁有的社會網絡都相對較小,而珠三角三個城市(鎮(zhèn))的打工者則有著最高的平均工資和最多的親友網絡。
表2 四大城市化地區(qū)工資及社會網絡對比
圖1 同城市親友數(shù)量分布密度
圖1報告了數(shù)據集中社會網絡的分布密度。其中左圖報告了同城市親友總數(shù)的分布直方圖和核密度分布,大部分農民工在打工城市擁有的親友數(shù)目集中在 0 到 50,分布形狀高度左偏。右圖對這一社會網絡變量進行了對數(shù)處理,以便于觀察其分布形狀,同時也與后文的計量分析部分保持一致。
本文采用經典的Mincer工資方程作為基本模型:
lnhourwage=Xα+Nβ+ε
其中被解釋變量是農民工的小時工資對數(shù)。解釋變量中,X是一個包含常數(shù)項、性別、婚姻狀況、教育、本市工作經驗、工作經驗平方、政治面貌及民族等控制變量的向量,其中性別、婚姻狀況、政治面貌與民族為虛擬變量,分別以女性、未婚、非黨員以及少數(shù)民族為對照組。N為社會網絡大小的代理變量向量,包括朋友數(shù)對數(shù)、親戚數(shù)對數(shù)、親友總數(shù)對數(shù)或其組合。ε為誤差項。
本文首先對這一工資方程進行簡單最小二乘回歸,得到社會網絡大小對工資影響的系數(shù)估計值,但這一估計值的一致性和無偏性依賴于社會網絡變量與誤差項的相關性,只有在E(Nε)=0時OLS估計值才是一致無偏的。然而,由于誤差項中包含的個人能力與家庭特征可能與社會網絡大小有關,E(Nε)=0這一條件很可能并不滿足。在這種情況下,需要引入一個只對個人社會網絡有影響,而不通過其他渠道影響工資或被工資影響的變量作為社會網絡的工具變量進行二階段回歸,從而獲得社會網絡工資回報的一致無偏估計量。嚴格地講,這里的工具變量二階段回歸包括兩個方程,其中第二階段的方程即上述工資決定方程,而第一階段的則是社會網絡決定方程:
N=Xγ1+IVγ2+U
其中,X是前述控制變量;U是誤差項;IV為本文構建的工具變量,即群體層面的移民網絡。如果滿足E(Nε)≠0與E(IVε)=0兩個條件,可以證明通過二階段回歸得到的β系數(shù)估計值是一致估計量。
這一部分我們對農民工社會網絡的工資回報進行簡單最小二乘法估計。表2報告了OLS回歸結果。六個模型設定使用的被解釋變量均為小時工資的對數(shù),核心解釋變量是社會網絡的大小。其中模型(1)使用打工所在城市的朋友與親戚總數(shù)(對數(shù))作為社會網絡大小的代理變量,而模型(2)則將構成這一變量的朋友和親戚兩個變量分開處理,分別代表調查對象的弱關系與強關系數(shù)量。相應地,模型(3)(4)在模型(1)(2)的基礎上控制了打工所在城市的固定效應,以消除城市間收入水平差異帶來的影響。模型(5)(6)則進一步控制了來源省份的固定效應。
由于模型的被解釋變量和社會網絡解釋變量均取了對數(shù)值,社會網絡變量的系數(shù)實際上代表了網絡的小時工資彈性。從表2前兩列的回歸結果里我們可以看到,總社會網絡大小的小時工資彈性為0.0244,并在5% 水平上顯著;區(qū)分開代表弱關系的朋友數(shù)和代表強關系的親戚數(shù)后,我們發(fā)現(xiàn)親戚數(shù)量與其他控制變量不變的情況下,朋友數(shù)對工資的影響較大且在1%水平上顯著;而控制朋友數(shù)量與其他控制變量后,親戚數(shù)量的工資回報則極小且不顯著。上述結果給出了本文的第一個初步推論:其他條件不變的情況下,一個人的弱關系數(shù)(朋友數(shù))對其工資有顯著的正影響,而強關系數(shù)(親戚數(shù))則沒有系統(tǒng)性的影響。控制了打工所在城市的固定效應后,總關系數(shù)量和朋友數(shù)量的小時工資彈性分別下降到0.0194和0.0293,但都保持顯著,其他控制變量中只有性別、工作經驗和民族的系數(shù)發(fā)生了一定改變。在進一步控制來源省固定效應后,關系數(shù)量的小時工資彈性仍然顯著并且只有小幅度變動,而回歸方程的所有變量系數(shù)也未發(fā)生系統(tǒng)性變化。
具體考察所在城市和來源省份虛擬變量的影響,我們得到了和經濟直覺以及現(xiàn)有文獻(劉平林和張春泥,2007)都很一致的發(fā)現(xiàn),即工作所在城市對工資水平有顯著影響,而來源省份則幾乎沒有影響。以模型(5)的回歸系數(shù)為例,在11個城市虛擬變量中有7個變量的系數(shù)顯著,其中以寧波市為對照,無錫、廣州、中山、成都四個城市的農民工條件工資水平與之相仿,溫州、東莞有著顯著更高的條件工資水平,而濟南、廊坊、濰坊、重慶、南充的條件工資水平則較低。與之相比,28個來源省份虛擬變量中只有4個變量的系數(shù)顯著,并且來自這4個省份的農民工人數(shù)也較少,不到總樣本的5%,可以認為來源省份虛擬變量對工資水平的影響很小。因此,在后文的進一步估計中我們只考慮所在城市固定效應而不再考慮來源省固定效應。
表3 社會網絡大小的工資回報:OLS回歸結果 (被解釋變量:小時工資對數(shù))
本文使用省級層面的移民網絡規(guī)模做個體層面的社會網絡規(guī)模的工具變量,基于數(shù)據集構造“在同一城市打工的來自同一省的人數(shù)”作為代理。我們知道,一個合意的工具變量需要滿足相關性和外生性兩個條件。相關性方面,這一工具變量代表個體在所在城市的潛在老鄉(xiāng)數(shù),與個人社會網絡大小的相關性非常直觀:當一個個體在城市中有更多來自同省的打工者,一方面他(她)有較多的親友在同城打工的概率自然較高,另一方面基于相同地緣和文化背景下的社交網絡拓展也更加容易。
在外生性方面,我們認為代表了潛在廣義“老鄉(xiāng)”規(guī)模的移民網絡對個人工資水平并沒有直接的影響,同時也很難受到個人工資水平的直接影響,因而較好地滿足工具變量的外生性假設。值得注意的是,這一工具變量與勞動力遷移文獻中常用的“社群移民網絡”變量在構造思路上非常類似,但在外生性上卻有一定區(qū)別。社群移民網絡變量在文獻中通常用“遷出地向外遷移的人口數(shù)量/比例”表示(7)具體而言,在最常見的墨西哥-美國移民研究中,移民網絡變量的度量為“一個給定社區(qū)15歲及以上人口(曾)向外遷移的比例”。,大多基于村莊或更小單位的社群構造(Massey et al.,1994;Zhao,2003;Mckenzie & Rapoport,2010;Munshi,2003、2011)。這一變量通常不僅僅通過個人社會網絡影響個人工資,同時也與宗族、社群、村莊等小群體的不可觀測的異質性有潛在相關性,因而并不適合作為個體社會網絡大小的工具。而在本研究中,我們的移民網絡變量有所不同,這一變量反應的事實上不是傳統(tǒng)使用的“老家外遷人口密度”而是“目的地城市老鄉(xiāng)密度”,其度量方式不依賴于村莊這一重要的遷移單位,而且這一“老鄉(xiāng)”是省級含義上的“潛在老鄉(xiāng)”,和個人社會網絡的重合度不高,且與宗族、家庭、村莊層面的遺漏變量沒有相關性,因而可以更好地避免遺漏變量造成的內生性偏誤。
另一個可能存在的問題是,這一工具變量雖然與個人遺漏變量不直接相關,卻可能通過進入勞動力市場前的外出打工決策的自選擇過程與工資水平間接相關(8)我們感謝Christopher Taber 對這一點的提醒。。具體而言,對同一來源地的人來說,能力和人力資本積累水平較低的個體只能到遷移成本相對較低的地方打工,從而使低能力者聚集在鄰近城市形成一個較大的老鄉(xiāng)網絡,而高能力者完全有能力遷移到老鄉(xiāng)較少、距離較遠的城市,因而目的地則相對分散,同城老鄉(xiāng)數(shù)量較少。這一思路與Munshi(2011)對社群網絡變量的估計偏誤的討論不謀而合:當遷移過程存在能力的正選擇,也即高能力者更傾向于遷移時,社群網絡的擴大會在邊際上帶來低能力者,從而造成社群網絡與殘差項的負相關;反之,當移民存在負選擇時,解釋變量與殘差項存在正相關。
為了盡量減小上述可能性帶來的估計偏誤,我們在前述兩階段最小二乘模型的基礎上加入了距離控制變量進行考察。這是因為:低能力農民工聚集形成大移民網絡的主要原因在于他們沒有能力跨越距離帶來的高遷移成本,因而在控制距離之后,工具變量潛在的外生性問題就會變得更加微弱。這里我們一共加入兩個表征遷移距離的變量,其中一個變量是“目前工作在本鄉(xiāng)、本縣外鄉(xiāng)、本省外縣還是外省”,這一距離變量實際上包含了行政、文化上的距離因素,并且更加注重短距離(省內)的細分。第二個變量是“目前所在城市與來源省份省會城市的鐵路距離”(9)這一變量與Zhang & Zhao(2015)的工具變量在構造方式上不謀而合。,這一變量具有更強的自然地理距離特征,對遠距離的刻畫更為精確,但對在省內或鄰省打工的農民工而言,度量誤差可能較大。
另一個可行的改進方式則是對原工具變量進行修正,將其中遷移成本差異帶來的潛在選擇偏誤因素“剝離”?;谶@一思路我們進行了如下的簡單構造:將原工具變量對距離變量進行回歸,并估計其殘差項,將所得到的估計值作為新的工具變量代入原問題進行回歸。
表4 報告了依據省級移民網絡工具變量得到的兩階段最小二乘估計結果。為了更好地削弱遺漏變量偏誤,我們添加了一定程度上代表個人和家庭遺漏能力的變量:父親的教育程度作為控制變量。表 4 的列 1 報告了作為對照的OLS回歸結果,而列 2 則展示了工具變量回歸的結果。我們發(fā)現(xiàn),在使用移民網絡作工具變量進行二階段回歸后,社會網絡大小的工資回報率變成負值,但統(tǒng)計上并不顯著;與此同時,性別工資差異、工作經驗回報都有一定程度擴大,而民族、政治面貌的系數(shù)也發(fā)生了變化。這一結果表明,在使用工具變量處理內生性之后,社會網絡大小對農民工工資并沒有顯著的影響。模型2、3、4中分別加入鐵路距離、行政距離以及同時加入兩個距離變量進行回歸,結果顯示朋友關系數(shù)量的系數(shù)絕對值有所減小,并依然保持不顯著。表5 報告了依據修正后的工具變量得到的兩階段最小二乘估計結果??梢钥吹剑褂眯拚蟮墓ぞ咦兞窟M行回歸,親友關系數(shù)量的系數(shù)絕對值在相同的控制變量組合下同樣有所減小且依然不顯著。這一系列結果都表明,在OLS中發(fā)現(xiàn)的社會網絡大小對工資的促進作用在考慮內生性之后消失了,因而這種相關關系更可能源于內生性而不具備因果性。
最后,我們沿用Acemoglu et al.(2001)工具變量外生性的粗略判斷方法(10)Acemoglu et al.(2001)是將原工具變量作為控制變量加入使用替代工具變量進行的2SLS方程進行回歸,這里由于缺少相應的替代工具變量,我們將原工具加入OLS方程進行回歸,這種方式明顯更加粗糙。值得注意的是,無論是加入替代工具變量的2SLS回歸還是原始OLS回歸,這種方法對于判斷工具變量外生性(排除性)條件的作用都非常有限,并可能有一定的誤導性。這一輔助判斷方式從理論上講既非充分又非必要——事實上正如我們所熟知的,工具變量的外生性只能通過其經濟意義判定,而無法通過統(tǒng)計和計量手段真正確定。,將移民網絡這一工具變量放入OLS方程里回歸,以作進一步的驗證。表6 列1—3報告的回歸結果顯示,當控制親友數(shù)量、其他個人特征而不控制距離時,同省移民網絡大小與工資有顯著的負相關關系,但控制距離變量,特別是鐵路距離后同省移民網絡與工資不再有顯著的相關性,這一定程度上意味著條件于遷移距離,同省移民網絡不通過個人網絡之外的渠道對農民工工資發(fā)揮作用。因此,我們認為同省移民網絡這一工具變量確實有可能具有一定的負向選擇效應,但可以通過加入距離變量進行很好的控制,因而在工具變量1-3的回歸中,我們更傾向于接受模型3的結果。列4—6報告了修正后工具變量的結果??梢钥吹?,在控制核心解釋變量和其他個人特征時,修正的工具變量對工資均無顯著影響,這也為這一工具變量提供了合法性的依據。
表7 弱工具檢驗及統(tǒng)計推斷
前文對工具變量的外生性做了細致的分析與處理,本節(jié)則對相關性問題作進一步的檢驗。我們知道,如果工具變量和核心解釋變量的相關性較小,也即存在一定的弱工具變量問題時,系數(shù)估計的無偏性和一致性都會收到干擾(Stock et al.,2012)。在表 7 中,我們進一步報告了工具變量一階段的回歸結果和弱工具檢驗結果。在第一階段回歸中,全部六個模型設定里的工具變量系數(shù)為正且在1%水平上顯著,而一階段系數(shù)的聯(lián)合檢驗F值則分布在7.86 到10.15 之間。根據Staiger & Stock(1997)提出的經驗法則(11)Staiger & Stock(1997)認為在單工具變量的情形下一階段F值大于10通??梢哉J為沒有弱工具變量的風險。,有五個模型設定的一階段F值略低于建議的經驗臨界值,可能存在一定的弱工具變量風險。因此,我們應用Montiel & Pflueger(2013)提出的方法進行了進一步的弱工具變量檢驗,發(fā)現(xiàn)Montiel-PfluegerF值在全部六個模型設定下均大于10,同樣說明工具變量可能存在一定的弱工具變量風險,但處于可接受范圍。
最后,表7還報告了工具變量回歸的Anderson-Rubin 檢驗結果。根據 Stock & Wright(2000)的經典結論,當弱工具變量風險存在時,我們可以使用Anderson-Rubin 統(tǒng)計量生成置信區(qū)間并對系數(shù)估計值進行檢驗??梢钥吹?,使用修正的工具變量進行的估計和使用原工具變量進行的回歸2和3(控制遷移距離變量后的回歸結果)都報告了較大的p值,也即我們無法拒絕社會網絡大小的系數(shù)為0這一原假設。
本文基于 2009 年 6 省 12 市流動人口調查數(shù)據,研究了農民工個體層面的社會網絡的大小對其工資的因果效因,并使用省級層面的同城打工人數(shù)作為個體社會網絡大小的工具變量進行因果識別。在細致地考察并處理了工具變量可能存在的內生性問題和弱工具問題之后,本文得出了以下較為穩(wěn)健的結論:
(1)個體層面的同城親戚數(shù)量與朋友數(shù)量均與工資水平呈正相關關系,但在控制朋友數(shù)量之后,親戚數(shù)量與工資不再有相關性;
(2)在考慮了社會網絡大小的內生性問題,并使用工具變量處理內生性之后,本文發(fā)現(xiàn)同城親友數(shù)量對農民工個體工資水平沒有因果效應,而Anderson-Rubin 穩(wěn)健檢驗也支持了這一結論。這一結果支持了章元和陸銘(2009)的觀點,但不同于大部分已有文獻中社會網絡大小對工資有正向影響的結論(Munshi,2003;Knight & Yueh,2008)。
需要指出的是,本文的分析結果認為在同城打工的親友數(shù)對農民工工資沒有因果效應,但這并不意味著社會網絡、社會資本對農民工在城市勞動力市場的表現(xiàn)沒有影響。首先,本研究使用的核心變量并不包括打工者在城市本地居民中的社交網絡,以及社會互動和同儕效應文獻中備受重視的“鄰里”、“社區(qū)”社會網絡;其次,數(shù)量只是社會網絡的一個維度,社會網絡的強度和質量也可能對勞動力市場上的表現(xiàn)有著重要的作用,而是否使用社會網絡獲得工作同樣是一個關鍵的因素。我們認為,在社會網絡內生性逐漸得到充分重視,各維度指標對勞動力市場的因果效應得到有力的識別之后,下一步工作應當集中在以下幾個方向:
(1)考察社會網絡在人口遷移過程中對能力、教育的選擇模式的影響(Mckenzie & Rappoport,2007)。針對這一問題的研究不僅有助于我們理解社會網絡對個體的幫助,也有助于理解勞動力遷移對遷出地、遷入地整體的收入分化與經濟平等問題。
(2)基于目前豐富的社會互動與同儕效應文獻,對社會資本的投資與積累,以及其與收入、經濟地位的互動機制。已有的文獻,特別是社會學文獻中,禮物贈送、春節(jié)拜年等行為作為社會資本的投資方式已經得到深入研究,但將這一投資行為納入結構性經濟系統(tǒng)之中的研究在中國還很少見。針對這一議題的研究無疑會在大量簡約型因果識別文獻的基礎上幫助我們加深對社會網絡與經濟行為互動模式的理解。
(3)對工作推薦等特定的社會網絡指標進行更加清晰深入的作用機制分析。這一話題早在Montgome(1991)等理論文獻中就有深入分析,但其實證上的突破則是在近五年大量涌現(xiàn)(Cingano & Rosolia,2012;Hensvik & Nordstrom,2013;Kramarz & Skans,2014;Schmutte,2015;Brown et al.,2016)。這些文獻大部分基于公司—雇員匹配數(shù)據,能夠深入挖掘工作推薦對被推薦者職位接受概率、工資水平、離職率、生產率以及對企業(yè)的福利影響,從而在機制上厘清社會網絡的作用。限于數(shù)據的普及度和精細度,國內目前還較缺乏這一類文獻,而相應數(shù)據的收集、整理和應用應當成為未來的一個重要突破方向。