周示瑩、付佳
(上海市浦東新區(qū)社會統(tǒng)計調(diào)查中心,上海 200136)
浦東新區(qū)就業(yè)相關(guān)大數(shù)據(jù)的數(shù)據(jù)源主要可分為政府?dāng)?shù)據(jù)和社會數(shù)據(jù)兩大類。政府?dāng)?shù)據(jù)一是政府?dāng)?shù)據(jù)平臺,指政府部門建立的包括所有工作對象相關(guān)數(shù)據(jù)的大型數(shù)據(jù)庫;二是部門統(tǒng)計數(shù)據(jù),指政府部門經(jīng)過一定統(tǒng)計方式處理、篩選、匯總的經(jīng)濟(jì)社會發(fā)展重要指標(biāo)的數(shù)據(jù)。社會數(shù)據(jù)則主要是各類互聯(lián)網(wǎng)站所記錄的與浦東就業(yè)相關(guān)的數(shù)據(jù)。
應(yīng)用大數(shù)據(jù)的處理方法從浦東新區(qū)就業(yè)相關(guān)大數(shù)據(jù)的數(shù)據(jù)源中提取能夠反映就業(yè)形勢各方面的指標(biāo)數(shù)據(jù),從而形成監(jiān)測就業(yè)形勢的指標(biāo)體系。
根據(jù)就業(yè)統(tǒng)計理論和實踐,就業(yè)形勢主要包括勞動力資源狀況、就業(yè)人口狀況、失業(yè)人口狀況和就業(yè)市場供需狀況四個方面。本文根據(jù)這四個方面建立指標(biāo)體系的基本框架,從相關(guān)大數(shù)據(jù)的數(shù)據(jù)源中提取相應(yīng)主要指標(biāo)(圖1)。
1.勞動力資源狀況:勞動力資源狀況指的是勞動年齡段人口情況。勞動年齡段人口是就業(yè)、失業(yè)人口的基本來源,是影響就業(yè)市場供需狀況的基礎(chǔ)因素。
通過浦東新區(qū)公安分局的實有人口信息平臺,可以提取勞動年齡段人口總數(shù)、勞動年齡段人口結(jié)構(gòu)(包括性別、年齡、戶籍、外來勞動力的來滬時間等)指標(biāo),從而監(jiān)測實際居住在浦東新區(qū)的勞動力資源狀況。
2.就業(yè)人口狀況:就業(yè)人口狀況指的是當(dāng)前處于就業(yè)狀態(tài)的人口狀況,它直接反映著就業(yè)形勢。
通過浦東新區(qū)統(tǒng)計局和浦東新區(qū)人力資源和社會保障局?jǐn)?shù)據(jù)平臺及統(tǒng)計調(diào)查可提取全面監(jiān)測就業(yè)人口狀況的指標(biāo)。
通過統(tǒng)計局的勞動工資統(tǒng)計直報平臺,可以提取規(guī)模以上企業(yè)就業(yè)崗位總量、就業(yè)崗位分行業(yè)結(jié)構(gòu)、就業(yè)崗位收入結(jié)構(gòu)等指標(biāo),從而能監(jiān)測在浦東大中企業(yè)就業(yè)人口狀況。
通過統(tǒng)計局的勞動力調(diào)查,可以推算常住人口中就業(yè)人口總數(shù)、比例、結(jié)構(gòu)(性別、年齡、學(xué)歷、戶籍、行職業(yè)分布、收入)等指標(biāo),從而能監(jiān)測浦東常住人口就業(yè)狀況。
通過人保局的社會保險金繳納信息系統(tǒng)和企業(yè)招退工及勞動合同備案登記系統(tǒng),可以提取繳納社會保險金或簽訂勞動合同的就業(yè)人口總量、就業(yè)人口基本結(jié)構(gòu)(性別、年齡、戶籍)、企業(yè)新增招工人數(shù)等指標(biāo)。通過以上指標(biāo)能監(jiān)測大部分浦東新區(qū)就業(yè)人口總量情況。
通過人保局的勞動保障信息系統(tǒng),可以提取浦東戶籍就業(yè)人口總量、就業(yè)人口結(jié)構(gòu)(性別、年齡、學(xué)歷等)指標(biāo),從而能監(jiān)測浦東戶籍就業(yè)人口狀況。
通過人保局的應(yīng)屆畢業(yè)生就業(yè)信息系統(tǒng)可以提取浦東戶籍應(yīng)屆畢業(yè)生就業(yè)人數(shù)、結(jié)構(gòu)(性別、學(xué)歷、就業(yè)去向等)指標(biāo),從而能監(jiān)測應(yīng)屆畢業(yè)生就業(yè)情況。
3.失業(yè)人口狀況:失業(yè)人口狀況是指當(dāng)前處于失業(yè)狀態(tài)的人口狀況,它直接反映著失業(yè)情況。
通過浦東新區(qū)統(tǒng)計局和浦東新區(qū)人力資源和社會保障局?jǐn)?shù)據(jù)平臺及統(tǒng)計調(diào)查,再加上互聯(lián)網(wǎng)數(shù)據(jù),可提取全面監(jiān)測失業(yè)人口狀況的指標(biāo)。
通過人保局勞動保障信息系統(tǒng),可以提取浦東戶籍登記失業(yè)人數(shù)、領(lǐng)取失業(yè)保險金人數(shù)以及浦東戶籍失業(yè)人口總量、結(jié)構(gòu)(性別、年齡、學(xué)歷、失業(yè)時間等)指標(biāo),從而監(jiān)測浦東戶籍失業(yè)人口狀況。
通過人保局企業(yè)招退工與勞動合同備案登記系統(tǒng),可以提取企業(yè)裁員總數(shù)、裁員行業(yè)結(jié)構(gòu)指標(biāo),從而監(jiān)測企業(yè)裁員狀況。
通過人保局應(yīng)屆畢業(yè)生就業(yè)信息系統(tǒng),可以提取畢業(yè)后未找到工作的浦東戶籍失業(yè)應(yīng)屆畢業(yè)生人數(shù)、結(jié)構(gòu)(性別、學(xué)歷等)指標(biāo)。
通過統(tǒng)計局勞動力調(diào)查,可以推算常住人口失業(yè)率、常住人口中失業(yè)人口總量、結(jié)構(gòu)(性別、年齡、戶籍、學(xué)歷、失業(yè)前行職業(yè)等、失業(yè)時間等)指標(biāo),從而監(jiān)測浦東常住人口失業(yè)狀況。
通過互聯(lián)網(wǎng)數(shù)據(jù),主要是通過對各類社交網(wǎng)站上反映個人就業(yè)的信息進(jìn)行語義分析,從中提取能判定處于失業(yè)狀態(tài)且居住在浦東的人數(shù)及其基本結(jié)構(gòu)(年齡、性別、學(xué)歷以及原工作行職業(yè))。這也是監(jiān)測浦東新區(qū)失業(yè)人口狀況的重要參考數(shù)據(jù)。
4.就業(yè)市場供需狀況:就業(yè)市場供需狀況指的是就業(yè)市場上企業(yè)招聘需求和求職者求職需求狀況。該狀況反映了影響就業(yè)形勢的勞動力供求因素。
通過浦東新區(qū)人力資源和社會保障局的數(shù)據(jù)平臺以及互聯(lián)網(wǎng)數(shù)據(jù)可提取全面監(jiān)測就業(yè)市場供需狀況的指標(biāo)。
通過人保局12303招聘網(wǎng)站和公益性職業(yè)介紹所信息系統(tǒng),可以提取其中發(fā)布和登記的企業(yè)招聘崗位總數(shù)、結(jié)構(gòu)(行職業(yè)、薪酬、年齡要求、學(xué)歷及專業(yè)技能要求等)指標(biāo)、求職者總數(shù)、結(jié)構(gòu)(性別、年齡、薪酬意向、崗位意向等)以及求職者投遞簡歷總數(shù)、結(jié)構(gòu)(簡歷投向的企業(yè)行業(yè)及崗位分布)指標(biāo)。
通過互聯(lián)網(wǎng)數(shù)據(jù),可以提取在各大求職網(wǎng)站上發(fā)布和登記的浦東企業(yè)招聘崗位總數(shù)和結(jié)構(gòu)、求職者總數(shù)和結(jié)構(gòu),求職者投遞簡歷總數(shù)和結(jié)構(gòu)指標(biāo);從各類社交網(wǎng)站的信息中還可以提取浦東企業(yè)招聘崗位數(shù)和結(jié)構(gòu)、求職者數(shù)量和結(jié)構(gòu)指標(biāo);從各大搜索引擎中還可以提取浦東新區(qū)就業(yè)崗位、招聘信息的搜索量指標(biāo)。
圖1 應(yīng)用大數(shù)據(jù)建立就業(yè)形勢監(jiān)測指標(biāo)體系示意圖
通過挖掘就業(yè)相關(guān)大數(shù)據(jù),可以提取出指標(biāo)體系中各指標(biāo)的不同時間維度的數(shù)據(jù),從而能實現(xiàn)對浦東就業(yè)形勢的動態(tài)監(jiān)測。在實際應(yīng)用中,將以月度、季度和年度為主要的時間維度。
通過對上述指標(biāo)數(shù)據(jù)的觀測,還可以進(jìn)一步探索這些指標(biāo)之間的相互關(guān)系,并相互校正,從而進(jìn)一步提高指標(biāo)數(shù)據(jù)的精度,使指標(biāo)體系能更準(zhǔn)確地監(jiān)測浦東新區(qū)就業(yè)形勢。
而隨著浦東就業(yè)相關(guān)大數(shù)據(jù)的進(jìn)一步擴(kuò)展,可以根據(jù)大數(shù)據(jù)的發(fā)展情況,同時也根據(jù)政府關(guān)注的重點問題,不斷擴(kuò)充、完善監(jiān)測浦東就業(yè)形勢的指標(biāo)體系。
應(yīng)用大數(shù)據(jù)分析處理方法,在就業(yè)相關(guān)大數(shù)據(jù)中篩選出一組與反映就業(yè)形勢關(guān)鍵指標(biāo)最密切相關(guān)的影響指標(biāo),用這組指標(biāo)構(gòu)建擬合和預(yù)測關(guān)鍵指標(biāo)的模型,使這組指標(biāo)成為 “風(fēng)向標(biāo)”。通過觀測“風(fēng)向標(biāo)”來預(yù)測關(guān)鍵指標(biāo)的未來走勢,從而建立起就業(yè)形勢預(yù)警體系。
用于建立預(yù)警體系的大數(shù)據(jù)一是直接反映就業(yè)形勢的大數(shù)據(jù),這些數(shù)據(jù)與關(guān)鍵指標(biāo)之間存在互相影響,因此應(yīng)作為篩選的對象;二是反映影響就業(yè)因素的大數(shù)據(jù)。主要包括:反映浦東經(jīng)濟(jì)社會發(fā)展各方面情況的各類政府?dāng)?shù)據(jù)平臺數(shù)據(jù)和部門統(tǒng)計數(shù)據(jù)(反映經(jīng)濟(jì)形勢、社會形勢、人民生活、政府政策、信心因素等的各類數(shù)據(jù)和統(tǒng)計指標(biāo))以及互聯(lián)網(wǎng)數(shù)據(jù)(主要指各類社交網(wǎng)站的信息關(guān)鍵詞和各類搜索引擎的搜索關(guān)鍵詞)等。
1.選取關(guān)鍵指標(biāo)。首先選取反映就業(yè)形勢的關(guān)鍵指標(biāo)。關(guān)鍵指標(biāo)可選取最能反映浦東新區(qū)就業(yè)、失業(yè)以及就業(yè)市場供需總體情況的指標(biāo),也可選取與當(dāng)前社會熱點或政府工作重點相關(guān)的指標(biāo)。
2.數(shù)據(jù)整理和處理。其次要對關(guān)鍵指標(biāo)數(shù)據(jù)和相關(guān)大數(shù)據(jù)進(jìn)行整理和處理。根據(jù)時間維度將關(guān)鍵指標(biāo)數(shù)據(jù)和相關(guān)大數(shù)據(jù)整理成月度、季度和年度數(shù)據(jù),從而便于探索對應(yīng)的相關(guān)關(guān)系。隨后應(yīng)用大數(shù)據(jù)的分析處理方法對數(shù)據(jù)進(jìn)行處理,分別篩選出與關(guān)鍵指標(biāo)月度、季度和年度數(shù)據(jù)密切相關(guān)的指標(biāo)。
3.模型構(gòu)建和驗證。運(yùn)用篩選出的指標(biāo),構(gòu)建擬合關(guān)鍵指標(biāo)的模型,并用歷史數(shù)據(jù)進(jìn)行驗證。通過模型來探索篩選出指標(biāo)對關(guān)鍵指標(biāo)的具體影響。然后再建立篩選出指標(biāo)的時間序列模型,用時間序列模型來預(yù)測篩選出指標(biāo)的未來走勢,根據(jù)其未來走勢運(yùn)用擬合模型擬合關(guān)鍵指標(biāo)走勢,從而實現(xiàn)對關(guān)鍵指標(biāo)的預(yù)測,并也用歷史數(shù)據(jù)進(jìn)行驗證。
4.應(yīng)用與改進(jìn)。對驗證證明效果良好的模型,即可用來建立關(guān)鍵指標(biāo)的短期(月度)、中期(季度)和長期(年度)預(yù)警體系。通過對預(yù)警體系中各指標(biāo)的觀測,來預(yù)測關(guān)鍵指標(biāo)的短期、中期和長期走勢。在實際應(yīng)用中,不斷檢驗預(yù)警體系的效果,并經(jīng)常應(yīng)用最新的大數(shù)據(jù)對指標(biāo)和模型進(jìn)行改進(jìn),從而不斷改進(jìn)預(yù)測的效果。
圖2 應(yīng)用大數(shù)據(jù)建立就業(yè)形勢預(yù)警體系示意圖
通過對就業(yè)形勢監(jiān)測指標(biāo)體系中的相關(guān)指標(biāo)數(shù)據(jù)的觀測,可以對就業(yè)形勢的重大變動以及社會經(jīng)濟(jì)熱點問題對就業(yè)形勢的影響進(jìn)行監(jiān)測,從而為政府更有針對性的決策提供數(shù)據(jù)支持。
1.監(jiān)測年末年初就業(yè)形勢變化。每年年末年初都是企業(yè)集中招退工的時期,就業(yè)形勢會發(fā)生較大波動??梢酝ㄟ^觀測年末年初數(shù)月的企業(yè)就業(yè)崗位,常住人口和戶籍人口中的就業(yè)、失業(yè)人口,互聯(lián)網(wǎng)信息反映的失業(yè)人口,企業(yè)裁員和新增員工,企業(yè)招聘和求職者需求等指標(biāo)數(shù)據(jù)的變動情況,來監(jiān)測年末年初就業(yè)形勢變化的具體情況。
2.監(jiān)測應(yīng)屆畢業(yè)生就業(yè)形勢。每年應(yīng)屆畢業(yè)生就業(yè)都是社會廣泛關(guān)注的問題。可以通過觀測浦東戶籍應(yīng)屆畢業(yè)生就業(yè)狀況,企業(yè)招聘應(yīng)屆畢業(yè)生狀況、應(yīng)屆畢業(yè)生求職需求等指標(biāo)數(shù)據(jù)來監(jiān)測當(dāng)年應(yīng)屆畢業(yè)生就業(yè)形勢,并通過分析這些數(shù)據(jù)來準(zhǔn)確判斷形勢,為新區(qū)政府采取相應(yīng)對策提供數(shù)據(jù)支持。
3.監(jiān)測重大項目和重要決策對就業(yè)形勢的影響。經(jīng)濟(jì)建設(shè)和社會發(fā)展的重大項目、黨和政府做出的重要決策(重要的改革措施、政策及法規(guī)等)都對就業(yè)形勢有著重要影響??梢酝ㄟ^觀測相關(guān)行業(yè)、相關(guān)地區(qū)企業(yè)就業(yè)崗位狀況、企業(yè)新增員工和裁員狀況、企業(yè)招聘狀況以及相關(guān)類別、相關(guān)地區(qū)常住人口和戶籍人口就業(yè)和失業(yè)狀況、求職者求職狀況等指標(biāo)數(shù)據(jù)的變動情況,來監(jiān)測重大項目和重要決策對就業(yè)形勢的具體影響。
4.監(jiān)測全國和世界經(jīng)濟(jì)波動對就業(yè)形勢的影響。浦東新區(qū)與國內(nèi)外經(jīng)濟(jì)聯(lián)系緊密,因此全國和世界經(jīng)濟(jì)形勢的波動也必將對浦東的就業(yè)形勢產(chǎn)生影響??梢酝ㄟ^觀測和分析經(jīng)濟(jì)波動前后就業(yè)狀況、失業(yè)狀況及就業(yè)市場供需狀況各項指標(biāo)數(shù)據(jù)的變動情況,來全面評估經(jīng)濟(jì)波動對浦東就業(yè)形勢的影響。
通過觀測就業(yè)預(yù)警體系中的“風(fēng)向標(biāo)”指標(biāo),能夠?qū)Ψ从呈I(yè)狀況、就業(yè)狀況和就業(yè)市場供需狀況的關(guān)鍵指標(biāo)進(jìn)行預(yù)測,從而對就業(yè)形勢的變動及時發(fā)布預(yù)警,為政府及時采取相應(yīng)對策提供數(shù)據(jù)支持。
1.對失業(yè)狀況實現(xiàn)預(yù)警。將常住人口失業(yè)率和浦東戶籍人口失業(yè)率作為關(guān)鍵指標(biāo),從就業(yè)相關(guān)大數(shù)據(jù)中篩選出與這兩個指標(biāo)密切相關(guān)的若干指標(biāo)來建立模型,作為“風(fēng)向標(biāo)”對失業(yè)率進(jìn)行擬合和預(yù)測。
2.對就業(yè)狀況實現(xiàn)預(yù)警。將各類企業(yè)就業(yè)崗位數(shù)量作為關(guān)鍵指標(biāo),從就業(yè)相關(guān)大數(shù)據(jù)中篩選出密切相關(guān)的若干指標(biāo)來建立模型,作為“風(fēng)向標(biāo)”對就業(yè)崗位數(shù)量進(jìn)行擬合和預(yù)測。
3.對就業(yè)市場供需狀況實現(xiàn)預(yù)警。將各類別招聘崗位數(shù)與各類別求職者數(shù)量、求職者各類求職意向數(shù)量等作為關(guān)鍵指標(biāo),從就業(yè)相關(guān)大數(shù)據(jù)中篩選出密切相關(guān)的若干指標(biāo)來建立模型,作為“風(fēng)向標(biāo)”對就業(yè)市場供需數(shù)量進(jìn)行擬合和預(yù)測。
通過對就業(yè)形勢監(jiān)測預(yù)警體系中大數(shù)據(jù)的深入挖掘,可以找出各種數(shù)據(jù)分布規(guī)律和數(shù)據(jù)之間的聯(lián)系,從而能為政府提高管理水平提供數(shù)據(jù)支持。
1.對失業(yè)人群進(jìn)行細(xì)分,幫助提高幫扶工作效率。對掌握的失業(yè)人員數(shù)據(jù)進(jìn)行聚類分析,并結(jié)合就業(yè)市場供需數(shù)據(jù)、政府幫扶記錄等,對失業(yè)人員進(jìn)行細(xì)分,總結(jié)出各類失業(yè)人員特點,從而可以為政府促進(jìn)就業(yè)部門對失業(yè)人員采取針對性幫扶措施提供數(shù)據(jù)支持。
2.找出隱性就業(yè)者,避免社會保障資源被濫用。將登記失業(yè)數(shù)據(jù)、領(lǐng)取失業(yè)保險金數(shù)據(jù)、領(lǐng)取低保金數(shù)據(jù)與勞動合同備案數(shù)據(jù)、社會保障金繳納數(shù)據(jù)、勞動者求職信息、社交網(wǎng)站信息等進(jìn)行比對,分析其中互相矛盾的記錄,可以找出隱性就業(yè)的勞動者,從而能為有關(guān)部門鑒別冒領(lǐng)失業(yè)金或低保金人員,避免社會保障資源被濫用提供數(shù)據(jù)支持。
3.根據(jù)政府部門的需要,還可開發(fā)出更多數(shù)據(jù)應(yīng)用來為提高管理水平服務(wù)。
[1] [英] 維克托·邁爾-舍恩伯格,[英] 肯尼思·庫克耶 .《大數(shù)據(jù)時代》,浙江人民出版社, 2013年
[2] 郭曉科主編《大數(shù)據(jù)》,清華大學(xué)出版社, 2013年
[3] 程開明,陳龍.大數(shù)據(jù)時代的統(tǒng)計挑戰(zhàn)與應(yīng)對,中國統(tǒng)計,2013(8)
[4] 楊皓,肖云,陳朗,黃婧.我國就業(yè)的影響因素分析,數(shù)學(xué)的實踐與認(rèn)識,第40卷第15期