国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

員工離職可視化分析及傾向預測研究*

2023-10-21 08:59:56劉敏佳
關(guān)鍵詞:在職員工工齡變量

劉敏佳

(豫章師范學院經(jīng)濟與管理學院,江西 南昌 330103)

經(jīng)濟新常態(tài)背景下,我國發(fā)展進入轉(zhuǎn)型升級階段,這對企業(yè)提出了更高的要求,變革和創(chuàng)新成為企業(yè)應對未來快速發(fā)展市場的重要手段,人作為企業(yè)最重要的資源,是推動和主導企業(yè)不斷發(fā)展升級的主導者。領(lǐng)英發(fā)布的《2021 人才趨勢報告》中提到,員工的流動較之以往更為頻繁,流動數(shù)據(jù)明顯上升,同時市場對人才的需求也不降反升。因此,企業(yè)采取靈活的人才戰(zhàn)略,對企業(yè)及時儲備人才具有重要意義。企業(yè)員工的流失具有不確定性,員工離職不僅增加了企業(yè)人力資源管理成本,而且給企業(yè)和員工的和諧文化環(huán)境帶來了負面影響。應用數(shù)據(jù)與科學的數(shù)據(jù)分析工具能夠?qū)崿F(xiàn)對員工的科學管理[1],不同于以往的傳統(tǒng)經(jīng)驗判斷,現(xiàn)階段大數(shù)據(jù)在各行各業(yè)、各個領(lǐng)域應用廣泛,在人力資源管理領(lǐng)域里也實現(xiàn)了其重要功能。調(diào)研數(shù)據(jù)顯示,89%的中國企業(yè)將大數(shù)據(jù)用于人力資源管理各職能模塊的工作中。應用大數(shù)據(jù)分析導致員工離職的主要因素,進而提出科學合理的員工管理對策建議,對于企業(yè)人才戰(zhàn)略具有重要意義。

1 員工離職的相關(guān)文獻研究

回顧關(guān)于員工離職的研究可知,員工離職是指從組織中獲取收益回報的員工與組織結(jié)束成員關(guān)系的一種行為,而主動離職員工的意愿與行為是研究的主要內(nèi)容,員工離職傾向發(fā)生在員工離職的前一個階段,員工還未采取行動但產(chǎn)生了相關(guān)離職傾向。在產(chǎn)生離職傾向到采取離職行動的這個過程中,員工是否采取實際行動受到內(nèi)部和外部各種因素的影響[2],如果能充分運用企業(yè)人力資源管理信息系統(tǒng)中的員工數(shù)據(jù),采用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)信息進行提煉,分析離職員工的共同特征,就能對其余員工的離職傾向進行預測,提前采取措施,這對降低員工流失具有重要意義。

隨著數(shù)據(jù)挖掘的發(fā)展與廣泛使用,專家學者們分析并處理員工離職行為模型的工具更加智能化,在運用大數(shù)據(jù)預測員工離職和流失方面取得了一定的成果[3]。國外eBay、VMware 等公司運用數(shù)據(jù)挖掘工具對公司的員工數(shù)據(jù)信息進行分析,發(fā)現(xiàn)工作壓力、家庭生活、年齡、業(yè)績表現(xiàn)情況等會導致員工離職,預測員工可能離職的傾向,并提前采取措施進行干涉,最終對企業(yè)留才起到了一定作用[4]。國內(nèi)學者在研究員工離職模型的基礎(chǔ)上,運用Stacking、Adaboost 等機器學習算法對企業(yè)員工離職傾向進行了預測,提高了企業(yè)對員工流動的洞察能力。

Muchinsky 等學者對影響員工離職的因素從3 個層面進行闡述,包括個人因素、經(jīng)濟機會和工作關(guān)系3 個方面[5]。國內(nèi)學者主要從外部環(huán)境、組織和個人3 個方面解釋員工離職的原因,企業(yè)儲備的大量員工個人信息數(shù)據(jù)對于從員工個人層面分析并預測離職傾向具有重要價值,幫助企業(yè)在員工甄選階段就提前辨別可能流失的員工[6]。因此,本文通過對互聯(lián)網(wǎng)行業(yè)員工個人信息數(shù)據(jù)進行可視化分析,獲取離職員工與在職員工的個體特征,并運用多種機器學習方法對員工離職進行預測結(jié)果對比,為企業(yè)提出預防措施。

2 研究設(shè)計

2.1 研究樣本與數(shù)據(jù)來源

GL 互聯(lián)網(wǎng)公司正處于快速發(fā)展階段。近幾年,公司對員工的需求量增加,內(nèi)部供給不足,通過對公司現(xiàn)階段員工供需平衡問題的分析發(fā)現(xiàn)導致近期外部招聘壓力增加的原因是員工離職率上升。文章選取GL 公司2018—2021 年員工數(shù)據(jù)作為進一步分析該公司員工離職原因的樣本來源,找出影響該公司員工離職的關(guān)鍵影響因素,挖掘離職員工的共同特質(zhì),進而提出具體和更有針對性的意見,運用數(shù)據(jù)挖掘的方法對員工數(shù)據(jù)進行分析并建立模型,幫助GL 公司確定可能離職的員工范圍,并且采取相應措施留住人才或者提前儲備人才,解決員工的流失問題。

2.2 數(shù)據(jù)整理與變量解釋

此次研究以人力資源部門數(shù)據(jù)系統(tǒng)中近3 年員工信息作為樣本,對所有收集到的數(shù)據(jù)進行局部清洗,對異常值和重復值進行處理,同時根據(jù)字段屬性對空白值進行填補。將本次數(shù)據(jù)中收集到的與員工離職關(guān)系不大的字段,如序號、員工工號等刪除,最后共計采集到在職員工與離職員工的數(shù)據(jù)5 396 條,變量9 個,其中包括員工崗位類別、崗位職務、員工年齡、員工職級、員工性別、員工婚姻狀況、員工學歷、員工工作地點8 個自變量,員工是否離職作為因變量。

3 員工數(shù)據(jù)可視化分析

通過對在職員工和離職員工數(shù)據(jù)進行可視化分析比較,可以發(fā)現(xiàn)在職員工與離職員工之間的特征差異,進而掌握影響員工離職的主要影響因素,并為后期進一步提取員工離職的變量特征和選擇離職模型提供選擇依據(jù),對變量與員工離職之間的關(guān)系進行描述性分析。

3.1 各崗位類別在職員工與離職員工可視化分析

從各部門在職與離職員工的分布情況可以發(fā)現(xiàn),不同崗位類別上的員工離職情況存在一些明顯差異,對采集到的員工信息按照工作性質(zhì)的相似性進行歸類,將員工的崗位類別歸為8 類。不同崗位類別離職人數(shù)和離職率差異較大,總體來看,離職人員較多集中在銷售部和技術(shù)部,但離職率最高的主要是產(chǎn)品和行政等職能部門(見圖1)?;ヂ?lián)網(wǎng)公司技術(shù)人員流失率較高,技術(shù)人員也是公司的核心競爭力所在,因此需要加強對關(guān)鍵部門的員工流失預防工作。

圖1 各崗位在職員工與離職員工人數(shù)柱形圖

3.2 各職位級別在職員工與離職員工可視化分析

圖2 為各職級在職員工與離職員工人數(shù)柱形圖。由圖2 可知,職位級別越高,離職的員工人數(shù)越少,當前該公司實習生和普通員工離職人數(shù)較多,而經(jīng)理及以上的職位離職人數(shù)較少。職位越高的員工在公司的收入和地位越高,其離職成本較大,且公司中高管理層以上人員數(shù)量占比較低。但從離職率來看,管理層與普通員工相對較高,對公司而言,管理層員工的流失帶來的損失更為嚴重,中高以上管理人員外部供給緊缺,招募成本較高,同時會給在職員工帶來跟隨效應。因此,公司在關(guān)注離職人數(shù)較多的普通員工群體的同時,也需要重視中高管理層員工的離職現(xiàn)象。

圖2 各職級在職員工與離職員工人數(shù)柱形圖

3.3 離職員工與在職員工工齡與年齡分布可視化分析

圖3 為離職員工與在職員工的年齡分布箱型圖。由圖3 可知,離職員工和在職員工的平均年齡都在30 歲左右,最高年齡在45 歲,與在職員工相比,離職員工年齡偏低,但差異不大;離職人員工齡主要集中在3 年到6 年之間(見圖4)。在職員工工齡中位數(shù)比離職員工工齡的中位數(shù)更高,在公司服務年限越短的員工離職的可能性越大,相對而言,工齡越長,員工越趨于穩(wěn)定,對公司的歸屬感和依賴感越強。

圖3 離職員工與在職員工年齡分布箱型圖

圖4 離職員工與在職員工工齡分布箱型圖

4 員工離職模型選擇與結(jié)果預測

為了對員工是否離職進行預測,本文使用3 種機器學習模型對員工離職情況進行預測,分別是支持向量機(Support Vector Machine,SVM)、XGBoost 和決策樹(Decision Tree)模型。為了更好地選擇與模型相關(guān)的特征變量,運用統(tǒng)計軟件對此次采集到的9 個變量信息進行皮爾遜相關(guān)性分析,對員工各變量信息之間是否存在統(tǒng)計上的顯著性相關(guān)關(guān)系進行檢驗,對具有顯著相關(guān)關(guān)系的變量進行一定程度的剔除,只選擇其中一個變量進行模型構(gòu)建與測試,避免選擇多個重復的特征變量。通過變量之間相關(guān)分析結(jié)果可知,員工是否離職與員工崗位類別、職務、婚否、是否全職、年齡、工齡之間存在一定的關(guān)系,員工婚否和是否全職及年齡的關(guān)聯(lián)度不大,因此刪除這兩個變量,考慮到特征變量不多,保留學歷這一變量,最后選擇剩下的幾個變量作為離職預測模型的特征變量。

4.1 特征處理

在進行模型預測前,首先對離職數(shù)據(jù)變量進行特征處理,主要是將字符型變量(職務、崗位類別、性別、學歷等)轉(zhuǎn)換成離散型的數(shù)值變量。本文使用one-hot 編碼處理字符型變量,使用pandas的get_dummies 方法。處理完字符型數(shù)據(jù)后,為防止梯度下降時算法收斂速度過慢,本文對連續(xù)性數(shù)值做歸一化處理。

4.2 使用支持向量機模型預測員工離職情況

本文選取支持向量機模型預測員工離職情況。采用8∶2 的比例劃分訓練集和測試集,最終獲得4 316 條訓練集和1 080 條測試集數(shù)據(jù)。本文使用10 折交叉驗證法選取最佳的超參數(shù)(懲罰系數(shù)C和核函數(shù)γ),最終選取的參數(shù)值C 為10,γ 為0.1。使用該參數(shù)進行預測,訓練集和測試集獲得的分類結(jié)果見表1。

表1 支持向量機模型預測離職訓練集和測試集分類結(jié)果

4.3 使用XGBoost 模型預測員工離職情況

同理,選取XGBoost 模型預測員工離職情況。訓練集和測試集同樣采用8∶2 的比例劃分。使用10折交叉驗證法選取參數(shù),最終選取控制數(shù)深度max_depth 為4,學習率為0.3,學習器個數(shù)n_estimators 為10。使用該參數(shù)進行預測,訓練集和測試集獲得的分類結(jié)果見表2。

表2 XGBoost 模型預測離職訓練集和測試集分類結(jié)果

4.4 使用決策樹模型預測員工離職情況

同理,使用決策樹模型預測員工離職情況。使用10 折交叉驗證法選取超參數(shù)決策樹深度maxdepth 為4。訓練集和測試集的分類結(jié)果見表3。

表3 決策樹模型預測離職訓練集和測試集分類結(jié)果

根據(jù)實驗結(jié)果,XGBoost 模型的預測結(jié)果相對其他模型要好,因此,本文最終選擇XGBoost 模型作為預測員工離職情況的模型。

5 結(jié)論與對策

員工是企業(yè)競爭核心力所在,員工流失會給企業(yè)帶來不可估量的損失,企業(yè)如果能夠在員工入職前或在員工入職初期就能提前預知某一員工未來離職的概率,發(fā)現(xiàn)影響員工離職的主要個人因素,不僅能夠在選用人才階段提高招聘率,還能夠在員工流失前及時采取有效措施,留住人才,將企業(yè)損失減至最低。文章基于大數(shù)據(jù)視角,結(jié)合收集整理到的北京GL 互聯(lián)網(wǎng)公司人力資源信息管理系統(tǒng)中近幾年在職員工與離職員工的信息數(shù)據(jù),運用統(tǒng)計工具對員工各特征變量與員工離職之間的關(guān)系進行相關(guān)分析,發(fā)現(xiàn)崗位類別、職務、婚否、是否全職、年齡、工齡與員工離職存在一定的相關(guān)性,并主要從崗位類別、職務級別、工齡和年齡方面對在職員工與離職員工數(shù)據(jù)進行可視化分析,為企業(yè)直觀了解員工個人數(shù)據(jù)特征提供參考,有利于企業(yè)制定人力資源相關(guān)決策。運用SVM、XGBoost 和決策樹3 種機器學習模型對員工離職情況進行預測,從預測結(jié)果來看,XGBoost 模型預測結(jié)果最佳,對企業(yè)有效預測員工在未來的離職情況有幫助。

企業(yè)結(jié)合影響員工離職的主要因素,有效采取預防措施,包括:一是加強人力資源信息系統(tǒng)的建設(shè),全面收集員工入職數(shù)據(jù)信息,為員工離職預測提供充足的數(shù)據(jù)資料,使企業(yè)在員工入職前就能運用模型提前預測離職率,提高招聘成功率。二是通過企業(yè)文化的建設(shè),加強企業(yè)與員工之間的情感承諾,為員工提供職業(yè)生涯規(guī)劃與指導,提升員工的歸屬感。三是制定科學合理的績效考核制度和薪酬體系,為員工提供公平的晉升環(huán)境,降低人才因職務晉升問題流失的風險。四是建立合理的企業(yè)內(nèi)部流動機制,打通部門之間人才流動的通道,為內(nèi)部員工提供適當?shù)霓D(zhuǎn)崗機會,降低企業(yè)整體招聘成本。

猜你喜歡
在職員工工齡變量
企業(yè)在職員工培訓存在的問題及應對之策
抓住不變量解題
也談分離變量
那些和工齡有關(guān)的事兒
新傳奇(2020年29期)2020-08-19 06:51:41
你的工齡和這些福利有關(guān)
樂活老年(2019年9期)2019-01-12 02:19:43
這七種情況,不在崗也能算工齡
新傳奇(2018年21期)2018-05-14 17:50:50
網(wǎng)絡(luò)遠程繼續(xù)教育培訓在職員工探析
SL(3,3n)和SU(3,3n)的第一Cartan不變量
員工在職期間的企業(yè)勞動關(guān)系風險防范方式研究
分離變量法:常見的通性通法
东乡县| 会泽县| 肃北| 延安市| 犍为县| 修文县| 东乌珠穆沁旗| 江津市| 措勤县| 突泉县| 稻城县| 玛沁县| 宁晋县| 临猗县| 阳原县| 宁武县| 临沂市| 正阳县| 张家界市| 美姑县| 隆安县| 垦利县| 阳朔县| 常山县| 花莲市| 灵武市| 金乡县| 广德县| 邯郸市| 东莞市| 澎湖县| 北宁市| 商水县| 格尔木市| 金坛市| 余干县| 鄂托克前旗| 开鲁县| 衡水市| 台北县| 安岳县|