楊柳 史彩計 周璇 張國安 陳正銘
關鍵詞:崗位特征;隨機森林;績效;員工畫像
0 前言
在國家和行業(yè)大力推動數(shù)字化轉型的背景下,人力資源管理的數(shù)字化和智能化已成為該領域的重要探索和研究方向,呈現(xiàn)出大數(shù)據(jù)驅動的新興模態(tài)。人力資源管理工作十分復雜。當前,煙草企業(yè)普遍存在員工績效管理方面的問題,缺乏對員工績效考核結果的系統(tǒng)和深入分析,未能充分挖掘員工績效考核結果在人力資源管理活動中的潛在價值。S煙草公司運用數(shù)字化管理思維,利用員工標簽化特征信息和績效考核數(shù)據(jù),嘗試采用隨機森林算法計算多個崗位模型并對員工進行畫像,搭建了智能化員工績效管理信息平臺,實現(xiàn)了數(shù)字化績效管理,充分挖掘了績效考核結果在人力資源管理活動中的應用價值,提升了人力資源管理水平,促進企業(yè)控員增效。
1 基于標簽化管理的員工畫像與績效統(tǒng)計
1.1 員工特征畫像
公司人事科收集員工信息,并通過提煉高精度的員工特征標識及數(shù)據(jù)分析處理后的多維標簽,實現(xiàn)員工特征畫像[1]。流程如下:首先,在不侵犯員工合法權益并充分做好信息保密工作的前提下,收集員工各類信息,包括員工資質信息、業(yè)績信息、需求信息和生活習慣等。其次,進行員工信息標簽化管理,為提高后期數(shù)據(jù)分析效率,對原始員工信息進行提煉和數(shù)據(jù)處理,實現(xiàn)員工信息的多維標簽化。目前已收集整理了131位員工的信息,共提取了63個特征標簽,具體如表1所示。
1.2 員工月度與年度績效統(tǒng)計
根據(jù)公司的績效考核制度,月度績效考核采用評分方式進行。考核項目包括工作態(tài)度指標(30分)、崗位職責指標和其他任務指標(60分)、其他任務指標(10 分)。工作態(tài)度指標是全員一致的,考核內容分為勞動紀律(15分)、思想作風(10分)、儀表衛(wèi)生(5分)。崗位職責指標根據(jù)不同的崗位而異,以客戶專員崗位為例,包括基礎管理、經(jīng)營指導、誠信互助小組建設、信息采集與市場調研、品牌培育與宣傳促銷、線上服務。其他任務指標滿分10分,考評以扣分進行,扣分最高不超過10分。主要扣分項目包括因個人原因被投訴或造成不良社會影響,每次扣1分;因個人原因被通報、約談、問責等情況,每次扣1分……
通過考核評分,統(tǒng)計出上述131名員工的近一年的月度與年度績效數(shù)據(jù),如表2。
2 基于隨機森林的崗位特征模型求解
2.1 求解算法選擇
如何有效地從高維數(shù)據(jù)中提取或選擇出有用的特征信息或規(guī)律,并將其分類、識別、存儲和使用已成為當今信息技術所面臨的基本問題[2]。特征選擇是指從原始特征集中選擇部分特征,使某種評估標準最優(yōu)(或次優(yōu))的特征子集,以使在該最優(yōu)(或次優(yōu))特征子集上所構建的分類或回歸模型達到與特征選擇前近似甚至更好的預測精度[3]。
隨機森林[4]是一個由一組決策樹分類器{h(X,θk),k=1,2,...,K}組成的集成分類器,其中{θk}是服從獨立同分布的隨機向量,K表示隨機森林中決策樹的個數(shù)。在給定自變量X下,每個決策樹分類器通過投票來決定最優(yōu)的分類結果[5]。
文獻2 中提出了一種名為RFFS 的特征選擇方法。該方法基于隨機森林算法,利用其提供的特征重要性度量對特征進行評估。通過序列后向搜索策略,每次從特征集中剔除一個最重要的特征(即重要性分數(shù)最低),并在每次迭代中計算分類的準確率。最終,獲得一個變量數(shù)量最少且分類準確率最高的特征集合,這就是特征選擇結果。該算法的時間復雜度近似為:O(km2n(logn)2),與特征維數(shù)m成平方關系,與數(shù)據(jù)集樣本個數(shù)n成n(logn)2關系。對于高維小樣本數(shù)據(jù),運算時間非常不錯。
根據(jù)當前數(shù)據(jù)集特征,特征維度為63,樣本數(shù)為131,嘗試用該算法思路求解崗位特征模型。
2.2 算法求解過程
2.2.1 數(shù)據(jù)預處理
數(shù)據(jù)類型變換主要針對分類數(shù)據(jù),原始數(shù)據(jù)中一共有63個分類變量指標。首先,將字符型映射為數(shù)值型,變換原則為所有指標映射為狀態(tài)數(shù)據(jù)值。例如,性別為男則映射到1,否則為0;性別為女同樣映射到1,否則為0。對于連續(xù)型特征值,例如年齡,采用分箱操作[6]變換為離散型特征值。例如,采用等寬分箱將年齡特征的取值范圍等距離劃分為多個分箱,21~30 歲映射為1,31~40歲映射為2……。
2.2.2 計算過程
依據(jù)績效考核分越高的員工越匹配當前崗位原則,對各崗位數(shù)據(jù)建立隨機森林分類模型。將數(shù)據(jù)通過隨機抽樣分別按照3∶1的比例隨機劃分,其中75%作為訓練數(shù)據(jù),25%作為測試數(shù)據(jù)。用訓練數(shù)據(jù)進行模型訓練,測試數(shù)據(jù)對模型進行評估。將特征隨機分為四份,CART決策樹從1到4 000變化時,通過網(wǎng)格搜索來自動化搜索n_estimators最佳值,觀察模型的誤差變化情況,調整n_estimators參數(shù),獲取n_estimators 最佳值,使用best_score_方法獲取模型準確率,使用best_params_方法獲取最優(yōu)模型的參數(shù)。
2.2.3 計算結果與分析
通過隨機森林算法求解,得到本次數(shù)據(jù)集包含的5個崗位的十個特征標簽與權重值,如表3。
3 系統(tǒng)實現(xiàn)
3.1 基于員工畫像的績效評估系統(tǒng)簡述
搭建基于員工畫像管理的績效評估系統(tǒng),將研究結果標準化、信息化。將員工信息及標簽化管理納入信息平臺,實現(xiàn)智能數(shù)據(jù)分析和應用建議,提高員工績效考核管理工作效率,助力企業(yè)優(yōu)化人力資源管理。
通過使用Java、Nginx、MySQL、Redis、Node.js等網(wǎng)站技術設計實現(xiàn)系統(tǒng)。系統(tǒng)可錄入或導入員工特征信息與績效,對員工績效的全面、準確評估,以及展示員工畫像的詳細分析,提供有針對性的改進建議和培訓需求,幫助企業(yè)實現(xiàn)人力資源的優(yōu)化配置。
3.2 企業(yè)崗位匹配整體數(shù)據(jù)展示
輸入用戶名密碼,點擊登錄進入信息維護模塊下的數(shù)據(jù)展示頁面(如圖2) 。上面四個小盒子展示員工的整體信息,崗位維度用折柱圖展示人數(shù)和人崗匹配系數(shù)(員工和崗位的匹配程度,越高越匹配)。標簽維度展示的是影響比較大的前五個標簽的人數(shù)和人數(shù)比。
3.3 員工信息/績效管理/員工標簽
點擊左側的菜單,可分別進入員工信息管理、績效管理和員工畫像標簽管理(如圖3) 模塊。在這三個模塊,分別可以新增/刪除/修改/查詢相應的信息,也可批量導入更新相應數(shù)據(jù)。
3.4 員工/崗位畫像
員工畫像模塊(如圖4) 頁面左側系統(tǒng)根據(jù)已有數(shù)據(jù)自動生成了個人簡介,還有對其崗位的分析,以及對員工能力提升的建議。右側展示其當前崗位的情況,匹配程度,還有與其他崗位的比較和分析,該頁面數(shù)據(jù)通過后臺調用隨機森林算法求解的模型數(shù)據(jù)得到。
崗位畫像頁面(如圖5) 顯示的是對當前崗位來說,影響最大的前五個標簽的相關系數(shù)與關聯(lián)數(shù)據(jù)。下圖則是與當前崗位匹配度高的一些員工基本信息。
3.5 人崗匹配功能
在人崗匹配模塊(如圖6) ,可根據(jù)選項得出員工和崗位的匹配情況。在崗位按需匹配(如圖7) ,則可在此輸入一些崗位需求,快速匹配適合的員工。
4 結束語
基于員工畫像的績效結果評估系統(tǒng)適用于各類需要進行員工績效管理和人力資源優(yōu)化配置的機構,例如在煙草行業(yè)以及其他需要精細化管理員工績效的領域。該軟件能夠提供全面、深入的員工績效分析和評估,幫助企業(yè)更好地了解員工的工作能力和潛力,實現(xiàn)人力資源的優(yōu)化配置和企業(yè)的持續(xù)發(fā)展。