楊夏薇
摘? 要: 針對(duì)傳統(tǒng)人力資源決策技術(shù)對(duì)海量人力資源數(shù)據(jù)辨別能力不高,導(dǎo)致決策效果不佳,研究基于Hadoop大數(shù)據(jù)平臺(tái)的人力資源決策技術(shù)。該技術(shù)對(duì)海量的企業(yè)人力資源數(shù)據(jù)進(jìn)行分布式處理,將神經(jīng)網(wǎng)絡(luò)下的員工信息按照輸入層、隱含層、輸出層進(jìn)行組別劃分;根據(jù)影響每一數(shù)據(jù)組數(shù)據(jù)變化的影響因素建立初選數(shù)據(jù)集合;通過計(jì)算人力資源的熵值離散度設(shè)立決策指標(biāo),以員工的姓名、部門、歷史業(yè)績(jī)、往期工作效率等要素作為選擇條件;采用決策樹分類算法構(gòu)建決策樹,生成人力資源決策分析報(bào)表,以此實(shí)現(xiàn)人力資源決策技術(shù)。實(shí)驗(yàn)結(jié)果表明:所研究的人力資源決策技術(shù)面對(duì)海量的人力資源數(shù)據(jù),其辨識(shí)能力更強(qiáng),決策結(jié)果的完整度達(dá)到了98.35%,比傳統(tǒng)決策技術(shù)高出了21.55%。由此可見,所研究的決策技術(shù)性能更優(yōu)越、更能滿足企業(yè)當(dāng)前的發(fā)展需求。
關(guān)鍵詞: 人力資源決策技術(shù); Hadoop平臺(tái); 數(shù)據(jù)挖掘; 分布式處理; 決策指標(biāo)設(shè)立; 決策樹構(gòu)建
中圖分類號(hào): TN911?34; TP311? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)03?0183?04
Research on human resource decision?making technology based on Hadoop platform
YANG Xiawei
(Zhixing College of Hubei University, Wuhan 430011, China)
Abstract: The traditional human resource decision?making technology has poor resolving ability on massive human resource data, resulting in unsatisfactory decision?making effect. Therefore, the human resource decision?making technology based on Hadoop platform is studied. As far as the technology is concerned, the massive enterprise human resource data is subject to distributed processing, and the employee information in the neural network is divided into groups according to the input layer, the hidden layer and the output layer. A primary data set is created according to the factors affecting the data change of each data group. The decision?making indicators are set up based on the calculation of entropy dispersion of human resources. The employees′ names, departments, historical performances and previous work efficiencies are taken as the selection conditions, and the decision tree classification algorithm is adopted to build the decision tree and generate the human resource decision analysis report, thus realizing the human resource decision?making technology. The experimental results show that the resolving ability of the studied human resource decision?making technology is more powerful in the processing of massive human resource data, and the integrity of decision?making results reaches 98.35%, which is 21.55% higher than the traditional decision?making technology. It can be seen that the decision?making performance of the technology is better and can further meet the current development needs of enterprises.
Keywords: human resource decision?making technology; Hadoop platform; data mining; distributed processing; decision?making index creation; decision tree establishment
0? 引? 言
人力資源管理是企事業(yè)單位中的主要組成部分,對(duì)企業(yè)的業(yè)務(wù)往來、前景發(fā)展起到重要的影響。為了順應(yīng)當(dāng)前的企業(yè)經(jīng)濟(jì)結(jié)構(gòu)的變化和發(fā)展趨勢(shì),提高企業(yè)的工作效率和經(jīng)濟(jì)效益,國(guó)家各行各業(yè)都將大數(shù)據(jù)技術(shù)應(yīng)用到人力資源管理決策中,通過運(yùn)用大數(shù)據(jù)平臺(tái)中的軟件系統(tǒng)、框架,實(shí)現(xiàn)更加全面化、系統(tǒng)化、效率化和現(xiàn)實(shí)化的決策技術(shù),以此提高企事業(yè)單位的核心競(jìng)爭(zhēng)力,滿足企業(yè)長(zhǎng)遠(yuǎn)發(fā)展的目標(biāo)[1]。
Hadoop是一個(gè)分布式系統(tǒng)基礎(chǔ)構(gòu)架,基于Hadoop大數(shù)據(jù)平臺(tái),找出Hadoop與人力資源決策管理之間的聯(lián)系,提高對(duì)人力資源數(shù)據(jù)吞吐量,以此來訪問決策模塊中的各類人員信息,實(shí)現(xiàn)更加符合員工自身?xiàng)l件的決策。將所研究的決策技術(shù)運(yùn)用到人員數(shù)量龐大、產(chǎn)業(yè)結(jié)構(gòu)復(fù)雜、企業(yè)部門多的企業(yè)人力資源實(shí)際工作之中,實(shí)現(xiàn)對(duì)企業(yè)中海量人員的人力資源決策,并為其他方面的決策技術(shù)研究提供理論依據(jù)和研究思路,為國(guó)家的社會(huì)主義經(jīng)濟(jì)建設(shè)提供技術(shù)支持[2]。
1? 基于Hadoop大數(shù)據(jù)平臺(tái)的人力資源決策技術(shù)
收集企業(yè)員工的基本信息,包括姓名、性別、年齡、居住地址、籍貫等,將這些信息設(shè)定表頭按部門進(jìn)行分組,并將劃分好的數(shù)據(jù)按照部門上傳到Hadoop大數(shù)據(jù)平臺(tái)上,利用人力資源信息管理決策系統(tǒng),基于員工的工作年限、受教育程度、專業(yè)技能水平等進(jìn)行決策,該平臺(tái)的操作頁面[3]如圖1所示。
根據(jù)圖1可知,人力資源部門的管理人員登錄到上述頁面后,將所有數(shù)據(jù)進(jìn)行整合,保證所有人員信息的完整性,然后將這些信息格式化統(tǒng)一,根據(jù)設(shè)置的決策指標(biāo)建立一個(gè)決策樹,比較企業(yè)員工之間的工作水平及業(yè)務(wù)能力。
1.1? 分布式分類基礎(chǔ)數(shù)據(jù)軟件算法設(shè)計(jì)
當(dāng)前大型企業(yè)中的員工數(shù)量較多,企業(yè)為增加經(jīng)濟(jì)效益和工作效率,對(duì)員工的業(yè)務(wù)能力和發(fā)展方向非常重視,因此在面對(duì)龐大的企業(yè)員工數(shù)據(jù)時(shí),為了保證決策的合理性和準(zhǔn)確性,利用Hadoop大數(shù)據(jù)平臺(tái)將這些員工數(shù)據(jù)信息進(jìn)行分布式處理。通過員工的受教育程度、實(shí)際工作經(jīng)驗(yàn)、以往工作效率和業(yè)績(jī)進(jìn)行未來發(fā)展預(yù)測(cè),從而有效地劃分出員工能力等級(jí),以此明確每個(gè)部門中的員工對(duì)企業(yè)未來發(fā)展的貢獻(xiàn)值[4]。
在效益較好、發(fā)展較快、產(chǎn)業(yè)結(jié)構(gòu)較為復(fù)雜的企事業(yè)單位中,每名員工都在不斷變化,可以說企業(yè)人力資源相關(guān)數(shù)據(jù)信息每日都在變更,這就令人力資源信息管理部門收集和分析數(shù)據(jù)的難度增加,傳統(tǒng)的數(shù)據(jù)平臺(tái)無法精準(zhǔn)地對(duì)這樣龐大的信息進(jìn)行準(zhǔn)確查找和判斷。而Hadoop為海量的人員數(shù)據(jù)存儲(chǔ)和分析處理提供了新的解決方案,Hadoop基于一個(gè)開源框架,采用分布式的方法存儲(chǔ)和處理大規(guī)模數(shù)據(jù)集,憑借其高容錯(cuò)性和可伸縮性的特點(diǎn),利用名稱節(jié)點(diǎn)維護(hù)命名空間層次結(jié)構(gòu)和文件系統(tǒng)元數(shù)據(jù),將命名空間和元數(shù)據(jù)存儲(chǔ)在RAM中并定期刷新磁盤;數(shù)據(jù)節(jié)點(diǎn)在本地文件系統(tǒng)中存儲(chǔ)人員信息文件數(shù)據(jù),并定期向名稱節(jié)點(diǎn)匯報(bào)數(shù)據(jù)存儲(chǔ)模塊的員工數(shù)據(jù)信息的變動(dòng)情況。而分布式的數(shù)據(jù)處理方式需要利用循環(huán)神經(jīng)網(wǎng)絡(luò),對(duì)員工信息進(jìn)行序列處理[5],該處理結(jié)構(gòu)如圖2所示。
通過圖2可知,隱含層是該分布結(jié)構(gòu)的核心,同時(shí)也是處理信息的地方。假設(shè)計(jì)入輸入層的數(shù)據(jù)為[n],隱含層的神經(jīng)元數(shù)量為[m],輸出層的數(shù)據(jù)量為[r]。圖2中利用[Q]表示輸入層到隱含層的矩陣;[P]表示該網(wǎng)絡(luò)中隱含層在[t-1]時(shí)刻下輸出值在[t]時(shí)刻的權(quán)重矩陣;[O]則是隱含層到輸出層的權(quán)重矩陣[6]。設(shè)在第[t]時(shí)刻輸入到序列中的員工信息為[at],輸出的信息為[bt],隱含層為[ct],其劃分公式為:
式中:[λ]表示激活函數(shù);[β]表示激活函數(shù)中所有相關(guān)參數(shù)的數(shù)據(jù)集。前[t-1]時(shí)間下積累的人員信息[ct]和當(dāng)前的員工信息[at]共同決定了在[t]時(shí)間的員工業(yè)績(jī)工作水平等信息。忽略基本人員信息,只考慮員工考核信息進(jìn)行傳遞,實(shí)現(xiàn)員工信息的分布式劃分[7]。
1.2? 設(shè)置決策指標(biāo)
根據(jù)劃分好的員工數(shù)據(jù)設(shè)立一個(gè)可供決策的指標(biāo),該指標(biāo)建立在企業(yè)人力資源戰(zhàn)略決策的目的和影響因素之上,對(duì)員工信息進(jìn)行分析與確認(rèn),形成一個(gè)能支持人力資源基本戰(zhàn)略決策,并能進(jìn)一步篩選指標(biāo)的集合,為實(shí)現(xiàn)人力資源決策做好鋪墊。當(dāng)前設(shè)立決策指標(biāo)的方法有很多,包括綜合分析法、屬性類別分析法等,綜合分析比較整理選用這些方法中優(yōu)秀的部分,結(jié)合具體實(shí)際,以曾經(jīng)使用過的對(duì)企業(yè)發(fā)展戰(zhàn)略有影響的指標(biāo)作為參考,重新設(shè)定新指標(biāo),此時(shí)的指標(biāo)受到表1中的因素影響[8]。
通過表1可知,影響決策指標(biāo)的因素包括內(nèi)部自身影響和外部環(huán)境影響,因此建立一個(gè)人力資源決策指標(biāo)初選集合[M=m1,m2,…,m20],并用熵值來表示指標(biāo)的離散度,建立原始數(shù)據(jù)矩陣為[A=kij×n],[kij]表示第[i]個(gè)備選指標(biāo)和第[j]個(gè)樣本數(shù)據(jù)(其中,[i]和[j]均為[m]個(gè)非零自然數(shù))。此時(shí)的熵值離散度為:
式中:[s=1ln n],表示人力資源決策參考數(shù)據(jù),[ei]表示第[i]個(gè)備選指標(biāo)下的熵值。當(dāng)[h]值越大時(shí),說明該指標(biāo)所能篩選的能力越大;當(dāng)[h]值過小時(shí)則說明該指標(biāo)設(shè)立不夠精準(zhǔn),此時(shí)的指標(biāo)對(duì)于人員信息的區(qū)分能力較小,要重新進(jìn)行設(shè)定[9]。
1.3? 構(gòu)建決策樹實(shí)現(xiàn)決策算法
人力資源管理決策模塊中主要包括企業(yè)組織架構(gòu)、員工信息以及人事事件管理三個(gè)子模塊,建立決策樹利用上述設(shè)置的決策指標(biāo)對(duì)這三個(gè)子模塊進(jìn)行數(shù)據(jù)提取,實(shí)現(xiàn)企業(yè)人力資源的決策。該決策技術(shù)[10]的操作過程如圖3所示。
企業(yè)組織架構(gòu)中主要包含員工職務(wù)、職位、級(jí)別、地址以及工資等數(shù)據(jù)。該技術(shù)在Hadoop大數(shù)據(jù)平臺(tái)中的系統(tǒng)界面選擇相應(yīng)的組織管理對(duì)象后,進(jìn)行管理對(duì)象的信息維護(hù),如員工姓名、開始日期、結(jié)束日期、備注、與其他部門的關(guān)系等,然后將這些資料保存,根據(jù)設(shè)定的決策指標(biāo)進(jìn)行自動(dòng)匹配,生成一個(gè)決策人員所需要的組織架構(gòu)樹形瀏覽表。根據(jù)需要決策的目標(biāo),選擇表頭的篩選按鈕,得到所需要決策的員工信息,同時(shí),每一姓名下的人員入職時(shí)間、工作年限等信息通過數(shù)據(jù)透視表透視到與該表相關(guān)聯(lián)的子表之中。同理,對(duì)企業(yè)的財(cái)務(wù)信息、生產(chǎn)和銷售數(shù)據(jù)進(jìn)行維護(hù),保證企業(yè)信息和員工信息的同步[11]。該決策樹采用決策樹分類算法計(jì)算生成: