国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)的人才管理平臺構建研究

2024-03-17 11:47:49何澤君云雄鮑斌
科學與信息化 2024年2期
關鍵詞:結構化數(shù)據(jù)處理人才

何澤君 云雄 鮑斌

中國民航信息網(wǎng)絡股份有限公司重慶分公司 重慶 401122

引言

大數(shù)據(jù)時代,數(shù)據(jù)已成為企業(yè)發(fā)展和生存的重要資源。企業(yè)正面臨VUCA這一新常態(tài),為應對眾多的跨界挑戰(zhàn)者、不斷變化的市場和持續(xù)演進的技術,需快速適應和敏捷轉型,這給企業(yè)人才管理工作帶來了前所未有的挑戰(zhàn)[1]?;ヂ?lián)網(wǎng)時代以來,企業(yè)普遍實現(xiàn)了人才管理信息化,主要以人力資源部門為主體,采用互聯(lián)網(wǎng)技術建設獨立的人才信息系統(tǒng),實現(xiàn)人才信息的統(tǒng)計、分析。新形勢下,功能單一、相互獨立的人才信息系統(tǒng)已不能滿足企業(yè)人才管理需求。全面引入智能技術,構建大數(shù)據(jù)技術為基礎的人才管理平臺,成為破解人才管理難題的新思路[2]。

1 人才管理的現(xiàn)狀和問題

互聯(lián)網(wǎng)時代,我國企業(yè)人力資源信息化建設開始蓬勃發(fā)展,企業(yè)基于不同部門職責,建設了功能相對獨立的信息系統(tǒng),企業(yè)人才管理轉變?yōu)閷θ瞬艛?shù)據(jù)的管理利用。當前人才管理的現(xiàn)狀和問題主要有以下幾個方面。

1.1 數(shù)據(jù)認識不足,管理方式落后

大數(shù)據(jù)時代,人才管理者對基于數(shù)據(jù)的管理方式缺乏理論認識和應用經驗。傳統(tǒng)的管理主要以人事管理為主,注重流程管控,所能應用和參考的數(shù)據(jù)有限,導致管理模式和決策具有較強的片面性和主觀性。此外,獨立的人力資源部門難以與市場、研發(fā)等部門配合。當前,大部分企業(yè)管理者并未意識到大數(shù)據(jù)技術在人才管理中的價值,也沒有合適的方法和工具,無法利用大數(shù)據(jù)優(yōu)化管理。這些問題都成為提高企業(yè)管理能力的掣肘之處[3]。

1.2 數(shù)據(jù)融通不夠,管理效率低下

大數(shù)據(jù)時代,爆炸式增長的信息和互聯(lián)網(wǎng)下分布的海量數(shù)據(jù)未被充分利用。企業(yè)人力資源信息化建設盲目激進,系統(tǒng)功能單一、信息集成水平低、安全問題嚴峻[4];員工產生的大量高價值的非結構化數(shù)據(jù)無法被利用;企業(yè)內外部數(shù)據(jù)無法融通。這些問題造成了人才數(shù)據(jù)失真、數(shù)據(jù)獲取成本高昂、數(shù)據(jù)利用效率低下,降低了人才管理工作的效率。

1.3 數(shù)據(jù)分析不足,管理規(guī)程滯后

大數(shù)據(jù)時代,人才管理不僅要對員工基礎數(shù)據(jù)、績效、外部人才市場數(shù)據(jù)等進行分析,更重要的是對員工產生的非結構化數(shù)據(jù)進行挖掘。當前人才管理的方式通常是預先設計好,數(shù)據(jù)分析多是事后總結,難以挖掘企業(yè)與員工間潛在關聯(lián)信息,不能為企業(yè)提供有價值的戰(zhàn)略方針,更無法為管理者提供預測指導,是一種滯后的管理[5]。

2 關鍵技術

2.1 大數(shù)據(jù)技術

Hadoop是一種分布式系統(tǒng)基礎架構,它包括多個生態(tài)組件:HDFS、MapReduce、HBase、Hive等。HDFS為海量數(shù)據(jù)提供存儲,容錯性高,部署硬件要求低;MapReduce是一種用于處理大規(guī)模數(shù)據(jù)集的并行計算框架;HBase是一個高可靠、高性能、面向列、可伸縮、實時讀寫的分布式數(shù)據(jù)庫,主要用來存儲非結構化和半結構化的松散數(shù)據(jù);Hive是一個開源的SQL解析引擎,用于將SQL語句轉換成MapReduce任務以處理大規(guī)模的數(shù)據(jù)集。

Flink是一個用Java和Scala編寫的分布式流數(shù)據(jù)處理引擎,用于在無界和有界數(shù)據(jù)流上進行有狀態(tài)計算。其流水線運行時系統(tǒng)可以同時執(zhí)行批處理和流處理程序,并支持任意數(shù)量的流變換。Flink還提供了現(xiàn)成的源和接收連接器,例如Kafka、HDFS等。

2.2 人工智能技術

樸素貝葉斯算法適用于大多數(shù)情況,但精度不夠高,要求數(shù)據(jù)量大,計算效率低。樸素貝葉斯算法的核心思想是將每個特征看作是一個條件概率分布,然后將每個樣本看作是一個條件概率分布的投影,投影到每個類別上得到一個新的條件概率分布。最后,根據(jù)樣本的條件概率分布來計算其分類結果。

支持向量機對數(shù)據(jù)需求量小、計算精度高,但對缺失的數(shù)據(jù)處理效果差。支持向量機通過訓練一個分類器來尋找最佳的超平面,并將數(shù)據(jù)映射到高維空間中,同時將分類器的結果與真實標簽進行比較,再根據(jù)比較結果更新超平面的位置,以使得正例和負例之間的距離最小。

深度學習是一種基于神經網(wǎng)絡的一類人工智能技術,在自然語言處理中的文本分類、實體識別、關系識別、語義識別有廣泛的應用。它通過多層非線性變換來實現(xiàn)對數(shù)據(jù)的高效表示和分類,主要算法有人工神經網(wǎng)絡、卷積神經網(wǎng)絡、循環(huán)神經網(wǎng)絡、自編碼器等。

3 基于大數(shù)據(jù)的人才管理平臺建設

大數(shù)據(jù)人才管理平臺旨在促進人才管理智能化發(fā)展,應具有數(shù)據(jù)資源和服務集約化,數(shù)據(jù)分析智能化,運維管理成本低、高可用、易擴展、具備產業(yè)生態(tài)系統(tǒng)支持的特點[6]。通過問題現(xiàn)狀分析和技術調研,確定平臺建設采取以Hadoop為核心的融合化技術方案[7]。大數(shù)據(jù)人才管理平臺架構,采用層次結構,從底層向上層依次是數(shù)據(jù)接入層、數(shù)據(jù)存儲層、數(shù)據(jù)處理層、數(shù)據(jù)應用層,以及貫穿始終的數(shù)據(jù)安全規(guī)范和數(shù)據(jù)管理規(guī)范要求。

3.1 數(shù)據(jù)接入

平臺的數(shù)據(jù)來源于企業(yè)信息系統(tǒng)、物聯(lián)網(wǎng)智能終端感知數(shù)據(jù)、內外部網(wǎng)絡數(shù)據(jù)、人員行為數(shù)據(jù)等,按數(shù)據(jù)類型可分為結構化數(shù)據(jù)、非結構化數(shù)據(jù),數(shù)據(jù)源具有來源分散,類型多樣的特點。針對企業(yè)OA平臺上的各類系統(tǒng)采用Sqoop工具,對各種關系型數(shù)據(jù)庫通過任務管理實現(xiàn)批量采集。針對人員行為日志、外部系統(tǒng)消息、網(wǎng)絡爬蟲動態(tài)捕獲的互聯(lián)網(wǎng)數(shù)據(jù),采用flume+kafka完成多源異構數(shù)據(jù)的實時采集。

3.2 數(shù)據(jù)存儲

平臺采集的數(shù)據(jù)結構復雜、質量標準不統(tǒng)一,需按照數(shù)據(jù)治理管理要求進行數(shù)據(jù)預處理和存儲。數(shù)據(jù)應進行ETL預處理,可以結合統(tǒng)計學方法、SQL清洗、粒度聚合等方法處理。數(shù)據(jù)存儲應具有高效性、可擴展性和容錯能力,存儲采用基于Hadoop與MySQL整合的數(shù)據(jù)倉庫。其中,Hadoop用于存儲多源異構的原始數(shù)據(jù)進行分布式運算;MySQL用于存儲面向應用的結果數(shù)據(jù),實現(xiàn)大數(shù)據(jù)存儲、高效能運算、實時查詢的需求[8]。根據(jù)數(shù)據(jù)運算需求平臺采用Hive、Presto、Spark、Flink作為數(shù)據(jù)倉庫的引擎,實現(xiàn)大數(shù)據(jù)的批處理和流式處理。利用Hive完成長時間運行的離線批處理,實現(xiàn)數(shù)據(jù)倉庫統(tǒng)計分析工作。利用Presto的高并發(fā)性、高吞吐量和高可用性等特點,通過聯(lián)合hive使用、加速Hive的查詢,實現(xiàn)更高效、更準確的大數(shù)據(jù)處理。采用Spark聯(lián)合Flink的設計,Spark擅長處理結構化數(shù)據(jù),而Flink則適合處理非結構化數(shù)據(jù)。當需要處理機器學習任務時,可以將數(shù)據(jù)分為結構化和非結構化部分,分別交給Spark和Flink處理,最后將它們合并為一個數(shù)據(jù)集。對于流處理任務,可以將Spark作為主要的流處理器,將Flink作為從庫或工作隊列來處理數(shù)據(jù),實現(xiàn)數(shù)據(jù)處理的分布式實時性能。

3.3 數(shù)據(jù)處理

平臺數(shù)據(jù)處理應滿足人才管理領域的統(tǒng)計分析需求,更重要的是能實現(xiàn)人才管理智能化。人才數(shù)據(jù)具有特征稀疏、深度關聯(lián)性強的特點,分析需要依賴平臺的批處理、流處理實現(xiàn)運算能力。數(shù)據(jù)分析的方法主要采用統(tǒng)計學和人工智能技術。針對人才管理業(yè)務需求,數(shù)據(jù)處理需要完成人才盤點數(shù)據(jù)處理、人才特征數(shù)據(jù)挖掘和人才畫像智能分析。對于人才盤點的數(shù)據(jù)處理,主要采用人才管理領域的規(guī)則和統(tǒng)計學方法,實現(xiàn)人才年齡、學歷、崗級等各類維度的統(tǒng)計分析。對人才特征挖掘主要采用統(tǒng)計學方法和人工智能技術中的分類、聚類、關聯(lián)分析、深度學習等方法,實現(xiàn)人才能力、潛力、心理動向等特征挖掘,以及自然語言文本信息挖掘。對于人才畫像智能分析主要采用人工智能技術中的預測分析、回歸分析等方法,實現(xiàn)崗位匹配度、人才相似度、高風險人才等的分析工作。

3.4 數(shù)據(jù)應用

平臺需滿足多種應用需求,采用專業(yè)的數(shù)據(jù)可視化技術如ECharts、BI工具等,能提供豐富的圖表,例如:折線圖、餅圖、散點圖、氣泡圖、樹形圖或箱型圖等,以及具有交互功能的數(shù)據(jù)分析界面[9]。平臺面向企業(yè)管理層能提供的企業(yè)人才大屏,面向人力資源部門提供的人才盤點九宮格分析,面向企業(yè)個人提供的成長歷程等應用功能。采用RESTful、微服務技術,提供接口服務,快速實現(xiàn)其他系統(tǒng)與平臺組態(tài)化構建,提高其他系統(tǒng)智能屬性,例如:提供給招聘管理系統(tǒng)的智能簡歷文本分析接口。采用網(wǎng)絡協(xié)議數(shù)據(jù)傳輸技術,提供批量數(shù)據(jù)文件傳輸,例如:財務系統(tǒng)所需的專業(yè)報表數(shù)據(jù)文件。

4 大數(shù)據(jù)人才管理平臺應用優(yōu)勢

4.1 以人才管理平臺為載體,實現(xiàn)多學科優(yōu)勢互補

大數(shù)據(jù)背景下,人才管理的理念、方法、模式都發(fā)生了重大變革,單一的人力資源學科領域,無法支撐目前的需求。谷歌、騰訊等企業(yè)都已組建由統(tǒng)計學、組織行為學、人力資源管理的專業(yè)人才擔任分析師的人力資源團隊,為企業(yè)提供前瞻性戰(zhàn)略指導、降低管理成本、提升人力資源的服務質量[10]。以大數(shù)據(jù)人才管理平臺為載體,能實現(xiàn)多學科交融互補,利用計算機技術、信息管理技術構建平臺;利用統(tǒng)計學、人工智能算法實現(xiàn)數(shù)據(jù)挖掘、智能決策;利用人力資源、心理學原理的知識、經驗,構建豐富的應用模塊。多學科優(yōu)勢在平臺上得以交融互補,提高企業(yè)人才管理水平。

4.2 利用平臺大數(shù)據(jù)優(yōu)勢,提高人才管理工作效率

大數(shù)據(jù)人才管理平臺匯聚了全面的數(shù)據(jù)信息,并進行了科學的數(shù)據(jù)治理,具有高效的數(shù)據(jù)運算能力,能夠支撐人才管理工作中的各類數(shù)據(jù)統(tǒng)計分析場景,從而大大提升了人才管理工作效率。例如,企業(yè)可以通過平臺快速搜集準確數(shù)據(jù),為人才規(guī)劃工作提供科學客觀的數(shù)據(jù)參考;平臺具有完善的數(shù)據(jù),融合了各類統(tǒng)計分析技術,能夠實時完成人才盤點工作,提高了工作效率。

4.3 利用平臺智能化優(yōu)勢,提升人才管理工作質量

大數(shù)據(jù)人才管理平臺對數(shù)據(jù)進行深入挖掘,利用先進的機器學習算法實現(xiàn)人才特征分析、畫像分析;利用平臺智能分析優(yōu)勢,可以預測潛在離職人員,實時向管理者預警,動態(tài)優(yōu)化管理策略。通過平臺關聯(lián)分析方法找到與穩(wěn)定性相關的典型特征,建立特定人員的畫像模型,便于人力資源部門實施定向服務。借助平臺智能化技術,顯著提高人才管理工作效益。

5 結束語

大數(shù)據(jù)時代,機遇與挑戰(zhàn)并存,企業(yè)管理者要把握機遇,利用大數(shù)據(jù)技術,創(chuàng)新人才管理模式。在大數(shù)據(jù)人才管理平臺建設中,要充分利用人才相關數(shù)據(jù),注重數(shù)據(jù)分析能力的建設,融合多學科優(yōu)勢,優(yōu)化人才管理的解決方案。對于數(shù)據(jù)的使用應注重安全和隱私保護,建立數(shù)據(jù)安全規(guī)范體系。

猜你喜歡
結構化數(shù)據(jù)處理人才
人才云
英語文摘(2022年4期)2022-06-05 07:45:02
認知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數(shù)據(jù)處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
促進知識結構化的主題式復習初探
結構化面試方法在研究生復試中的應用
計算機教育(2020年5期)2020-07-24 08:53:00
忘不了的人才之策
商周刊(2018年13期)2018-07-11 03:34:10
留住人才要走心
商周刊(2018年10期)2018-06-06 03:04:09
“人才爭奪戰(zhàn)”
商周刊(2018年10期)2018-06-06 03:04:08
基于希爾伯特- 黃變換的去噪法在外測數(shù)據(jù)處理中的應用
基于圖模型的通用半結構化數(shù)據(jù)檢索
計算機工程(2015年8期)2015-07-03 12:20:35
甘泉县| 永和县| 绍兴市| 胶南市| 根河市| 深泽县| 黔西县| 诸暨市| 叙永县| 东阳市| 呈贡县| 明水县| 崇左市| 察哈| 武鸣县| 历史| 武邑县| 肥西县| 札达县| 临潭县| 余姚市| 磐石市| 土默特右旗| 梁山县| 佛冈县| 邵武市| 隆德县| 卫辉市| 西青区| 梧州市| 黎城县| 唐河县| 托克逊县| 邻水| 泽州县| 四川省| 农安县| 佛冈县| 资中县| 易门县| 乐至县|