秦玥 朱繼威 董哲清
摘? 要:國(guó)家教育事業(yè)發(fā)展迅猛,畢業(yè)生人數(shù)連年攀升。尤其是受疫情影響,就業(yè)形勢(shì)嚴(yán)峻,給畢業(yè)生帶來(lái)了巨大的挑戰(zhàn)。因此,了解企業(yè)招聘要求,實(shí)時(shí)獲取招聘信息十分關(guān)鍵。本文采用hadoop集群作為數(shù)據(jù)清洗的環(huán)境搭建大數(shù)據(jù)平臺(tái),Tomcat服務(wù)器,Vue作為前端框架設(shè)計(jì)了一套基于互聯(lián)網(wǎng)大數(shù)據(jù)的招聘數(shù)據(jù)智能分析平臺(tái),對(duì)主流企業(yè)的招聘信息進(jìn)行分析和整理,并利用可視化技術(shù)展示幫助畢業(yè)生們能夠了解互聯(lián)網(wǎng)行業(yè)的趨勢(shì)和要求,提供適合的崗位。
關(guān)鍵詞:招聘;大數(shù)據(jù);智能分析;可視化
引言
據(jù)教育部統(tǒng)計(jì),2020屆高校畢業(yè)人數(shù)高達(dá)874萬(wàn)人,再創(chuàng)歷史新高[1,2]。尤其是受到新冠肺炎,經(jīng)濟(jì)下滑等多種因素的影響,就業(yè)形勢(shì)十分嚴(yán)峻,畢業(yè)生們面臨著巨大的就業(yè)壓力。值得注意的是,在《2020應(yīng)屆生畢業(yè)生春招求職報(bào)告》,中我們了解到,在各行業(yè)新增的應(yīng)屆畢業(yè)生人數(shù)來(lái)看,互聯(lián)網(wǎng)行業(yè)應(yīng)屆生占比最高,無(wú)疑加大了互聯(lián)網(wǎng)行業(yè)人才市場(chǎng)的競(jìng)爭(zhēng),解決高校畢業(yè)生就業(yè)成為了一個(gè)熱點(diǎn)問(wèn)題。
隨著網(wǎng)絡(luò)時(shí)代的到來(lái),每天都有海量的信息鋪天蓋地而來(lái)。一方面為人們提供了大量選擇的機(jī)會(huì),但另一方面,信息的冗余也增大了人們篩選的難度[3]。傳統(tǒng)招聘的數(shù)據(jù)采集和分析光靠人工收集并采用普通的方式進(jìn)行分析十分的浪費(fèi)人力和物力,效率不高,用戶體驗(yàn)效果不好。
針對(duì)上述問(wèn)題,本文設(shè)計(jì)了一套基于互聯(lián)網(wǎng)大數(shù)據(jù)而招聘數(shù)據(jù)智能分析平臺(tái),運(yùn)用大數(shù)據(jù)技術(shù),對(duì)當(dāng)前主流企業(yè)的招聘信息進(jìn)行分析和整理,提煉出畢業(yè)生最關(guān)心最感興趣的部分,并利用可視化技術(shù)將這些內(nèi)容以一種簡(jiǎn)潔清晰的方式展現(xiàn)出來(lái)。在此平臺(tái),畢業(yè)生們能夠了解到當(dāng)前互聯(lián)網(wǎng)各行業(yè)的趨勢(shì)以及當(dāng)前企業(yè)對(duì)畢業(yè)生的期望和要求;同時(shí)還能根據(jù)自身的條件,獲取到適合自己的崗位信息。
1系統(tǒng)設(shè)計(jì)框架
本系統(tǒng)主要采用hadoop集群搭建大數(shù)據(jù)平臺(tái),并將事先采集到的數(shù)據(jù)加載到Mapreduce中清洗,再載入至hive數(shù)據(jù)表中,對(duì)其進(jìn)行統(tǒng)計(jì)和分析,并將結(jié)果通過(guò)hive表保存至hbase中。再通過(guò)tomcat服務(wù)器訪問(wèn)獲取hbase中的數(shù)據(jù)打包成json格式,通過(guò)前端頁(yè)面展示出來(lái),具體設(shè)計(jì)框架如圖1所示:
2具體實(shí)現(xiàn)方案
2.1 數(shù)據(jù)分析
在hadoop大數(shù)據(jù)集群環(huán)境搭建完畢后,進(jìn)入數(shù)據(jù)處理的階段。首先將csv數(shù)據(jù)文件裝載到hdfs文件系統(tǒng)中并編寫(xiě)相應(yīng)的MapReduce進(jìn)行數(shù)據(jù)的初步清洗。將初步的清洗結(jié)果通過(guò)hdfs文件系統(tǒng)載入至hive表格當(dāng)中進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與分析。并將統(tǒng)計(jì)結(jié)果存入hive表。
2.2 數(shù)據(jù)展示
在處理好數(shù)據(jù)后,創(chuàng)建web項(xiàng)目。通過(guò)啟動(dòng)tomcat服務(wù)器訪問(wèn)hbase獲取hive統(tǒng)計(jì)好的數(shù)據(jù),并打包成json格式,方便前端實(shí)時(shí)訪問(wèn)數(shù)據(jù)。當(dāng)前端獲取到數(shù)據(jù)后,對(duì)其進(jìn)行解析利用echarts可視化工具進(jìn)行展示。在前端頁(yè)面展示中主要通過(guò)“工作薪資”,“地區(qū)”,“招聘所學(xué)技能點(diǎn)”,“招聘影響因素”等方面進(jìn)行展示。
2.3 職位推薦
根據(jù)用戶對(duì)相關(guān)知識(shí)技能的專業(yè)程度對(duì)用戶進(jìn)行畫(huà)像,再根據(jù)職位對(duì)用戶的相關(guān)知識(shí)技能的專業(yè)程度要求對(duì)職位進(jìn)行畫(huà)像。在前面的大數(shù)據(jù)分析過(guò)程中,已經(jīng)分析出了各職位標(biāo)簽分類(lèi)的技術(shù)熱詞以及數(shù)量,利用大數(shù)據(jù)分析結(jié)果,對(duì)每個(gè)專業(yè)領(lǐng)域的技能要求進(jìn)行重要程度的分析,再根據(jù)不同職位所屬大類(lèi)對(duì)各種不同知識(shí)技能的重要程度的分析,利用層次分析法計(jì)算在用戶和職位中不同知識(shí)技能所占的比重,利用這個(gè)比重衡量用戶畫(huà)像和職位畫(huà)像的和適度,和適度前幾位的職位信息將被推薦給用戶。
3系統(tǒng)測(cè)試
本文主要是針對(duì)算法和主要功能點(diǎn)進(jìn)行測(cè)試,通過(guò)設(shè)計(jì)測(cè)試用例判斷程序的邏輯、功能是正確實(shí)現(xiàn)。測(cè)試結(jié)果與分析如表1所示:
4總結(jié)展望
本系統(tǒng)充分利用了大數(shù)據(jù)技術(shù)解決了傳統(tǒng)數(shù)據(jù)采集和分析所帶來(lái)的不便,通過(guò)前端可視化的展示讓用戶直觀了解招聘信息,為畢業(yè)生提供了一定的就業(yè)幫助。但是仍有不足的地方需要改進(jìn),在之后的工作中,我們將采集更多的招聘信息,優(yōu)化推薦算法,為高校畢業(yè)生提供更精確的推薦服務(wù)。
參考文獻(xiàn)
[1]楊紫,劉凱,王樂(lè)樂(lè).后疫情時(shí)代高校畢業(yè)生就業(yè)意愿的變化分析及對(duì)策研究[J].中國(guó)商論,2021(08):187-189.
[2]黃宇飛.大學(xué)生就業(yè)現(xiàn)狀及對(duì)策研究[J].青年與社會(huì),2020(17):130-131.
[3]馬曉超.“互聯(lián)網(wǎng)+”時(shí)代高校人才招聘新思考[J].科技經(jīng)濟(jì)導(dǎo)刊,2020,28(24):163-164.