基于數(shù)據(jù)挖掘的大學(xué)生就業(yè)市場(chǎng)需求分析

2021-11-08 13:12:09胡鵬李長(zhǎng)云傅榮鑫

電腦知識(shí)與技術(shù) 2021年27期

胡鵬李長(zhǎng)云傅榮鑫

摘要：“擇業(yè)難”“就業(yè)難”已是大學(xué)生面臨的兩難問(wèn)題。該文基于網(wǎng)絡(luò)校園招聘，利用Python和SPSS工具需求視角分析就業(yè)現(xiàn)狀。研究表明，熱門職位集中在計(jì)算機(jī)、互聯(lián)網(wǎng)，主要分布在北上廣深城市，但“新一線”需求比例在上升，并且私營(yíng)企業(yè)占比最大。另外，企業(yè)更看重大學(xué)生的基礎(chǔ)能力、工作態(tài)度和品質(zhì)。該研究為大學(xué)生就業(yè)、擇業(yè)提供參考和借鑒。

關(guān)鍵詞：就業(yè)指導(dǎo);大學(xué)生招聘;數(shù)據(jù)挖掘;Python

中圖分類號(hào)：TP3-0? ? ? 文獻(xiàn)標(biāo)識(shí)碼：A

文章編號(hào)：1009-3044（2021）27-0035-03

1 背景

隨著我國(guó)改革開(kāi)放不斷深化，高校教育模式也從精英轉(zhuǎn)為大眾教育，導(dǎo)致大學(xué)生就業(yè)壓力日益增大。通過(guò)分析，人們發(fā)現(xiàn)“就業(yè)難”的影響因素之一就是“擇業(yè)難”。由于企業(yè)和學(xué)生存在信息不對(duì)稱問(wèn)題[1]，導(dǎo)致人才結(jié)構(gòu)性化短缺。

因此，本文用爬蟲(chóng)算法收集招聘網(wǎng)站信息，分析需求的熱門區(qū)域、熱門職業(yè)、熱門職位的技能要求等。為高校和大學(xué)生解決“就業(yè)難”“擇業(yè)難”的問(wèn)題。

2 大學(xué)生招聘方式分析

企業(yè)針對(duì)大學(xué)生招聘通常會(huì)采用校園招聘或者網(wǎng)絡(luò)招聘。

校園招聘是專門針對(duì)應(yīng)屆大學(xué)生的招聘方式。目前，應(yīng)屆畢業(yè)生主要就業(yè)途徑就是校園招聘，但是，艾瑞咨詢?cè)凇吨袊?guó)校園招聘大學(xué)生洞察白皮書》中指出獲得1～3家企業(yè)面試的學(xué)生比例近40%，這說(shuō)明應(yīng)屆畢業(yè)生雖然參與不少校園招聘，但成功獲取Offer還是具有一定難度。網(wǎng)絡(luò)招聘是以招聘平臺(tái)為載體，企業(yè)在平臺(tái)發(fā)布招聘信息，它可以將就業(yè)信息全方位地提供給學(xué)生[2]，相較于傳統(tǒng)的線下招聘，它更節(jié)約時(shí)間成本和空間成本。典型的招聘網(wǎng)站如“前程無(wú)憂”“智聯(lián)招聘”等。網(wǎng)絡(luò)招聘發(fā)展至今，已經(jīng)積累了大量的職位信息，隨著AI技術(shù)的日漸成熟，依靠網(wǎng)絡(luò)就能夠?qū)崿F(xiàn)精準(zhǔn)的職位推薦[3]，對(duì)于促進(jìn)大學(xué)生就業(yè)是十分有意義的。

3 企業(yè)招聘市場(chǎng)需求數(shù)據(jù)挖掘

3.1 數(shù)據(jù)獲取

1）數(shù)據(jù)源的選擇。招聘網(wǎng)站有很多，但是最有影響力的綜合招聘網(wǎng)站非前程無(wú)憂（51job.com）莫屬。前程無(wú)憂招聘網(wǎng)站上具有海量的招聘信息，覆蓋的知名企業(yè)較多。所以本文選擇從前程無(wú)憂招聘網(wǎng)站上獲取職位信息。

2）Python爬蟲(chóng)獲取數(shù)據(jù)。Python閱讀簡(jiǎn)單，代碼結(jié)構(gòu)清晰、明了[4]。利用爬蟲(chóng)算法獲取以下信息。①獲取熱門職位名單。前程無(wú)憂網(wǎng)有各類職位信息，職位名稱眾多，為了Python爬蟲(chóng)可以實(shí)現(xiàn)，我們需要先確定職位名稱。由于前程無(wú)憂沒(méi)有提供職位名稱集合，我們選擇從BOSS直聘首頁(yè)獲取職位名稱。②獲取熱門職位信息。由于我們研究的市場(chǎng)需求是針對(duì)大學(xué)生就業(yè)，所以在爬取職位信息時(shí)，將工作年限參數(shù)設(shè)置為“在校生/應(yīng)屆生”。獲取熱門職位的爬蟲(chóng)代碼如下：

def count_page（）：

"根據(jù)boss直聘首頁(yè)的職位名獲取職位名稱集合，再?gòu)那俺虩o(wú)憂上獲取熱門職位"

driver_path = r"D：＼Chrome＼Downloads＼chromedriver.exe"

file_name = r"D：＼Python_code＼Python程序＼爬蟲(chóng)相關(guān)代碼＼51job＼原始數(shù)據(jù)＼數(shù)量.xlsx"

headers = {

'User-Agent'： 'Mozilla/5.0 （Windows NT 10.0; Win64; x64） AppleWebKit/537.36 （KHTML， like Gecko） Chrome/73.0.3683.86 Safari/537.36'

}

browser = webdriver.Chrome（executable_path=driver_path）

url = "https：//www.zhipin.com/"

job_names = []

browser.get（url）

html = browser.page_source

selector = etree.HTML（html）

job_names += selector.xpath（"http://div[@class='job-menu']//div[@class='menu-sub']//li/div[@class='text']/a/text（）"）

name_nums = {}

for name in job_names：

browser = webdriver.Chrome（executable_path=driver_path）

input_tag = browser.find_element_by_id（"kwdselectid"）

input_tag.send_keys（name）

input_tag.clear（）

click_tag = browser.find_element（By.LINK_TEXT， "搜索"）

click_tag.click（）

html = browser.page_source

html = etree.HTML（html）

job_url = html.xpath（"http://div[contains（@id，'filter_workyear'）]//li[2]/a/@href"）

web = requests.get（job_url， headers=headers）

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于數(shù)據(jù)挖掘的大學(xué)生就業(yè)市場(chǎng)需求分析