胡鵬 李長(zhǎng)云 傅榮鑫
摘要:“擇業(yè)難”“就業(yè)難”已是大學(xué)生面臨的兩難問(wèn)題。該文基于網(wǎng)絡(luò)校園招聘,利用Python和SPSS工具需求視角分析就業(yè)現(xiàn)狀。研究表明,熱門職位集中在計(jì)算機(jī)、互聯(lián)網(wǎng),主要分布在北上廣深城市,但“新一線”需求比例在上升,并且私營(yíng)企業(yè)占比最大。另外,企業(yè)更看重大學(xué)生的基礎(chǔ)能力、工作態(tài)度和品質(zhì)。該研究為大學(xué)生就業(yè)、擇業(yè)提供參考和借鑒。
關(guān)鍵詞:就業(yè)指導(dǎo);大學(xué)生招聘;數(shù)據(jù)挖掘;Python
中圖分類號(hào):TP3-0? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)27-0035-03
1 背景
隨著我國(guó)改革開(kāi)放不斷深化,高校教育模式也從精英轉(zhuǎn)為大眾教育,導(dǎo)致大學(xué)生就業(yè)壓力日益增大。通過(guò)分析,人們發(fā)現(xiàn)“就業(yè)難”的影響因素之一就是“擇業(yè)難”。由于企業(yè)和學(xué)生存在信息不對(duì)稱問(wèn)題[1],導(dǎo)致人才結(jié)構(gòu)性化短缺。
因此,本文用爬蟲(chóng)算法收集招聘網(wǎng)站信息,分析需求的熱門區(qū)域、熱門職業(yè)、熱門職位的技能要求等。為高校和大學(xué)生解決“就業(yè)難”“擇業(yè)難”的問(wèn)題。
2 大學(xué)生招聘方式分析
企業(yè)針對(duì)大學(xué)生招聘通常會(huì)采用校園招聘或者網(wǎng)絡(luò)招聘。
校園招聘是專門針對(duì)應(yīng)屆大學(xué)生的招聘方式。目前,應(yīng)屆畢業(yè)生主要就業(yè)途徑就是校園招聘,但是,艾瑞咨詢?cè)凇吨袊?guó)校園招聘大學(xué)生洞察白皮書》中指出獲得1~3家企業(yè)面試的學(xué)生比例近40%,這說(shuō)明應(yīng)屆畢業(yè)生雖然參與不少校園招聘,但成功獲取Offer還是具有一定難度。網(wǎng)絡(luò)招聘是以招聘平臺(tái)為載體,企業(yè)在平臺(tái)發(fā)布招聘信息,它可以將就業(yè)信息全方位地提供給學(xué)生[2],相較于傳統(tǒng)的線下招聘,它更節(jié)約時(shí)間成本和空間成本。典型的招聘網(wǎng)站如“前程無(wú)憂”“智聯(lián)招聘”等。網(wǎng)絡(luò)招聘發(fā)展至今,已經(jīng)積累了大量的職位信息,隨著AI技術(shù)的日漸成熟,依靠網(wǎng)絡(luò)就能夠?qū)崿F(xiàn)精準(zhǔn)的職位推薦[3],對(duì)于促進(jìn)大學(xué)生就業(yè)是十分有意義的。
3 企業(yè)招聘市場(chǎng)需求數(shù)據(jù)挖掘
3.1 數(shù)據(jù)獲取
1)數(shù)據(jù)源的選擇。招聘網(wǎng)站有很多,但是最有影響力的綜合招聘網(wǎng)站非前程無(wú)憂(51job.com)莫屬。前程無(wú)憂招聘網(wǎng)站上具有海量的招聘信息,覆蓋的知名企業(yè)較多。所以本文選擇從前程無(wú)憂招聘網(wǎng)站上獲取職位信息。
2)Python爬蟲(chóng)獲取數(shù)據(jù)。Python閱讀簡(jiǎn)單,代碼結(jié)構(gòu)清晰、明了[4]。利用爬蟲(chóng)算法獲取以下信息。①獲取熱門職位名單。前程無(wú)憂網(wǎng)有各類職位信息,職位名稱眾多,為了Python爬蟲(chóng)可以實(shí)現(xiàn),我們需要先確定職位名稱。由于前程無(wú)憂沒(méi)有提供職位名稱集合,我們選擇從BOSS直聘首頁(yè)獲取職位名稱。②獲取熱門職位信息。由于我們研究的市場(chǎng)需求是針對(duì)大學(xué)生就業(yè),所以在爬取職位信息時(shí),將工作年限參數(shù)設(shè)置為“在校生/應(yīng)屆生”。獲取熱門職位的爬蟲(chóng)代碼如下:
def count_page():
"根據(jù)boss直聘首頁(yè)的職位名獲取職位名稱集合,再?gòu)那俺虩o(wú)憂上獲取熱門職位"
driver_path = r"D:\Chrome\Downloads\chromedriver.exe"
file_name = r"D:\Python_code\Python程序\爬蟲(chóng)相關(guān)代碼\51job\原始數(shù)據(jù)\數(shù)量.xlsx"
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
}
browser = webdriver.Chrome(executable_path=driver_path)
url = "https://www.zhipin.com/"
job_names = []
browser.get(url)
html = browser.page_source
selector = etree.HTML(html)
job_names += selector.xpath("http://div[@class='job-menu']//div[@class='menu-sub']//li/div[@class='text']/a/text()")
name_nums = {}
for name in job_names:
browser = webdriver.Chrome(executable_path=driver_path)
input_tag = browser.find_element_by_id("kwdselectid")
input_tag.send_keys(name)
input_tag.clear()
click_tag = browser.find_element(By.LINK_TEXT, "搜索")
click_tag.click()
html = browser.page_source
html = etree.HTML(html)
job_url = html.xpath("http://div[contains(@id,'filter_workyear')]//li[2]/a/@href")
web = requests.get(job_url, headers=headers)