国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的招聘信息中就業(yè)技能提取的應(yīng)用分析

2019-01-08 03:16:09趙力衡陳虹君
電腦知識(shí)與技術(shù) 2019年33期
關(guān)鍵詞:應(yīng)聘者分詞職位

趙力衡 陳虹君

摘要:應(yīng)聘者,特別是剛進(jìn)入職場(chǎng)的學(xué)生,如果在就業(yè)前一段時(shí)間就能了解到自己掌握的技能與公司職位招聘信息中所要求的技能是否吻合,就能幫助應(yīng)聘者在應(yīng)聘前有更多的準(zhǔn)備。為分析招聘信息中的就業(yè)技能,從招聘信息中提取就業(yè)技能詞匯就顯得很有必要了。鑒于此,提出使用機(jī)器學(xué)習(xí)中使用FP關(guān)聯(lián)規(guī)則模型和語義分詞法來實(shí)現(xiàn)對(duì)招聘信息中的就業(yè)技能的提取。實(shí)驗(yàn)結(jié)果表明,所提方法能較準(zhǔn)確地分析并提取出招聘信息中的技能詞匯,可作為就業(yè)技能提取的有效依據(jù),也可為文本關(guān)鍵詞組提取提供參考。

關(guān)鍵詞:大數(shù)據(jù);機(jī)器學(xué)習(xí);就業(yè);技能;FP

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2019)33-0211-02

當(dāng)前很多應(yīng)聘者,特別是初人職場(chǎng)的學(xué)生,在就業(yè)時(shí)常常不知道自己能勝任什么樣的工作,因此幫助應(yīng)聘者分析自己所掌握的技能和工作所需技能的差異就顯得很有價(jià)值。為了解決這個(gè)問題,首先要做的就是從眾多的招聘信息中識(shí)別出被普遍要求的就業(yè)技能詞匯。

本文從分析招聘信息內(nèi)容出發(fā),通過機(jī)器學(xué)習(xí)和語義分詞方式從招聘信息文本中識(shí)別出其中被普遍引用的就業(yè)技能詞匯和詞匯組,從而提供了從招聘文本信息中提取技能詞匯和詞匯組的一種實(shí)現(xiàn)方法。

1就業(yè)技能提取問題分析

在明確應(yīng)聘者技能是否與職位匹配時(shí),首先需要明確應(yīng)聘者所掌握的技能和不同職位所需的技能有哪些。前者可以通過應(yīng)聘者的技能調(diào)查準(zhǔn)確獲知,后者的數(shù)據(jù)則分散于各個(gè)招聘信息中,這就需要使用爬蟲等工具來采集、整合這些數(shù)據(jù)。因時(shí)間有限,本文僅關(guān)注了計(jì)算機(jī)行業(yè)相關(guān)的職位。在采集職位數(shù)據(jù)時(shí)發(fā)現(xiàn)了以下問題:

1)招聘信息中對(duì)技能的描述不是單獨(dú)的,通常是嵌套在一條或多條完整的語句中,以Java工程師為例:

21不同公司對(duì)同一職位所需技能的要求存在著不同,如圖1所示的脫敏后不同公司對(duì)Java工程師的不同要求。

2就業(yè)技能提取模型分析

分析多個(gè)招聘信息發(fā)現(xiàn),同一職位的技能要求中,部分技能是在多數(shù)公司的招聘信息中都出現(xiàn)的,比如表1中的Hiber-nate、Oracle等,這些技能文中稱為該職位的通用技能;另一些技能,則僅在少數(shù)公司的招聘信息中出現(xiàn),這部分技能通常是公司或項(xiàng)目所特需的技能。

其中,前者具有應(yīng)聘職位的普遍性,掌握后能符合多數(shù)招聘信息需求,也是應(yīng)聘者就業(yè)技能分析應(yīng)當(dāng)關(guān)注的;而后者通常僅在少數(shù)公司的招聘信息中出現(xiàn),大多是該公司因業(yè)務(wù)需求所特有的技能需求,應(yīng)聘者即便掌握,符合的招聘信息也不多,因此這部分技能并不需要應(yīng)聘者普遍掌握。

在應(yīng)聘一個(gè)職位時(shí),應(yīng)聘者也并不需要掌握該職位所有的通用就業(yè)技能,而是只需要掌握這個(gè)招聘信息中要求的通用技能即可,即這次應(yīng)聘所需的通用技能組。

因此,實(shí)現(xiàn)對(duì)就業(yè)技能的分析時(shí)需要解決以下兩個(gè)問題:

1)從招聘信息中提取出相關(guān)的就業(yè)技能;

2)識(shí)別出其中被同一職位廣泛引用的通用技能和通用技能組。

2.1技能提取

提取技能詞匯的第一步就是分詞。本文采用了語義分詞與分詞工具結(jié)合的方法實(shí)現(xiàn)分詞。這里語義分詞實(shí)現(xiàn)方式是將描述信息按“謂詞一賓語”的語義分詞方法,先定義了以謂語表示的“特征謂詞”和以賓語表示的“后綴停詞”詞典,然后使用正則表達(dá)式進(jìn)行分詞。先使用分詞工具分詞,分詞工具的分詞結(jié)果較粗,因此再將分詞工具的結(jié)果再使用語義分詞,從而能較精確地將就業(yè)技能從招聘信息中提取出來,如下圖所示:

2.2通用就業(yè)技能組分析

就業(yè)技能提取完成后,對(duì)每一個(gè)職位創(chuàng)建一個(gè)表格,將該職位的每一則招聘信息中提取出來的就業(yè)技能詞匯填入同一行中。以表2中的招聘信息為例,如下表所示:

如果同一職位中一個(gè)就業(yè)技能的支持度超過50%,則設(shè)定該技能在這個(gè)職位中是一個(gè)通用技能。找出通用技能后,在尋找通用就業(yè)技能組時(shí)還需要找出同一則招聘信息中同時(shí)出現(xiàn)的通用技能,這就需要用到數(shù)據(jù)關(guān)聯(lián)分析模型。因此可以用FP Growth關(guān)聯(lián)模型對(duì)該表數(shù)據(jù)建模。

在FP模型中設(shè)定最小支持度參數(shù)為0.5,就能同時(shí)得到該職位支持度超過50%的通用技能及通用技能組。下圖展示了FP Growth模型分析的部分結(jié)果:

上圖中一行記錄表示一則招聘信息,該記錄中的工作要求則是這條招聘信息中保留的在該職位中支持度超過50%的技能,這些就是在該職位的大多招聘信息中都要求了的通用技能。此外,從圖中可以看出同一條招聘記錄中的全部通用技能就是這條招聘信息中要求的一組相關(guān)就業(yè)技能,它們就構(gòu)成了一個(gè)通用技能組。至此,就將招聘信息中的通用技能和技能組提取了出來,可以用于應(yīng)聘者就業(yè)技能畫像了。

3結(jié)束語

從結(jié)果來看,方法所提出的模型能較準(zhǔn)確地從不同的招聘信息的職位描述中識(shí)別出技能相關(guān)詞匯,并提取出該職位相關(guān)的通用就業(yè)技能和技能組,從而有效解決了嵌入在招聘信息這樣的文本中的技能詞匯識(shí)別和通用技能提取的問題,為文本分析中使用機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)詞匯識(shí)別和關(guān)鍵詞提取提供了一個(gè)可行的思路。

實(shí)驗(yàn)結(jié)果表明,所提方法能較準(zhǔn)確地從招聘信息中識(shí)別并提取該職位所需的通用就業(yè)技能和技能組,可作為招聘信息分析中就業(yè)技能提取的有效手段,并為文本關(guān)鍵詞組分析提供了一個(gè)可行的思路。

猜你喜歡
應(yīng)聘者分詞職位
領(lǐng)導(dǎo)職位≠領(lǐng)導(dǎo)力
面試好難
37°女人(2020年2期)2020-03-12 10:47:38
把降落傘賣給農(nóng)夫
結(jié)巴分詞在詞云中的應(yīng)用
職位之謎與負(fù)謗之痛:柳治徵在東南大學(xué)的進(jìn)退(1916—1925)
值得重視的分詞的特殊用法
電話預(yù)約技巧知多少
人力資源(2016年8期)2016-10-18 09:59:53
美最高就業(yè)率地鐵圈
海外星云 (2014年22期)2015-01-19 09:34:28
收入性別歧視的職位差異
高考分詞作狀語考點(diǎn)歸納與疑難解析
建水县| 濮阳县| 上蔡县| 安顺市| 余庆县| 遂平县| 庆阳市| 南开区| 镇远县| 龙山县| 吉木萨尔县| 金阳县| 牡丹江市| 淅川县| 武安市| 涞水县| 辽宁省| 县级市| 固镇县| 宜兴市| 无锡市| 鸡东县| 广平县| 高尔夫| 军事| 罗源县| 论坛| 从江县| 庐江县| 秦安县| 荔浦县| 镇平县| 西乌| 永兴县| 民和| 大竹县| 唐海县| 襄垣县| 吐鲁番市| 宝应县| 横峰县|