拜亞萌
(焦作大學(xué),河南 焦作454000)
隨著高等教育普及,高校畢業(yè)生人數(shù)日益增多,高校就業(yè)工作的壓力也變得越來越嚴(yán)峻。 國家層面和高校層面均出臺相應(yīng)政策,不斷完善就業(yè)信息服務(wù)體系,提升就業(yè)工作效率與服務(wù)質(zhì)量[1]。 大學(xué)生網(wǎng)絡(luò)就業(yè)信息服務(wù)就是通過各類就業(yè)網(wǎng)站獲取相應(yīng)的求職信息,但目前大多數(shù)就業(yè)網(wǎng)站在個性化服務(wù)內(nèi)容、崗位精準(zhǔn)匹配等方面存在不足,如何解決大學(xué)生就業(yè)難和企業(yè)招聘人才難的問題,已經(jīng)成為大學(xué)生就業(yè)網(wǎng)絡(luò)服務(wù)模式研究的一項(xiàng)重要內(nèi)容[2-3]。
運(yùn)用大數(shù)據(jù)分析技術(shù)對海量就業(yè)信息數(shù)據(jù)進(jìn)行挖掘處理,從而獲取具有價值的就業(yè)信息,提升高校畢業(yè)生精準(zhǔn)就業(yè)服務(wù)水平, 成為大數(shù)據(jù)背景下高校精準(zhǔn)就業(yè)服務(wù)工作的重點(diǎn)之一。 本文正是基于此目的,以大數(shù)據(jù)分析技術(shù)為基礎(chǔ),優(yōu)化構(gòu)建一種多層結(jié)構(gòu)的就業(yè)網(wǎng)絡(luò)精準(zhǔn)化服務(wù)模式。
在就業(yè)網(wǎng)絡(luò)招聘領(lǐng)域,求職用戶和招聘企業(yè)構(gòu)成了供求關(guān)系, 本文將兩者作為研究主體,分析得到不同主體所具備的對應(yīng)屬性信息[4]。其中,求職用戶的簡歷類資源主要包括客觀特征和主觀意向,客觀特征主要指基本信息、技能特長、教育水平、工作經(jīng)歷等客觀屬性,主觀意向則包括期望職業(yè)、期望行業(yè)、期望公司類別以及期望工作地等相關(guān)屬性。而招聘企業(yè)中的職位類資源需求,同樣又包括崗位客觀需求以及崗位主觀要求[5-6]。 其中,崗位客觀需求則主要對應(yīng)聘者的基本信息、教育水平、工作經(jīng)歷以及技能水平進(jìn)行客觀性約束,崗位主觀要求則針對職位所屬行業(yè)、 公司所屬行業(yè)、公司性質(zhì)、職位所在地等主觀因素。 圖1 描述了求職用戶簡歷類資源和招聘企業(yè)職位類資源的不同屬性之間的對應(yīng)關(guān)系。
圖1 簡歷類資源與職位類資源的對應(yīng)關(guān)系
簡歷類資源和職位類資源中的某些屬性之間存在聯(lián)系。 其中,求職用戶的客觀特征屬性與招聘職位所需的能力要求之間存在對應(yīng)關(guān)系,求職者的期望屬性與崗位主觀要求之間也存在對應(yīng)關(guān)系。 因此,本文正是基于此思路,通過采集簡歷類資源和職位類資源中的關(guān)鍵屬性值,對用戶與就業(yè)信息數(shù)據(jù)向量進(jìn)行匹配計(jì)算,根據(jù)匹配結(jié)果,對權(quán)重推薦度進(jìn)行排序,取相似度靠前的推薦結(jié)果推薦給用戶,從而完成就業(yè)網(wǎng)絡(luò)信息服務(wù)模式的精準(zhǔn)化推薦操作。
針對目前就業(yè)網(wǎng)絡(luò)信息服務(wù)中普遍存在的就業(yè)冗余信息多、就業(yè)信息不匹配、就業(yè)信息時效性差以及推薦系統(tǒng)不完善等問題,重點(diǎn)對就業(yè)網(wǎng)絡(luò)信息服務(wù)平臺、精準(zhǔn)化就業(yè)服務(wù)推薦模型以及個性化推薦算法的設(shè)計(jì)過程進(jìn)行了闡述。
就業(yè)網(wǎng)絡(luò)信息服務(wù)平臺是實(shí)現(xiàn)大學(xué)生就業(yè)網(wǎng)絡(luò)精準(zhǔn)化服務(wù)模式的重要載體,該平臺可為不同用戶提供一站式就業(yè)信息服務(wù)。 設(shè)計(jì)思路采用分層架構(gòu)思想, 自上而下分為信息服務(wù)平臺層、信息服務(wù)策略層、信息數(shù)據(jù)倉庫層。 每個層次又根據(jù)實(shí)際業(yè)務(wù)需求劃分為不同功能模塊,通過面向?qū)ο蠓?wù)設(shè)計(jì)模式,使得不同功能模塊之間具備低耦合、可擴(kuò)展等良好的技術(shù)特性。 圖2 描述了就業(yè)網(wǎng)絡(luò)信息服務(wù)平臺的體系模型結(jié)構(gòu)。
圖2 大學(xué)生就業(yè)網(wǎng)絡(luò)信息服務(wù)平臺體系框架
2.1.1 服務(wù)平臺層
該層以就業(yè)信息服務(wù)網(wǎng)站的方式為求職者和用人單位等相關(guān)主體用戶提供訪問各種業(yè)務(wù)的操作, 同時通過該層實(shí)現(xiàn)交互式的訪問操作。另外, 該層還負(fù)責(zé)收集就業(yè)信息和基礎(chǔ)數(shù)據(jù),包括求職用戶和企業(yè)用戶的客觀屬性和主觀需求所涉及的相關(guān)數(shù)據(jù)信息,并將相應(yīng)數(shù)據(jù)轉(zhuǎn)換為對應(yīng)技能或就業(yè)需求。 該層主要向用戶提供各種就業(yè)信息服務(wù),包括個人簡歷管理、個性化搜索管理、職業(yè)規(guī)劃管理、技能評估管理等多個核心模塊和基本的服務(wù)功能。
2.1.2 服務(wù)策略層
該層負(fù)責(zé)對服務(wù)平臺層所涉及的各種業(yè)務(wù)進(jìn)行分析和計(jì)算,并將計(jì)算結(jié)果以策略的方式呈現(xiàn)給用戶。 該層以大數(shù)據(jù)分析、數(shù)據(jù)挖掘技術(shù)為技術(shù)支撐,構(gòu)建信息采集、過濾、精準(zhǔn)化推薦、智能搜索、就業(yè)預(yù)測分析等不同的服務(wù)策略。
其中,信息采集過濾服務(wù)主要負(fù)責(zé)對用戶求職行為(點(diǎn)擊、申請、收藏、瀏覽)以及個人基本信息、簡歷信息等數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)化、過濾等操作,為數(shù)據(jù)分析提供規(guī)范化的數(shù)據(jù)集合。 精準(zhǔn)化推薦的核心是協(xié)同過濾推薦引擎算法,根據(jù)求職用戶的興趣愛好、 期望職業(yè)等主觀意愿信息,預(yù)測用戶實(shí)際需求, 并檢索出相應(yīng)的就業(yè)服務(wù)信息,主動為用戶提供各種個性化就業(yè)相關(guān)的服務(wù)信息。 智能搜索引擎服務(wù)則通過搜索引擎接收用戶信息,分析就業(yè)信息需求,并通過協(xié)同過濾推薦算法,在本地?cái)?shù)據(jù)庫中進(jìn)行信息匹配,將得到的匹配信息匯總,從而為用戶提供所需的搜索服務(wù)。 就業(yè)預(yù)測分析則主要通過個性化推薦引擎算法, 計(jì)算與目標(biāo)求職者具有相似行為的其他用戶, 并獲取相似用戶的求職行為和職位獲取信息,并將該信息作為個性化推薦信息推送給目標(biāo)求職者,從而完成就業(yè)趨勢預(yù)測分析等服務(wù)。
2.1.3 數(shù)據(jù)倉庫層
數(shù)據(jù)倉庫層主要由海量異構(gòu)數(shù)據(jù)倉庫、就業(yè)網(wǎng)絡(luò)信息服務(wù)核心數(shù)據(jù)庫以及數(shù)據(jù)ETL 引擎三部分組成,其主要功能是負(fù)責(zé)為服務(wù)策略層提供必要的數(shù)據(jù)信息。 其中,海量易購數(shù)據(jù)倉庫則由用人單位招聘數(shù)據(jù)庫、 畢業(yè)生基本信息數(shù)據(jù)庫、用戶行為采集數(shù)據(jù)庫、高校畢業(yè)生信息數(shù)據(jù)庫構(gòu)成。 ETL 引擎則是該層的核心,將各種異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行抽取、清洗、轉(zhuǎn)換、聚合后加載到核心數(shù)據(jù)庫中,為上層的數(shù)據(jù)挖掘和聯(lián)機(jī)分析提供必要的基礎(chǔ)數(shù)據(jù)。
就業(yè)信息推薦模型是整個就業(yè)網(wǎng)絡(luò)服務(wù)平臺的核心,也是服務(wù)策略層的重要組件之一。 在該模型中分別針對求職用戶和招聘企業(yè)進(jìn)行內(nèi)容屬性提取,并構(gòu)建各自相應(yīng)的用戶模型,再通過推薦引擎(內(nèi)容匹配器)完成信息匹配,從而對求職者的真實(shí)求職意圖進(jìn)行預(yù)測和推薦。 圖3 則是精準(zhǔn)化就業(yè)服務(wù)推薦模型的工作流程,就業(yè)服務(wù)推薦模型工作步驟描述如下。
(1)采集信息:分別獲取求職用戶簡歷類資源信息以及招聘企業(yè)崗位需求類資源信息。 其中,用戶資源包括個人基本信息等顯式數(shù)據(jù)以及用戶行為等隱式數(shù)據(jù),崗位需求類資源則主要包括崗位客觀需求和崗位主觀需求等數(shù)據(jù)信息。
(2)創(chuàng)建模型:面向求職用戶和招聘企業(yè),分別創(chuàng)建求職用戶基本模型、用戶行為模型和職位需求模型。
(3)抽取集合:從所創(chuàng)建的資源模型中抽取由主觀興趣和客觀特征組成的關(guān)鍵屬性集合,并將對應(yīng)的關(guān)鍵屬性值存儲到就業(yè)信息核心數(shù)據(jù)庫中,生成各自屬性向量集。
(4)數(shù)據(jù)處理:利用用戶協(xié)同過濾推薦算法,對用戶和就業(yè)信息數(shù)據(jù)向量進(jìn)行匹配計(jì)算。
(5)結(jié)果推薦:根據(jù)匹配結(jié)果,對權(quán)重推薦度進(jìn)行排序, 取相似度靠前的推薦結(jié)果推薦給用戶,從而獲取職位推薦信息。
圖3 精準(zhǔn)化就業(yè)服務(wù)推薦流程
其中,用戶行為數(shù)據(jù)的采集主要包括顯式數(shù)據(jù)和隱式數(shù)據(jù)。 顯式數(shù)據(jù)包括個人基本信息、學(xué)歷專業(yè)、興趣愛好等用戶注冊所提交的靜態(tài)數(shù)據(jù)信息。 而隱式數(shù)據(jù)則主要指求職者通過點(diǎn)擊、瀏覽、搜索、查詢、收藏等行為所產(chǎn)生的行為數(shù)據(jù)信息。 通過對上述兩類數(shù)據(jù)信息的采集,并進(jìn)行數(shù)據(jù)清洗、轉(zhuǎn)化、篩選等預(yù)處理,減少無效數(shù)據(jù)的參與量,降低模型計(jì)算量。 然后,根據(jù)用戶行為數(shù)據(jù),采用用戶畫像技術(shù),構(gòu)建用戶模型。 最后,通過推薦引擎(內(nèi)容匹配器)完成職位信息的推薦。
本文采用協(xié)同過濾推薦算法作為推薦引擎的核心算法,首先對用戶顯式數(shù)據(jù)和隱式數(shù)據(jù)進(jìn)行采集,并對采集的數(shù)據(jù)進(jìn)行數(shù)據(jù)建模,計(jì)算分析出與目標(biāo)求職者類似的相似用戶;最后,將相似用戶所具有的求職行為作為目標(biāo)求職者的匹配結(jié)果,輸出職位推薦結(jié)果,從而實(shí)現(xiàn)個性化推薦。 該算法是在基于內(nèi)容和規(guī)則的推薦算法基礎(chǔ)之上進(jìn)行的改進(jìn),相比傳統(tǒng)的基于文本的推薦算法,協(xié)同過濾推薦算法在數(shù)據(jù)依賴度、數(shù)據(jù)模型創(chuàng)建、 數(shù)據(jù)集合采集等性能方面均有較大的提高。 同時,協(xié)同過濾推薦算法的最大優(yōu)勢在于對用戶隱式數(shù)據(jù)的分析和處理,從而可以從更多維度提升推薦結(jié)果的精準(zhǔn)性。
高校畢業(yè)生就業(yè)網(wǎng)絡(luò)信息服務(wù)模式是一個綜合性的服務(wù)系統(tǒng),除了需要專業(yè)的技術(shù)支持之外,還需要從豐富就業(yè)資源、改進(jìn)信息技術(shù)、完善就業(yè)指導(dǎo)體系、 加強(qiáng)就業(yè)信息服務(wù)隊(duì)伍建設(shè)、擴(kuò)大機(jī)構(gòu)合作等五個方面提供相應(yīng)的保障機(jī)制。
(1)高質(zhì)量的就業(yè)信息資源。 傳統(tǒng)就業(yè)信息服務(wù)模式已經(jīng)不能滿足高校畢業(yè)生的就業(yè)需求,要構(gòu)建滿足不同學(xué)歷層次的畢業(yè)生就業(yè)信息資源庫,同時對就業(yè)信息進(jìn)行細(xì)化分類,形成橫向和縱向布局、 專業(yè)和愛好交叉的信息分類模式。加強(qiáng)對異構(gòu)就業(yè)資源信息庫的統(tǒng)一化管理,對各類數(shù)據(jù)資源進(jìn)行標(biāo)準(zhǔn)化、規(guī)范化處理,更好實(shí)現(xiàn)就業(yè)信息資源的最優(yōu)化配置。
(2)改進(jìn)個性化的信息服務(wù)技術(shù)。 要充分利用信息過濾技術(shù)、移動互聯(lián)網(wǎng)、云計(jì)算技術(shù)、WEB數(shù)據(jù)挖掘技術(shù)、 大數(shù)據(jù)分析等智能信息技術(shù),針對大學(xué)生就業(yè)網(wǎng)絡(luò)信息服務(wù)實(shí)際需求,改進(jìn)就業(yè)網(wǎng)絡(luò)信息服務(wù)模式,優(yōu)化個性化推薦引擎和推薦策略,不斷提高大學(xué)生對個性化就業(yè)信息服務(wù)的滿意度。
(3)完善高校畢業(yè)生就業(yè)指導(dǎo)體系。 各個高校要重視大學(xué)生職前培訓(xùn),加強(qiáng)學(xué)校和學(xué)生之間的聯(lián)系, 更多地獲取大學(xué)生的各種就業(yè)需求,進(jìn)一步了解當(dāng)前大學(xué)生在就業(yè)、擇業(yè)過程中面臨的各種實(shí)際問題。 將專業(yè)知識與企業(yè)崗位技能需求之間的關(guān)系進(jìn)行重新梳理,一方面可以通過優(yōu)化高校課程體系及培養(yǎng)方案,更高效地為企業(yè)培養(yǎng)各種急需人才,另一方面,通過收集各類畢業(yè)生就業(yè)信息數(shù)據(jù),更好地優(yōu)化就業(yè)網(wǎng)絡(luò)信息服務(wù)模式, 進(jìn)而更好地完善高校畢業(yè)生的就業(yè)服務(wù)體系。
(4)加強(qiáng)就業(yè)信息服務(wù)隊(duì)伍建設(shè)。 就業(yè)信息服務(wù)隊(duì)伍建設(shè)也是確保就業(yè)信息服務(wù)模式順利開展的重要環(huán)節(jié),要建立不同技術(shù)水平和服務(wù)能力的就業(yè)信息服務(wù)人員梯隊(duì),圍繞大學(xué)生就業(yè)信息實(shí)際需求,形成技術(shù)開發(fā)、需求調(diào)研、培訓(xùn)管理為一體的初級、中級、高級三類人才體系。 只有不斷加強(qiáng)技術(shù)人才儲備,定期開展技術(shù)交流和業(yè)務(wù)培訓(xùn),才能不斷完善技術(shù)服務(wù)水平,應(yīng)對來自不同層面的競爭和壓力,為高校畢業(yè)生就業(yè)信息服務(wù)提供更為滿意的服務(wù)。
(5)擴(kuò)大機(jī)構(gòu)合作共享。 為提高推薦模型的精準(zhǔn)度,還需要提供更多的學(xué)習(xí)樣本數(shù)據(jù),這就要求不同的就業(yè)信息服務(wù)平臺、服務(wù)機(jī)構(gòu)和各個高校要打破界限,加強(qiáng)合作交流,提供更多的就業(yè)信息數(shù)據(jù)和職位需求信息, 提高資源利用率。另外,在不斷增加數(shù)據(jù)資源數(shù)量的同時,還要確保數(shù)據(jù)的質(zhì)量,制訂標(biāo)準(zhǔn)化的數(shù)據(jù)格式,提高數(shù)據(jù)的有效性。
在本課題的研究過程中, 通過問卷調(diào)查、門戶網(wǎng)站調(diào)研、高校走訪等方式,明確高校畢業(yè)生的就業(yè)網(wǎng)絡(luò)信息服務(wù)需求。 利用云計(jì)算架構(gòu)、大數(shù)據(jù)分析等技術(shù), 釆用自頂向下的分層設(shè)計(jì)思想, 優(yōu)化高校畢業(yè)生就業(yè)網(wǎng)絡(luò)信息服務(wù)模式,提出個性化推薦算法來彌補(bǔ)當(dāng)前就業(yè)信息服務(wù)中求職用戶與就業(yè)信息不匹配問題,為個性化推薦系統(tǒng)在就業(yè)信息服務(wù)領(lǐng)域的應(yīng)用作參考,進(jìn)而為就業(yè)信息實(shí)現(xiàn)精準(zhǔn)化推薦服務(wù)提供解決思路。
該服務(wù)模式運(yùn)用大數(shù)據(jù)分析技術(shù)挖掘就業(yè)相關(guān)數(shù)據(jù)的潛在價值,將大數(shù)據(jù)相關(guān)技術(shù)應(yīng)用于高校就業(yè)工作,能夠更好地分析人才市場供需不匹配的現(xiàn)象,為高校畢業(yè)生個性化就業(yè)指導(dǎo)提供更加客觀、科學(xué)、準(zhǔn)確的數(shù)據(jù)、算法和模型支撐,為畢業(yè)生提供精準(zhǔn)化的就業(yè)推薦和就業(yè)指導(dǎo)服務(wù),進(jìn)而提高就業(yè)工作服務(wù)質(zhì)量和效率。