吳曉玲,姜靈敏,張連堂,阿拉拇,吳廣裕
(廣州商學(xué)院 信息與技術(shù)工程學(xué)院,廣東 廣州 511363)
當(dāng)前高校人才培養(yǎng)存在教學(xué)內(nèi)容與社會需求脫節(jié)、學(xué)生知識鏈碎片化、學(xué)生知識內(nèi)化低效化等問題。傳統(tǒng)的專業(yè)知識學(xué)習(xí)領(lǐng)域確定,更多依靠學(xué)科帶頭人個人或?qū)I(yè)建設(shè)團隊主觀的經(jīng)驗與感受,即停留在采用“拍腦袋”式粗放型決策方法,專業(yè)課程體系設(shè)計質(zhì)量由個人知識水平與直觀感受決定,其客觀性、系統(tǒng)性、合理性等方面令人置疑。
大數(shù)據(jù)技術(shù)的發(fā)展,使得各種與“教學(xué)”相關(guān)的數(shù)據(jù)成為高校辦學(xué)的“生產(chǎn)資料”。大數(shù)據(jù)技術(shù)應(yīng)用到高校辦學(xué)“需求預(yù)測”“過程監(jiān)控”“就業(yè)反饋”等各個環(huán)節(jié),對數(shù)據(jù)有“完備性”“連續(xù)性”“實時性”“價值性”等多個方面的要求。高校專業(yè)課程體系設(shè)計這一人才培養(yǎng)的基本工作,針對企業(yè)人才需求預(yù)測、行業(yè)發(fā)展動態(tài)、行業(yè)知識領(lǐng)域、崗位類別、核心知識域等課程設(shè)置共性問題,大數(shù)據(jù)技術(shù)已能在一定程度上輔助決策者較為全面、客觀、可靠地進行課程體系設(shè)計。
綜觀各高校專業(yè)課程體系設(shè)計,其內(nèi)容一般包括專業(yè)知識和能力要求兩大方面。對一個專業(yè)課程體系進行設(shè)計,其實就是為學(xué)生設(shè)計其行業(yè)領(lǐng)域知識樹與對應(yīng)的知識運用能力。把行業(yè)領(lǐng)域問題的出現(xiàn)到解決,看成一個知識應(yīng)用過程,對整個周期各環(huán)節(jié)對應(yīng)的知識進行構(gòu)建與還原,是一種較為全面、系統(tǒng)地構(gòu)建專業(yè)課程體系的方法,這種方法在企業(yè)管理、軟件工程等領(lǐng)域的應(yīng)用已較為廣泛與成熟。應(yīng)用型人才培養(yǎng)強調(diào)知識應(yīng)用于解決行業(yè)領(lǐng)域問題,因此,“領(lǐng)域問題具有生命周期”理念下設(shè)計的課程體系與能力框架,對“工程類”專業(yè)應(yīng)用型人才培養(yǎng)課程體系構(gòu)建具有普遍適用性。
利用大數(shù)據(jù)技術(shù)構(gòu)建課程體系框架,其核心與首要任務(wù)是構(gòu)造專業(yè)課程知識鏈[1]。知識的推動過程對應(yīng)解決行業(yè)領(lǐng)域問題的流程,每個流程對知識的運用要求具備相關(guān)能力,即在解決行業(yè)領(lǐng)域問題這一過程驅(qū)動下,形成相應(yīng)的能力要求鏈,并據(jù)此要求具備相應(yīng)的知識模塊要求,其構(gòu)造的流程如圖1 所示。
圖1 課程體系構(gòu)建過程
該課程體系框架背后實質(zhì)上需要解決以下幾個問題:解決的是什么行業(yè)領(lǐng)域的問題[2],該行業(yè)的人才需求狀況如何?該行業(yè)領(lǐng)域問題處理的一般流程是什么?每個處理流程、能力模塊、課程模塊如何對應(yīng)轉(zhuǎn)換?如何將課程框架具體實施于教學(xué)環(huán)節(jié)以達到專業(yè)培養(yǎng)目標(biāo)?
整個課程體系框架設(shè)計,其主要研究重點有二:①如何更科學(xué)合理地確定專業(yè)培養(yǎng)的方向?應(yīng)用型人才培養(yǎng)更著眼于面向社會需求,與社會需求對接,專業(yè)方向的設(shè)置有緊跟前沿、潛力巨大等特點。對于個人職業(yè)生涯規(guī)劃而言,專業(yè)方向設(shè)置傾向于選擇熱門行業(yè)。熱門行業(yè)一般具有較好的就業(yè)前景,在個人福利待遇、升職空間、專業(yè)發(fā)展等方面往往具備競爭優(yōu)勢,并且一般也為人才匱乏重災(zāi)區(qū)。②作為課程框架主要內(nèi)容的能力模塊與課程模塊,如何由相應(yīng)的處理流程聯(lián)系導(dǎo)出?從整體上看,整個行業(yè)領(lǐng)域問題可以拆解為多個處理流程。處于不同業(yè)務(wù)階段的流程,人認(rèn)識對象的內(nèi)容與層次,應(yīng)用的方法與工具,思維過程是不一樣的。相應(yīng)地,人處在不同階段的能力要求也就不一樣。課程知識模塊主要由確定認(rèn)識對象、掌握改造方法、使用改造工具等方面構(gòu)成,而相應(yīng)的能力要求則是由人對課程知識模塊各組件的認(rèn)知、固化、擴展與應(yīng)用等學(xué)習(xí)過程組成的綜合訓(xùn)練。由此,可推導(dǎo)出每個處理流程、能力模塊、課程模塊之間的轉(zhuǎn)換規(guī)則。基于大數(shù)據(jù)技術(shù)的課程體系設(shè)計,就是利用大數(shù)據(jù)技術(shù)對網(wǎng)絡(luò)招聘信息進行處理與提取,從中找到各個流程階段對應(yīng)的學(xué)習(xí)知識、工具、能力方面的信息。
課程體系框架的實現(xiàn)路徑即可用數(shù)據(jù)分析與挖掘技術(shù)來設(shè)計與實現(xiàn)[3]。如此一來,此問題即為通過對網(wǎng)絡(luò)招聘信息分析與挖掘,“了解行業(yè)人才需求狀況”與“獲知行業(yè)領(lǐng)域知識能力結(jié)構(gòu)”這兩大子問題。
行業(yè)人才需求狀況分析,從求職者就業(yè)關(guān)心的角度來看,可以從企業(yè)需求概況、熱門需求、需求走向、擇業(yè)因素關(guān)聯(lián)分析等角度探討。
1)統(tǒng)計分析人才需求概況,獲取人才需求整體狀況。
此分析可以從行業(yè)招聘整體情況、職位招聘情況等方面分析。部分分析思路可參考圖2和圖3。
2)分析熱門的行業(yè)、職位、地域等信息,是行業(yè)人才需求分析的重要內(nèi)容。
熱門行業(yè)、熱門城市、熱門職位等對象,一般是高校專業(yè)建設(shè)與大學(xué)生個人就業(yè)最先關(guān)心的問題之一。熱門是個綜合性的概念,一個城市是否是熱門城市,要綜合考慮該城市各種不同規(guī)模企業(yè)的構(gòu)成、企業(yè)發(fā)展階段、人才需求量、平均工資水平等方面的因素。對于熱門城市、熱門行業(yè)的定義,均可從以上幾個維度進行綜合評估,在此可采用主成分分析法將相關(guān)變量轉(zhuǎn)換成互不相關(guān)的主成分來衡量,并獲取主成分得分,根據(jù)得分排名確定熱門“城市”與“行業(yè)”等。對熱門城市的分析結(jié)果見表1。
圖2 人才需求量排行前10 行業(yè)薪資對比
圖3 大數(shù)據(jù)職位月薪對比
按照以上方法,可同時對熱門行業(yè)、熱門職位進行分析,獲取更全面的熱門就業(yè)信息。
3)分析擇業(yè)因素關(guān)聯(lián)性。
每個求職者在求職時考慮的著重點可能不大一樣。招聘信息關(guān)聯(lián)性分析,對專業(yè)人才培養(yǎng)層次、人才培養(yǎng)服務(wù)輸出區(qū)域等目標(biāo)的定位,具有一定參考價值。此方面信息的獲悉,可用關(guān)聯(lián)規(guī)則實現(xiàn)。從就業(yè)關(guān)注焦點看,對企業(yè)招聘要求與相關(guān)待遇等招聘因素之間的關(guān)系挖掘,可以為其學(xué)校人才輸出服務(wù)區(qū)域定位、學(xué)生簡歷投放對象選取等問題提供參考。考慮到關(guān)聯(lián)挖掘的數(shù)據(jù)是為高校專業(yè)建設(shè)及大學(xué)生就業(yè)提供決策信息,應(yīng)屆大學(xué)生具有無工作經(jīng)驗、優(yōu)先考慮經(jīng)濟較發(fā)達地區(qū)就業(yè)、起步工資期望高等特點,因此,可以從大數(shù)據(jù)相關(guān)職位招聘數(shù)據(jù)里計算結(jié)果篩選出符合以上部分要求的規(guī)則。例如,要求平均月薪在10k 至15k(k 表示千元)的規(guī)則計算結(jié)果如下:
表1 熱門城市排序
月薪10k 至15k 對于應(yīng)屆畢業(yè)生很多人來說算是高薪,綜合以上計算結(jié)果可知,要拿到這樣的高薪,可能要在一線城市就職,求職者學(xué)歷要本科以上,且工作經(jīng)驗要求為1~3 年。同理,可做出類似“要求工作地點在一線城市”符合求職者預(yù)期的關(guān)聯(lián)分析。
2.2.1 專業(yè)能力—課程結(jié)構(gòu)分析原理
1)專業(yè)能力—課程結(jié)構(gòu)的關(guān)系是課程體系設(shè)計的基本框架。
由上可知,以培養(yǎng)實踐能力為導(dǎo)向的應(yīng)用型課程體系框架,由3 條主線構(gòu)成,分別為業(yè)務(wù)階段流程鏈、能力構(gòu)成鏈、課程模塊鏈。其中,業(yè)務(wù)階段流程鏈可由該領(lǐng)域?qū)<姨峁﹨⒖?,而能力?gòu)成鏈與課程模塊鏈內(nèi)容的設(shè)計,涉及專業(yè)能力與課程之間關(guān)系的探索與研究。由于教學(xué)傳授知識的形式主要是課程,因此,專業(yè)能力與課程內(nèi)容之間的關(guān)系,即為專業(yè)能力與知識之間關(guān)系的探討。目前,學(xué)者普遍認(rèn)為知識是形成能力的基礎(chǔ),而能力是學(xué)習(xí)知識的目的。能力分為認(rèn)識能力與實踐能力。將課程劃分為認(rèn)知層與應(yīng)用層,認(rèn)知層側(cè)重于對領(lǐng)域相關(guān)概念、原理、方法的了解與掌握,而實踐層側(cè)重于以培養(yǎng)專業(yè)實踐能力為目的。知識向認(rèn)識能力轉(zhuǎn)換主要是心理過程,知識從認(rèn)識能力向?qū)嵺`能力轉(zhuǎn)換是心理過程與人肢體活動過程的統(tǒng)一。實踐能力習(xí)得經(jīng)常需要借助個體之外的外部工具與環(huán)境。該轉(zhuǎn)換過程如圖4 所示。
因此,整個課程體系框架按照業(yè)務(wù)處理流程與知識—能力的結(jié)構(gòu)關(guān)系設(shè)計,如圖5 所示,每一個業(yè)務(wù)階段對人的專業(yè)能力要求包括認(rèn)知能力與實踐能力,同時對應(yīng)著有相應(yīng)的認(rèn)知層與實踐層知識結(jié)構(gòu)要求。認(rèn)知層的課程目標(biāo),在教學(xué)上表現(xiàn)為對該業(yè)務(wù)階段相關(guān)概念、原理等知識的理解與掌握,而實踐層的課程側(cè)重對該業(yè)務(wù)階段所需實踐與創(chuàng)新應(yīng)用能力的培養(yǎng)。
2)“崗位描述”信息是獲知“專業(yè)能力—課程結(jié)構(gòu)”關(guān)系的重要數(shù)據(jù)源。
與業(yè)務(wù)階段對應(yīng)的每種職位類別,其“崗位描述”信息往往是該類別職位相關(guān)的業(yè)務(wù)能力信息。與將所有職位崗位描述數(shù)據(jù)進行分析比較,按職位類別分析可為課程設(shè)計篩選出關(guān)聯(lián)性更強的數(shù)據(jù)源,并計算出更精確的業(yè)務(wù)階段—能力—課程鏈關(guān)系數(shù)據(jù)。
3)利用LDA 主題模型求解“專業(yè)能力—課程結(jié)構(gòu)”關(guān)系。
LDA 模型的主要功能是提取可以理解、相對穩(wěn)定的潛在語義結(jié)構(gòu)。每一條“崗位描述”數(shù)據(jù)蘊含該職位的多個“能力”要求,每一種能力往往總是與一些詞匯同時出現(xiàn)。把每一條“崗位描述”等同于每一篇文檔,每一種專業(yè)能力即代表一個“主題”,“主題”由一系列的主題詞組合而成。根據(jù)計算生成的若干“主題”,即代表著該行業(yè)領(lǐng)域知識的相關(guān)職位能力。最后,對這些“主題”進行手工提煉與總結(jié),然后根據(jù)能力與課程的層次關(guān)系,可進一步歸類到認(rèn)知層與應(yīng)用層。
圖4 課程與能力的轉(zhuǎn)換關(guān)系
圖5 課程體系框架設(shè)計思路
2.2.2 專業(yè)能力—課程結(jié)構(gòu)數(shù)據(jù)分析流程設(shè)計
綜上所述,專業(yè)能力—課程結(jié)構(gòu)推導(dǎo)過程,主要包括“計算能力主題”與“能力—課程結(jié)構(gòu)轉(zhuǎn)換”兩大階段。第一階段“計算能力主題”的主要流程如下:首先將職位按對應(yīng)的“業(yè)務(wù)階段”關(guān)系進行歸類劃分,根據(jù)劃分結(jié)果對每種職位類別的“崗位描述”文本數(shù)據(jù)采用自然語言處理技術(shù)進行預(yù)處理,如數(shù)字與標(biāo)點符號去除、分詞處理、停止詞過濾等,同時,應(yīng)用LDA 主題模型,對處理過后的崗位描述進行“能力”主題模型挖掘。在詞頻統(tǒng)計時,將與“工具”相關(guān)的文本進行分析,找出熱門技術(shù),可為實踐教學(xué)工具選取提供參考依據(jù)。
第二階段為“能力—課程結(jié)構(gòu)轉(zhuǎn)換”。利用LDA 模型,對其中的主題數(shù)經(jīng)過多次參數(shù)計算,以獲得相對獨立、主題較突出的若干個“能力”主題,然后再對這些主題進行人工提煉并按認(rèn)知能力與實踐能力進行分類。最后,將各業(yè)務(wù)階段的能力要求按認(rèn)知層與應(yīng)用層進行劃分,并按課程內(nèi)容形式(概念原理類、案例工具類等)輔助設(shè)置對應(yīng)的課程。
2.3.1 LDA 模型計算“能力”主題
從劃分結(jié)果看,數(shù)據(jù)采集工程師、數(shù)據(jù)平臺/倉庫工程師、數(shù)據(jù)算法工程師、數(shù)據(jù)分析師,這幾種職位分別對應(yīng)著數(shù)據(jù)采集、數(shù)據(jù)收集存儲管理、數(shù)據(jù)建模、數(shù)據(jù)分析這幾個數(shù)據(jù)處理階段,而數(shù)據(jù)可視化工程師、數(shù)據(jù)產(chǎn)品經(jīng)理等職位則偏重于數(shù)據(jù)與業(yè)務(wù)應(yīng)用的結(jié)合。
1)職位類別劃分。
如前所述,大數(shù)據(jù)技術(shù)在行業(yè)領(lǐng)域問題處理時,其基本流程為確定業(yè)務(wù)目標(biāo)、數(shù)據(jù)采集、數(shù)據(jù)提取轉(zhuǎn)換與加載管理、數(shù)據(jù)處理與建模分析、數(shù)據(jù)解釋與應(yīng)用這幾大基本階段。數(shù)據(jù)科學(xué)與大數(shù)據(jù)應(yīng)用技術(shù)專業(yè)的課程框架如圖6 所示,其中,“?”表示在利用LDA 模型計算前尚未確定的相關(guān)內(nèi)容。
圖6 數(shù)據(jù)科學(xué)與大數(shù)據(jù)應(yīng)用技術(shù)專業(yè)課程框架
按照專業(yè)能力—課程結(jié)構(gòu)數(shù)據(jù)分析流程設(shè)計,需將招聘職位根據(jù)大數(shù)據(jù)技術(shù)應(yīng)用流程進行分類,同時,對異名同工的職位統(tǒng)一命名,實現(xiàn)職位類別劃分。根據(jù)對職位名稱與對應(yīng)崗位描述的研究,職位劃分方法與歸類見表2。
表2 大數(shù)據(jù)部分職位劃分方法與歸類結(jié)果
2)詞頻統(tǒng)計。
對每種職位類別的崗位描述進行分詞,并對高頻詞進行統(tǒng)計,可以幫助對該職位的核心技能有整體認(rèn)識。從上面的詞云圖中,可知數(shù)據(jù)采集工程師的職位有工作經(jīng)驗要求,同時,該類別職位與網(wǎng)頁技術(shù)、網(wǎng)絡(luò)協(xié)議、爬蟲開發(fā)、算法設(shè)計等知識有密切聯(lián)系。由于數(shù)據(jù)采集需要借用計算機語言來實現(xiàn),而這些語言通常用英文表示,因此,將數(shù)據(jù)采集類職位的崗位描述信息里的英文字母提取并進行詞頻統(tǒng)計詞云圖可獲知,用于數(shù)據(jù)采集的熱門技術(shù)工具有Python、Java、MySql等,而html、CSS、http、xpath 等網(wǎng)絡(luò)知識,是數(shù)據(jù)采集工程師必備知識體系。同理,可將其他相關(guān)職位進行詞頻統(tǒng)計。
3)模型計算。
按照LDA 主題模型計算步驟,分別對每種職位類別構(gòu)建語料庫、構(gòu)造崗位描述—詞匯矩陣并進行LDA 模型計算,可得到該職位類別相關(guān)的“能力”主題。在此,以“數(shù)據(jù)采集工程師”計算的結(jié)果舉例說明。LDA 計算出來的每一個Topic 即代表著該職位類別的某一種能力。這些能力代表的主題由相關(guān)的詞匯集合組成,需要進一步加工提煉。
2.3.2 能力—課程結(jié)構(gòu)轉(zhuǎn)換實現(xiàn)
1)主題提煉。
將LDA 主題模型計算結(jié)果進一步加工提煉,以上6 個主題分別為熟悉網(wǎng)絡(luò)、網(wǎng)頁原理;具備數(shù)據(jù)抓取經(jīng)驗;掌握J(rèn)ava(數(shù)據(jù)采集語言工具);提供職位福利待遇;熟悉數(shù)據(jù)采集協(xié)議;熟悉數(shù)據(jù)結(jié)構(gòu)與算法。
2)能力分類。
提供職位福利待遇屬于崗位薪資福利問題,可以剔除。根據(jù)能力的層次結(jié)構(gòu),剩下的5 個能力中屬于認(rèn)知能力的有熟悉網(wǎng)絡(luò)網(wǎng)頁原理、熟悉數(shù)據(jù)采集協(xié)議、熟悉數(shù)據(jù)結(jié)構(gòu)與算法。屬于實踐能力要求的主題有數(shù)據(jù)采集語言工具、數(shù)據(jù)抓取經(jīng)驗。
3)課程設(shè)計。
結(jié)合劃分好的認(rèn)知能力與實踐能力,可進一步設(shè)計對應(yīng)教學(xué)內(nèi)容,形成該職位人才的知識結(jié)構(gòu)框架。例如,數(shù)據(jù)采集工程師其能力—課程結(jié)構(gòu)經(jīng)過轉(zhuǎn)換后,結(jié)果如圖7 所示。
按照以上數(shù)據(jù)采集工程師的能力—課程結(jié)構(gòu)轉(zhuǎn)換方法,分別得到其他職位類別的能力—課程結(jié)構(gòu)信息,見表3。
圖7 數(shù)據(jù)采集工程師能力—課程結(jié)構(gòu)關(guān)系轉(zhuǎn)換結(jié)果
表3 數(shù)據(jù)部分職位“能力—課程結(jié)構(gòu)”關(guān)系轉(zhuǎn)換結(jié)果
從表3 中可以看出,每一種職位對人才知識結(jié)構(gòu)要求的側(cè)重點有所不同,個別職位之間存在交叉。高校應(yīng)用型數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)人才培養(yǎng),可以根據(jù)學(xué)校目標(biāo)定位重點培養(yǎng)其中的某1~2 種職位類別的人才,以這些類別的能力要求與課程內(nèi)容作為人才培養(yǎng)方案,也可以對學(xué)生進行全方位的大數(shù)據(jù)通才培養(yǎng),對這些職位的相關(guān)課程進行整合。
通過大數(shù)據(jù)應(yīng)用技術(shù)對網(wǎng)絡(luò)招聘數(shù)據(jù)分析,提出的按職位類別進行人才能力培養(yǎng)與課程內(nèi)容設(shè)計的思路,可為高校應(yīng)用型人才培養(yǎng)課程體系設(shè)計提供可模仿借鑒的方法;同時,該方法在實施過程中,存在專業(yè)適用差異性[4]。人才能力—課程結(jié)構(gòu)框架設(shè)計方法,相比歷史學(xué)、語言學(xué)等專業(yè)來說,對于工程類專業(yè)如石油工程、冶金工程、交通工程、制藥工程等具備行業(yè)工藝處理流程的專業(yè),具有更好的借鑒意義。網(wǎng)絡(luò)招聘信息的采集工作耗時,受計算機計算能力、網(wǎng)絡(luò)招聘信息的時效性、樣本數(shù)量呈規(guī)模等約束條件影響,網(wǎng)絡(luò)招聘信息采集任務(wù)需要持續(xù)一段時間才能完成。數(shù)據(jù)處理與分析是半自動化過程,為了使計算結(jié)果更準(zhǔn)確,對網(wǎng)絡(luò)招聘信息進行預(yù)處理與建模時,需要有行業(yè)專家的參與建議。另外,人才培養(yǎng)方案設(shè)計思路并未提及具體教學(xué)實施過程,更側(cè)重為高校應(yīng)用型人才培養(yǎng)方案框架設(shè)計提供切實可行方法,按職位要求設(shè)計人才對應(yīng)知識塊,注重知識層次培養(yǎng)與知識內(nèi)部前后聯(lián)系[5]。綜上所述,未來可進一步從數(shù)據(jù)源采集工作易操作性、如何利用大數(shù)據(jù)技術(shù)指導(dǎo)應(yīng)用型人才培養(yǎng)實施環(huán)節(jié)等方面予以改進與探索。