周留軍 王靖
摘要:高職畢業(yè)生的就業(yè)情況是高職教育發(fā)展的關(guān)鍵,通過(guò)對(duì)高職院校的就業(yè)數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)有用的信息以提高高職院校畢業(yè)生的就業(yè)水平是非常必要的。文中用徐州建筑學(xué)院的教務(wù)系統(tǒng)和就業(yè)管理系統(tǒng)的數(shù)據(jù)作為研究對(duì)象,以學(xué)生培養(yǎng)和就業(yè)指導(dǎo)作為研究目的,通過(guò)對(duì)學(xué)生成績(jī)、課程設(shè)置、專業(yè)設(shè)置、就業(yè)數(shù)據(jù)的挖掘找到了影響學(xué)生就業(yè)的若干因素。
關(guān)鍵詞:高職教育;就業(yè);數(shù)據(jù)挖掘
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)15-3505-05
Based on Data Mining Study on Employment Situation of Higher Vocational Students
ZHOU Liu-jun1, WANG Jing2
(1.Jiangsu Jianzhu Institute, Xuzhou 221116, China; 2. Xuzhou Institute of Technology ,Xuzhou 221008, China)
Abstract: The employment situation of graduates from higher vocational colleges is the key to the development of higher vocational educa tion, through the analysis of data on employment of higher vocational college, finding useful information in order to improve the level of employment of the graduates in higher vocational colleges is very necessary. Xuzhou College of architecture research on educational sys tems and employment management system data as objects, to career guidance for students and for research purposes, by setting on student achievement, curriculum, professional, employment data mining to find the factors influencing the employment of students.
Key words: higher occupation education, obtain employment, data mining
在就業(yè)形勢(shì)日益嚴(yán)峻的今天,高職畢業(yè)生的就業(yè)情況是高職教育發(fā)展的關(guān)鍵,很多高職院校在學(xué)生就業(yè)研究和管理上都投入了大量的人力和物力[3],然而面對(duì)招生規(guī)模的擴(kuò)大、在校生人數(shù)的增多,高校學(xué)生就業(yè)管理工作日趨繁重、復(fù)雜。在高校學(xué)生就業(yè)管理工作中需要處理大量的數(shù)據(jù),這些信息之間彼此存在千絲萬(wàn)縷的聯(lián)系,同時(shí)也隱含著一些重要信息。海量信息給人們帶來(lái)方便的同時(shí)也帶來(lái)了問(wèn)題:信息過(guò)量,難以消化;形式不一致,難以統(tǒng)一處理;技術(shù)條件限制,安全難以保證;數(shù)據(jù)欠規(guī)范,真假難以辨識(shí)等。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校學(xué)生就業(yè)研究和管理領(lǐng)域,把這些重要的信息從數(shù)據(jù)庫(kù)中抽取出來(lái),可以為招生、教務(wù)等部門提供具有價(jià)值的信息,同時(shí)為校學(xué)生就業(yè)研究和管理人員提供有力的信息支持和工作指導(dǎo)。
1數(shù)據(jù)準(zhǔn)備
本課題的原始數(shù)據(jù)資料來(lái)源于徐州建筑學(xué)院的教務(wù)系統(tǒng)和就業(yè)管理系統(tǒng),收集了畢業(yè)生資料20107個(gè)。利用SQL Server 2005的外部數(shù)據(jù)導(dǎo)入功能將數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù),并根據(jù)需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,主要包括:數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)消減。原始數(shù)據(jù)資料如表1到表3所示。
表1學(xué)生成績(jī)數(shù)據(jù)表
2數(shù)據(jù)挖掘模型分析
2.1學(xué)生基本素質(zhì)與就業(yè)的關(guān)系
本研究認(rèn)為,學(xué)生的就業(yè)與學(xué)生本身的基本素質(zhì)有極大的關(guān)系,例如學(xué)生在校學(xué)習(xí)成績(jī)、外語(yǔ)水平、計(jì)算機(jī)水平、實(shí)踐能力、職業(yè)資格等級(jí)、社會(huì)工作經(jīng)驗(yàn)等都會(huì)影響到學(xué)生的就業(yè)。由于收集到的數(shù)據(jù)有限,我們?cè)趯W(xué)生成績(jī)記錄和學(xué)生基本信息中提?。赫n程成績(jī)、外語(yǔ)水平、計(jì)算機(jī)水平幾項(xiàng)作為數(shù)據(jù)挖掘的屬性來(lái)發(fā)現(xiàn)這些因素和就業(yè)之間的關(guān)系。
1)學(xué)生課程成績(jī)以“必修”類課程作為研究對(duì)象
2)外語(yǔ)水平以英語(yǔ)CET成績(jī)?yōu)闃?biāo)準(zhǔn),計(jì)算機(jī)水平以PRET成績(jī)?yōu)闃?biāo)準(zhǔn)3)采用關(guān)聯(lián)規(guī)則結(jié)合決策樹作為數(shù)據(jù)挖掘的方法,利用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)形如以下形式的信息:概率=0.688支持度=0.068建筑構(gòu)造1 =良好,建筑制圖與AUTOCAD2 =良好-> DWXZ = D2
2.2課程設(shè)置與就業(yè)關(guān)系
最近業(yè)界經(jīng)常提出:大學(xué)生就業(yè)難與大學(xué)課程設(shè)置有關(guān)。很多大學(xué)專業(yè)課程設(shè)置和社會(huì)脫節(jié)嚴(yán)重,在一定程度上造成了一些畢業(yè)生就業(yè)困難。通過(guò)對(duì)挖掘的各學(xué)科課程設(shè)置信息數(shù)據(jù)建立一個(gè)量的模型,在此基礎(chǔ)上進(jìn)行分析、歸納和總結(jié),按照課程的性質(zhì)將其劃分、歸類到相應(yīng)的分類模式中,將課程設(shè)置劃分方案概括到某個(gè)給定的范圍,我們可以把專業(yè)課分為專業(yè)基礎(chǔ)課和專業(yè)技術(shù)課,專業(yè)技術(shù)課又分為理論性較強(qiáng)的課程和實(shí)踐性較強(qiáng)的課程。
1)以專業(yè)技術(shù)課為研究對(duì)象
2)主要研究專業(yè)技術(shù)課對(duì)就業(yè)層次的影響3)采用聚類分析作為數(shù)據(jù)挖掘的方法
2.3人才需求趨勢(shì)
人才需求分析的主要任務(wù)是發(fā)現(xiàn)專業(yè)類型和學(xué)制與就業(yè)之間的關(guān)系,根據(jù)不同專業(yè)、不同學(xué)制學(xué)生的就業(yè)情況。進(jìn)行人才需求趨勢(shì)分析可以對(duì)人才需求信息的變化作出快速反應(yīng),為學(xué)校培養(yǎng)出更加符合社會(huì)發(fā)展的高素質(zhì)人才提供信息支持,有利于學(xué)校進(jìn)行合理的專業(yè)設(shè)置和招生、培養(yǎng)計(jì)劃。
本研究采用關(guān)聯(lián)分析的挖掘方法,試圖得出如下形式的結(jié)果:
概率=0.775重要性=0.115 ZYMC =電子商務(wù),XZ = 3 -> DWXZ = D2
表4學(xué)生必修課成績(jī)與就業(yè)關(guān)系關(guān)聯(lián)規(guī)則
3數(shù)據(jù)挖掘結(jié)果及分析
3.1學(xué)生基本素質(zhì)與就業(yè)的關(guān)系
通過(guò)對(duì)學(xué)生必修課成績(jī)和就業(yè)數(shù)據(jù)進(jìn)行挖掘,得到如表4所示的關(guān)聯(lián)規(guī)則;通過(guò)對(duì)學(xué)生各種等級(jí)證書數(shù)據(jù)和就業(yè)數(shù)據(jù)挖掘,得到表5所示的關(guān)聯(lián)規(guī)則。
用決策樹對(duì)學(xué)生成績(jī)和學(xué)生英語(yǔ)水平、計(jì)算機(jī)水平和學(xué)校獎(jiǎng)勵(lì)的數(shù)據(jù)同時(shí)進(jìn)行挖掘,得到如圖1。所示的結(jié)果;依賴強(qiáng)度由強(qiáng)到弱由表6所示。
分析以上結(jié)果,我們可以得出以下幾點(diǎn):1)高職學(xué)生就業(yè)單位主要集中在私人企業(yè)
從數(shù)據(jù)挖掘結(jié)果我們可以看出,高職學(xué)生的就業(yè)單位主要集中在中等和較差的D類企業(yè)(單位性質(zhì)集中在D2、D3的私人企業(yè)),這與學(xué)生本身素質(zhì)和社會(huì)對(duì)高職院校的認(rèn)可度有關(guān)。高職院校的學(xué)生入學(xué)時(shí)錄取門檻相對(duì)較低,高中起點(diǎn)的一般是高中學(xué)習(xí)成績(jī)不理想沒(méi)能考入普通高等學(xué)校學(xué)生,初中起點(diǎn)的大多是初中成績(jī)不太好并且對(duì)自己的今后的學(xué)習(xí)信心不足的學(xué)生。這些學(xué)生雖然在進(jìn)入高職院校后有一部分通過(guò)3-5年的學(xué)習(xí)自身素質(zhì)大大提高,有的學(xué)生走進(jìn)社會(huì)之后甚至表現(xiàn)比普通高等院校和名牌高校的學(xué)生更加優(yōu)秀。但是,由于社會(huì)上人們對(duì)待高職學(xué)生的觀念還沒(méi)有轉(zhuǎn)變,所以他們走出校園的第一份工作一般都集中在中等偏下的私人企業(yè)。
2)課程成績(jī)對(duì)就業(yè)產(chǎn)生一定影響
從表4我們可以看出課程成績(jī)對(duì)就業(yè)產(chǎn)生的影響。有些專業(yè)的某一門或某幾門成績(jī)明顯影響了學(xué)生的就業(yè)。例如建筑專業(yè)的專業(yè)課“建筑構(gòu)造”、“建筑制圖與AUTOCAD2”、“建筑施工”、“建筑施工組織與管理”等這幾門課成績(jī)良好以上的同學(xué)就業(yè)單位性質(zhì)在中等企業(yè)的概率達(dá)到65%以上。而課程成績(jī)只達(dá)到及格的學(xué)生就業(yè)單位性質(zhì)是D3的較多。這是由于一些就業(yè)單位認(rèn)為學(xué)生的學(xué)習(xí)成績(jī)可以從一定程度上反映學(xué)生的整體素質(zhì),在招聘時(shí),他們可能會(huì)偏向優(yōu)先考慮各科成績(jī)優(yōu)秀的學(xué)生。不過(guò)從數(shù)據(jù)挖掘結(jié)果可以看出,學(xué)生成績(jī)對(duì)就業(yè)的產(chǎn)生了一定的影響,但是這種影響并不是特別明顯。
3)英語(yǔ)水平、計(jì)算機(jī)水平和學(xué)院獎(jiǎng)勵(lì)學(xué)分對(duì)就業(yè)產(chǎn)生明顯影響。
表5顯示,學(xué)生的英語(yǔ)水平、計(jì)算機(jī)水平和學(xué)院獎(jiǎng)勵(lì)學(xué)分對(duì)就業(yè)產(chǎn)生了明顯影響。通過(guò)英語(yǔ)四六級(jí)并且得到過(guò)學(xué)院獎(jiǎng)勵(lì)學(xué)分的同學(xué)都找到了較好的工作;具有英語(yǔ)等級(jí)證書、計(jì)算機(jī)等級(jí)證書、學(xué)院獎(jiǎng)勵(lì)學(xué)分中的任兩個(gè)的同學(xué)大多數(shù)有較好的就業(yè)單位。所以,本研究認(rèn)為,英語(yǔ)、計(jì)算機(jī)的等級(jí)考試和其他證書并不像有些人所評(píng)論的那樣,對(duì)學(xué)生沒(méi)有什么作用,用人單位還是可以通過(guò)這些來(lái)看學(xué)生的各項(xiàng)水平的,學(xué)生的英語(yǔ)水平、計(jì)算機(jī)水平和學(xué)院獎(jiǎng)勵(lì)等相對(duì)于課程的考試成績(jī)來(lái)說(shuō)更被用人單位所看重。
3.2課程設(shè)置與就業(yè)的關(guān)系
通過(guò)對(duì)學(xué)生專業(yè)技術(shù)課的設(shè)置和就業(yè)層次進(jìn)行挖掘,得到如表7所示結(jié)果,學(xué)生的就業(yè)層次自動(dòng)聚合為5個(gè)分類:
分類1=86.6%E+9.5%B+3.7%C
分類2=65.0%D+30.1%E+4.9%C
分類3=80.2%B+19.7%E
分類4=85.7%D+14.2%B
分類1=53.4%E+40.1%D+6.5%C
表7學(xué)生課程設(shè)置與就業(yè)關(guān)系的聚類
分析以上結(jié)果,我們可以得出以下幾點(diǎn):
1)徐州建筑學(xué)院學(xué)生專業(yè)技術(shù)課程設(shè)置三年來(lái)變化并不明顯
從數(shù)據(jù)挖掘結(jié)果我們可以看出,徐州建筑學(xué)院學(xué)生的專業(yè)技術(shù)課主要設(shè)置了電動(dòng)機(jī)的單片機(jī)控制、電氣工程CAD、樓宇自動(dòng)化技術(shù)、機(jī)床數(shù)控技術(shù)、建筑供電、機(jī)電一體化原理這幾門課程,三年來(lái)課程設(shè)置變化不明顯。
2)課程設(shè)置對(duì)學(xué)生就業(yè)層次產(chǎn)生了一定的影響
從表6我們可以看出課程設(shè)置對(duì)就業(yè)產(chǎn)生了一定的影響。盡管各種就業(yè)層次出現(xiàn)在不同分類中,沒(méi)有獨(dú)立聚合為分類,但是通過(guò)分類間的對(duì)比還是可以發(fā)現(xiàn),不同就業(yè)層次在不同分類中的概率有明顯的偏向,一些就業(yè)層次以較高的概率和某些課程聚合成一類,這說(shuō)明,這些聚合在一類的就業(yè)層次和課程之間存在很大的共性,課程設(shè)置對(duì)就業(yè)層次產(chǎn)生了一定的影響。但是由于課程設(shè)置缺少變化,此數(shù)據(jù)源挖掘出的信息有較大的局限性,難以充分挖掘出課程設(shè)置對(duì)學(xué)生就業(yè)層次的影響。
3)高職院校的專業(yè)課程設(shè)置應(yīng)該與時(shí)俱進(jìn)。
隨著專業(yè)技術(shù)的不斷發(fā)展和社會(huì)需求的不斷變化,學(xué)校的專業(yè)課程設(shè)置應(yīng)該不斷的更新,以培養(yǎng)出更適合社會(huì)需要的專業(yè)人才。
3.3人才需求趨勢(shì)分析
人才需求趨勢(shì)分析主要找出學(xué)生所學(xué)專業(yè)和學(xué)制與就業(yè)之間的關(guān)系,通過(guò)對(duì)學(xué)生就業(yè)數(shù)據(jù)的挖掘,得到如表8所示的結(jié)果:
分析以上結(jié)果,我們可以得出以下幾點(diǎn):
1)學(xué)制對(duì)學(xué)生就業(yè)影響較大
高職院校學(xué)生的學(xué)制決定了學(xué)生的入學(xué)起點(diǎn)和畢業(yè)學(xué)歷,5年制學(xué)生是初中起點(diǎn)的大專學(xué)歷,從表中結(jié)果我們可以看出,這部分學(xué)生的就業(yè)單位明顯比高中起點(diǎn)的大專學(xué)歷學(xué)生差,主要集中在較差的私人企業(yè)。而4年制的本科學(xué)歷學(xué)生的就業(yè)情況和學(xué)制之間的關(guān)聯(lián)規(guī)則不明顯,并且有些專業(yè)的本科學(xué)歷學(xué)生的就業(yè)單位并不理想。由此可以看出,高職院校的學(xué)制中,3年制和5年制對(duì)學(xué)生的就業(yè)產(chǎn)生的影響較大,而4年制則沒(méi)有明顯影響。
2)專業(yè)對(duì)學(xué)生就業(yè)產(chǎn)生一定的影響,熱門專業(yè)并不一定好就業(yè)
從數(shù)據(jù)挖掘結(jié)果可以看出,不同專業(yè)之間學(xué)生的就業(yè)單位性質(zhì)有一定的區(qū)別,人們所普遍認(rèn)為的熱門專業(yè)由于社會(huì)需求量較大,應(yīng)用面廣,學(xué)生的就業(yè)面也較廣,單位應(yīng)該相對(duì)較好。例如電子類專業(yè),現(xiàn)在社會(huì)上此類公司數(shù)量多,發(fā)展快,較具規(guī)模,所以,這個(gè)專業(yè)成為學(xué)生報(bào)考的熱門專業(yè)。但是從就業(yè)數(shù)據(jù)挖掘結(jié)果來(lái)看,熱門專業(yè)學(xué)生的就業(yè)單位層次并不高于非熱門專業(yè),例如“計(jì)算機(jī)應(yīng)用與維護(hù)”、“通信工程”專業(yè),學(xué)生的就業(yè)單位性質(zhì)主要分布在D2和D3,即一般和較差的私企。而一些非熱門專業(yè),例如“公路與橋梁”、“工程監(jiān)理”、“資產(chǎn)評(píng)估”等專業(yè),學(xué)生的就業(yè)單位則多集中在D2,即一般私企。另外,有些專業(yè)如“建筑工程”、“建筑工程項(xiàng)目管理”等專業(yè),由于社會(huì)需求量較小,對(duì)專業(yè)和工作對(duì)口的要求較高,高職學(xué)生的競(jìng)爭(zhēng)力又明顯要輸于普通高等院校的畢業(yè)生。所以就業(yè)單位不太理想。
3)低期望值保證了高職學(xué)生的就業(yè)率
雖然高職院校的畢業(yè)生就業(yè)單位大多為私人企業(yè),并且集中在中低檔次,但是由于學(xué)生的期望值遠(yuǎn)遠(yuǎn)低于普通高等院校的學(xué)生,找工作時(shí)本著先就業(yè)后擇業(yè)的原則,保證了高職學(xué)生的就業(yè)率。從高職學(xué)生的就業(yè)數(shù)據(jù)來(lái)看,待就業(yè)的學(xué)生所占比例極少,這一點(diǎn)必將有利于高職教育的發(fā)展。
從以上數(shù)據(jù)挖掘結(jié)果可以看出,高職院校的專業(yè)開設(shè)不能盲目的追求熱門專業(yè)、高學(xué)歷。社會(huì)對(duì)高職院校的人才需求是中等學(xué)歷的,技能型的畢業(yè)生更受歡迎。
4結(jié)束語(yǔ)
通過(guò)對(duì)徐州建筑學(xué)院的教務(wù)系統(tǒng)和就業(yè)管理系統(tǒng)的數(shù)據(jù)進(jìn)行挖掘,我們得出以下結(jié)論:
1)學(xué)生在校的專業(yè)課成績(jī)對(duì)學(xué)生就業(yè)產(chǎn)生一定影響,而學(xué)生的英語(yǔ)水平和計(jì)算機(jī)水平以及學(xué)校獎(jiǎng)勵(lì)對(duì)學(xué)生的就業(yè)影響特別明顯。
2)專業(yè)課程設(shè)置在一定程度上影響學(xué)生的就業(yè)。
3)學(xué)制對(duì)學(xué)生就業(yè)影響較大,專業(yè)對(duì)學(xué)生就業(yè)產(chǎn)生一定的影響。
參考文獻(xiàn):
[1] Margaret H. Dunham.數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2005.
[2]滕廣青,毛英爽.國(guó)外數(shù)據(jù)挖掘應(yīng)用研究與發(fā)展分析[J].統(tǒng)計(jì)研究,2005(12):68-70.
[3]王偉鳴.教育信息的關(guān)聯(lián)規(guī)則挖掘[D].上海:上海海運(yùn)學(xué)院,2003.
[4]張海笑.數(shù)據(jù)挖掘分類技術(shù)在高校教學(xué)中的應(yīng)用研究[D].廣州:廣東工業(yè)大學(xué),2005.
[5]王欣,徐騰飛,唐連章.SQL Server 2005數(shù)據(jù)挖掘?qū)嵗治鯷M].北京:中國(guó)水利水電出版社,2008.
[6]員巧云,程剛.近年來(lái)我國(guó)數(shù)據(jù)挖掘研究綜述[J].情報(bào)學(xué)報(bào),2005(24):251-256.