王志偉 王利軍
摘要:學(xué)生就業(yè)管理系統(tǒng)可以采集畢業(yè)生的就業(yè)調(diào)查數(shù)據(jù)信息,并且可以對(duì)數(shù)據(jù)進(jìn)行選擇和轉(zhuǎn)換以便數(shù)據(jù)挖掘的順利完成,利用SPSS軟件進(jìn)行K-means聚類(lèi)分析,從而得到有價(jià)值的信息,為學(xué)生管理工作和教學(xué)方案的修改制定提供參考。
關(guān)鍵詞:就業(yè)管理;聚類(lèi)分析;數(shù)據(jù)
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)24-0008-02
Application Research of K-means Clustering Analysis in Job Management System
WANG zhi-wei,WANG li-jun
(Anhui Economic Management Cadres Institute, Hefei 230059, Anhui)
Abstract: Student job management system can collect the data information about the employment of graduates, and can choose and convert the data to complete the data mining, and use SPSS software to carry out K-means clustering analysis, so as to get valuable information, and provide a reference for the students' management work and teaching plan.
Key words: job management; clustering analysis; data
1 數(shù)據(jù)的采集
就業(yè)調(diào)查數(shù)據(jù)的采集工作是通過(guò)畢業(yè)生登錄系統(tǒng)后在就業(yè)調(diào)查頁(yè)面填寫(xiě)就業(yè)調(diào)查問(wèn)卷完成的,并將數(shù)據(jù)保存在數(shù)據(jù)庫(kù)中,以便后期的數(shù)據(jù)統(tǒng)計(jì)和數(shù)據(jù)挖掘使用。就業(yè)調(diào)查數(shù)據(jù)主要包含應(yīng)屆畢業(yè)生的基本信息,教育信息和就業(yè)信息等?;拘畔⒅饕尚彰?、性別、是否干部、班級(jí)、專(zhuān)業(yè)、系部、籍貫和黨團(tuán)關(guān)系組成;教育信息主要由學(xué)業(yè)成績(jī)(優(yōu)秀、良好、中等、及格和不及格五個(gè)檔次)、英語(yǔ)水平和專(zhuān)業(yè)證書(shū)組成;就業(yè)信息主要由就業(yè)狀況、單位性質(zhì)、就業(yè)位置、滿意程度、對(duì)口程度、起薪標(biāo)準(zhǔn)、主要就業(yè)困難、實(shí)習(xí)經(jīng)歷情況、就業(yè)指導(dǎo)情況、招聘信息來(lái)源、基本素質(zhì)培養(yǎng)和意見(jiàn)建議等組成。
2 數(shù)據(jù)選擇
就業(yè)調(diào)查數(shù)據(jù)是通過(guò)在線問(wèn)卷調(diào)查頁(yè)面采集的,數(shù)據(jù)在格式上相對(duì)規(guī)范統(tǒng)一。但不是所有的數(shù)據(jù)都適合進(jìn)行數(shù)據(jù)挖掘,系統(tǒng)主要提取就業(yè)調(diào)查數(shù)據(jù)表和畢業(yè)生信息表中的性別、是否干部、學(xué)業(yè)成績(jī)、實(shí)習(xí)經(jīng)歷、就業(yè)指導(dǎo)、工作位置、起薪標(biāo)準(zhǔn)、對(duì)口程度和滿意程度屬性的值作為數(shù)據(jù)挖掘的原始數(shù)據(jù),以便為數(shù)據(jù)挖掘工作的順利完成提供完整的數(shù)據(jù)基礎(chǔ)。提取原始數(shù)據(jù)頁(yè)面如圖1所示。
3 數(shù)據(jù)轉(zhuǎn)換
提取的原始數(shù)據(jù)大多是以文本的形式存在,不適合進(jìn)行數(shù)據(jù)挖掘,因此需要對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)轉(zhuǎn)換。
3.1 數(shù)據(jù)規(guī)范
為了便于數(shù)據(jù)挖掘,性別、是否班委、學(xué)業(yè)成績(jī)、實(shí)習(xí)經(jīng)歷、就業(yè)指導(dǎo)、工作位置六個(gè)屬性采用十基數(shù)變換規(guī)格化方法,規(guī)范的字段和說(shuō)明如下所示:
3.2 屬性構(gòu)造
屬性構(gòu)造是根據(jù)己有屬性集構(gòu)造新的屬性,并加入到現(xiàn)有屬性集合中以幫助挖掘更深層次的知識(shí),提高數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性。就業(yè)質(zhì)量不能僅僅通過(guò)起薪標(biāo)準(zhǔn)、對(duì)口程度或滿意程度某一個(gè)屬性來(lái)體現(xiàn)。就業(yè)質(zhì)量是一個(gè)綜合屬性,需要通過(guò)屬性構(gòu)造來(lái)生成。
屬性項(xiàng)“起薪標(biāo)準(zhǔn)”、“對(duì)口程度”和“滿意程度”三項(xiàng)進(jìn)行合并來(lái)構(gòu)造新的屬性“就業(yè)質(zhì)量”。就業(yè)質(zhì)量取值采用一個(gè)加權(quán)函數(shù)式進(jìn)行構(gòu)造,就業(yè)質(zhì)量=0.3*(起薪標(biāo)準(zhǔn))+0.3*(對(duì)口程度)+0.4*(滿意程度),再采用十基數(shù)變換規(guī)格化方法進(jìn)行規(guī)范數(shù)據(jù),數(shù)據(jù)轉(zhuǎn)換后的結(jié)果如圖2所示:
4 數(shù)據(jù)挖掘
利用IBM SPSS軟件對(duì)選擇和構(gòu)造的屬性進(jìn)行K-means聚類(lèi)分析。聚類(lèi)變量為sex、banwei、xueye、shixijingli、jiuyezhidao、gongzuoweizhi和quality,個(gè)案標(biāo)識(shí)依據(jù)為StudentID,聚類(lèi)數(shù)設(shè)置為3,選項(xiàng)參數(shù)中勾選初始聚類(lèi)中心、ANOVA和每個(gè)個(gè)案的聚類(lèi)信息。K-means聚類(lèi)分析設(shè)置窗口如圖3所示:
各個(gè)聚類(lèi)簇的案例數(shù)分別為86、119和150。
聚類(lèi)簇編號(hào)為1的案例具體數(shù)據(jù)是一組就業(yè)質(zhì)量較高的一組分布,男生居多,學(xué)生干部居多,學(xué)業(yè)成績(jī)?yōu)閮?yōu)秀的居多,絕大多數(shù)都有實(shí)習(xí)經(jīng)歷和參加過(guò)就業(yè)指導(dǎo),就業(yè)的工作位置多為直轄市或省會(huì)城市。
聚類(lèi)簇編號(hào)為2的案例具體數(shù)據(jù)是一組就業(yè)質(zhì)量較低的一組分布,女生居多,非學(xué)生干部居多,學(xué)業(yè)成績(jī)?yōu)橹械鹊木佣?,?shí)習(xí)經(jīng)歷和就業(yè)指導(dǎo)經(jīng)歷不完善,就業(yè)的工作位置多為非省會(huì)城市。
聚類(lèi)簇編號(hào)為3的案例具體數(shù)據(jù)是一組就業(yè)質(zhì)量中等的一組分布,男女比例均衡,非學(xué)生干部居多,學(xué)業(yè)成績(jī)?yōu)榱己玫木佣啵瑢?shí)習(xí)經(jīng)歷和就業(yè)指導(dǎo)經(jīng)歷較完善,就業(yè)的工作位置多為非省會(huì)城市。
學(xué)院在制定教學(xué)與培養(yǎng)計(jì)劃時(shí),應(yīng)加強(qiáng)專(zhuān)業(yè)課程建設(shè),考慮到性別的差異性,加強(qiáng)實(shí)習(xí)實(shí)訓(xùn)的監(jiān)察工作,合理設(shè)置就業(yè)指導(dǎo)課程的內(nèi)容與時(shí)間安排。
6 總結(jié)
學(xué)生管理部門(mén)的管理者可以使用聚類(lèi)分析方法從學(xué)生的就業(yè)調(diào)查信息中挖掘有價(jià)值的信息,從而指導(dǎo)學(xué)生就業(yè)管理和教學(xué)方案的修訂。
參考文獻(xiàn):
[1] Jia-wei Han, Kamber M.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社, 2008.
[2] 張繼美.數(shù)據(jù)挖掘在高校就業(yè)分析中的應(yīng)用研究[D].安徽大學(xué),2010.
[3] SPSS聚類(lèi)分析全過(guò)程: http://www.i#cn/article/061022 162013.html.