吳剡青 韓佳宏 金淵濤 陳佳鑫 賈祖星
摘要:警察院校大部分畢業(yè)生以考取公務(wù)員為主,為提高警校大學(xué)生公務(wù)員成功考取率,本小組進(jìn)行問卷調(diào)查,使用spssstatistics和excel清洗、轉(zhuǎn)換、整合數(shù)據(jù),建立警校大學(xué)生成功考取公務(wù)員數(shù)據(jù)集。將現(xiàn)有的經(jīng)典的具有普適作用的關(guān)聯(lián)規(guī)則挖掘算法(如Apnon算法、FP-Growth算法)應(yīng)用于警校大學(xué)生成功考取公務(wù)員數(shù)據(jù)集,設(shè)計(jì)適合這一主題的數(shù)據(jù)關(guān)聯(lián)分析算法和數(shù)據(jù)挖掘算法,使用訓(xùn)練集用來估計(jì)模型運(yùn)用spssmodeler、IBMWatson analytics構(gòu)建多個模型,使用交叉驗(yàn)證選擇最優(yōu)模型,在R、python語言環(huán)境下對警校學(xué)生日常行為在網(wǎng)上進(jìn)行爬蟲、使用測試集來檢驗(yàn)最終選擇最優(yōu)的模型的性能,不斷驗(yàn)證模型性能,形成生態(tài)鏈條。最終出具調(diào)查報(bào)告,進(jìn)而根據(jù)調(diào)查報(bào)告做出針對警校大學(xué)生公務(wù)員成功考取預(yù)測。
關(guān)鍵詞:警校生;數(shù)據(jù)挖掘;預(yù)測模型;公務(wù)員考試
中央司法警官學(xué)院作為司法部直屬司法部直屬的唯一一所普通高等院校的警校畢業(yè)生,在全國公安院校擁有多種就業(yè)政策對比下,中警院的畢業(yè)生沒有太多便利條件,我校大部分的畢業(yè)生在公務(wù)員考試時(shí)需要放棄自身專業(yè)的優(yōu)勢與社會招考的考生一起競爭為數(shù)不多的崗位,面臨著失去專業(yè)優(yōu)勢,自謀出路巨大就業(yè)壓力
為提高警校大學(xué)生公務(wù)員成功考取率,本小組使用大數(shù)據(jù)挖掘技術(shù),建立預(yù)測模型。根據(jù)預(yù)測結(jié)果,為畢業(yè)生報(bào)考公務(wù)員提供決策支持為新人學(xué)的新生在大學(xué)四年所在的不同階段的學(xué)習(xí)提供規(guī)劃指,為將來的工作做好職業(yè)規(guī)劃,并為我校的教學(xué)部門和管理部門探尋針對警校大學(xué)生更加有效的管理模式和教學(xué)方式提供幫助。我們對調(diào)查問卷的數(shù)據(jù)進(jìn)行處理分析后得到的初步調(diào)查結(jié)果。
1我??忌拇髮W(xué)個人履歷調(diào)查
1.1學(xué)生參與活動調(diào)查
我們通過調(diào)查問卷調(diào)查學(xué)生參與活動情況,來調(diào)查參與活動是否對考公務(wù)員有所幫助,調(diào)查結(jié)果見圖1所示。在圖1中,有31.1%的畢業(yè)生,認(rèn)為專業(yè)知識競賽對考上公務(wù)員最有幫助。作為警校學(xué)生,在大學(xué)所學(xué)的專業(yè)知識基本于實(shí)際工作中的業(yè)務(wù)接軌,有很強(qiáng)的聯(lián)系性。參與專業(yè)知識競賽能鞏固自己的專業(yè)知識,提高自己的專業(yè)水平,而其中脫穎而出的優(yōu)勝者更受到用人單位的青睞。占到21.3%的科研創(chuàng)新項(xiàng)目競賽也同樣如此,這樣的活動一是培養(yǎng)了學(xué)生的學(xué)習(xí)能力、科研創(chuàng)新能力,二也證明了學(xué)生出類拔萃的綜合素質(zhì),為用人單位在面試時(shí)提供參考。辯論大賽之所以能有19.5%這么高的比例,那是應(yīng)為公務(wù)員考試需要進(jìn)行面試,在筆試中也有諸多考察邏輯能力的考題,所以這也是學(xué)生認(rèn)為一個值得參與的重要活動。
因此我們在這建議學(xué)生在大學(xué)期間應(yīng)該多去參加以上這3種活動,來提高自己的能力,為將來的公務(wù)員考試作準(zhǔn)備。當(dāng)然別的小比例的如運(yùn)動會、創(chuàng)新創(chuàng)業(yè)大賽、歌舞大賽活動也可以多多參與,結(jié)交朋友陶冶情操,畢竟讀大學(xué)的目的不單單是為了考公務(wù)員。
1.2學(xué)生心中最重要的個人資質(zhì)和證書調(diào)查
在大學(xué)的四年中學(xué)生會考取許多證書和取得各種資質(zhì),我們想找出哪些證書資質(zhì)是對公務(wù)員考試是有用的哪些是無關(guān)緊要的,所以我們對學(xué)生心中最重要的個人資質(zhì)和證書進(jìn)行調(diào)查,調(diào)查結(jié)果見圖2所示。
在圖2中,學(xué)生心中最重要的個人資質(zhì)和證書是大學(xué)英語四、六級占其中的48.3%,其次是司法考試占30.2%,黨員占30.2%,計(jì)算機(jī)二級占22.1%,駕照占14.9%,心理咨詢師占12.2%。由此我們可以直觀地了解到在大學(xué)期間最重要的3個證書資質(zhì)分別是大學(xué)英語四、六級證書、司法考試證書和黨員。在我們看來公務(wù)員考試很大程度上是以學(xué)歷為基礎(chǔ),以能力和證照為標(biāo)準(zhǔn)的人才選拔機(jī)制。學(xué)院考公成功的同學(xué)們,認(rèn)為黨員、大學(xué)英語四、六級、計(jì)算機(jī)二級和司法考試等證書非常有用。資質(zhì)和證書,在某種程度上代表了能力的高低和大小。在對手和自己能力不相上下時(shí),資質(zhì)和證書的含金量和數(shù)量很可能會成為你打敗對手的殺手锏。因此,我們建議盡可能多的考取一些社會熱門、用人單位急需的(含金量高)的資質(zhì)和證書,對考公輕松勝出是很有幫助的。
2我??忌鷱?fù)習(xí)迎考策略和技巧
由于公務(wù)員考試每年熱點(diǎn)考題、題型都會有一定的變動,所以我們?yōu)榱颂岣邔W(xué)生公務(wù)員考試成績,為了更有效率的復(fù)習(xí)迎考,我們就公務(wù)員考試復(fù)習(xí)迎考策略和技巧進(jìn)行調(diào)查。
2.1準(zhǔn)備公務(wù)員考試的方法
我們調(diào)查了絕大部分畢業(yè)生公務(wù)員考試準(zhǔn)備階段的學(xué)習(xí)方式,以比較出最有效的學(xué)習(xí)方式供同學(xué)們參考,各方法所占比例,見圖3所示。
在圖3中,有36.16%的學(xué)生的學(xué)習(xí)宗旨是計(jì)劃明確,瞄準(zhǔn)真題,掐時(shí)練筆,查漏補(bǔ)缺,這種學(xué)習(xí)方式可以給自己帶來非常高效的學(xué)習(xí)效率,并且可以在學(xué)習(xí)的同時(shí)養(yǎng)成良好的學(xué)習(xí)習(xí)慣,使自己在考試中不丟冤枉分。其次是占24.29%的人積極利用網(wǎng)絡(luò)公務(wù)員考試平臺信息,通過此方式可以及時(shí)獲得最新的公務(wù)員考試信息和一些地方政府的政策,使自己可以全方位的去挑選適合自己的崗位,最大限度的發(fā)掘自己的潛能。參加學(xué)院開設(shè)的公務(wù)員選修課,在老師的指導(dǎo)下學(xué)習(xí)也占到19.2%,說明這也是一個非常有效的方法,通過老師傳授自己多年的經(jīng)驗(yàn),可以使自己在公務(wù)員考試中少走彎路,將精力留在最正確的環(huán)節(jié)上。漫無目的的題海戰(zhàn)術(shù)也占到6.92%,這種低效率低質(zhì)量的學(xué)習(xí)方式經(jīng)調(diào)查是不可取的,所以我們要去尋找最有效的學(xué)習(xí)方法。
所以我們希望同學(xué)們可以將高效率高質(zhì)量的學(xué)習(xí)方法相結(jié)合,使它們互相貫通,已達(dá)到學(xué)習(xí)效率的最高境界,這樣才能使自己在公務(wù)員考試中馬到成功。
3我校警務(wù)化管理、警察特色教學(xué)的影響
中央司法警官學(xué)院作為一個警察類院校,采用警務(wù)化管理和警察教學(xué),有著其他地方院校所不具備的特色,所以我們就警務(wù)化特色管理、警察教學(xué)帶來的對學(xué)生公考的幫助進(jìn)行調(diào)查,調(diào)查結(jié)果見圖4所示。
這一調(diào)查采用不定項(xiàng)選擇題進(jìn)行測試。在圖4中,所有學(xué)生中有83.67%的人認(rèn)為警務(wù)化特色管理可以使自己有規(guī)范得體的行為舉止和昂揚(yáng)向上的警察精神風(fēng)貌,幫助自己考公務(wù)員。有77.56%的學(xué)生認(rèn)為警察特色教學(xué)強(qiáng)化了政治意識、警察意識和法制意識,此外64.29%的學(xué)生認(rèn)為這樣的特色大學(xué)學(xué)習(xí)對參加招考警察類公務(wù)員體能測試(警務(wù)技能)幫助很大,還有66.33%的學(xué)生因此具備了很強(qiáng)的時(shí)間觀念和效率觀念。
由此看出學(xué)院警務(wù)化管理對學(xué)生考公幫助很大,主要集中在思想建設(shè)、風(fēng)貌舉止和體能鍛煉三個方面。這說明學(xué)院的警務(wù)化管理模式是一種科學(xué)的管理方式,能夠?qū)崿F(xiàn)教育和管理的有機(jī)結(jié)合,幫助學(xué)生養(yǎng)成準(zhǔn)警察、準(zhǔn)公務(wù)員的良好行為習(xí)慣。因此,我認(rèn)為學(xué)??梢詮墓珓?wù)員就業(yè)標(biāo)準(zhǔn)和考公要求的角度,突出專業(yè)優(yōu)勢,進(jìn)一步探索科學(xué)發(fā)展、健全完善學(xué)院警務(wù)化管理的教育內(nèi)容和管理方式。
4警校大學(xué)生公務(wù)員成功考取預(yù)測
4.1選擇算法,構(gòu)建模型
我們科學(xué)地剔除噪音,確定對于成功考取公務(wù)員重點(diǎn)因素之后,進(jìn)行模型的設(shè)計(jì)。不用類型數(shù)據(jù)的數(shù)據(jù)使用不同的算法進(jìn)行建模。結(jié)構(gòu)化的數(shù)據(jù)(學(xué)生的個人成績,個人學(xué)習(xí)時(shí)間)使用邏輯回歸構(gòu)建模型。半結(jié)構(gòu)化的數(shù)據(jù)(學(xué)生的日常行為記錄)和非結(jié)構(gòu)化數(shù)據(jù)(面試過程,復(fù)習(xí)過程)使用決策樹或者支持向量機(jī)svm構(gòu)建模型。
對于結(jié)構(gòu)化的數(shù)據(jù)例如考生的國考成績與復(fù)習(xí)時(shí)間的長度之間的關(guān)系等等我們先將兩種數(shù)據(jù)挑選出放入一個Excel中,使用spss modeler選擇線性回歸算法對數(shù)據(jù)進(jìn)行建模。在圖5中10小時(shí)的復(fù)習(xí)時(shí)間能達(dá)到148分的峰值,達(dá)到效率最大化。從復(fù)習(xí)10小時(shí)到復(fù)習(xí)12小時(shí)的成績呈現(xiàn)下降趨勢,成績148分能滑落到136分這樣一個谷值和復(fù)習(xí)5個小時(shí)的成績持平。而從復(fù)習(xí)5小時(shí)到復(fù)習(xí)12小時(shí)成績呈現(xiàn)上升趨勢是一個效率提升的過程。
對于半結(jié)構(gòu)化的數(shù)據(jù),我們篩選出適合決策樹算法的出關(guān)系顯著因子,分為三個方向:個人履歷優(yōu)勢、特色教學(xué)優(yōu)勢、考試復(fù)習(xí)策略,在個人履歷優(yōu)勢中存在4個因子分別是:是否擔(dān)任過學(xué)生干部、突出素質(zhì)特長、在校期間是否獲過重大獎項(xiàng)、在校期間是否經(jīng)常參加活動,在特色教學(xué)優(yōu)勢中存在2個因子分別是:警務(wù)化管理是否有幫助、所學(xué)專業(yè)是否有就業(yè)優(yōu)勢,在考試復(fù)習(xí)策略中存在2個因子分別是:報(bào)網(wǎng)課還是面授課、準(zhǔn)備公考是自學(xué)還是報(bào)班。構(gòu)建決策樹模型,做出預(yù)測符合以下兩種情況的學(xué)生具有大概率成功考取公務(wù)員:
情況1:擔(dān)任學(xué)生干部,自學(xué)復(fù)習(xí)公考,邏輯思維強(qiáng)口才出眾,體育好身體素質(zhì)出色,精通政治理論文筆好,服從警務(wù)化管理的學(xué)生;
情況2:擔(dān)任學(xué)生干部,報(bào)班復(fù)習(xí)公考,上面授課,邏輯思維強(qiáng)口才出眾,體育好身體素質(zhì)出色、精通政治理論文筆好的學(xué)生。
4.2測試模型,構(gòu)建生態(tài)鏈條
我們會使用python語言編寫代碼在校園網(wǎng)、貼吧、微博、人人網(wǎng)上對警校生日常行為進(jìn)行爬蟲,構(gòu)建一個動態(tài)數(shù)據(jù)測試集同時(shí)加入時(shí)間序列模型來檢驗(yàn)最終選擇最優(yōu)的模型的性能,。
同時(shí)由于公務(wù)員考試每年政策的改變,會有不同的熱門考點(diǎn),因此我們會根據(jù)每年不同情況,將測試集的反饋結(jié)果,在作為重要因子重新放人模型中,訓(xùn)練模型,不斷優(yōu)化模型性能。使模型能自我學(xué)習(xí),形成一個構(gòu)建一測試一反饋一構(gòu)建的生態(tài)鏈條。