李松濤
摘 要:隨著高職生教育不斷地發(fā)展擴(kuò)大,如何提高職學(xué)生能力發(fā)展定位已經(jīng)成為社會(huì)的一個(gè)熱點(diǎn)話題。學(xué)生的能力定位和規(guī)劃決定著學(xué)生的未來(lái)和發(fā)展,但現(xiàn)如今學(xué)生能力分析不能很完全的提供有效信息,本文通過(guò)總結(jié)歸納數(shù)據(jù)挖掘的相關(guān)技術(shù),探索數(shù)據(jù)挖掘技術(shù)如何應(yīng)用于高職生能力發(fā)展定位與預(yù)測(cè)。
關(guān)鍵詞:數(shù)據(jù)挖掘 高職生 能力發(fā)展定位
中圖分類(lèi)號(hào):G641 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2014)02(c)-0183-01
1 數(shù)據(jù)挖掘的內(nèi)涵
廣義上說(shuō)的數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的原始數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用、可信新穎的信息和知識(shí)的過(guò)程。即數(shù)據(jù)挖掘從數(shù)據(jù)庫(kù)的相關(guān)數(shù)據(jù)集合中抽取有價(jià)值的知識(shí)、規(guī)則或深層次的信息。狹義上的數(shù)據(jù)挖掘是一個(gè)利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)之間關(guān)系的過(guò)程,是知識(shí)發(fā)現(xiàn)過(guò)程中的一個(gè)關(guān)鍵步驟。數(shù)據(jù)挖掘是一門(mén)廣義的交叉學(xué)科,它的發(fā)展和應(yīng)用涉及到不同的領(lǐng)域,尤其是數(shù)據(jù)庫(kù)、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等。數(shù)據(jù)挖掘的使用極大地提高了信息的利用率,使用有效信息更高效,為社會(huì)與人類(lèi)的發(fā)展提供了方便的實(shí)用工具。
2 應(yīng)用于學(xué)生能力信息的數(shù)據(jù)挖掘技術(shù)方法
根據(jù)不同的問(wèn)題及數(shù)據(jù)類(lèi)型,存在相對(duì)應(yīng)的數(shù)據(jù)挖掘技術(shù)方法,方法如下。
第一,分類(lèi)與預(yù)測(cè):分類(lèi)是根據(jù)問(wèn)題情況事先分好類(lèi)別,利用某個(gè)分類(lèi)器一一劃分?jǐn)?shù)據(jù)庫(kù)中的數(shù)據(jù)對(duì)象,并分配到相對(duì)應(yīng)的類(lèi)別中。分類(lèi)方法在學(xué)習(xí)過(guò)程中提供了指導(dǎo)性作用。預(yù)測(cè)是為了預(yù)測(cè)未知類(lèi)別的數(shù)據(jù)對(duì)象,通過(guò)之前學(xué)習(xí)歸納的方法模型預(yù)測(cè)未知數(shù)據(jù)對(duì)象。其中分類(lèi)模型可應(yīng)用于預(yù)測(cè)。
操作步驟為:(1)構(gòu)造對(duì)數(shù)據(jù)進(jìn)行分類(lèi)的分類(lèi)器。例如運(yùn)動(dòng)員體能數(shù)據(jù)庫(kù)中,根據(jù)學(xué)體能測(cè)試成績(jī),將運(yùn)動(dòng)員的成績(jī)分類(lèi)為:優(yōu)、良、可、差四個(gè)等級(jí)。(2)精確分析分類(lèi)規(guī)則,即是通過(guò)總結(jié)分析運(yùn)動(dòng)員成績(jī)數(shù)據(jù),對(duì)成績(jī)分類(lèi)等級(jí)做出更加具體的分類(lèi)規(guī)則描述,如“體能測(cè)試科目總分高于85分的運(yùn)動(dòng)員分為等級(jí)優(yōu)”。(3)最后是利用制定完備的分類(lèi)規(guī)則來(lái)分析數(shù)據(jù)庫(kù)中的相應(yīng)數(shù)據(jù)。
第二,聚類(lèi):聚類(lèi)是將數(shù)據(jù)全部輸入數(shù)據(jù)庫(kù)中,然后對(duì)數(shù)據(jù)進(jìn)行分析,其方法步驟正好與分類(lèi)是相反的。其內(nèi)容是根據(jù)數(shù)據(jù)的相似性,相似度高的劃分到同一組。聚類(lèi)是一種無(wú)指導(dǎo)性的學(xué)習(xí)過(guò)程,也可以說(shuō)聚類(lèi)與分類(lèi)是一個(gè)互逆的過(guò)程。
第三,決策樹(shù):主要應(yīng)用原理是利用概率論分析事例的概率數(shù),在此基礎(chǔ)上劃分?jǐn)?shù)據(jù)到不同的類(lèi)別,并以樹(shù)的分支形式表示。根據(jù)數(shù)據(jù)的分類(lèi)情況也可以預(yù)測(cè)數(shù)據(jù)的發(fā)展趨勢(shì),這是這種方法的一個(gè)優(yōu)點(diǎn),優(yōu)點(diǎn)還有數(shù)據(jù)表達(dá)直觀,并且應(yīng)用便捷快速,易于理解,但是不適合于復(fù)雜量大的數(shù)據(jù),由于分支太多會(huì)埋沒(méi)了優(yōu)點(diǎn),不利于使用。
第四,遺傳算法:這種方法適用于結(jié)算最優(yōu)數(shù)據(jù),其內(nèi)容是利用概率計(jì)算,直接計(jì)算出最有數(shù)據(jù)結(jié)果的方法。遺傳算法模擬了自然界優(yōu)勝劣汰、適者生存的自然進(jìn)化規(guī)則,生成的用于數(shù)據(jù)選擇的隨機(jī)搜索算法。其優(yōu)點(diǎn)是在對(duì)數(shù)據(jù)進(jìn)行操作過(guò)程中,不需要制定規(guī)則,直接用于數(shù)據(jù)對(duì)象,直接快捷的得倒最優(yōu)化搜索。缺點(diǎn)是應(yīng)用比較單一化,可以配合其他方法使用。
3 數(shù)據(jù)挖掘技術(shù)應(yīng)用于高職學(xué)生職業(yè)能力發(fā)展定位
如何開(kāi)發(fā)優(yōu)質(zhì)課程,提高課程對(duì)就業(yè)和能力這兩個(gè)要素的針對(duì)性;如何提出以“提高學(xué)生能力”為教學(xué)本位的教育方案,是目前各大職業(yè)院校所面對(duì)的重要問(wèn)題。要想歸納出教育教學(xué)方案中所必不可少的、課程中應(yīng)該重點(diǎn)傳授的知識(shí)點(diǎn)和能力培養(yǎng)方向,就需要對(duì)學(xué)生們的招生信息、在校表現(xiàn)情況和就業(yè)信息等等的相關(guān)信息進(jìn)行挖掘,從而獲得對(duì)校方來(lái)說(shuō)了解學(xué)生的有用信息,并把這些信息同企業(yè)對(duì)學(xué)生需求的信息結(jié)合起來(lái)。
高校儲(chǔ)存著大量學(xué)生數(shù)據(jù),包括教育信息和就業(yè)信息。教育信息同樣分為兩部分,一部分是教學(xué)直接相關(guān)的,如學(xué)業(yè)成績(jī)、學(xué)績(jī)點(diǎn)、獲獎(jiǎng)情況等等;一另部分則是與非智力因素有關(guān),包括學(xué)生的性別、身體狀況、心理健康情況等等。就業(yè)信息、顧名思義,可能包括學(xué)生就業(yè)所在的企業(yè)地域、企業(yè)性質(zhì)、所處職位、行業(yè)、薪資待遇等。近年來(lái),信息化應(yīng)用與存儲(chǔ)規(guī)范化的推進(jìn)使得高校的學(xué)生個(gè)人信息庫(kù)越來(lái)越豐富。但與信息高度豐富不同的是,這些數(shù)據(jù)和信息都沒(méi)有被充分利用。高校在制定學(xué)生們的培養(yǎng)計(jì)劃時(shí)很少注意到這類(lèi)信息,這些寶貴并且具有指導(dǎo)性的信息被遺忘了。但培養(yǎng)計(jì)劃的制定者如果整合學(xué)生信息并從中總結(jié)出規(guī)律,那么這種規(guī)律能很好的啟發(fā)教育者應(yīng)該重視培養(yǎng)學(xué)生的哪種方面素養(yǎng)。本課題就是從這個(gè)角度出發(fā),總和并研究學(xué)生信息和最終就業(yè)的信息,挖掘出其中包含的規(guī)律,為培養(yǎng)計(jì)劃的制定和設(shè)計(jì)提供相關(guān)的理論支持。數(shù)年以來(lái),高職院校在其教學(xué)和管理工作,積累了大量的學(xué)生信息數(shù)據(jù),這些信息已具備了形成一個(gè)信息庫(kù)的基本條件。而目前需要做的,是將這些數(shù)據(jù)庫(kù)進(jìn)行開(kāi)發(fā),通過(guò)對(duì)這些教學(xué)信息進(jìn)行有針對(duì)性和關(guān)聯(lián)性的分析和挖掘,總結(jié)出課程的效果與其他因素的關(guān)聯(lián),為培養(yǎng)計(jì)劃的決策者支持信息,以便教學(xué)工作能更有計(jì)劃和效果的進(jìn)行,課程安排能更加合理的開(kāi)展,教學(xué)質(zhì)量進(jìn)一步提高,學(xué)生相關(guān)能力也進(jìn)一步提升。
4 結(jié)語(yǔ)
將學(xué)生的個(gè)人信息,包括教育信息和就業(yè)信息等挖掘出來(lái),整合成對(duì)校方設(shè)計(jì)培養(yǎng)學(xué)生、了解學(xué)生的有用信息,并把這些信息用于在分析企業(yè)對(duì)學(xué)生能力的需求上,從而進(jìn)一步歸納出課程設(shè)計(jì)和能力培養(yǎng)的側(cè)重點(diǎn)。把新興的數(shù)據(jù)挖掘技術(shù)應(yīng)用到學(xué)生管理工作中,這在大力提倡科教興國(guó)的今天,對(duì)于提高教學(xué)質(zhì)量,培養(yǎng)全方位人才無(wú)疑具有十分重大的現(xiàn)實(shí)意義。
參考文獻(xiàn)
[1] 安淑芝.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M].清華大學(xué)出版社,2005.
[2] 于立紅,張建偉.基于數(shù)據(jù)挖掘的高職生成績(jī)分析與預(yù)測(cè)[J].鄭州輕工業(yè)學(xué)院學(xué)報(bào):自然科學(xué)版,2006(3):77-79.
[3] 慕春棣,戴劍彬,葉俊,等.用于數(shù)據(jù)挖掘的貝葉斯網(wǎng)絡(luò)[J].軟件學(xué)報(bào),2000(11):660-666.endprint