陳婷婷
目前高等職業(yè)院校畢業(yè)生的技能要求越來越高,而在數(shù)據(jù)統(tǒng)計過程中,因為數(shù)據(jù)信息龐大和復雜,使得傳統(tǒng)方法無法對這些數(shù)據(jù)進行有效的分析。本文主要分析了現(xiàn)在數(shù)據(jù)挖掘算法的現(xiàn)狀,其中存在的不足,以及數(shù)據(jù)挖掘技術(shù)的改進方法,以高職院校學生技能證管理數(shù)據(jù)為例,對這項技術(shù)進行了深入的研究。
對于高職院校來說,學生就業(yè)管理部門主要的工作就是對學生信息進行管理。通過對學生信息準確的收集和把握,可以為學生將來的就業(yè)指導提供非常好的依據(jù)。所以本文研究了卜面系統(tǒng),對數(shù)據(jù)挖掘技術(shù)在高職院校學生技能考證方面進行實踐探索,從而使高職院校對學生信息能做到更好的管理。
1 數(shù)據(jù)挖掘技術(shù)
面對海量的學生技能、考證、就業(yè)等信息,如果沒有很好的管理技術(shù)和方法,那么這勢必將成為一件耗時、耗力的苦差事。因為這項工作,需要相關(guān)的工作人員對學生的信息進行收集、整理、分類歸納等。在大部分的信息當中,一般都是些不同類型的數(shù)據(jù),而且在這些數(shù)據(jù)信息的管理過程中,相關(guān)工作人員沒有對這些數(shù)據(jù)信息做到有效的處理。因為,隨著學??焖俚陌l(fā)展,學生信息的不斷增多,而且向著更加復雜化的方向發(fā)展,這就造成了傳統(tǒng)的數(shù)據(jù)處理技術(shù)已經(jīng)完全無法滿足現(xiàn)代數(shù)據(jù)信息的管理需求。從這方面也可以看出,利用現(xiàn)代先進的技術(shù)對數(shù)據(jù)挖掘技術(shù)進行有效的優(yōu)化和完善,提高其對數(shù)據(jù)信息的處理效果,便成為了現(xiàn)代非常重要的工作。
數(shù)據(jù)挖掘簡單的解釋就是高速、有效的對數(shù)據(jù)信息進行處理的一種技術(shù)。數(shù)據(jù)挖掘,英文為Data Mining,簡稱為DM。這項技術(shù)、結(jié)合了數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計學、模糊數(shù)學等多個領(lǐng)域的前沿理論與技術(shù)。通過采用這項技術(shù),可以讓人們在紛雜的數(shù)據(jù)信息中快速的提煉出自己想要知道的信息和知識。因為這項技術(shù)有著如此的優(yōu)勢,所以在許多數(shù)據(jù)處理過程中,都采用了這項技術(shù),最終都取得了不錯的處理效果。但是,我國現(xiàn)在在這方面的技術(shù)還比較落后,只是處在一個初步的發(fā)展階段,對數(shù)據(jù)挖掘的核心技術(shù)的研究還不夠深入和透徹。
2 數(shù)據(jù)挖掘技術(shù)在職業(yè)技能考證信息應用結(jié)果分析
2.1 數(shù)據(jù)挖掘技術(shù)開發(fā)步驟
數(shù)據(jù)挖掘是一項非常系統(tǒng)的工作,所以在對其進行開發(fā)時,一定要按照步驟進行:
①對需要處理的數(shù)據(jù)信息進行有效的分析,并且從中獲得符合要求的相關(guān)數(shù)據(jù)和信息。②對經(jīng)過分析的數(shù)據(jù)和信息進行再次的篩選和提煉,確保自己所獲得的信息是全面的,沒有出現(xiàn)遺漏的情況,同時,這些數(shù)據(jù)信息還是相互兼容的。而對于那些不滿足自己要求的數(shù)據(jù)信息進行有效的清理,然后再選出新的數(shù)據(jù)來進行選擇和提取。③選定數(shù)據(jù)挖掘算法。在對數(shù)據(jù)處理過程中,主要就是通過采用這樣的數(shù)據(jù)挖掘算法來對相關(guān)的數(shù)據(jù)信息進行提取。④對數(shù)據(jù)庫中的所有數(shù)據(jù)都進行處理之后,再在這個基礎(chǔ)上建立起一個新的數(shù)據(jù)集。⑤對處理之后的數(shù)據(jù)做到清晰的說明,以便區(qū)分和辨識。⑥驗證挖掘效果。通過進行具體的數(shù)據(jù)分析對數(shù)據(jù)挖掘的整個結(jié)果進行驗證,確保挖掘信息的正確性和真實性,最終好達到預期效果。在對數(shù)據(jù)挖掘進行驗證的時候,要對其中不符合要求的信息進行進一步的排除。
2.2 學生技能考證培訓信息挖掘結(jié)果分析
2.2.1 統(tǒng)計分析方法
統(tǒng)計分析方法是數(shù)據(jù)信息處理中常用的一種方法,數(shù)據(jù)挖掘過程主要需要對數(shù)據(jù)信息進行統(tǒng)計的方面有這些:
(1)常用統(tǒng)計,就是人們在日常高職院校學生信息統(tǒng)計時常用的統(tǒng)計方法和信息處理方法。
(2)相關(guān)分析,根據(jù)一定的標準,對高職院校學生信息進行具體的分析和處理。
(3)回歸分析,通過運用回歸方程對高職院校學生信息中的變量進行有效的處理和分析。
高職院校在對學生技能考證方面的數(shù)據(jù)管理過程中,在數(shù)據(jù)統(tǒng)計分析期間,經(jīng)常容易出現(xiàn)數(shù)據(jù)雜亂的現(xiàn)象,這種情況嚴重的影響到了數(shù)據(jù)信息處理,更加不利于采用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)進行處理,所以才造成了統(tǒng)計過程中,出現(xiàn)了許多亂象。另外,設備本身存在問題也會嚴重的影響到數(shù)據(jù)挖掘的效果,所以在數(shù)據(jù)管理過程中,確保設備的正常運行也是非常重要的。
2.2.2 數(shù)據(jù)預處理分析
在對高職院校學生的信息進行處理時,如果直接采用數(shù)據(jù)挖掘技術(shù)對這些信息進行處理,勢必會造成處理的數(shù)據(jù)過于大且集中,很難達到理想的處理效果。所以在對這些數(shù)據(jù)信息進行處理時,相關(guān)的工作人員可以先對數(shù)據(jù)信息進行預處理,這樣便可以保證后面數(shù)據(jù)信息處理工作更好的開展。
綜上所述,隨著現(xiàn)代高職院校的快速發(fā)展,對學生信息管理的要求也更高,這就要求相關(guān)的部門不斷提升學生信息管理的技術(shù)。相關(guān)的工作人員要加強對數(shù)據(jù)挖掘這一技術(shù)的研究,并且建起屬于自己學校學生信息的數(shù)據(jù)庫,從而推動高職院校學生信息管理技術(shù)的不斷發(fā)展,為學生專業(yè)技能的培養(yǎng)和將來的就業(yè)指導做到有效的管理和幫助。
(作者單位:南京機電職業(yè)技術(shù)學院)