楊 媛
數(shù)據(jù)挖掘是一門(mén)新興的學(xué)科,其誕生于20 世紀(jì)80 年代,其主要面向商業(yè)應(yīng)用的人工智能研究領(lǐng)域,從技術(shù)角度來(lái)說(shuō),數(shù)據(jù)挖掘就是從大量的復(fù)雜的、不規(guī)則的、隨機(jī)的,模糊的數(shù)據(jù)中獲取隱含的,受眾事先沒(méi)有發(fā)覺(jué)的、有潛在價(jià)值和知識(shí)的過(guò)程。
在數(shù)據(jù)挖掘技術(shù)應(yīng)用過(guò)程中,分析方法可以說(shuō)是其最為基礎(chǔ)和核心的內(nèi)容,借助科學(xué)可靠的算法才能更好的實(shí)現(xiàn)數(shù)據(jù)挖掘,理清數(shù)據(jù)中潛在的各種規(guī)律,使所挖掘的數(shù)據(jù)作用得到最大限度的發(fā)揮,通過(guò)不同的分析方法,可以解決不同的問(wèn)題,當(dāng)前最為常用的數(shù)據(jù)挖掘方法主要有聚類分析、特征數(shù)據(jù)分析法、關(guān)聯(lián)性分析等。下面,筆者將結(jié)合自身的理解和認(rèn)識(shí),對(duì)不同分析方法進(jìn)行詳細(xì)的論述。
所謂的聚類分析就是將各種數(shù)據(jù)對(duì)象按照其作用、功能及特性等進(jìn)行聚類分組,然后形成板塊,這樣可以快速的將毫無(wú)邏輯的數(shù)據(jù)變成具有一定聯(lián)系性的分組數(shù)據(jù),然后再對(duì)這些分組數(shù)據(jù)進(jìn)行分析和利用,進(jìn)一步挖掘出具有一定價(jià)值的數(shù)據(jù),發(fā)揮數(shù)據(jù)的作用價(jià)值。但是需要注意的是該數(shù)據(jù)分析方法雖然可以快速的對(duì)數(shù)據(jù)進(jìn)行分組,但是其缺陷也十分的明顯,即難以較好的結(jié)合數(shù)據(jù)類別、屬性等對(duì)數(shù)據(jù)進(jìn)行分類,因此該分析方法應(yīng)用比較多的領(lǐng)域主要是心理學(xué)、統(tǒng)計(jì)學(xué)和數(shù)據(jù)識(shí)別等領(lǐng)域。
在大數(shù)據(jù)時(shí)代下,網(wǎng)絡(luò)數(shù)據(jù)每秒鐘都是快速更新,數(shù)據(jù)爆炸式發(fā)展已經(jīng)成為時(shí)代發(fā)展的趨勢(shì),數(shù)據(jù)資源的普及和應(yīng)用范圍可謂是越來(lái)越廣泛,但是面對(duì)網(wǎng)絡(luò)爆炸式數(shù)據(jù),如何快速的搜尋出使用者所需要的數(shù)據(jù),發(fā)揮相關(guān)數(shù)據(jù)的作用和價(jià)值就是一件值得思考的事情了,而特性分類逐漸發(fā)展成為當(dāng)前數(shù)據(jù)整理分類的主要內(nèi)容。在應(yīng)用特征性數(shù)據(jù)分析方法時(shí),還有多種方法是通過(guò)計(jì)算機(jī)來(lái)實(shí)現(xiàn)虛擬數(shù)據(jù)分類的,專業(yè)的計(jì)算機(jī)工作者可以尋找數(shù)據(jù)之間存在的普遍規(guī)律然后完成數(shù)據(jù)的特性分析,在此基礎(chǔ)之上進(jìn)行下一步的分類。
網(wǎng)絡(luò)上的數(shù)據(jù)形形色色,千奇百怪,有的數(shù)據(jù)發(fā)布者為了保護(hù)數(shù)據(jù)往往會(huì)實(shí)施各種加密方法使得數(shù)據(jù)具有一定的隱蔽性,這樣可能就很難通過(guò)普通的數(shù)據(jù)分析法對(duì)相關(guān)數(shù)據(jù)進(jìn)行挖掘和利用,而要解決該問(wèn)題則可以通過(guò)關(guān)聯(lián)性分析法完成對(duì)于數(shù)據(jù)信息的關(guān)聯(lián)性識(shí)別,進(jìn)而快速的獲取有效數(shù)據(jù),幫助人力完成對(duì)各種數(shù)據(jù)分辨的任務(wù),相較于其他的數(shù)據(jù)分析方法來(lái)說(shuō),這種分析方法實(shí)際上帶有很強(qiáng)的目的性,因此往往適用于對(duì)數(shù)據(jù)精準(zhǔn)度要求相對(duì)比較高的信息管理工作。
實(shí)際應(yīng)用中數(shù)據(jù)挖掘技術(shù)的具體流程就是先通過(guò)對(duì)海量數(shù)據(jù)的保存,然后對(duì)保存好的數(shù)據(jù)進(jìn)行分析、整理、選擇和轉(zhuǎn)換等。數(shù)據(jù)的準(zhǔn)備工作是數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)前提,前期準(zhǔn)備工作的好壞也直接決定了數(shù)據(jù)挖掘技術(shù)的效率及質(zhì)量。在數(shù)據(jù)準(zhǔn)備工作完成之后工作人員需要進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行挖掘,在挖掘的基礎(chǔ)之上對(duì)數(shù)據(jù)進(jìn)行評(píng)估,然后達(dá)到應(yīng)用目的。數(shù)據(jù)挖掘技術(shù)可以應(yīng)用于多個(gè)方面,其挖掘的結(jié)果可以參與到政府、企業(yè)和個(gè)人的決策中,數(shù)據(jù)挖掘的社會(huì)價(jià)值得到了最大限度的發(fā)揮,其不斷改變著人們的生活方式,而文章結(jié)合筆者自身的工作經(jīng)驗(yàn),嘗試分析數(shù)據(jù)挖掘技術(shù)在高校中的應(yīng)用,其具體如下所示。
高校管理涉及到了多個(gè)方面的內(nèi)容,如學(xué)生在校的學(xué)習(xí)和生活中都涉及有管理方面的內(nèi)容,數(shù)據(jù)挖掘技術(shù)在高校管理中的內(nèi)容主要包含有高校招生錄取、貧困生選擇以及優(yōu)秀學(xué)生和班干部的評(píng)比等工作。從高校管理的角度來(lái)說(shuō),其每年的招生工作是學(xué)??沙掷m(xù)發(fā)展的重要環(huán)節(jié),招生質(zhì)量高低直接影響到了高校教學(xué)質(zhì)量以及未來(lái)的發(fā)展動(dòng)向,而將數(shù)據(jù)挖掘技術(shù)應(yīng)用到高校的招生管理工作中,可以快速有效的對(duì)學(xué)生高考成績(jī)、志愿填報(bào)方式以及生源地基本情況等進(jìn)行多方面的信息整合與匯總,這樣可以更加科學(xué)的對(duì)學(xué)生情況進(jìn)行評(píng)估,為學(xué)校選取更久優(yōu)質(zhì)的生源,促進(jìn)高校的長(zhǎng)遠(yuǎn)發(fā)展建設(shè)。數(shù)據(jù)挖掘技術(shù)應(yīng)用的具體步驟就是通過(guò)對(duì)數(shù)據(jù)的收集和預(yù)處理,建立相關(guān)的數(shù)據(jù)模型,然后借助分類算法,提取和挖掘最為有價(jià)值的信息,對(duì)所挖掘的數(shù)據(jù)進(jìn)行存儲(chǔ),以備后期使用,貧困生選擇以及優(yōu)秀學(xué)生和班干部評(píng)選中也可以應(yīng)用這種方式進(jìn)行數(shù)據(jù)挖掘處理。
教學(xué)評(píng)價(jià)是教育教學(xué)工作的重要組成部分,其能夠幫助教師深入的了解學(xué)生的學(xué)習(xí)情況,分析教學(xué)中存在的不足,并在后期的教學(xué)中及時(shí)的進(jìn)行調(diào)整,這樣能夠有效的提升教育教學(xué)質(zhì)量,而在高校課堂教學(xué)中評(píng)價(jià)也是不可或缺的。數(shù)據(jù)挖掘技術(shù)在高校課堂教學(xué)評(píng)價(jià)系統(tǒng)中的應(yīng)用主要也是借助關(guān)聯(lián)分析法,對(duì)各種數(shù)據(jù)進(jìn)行挖掘和利用。在實(shí)際工作中首先需對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,數(shù)據(jù)的預(yù)處理是數(shù)據(jù)挖掘技術(shù)的關(guān)鍵所在,如果預(yù)處理操作不當(dāng)則會(huì)直接影響到數(shù)據(jù)挖掘技術(shù)的應(yīng)用效率。數(shù)據(jù)預(yù)處理中需要將教師的基本信息、教學(xué)所教授課程以及教師的職稱、學(xué)歷、學(xué)生信息以及學(xué)生課表相關(guān)的信息進(jìn)行數(shù)據(jù)初始記錄,然后再實(shí)際教學(xué)中對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析處理,達(dá)到科學(xué)合理評(píng)價(jià)的目的。
在互聯(lián)網(wǎng)技術(shù)的支持之下,高校學(xué)生信息管理系統(tǒng)得以成功的構(gòu)建,該管理系統(tǒng)有助于學(xué)校各種重要信息的公布和搜索,該系統(tǒng)中管理要素主要是學(xué)校的領(lǐng)導(dǎo)、專業(yè)課教師、學(xué)生以及家長(zhǎng)。信息系統(tǒng)的主要功能則應(yīng)當(dāng)包含,對(duì)不同的用戶設(shè)置不同的使用權(quán)限;針對(duì)學(xué)生的基本信息以及瀏覽管理網(wǎng)站的記錄要做到明確記錄;各個(gè)學(xué)院不同專業(yè)的學(xué)生課程則應(yīng)當(dāng)可以公布并允許學(xué)生根據(jù)實(shí)際情況修改的信息;學(xué)生成績(jī)管理的錄入和修改等功能。數(shù)據(jù)挖掘技術(shù)在高校學(xué)生信息管理系統(tǒng)中的應(yīng)用主要借助的是決策樹(shù)的方法。
圖書(shū)館是高校的重要組成部分,圖書(shū)館內(nèi)擁有海量圖書(shū)資源其對(duì)于學(xué)生的學(xué)習(xí)發(fā)展有著極為重要的促進(jìn)作用,那么在教育教學(xué)中該如何有效發(fā)揮這些圖書(shū)資源的作用,使其能夠?yàn)閷W(xué)生所用呢?數(shù)據(jù)挖掘技術(shù)的誕生給圖書(shū)館資源的應(yīng)用提供了更加廣闊的空間,如數(shù)據(jù)挖掘技術(shù)可以快速的對(duì)圖書(shū)館內(nèi)不同類型的圖書(shū)資源進(jìn)行分類處理,了解學(xué)生的圖書(shū)借閱情況,以及當(dāng)前學(xué)校圖書(shū)館現(xiàn)有資源利用的基本情況,分析哪些圖書(shū)在學(xué)生心目中最受歡迎,這樣也可以為圖書(shū)館未來(lái)的發(fā)展建設(shè)提供更加可靠的方向,一定程度上來(lái)說(shuō),數(shù)據(jù)挖掘技術(shù)使得及圖書(shū)館資源得到了最大程度的優(yōu)化整合,高校圖書(shū)館的價(jià)值得到了有效的發(fā)揮。
大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)雖然在高校的多個(gè)領(lǐng)域得到了有效的應(yīng)用,給高校師生的學(xué)習(xí)和生活提供了較多的便利,但是數(shù)據(jù)挖掘技術(shù)在實(shí)際應(yīng)用中還有較多需要注意的事項(xiàng),首先要保證數(shù)據(jù)的安全性,防止數(shù)據(jù)被泄露,高校數(shù)據(jù)涉及到了多種師生信息,這些信息一旦被泄露,可能會(huì)給師生的正常生活帶來(lái)一定的困擾,因此在數(shù)據(jù)挖掘技術(shù)應(yīng)用過(guò)程中,要注意做好信息的存儲(chǔ)與處理工作,降低數(shù)據(jù)泄露風(fēng)險(xiǎn)。同時(shí),數(shù)據(jù)挖掘技術(shù)在應(yīng)用過(guò)程中對(duì)于計(jì)算機(jī)設(shè)備以及技術(shù)人員的應(yīng)用能力水平也有一定的要求,如果計(jì)算機(jī)設(shè)備落后,技術(shù)人員的應(yīng)用水平比較差,因此在應(yīng)用數(shù)據(jù)挖掘技術(shù)之前,還需及時(shí)的更新落后的計(jì)算機(jī)設(shè)備,保證各項(xiàng)設(shè)備軟件都是最新的,同時(shí)還需定期對(duì)技術(shù)人員進(jìn)行培訓(xùn),這樣也可以更好的發(fā)揮數(shù)據(jù)挖掘技術(shù)的作用價(jià)值。
總之,數(shù)據(jù)挖掘技術(shù)是計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)進(jìn)步的重要表現(xiàn),其能夠高效快捷的從海量數(shù)據(jù)中挖掘出人們想要的隱藏信息,該技術(shù)在金融、管理、教學(xué)等多個(gè)行業(yè)都有所應(yīng)用,其推動(dòng)了相關(guān)產(chǎn)業(yè)的發(fā)展,解決了傳統(tǒng)技術(shù)搜索中存在的不足,滿足了人們多元化的信息需求,而未來(lái)大數(shù)據(jù)挖掘技術(shù)的應(yīng)用面必將會(huì)越來(lái)越廣泛。