摘要:由于我國(guó)大眾化高等教育的普及,高校學(xué)生數(shù)量的激增,給學(xué)生管理工作帶來了諸多新的問題,把數(shù)據(jù)挖掘中數(shù)據(jù)倉(cāng)庫(kù)和聯(lián)機(jī)分析處理等技術(shù)合理應(yīng)用到高校學(xué)生綜合測(cè)評(píng)體系中,是解決上述問題的一種有益探索,并在高校各項(xiàng)工作起到輔助決策作用,對(duì)提高管理水平和效率具有重要的意義。
關(guān)鍵詞:數(shù)據(jù)挖掘;學(xué)生;測(cè)評(píng)
伴隨我國(guó)高等教育由精英化教育向大眾化教育逐漸轉(zhuǎn)變,勢(shì)必給學(xué)校學(xué)生管理帶來諸多問題。學(xué)生的信息大量且復(fù)雜,學(xué)生的狀態(tài)和發(fā)展越來越難以預(yù)測(cè)。因此學(xué)校迫切地希望學(xué)生管理信息系統(tǒng)能夠具備輔助決策的能力,尤其是在大學(xué)生綜合測(cè)評(píng)中。經(jīng)研究發(fā)現(xiàn),數(shù)據(jù)倉(cāng)庫(kù)和聯(lián)機(jī)分析處理技術(shù)是可行而有效的方法。
一、數(shù)據(jù)倉(cāng)庫(kù)和聯(lián)機(jī)分析處理
聯(lián)機(jī)分析處理(OLAP)的概念最早是由關(guān)系數(shù)據(jù)庫(kù)之父E.F.Codd于1993年提出的,他同時(shí)提出了關(guān)于OLAP的12條準(zhǔn)則。而Nigel Pendse和Richard Creeh將OLAP應(yīng)用定義為快速分析共享的多維信息(FASMI)。
構(gòu)造數(shù)據(jù)倉(cāng)庫(kù)涉及數(shù)據(jù)清理和數(shù)據(jù)集成,可看作數(shù)據(jù)挖掘的重要預(yù)處理。此外,數(shù)據(jù)倉(cāng)庫(kù)提供聯(lián)機(jī)分析處理(OLAP)工具,用于各種粒度的多維數(shù)據(jù)分析。因此,數(shù)據(jù)倉(cāng)庫(kù)成為數(shù)據(jù)分析和聯(lián)機(jī)分析處理日趨重要的平臺(tái),并將為數(shù)據(jù)挖掘提供有效的支持。
一般數(shù)據(jù)倉(cāng)庫(kù)體系可分為四層次結(jié)構(gòu),如圖1所示。
對(duì)于學(xué)生綜合測(cè)評(píng)數(shù)據(jù)倉(cāng)庫(kù),第一層數(shù)據(jù)源是學(xué)生綜合信息,經(jīng)過數(shù)據(jù)清理和抽取,在第二層數(shù)據(jù)倉(cāng)庫(kù),即開發(fā)的學(xué)生綜合測(cè)評(píng)信息系統(tǒng)中進(jìn)行存儲(chǔ)和管理,之后通過第三層OLAP服務(wù)器進(jìn)行各種處理和集成,在第四層前端工具,SQL server2000的Analysis Services和 DBMiner軟件建立多維挖掘模型,形成可視化數(shù)據(jù)立方體,進(jìn)行數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)。
本系統(tǒng)的開發(fā)基于VB語(yǔ)言,數(shù)據(jù)庫(kù)為SQL server 2000數(shù)據(jù)庫(kù)管理系統(tǒng)??紤]到數(shù)據(jù)的安全性,采用客戶/服務(wù)器方式,數(shù)據(jù)庫(kù)管理以學(xué)生管理中心數(shù)據(jù)庫(kù)為核心,其它部門數(shù)據(jù)庫(kù)管理相對(duì)獨(dú)立,定期向中心數(shù)據(jù)庫(kù)提交數(shù)據(jù)。
二.具體應(yīng)用
1. 物理結(jié)構(gòu)和數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)
數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)結(jié)構(gòu)為星型模式。主題事實(shí)表是匯總整理后的“綜合測(cè)評(píng)事實(shí)表”,以及“學(xué)生情況”、“時(shí)間”、“性別”等三個(gè)維度表。由此,我們可以在建立數(shù)據(jù)立方體之后,方便地在時(shí)間(總時(shí)間、學(xué)年、學(xué)期)、學(xué)生基本情況和性別等各個(gè)維度上對(duì)綜合測(cè)試內(nèi)容(包括德育水平、學(xué)業(yè)水平、課外實(shí)踐能力、綜合能力)進(jìn)行分析和選擇,并根據(jù)需要進(jìn)行各種OLAP操作。
2. 構(gòu)建多維數(shù)據(jù)模型
我們把有效數(shù)據(jù)進(jìn)行提取,并利用MOLAP服務(wù)器建立多維數(shù)據(jù)模型。在學(xué)生綜合測(cè)評(píng)可視的多維立方體上進(jìn)行OLAP操作,通過對(duì)立方體的上卷、下鉆、切片和切塊,可以看到任何學(xué)生或任何班級(jí)在任意時(shí)間段的某一項(xiàng)或綜合測(cè)評(píng)結(jié)果。對(duì)于管理者,可以了解每個(gè)學(xué)生或班級(jí)的發(fā)展?fàn)顩r,起到有效的輔助決策作用;對(duì)于用人單位,也可以了解到畢業(yè)生在校期間的表現(xiàn)情況,使人才的選拔更加客觀和準(zhǔn)確。
在數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,通過Analysis Services生成三維學(xué)生綜合測(cè)評(píng)數(shù)據(jù)立方體。但Analysis Services不能數(shù)據(jù)可視化。我們采用了數(shù)據(jù)挖掘系統(tǒng)——DBMiner軟件實(shí)現(xiàn)數(shù)據(jù)立方體的可視化操作。圖2是利用Analysis Services和DBMiner生成的綜合測(cè)評(píng)數(shù)據(jù)的三維立方體形式表示。我們可以通過顏色和小立方體的大小就可以直接看出學(xué)生的綜合、德育、學(xué)業(yè)和課外實(shí)踐情況。
下面我們舉例對(duì)多維數(shù)據(jù)立方體進(jìn)行OLAP操作。圖3為先按學(xué)號(hào)維進(jìn)行了從學(xué)號(hào)到班級(jí)的上卷后,按時(shí)間維進(jìn)行了從學(xué)期到學(xué)年的上卷。我們可以直觀看到某個(gè)班級(jí)的在一學(xué)年的總體情況。圖4為從總時(shí)間到學(xué)期下鉆操作,生成按學(xué)期顯示的綜合測(cè)評(píng)立方體。
圖5為總數(shù)據(jù)切塊生成的十個(gè)學(xué)生的測(cè)評(píng)情況。立方體的尺寸和顏色直觀表示了學(xué)生的學(xué)業(yè)水平和課外實(shí)踐情況。實(shí)際上,只需將鼠標(biāo)點(diǎn)在小立方體上,即顯示出某學(xué)生在某學(xué)期的測(cè)評(píng)數(shù)據(jù)。如圖,鼠標(biāo)所在位置顯示的是其第六學(xué)期的學(xué)業(yè)測(cè)評(píng)值和課外實(shí)踐值分別為76.72和2。
三.結(jié)論
本研究著眼于管理的模型和方法,從管理的角度研究數(shù)據(jù)倉(cāng)庫(kù)和聯(lián)機(jī)分析處理技術(shù)的應(yīng)用,采用定量分析和定性相結(jié)合的方法,對(duì)于高校本科學(xué)生管理中的一些問題給出新的科學(xué)的解決方法。
作者單位:北京航空航天大學(xué)經(jīng)濟(jì)管理學(xué)院
參考文獻(xiàn):
[1]Jiawei