国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)下數(shù)字化校園系統(tǒng)的分析與研究

2020-01-02 23:31劉建花
數(shù)字通信世界 2020年3期
關(guān)鍵詞:結(jié)點決策樹數(shù)據(jù)挖掘

劉建花

(晉中師范高等??茖W校數(shù)理科學系,晉中 030600)

0 引言

數(shù)據(jù)挖掘技術(shù)在數(shù)字化校園系統(tǒng)中的作用主要是通過分析高校中各種類型的大量數(shù)據(jù)為高校制定各項決策提供數(shù)據(jù)依據(jù),以此來不斷提高學校教學、管理、服務的各項水平。

1 數(shù)據(jù)挖掘技術(shù)下數(shù)字化校園系統(tǒng)中的重要性

1.1 實現(xiàn)智能化教學

在高校的數(shù)字化教學中,學生可自主式學習,與老師、同學互動留言,提高學生對時間的利用率。智能化教學將每個學生的學習過程進行記錄,教師根據(jù)學生的學習情況進行合理的課堂設(shè)計,對學生針對性的教學和輔導。

1.2 提高學校管理效率

在數(shù)字化校園系統(tǒng)中,學校將網(wǎng)站中的一些留言、發(fā)表的稿子以及一些評論的數(shù)據(jù)信息分析處理后,對教師的教學效果進行預測,對教學活動進行更好地管理和服務。

1.3 實現(xiàn)智能化服務

系統(tǒng)將用戶數(shù)據(jù)和資料進行管理和整合,用戶登錄平臺對身份識別驗證后獲取相應的使用權(quán)限,享受其對應的功能服務。

2 數(shù)據(jù)挖掘技術(shù)下數(shù)字化校園系統(tǒng)構(gòu)建

2.1 總體技術(shù)架構(gòu)

在數(shù)字化校園中,從上至下由四個方面進行建構(gòu):一是業(yè)務系統(tǒng)應用層。有校教務管理系統(tǒng)、科研管理系統(tǒng)、網(wǎng)絡教學和成績管理系統(tǒng)以及檔案管理系統(tǒng)等。二是平臺管理層。利用數(shù)據(jù)挖掘技術(shù),將應用層的數(shù)據(jù)進行收集、篩選、備份、分析、整理,讓數(shù)據(jù)系統(tǒng)化。三是網(wǎng)絡綜合層。有校園網(wǎng)、移動網(wǎng)和物聯(lián)網(wǎng),利用無線技術(shù)和IP技術(shù),將網(wǎng)絡信息進行全面覆蓋,收集更多數(shù)據(jù)。四是感知層。通過GPS、RFID以及傳感器等設(shè)備對校園中的信息進行采集、處理和篩選,然后傳輸?shù)叫畔⑵脚_中。

2.2 系統(tǒng)功能設(shè)計

借鑒其他學校數(shù)字化校園系統(tǒng)構(gòu)建的經(jīng)驗,將管理、科研、教學、安全、生活等方面結(jié)合,為教師和學生構(gòu)建數(shù)字化的校園環(huán)境。

(1)校務和辦公自動化。整個數(shù)字化校園的重要的環(huán)節(jié),所有業(yè)務都在系統(tǒng)上完成,包括教職工任務,領(lǐng)導審批,有效提高效率,真正實現(xiàn)辦公無紙。

(2)智能教學。教師的教學計劃、學生的考試、閱卷、成績的錄入等環(huán)節(jié)都在系統(tǒng)上進行。

(3)教研查詢。教師可以將課研成果,包括科研論文、教案、教學經(jīng)驗的總結(jié)以及教學視頻等資源上傳到系統(tǒng)進行展示和交流,相互分享。在課題管理系統(tǒng)中,方便申報課題與中期檢查,教研人員節(jié)省了報告的時間。

(4)智能平安校園。利用物聯(lián)網(wǎng)技術(shù),植物灌溉和養(yǎng)護、照明、門禁、監(jiān)控以及報警實現(xiàn)智能化,既節(jié)省費用,也提高效率。

(5)智能校園生活。采用無限射頻識別技術(shù),學生只需要一部手機,實現(xiàn)電子簽到、超市購物、費用繳納等功能。

2.3 關(guān)鍵技術(shù)

數(shù)字化校園構(gòu)建中用到的技術(shù)和數(shù)據(jù)挖掘算法:

(1)云計算:主要對虛擬化的資源進行分配,對數(shù)據(jù)進行整理和量化。

(2)物聯(lián)網(wǎng)技術(shù):將數(shù)據(jù)信息、互聯(lián)網(wǎng)技術(shù)以及遠程操作等技術(shù)結(jié)合起來,實現(xiàn)智能化。

(3)移動互聯(lián)網(wǎng)技術(shù):提供安全的網(wǎng)絡環(huán)境,實現(xiàn)對人員的動態(tài)管理,使得生活更加便捷。

(4)決策樹方法一般用于將數(shù)據(jù)分類,由構(gòu)造樹和修剪樹兩個過程。先開始使用初始數(shù)據(jù)生成測試函數(shù),依據(jù)所得到的值生成樹的分支,重復步驟,再各個分支上再生成下一層的分支和結(jié)點,這樣生成的樹稱之為決策樹,然后再對決策樹進行修剪,最后生成規(guī)則。該算法有ID3、IBLE等。

3 數(shù)字化校園系統(tǒng)中成績管理系統(tǒng)的評估模型分析

本校學生最終考試成績由平時成績和期末成績決定,平時成績占40%,期末成績占60%,考試形式有筆試、機試、論文、表演等,考試方式有考查和考試兩種??纪旰笥纱n老師登錄成績管理系統(tǒng)提交成績生成最終考試成績。

在成績管理系統(tǒng)中,為了分析考試成績數(shù)據(jù),第一項將成績數(shù)據(jù)進行預處理,第二項將連續(xù)成績數(shù)據(jù)轉(zhuǎn)換為離散的數(shù)據(jù),第三項利用決策樹中ID3算法進行屬性歸納出成績規(guī)則,第四項教師和學生進行相應的分析評估。

數(shù)據(jù)預處理過程有對空值的處理、對無用信息進行消減等步驟。系統(tǒng)中采用忽略的方式解決因為缺考、作弊產(chǎn)生的空值。將開課單位、班級、學期、科目類型、代課老師等無關(guān)字段刪去,只保留學號、姓名、性別、科目、考核方式、平時成績、期末成績和最后的成績等字段。

數(shù)據(jù)的離散型處理分兩過程組成:一先將成績按是否大于等于60分來判斷成績是否合格劃分,二將上一步60分以上的成績執(zhí)行下列步驟:一是將成績數(shù)據(jù)進行排序;二是去除重復數(shù)據(jù);三是根據(jù)相應的比例劃分等級;四是根據(jù)確立好的等級標準離散化數(shù)據(jù)。

比如期末考試成績(67,87,69,79,77,88,79,86,79,60,70,71,76,98,89,…)將分數(shù)從高到低排序,并去除重復的值,(98,89,88,87,86,79,77,76,71,70,69,67,60,…),可將成績的25%,50%,25%劃分A、B、C三個等級,把產(chǎn)生的等級作為成績表中新的字段值。最后需在原成績表中的字段XH(學號)、XM(姓名)、KM(科目)、PC(平時成績)、QC(期末成績)、ZC(綜合成績)中增加字段PCDJ(平時成績等級)、QCDJ(期末成績等級)、YX(優(yōu)秀否)、JG(及格否)。

利用ID3算法構(gòu)造決策樹。該算法是遞歸算法的一種,其算法思想:(1)首先生成一個結(jié)點。(2)根據(jù)判斷是否屬于同一類的結(jié)果來確定是否是葉結(jié)點,如果是,該結(jié)點是葉結(jié)點。(3)如果否,依據(jù)信息增益的基于熵的度量啟發(fā)信息,重新選擇屬性,將數(shù)據(jù)樣本進行分類,成為該結(jié)點測試和判定屬性。(4)再根據(jù)測試屬性的每一個值,創(chuàng)建一個分支,以此劃分樣本數(shù)據(jù),所有的屬性都進行離散化轉(zhuǎn)化。該算法符合以下三種情況遞歸結(jié)束:一是結(jié)點的數(shù)據(jù)屬于同一類;二是數(shù)據(jù)全部屬性都測試完,沒有可利用的屬性來劃分數(shù)據(jù);三是分支沒有數(shù)據(jù)樣本了,遇到此情況下創(chuàng)建一個葉結(jié)點。

算法步驟:

輸入:由離散值屬性表示的樣本值samp,候選屬性集合att_list

(1)初始化一個結(jié)點M。

(2)如果結(jié)點中的所有樣本都屬于同一類別B,該結(jié)點屬于葉結(jié)點。

(3)返回決策樹tree,B為結(jié)點的類標記。

(4)判斷att_list是否為空。

(5)如果空,該決策樹為單結(jié)點樹,B記作類別個數(shù)最多的類別。

(6)如果非空,在att_list里選擇一個最大的信息增益的屬性特征m_att。

(7)m_att的信息增益和閾值相比,如果m_att 大,則決策樹為單結(jié)點樹,B作為實例數(shù)最大的類的類標記。

(8)如果m_att小,對m_att的取值mm,根據(jù)取值劃分樣本值子集sampi,將子集中實例數(shù)最大的類作為標記,創(chuàng)建子結(jié)點,由結(jié)點和其子樹構(gòu)成決策樹,返回。

(9)對下個子結(jié)點,以sampi為新的樣本值數(shù)據(jù)集,以att_list-{m_att}為候選屬性遞歸重復以上步驟。

創(chuàng)建好決策樹后,使用后剪枝方法中代價復雜性剪枝對樹進行修剪。此算法需要計算樹中每個非葉結(jié)點刪去該結(jié)點后子樹所產(chǎn)生的期望錯誤率,低的期望錯誤率則修剪該子樹,否則保留該子樹。

決策樹剪枝完成后,將決策樹分析出的信息進行提取,生產(chǎn)成績系統(tǒng)的評估模型,也就是生成分類規(guī)則,產(chǎn)生學生的考核等級,可預測學生的成績是否及格或優(yōu)秀,分析規(guī)則,分析影響學生成績的原因。

4 結(jié)束語

目前,數(shù)據(jù)挖掘技術(shù)處于不斷的探索和研究過程中,在完善數(shù)字化校園系統(tǒng)的過程中利用數(shù)據(jù)挖掘技術(shù)讓數(shù)據(jù)變得更加有用,使數(shù)字化校園系統(tǒng)功能更加完善。

猜你喜歡
結(jié)點決策樹數(shù)據(jù)挖掘
改進支持向量機在特征數(shù)據(jù)挖掘中的智能應用
LEACH 算法應用于礦井無線通信的路由算法研究
基于八數(shù)碼問題的搜索算法的研究
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于事故數(shù)據(jù)挖掘的AEB路口測試場景
決策樹和隨機森林方法在管理決策中的應用
決策樹學習的剪枝方法
軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
決策樹多元分類模型預測森林植被覆蓋
決策樹在施工項目管理中的應用