国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SPSS Modeler建模的大學(xué)英語四級(jí)考試通過率影響因素分析

2018-05-14 08:55王科余禮娜石川
關(guān)鍵詞:決策樹神經(jīng)網(wǎng)絡(luò)

王科 余禮娜 石川

摘要:基于SPSS Modeler,使用決策樹和神經(jīng)網(wǎng)絡(luò)兩種統(tǒng)計(jì)分析方法,對(duì)影響大學(xué)英語四級(jí)考試通過率的閱讀、聽力、寫作及翻譯等四個(gè)方面因素進(jìn)行了分析。認(rèn)為閱讀和聽力對(duì)英語四級(jí)考試通過率影響最大,寫作和翻譯相對(duì)較小。相對(duì)于以往的一些研究方法,這決策樹和神經(jīng)網(wǎng)絡(luò)兩種統(tǒng)計(jì)分析方法預(yù)測(cè)精度高,結(jié)果更加準(zhǔn)確和直觀,對(duì)于提高學(xué)生英語四級(jí)考試通過率起到積極的指導(dǎo)作用。另外,決策樹和神經(jīng)網(wǎng)絡(luò)也可推廣其他相關(guān)的情況的分析和預(yù)測(cè)。

關(guān)鍵詞:SPSS Modeler;決策樹;神經(jīng)網(wǎng)絡(luò)

中圖分類號(hào):H319.6 文獻(xiàn)標(biāo)志碼:A

文章編號(hào):2095-5383(2018)03-0061-03

Abstract: Based on SPSS Modeler, this paper used statistical analysis methods,decision tree and neural network,to analyze four factors: reading, listening, writing and translation. It concluded that reading and listening have the greatest impact on the passing rate of CET4. Writing and translation have relatively small impact. Compared with previous research methods, the two methods have high prediction accuracy. The results are more accurate and intuitive. They play a positive role in improving the passing rate of CET4. In addition, decision trees and neural networks can also be used to promote the analysis and prediction of other related situations.

Keywords:SPSS Modeler;decision trees; neural networks

大學(xué)英語四級(jí)考試是具有較高權(quán)威性的全國(guó)統(tǒng)一考試,其通過率是衡量高校英語教學(xué)水平的主要指標(biāo)之一,各高校高度重視英語四級(jí)考試通過率的提高。而學(xué)校作為整個(gè)教學(xué)過程的宏觀管理者,制定合理的教學(xué)計(jì)劃,對(duì)于提高學(xué)生的英語四級(jí)考試的通過率將起到非常重要的作用。

眾所周知,英語四級(jí)考試由四個(gè)部分組成:閱讀、聽力、寫作及翻譯。在教學(xué)計(jì)劃的制定中,限于教學(xué)學(xué)時(shí),四個(gè)部分不可能面面俱到,而應(yīng)根據(jù)學(xué)生薄弱環(huán)節(jié),有側(cè)重地開展教學(xué)活動(dòng),有效提高學(xué)生英語四級(jí)考試的通過率。

1 研究背景

目前有一些研究英語四級(jí)考試通過率影響因素的文獻(xiàn),但是,這些文獻(xiàn)有的僅作了理論分析,沒有對(duì)實(shí)際問題進(jìn)行深入討論[1-3],還有的雖然通過一些統(tǒng)計(jì)分析方法對(duì)英語四級(jí)考試通過率作了相關(guān)研究,但僅使用回歸分析、相關(guān)分析等簡(jiǎn)單的統(tǒng)計(jì)分析方法[4-5],只能處理線性關(guān)系的情況,且預(yù)測(cè)誤差大。

SPSS Modeler對(duì)于大數(shù)據(jù)處理操作簡(jiǎn)便,實(shí)用性強(qiáng)。 SPSS Modeler的動(dòng)態(tài)建模技術(shù)能夠?qū)?shí)時(shí)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。[6-7]通過該軟件對(duì)英語四級(jí)考試成績(jī)分析,能夠充分了解學(xué)生的學(xué)習(xí)情況及教師的教學(xué)情況,這樣有利于教師根據(jù)學(xué)生學(xué)習(xí)需要,調(diào)整教學(xué)計(jì)劃,有利于提高學(xué)生四級(jí)考試通過率。

2 研究目的

本文運(yùn)用決策樹和神經(jīng)網(wǎng)絡(luò)算法,對(duì)以往的四級(jí)考試成績(jī)進(jìn)行分析,使用SPSS Modeler軟件,對(duì)影響大學(xué)英語四級(jí)通過率的閱讀、聽力、寫作及翻譯等四個(gè)方面因素進(jìn)行了分析,找出影響四級(jí)通過率的主要影響因素,為教學(xué)和管理提供有價(jià)值的參考。

3 研究方法

3.1 數(shù)據(jù)準(zhǔn)備

選取成都工業(yè)學(xué)院2013—2016年的本科學(xué)生參加英語四級(jí)考試成績(jī)作為研究對(duì)象(除去缺考的考生)。通過SPSS Modeler的Partition節(jié)點(diǎn)將現(xiàn)有樣本集隨機(jī)分割成兩部分,其中一份用于建立和訓(xùn)練模型,稱為訓(xùn)練樣本集;另一份用于模型誤差的估計(jì),稱為檢驗(yàn)樣本集。對(duì)于總分按式(1)處理,

3.2 數(shù)據(jù)分析

選取成都工業(yè)學(xué)院2012—2014年的本科學(xué)生參加英語四級(jí)考試成績(jī)作為研究對(duì)象,以SPSS Modeler為基礎(chǔ)進(jìn)行建模,以閱讀(T1)、聽力(T2)、寫作(T3)及翻譯(T4)這四個(gè)因素為輸入變量,是否通過為輸出變量(Y)進(jìn)行Logistic回歸分析、決策樹分析及神經(jīng)網(wǎng)絡(luò)分析,找出影響英語四級(jí)考試通過率的主要因素,為制定教學(xué)計(jì)劃給出更加科學(xué)的建議。

3.2.1 決策樹分析

決策樹算法最早源于人工智能的機(jī)器學(xué)習(xí)技術(shù),用以實(shí)現(xiàn)數(shù)據(jù)內(nèi)在規(guī)律的研究和新數(shù)據(jù)對(duì)象的分類預(yù)測(cè)。決策樹算法通過向數(shù)據(jù)學(xué)習(xí),依據(jù)新數(shù)據(jù)輸入變量的取值,推斷其輸出變量的分類取值。本文以C5.0決策樹算法介紹,

決策樹算法的核心問題是確定決策樹分支準(zhǔn)則,C5.0以信息增益率為標(biāo)準(zhǔn)確定最佳分組變量和分割點(diǎn),其核心概念是信息熵。設(shè)訓(xùn)練樣本數(shù)據(jù)集中有m個(gè)獨(dú)立的類ci,i=1,2,…,m。Ri為數(shù)據(jù)集S中屬于類Ci的子集,子集Ri中元組的數(shù)量用ri表示,則集合S在分類中期望信息量可以式(2)表示:

3.2.2 神經(jīng)網(wǎng)絡(luò)分析

神經(jīng)網(wǎng)絡(luò)是一種人腦的抽象計(jì)算模型,是一種模擬人腦思維的計(jì)算機(jī)建模方式。神經(jīng)網(wǎng)絡(luò)分類算法是在加法器和激活函數(shù)的共同作用下,以節(jié)點(diǎn)來構(gòu)造一個(gè)超平面。將訓(xùn)練樣本集中的每個(gè)樣本看作n維空間上的點(diǎn),一個(gè)超平面將n維空間劃分成兩個(gè)部分:處于超平面上部的所有樣本點(diǎn)為一類,將超平面下部的所有點(diǎn)為另一類,從而實(shí)現(xiàn)二值分類。

1)數(shù)據(jù)準(zhǔn)備

神經(jīng)網(wǎng)絡(luò)中輸入變量的取值范圍通常要求在0~1之間,首先用極差法將數(shù)據(jù)標(biāo)準(zhǔn)化處理,即

3)神經(jīng)網(wǎng)絡(luò)訓(xùn)練

由輸入模式向量Sk和輸出向量yk訓(xùn)練連接權(quán)向量W,然后不斷修正連接權(quán)向量,使誤差平方和達(dá)到最小。

3.3 數(shù)值模擬

以操作系統(tǒng)Win8,軟件SPSS Modeler 14.1為實(shí)驗(yàn)平臺(tái),建立模型如圖1所示。

節(jié)點(diǎn)包括數(shù)據(jù)節(jié)點(diǎn)、類型節(jié)點(diǎn)、分割節(jié)點(diǎn)、模型節(jié)點(diǎn)和分析節(jié)點(diǎn)。其中,數(shù)據(jù)節(jié)點(diǎn)用于導(dǎo)入數(shù)據(jù);類型節(jié)點(diǎn)用于對(duì)導(dǎo)入數(shù)據(jù)進(jìn)行分類,將閱讀(yd)、聽力(tl)、寫作(xz)及翻譯(zh)這四個(gè)變量為輸入變量,是否通過為輸出變量;分割節(jié)點(diǎn)隨機(jī)將樣本分成預(yù)測(cè)樣本和檢驗(yàn)樣本;模型節(jié)點(diǎn)對(duì)于不同的模型采用相應(yīng)的模型節(jié)點(diǎn),即決策樹分析采用決策樹模型節(jié)點(diǎn),神經(jīng)網(wǎng)絡(luò)分析采用神經(jīng)網(wǎng)絡(luò)模型節(jié)點(diǎn);分析節(jié)點(diǎn)用于檢驗(yàn)預(yù)測(cè)的精度。

3.3.1 決策樹分析

通過決策樹分析結(jié)果的軟件界面如圖2所示。

由圖2可知,閱讀對(duì)四級(jí)考試通過率的影響最大,聽力次之,寫作和綜合對(duì)通過率影響相對(duì)較小。本次估計(jì)的預(yù)測(cè)精度為99.31%,驗(yàn)證精度為97.62%。

3.3.2 神經(jīng)網(wǎng)絡(luò)分析

通過決策樹分析結(jié)果的軟件界面如圖3所示。

由圖3可知,聽力對(duì)四級(jí)考試通過率的影響最大,閱讀次之,寫作和綜合對(duì)通過率影響相對(duì)較小。本次估計(jì)的預(yù)測(cè)精度為99.99%,驗(yàn)證精度為99.97%。

4 結(jié)語

根據(jù)上文分析可以看出,聽力和閱讀對(duì)四級(jí)考試通過率的影響較大,寫作和綜合影響相對(duì)較小。SPSS Modeler動(dòng)態(tài)建模優(yōu)于以往的一些分析方法,能從試題的角度準(zhǔn)確發(fā)現(xiàn)影響學(xué)生英語四級(jí)考試通過率的因素,對(duì)及時(shí)調(diào)整教學(xué)計(jì)劃和教學(xué)方法,起到一定的指導(dǎo)作用。

參考文獻(xiàn):

[1]薛薇,陳歡歌.SPSS Modeler數(shù)據(jù)挖掘方法及應(yīng)用[M].2版. 北京:電子工業(yè)出版社,2014:75-82.

[2]李潔. 提高大學(xué)英語四級(jí)通過率的措施探討[J]. 海外英語, 2011(10x):57-58.

[3]朱瑋, 劉漢香. 提高大學(xué)英語四級(jí)通過率的措施探討[J]. 河南機(jī)電高等??茖W(xué)校學(xué)報(bào), 2006, 14(4):118-119.

[4]李紅燕, 曹蘇娜, 曹貽鵬,等. 基于統(tǒng)計(jì)分析的英語四級(jí)通過率和入學(xué)重點(diǎn)率的相關(guān)性之實(shí)證研究[J]. 時(shí)代教育, 2010(7):121-122.

[5]段嘉芊, 周廣榮. 《大學(xué)英語》與四、六級(jí)考試的相關(guān)性分析[J]. 云南民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版), 2002, 19(2):115-118.

[6]MENG X H, HUANG Y X, RAO D P. Comparison of three data mining models for predicting diabetes or prediabetes by risk factors[J]. Kaohsiung Journal of Medical Sciences,2013(29):93-99.

[7]KUROSAKI M, TANAKA Y, NISHIDA N, et al. Pre-treatment prediction of response to pegylated-interferon plus ribavirin for chronic hepatitis C using genetic polymorphism in IL28B and viral factors[J]. Journal of Hepatology, 2011, 54(3):439-448.

[8]馮建, STARZYK, JANUSZ,等. 一種基于信息熵的金融數(shù)據(jù)神經(jīng)網(wǎng)絡(luò)分類方法[J]. 控制與決策, 2012, 27(2):211-215.

猜你喜歡
決策樹神經(jīng)網(wǎng)絡(luò)
基于人工智能LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)成績(jī)預(yù)測(cè)
基于圖像處理與卷積神經(jīng)網(wǎng)絡(luò)的零件識(shí)別
基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)穩(wěn)定性預(yù)測(cè)
簡(jiǎn)述一種基于C4.5的隨機(jī)決策樹集成分類算法設(shè)計(jì)
三次樣條和二次刪除相輔助的WASD神經(jīng)網(wǎng)絡(luò)與日本人口預(yù)測(cè)
決策樹學(xué)習(xí)的剪枝方法
決策樹在施工項(xiàng)目管理中的應(yīng)用