王煜 劉彤彤 郭磊
摘 要:本文在獲取校園一卡通數(shù)據(jù)的基礎(chǔ)上,采用數(shù)據(jù)挖掘與Logistic回歸分析方法,以某高校的助學(xué)金發(fā)放為例,分析助學(xué)金獲得者的共同特征,為其建立數(shù)學(xué)模型,以期完成精準(zhǔn)資助,幫助真正家庭貧困的同學(xué)順利完成學(xué)業(yè)。
關(guān)鍵詞:助學(xué)金;數(shù)據(jù)挖掘;影響因素;Logistic回歸分析
中圖分類號:G467.8 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-8454(2018)17-0064-03
一、引言
助學(xué)金是幫助困難學(xué)生完成學(xué)業(yè),保障學(xué)習(xí)質(zhì)量的重要手段。精確的助學(xué)金資助策略,體現(xiàn)了決策者的管理智慧和教育公平性。目前國內(nèi)許多學(xué)者主要關(guān)注以下幾個方面的研究內(nèi)容:①助學(xué)金管理模式的探索及體系的完善。國內(nèi)學(xué)者從影響資助的不同因素出發(fā),構(gòu)建了多樣化的資助評價體系。如余春玲根據(jù)平衡加分卡思想,分析了目前高校貧困學(xué)生資助模式存在的問題,并基于平衡記分卡,構(gòu)建了一個包含財(cái)務(wù)、客戶、內(nèi)部流程管理過程、學(xué)習(xí)與成長四個方面指標(biāo)的高校貧困學(xué)生資助評價體系。[1]張彥坤結(jié)合高校國家助學(xué)金評定實(shí)際情況,構(gòu)建了一套包括4項(xiàng)一級指標(biāo)、12項(xiàng)由一級指標(biāo)細(xì)化而來的子因素的助學(xué)金量化評定指標(biāo)體系。[2]②助學(xué)金制度績效調(diào)查分析。國內(nèi)學(xué)者大多從財(cái)政教育投資的投入、活動、產(chǎn)出、結(jié)果和影響等方面,多角度構(gòu)建了多層次的高等教育績效評價體系。[3]如陳綿水等從助學(xué)金發(fā)放(資金投入指標(biāo))、助學(xué)金使用(過程指標(biāo))、助學(xué)金效果(產(chǎn)出指標(biāo))三個方面評價助學(xué)金制度績效,得出我國助學(xué)金評定基本做到公平公正,但仍存在宣傳工作不盡人意,信息不夠暢通,存在少量暗箱操作等問題。[4]③關(guān)于影響助學(xué)金發(fā)放的因素模型的探究。國內(nèi)學(xué)者大多綜合利了模糊評價與熵權(quán)法,建立模糊評價模型。[5]如夏陽針對資助判定問題,運(yùn)用模糊層次分析方法,構(gòu)造模糊一致矩陣,建立了助學(xué)金判定模型。[6]也有學(xué)者利用了SPSS中的多元線性回歸模型。如鄧海云進(jìn)行多元線性回歸分析,應(yīng)用 stepwise方法,建立了評定的多元線性回歸關(guān)系模型。[7]
現(xiàn)有文獻(xiàn)研究多局限于理論層面的宏觀分析,實(shí)證分析和數(shù)學(xué)模型的輔助研究較少,并且已有的實(shí)證分析大都是通過問卷調(diào)查得到的數(shù)據(jù),具有一定的主觀性。本文則針對某高校校園一卡通的客觀數(shù)據(jù),采用數(shù)據(jù)挖掘技術(shù),利用相關(guān)性分析提取與獲得助學(xué)金與否有關(guān)的特征因子,以期進(jìn)行精準(zhǔn)助學(xué)金發(fā)放。本文的數(shù)據(jù)直接來自于較為客觀的學(xué)生一卡通數(shù)據(jù),在此基礎(chǔ)上,本文將獲得助學(xué)金與否作為被解釋變量,建立二分類Logistic回歸模型來直觀說明影響助學(xué)金獲得與否的關(guān)鍵因素。
二、模型設(shè)計(jì)
邏輯回歸又稱logistic回歸,是一種廣義線性回歸,用于在被解釋變量是非連續(xù)情況下進(jìn)行回歸分析。根據(jù)被解釋變量的分類方式不同,有二分類logistic回歸和多分類logistic回歸。
1.模型選擇
2.變量選取
三、實(shí)證分析
本文根據(jù)某高校學(xué)生一卡通數(shù)據(jù),選取108名學(xué)生作為樣本,進(jìn)行實(shí)證研究。
1.變量描述性統(tǒng)計(jì)分析
本文從極小值、極大值、均值、標(biāo)準(zhǔn)差四個方面對108名學(xué)生一個月的一卡通數(shù)據(jù)進(jìn)行描述。在各消費(fèi)中,食堂消費(fèi)的均值最大,為318.5,說明該校學(xué)生的花銷大多用于伙食消費(fèi);成績排名的標(biāo)準(zhǔn)差最大,達(dá)到843.5,說明所選學(xué)生的學(xué)習(xí)存在明顯的兩極分化;開水房消費(fèi)與坐校車次數(shù)的極小值為0,說明開水房消費(fèi)與校車消費(fèi)并不是學(xué)生的必須消費(fèi);去圖書館次數(shù)的標(biāo)準(zhǔn)差較大,說明學(xué)生的學(xué)習(xí)態(tài)度存在較大差異。具體描述情況見表2。
2.多重共線性分析
Hanushek和Jackson認(rèn)為Logistic回歸模型的參數(shù)易受解釋變量間共線性的影響[11],由于本文是多因素分析,為了防止各變量存在多重共線性,避免各個變量之間的相互影響,保證結(jié)果的準(zhǔn)確性,首先對解釋變量與被解釋變量進(jìn)行多重共線性檢驗(yàn)。[12]
本文選取方差膨脹因子(VIF)和條件索引(CI)來檢驗(yàn)變量間的共線性[13],一般認(rèn)為VIF值越大則變量共線性越強(qiáng),VIF≥5時存在復(fù)共線性,VIF≥10時存在嚴(yán)重共線性。當(dāng)條件索引 30≥CI≥10 時存在弱共線性,100≥CI≥30 時存在中等共線性,CI>100時存在嚴(yán)重共線性。而當(dāng)CI<10時認(rèn)為不存在共線性。
從表3的多重共線性分析結(jié)果可以看到,各個解釋變量的方差膨脹因子(VIF)的最大值為1.182,未超過5;條件索引(CI)的最大值為7.481,小于10,說明各變量之間不存在多重共線性問題,可以在一個模型中使用。
3.邏輯回歸分析
本文選取H-L擬合優(yōu)度檢驗(yàn)[14-15]來判斷模型的擬合情況,零假設(shè)為模型能夠很好地?cái)M合數(shù)據(jù)。分析結(jié)果顯示,Sig=0.596>0.1,接受零假設(shè),說明模型擬合數(shù)據(jù)程度好。
表4是對所有變量進(jìn)行二元邏輯回歸的結(jié)果。結(jié)果顯示,食堂消費(fèi)、開水房消費(fèi)與獲得助學(xué)金與否在1%的概率水平下呈顯著的負(fù)相關(guān)關(guān)系;坐校車的次數(shù)與獲得助學(xué)金與否在10%的概率水平下呈顯著的負(fù)相關(guān)關(guān)系。而超市消費(fèi)、成績排名、去圖書館次數(shù)與獲得助學(xué)金與否的關(guān)系并不明顯。
四、總結(jié)
1.結(jié)論分析
通過構(gòu)建logistic回歸模型以分析助學(xué)金獲得與否的影響因素,確定被解釋變量、選取解釋變量、檢驗(yàn)變量間多重共線性、檢驗(yàn)?zāi)P蛿M合度并利用SPSS軟件進(jìn)行模型分析與檢驗(yàn),得出以下結(jié)論:食堂消費(fèi)、開水房消費(fèi)、坐校車的次數(shù)與獲得助學(xué)金與否呈顯著的負(fù)相關(guān)關(guān)系;而超市消費(fèi)、成績排名、去圖書館次數(shù)與獲得助學(xué)金與否的關(guān)系不明顯。
本文認(rèn)為,食堂、開水房、校車等場所只能以學(xué)生一卡通作為消費(fèi)的途徑,可以較好地反映學(xué)生的實(shí)際經(jīng)濟(jì)情況,而超市等場所除可用學(xué)生一卡通支付外,還可使用現(xiàn)金,不能較好地反映學(xué)生的實(shí)際經(jīng)濟(jì)情況。由此可見,可以根據(jù)學(xué)生一卡通的食堂消費(fèi)、開水房消費(fèi)、坐校車次數(shù)等因素進(jìn)行助學(xué)金的評定,而超市消費(fèi)則不能作為評定的依據(jù)。同時,學(xué)生的用功情況及學(xué)習(xí)成績也不作為評定的依據(jù)。
2.對策建議
由實(shí)驗(yàn)可得出,評定助學(xué)金可以以學(xué)生一卡通信息為依據(jù),但通過一卡通信息進(jìn)行助學(xué)金評定時,應(yīng)選擇學(xué)生的食堂消費(fèi)、開水房消費(fèi)、坐校車次數(shù)等單消費(fèi)途徑的因素,超市消費(fèi)等多消費(fèi)途徑的因素由于不能反映學(xué)生的實(shí)際經(jīng)濟(jì)情況,不應(yīng)在考慮范圍之內(nèi)。
在此提出建議:在評定助學(xué)金時,通過學(xué)生一卡通消費(fèi)情況確定其家庭經(jīng)濟(jì)情況,以此作為發(fā)放的依據(jù)。在家庭經(jīng)濟(jì)情況相同時,可以優(yōu)先考慮評選學(xué)習(xí)成績較好、學(xué)習(xí)態(tài)度端正的學(xué)生,將學(xué)習(xí)情況也納入評定助學(xué)金的指標(biāo),以此激勵學(xué)生刻苦學(xué)習(xí)。
參考文獻(xiàn):
[1]余春玲.基于平衡記分卡的高校貧困學(xué)生資助評價體系[J].江蘇高教,2009(1):117-118.
[2]張彥坤.高校國家助學(xué)金量化評定管理模式探索[J].思想政治教育研究,2013(3):105-107.
[3]劉國永.高等教育財(cái)政支出績效評價指標(biāo)設(shè)計(jì)原理方法及運(yùn)用[J].教育與經(jīng)濟(jì),2007(3):30-35.
[4]陳綿水,付劍茹,施文藝.國家助學(xué)金制度績效調(diào)查分析[J].江西社會科學(xué),2013(11):232-236.
[5]侯其鋒.基于熵權(quán)法與模糊綜合評價模型的助學(xué)金評定方法[J].高校輔導(dǎo)員學(xué)刊,2012(5):61-64.
[6]夏陽,蔣誠鋼.基于模糊層次分析法的高校國家助學(xué)金評定模型[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會科學(xué)版),2017(4):437-441.
[7]鄧海云,熊良林,顏莉.基于SPSS助學(xué)金評選獲評因素的MLR模型構(gòu)建[J].云南民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(2):119-123.
[8]蘇磊.不同公司規(guī)模下公司治理結(jié)構(gòu)與信息披露質(zhì)量的關(guān)系研究[D].濟(jì)南:山東大學(xué),2012.
[9]付劍茹,張偉,陳綿水.針對微觀數(shù)據(jù)的新國家助學(xué)金政策——LOGIT模型實(shí)證分析[J].現(xiàn)代教育管理,2014(9):64-68.
[10]牛巖.作物產(chǎn)量指標(biāo)綜合評價的數(shù)據(jù)標(biāo)準(zhǔn)化處理[J].農(nóng)村經(jīng)濟(jì)與科技,2017(19):16-19.
[11]蔣紅衛(wèi),張羅漫,孟虹.Logstic回歸模型共線性三種降維方法的模擬比較研究[J].中國衛(wèi)生統(tǒng)計(jì),2010(6):562-566.
[12]白雪梅,趙松山.更深入地認(rèn)識多重共線性[J].東北財(cái)經(jīng)大學(xué)學(xué)報(bào),2005(2):8-12.
[13]魏晨,陳英,白志遠(yuǎn),黃思琴.基于Logic回歸模型的農(nóng)民宅基地退出意愿測算——以玉泉鎮(zhèn)4個村莊為例[J].中國農(nóng)學(xué)通報(bào),2014(32):114-121.
[14]吳明隆.問卷統(tǒng)計(jì)分析實(shí)務(wù)——SPSS 操作與應(yīng)用[M].重慶:重慶大學(xué)出版社,2010.
[15]康逸.基于邏輯回歸模型下微商市場中消費(fèi)者意愿的影響因素實(shí)證分析——以杭州市為例[J].當(dāng)代經(jīng)濟(jì),2016(28):38-40.
(編輯:王曉明)