段菊
摘要:扶貧問題一直以來備受關(guān)注,隨著大數(shù)據(jù)技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校精準(zhǔn)扶貧中,但數(shù)據(jù)分析對(duì)象僅限于校園一卡通數(shù)據(jù),存在一定的局限性。隨著高校信息化建設(shè)的完善升級(jí),移動(dòng)支付已是遍地開花,因此,數(shù)據(jù)分析的對(duì)象還需要考慮移動(dòng)支付產(chǎn)生的數(shù)據(jù),提出移動(dòng)支付背景下數(shù)據(jù)挖掘技術(shù)在高校扶貧中的應(yīng)用研究。對(duì)移動(dòng)支付和校園一卡通數(shù)據(jù)的綜合分析與挖掘,在一定程度上提高了扶貧的精確度。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;移動(dòng)支付;校園一卡通;精準(zhǔn)扶貧
中圖分類號(hào):TP391.4 ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? 文章編號(hào):1009-3044(2018)35-0015-02
Abstract:The issue of poverty alleviation has attracted much attention. With the development of big data technology, data mining technology is applied to the precise poverty alleviation of colleges and universities, but the data analysis object is limited to campus card data, which has certain limitations. With the improvement and upgrading of university Information construction, mobile payment has been everywhere. Therefore, the object of data analysis also needs to consider the data generated by mobile payment. This paper proposes the application of data mining technology in poverty alleviation in Colleges and Universities under the background of mobile payment. The comprehensive analysis of mobile payment and campus card data improves the accuracy of poverty alleviation.
Key words: big data;data mining technology;mobile payment;campus card; precise poverty alleviation
1 概述
確定扶貧對(duì)象的傳統(tǒng)做法是通過調(diào)查走訪、個(gè)人申請(qǐng)、學(xué)生評(píng)議等方式來確定,過程復(fù)雜、耗時(shí)耗財(cái)又耗力,不適合大面積推廣使用,并且存在有些學(xué)生自尊心強(qiáng)不愿意自主申請(qǐng),即使辦理了資助在心理上也覺得自卑,如果可以“隱形資助”在一定程度上可以消除這些學(xué)生的顧慮,目前有些高校已經(jīng)實(shí)現(xiàn)[1]。
這些高校無疑是通過借助數(shù)據(jù)挖掘技術(shù)[2],對(duì)校園一卡通的海量數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)挖掘[3](Data Mining)是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。校園卡作為學(xué)生在校園里的唯一身份認(rèn)證憑證,記錄了學(xué)生就餐、購物、借閱圖書、洗浴等信息,提取校園卡中學(xué)生消費(fèi)的信息、考勤信息等可以用來判定學(xué)生的貧困程度。文獻(xiàn)[4]中通過挖掘?qū)W生的消費(fèi)模式、學(xué)習(xí)模式和生活模式來判斷該生是否為貧困生,再加以實(shí)際調(diào)研來確定;文獻(xiàn)[5]對(duì)校園一卡通數(shù)據(jù)采用K-means聚類算法,將得到的聚類結(jié)果用于計(jì)算學(xué)生的貧困指數(shù);文獻(xiàn)[6-10]都是通過對(duì)一卡通中的數(shù)據(jù)進(jìn)行分析,對(duì)學(xué)生進(jìn)行貧困生的分類。
可見,通過數(shù)據(jù)挖掘技術(shù)對(duì)校園一卡通中的數(shù)據(jù)進(jìn)行分析,輔助高校判定貧困生的技術(shù)已經(jīng)相當(dāng)成熟。隨著學(xué)校信息化建設(shè)的發(fā)展,微信、支付寶支付已經(jīng)逐漸滲透到學(xué)校,在校園內(nèi)同時(shí)存在著一卡通支付、微信支付和支付寶支付,因此,只分析一卡通的數(shù)據(jù)來判定貧困生的做法,存在嚴(yán)重的局限性。
2 移動(dòng)支付下數(shù)據(jù)挖掘技術(shù)在高校扶貧中的應(yīng)用
2.1 移動(dòng)支付在高校校園生活中的應(yīng)用
目前,無論是微信還是支付寶都為高校免費(fèi)提供電子一卡通產(chǎn)品,學(xué)生可以通過電子一卡通實(shí)現(xiàn)支付功能,并且可以用于借閱圖書、門禁等身份驗(yàn)證。在這之前,學(xué)校餐廳僅提供刷卡機(jī)刷一卡通服務(wù),學(xué)校商店不納入學(xué)校財(cái)務(wù)管理范圍,學(xué)生去校園商店購物支付現(xiàn)金或者掃碼支付,但是付款二維碼歸商店所有,學(xué)生的消費(fèi)記錄不會(huì)出現(xiàn)在學(xué)校的統(tǒng)計(jì)范圍內(nèi)。隨著生活條件的提高或四季天氣的變化,有些學(xué)生不去或很少去餐廳就餐而是去商店購買零食,以筆者所在學(xué)校為例,商店里面有幾家賣面食的,每次到吃飯的時(shí)候,都排很長的隊(duì)伍,有些學(xué)生在夏天直接買點(diǎn)水果就回宿舍休息了,這些情況,如果僅僅通過對(duì)一卡通的數(shù)據(jù)進(jìn)行判斷來確定貧困生,就會(huì)產(chǎn)生誤差,可能在分析一卡通信息的時(shí)候存在同學(xué)在餐廳消費(fèi)金額很小,而導(dǎo)致誤判其家境貧寒,實(shí)則是其不經(jīng)常在餐廳就餐而是購買商店零食或水果等,代替了去餐廳就餐,為了減少這種情況的出現(xiàn),需要拓寬采集數(shù)據(jù)來源的渠道。
隨著移動(dòng)校園的上線推廣使用,移動(dòng)支付也推廣到了高校,微信、支付寶商家為高校設(shè)置校園賬號(hào),為餐廳、校園商店都提供掃碼器,這樣,學(xué)生就可以像使用校園一卡通一樣使用電子一卡通實(shí)現(xiàn)電子支付,學(xué)生的所有消費(fèi)記錄都會(huì)在學(xué)校的總賬戶上有記錄,這在一定程度上彌補(bǔ)了數(shù)據(jù)來源的局限性。
2.2 校園一卡通數(shù)據(jù)在高校扶貧中的應(yīng)用
抽取校園一卡通數(shù)據(jù)庫中某一時(shí)間段內(nèi)的數(shù)據(jù),對(duì)經(jīng)過清洗后的數(shù)據(jù)進(jìn)行聚類分析、關(guān)聯(lián)挖掘,提取有用信息應(yīng)用于貧困生的判定,可以有效地提高貧困生認(rèn)定的精確度和相關(guān)人員的工作效率,圖1就是數(shù)據(jù)挖掘技術(shù)在貧困生認(rèn)定中的應(yīng)用模型。
數(shù)據(jù)挖掘又稱知識(shí)發(fā)現(xiàn)(KDD:Knowledge Discovery in Database),即“從數(shù)據(jù)中挖掘知識(shí)”,其基本步驟為:
(1) 數(shù)據(jù)清洗:清除噪音和刪除不一致的數(shù)據(jù);
(2) 數(shù)據(jù)集成:多種數(shù)據(jù)源組合在一起;
(3) 數(shù)據(jù)選擇:從數(shù)據(jù)庫中提取與分析任務(wù)相關(guān)的數(shù)據(jù);
(4) 數(shù)據(jù)變換:通過匯總或聚集操作,把數(shù)據(jù)變成和統(tǒng)一成適合挖掘的形式;
(5) 數(shù)據(jù)挖掘:數(shù)據(jù)挖掘吸納了諸多領(lǐng)域的大量技術(shù),根據(jù)數(shù)據(jù)功能的類型和數(shù)據(jù)的特點(diǎn)選擇相應(yīng)的算法;
(6) 模式評(píng)估:根據(jù)某種興趣度量值,識(shí)別代表知識(shí)的真正有趣的模式;
(7) 知識(shí)表示:使用可視化和知識(shí)表示技術(shù),向用戶提供挖掘的知識(shí)。
數(shù)據(jù)挖掘過程是一個(gè)反復(fù)循環(huán)的過程,每一個(gè)步驟如果沒有達(dá)到預(yù)期目標(biāo),都需要回到前面的步驟,重新調(diào)整并執(zhí)行。步驟(1)~(4)又合稱為數(shù)據(jù)預(yù)處理,在數(shù)據(jù)挖掘的過程中,要花費(fèi)絕大部分的時(shí)間和精力在數(shù)據(jù)預(yù)處理部分。
2.2.1 學(xué)生消費(fèi)數(shù)據(jù)挖掘分析
學(xué)生通過使用校園一卡通和電子校園一卡通,在校園內(nèi)就餐、購物、打水、洗浴等,挖掘?qū)W生每學(xué)年的整體消費(fèi)數(shù)據(jù),統(tǒng)計(jì)分析學(xué)生一個(gè)學(xué)期內(nèi)平均在校就餐次數(shù)和每餐平均消費(fèi)金額;在校園超市內(nèi)消費(fèi)總額及購買物品的種類;打水、洗浴的消費(fèi)記錄也至關(guān)重要,一般家境貧寒的學(xué)生會(huì)比較節(jié)約用水。通過數(shù)據(jù)挖掘技術(shù)分析學(xué)生的家庭經(jīng)濟(jì)狀況,可以作為確定貧困生認(rèn)定的先決條件,也可以作為認(rèn)定后的驗(yàn)證條件。
2.2.2 充值數(shù)據(jù)分析
通過對(duì)比分析充值的次數(shù)和每次充值金額,在一定程度上可以看出學(xué)生的經(jīng)濟(jì)狀況,一般經(jīng)濟(jì)條件好的學(xué)生,每次充值金額會(huì)比較大,因?yàn)槭稚腺Y金比較寬裕,不怕遇到意外情況;而經(jīng)濟(jì)條件比較差的學(xué)生,更傾向于少量多次的方式,因?yàn)橐豢ㄍㄖ荒艹渲挡荒芴岈F(xiàn),遇到意外情況,經(jīng)濟(jì)損失比較大。因此,通過分析充值數(shù)據(jù),在一定程度上可以作為判定貧困的佐證條件。
2.2.3 學(xué)習(xí)和生活數(shù)據(jù)分析
貧困生評(píng)定的另外一個(gè)重要依據(jù)就是學(xué)生的學(xué)業(yè)情況,包括出勤率、學(xué)業(yè)成績、圖書借閱、宿舍門禁數(shù)據(jù)等,通過對(duì)學(xué)生學(xué)習(xí)及生活數(shù)據(jù)的挖掘分析,可以評(píng)定該生的貧困情況,一般家庭貧困的學(xué)生能夠按時(shí)上課、按時(shí)回宿舍休息、成績一般不會(huì)很差,如果是貧困生但是存在經(jīng)常曠課、夜不歸宿等情況,說明該生本身沒有上進(jìn)心,扶貧意義不大。
3 結(jié)論
對(duì)校園一卡通中海量數(shù)據(jù)的信息挖掘,可以為扶貧工作帶來有實(shí)用價(jià)值的信息。本文提出的移動(dòng)支付背景下數(shù)據(jù)挖掘技術(shù)在高校扶貧中的應(yīng)用研究,在高校扶貧中增加對(duì)移動(dòng)支付數(shù)據(jù)的挖掘,在一定程度上彌補(bǔ)了僅對(duì)傳統(tǒng)校園一卡通數(shù)據(jù)分析的局限性,使貧困生的判定精確度在一定程度上得到了提高。
參考文獻(xiàn):
[1] 文明珠. 教育信息化背景下校園卡系統(tǒng)數(shù)據(jù)挖掘的研究與實(shí)現(xiàn)[J]. 電腦知識(shí)與技術(shù), 2016, 12(5):5-6.
[2] 劉銘, 呂丹, 安永燦. 大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J]. 科技導(dǎo)報(bào), 2018(9).
[3] 劉世平. 數(shù)據(jù)挖掘技術(shù)及應(yīng)用[M]. 北京,高等教育出版社,2010,25-26.
[4] 樊搏, 呂艷芝, FanBo,等. 基于一卡通數(shù)據(jù)中心的貧困生輔助認(rèn)定分析[J]. 科教文匯, 2015(31):122-123.
[5] 費(fèi)小丹, 董新科, 張暉. 基于校園一卡通消費(fèi)數(shù)據(jù)的高校貧困生分析[J]. 電腦知識(shí)與技術(shù), 2014(20):4934-4936.
[6] 張璽, 咼森林, 孫宗良. 基于校園一卡通消費(fèi)數(shù)據(jù)對(duì)高校貧困生分類的應(yīng)用研究[J]. 數(shù)字技術(shù)與應(yīng)用, 2016(8):100-100.
[7] 張紅蕾. 數(shù)據(jù)挖掘在校園卡消費(fèi)中的研究與應(yīng)用[D]. 蘭州交通大學(xué), 2016.
[8] 吳衛(wèi)東. 高校校園一卡通消費(fèi)數(shù)據(jù)完整性及應(yīng)用研究[J]. 華中師范大學(xué)學(xué)報(bào):自科版, 2017(s1):130-133.
[9] 王亞楠. 大數(shù)據(jù)背景下數(shù)據(jù)挖掘技術(shù)在高校中的應(yīng)用——以校園卡系統(tǒng)為例[J]. 華中師范大學(xué)學(xué)報(bào):自科版, 2017(s1):9-12.
[10] 馬洪維. 校園一卡通消費(fèi)數(shù)據(jù)的挖掘與分析[D]. 山西師范大學(xué), 2016.
[通聯(lián)編輯:王力]